課程資訊
課程名稱
資料科學程式設計
Data Science Programming 
開課學期
106-2 
授課對象
共同教育中心  共同教育組  
授課教師
蔡芸琤 
課號
CSX4001 
課程識別碼
H03 04010 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四2,3,4(9:10~12:10) 
上課地點
普205 
備註
基本能力課程.另開放國北教大、臺藝大各 4個名額.。基本能力課程。
總人數上限:42人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1062CSX4001_ 
課程簡介影片
 
核心能力關聯
本課程尚未建立核心能力關連
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

拜寬頻網路普及化之賜,大數據熱潮來襲,許多資料科學相關的需求因應而出,《哈佛商業評論》將會寫程式、又有專業領域知識的資料科學家,封為「21世紀最性感行業」。本課程結合 R 語言與其他電腦資訊技術,運用在各專業領域上。例如:以虛擬社群做社會行為的量化分析、以量化研究方法做人口統計學上的社會變遷、以質性研究方法針對虛擬社群做網誌調查、資料視覺化與結合地圖資訊系統等。 

課程目標
想透過這門課,培養學生們成為台灣的資料英雄。進行資料分析不是為了要批評或鬥爭,而是想要讓我們所處在的社會可以透過資訊技能,看到問題點在哪裡,進而得到更好的決策參考。批評很容易,放炮也很簡單。最難的是要如何在舊有的體制內做軟性的創新,讓大家都願意一同進步,期待熱血的你們加入。 
課程要求
優先錄取具備以下條件者,上限 50 人,收滿為止:
1. 已安裝好 R 和 RStudio 者。
2. 已使用過 GitHub 者。
3. 能提出開放資料相關構想者(想做的題目、資料來源)。
作業繳交規範: https://joe188032.github.io/pecuclass1/regulation.html
課程投影片清單:https://ntu-csplusx.github.io/2017-DS-Programming/ 
預期每週課後學習時數
 
Office Hours
另約時間 
指定閱讀
http://datascienceandr.org/
https://github.com/NTU-CSX-datascience
 
參考書目
http://r4ds.had.co.nz/ 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
個人作業 
30% 
共5次,每次佔個人總分的6%,於作業公布後兩周內於上課前繳交,每次作業分數依照指示給分,於公布作業當天公告,遲交斟酌扣分。  
2. 
期末專題 
30% 
共1次,於期中考後,進行分組,三個人一組,依照完成度斟酌給分。 
3. 
課堂參與 
40% 
每週課堂任務,根據每週課程進度目標設計學習菜單,依照提示完成自主練習。  
 
課程進度
週次
日期
單元主題
第1週
2018/03/01  1. 上課規則、計分規則、作業說明、Github 教學。

2. 介紹 R 語言、上手 R 語言、如何進行翻轉教學。

<a href=https://docs.google.com/presentation/d/e/2PACX-1vQh00Jk_bTDRZi3-QDSVUo_8i6396i7HMpk8SiYDrXKJen7kL-iQZo1ts9610-wkBPxONfMH_lo8vk9/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第2週
2018/03/08  1. 網路爬蟲初探。

2. 完成第一個 RMarkdown 的基本報告。

<a href=https://docs.google.com/presentation/d/e/2PACX-1vR8Qt88Bh3oDn4JE_Un-EoslttHGrvaudgvjqKs1IBiC-B8gfk4R7ox_-VEFfTLTPE6Kq493ZHHNuPU/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第3週
2018/03/15  1. 活用 dplyr 與 data farame。

2. 上手 ggplot2 繪圖工具包。

<a href=https://docs.google.com/presentation/d/e/2PACX-1vRK_nZPbToZoI3Xw7p7i-9r4pRvJazoS68QmkNQeCVbj4lQvSOIK9exmYF5Ct7UdAQqj3EX0oMrCzRv/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第4週
2018/03/22  Open API & 詞頻 & 文字雲。

主題討論:使用 R 進行自動化分析,政治人物的臉書都在討論甚麼?詞頻與文字雲。

<a href=https://docs.google.com/presentation/d/e/2PACX-1vSRTiPlPWFlEtYHbXOdD_pf7bbOsi9Idlvjdgwx-1vsNKO270cmD70ND8r4gIS1eXiet-3OnatXIvuA/pub?start=false&loop=false&delayms=3000&slide=id.g34447a6361_0_20 target=_blank>本週投影片</a> 
第5週
2018/03/29  1. Term to Document Matrix 與文本分析。

2. TF-IDF 與文本分析。

3. R Shiny 自學介紹。

<A href=https://docs.google.com/presentation/d/e/2PACX-1vTsOaEG2FzFrqvz-3SN9Jnm-jv8oO3snK9oOQ87eMze1BbUjVyl_QhV80R0NEH9RrVpxjUMt5XPe44Q/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第6週
2018/04/05  清明節放假一週。 
第7週
2018/04/12  <a href=https://docs.google.com/presentation/d/e/2PACX-1vTcodJ-JXQaR3-bLTLkuS5MPvwuCZMu2YW6s_mHz8LCQpK3ZQ0VOawj47aBSObhyKS5OQN9yo47tyxK/pub?start=false&loop=false&delayms=3000 target=_blank>Project 1 專案分享</a> 
第8週
2018/04/19  SVM 基礎觀念介紹

<a href=https://docs.google.com/presentation/d/e/2PACX-1vRO8wNjqzdKb_m_zTdQfLwqhv-LB72PA6TuuQYrO7r3-Ff1O0z5KVZeKBauzJvMR32WRFWbKr0pmYDG/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第9週
2018/04/26  PCA & SVM

<a href=https://docs.google.com/presentation/d/e/2PACX-1vT9X5i25Q4ls_wXvBG9OWdhrVd5WO5reUwce6w-pvoNtXta6cYF8DD1olG7YbDpUod9DldHstJgrGMG/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第10週
2018/05/03  統計回歸 & ANOVA 分析

<a href=https://docs.google.com/presentation/d/e/2PACX-1vRb74dovh6xyhBrvSn5QddUO92X70nspg6SA3sQ2H6evwYqNdLObwGgr6UVdt9flRdoBWat790Q6HYz/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第11週
2018/05/10  Apriori 關係演算法

<a href=https://docs.google.com/presentation/d/e/2PACX-1vSw-kVhhSjIFZcKZw4nkTzzRw8-4e6e0x6VeRUIFpr258-KyCEF6pLDZPm7qEt37f70EOUQt3kdv-pq/pub?start=false&loop=false&delayms=3000 target=_blank>本週投影片</a> 
第12週
2018/05/17  深度學習基礎介紹 (上) 
第13週
2018/05/24  深度學習基礎介紹 (下) 
第14週
2018/05/31  Project2 ~ Project5 小組整合討論時間。 
第15週
2018/06/07  分組討論進行可行性分析第一回。 
第16週
2018/06/14  分組討論進行可行性分析第二回。 
第17週
2018/06/21  小組專題成果發表。 
第18週
2018/06/28  期末考停課。