課程資訊
課程名稱
R程式語言與資料處理
Data Manipulation with R 
開課學期
106-2 
授課對象
 
授課教師
吳齊軒 
課號
CSX4007 
課程識別碼
H03 04070 
班次
 
學分
1.0 
全/半年
半年 
必/選修
 
上課時間
第7,8,9,10,11,12 週
星期四7,8,9(14:20~17:20) 
上課地點
普302 
備註
密集課程。限非電資學院學生選修。需自備筆電。另開放各2名給國北教大與臺藝大選修。。A6:量化分析與數學素養
總人數上限:36人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1062CSX4007_ 
課程簡介影片
 
核心能力關聯
本課程尚未建立核心能力關連
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

這是R語言的中階課程,同學應該具備基礎的R語言知識(熟悉基礎物件、list、data.frame以及條件控制和迴圈等功能的操作與語法)。
資料處理是資料科學工作中最花時間的部份。這系列課程希望能基於我的實務經驗,向同學介紹使用R語言作資料處理時,重要的知識與技術。 

課程目標
-掌握處理非結構化、半結構或與結構化資料的技術
- 利用整理後的資料製作Dashboard
- 掌握時間與空間的資料處理技術 
課程要求
利用翻轉教室系統完成相關的作業(60%)、期末需要繳交一份報告(40%)

想加簽的同學請在3月1日第10節課時至普通406教室處理加簽事宜。老師會簡單介紹修課的注意事項之後請同學向助教登記,並且在第一週內寄發授權碼給加簽成功的同學。

本課程正在徵求教學助理協助製作教材,歡迎已經具備R語言基礎的同學應徵。詳情請參考:  https://ann.cc.ntu.edu.tw/asp/Show.asp?num=61797 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
待補 
參考書目
待補 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第7週
4/12  資料科學的Hello World

- 以案例描述在實務的資料科學工作中,需要優先進行的工作
- R語言的資料視覺化
- 利用R語言製作Dashboard

<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer.html>投影片</a> 
第8週
4/19  半結構化與非結構化的資料整理

- 純文字的資料處理
- XML、JSON等資料格式
- R語言的list物件
- R語言中如何處理XML與JSON

<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer2.html>投影片</a> 
第9週
4/26  結構化的資料清理

- dplyr套件的資料處理技術
- wide table 與 tall table的概念
- pipeline operator

<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer3.html>投影片</a><br/>
<a href=http://datascienceandr.org/slide/RDataEngineer-Introduction.html#20>編碼相關的投影片</a> 
第10週
5/03  資料整合

- dplyr套建中的各種資料整合函數

投影片

 
第11週
5/10  時間與空間的資料整合

- R語言中與時間相關的物件
- R語言中與空間間相關的物件
- 三種空間型態與相關的資料整合

投影片

 
第12週
5/17  實例展示

期末報告範例與詳解 windows版本 mac版本

作業02-RDataEngineer-06-Join解說

農地重金屬污染潛勢分析實作 by R