課程名稱 |
R程式語言與資料處理 Data Manipulation with R |
開課學期 |
106-2 |
授課對象 |
|
授課教師 |
吳齊軒 |
課號 |
CSX4007 |
課程識別碼 |
H03 04070 |
班次 |
|
學分 |
1.0 |
全/半年 |
半年 |
必/選修 |
|
上課時間 |
第7,8,9,10,11,12 週 星期四7,8,9(14:20~17:20) |
上課地點 |
普302 |
備註 |
密集課程。限非電資學院學生選修。需自備筆電。另開放各2名給國北教大與臺藝大選修。。A6:量化分析與數學素養 總人數上限:36人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1062CSX4007_ |
課程簡介影片 |
|
核心能力關聯 |
本課程尚未建立核心能力關連 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
這是R語言的中階課程,同學應該具備基礎的R語言知識(熟悉基礎物件、list、data.frame以及條件控制和迴圈等功能的操作與語法)。
資料處理是資料科學工作中最花時間的部份。這系列課程希望能基於我的實務經驗,向同學介紹使用R語言作資料處理時,重要的知識與技術。 |
課程目標 |
-掌握處理非結構化、半結構或與結構化資料的技術
- 利用整理後的資料製作Dashboard
- 掌握時間與空間的資料處理技術 |
課程要求 |
利用翻轉教室系統完成相關的作業(60%)、期末需要繳交一份報告(40%)
想加簽的同學請在3月1日第10節課時至普通406教室處理加簽事宜。老師會簡單介紹修課的注意事項之後請同學向助教登記,並且在第一週內寄發授權碼給加簽成功的同學。
本課程正在徵求教學助理協助製作教材,歡迎已經具備R語言基礎的同學應徵。詳情請參考: https://ann.cc.ntu.edu.tw/asp/Show.asp?num=61797 |
預期每週課後學習時數 |
|
Office Hours |
|
指定閱讀 |
待補 |
參考書目 |
待補 |
評量方式 (僅供參考) |
|
週次 |
日期 |
單元主題 |
第7週 |
4/12 |
資料科學的Hello World
- 以案例描述在實務的資料科學工作中,需要優先進行的工作
- R語言的資料視覺化
- 利用R語言製作Dashboard
<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer.html>投影片</a> |
第8週 |
4/19 |
半結構化與非結構化的資料整理
- 純文字的資料處理
- XML、JSON等資料格式
- R語言的list物件
- R語言中如何處理XML與JSON
<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer2.html>投影片</a> |
第9週 |
4/26 |
結構化的資料清理
- dplyr套件的資料處理技術
- wide table 與 tall table的概念
- pipeline operator
<a href=http://homepage.ntu.edu.tw/~wush978/rdataengineer/rdataengineer3.html>投影片</a><br/>
<a href=http://datascienceandr.org/slide/RDataEngineer-Introduction.html#20>編碼相關的投影片</a> |
第10週 |
5/03 |
資料整合
- dplyr套建中的各種資料整合函數
投影片
|
第11週 |
5/10 |
時間與空間的資料整合
- R語言中與時間相關的物件
- R語言中與空間間相關的物件
- 三種空間型態與相關的資料整合
投影片
|
第12週 |
5/17 |
實例展示
期末報告範例與詳解 windows版本 mac版本
作業02-RDataEngineer-06-Join解說
農地重金屬污染潛勢分析實作 by R
|