資料科學是綜合統計學、資訊科學及領域知識的一門新興學科。因此,要成為一名資料科學家,對統計當然要有基本的認識。舉凡日常的機率統計問題,例如:算機率值,統計參數估計,假設檢定及模型配適等等,除了需要理論証明推導之外,也需以程式做數值的模擬與驗証。而 R 語言正是研究者分析資料及執行統計模擬不可或缺的工具。也因為 R 軟體具有豐富的統計套件,也成為資料科學領域裡最受歡迎的程式語言之一。
本課程由統計學家教您用 R 進行資料處理、呈現及統計分析。從第一天 R 的基礎 + 進階 (資料輸出輸入及處理、統計圖形、機率分佈、假設檢定、變異數分析、模擬統計模型與迴歸分析) 到第二天的統計分析方法應用(探索式資料分析、資料探勘案例研究),除了著重在方法理論的講述、假設及觀念的闡釋,同時也強調實際 R 程式撰寫操作,希望藉由本課程之訓練,奠定學員 R 程式撰寫及資料統計分析的基礎,並具有判斷不同狀況該用什麼不同的統計方法的數據能力。
9:00 - 9:30 |
第一天報到 |
9:30 - 10:30 |
資料的輸入與輸出,資料處理: 篩選、變數轉換、整合、遺失值處理 |
10:30 - 10:50 |
茶點時間 |
10:50 - 12:30 |
統計圖形及資料視覺化 |
12:30 - 13:20 |
午餐 |
13:20 - 15:00 |
機率分佈、假設檢定、變異數分析、模擬 |
15:00 - 15:20 |
茶點時間 |
15:20 - 17:00 |
統計模型與迴歸分析 |
9:00 - 9:30 |
第二天報到 |
9:30 - 10:30 |
探索式資料分析 (I):維度縮減 |
10:30 - 10:50 |
茶點時間 |
10:50 - 12:30 |
探索式資料分析 (II):群集分析 |
12:30 - 13:20 |
午餐 |
13:20 - 15:00 |
資料探勘 (I):區別分析、決策樹、隨機森林、支持向量機 |
15:00 - 15:20 |
茶點時間 |
15:20 - 17:00 |
資料探勘 (II):關聯性分析、案例研究 |
國立臺北大學統計學系 / 副教授
吳漢銘於 2003 年國立交通大學取得統計博士學位後,隨即加入中央研究院統計科學研究所陳君厚教授實驗室,擔任博士後研究員,從事資料矩陣視覺化的研究及微陣列資料分析。2008 年開始任教於淡江大學數學學系資料科學與數理統計組,兩度獲得教學優良教師獎勵。2016 年 8 月轉任國立臺北大學統計學系,現職為副教授。吳漢銘博士於 2013 年被國際統計計算學會 (IASC, International Association for Statistical Computing) 推選為國際統計學會 (ISI, International Statistical Institute) 年輕統計學家委員會 IASC 代表,推廣統計與R資料分析正是他擔任此代表的任務之一。吳漢銘博士的研究興趣及專長為高維度資料分析、資料視覺化、微陣列資料統計分析、統計計算、R/Java 程式軟體開發及機器學習等。他長期於校內外教授 R 語言程式設計與資料分析,目前專注於象徵性資料分析的相關研究。
© Copyright 2016 - 台灣資料科學協會