手把手教你 R 語言資料分析實務


講座簡介

在此課程中,兩位老師將帶領對資料分析稍微有點陌生卻又充滿興趣的您,完整地學會運用 R 語言從自己寫爬蟲蒐集資料、進行探索性分析解讀資料,到真正建構解釋與預測模型,發現那些肉眼看不見隱藏在資料底下的意義。

此課程主要設計給對於 R 語言有基本認識,想要進一步熟悉實作分析的朋友們,希望在課程結束後,您能夠更熟悉 R 語言這個豐富分析工具:了解如何解析網頁、熟悉 xpath 語法,撰寫爬蟲自動化收集資訊 ( RCurl, xml );取得資料後靈活使用熱門的套件 ( data.table, dplyr ),提高資料清洗及整合的效率;利用現成的套件進行文字探勘、文本解析 ( jiebaR, text2vec );更重要的是最終能夠從資料中找出不分析就不會輕易發現的意義。我們透過蘋果日報慈善捐款的公開資料,帶著大家實際走一回資料分析的歷程,一步步處理、觀察、解構資料,試著看看究竟是什麼原因在不經意中影響了人們在做捐款的決策過程,以及這些結果又是如何從資料中挖掘而出的呢?

議程

時間 主題
09:30 - 10:30

爬蟲是什麼?好吃嗎?

自製網路爬蟲蒐集資料
10:30 - 11:00 茶點時間
11:00 - 12:30

資料礦工的一天:

探索式資料解析
12:30 - 13:50 午餐
13:50 - 15:20

名模生死鬥:

建構解釋與預測模型
15:20 - 15:50 茶點時間
15:50 - 17:20

那些資料告訴我們 ( 與沒告訴我們 ) 的事

講師簡介

張毓倫 Helen Chang

中央研究院資訊科學研究所 / 研究助理

清大材料所畢,學生時期受的是微觀層級的訓練,後來到傳統產業當 PM,做的卻都是巨型產品;每天都比昨天更明白資源的有限,想盡辦法維持動態平衡。現栽入資料海裡載浮載沉,學著觀測人類行為的同時,也藉以修剪自己的偏見謬誤。覺得一切事物都關乎設計,希望世界的冗餘或浪費降到最低。推理迷,不喜歡沒有謎題的故事,也很愛玩拼圖;唯一不可或缺的是音樂,最近都在聽山形瑞秋的歌。

陳柏亨 Po-Heng Chen ( Henry )

中央研究院資訊科學研究所 / 研究助理

現任中央科學院資訊所擔任研究助理,並將於 2016 年秋季前往美國密西根大學攻讀碩士學位。畢業於臺灣大學工商管理學系,畢業後前往北京 RedAtoms, Inc. 移動社交遊戲公司任職運營專員。分析玩家行為模式的過程中,意外發現資料背後潛藏的價值與分析的樂趣,於是決心轉向資料分析領域發展,一路自學 R 語言與 Python。目前研究範圍包含健保資料庫分析、遊戲市場分析。

課程須知

這個課程適合對 R 有多少經驗的人?我完全不會寫 R,但也很有興趣該怎麼辦?

本課程針對對 R 語言有基本認識但想更進一步擁有實務經驗的夥伴們。我們將一步一步帶領著您寫出程式。但若對 R 為零經驗的朋友們,也可以先透過 R 語言基礎自學教材 swirl 練習基本操作,再來參加我們的分析實務教學。

我需要自己帶筆記型電腦來嗎?如果需要的話有什麼軟體需要先安裝嗎?

因為是會手把手地教您寫出實用的程式,當然需要帶筆記型電腦來參加囉!請先將 R 3.2 以上的版本安裝起來。( https://cran.r-project.org/ )