2016/7/14 (Thu) ~ 2016/7/17 (Sun)
本課程由統計學家教您用 R 進行資料處理、呈現及統計分析。從第一天 R 的基礎 + 進階 (資料輸出輸入及處理、統計圖形、機率分佈、假設檢定、變異數分析、模擬統計模型與迴歸分析) 到第二天的統計分析方法應用(探索式資料分析、資料探勘案例研究),除了著重在方法理論的講述、假設及觀念的闡釋,同時也強調實際 R 程式撰寫操作,希望藉由本課程之訓練,奠定學員 R 程式撰寫及資料統計分析的基礎,並具有判斷不同狀況該用什麼不同的統計方法的數據能力。 活動介紹
智慧對話機器人 (Intelligent Conversational Bot) 是人工智慧領域中近年來備受重視的一支,各個公司及個人都嘗試著架構專屬的聊天機器人 (ChatBot)。然而,聊天機器人的功能不僅僅侷限於聊天,能夠以對話的方式來協助人類完成各式各樣目標才是我們真正想要的人工智慧。聽完以後覺得心癢癢的,想要趕快建立一個自己的對話機器人,卻不知要從何下手學習,以及不知道要如何實作,那這門課就是你所需要的。這門課程將由臺大資訊系陳縕儂教授利用短短的一天議程簡介對話系統,包含對話系統的基礎理論及架構、每個元件中如何實作、及對話系統近期的發展及趨勢。無論你是否有相關的經驗,都可以在這門課中有所收穫。 活動介紹
我們都知道資料探勘是資料科學中的基礎科目,這個科目總讓大部分的人有個錯覺:以為學了這門課以後,就可以從雜亂、巨大的資料中抽取出有意義的知識。然而實際上,即使上完了資料探勘課卻仍然發現資料往往混亂、難以著手,無法真正從透過資料探勘技術得到有價值的知識。為甚麼?大部份的資料探勘或機器學習方法其實都是利用數值資料,文字資料要分析、整理往往要經過許多前處理,才有可能挖掘文字中的深層知識,即使是同一批文字資料,透過不同處理方式能得到的資訊常常差異甚大。本課程的目的在引領資料工作者:分析、整理原始文字資料,針對文字、與待解問題的特性,找到適合的轉換方式,進而可以利用資料探勘技術,找出有價值的知識。 活動介紹
在這個資料科學蔚為風潮的年代,身為一個對新技術充滿好奇的攻城獅,自然會想要擴充自己的武器庫,學習嶄新的資料分析工具;而 R 語言,一個由統計學家專門為了資料探索與分析所開發的腳本語言,具有龐大的開源社群支持以及琳瑯滿目、數以萬計的各式套件,正是當今學習資料科學相關工具的首選。然而,R 語言的設計邏輯與一般的程式語言不同,工程師們過去學習程式語言的經驗,往往造成學習 R 語言的障礙,本課程將從 R 語言的基礎開始,讓同學們從課堂講解以及互動式上機課程中,得以徹底理解 R 語言的核心概念與精要,學習如何利用 R 語言問資料問題,並且從資料分析的角度撰寫效率良好同時具有高度可讀性的 R 語言代碼。 活動介紹
深度學習 (Deep Learning) 是機器學習 (Machine Learning) 中近年來備受重視的一支,深度學習根源於類神經網路 (Artificial Neural Network) 模型,但今日深度學習的技術和它的前身已截然不同,目前最好的語音辨識和影像辨識系統都是以深度學習技術來完成。你可能在很多不同的場合聽過各種用深度學習做出的驚人應用 (例如:最近紅遍大街小巷的 AlphaGo),聽完以後覺得心癢癢的,想要趕快使用這項強大的技術,卻不知要從何下手學習,以及不知道要如何應用深度學習於各式應用上,那這門課就是你所需要的。 活動介紹
D3.js 立基於網頁技術、並從設計的核心納入互動、即時等概念,可說是當代最先進的一組視覺化工具。這個課程將從 D3.js 4.4 的基本資料模型開始到各種視覺化元件與布局模組,以穿插實作的方式帶領學員實際做出各種圖表,包含從基本的長條圖、圓餅圖、到泡泡圖、樹狀圖等複雜圖表,同時也將說明使用 D3.js 時常見的陷阱與不易理解的部份。 活動介紹
我們都知道資料探勘是資料科學中的基礎科目,這個科目總讓大部分的人有個錯覺:以為學了這門課以後,就可以從雜亂、巨大的資料中抽取出有意義的知識。然而實際上,即使上完了資料探勘課卻仍然發現資料往往混亂、難以著手,無法真正從透過資料探勘技術得到有價值的知識。為甚麼?大部份的資料探勘或機器學習方法其實都是利用數值資料,文字資料要分析、整理往往要經過許多前處理,才有可能挖掘文字中的深層知識,即使是同一批文字資料,透過不同處理方式能得到的資訊常常差異甚大。本課程的目的在引領資料工作者:分析、整理原始文字資料,針對文字、與待解問題的特性,找到適合的轉換方式,進而可以利用資料探勘技術,找出有價值的知識。 活動介紹
我們希望藉由近幾年資料科學的興起,推廣正確的金融交易知識,包括金融資料分析與建立自己的演算法交易事業。自己的策略自己做,自己的風險自己控,自己的部位自己顧。在本課程裡,1 就是 1,2 就是 2,40 就是 40 (事實),沒有怪力亂神,沒有定義不清,一切的一切,統計說話,數據說話!本課程與上一課程 (用 R 輕鬆做交易策略分析及自動下單) 部分重覆,本次除針對理論做更深入講解,亦增加股票、期貨、選擇權開發實務分享。 活動介紹
這個課程濃縮了康教授在臺大所開設的『資料視覺化』課程的精華,總共包含賞析、理論、設計與實作四節課程。 活動介紹
機器學習旨在讓電腦能由資料中累積的經驗來自我進步,近年來已廣泛應用於資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA 序列測序、語音和手寫識別、戰略遊戲和機器人等領域。它已成為資料科學的基礎學科之一,為任何資料科學家必備的工具。這門課程將由 Appier 首席資料科學家林軒田利用短短的六個小時,快速地帶大家探索機器學習的基石、介紹核心的模型及一些熱門的技法,希望幫助大家有效率而紮實地了解這個領域,以妥善地使用各式機器學習的工具。此課程適合所有希望開始運用資料的資料分析者,推薦給所有有志於資料分析領域的資料科學愛好者。 活動介紹
這門課程由國立成功大學資訊系暨製造所李家岩副教授主講,希望以深入淺出的方式,對製造資料科學作一整體性的介紹。課程專注於「問題本質的探索與觀念的釐清」,並輔以案例介紹工程資料分析時會遭遇的困難與挑戰。此外,對於機器學習或資料探勘強調的預測性分析 (Predictive Analytics),課程更進一步地延伸到處方性分析 (Prescriptive Analytics),以連結到管理者視角下,風險評估與決策制定的過程。希望課程內容能引起大家的興趣,並帶給大家在未來繼續學習進階知識的基礎。 活動介紹
由於資訊技術與行動裝置的快速發展,雲端運算、物聯網、感測網路、行動通訊、社交媒體、地理資訊等技術與服務日漸成熟,城市中由不同平台產生的異質性資料 (如感測網路、社群媒體、交通資訊、人群移動、地理特性與環境監測等資料) 已成為解決城市發展課題的重要手段,分析城市中的時空大數據將有利於開發者提供各種個人化或客製化的智慧型服務,也可輔助政府或企業管理高層做出聰明的決策,在本課程中將介紹如何處理城市的異質性大數據以及善用其開發社群媒體、商業策略、交通、能源、環保、旅遊與都市規劃等相關的智慧應用。 活動介紹
本課程由統計學家教您用 R 進行資料處理、呈現及統計分析。從第一天 R 的基礎 + 進階 (資料輸出輸入及處理、統計圖形、機率分佈、假設檢定、變異數分析、模擬統計模型與迴歸分析) 到第二天的統計分析方法應用(探索式資料分析、資料探勘案例研究),除了著重在方法理論的講述、假設及觀念的闡釋,同時也強調實際 R 程式撰寫操作,希望藉由本課程之訓練,奠定學員 R 程式撰寫及資料統計分析的基礎,並具有判斷不同狀況該用什麼不同的統計方法的數據能力。 活動介紹
近年來,從機器學習、深度學習到人工智慧,都是透過分析這些巨量的資料,從中萃取出有價值的訊息,進而讓「電腦」對各種狀況作出正確判斷,甚至對一些未來的狀況做出預測。這些技術的高度發展,也帶動了各式各樣的創新應用。從 IBM 的 Watson 在 Jeopardy 搶答賽贏過參賽者、Google Deep Mind 的 AlphaGo 以四勝一負戰勝南韓九段天才棋王李世乭、Amazon 的 Echo 到工業 4.0、智慧城市等等。這些改變,已徹底改變了人類思考、學習與生活方式。本課程將介紹機器學習的基礎與原理,也將涵蓋各式機器學習演算法的核心技術:數值最佳化方法,同時也提供各種評估指標,以利在演算法中的參數挑選與不同演算法之間的比較。 活動介紹
本課程利用六個小時的時間,介紹 Keras 這個熱門的深度學習工具,從最簡單的前饋類神經網路 (Feedforward Neural Network) 開始,用 Keras 加入各種訓練技巧 (Regularization, Early Stopping, Dropout) 以得到好的預測模型。亦介紹深度學習模型的另一個變形:捲積式類神經網路 (Convolutional Neural Network, CNN),以完整的實務操作,讓你邁出成為深度學習訓練大師的第一步。 活動介紹
我們希望藉由近幾年資料科學的興起,推廣正確的金融交易知識,包括金融資料分析與建立自己的演算法交易事業。自己的策略自己做,自己的風險自己控,自己的部位自己顧。在本課程裡,1 就是 1,2 就是 2,40 就是 40 (事實),沒有怪力亂神,沒有定義不清,一切的一切,統計說話,數據說話!本課程與上一課程 (用 R 輕鬆做交易策略分析及自動下單) 部分重覆,本次除針對理論做更深入講解,亦增加股票、期貨、選擇權開發實務分享。 活動介紹
人類本身具有透過觀察另一人的行為以做出高階層判斷,如情緒、個性、喜好、意圖…等訊息的高度整合能力。這種人類的主觀感知機制不僅發生在日常生活中,更早已廣泛在行為科學領域中被應用於專業主觀評量與行為分析。近年來,隨著工程訊號處理演算法的進步,學科領域界線的破除,加上大數據資料科學的發展,慢慢匯流出新興跨學科整合式「人類行為訊號處理」。本課程將以數個教育及醫療應用實例為主軸,貫穿並拆解「人類行為訊號處理」四大簡易步驟。 活動介紹
本課程利用六個小時的時間,介紹 Keras 這個熱門的深度學習工具,從最簡單的前饋類神經網路 (Feedforward Neural Network) 開始,用 Keras 加入各種訓練技巧 (Regularization, Early Stopping, Dropout) 以得到好的預測模型。亦介紹深度學習模型的另一個變形:捲積式類神經網路 (Convolutional Neural Network, CNN),以完整的實務操作,讓你邁出成為深度學習訓練大師的第一步。 活動介紹
資料探勘是資料科學中一個基礎的修習科目,這個學問結合了機器學習、人工智慧、資料庫、訊號處理、與統計等不同領域的技術,期待能從雜亂、巨大的資料中抽取出有意義的知識。理論上,透過這個技術,資料科學家可以作出各種應用。然而實際上,由於資料未經處理前,往往混亂、難以著手,如果沒有正確處理資料,往往無法得到有價值的知識。本課程的目的,在於帶領初學者了解如何從整理混亂的資料、並找到最適合的技術來解決問題,除了會深入淺出的教授一般教科書有的技術外,並會給與實際應用的例子,讓初學者能練習面對問題的方法,也能運用技巧來分析成品並同時教導如何衡量分析結果。 活動介紹
「統計學」,是一個大家都熟悉卻可能又陌生的名詞。做為傳統上最接近資料科學、藉由分析資料去探索事實真相的一門學問,統計學遍佈在大專院校的各個系所中,在以往是許多學生最大的惡夢之一,現在卻又在大數據的時代,被許多人宣稱統計學已死。到底什麼是統計學?統計學包含資料分析,還是資料分析包含統計學?統計學能做到什麼,又不能做到什麼?會算平均數跟標準差之後,如果懂機率學,還能多做些什麼?這門課程將由臺大資管系孔令傑助理教授主講,用一天的時間對統計學與資料分析做一個入門的介紹。時間雖短,內容雖淺,相信仍可以幫大家釐清一些概念,也讓初學者學到一些可以實戰的技術。更重要的是,這門課希望能給大家在未來繼續學習進階知識的動機與基礎。 活動介紹
在此課程中將帶領對資料分析感到陌生卻又充滿興趣的您,完整地學會運用 R 語言從最初的蒐集資料、探索性分析解讀資料,並進行文字探勘,發現那些肉眼看不見、隱藏在資料底下的意義。此課程主要設計給對於 R 語言有基本認識,想要進一步熟悉實作分析的朋友們,希望在課程結束後,您能夠更熟悉 R 語言這個豐富的分析工具。透過蘋果日報慈善捐款的資料集,了解如何從頭解析網頁,撰寫爬蟲自動化收集資訊;取得資料後,能夠靈活處理資料,做清洗、整合及探索;並利用現成的套件進行文字探勘、文本解析;我們將一步步實際走一回資料分析的歷程,處理、觀察、解構資料,試著看看人們在捐款的決策過程中,究竟是什麼因素產生了影響,以及這些結果又是如何從資料中挖掘而出的呢? 活動介紹
電腦視覺旨在發展演算法使得電腦能理解影像的內容,近年來電腦視覺相關的技術已廣泛應用於我們生活中,舉凡物件偵測,識別,追蹤,三維重建,多媒體分析以及檢索,監控系統,醫療影像,以及電視電影中的許多視覺效果都可以看到電腦視覺技術的應用。這場演講的目的在於介紹電腦視覺中的基本觀念和核心技術,透過大量實際的範例幫助大家快速了解這些技術如何被應用在日常生活中,以期讓聽眾有效率地了解這個領域,最新的發展以及未來展望。 活動介紹
Exploratory data analysis is the process of quickly looking at data, formulating hypotheses, and testing those hypotheses. In practice, two of the most important components of this process are transforming data and visualizing it. This tutorial will be a hands-on, practical introduction to using R for data exploration, with an emphasis on data transformation and visualization. I will focus on using modern R packages like ggplot2, dplyr, and tidyr for this tutorial. 活動介紹
本課程將帶你綜觀人工智慧,包括簡介人工智慧的歷史演進,以及其與機器學習的關聯,並介紹近年來機器學習發展出哪些擁有不同「能力」的模型;同時也會介紹推薦系統的原理、不同方式的推薦機制,以及協同過濾推薦的技巧,讓大家瞭解在實務上如何訓練好的機器學習模型,及如何應用相關技術建立智慧推薦系統。 活動介紹
本課程利用六個小時的時間,介紹 Keras 這個熱門的深度學習工具,從最簡單的前饋類神經網路 (Feedforward Neural Network) 開始,用 Keras 加入各種訓練技巧 (Regularization, Early Stopping, Dropout) 以得到好的預測模型。亦介紹深度學習模型的另一個變形:捲積式類神經網路 (Convolutional Neural Network, CNN),以完整的實務操作,讓你邁出成為深度學習訓練大師的第一步。 活動介紹
此課程專為 Spark 入門者設計,在六小時帶您從無到有建置 Spark 開發環境,並以實作方式帶領您了解 Spark 機器學習函式庫 (MLlib) 的應用及開發。課程實作將以 Spark 核心之實作語言 - Scala 為主,搭配 Scala IDE eclipse 及相關 Library 建置本機開發環境,透過 IDE 強大的開發及偵錯功能加速開發流程;並介紹如何佈置至 Spark 平台,透過 Spark-submit 執行資料分析工作。本課程涵蓋機器學習中最常使用之分類、迴歸及分群方法,歡迎對 Spark 感興趣,卻不知從何下手;或想快速的對 Spark 機器學習有初步的了解的您參與! 活動介紹
本課程將帶你綜觀人工智慧,包括簡介人工智慧的歷史演進,以及其與機器學習的關聯,並介紹近年來機器學習發展出哪些擁有不同「能力」的模型;同時也會介紹推薦系統的原理、不同方式的推薦機制,以及協同過濾推薦的技巧,讓大家瞭解在實務上如何訓練好的機器學習模型,及如何應用相關技術建立智慧推薦系統。 活動介紹
深度學習是機器學習中近年來備受重視的一支,這堂課會簡介如何使用深度學習的工具 Keras,剖析深度學習和其它機器學習方法相比潛在的優勢,並分享深度學習的實作技巧及深度學習模型的各種變形,最後對深度學習的應用做展望。無論是從未嘗試過深度學習的新手,還是已經有一點經驗,都可以在這門課中有所收穫! 活動介紹
人類本身具有透過觀察另一人的行為以做出高階層判斷,如情緒、個性、喜好、意圖…等訊息的高度整合能力。這種人類的主觀感知機制不僅發生在日常生活中,更早已廣泛在行為科學領域中被應用於專業主觀評量與行為分析。近年來,隨著工程訊號處理演算法的進步,學科領域界線的破除,加上大數據資料科學的發展,慢慢匯流出新興跨學科整合式「人類行為訊號處理」。本課程將以數個教育及醫療應用實例為主軸,貫穿並拆解「人類行為訊號處理」四大簡易步驟。 活動介紹
在這資料科學逐漸成為顯學的年代,無論面對的是資料的幾個 V,其中最重要的永遠都是 Value (價值) 這個 V,而資料探勘正是一種透過系統化的方式釐清資料的脈絡、找出其中有價值的特徵與相關性的技術。這門六小時的課程,將從最實務的角度切入,與大家分享如何將現實中極待解決的問題,轉換成可以利用資料探勘技術處理的問題,並且運用 R 語言中各種強大的工具,進行關聯性分析、迴歸分析以及叢聚分析,以達成將資料中隱藏的資訊挖掘出來的最終目標。 活動介紹
金融交易博大精深,許多有趣的現象也伴隨科技的進步跟著演變,過去股市名嘴喊盤,現在資料科學說話,舉凡交易策略建構、資金管裡的理論與實務,甚至老師最愛說的技術分析、K 線型態,高手最愛強調的盤感、盤感、盤感,說穿了這些都是資料科學的應用。這堂課由知名財金部落格 Bituzi 專欄作家吳牧恩 (牧清華) 與新創公司 Fintech 團隊系統顧問林佳緯聯手打造,讓資料科學教你正確的金融交易知識,同時學會用 R 語言做自動下單系統的決策工具,自己分析金融資料。 活動介紹
此課程專為 Spark 入門者設計,在六小時帶您從無到有建置 Spark 開發環境,並以實作方式帶領您了解 Spark 機器學習函式庫 (MLlib) 的應用及開發。課程實作將以 Spark 核心之實作語言 - Scala 為主,搭配 Scala IDE eclipse 及相關 Library 建置本機開發環境,透過 IDE 強大的開發及偵錯功能加速開發流程;並介紹如何佈置至 Spark 平台,透過 Spark-submit 執行資料分析工作。本課程涵蓋機器學習中最常使用之分類、迴歸及分群方法,歡迎對 Spark 感興趣,卻不知從何下手;或想快速的對 Spark 機器學習有初步的了解的您參與! 活動介紹
深度學習是機器學習中近年來備受重視的一支,這堂課會簡介如何使用深度學習的工具 Keras,剖析深度學習和其它機器學習方法相比潛在的優勢,並分享深度學習的實作技巧及深度學習模型的各種變形,最後對深度學習的應用做展望。無論是從未嘗試過深度學習的新手,還是已經有一點經驗,都可以在這門課中有所收穫! 活動介紹
金融交易博大精深,許多有趣的現象也伴隨科技的進步跟著演變,過去股市名嘴喊盤,現在資料科學說話,舉凡交易策略建構、資金管裡的理論與實務,甚至老師最愛說的技術分析、K 線型態,高手最愛強調的盤感、盤感、盤感,說穿了這些都是資料科學的應用。這堂課由知名財金部落格 Bituzi 專欄作家吳牧恩 (牧清華) 與新創公司 Fintech 團隊系統顧問林佳緯聯手打造,讓資料科學教你正確的金融交易知識,同時學會用 R 語言做回測及串接 API 下單,自己分析金融資料。 活動介紹
「統計學」,是一個大家都熟悉卻可能又陌生的名詞。做為傳統上最接近資料科學、藉由分析資料去探索事實真相的一門學問,統計學遍佈在大專院校的各個系所中,在以往是許多學生最大的惡夢之一,現在卻又在大數據的時代,被許多人宣稱統計學已死。到底什麼是統計學?統計學包含資料分析,還是資料分析包含統計學?統計學能做到什麼,又不能做到什麼?會算平均數跟標準差之後,如果懂機率學,還能多做些什麼?這門課程將由臺大資管系孔令傑助理教授主講,用一天的時間對統計學與資料分析做一個入門的介紹。時間雖短,內容雖淺,相信仍可以幫大家釐清一些概念,也讓初學者學到一些可以實戰的技術。更重要的是,這門課希望能給大家在未來繼續學習進階知識的動機與基礎。本課程由四個模組組成:1) 貓都嫌簡單的資料摘要與視覺化, 2) 假設檢定與一點都不神秘的 p 值, 3) 讓你一秒看起來像專家的迴歸分析, 及 4) 想當然爾的綜合應用與案例研討。 活動介紹
在此課程中將帶領對資料分析感到陌生卻又充滿興趣的您,完整地學會運用 R 語言從最初的蒐集資料、探索性分析解讀資料,並進行文字探勘,發現那些肉眼看不見、隱藏在資料底下的意義。此課程主要設計給對於 R 語言有基本認識,想要進一步熟悉實作分析的朋友們,希望在課程結束後,您能夠更熟悉 R 語言這個豐富的分析工具。透過蘋果日報慈善捐款的資料集,了解如何從頭解析網頁、熟悉 xpath 語法,撰寫爬蟲自動化收集資訊;取得資料後,能夠靈活處理資料,做清洗、整合及探索;並利用現成的套件進行文字探勘、文本解析;我們將一步步實際走一回資料分析的歷程,處理、觀察、解構資料,試著看看人們在捐款的決策過程中,究竟是什麼因素產生了影響,以及這些結果又是如何從資料中挖掘而出的呢? 活動介紹
邁入第三屆的 2016 台灣資料科學年會將保持深獲好評的四天議程,除了有從資料科學的入門到專家,為不同程度參加者精心準備的全天實戰課程營,年會主議程更擴大到 43 場主題各異、產學兼具的密集演講,讓我們今年能歡迎更多的報名者參加。以此搭配新型態的交流活動設計,期待能使與會者間有更豐富且多元的平台,來分享資料科學最尖端的技術思維。今年的活動包含「年會主議程」、「「資料科學的第一堂課:心法、案例分析與團隊建立」、「一天搞懂深度學習」、「從資料到知識:從零開始資料探勘」、「R 語言資料工程及探勘實務」、「手把手教你 R 語言資料分析實務」、「有志一同場次」、「媒合交流場次」,詳細介紹如下: