講者

頁數: 1 2 3 4 - 每頁 20 筆

共有 68 位講者

資料科學演講:

黃致豪

黃致豪 Calculating WAR of CPBL players 中職球員勝負貢獻值計算

We set a goal to calculate Wins Above Replacement(WAR) players for each player in CPBL, which has never been done before. WAR is widely used in MLB as an index for salary negotiation for free agents. It includes not only the offensive ability of a player, but also the fielding position, fielding ability, and base running ability. Through the project, we hope to show the true value of each player, especially players with good fielding ability, and in turn cause the clubs and the league to appreciate the value of fielding and base running.
more
黃彥棕

黃彥棕 干擾機制對資料科學帶來的挑戰與契機:以抽煙及肺癌存活的因果關係為例

Complexity of the data may provide challenges for making valid causal inference about a scientific hypothesis (smoking vs. lung cancer mortality), particularly in the presence of unknown confounding (underlying lung function). Mendelian randomization (MR) addresses the issue of unknown confounding by using genetic information as an instrumental variable (IV) to estimate the causal effect of an exposure of interest on an outcome. Despite the popularity of IV analyses in fully observable outcomes, methodology is limited for time-to-event survival outcomes with censoring, a common data structure in biomedical sciences. We propose an IV analysis method in the survival context, estimating causal effects on a transformed survival time and the survival probabilities using semiparametric transformation models. We construct unbiased estimating equations to circumvent the difficulty in deriving joint likelihood of the exposure and the outcome, due to the unknown covariance by confounding. Asymptotic properties of the proposed estimators are established. We apply our methods to conduct an MR study for lung cancer survival, which suggests a harmful prognostic effect by smoking intensity (p=0.0067) that would have been missed by the conventional methods.
more
邱泊寰

邱泊寰 當政府數據分析碰撞體驗設計

數據分析最困難的任務之一是找對題目,好題目的關鍵在相同預算創造最大效益ROI。政府單位其實臥虎藏龍,但礙於種種制度,有時難以伸展。透過Google Sprint體驗設計流程,漫天飛舞的便利貼融合共享大腦記憶體,鎖定數據洞見,創造幸福價值。
more
彭其捷

彭其捷 資料視覺化與使用者經驗設計

許多人都了解資料視覺化的優點,例如可將資料抽象化、讓資訊降維等等,讓數據以更直覺的方式呈現在使用者面前,提升閱讀者的吸收意願。然而,我們依然可以舉出許多例子,即使是視覺化後的數據,依然不容易讓人讀懂其價值,也難以勾起人們理解的意願。 『使用者經驗(UX)』設計的最終目標是『Don’t Make Me Think』,也就是打造一段順暢的閱讀過程,讓使用者能夠更輕鬆理解背後的寶貴價值,而這之中除了透過視覺設計、互動設計將結果優化之外,還包括了使用者研究、需求釐清、文案優化等等技巧,如果能夠將使用者經驗設計相關方法結合資料視覺化技巧,能夠再一次降低數據解讀的門檻,讓更多人了解其價值意涵,也讓更多人被數據所感動。
more
邵軒磊

邵軒磊 AI、大數據、法資訊學-法律與判決中的資料科學

傳統上,法律與判決研究中多以價值判斷與理念分析為主,而在大數據與人工智慧(AI)的趨勢之下,逐漸有學者思考結合新技術開展「法資訊學研究」。本文作為階段性的成果,旨在分析「離婚後小孩歸誰?」(法學中稱為酌定親權人)之運作情形,而得到有效的計算結果。闡釋這類之分析結果,有助於當事人能對與自身訴訟優劣勢上有初步認識,也能對法官對自身判決與其他判決之「共通性」上有所預期(避免恐龍法官),有助於弭平「法院判決與社會民意」之巨大差異。隨著科技發達,法資訊學研究能夠做到研究大範圍時間段與多數案例重複出現之現象,而較少涉及非常特殊之個案,而受到影響。期望在法資訊學之開展中,能提供一個論證與分析的有效知識基礎,讓不同意見的研究者,有據以對話討論的平臺和起點;也藉此機會,歡迎資訊學科的同好一起合作。
more
曾韵

曾韵 不只是會計 會計師事務所的風險數據分析

什麼? 原來會計師事務所也有在做數據分析! 大部分人對於會計師事務所的刻板印象就是看財報、算數字。這次演講主題將從隱藏在會計師事務所的神祕服務-風險諮詢出發,告訴大家原來會計師事務所也有做很不一樣的數據分析,讓企業了解除了財務風險,還有各種可能面對的風險因子,這些風險因子都可以透過數據分析來提前預警,及時因應。
more
曾俊雄

曾俊雄 課堂資料學:到底有沒有在上課

身為教職人員,看著講臺下的學子們,不免有一些期許,但是,我經常不由得問自己,小朋友們到底有沒有在聽課呢? 因緣際會,接觸了情感學習這個領域,帶著實驗團隊找了一些從情感反映來窺探小朋友想法的小研究,在本次演講中,會試著將這些研究結果進行說明及整理。
more
廖弘源

廖弘源 我的多媒體研究之路

多媒體訊號涵蓋聲音、影像、視訊、三維圖檔及文字等,在處理上有不同的需求,因應人工智慧的來臨,有越來越多的深度學習技術被引入此領域。在此演講中,我將講述三個議題。首先,我將描述如何結合視訊、音樂情緒,及機器人學來發展一套自動指揮系統。在第二個議題中,我將談論如何自YouTube上截取同一場演唱會中,由不同聽眾錄得的片段,並用自動的方式將其整合成一段較完整的曲子。我們將引入音樂劇導演的手法讓此雜湊過程更貼近人性。第三個講題是如何讓電腦自動判讀NBA球賽的戰術。
more
溫在弘

溫在弘 剖繪人類移動空間行為的地理科學

疾病擴散常起因於人際間的複雜接觸與移動,病原體可能會透過空氣中傳染,或由病媒攜帶,透過運輸工具傳播至其他乘客身上,或隨著病例從一個區域轉移至另一個區域,促使疾病的擴散發生。換言之,人的流動是疾病擴散的關鍵因子,而理解人的移動是探討疾病擴散等議題的重要一環。而在城市內部的尺度下,人的主要移動方式可分為四種,鐵道運輸(捷運)、機動型運具(汽機車或公車)、非機動型運具(腳踏車)、以及步行等。我將介紹利用各種移動方式的資料來源,包括:資料庫(戶口普查或交通調查、健保資料等)、介接政府開放資料、以及社群媒體等,透過地理視覺分析來呈現都市移動過程,理解人在都市系統中的流動狀況,並進一步介紹利用都市移動資料在疾病擴散預警與就醫行為等公共衛生議題的應用研究。
more
溫明輝

溫明輝 Computational Design Thinking - 數據取向的產品設計思維與案例

「設計思考」是當代設計領域的一門顯學,其提供了各種的設計方法幫助設計師以一個較為客觀及理性的流程推動需求分析、產品發展、測試驗證等各個設計活動。然而,多數的設計思考方法本身仍由設計師的經驗進行主觀分析及判斷。本次分享的主題「運算式的設計思考(Computational Design Thinking」在強調如何架構及運用科學化的工具,獲取產品相關的數據,協助設計師可以更即時、客觀的掌握產品與用戶之間的互動關係,以檢視及評估設計成效,進行設計的優化。透過講者自身發展產品的案例解析,分享數據協助產品設計之經驗與心得。
more
劉正山

劉正山 意義探勘怎麼做:談談如何從小資料看見大格局

本演講將以意義探勘作為料分析的出發點,介紹如何使用R語言,探索民調資料背後的意義。我將以大家熟悉的政黨認同及民主態度,展現實作的過程,幫助大家舉一反三,看見小資料背後驚人的力量。
more
劉憲錡

劉憲錡 非均衡學習建物火災風險模型-以資料英雄計畫「高雄火災風險地圖2.0」為例

「高雄火災風險地圖2.0」係由智庫驅動與高雄市政府消防局共同推動之資料英雄專案,本專案透過隨機森林模型找出火災關鍵因子,進而在消防資源有限的情況下優化巡視家訪建物之效率。建物火災風險預測是典型的非均衡學習,過程中我們利用 BalanceCascade 等方法處理非平衡學習,並測試不同分類器在 bootstrapping 中的表現,最後模型在預測建物火災機率準確率可達 88%、召回率亦有 78% 之表現。 根據內政部消防署公布火災統計資料,105 年火災發生次數1,856 次,火災發生類型以建築物火災1,424次最多,造成火災死亡人數約占年度火災死亡人數的86%。鑑此,降低當地建築物火災事故是各縣市政府消防局的難題之一。對抗火災的最佳策略是採取預防性介入,防患於未然,本次專案與高雄市政府消防局合作,選定鳳山區作為標的,從建築物火災角度出發,彙整建築物及人口特性資料,建構火災風險評估模型,設法找出影響建築物火災關鍵因子,面對當前人力、資源有限的挑戰下,優化現有防火診斷、宣導策略。 前期研究僅依小樣本火警報案紀錄與火災地特徵、或著力於森林火災等空間分析;於建物火災方面則較少著墨。本專案在未失火建物佔多數樣本的情況下,非均衡資料對訓練模型是一大挑戰。在此我們選用了 BalanceCasecade 方法,以 kNN 分類器為依據將未失火建物拆成與失火建物數目一致之子資料集,並透過數個小的 ensemble 隨機森林模型預測建物之火災發生機率。另外,我們也藉由深度學習模型預測建物如發生火災之預期損失。 此專案將非均衡學習實際應用到政府部門,並且實驗不同的分類器下 BalanceCascade 表現之特性。研究後我們也進一步將結果彙整給高雄市政府消防局供往後使用。過程中發現諸多地方政府在跨部會的資料倉儲管理之缺失,我們也加以從「公私協力」角度反饋給地方政府,希望藉由專案的互動交流意見,能夠進一步讓資料倉儲成為政府開放資料之基石。
more
葉宇心

葉宇心 Try Again, Fail Better. 深度學習,從0到1的成長過程。

本次的演講適合正在思索如何將機器學習的方法用在日常生活中的朋友,以及在實作過程中面對各種困難的朋友。分享將著重在AAAD+的架構上。期待能和大家一起交流,相信每一個人都可以將人工智慧與資料科學的方法,帶到生活中,協助我們解決問題! Design: 我們如何從生活出發,找到我們想做的題目,發現問題後,找到深度學習中圖像處理技術,解決所面對的問題。 Algorithm: 深度學習中各種圖像處理的數學方法介紹。 Architeture: 我們如何使用程式工具,將深度學習的方法實作出來。 Application: 分享演算法與程式工具的應用。本次將分享我們在藝術領域與健康領域的應用。
more
葉彌妍

葉彌妍 記憶體內巨量資料探勘:從有效率的摘要擷取到記憶體友善的演算法設計

本演講將分享巨量資料探勘經驗,包含如何從大量資料中去蕪存菁以簡馭繁,如何在多重資料來源的環境下進行節省資料傳輸量並有效率的分析,以及如何利用新興儲存媒體實現記憶體內巨量資料運算。
more
郭立言

郭立言 台灣 PM2.5 短期趨勢預測

細懸浮微粒(PM2.5)因其對人類所造成的危害,逐漸為國人所重視。相較於環保署既有空氣品質日報,短期的PM2.5趨勢預測因其時間近且較精準之特性,將更貼近我們日常活動之需求。是故,我們以環保署測站資料為基礎,從資料分析出發,檢測各個變數於PM2.5間的關聯性,同時考量時空因素,進而選用適當的模型加以訓練,其後整合多個預測模型以達綜效。最後,我們除了展示現階段預測成果外,也將分享待克服的挑戰與可行解決之道。
more
郭耀仁

郭耀仁 Challenges Ahead: Being A Unicorn in Data Science through Problem Solving

I believe the value of data science could reach a incredible level if we eliminate clear boundaries between different roles in a data science team. Every analyst is able to code and modeling, while every statistician is able to manipulate data and visualize data. Besides staying passionate about learning, another good way to is solving problems in work or on your own side projects. In this section, I would like to talk about the concept of a unicorn in data science, the skill sets, and a few practical problems.
more
陳怡安

陳怡安 KKBOX 上的個人化推薦系統

推薦系統已經在許多領域有成熟的應用,但是在音樂串流的領域中,仍存在許多挑戰。使用者對音樂喜好的多變性、音樂訊號的複雜性及聆聽情境推移帶來的影響等等問題,讓推薦問題有了許多趣味。我們會介紹在KKBOX 的資料科學家們怎麼試圖利用使用者行為數據與音樂訊號,結合機器學習演算法來解題,為每個人做出個人化的推薦。
more
陳榮錡

陳榮錡 資料科學在國泰

資料處理微服務架構設計與實現
more
陳潔寧

陳潔寧 不會寫程式的人友善上手機器學習-淺談 Azure Machine Learning

除了資料分析師、資料工程師、機器學習專家外,一般人在工作上或多或少會接觸到資料。透過Azure Machine Learning讓接觸資料的人,能對資料分析及機器學習有了解,也避免掉從零開始學習程式語言的挫折感,幫助日後學習相關語言的成就動機及方向。
more
陳璿宇

陳璿宇 精準醫學時代: 探索健康檢查數據,啟動個人化健康促進

生老病死為人的自然過程,健康、亞健康至生病則為疾病的自然過程,健康促進能阻斷亞健康發展至生病,維持在不生病狀態。精準醫學為在對的時間、對對的人、進行對的處置,也就是基於個人健康或臨床數據,打造個人化健康促進規畫或治療。預防勝於治療為大家耳熟能享的口號,預測個體由亞健康發展至生病的風險,甚至能將亞健康回復成健康狀態,然而誰需要接受健康促進?從生化指標、X光、超音波等基本的健檢數據,到高階的斷層掃描等影像,提供每個人身體狀況指標。每個人都是獨一無二的個體,每個人的健檢數據也有不同意涵,在大數據與人工智慧概念的幫助下,我們可以針對每個人的身體狀況進行風險預測與分類,針對每個人打造不同的健康促進規畫。
more
頁數: 1 2 3 4 - 每頁 20 筆

歡迎在此登錄您的大名及電子郵件地址,日後任何台灣資料科學協會舉辦的相關活動,我們將會以電子郵件通知您。謝謝。