講者

頁數: 1 2 3 4 5 6 7 - 每頁 20 筆

共有 131 位講者

人工智慧╳資料科學演講:

劉正山

劉正山 意義探勘怎麼做:談談如何從小資料看見大格局

本演講將以意義探勘作為料分析的出發點,介紹如何使用R語言,探索民調資料背後的意義。我將以大家熟悉的政黨認同及民主態度,展現實作的過程,幫助大家舉一反三,看見小資料背後驚人的力量。
more
劉冠良

劉冠良 Defect Inspection with Deep Learning

為了確保提供給客戶的產品符合需求,生產線上都會安排站點做最終產品的外觀檢測,然外觀瑕疵大小、樣式不一,產品表面又有很高的變異性,不管是利用golden sample做pattern match或是設計客製化的特徵萃取都還是會有相當高的誤報(false alarm)或漏檢(false negative)機率,在這次分享中,我們將介紹如何利用深度學習演算法對產品做瑕疵檢測,其中將包含利用CNN以object detection的方式對目標物做檢測,以及FCN以pixel in, pixel out的方式segment瑕疵範圍,或透過autoencoder了解待測物結構後將瑕疵當作anomaly檢測出來。
more
劉憲錡

劉憲錡 非均衡學習建物火災風險模型-以資料英雄計畫「高雄火災風險地圖2.0」為例

「高雄火災風險地圖2.0」係由智庫驅動與高雄市政府消防局共同推動之資料英雄專案,本專案透過隨機森林模型找出火災關鍵因子,進而在消防資源有限的情況下優化巡視家訪建物之效率。建物火災風險預測是典型的非均衡學習,過程中我們利用 BalanceCascade 等方法處理非平衡學習,並測試不同分類器在 bootstrapping 中的表現,最後模型在預測建物火災機率準確率可達 88%、召回率亦有 78% 之表現。 根據內政部消防署公布火災統計資料,105 年火災發生次數1,856 次,火災發生類型以建築物火災1,424次最多,造成火災死亡人數約占年度火災死亡人數的86%。鑑此,降低當地建築物火災事故是各縣市政府消防局的難題之一。對抗火災的最佳策略是採取預防性介入,防患於未然,本次專案與高雄市政府消防局合作,選定鳳山區作為標的,從建築物火災角度出發,彙整建築物及人口特性資料,建構火災風險評估模型,設法找出影響建築物火災關鍵因子,面對當前人力、資源有限的挑戰下,優化現有防火診斷、宣導策略。 前期研究僅依小樣本火警報案紀錄與火災地特徵、或著力於森林火災等空間分析;於建物火災方面則較少著墨。本專案在未失火建物佔多數樣本的情況下,非均衡資料對訓練模型是一大挑戰。在此我們選用了 BalanceCasecade 方法,以 kNN 分類器為依據將未失火建物拆成與失火建物數目一致之子資料集,並透過數個小的 ensemble 隨機森林模型預測建物之火災發生機率。另外,我們也藉由深度學習模型預測建物如發生火災之預期損失。 此專案將非均衡學習實際應用到政府部門,並且實驗不同的分類器下 BalanceCascade 表現之特性。研究後我們也進一步將結果彙整給高雄市政府消防局供往後使用。過程中發現諸多地方政府在跨部會的資料倉儲管理之缺失,我們也加以從「公私協力」角度反饋給地方政府,希望藉由專案的互動交流意見,能夠進一步讓資料倉儲成為政府開放資料之基石。
more
葉宇心

葉宇心 Try Again, Fail Better. 深度學習,從0到1的成長過程。

本次的演講適合正在思索如何將機器學習的方法用在日常生活中的朋友,以及在實作過程中面對各種困難的朋友。分享將著重在AAAD+的架構上。期待能和大家一起交流,相信每一個人都可以將人工智慧與資料科學的方法,帶到生活中,協助我們解決問題! Design: 我們如何從生活出發,找到我們想做的題目,發現問題後,找到深度學習中圖像處理技術,解決所面對的問題。 Algorithm: 深度學習中各種圖像處理的數學方法介紹。 Architeture: 我們如何使用程式工具,將深度學習的方法實作出來。 Application: 分享演算法與程式工具的應用。本次將分享我們在藝術領域與健康領域的應用。
more
葉彌妍

葉彌妍 記憶體內巨量資料探勘:從有效率的摘要擷取到記憶體友善的演算法設計

本演講將分享巨量資料探勘經驗,包含如何從大量資料中去蕪存菁以簡馭繁,如何在多重資料來源的環境下進行節省資料傳輸量並有效率的分析,以及如何利用新興儲存媒體實現記憶體內巨量資料運算。
more
郭建甫

郭建甫 Project Mynah 九官鳥計畫:AI 幫你接電話

whoscall 如何從既有的累積出發再次創新,推出貼近人性需求的新產品。如何從來電辨識與過濾的軟體,走向電話線裡的人工智慧服務; 如何從消費者端的產品,找出商業上的痛點; 如何克服科技上的突兀,找到人性上的解法。此場演講中,將第一次公開分享 gogolook 在內部創新的新專案:Mynah,一個讓 AI 幫你接電話服務。
more
郭立言

郭立言 台灣 PM2.5 短期趨勢預測

細懸浮微粒(PM2.5)因其對人類所造成的危害,逐漸為國人所重視。相較於環保署既有空氣品質日報,短期的PM2.5趨勢預測因其時間近且較精準之特性,將更貼近我們日常活動之需求。是故,我們以環保署測站資料為基礎,從資料分析出發,檢測各個變數於PM2.5間的關聯性,同時考量時空因素,進而選用適當的模型加以訓練,其後整合多個預測模型以達綜效。最後,我們除了展示現階段預測成果外,也將分享待克服的挑戰與可行解決之道。
more
郭耀仁

郭耀仁 Challenges Ahead: Being A Unicorn in Data Science through Problem Solving

I believe the value of data science could reach a incredible level if we eliminate clear boundaries between different roles in a data science team. Every analyst is able to code and modeling, while every statistician is able to manipulate data and visualize data. Besides staying passionate about learning, another good way to is solving problems in work or on your own side projects. In this section, I would like to talk about the concept of a unicorn in data science, the skill sets, and a few practical problems.
more
陳宜欣

陳宜欣 大數據情緒分析的經驗分享

「情緒」是社群網站上的一種特性,它可以用在不同的用途,像是偵測意見、消除模稜兩可、猜測興趣、甚至是預防犯罪以及偵測自殺傾向。因此,偵測出使用者文章中的情緒,將是改善服務以及關懷社會中,非常重要的一環。 過去的研究在分析情緒的時候,大部分都採用正負方來分類,而且會利用計算語言專有的技術,如:字詞分析、使用情緒辭典,在這個演講中,我們將分享用一種異於傳統的分析方法,利用潛意識群眾智慧,不但可以分出更細的情緒(如:高興、悲傷、憤怒、驚訝等等),還可以輕易將方法運用到多國語言的情緒分析上。在我們過去的經驗中,我們利用情緒分析技術,運用到心理情緒的偵測,來偵查社群網路上發文者的心理狀態(躁鬱等),期待這樣的技術將可以減少許多不幸的案件、或協助研究者了解心理狀態的轉變。 從這些過去的研究中,我們將會分享一些過去的經驗、由不同的視野來探討使用者,相信這些經驗將能引起資料愛好者的興趣、且具有應用的參考價值。
more
陳怡安

陳怡安 KKBOX 上的個人化推薦系統

推薦系統已經在許多領域有成熟的應用,但是在音樂串流的領域中,仍存在許多挑戰。使用者對音樂喜好的多變性、音樂訊號的複雜性及聆聽情境推移帶來的影響等等問題,讓推薦問題有了許多趣味。我們會介紹在KKBOX 的資料科學家們怎麼試圖利用使用者行為數據與音樂訊號,結合機器學習演算法來解題,為每個人做出個人化的推薦。
more
陳榮錡

陳榮錡 資料科學在國泰

資料處理微服務架構設計與實現
more
陳潔寧

陳潔寧 不會寫程式的人友善上手機器學習-淺談 Azure Machine Learning

除了資料分析師、資料工程師、機器學習專家外,一般人在工作上或多或少會接觸到資料。透過Azure Machine Learning讓接觸資料的人,能對資料分析及機器學習有了解,也避免掉從零開始學習程式語言的挫折感,幫助日後學習相關語言的成就動機及方向。
more
陳煥宗

陳煥宗 不視而見的智慧

電腦視覺是發展人工智慧的重要環節之一,而當前的電腦視覺技術,對於人工智慧提供了什麼樣的能力?從「視而不見」到「不視而見」需要多少「智慧」?電腦視覺與人類視覺還有多少差距?在這個演講中我們將對這些問題做初步的探討。
more
陳璿宇

陳璿宇 精準醫學時代: 探索健康檢查數據,啟動個人化健康促進

生老病死為人的自然過程,健康、亞健康至生病則為疾病的自然過程,健康促進能阻斷亞健康發展至生病,維持在不生病狀態。精準醫學為在對的時間、對對的人、進行對的處置,也就是基於個人健康或臨床數據,打造個人化健康促進規畫或治療。預防勝於治療為大家耳熟能享的口號,預測個體由亞健康發展至生病的風險,甚至能將亞健康回復成健康狀態,然而誰需要接受健康促進?從生化指標、X光、超音波等基本的健檢數據,到高階的斷層掃描等影像,提供每個人身體狀況指標。每個人都是獨一無二的個體,每個人的健檢數據也有不同意涵,在大數據與人工智慧概念的幫助下,我們可以針對每個人的身體狀況進行風險預測與分類,針對每個人打造不同的健康促進規畫。
more
陳紹慶

陳紹慶 從資料發掘理論?用資料確認理論?淺談如何兼容資料科學與開放科學

從資料發掘新奇實用理論的機器學習,是近幾年台灣社會及學術界許多領域的顯學。近期學術界造假事件層出不窮,我認為這時候值得了解開放科學的宗旨:累積可重製的資料,才能建構經得起考驗的理論。 我以2011年心理學再現危機開始爆發的指標事件,與近兩年引發議論的「權力姿勢」為例,說明以新奇理論包裝的劣質研究能被發表,並獲得關注的關鍵。現在的開放科學採用那些措施扭轉這些問題。這些措施與資料科學的建模有沒有抵觸?或是相輔相成的可能? 最後以curate science project為例,說明如何運用累積數據,引導一般科學研究人員提昇研究操作品質,建構以可再現結果為基礎的實用理論。
more
陳彥呈

陳彥呈 影音大數據商機挖掘

近十年來影音內容年年暴增,觀看網路影片已經成為現代人主要的娛樂方式。然而,有別於文字內容,影音中的資訊不易被搜尋、檢索,觀賞時所產生的流量成本與版權費用,往往也大過其所能帶來的廣告營收或會費收入。即便世界最大的影音內容平台Youtube,也僅能勉強平衡收支。近年來人工智慧技術的突破,已讓大量辨識影音內容變為可行,但辨識成本高、準確率不完美、變現方式不成熟等因素,讓傳統媒體、影視產業,對於是否轉型成為「新媒體」陷入進退兩難的困境。講者投身影音內容辨識技術十餘年,近年來專注挖掘影音內容中的金礦,進行辨識技術的客製化、「邊看邊買」、「影音內容關連廣告」等業務的推廣。講者將分享這一路上所遇見的難題,從演算法到系統架構,到商務上與策略上所遇到的瓶頸與挑戰。
more
陳維超

陳維超 人工智慧運算系統的現況與展望

類神經網路的訓練與推論,近幾年已成為平行運算裡最重要的成長契機。由繪圖晶片 GPU 領軍的跳躍性成長,其背後有著二十年的積累。依據資料中心需求設計的 Google TPU,以及可程式化的 FPGA 晶片,同時也加速了產業的變革與進展。行動運算的進步,更促成了人工智慧終端的開發。在這個演講裡,我會試著探討這些方向的共通性與差異性,並介紹我們自行開發之高效能運算架構與影像處理之算法,以協助聽眾理解、預期未來之運算趨勢。
more
陳縕儂

陳縕儂 深度學習之智慧型對話機器人 Deep Learning for Intelligent Conversational Bots

智慧對話機器人 (Intelligent Conversational Bot) 是人工智慧領域中近年來備受重視的一支,各個公司及個人都嘗試著架構專屬的聊天機器人 (ChatBot)。然而,聊天機器人的功能不僅僅侷限於聊天,能夠以對話的方式來協助人類完成各式各樣目標才是我們真正想要的人工智慧。要如何應用深度學習的技術讓機器理解人類對話,並且有效率的協助人類,是現今最重要的研究發展方向,也是此演講會涵蓋的主要範疇。
more
陳韋良

陳韋良 善用 Machine Learning 及 AWS serverless 架構分析惡意檔案

對於惡意檔案數量快速的增加,此主題將分享透過對各類檔案的特性研究收集資料,並善用AWS Lambda, ECS 等服務,打造serverless系統架構,從Feature generation到model training及prediction,event trigger方式串起自動化流程,即時處理大量case。
more
潘建興

潘建興 A SOP for Accurate and Efficient Analysis of Large-Scale Network Data

Large-scale network data analysis has emerged into one of the most important tools in th big data regime for almost all scientists and practitioners. Among all characteristics and properties, community and centrality are two major components for a detailed understanding of a large-scale network. Unfortunately, traditional methods are either computationally infeasible for large-scale network, or without statistical verification and inference. This talk introduces a SOP for accurate and efficient analysis of large-scale network data. It consists of four main steps. First, a screening stage is proposed to roughly partition the whole network into communities via complement graph coloring. Then a likelihood-based statistical test is introduced to test for the significance of the detected communities. Once these significant communities are detected, another likelihood-based statistical test is introduced to check for the focus centrality of each community. Finally, a metaheuristic swarm intelligence based (SIB) method is proposed to fine tune the range of each community from its original circular setting. Our proposed SOP is demonstrated in several real-life data, showing how this method can provide extra suggestions from the data.
more
頁數: 1 2 3 4 5 6 7 - 每頁 20 筆

歡迎在此登錄您的大名及電子郵件地址,日後任何台灣資料科學協會舉辦的相關活動,我們將會以電子郵件通知您。謝謝。