講者

« 回列表

非均衡學習建物火災風險模型-以資料英雄計畫「高雄火災風險地圖2.0」為例

演講摘要

「高雄火災風險地圖 2.0」係由智庫驅動與高雄市政府消防局共同推動之資料英雄專案,本專案透過隨機森林模型找出火災關鍵因子,進而在消防資源有限的情況下優化巡視家訪建物之效率。建物火災風險預測是典型的非均衡學習,過程中我們利用 BalanceCascade 等方法處理非平衡學習,並測試不同分類器在 bootstrapping 中的表現,最後模型在預測建物火災機率準確率可達 88%、召回率亦有 78% 之表現。 根據內政部消防署公布火災統計資料,105 年火災發生次數 1,856 次,火災發生類型以建築物火災 1,424 次最多,造成火災死亡人數約占年度火災死亡人數的 86%。鑑此,降低當地建築物火災事故是各縣市政府消防局的難題之一。對抗火災的最佳策略是採取預防性介入,防患於未然,本次專案與高雄市政府消防局合作,選定鳳山區作為標的,從建築物火災角度出發,彙整建築物及人口特性資料,建構火災風險評估模型,設法找出影響建築物火災關鍵因子,面對當前人力、資源有限的挑戰下,優化現有防火診斷、宣導策略。 前期研究僅依小樣本火警報案紀錄與火災地特徵、或著力於森林火災等空間分析;於建物火災方面則較少著墨。本專案在未失火建物佔多數樣本的情況下,非均衡資料對訓練模型是一大挑戰。在此我們選用了 BalanceCasecade 方法,以 kNN 分類器為依據將未失火建物拆成與失火建物數目一致之子資料集,並透過數個小的 ensemble 隨機森林模型預測建物之火災發生機率。另外,我們也藉由深度學習模型預測建物如發生火災之預期損失。 此專案將非均衡學習實際應用到政府部門,並且實驗不同的分類器下 BalanceCascade 表現之特性。研究後我們也進一步將結果彙整給高雄市政府消防局供往後使用。過程中發現諸多地方政府在跨部會的資料倉儲管理之缺失,我們也加以從「公私協力」角度反饋給地方政府,希望藉由專案的互動交流意見,能夠進一步讓資料倉儲成為政府開放資料之基石。

講者簡介

劉憲錡
  • 劉憲錡
  • 清華大學資應所 / 研究生
  • 劉憲錡 Toby Liu 是由智庫驅動發起之第二期資料英雄計畫參與者之一,中大經濟系畢業後,目前是清大資應用所碩士生,研究主題包含資料探勘、語意分析、情緒分析等。研究之餘,他還是個開放原始碼社群貢獻者,參與社群包括開源人年會、零時政府年會、台灣摩茲社群、國立中央大學網路開源社。 他信仰資料科學,並且希望這個世界能藉由資料科學的力量變得稍微好一點點。

歡迎在此登錄您的大名及電子郵件地址,日後任何台灣資料科學協會舉辦的相關活動,我們將會以電子郵件通知您。謝謝。