講者

« 回列表

音樂檢索與歌聲抽取

演講摘要

本演講將回顧音樂檢索的過去與現況,特別是在哼唱選歌及音訊指紋辨識這兩個領域,並說明目前音樂檢索所碰到的最大挑戰。針對這個挑戰,我們將解釋如何從複音音樂進行歌聲抽取以及其重要性。在不同的應用情境下,我們使用的方法包含深度神經網路以及主動是噪音消除,同時我們也將說明如何將抽取出來的歌聲用於各項音樂相關的應用,包含哼唱選歌、口水歌辨識、歌詞對位、歌聲評分等,現場並會進行各項相關展示。

講者簡介

張智星
  • 張智星 個人網站
  • 台灣大學資訊工程系 / 教授
  • 張智星教授於 1992 年取得加州大學柏克萊分校的電機電腦博士,博士論文即在探討模糊邏輯與類神經網路的建模與迴歸,1993 年的單一作者論文「ANFIS: Adaptive-network-based fuzzy inference system」開啟模糊推論系統自我學習的大門,Google Scholar 被引用數達到 12740(2017/07/31)。張教授於 1993 年加入美國 MathWorks 公司,開發模糊邏輯工具箱。1995 年回台任教後,研究方向轉向機器學習的各項應用,包含語音評分、音樂檢索、文件分類、影像辨識等領域。他曾經擔任 2014 年 ISMIR(在台北舉行)的 General Chair 以及 2017 年 ISMIR(在蘇州舉行)的 General Co-chair,他的團隊也在歷年 MIREX 國際音樂檢索評比中的數個項目拿下第一名的佳績。張教授著重理論和實作的整合,曾經將所開發的語音評分、音樂檢索的程式庫授權給多家知名廠商,同時也執行多項產學合作計畫,並擔任工研院、資策會及其它相關廠商顧問,產學合作績效亮麗。

歡迎在此登錄您的大名及電子郵件地址,日後任何台灣資料科學協會舉辦的相關活動,我們將會以電子郵件通知您。謝謝。