本期專訪|練光祐教授:量「聲」訂做智慧家庭聲控系統

本期專訪|練光祐教授:量「聲」訂做智慧家庭聲控系統


產學處 周佩萱專員/採訪報導

關鍵字:音訊處理、AI、智慧家庭、IoT、生理訊號量測與分析、嵌入式裝置、智慧型控制

臺北科大電機工程系

練光祐教授

 

經歷

國科會控制學門 複審委員(2003~2005、2008~2011、2014~)

國科會控制學門 控制理論研究規劃委員會召集人(2004年、2008年、2015年)

IEEE 控制系統學會台北分會 主席(2015~ )、副主席(2005~2009)

IEEE CIS學會台北分會 副主席 (2009~2011)

Asia Journal of Control, Associate Editor (2008~)

 

智慧音訊處理技術介紹

  北科大機電工程系練光祐教授實驗室近年專注於智慧音訊處理技術的研發,以不需要連網的方式,由使用端的嵌入式系統或是電腦逕自進行音訊處理,即時輸出結果,將具有以下優點:低成本、隱私保護及安全性高,系統獨創可以針對關鍵詞進行辨識,且針對不同人的指令也可分辨,雖然是同一個指令但可以改變不同的情境效果,適合針對特定語言族群開發客製化商品。核心技術包含:

 

一、獨特降噪技術

  單麥克風降噪技術可以做到精準保留指令聲紋,進行特徵分析。另外也可對發音方位進行語音強化並弱化其他方位的噪音,提高音訊品質。透過獨門演算法分析將主要聲源分離出來,特徵擷取並進行分類。

二、聲源追蹤技術

  利用獨家研發的麥克風陣列技術,儘管走動中的人一邊講話,仍可以準確判讀方位,可自動偵測聲源的XY軸、定位及仰角。

三、高精確度的關鍵字技術

  研究室有許多自製的演算法,可用於語音辨識、語者辨識、深度學習等。運用特徵擷取技術及獨門的演算法,將程式寫進嵌入式系統中,不需依賴網路,使用者可直接建置個人資料庫,裝置將自動辨認使用者身份及自訂關鍵詞。在成果展示中,示範30種控制指令與30位使用者,辨識率高達9成以上,練教授表示更多都沒問題。

四、多音源辨識技術

  實驗室技術更可以達到多音源辨識,例如語者同時下達開燈及開電扇的指令,系統都可以同時辨認並執行。多音源辨識除了應用在智慧家庭,也可以用於機場服務台和旅遊中心,協助旅客諮詢服務。除了可以做到即時回覆旅客問題,也可偵測不同國籍的口音進行辨識,系統可對應變換口音回覆。

 

智慧音訊處理技術應用的案例分享

一、智慧家庭聲控系統

  此系統不僅能控制家中任何擁有紅外線功能的電器,例如:電視、冷氣、暖氣等,亦能直接切換家中各式照明電器及電源開關。更藉由辨識語者身份的差異,針對同一個關鍵詞呈現不同的情境效果。

二、智慧安撫嬰兒床

  2017年智慧安撫嬰兒床獲得旺宏金矽獎應用組金獎,旺宏金矽獎為國內最大的電機電子類競賽。智慧安撫嬰兒床透過辨識嬰兒的哭聲、笑聲與咳嗽聲,可進行相對應情境的安撫,或是發生緊急事件時,可透過手機通知父母,父母便可以在第一時間照護嬰兒。

三、遠端居家老人照護

  一般老年人遠端照護,通常使用攝影機監控,但攝影機無法裝設在隱私的空間如廁所、臥室等地方。此時可安裝居家環境音偵測系統,假設老人家在廁所跌倒發出巨響,或是在廁所長時間無聲響,系統都可時通知家屬。

四、智慧交通管控

  智慧都市的應用層面上,在每個號誌燈路口皆安裝智慧音訊處理系統,可即時偵測警車或救護車鳴笛聲響,系統將自動判讀,即時變換交通號誌,爭取救護時間。

 

 

圖一、智慧家庭聲控系統

 

圖二、智慧家庭聲控系統使用的類神經網路架構

 

圖三、智慧嬰兒床

 

圖四、英文口音矯正系統

 

圖五、語者字詞辨識系統

 

圖六、聲源定位系統