TCS 臺灣傳播調查資料庫

【產業動態】語音識別大突破！Google深度學習仿造雞尾酒效應，從吵雜環境將人聲獨立

日期

2018-04-16

新聞來源

INSIDE

內容

近年來語音辨識技術大幅邁進，但機器仍難以從吵雜環境中認出單一聲音。人類具有聽力選擇能力，可將注意力集中於某人談話上，忽略背景裡其他對話或噪音，此即所謂「雞尾酒會效應」。Google為了加強機器判讀音訊的能力，提出模擬人類「雞尾酒會效應」的深度學習視聽模型，機器將可利用影音內容的視覺訊號來辨識聽覺訊號，例如，機器可以憑藉人類嘴部運動獲悉相應的說話聲音，並將這說話聲音從週遭的雜音中提取出來。

資料來源：https://www.inside.com.tw/2018/04/16/google-cocktail-parties-listen-audio-visual-speech
責任編輯：林薇晨（政大傳播所）

關鍵字

Google、語音辨識、聽力、雞尾酒會效應、深度學習

產業新聞

【產業動態】語音識別大突破！Google深度學習仿造雞尾酒效應，從吵雜環境將人聲獨立