大家好,我們是 LINE 台灣資料開發團隊的 Penny、Johnson 與 Nina。很高興能參加這次由台灣大學電信所及資工所,於 2 月 7 號舉辦的專題演講 "Speech Technologies at Google: an Overview"。本演講很難得地邀請到帶領 Google speech 團隊的 Pedro J. Moreno 博士,親自分享 Google 語音辨識服務的技術演進和應用。演講內容深入淺出,從傳統語音辨識的方法,到比較深的 end-to-end 模型,並用 end-to-end 模型帶出幾個主要的應用。接下來我們會針對什麼是語音辨識、如何做語音辨識、語音辨識的應用,以及 LINE 台灣對於中文語音辨識的努力進行分享。怎麼做語音辨識?首先,什麼是語音辨識呢?語音辨識,或稱自動語音辨識 (Automatic Speech Recognition, ASR) 的目標很簡單,就是透過電腦自動把語音內容轉成對應的文字,與大家說的語音轉文字 (Speech To Text, STT) 是同一件事。聽起來好像很枯燥,但其實可延伸出無窮的應用。Pedro J. Mo