Taishi Nakashima
2021-03-04はじめに
LINE株式会社の 2020 年度夏季インターンシップに参加しました中嶋 大志と申します。普段は東京都立大学大学院で音源分離に関する研究をしています。今回のインターンシップでは LINEのData Labs の Speech チームに所属し、 Robin Scheibler さんにメンターになっていただきました。
人間には複数の人が同時に発話している状況でも、自分が聞きたい発話だけを聞き取る能力があります。これはカクテルパーティー効果と呼ばれています。音源分離とはこのカクテルパーティー効果を機械で実現する研究です。音源分離には様々な応用が期待されています。代表的な応用例はスマートフォンやスマートスピーカーなどの音声入力機器です。例えば、子供たちが騒いでいたり、テレビの声があるようなリビングでも自分の声だけを聞き取ってくれればとても便利です。
しかし、会議室やリビングのような閉じた環境で音声を録音すると、残響が含まれます。仕事で議事録を作るために会議の音声を録音して後で聞いてみたものの、音がぼやけて聞きづらいという経験はないでしょうか。このように残響