Tag Archives: Signal-to-Noise

任意のSignal-to-Noise比の音声波形をPythonで作ろう!

この記事は、 LINE Engineering Blog 「夏休みの自由研究 -Summer Homework-」 の 12 日目の記事です。

こんにちは、LINE Ads Platformの開発チームに所属している新卒1年目の佐藤邦彦です。
本記事では、Pythonを使って任意のSignal-to-Noise比(SN比)の音声波形を作る方法を紹介します。なお、本記事の内容は、Clova等の弊社音声事業とは関係ありません。

音声のDeep Learning

画像処理分野においてDeep Learningが技術革新を起こしてから久しいですが、同様のことが音声処理の分野においても起きています。Deep Learningによって音声認識の精度は格段に上がり、Amazon EchoやGoogle Home, LINE ClovaなどのAIスピーカーが市場に普及しました。また、コンピュータによる音声生成(Text-to-Speech)の精度も上がり、その質は人間の声と区別が付きづらいほどです。

Deep Learningで音源分離したい

上記に挙げた音声処理以外にもDeep Learningによって格段に精度が上がっている音声分野があります。

そのひとつが音源分離です。
音源分離とは、複数の音源が混ざった入力波形を各音源の波形に分離することです。