Kunihiko Sato

광고 플랫폼을 개발하는 소프트웨어 엔지니어입니다.

세계 최대 IT 경진 대회인 ‘Imagine Cup 2018’ 3위를 차지했습니다

안녕하세요? LINE에서 광고 플랫폼을 개발하고 있는 Kunihiko Sato입니다. 저는 2018년 7월 23일부터 25일까지 미국 시애틀에서 열린 Microsoft 주최 IT 경진 대회 ‘Imagine Cup‘에 일본 대표로 참가해 3위에 입상했는데요. 오늘은 그 후기를 전해드릴까 합니다. 참고로 Imagine Cup은 학생들이 참가하는 IT 경진 대회인데요. 2018년도에는 2017년 9월부터 2018년 7월 사이에 하루라도 학생이었던 사람에게는 출전권이 주어졌습니다. 저는 2018년 3월에 […]

딥 러닝 음성 인식에 필요한 훈련 데이터를 직접 만들어보자

안녕하세요, LINE에서 광고 플랫폼 개발을 맡고 있는 1년차 신입사원 Kunihiko Sato입니다.

이번 블로그에서는 Python을 사용해서 임의의 Signal-to-Noise ratio(SN비)를 가진 음성 파형을 만드는 방법을 소개하겠습니다. 참고로 이 포스팅의 내용은 Clova 등 LINE의 음성 사업과는 관련이 없습니다.

음성 처리 분야에서의 딥 러닝

오래 전 딥 러닝이 이미지 처리 분야에서 기술 혁신을 일으켰는데, 음성 처리 분야에서도 비슷한 일이 벌어지고 있습니다. 딥 러닝으로 음석 인식의 정밀도가 크게 향상되면서, Amazon Echo나 Google Home, LINE Clova와 같은 AI 스피커가 개발되어 시장에 보급되었습니다. 또, 컴퓨터로 음성을 생성하는 문자 음성 변환(Text-to-Speech)의 정밀도도 높아져서 실제 사람의 목소리와 분간하기 힘들 정도의 음질이 되었습니다.

음원 분리에 적용된 딥 러닝

위에서 언급한 사례 외에도 딥 러닝을 통해 정밀도 측면에서 많은 발전을 이룬 음성 처리 분야들이 있는데요. 그 중 하나가 음원 분리입니다.