메신저에서 AI와 블록체인까지, LINE이 10년간 걸어온 길

LINE은 지난 2021년 11월 10일과 11일 양일간 기술 컨퍼런스 LINE DEVELOPER DAY 2021을 온라인에서 개최했습니다. 이 행사의 오프닝 키노트에서 CTO 박의빈 님과 AI 사업 책임자 이사고 신이치 님, 블록체인 사업을 담당하고 있는 요네야마 유스케 님이 LINE의 과거와 현재, 그리고 미래에 대해 이야기했는데요. 이 키노트를 글로 옮겨서 두 번에 걸쳐 전달드리려고 합니다. 

이번 블로그는 그 첫 번째 편으로 먼저 박의빈 님이 LINE의 지난 10년을 돌아본 이야기를 전해 드리고, 이어서 이사고 님이 하이퍼스케일 AI를 목표로 삼은 LINE CLOVA에 대해 전해 드리겠습니다.

 

LINE 출시 후 10년

박의빈 님: LINE의 CTO 박의빈입니다. LINE DEVELOPER DAY 2021에 참여해 주셔서 감사합니다. 올해(2021년)도 LINE DEVELOPER DAY가 온라인으로 개최됐습니다.

그래서 온라인의 장점을 살려 평소에는 쉽게 보여드리지 못했던 LINE의 사내 카페로 여러분을 초대하겠습니다. 

2021년은 LINE이 출시된 지 10년이 되는 해입니다. 그래서 오늘은 지난 10년을 한 번 돌아보려고 합니다. 이 화면 다들 기억하실까요? 

2011년 출시 당시의 LINE 앱입니다. 그립네요. 그 시절 에피소드를 하나 말씀드리면, 당시 저희는 모바일 앱 메신저의 가능성을 믿었지만 대부분의 사용자들은 문자 메시지로 충분히 만족하던 시기였습니다. 그래서 앱 간의 메시지 기능뿐 아니라 문자와도 메시지를 주고받을 수 있는 기능을 제공하기 위해 출시까지 정말 시간이 부족했는데도 다같이 빠듯하게 노력했던 기억이 나는데요. 덕분에 앱 사용자는 문자 사용자와도 소통할 수 있어서 보다 편하게 LINE을 시작할 수 있었고, 문자 사용자에게는 LINE을 접하는 계기가 되어 LINE의 연결이 보다 자연스럽게 확대되지 않았나 생각합니다. 

이와 같이 LINE은 사용자의 니즈를 놓치지 않고 사용자가 무엇을 필요로 하는지를 최우선으로 생각하면서 서비스 개선에 매진해 왔습니다. 이후에도 사용자의 니즈에 부응하기 위해 지속적으로 기능을 추가하며, 10년이 지난 지금은 전 세계적으로 약 2억 명이 사용하는 서비스로 성장했습니다. 

그리고 뉴스와 동영상, 음악과 게임 등 다양한 콘텐츠를 더 즐기고 싶어 하는 사용자의 니즈를 읽으면서 다양한 서비스에 도전해 왔습니다. 그 결과, 아래와 같이 여러 가지 미디어와 엔터테인먼트 서비스가 성장했습니다. 예를 들어 일본의 LINE NEWS는 월간 154억 PV의 서비스로 성장했습니다.

2014년에는 LINE Pay를 시작하면서 핀테크에도 도전했습니다. 이후 LINE 증권과 같은 서비스를 출시했고, 2020년에는 태국에서, 2021년에는 대만과 인도네시아에서 은행 서비스를 오픈했습니다. 그중에서 태국 은행 서비스인 LINE BK는 서비스 시작 후 단 1년 만에 330만 명 이상의 사용자를 확보했습니다. 또한 LINE 선물과 같이 커뮤니케이션과 관련이 깊은 이커머스 분야에서도 사용자가 보다 훌륭한 경험을 할 수 있도록 서비스를 개발했습니다. 

물론 모든 서비스가 성공한 것은 아니었습니다. 그동안 많은 서비스를 닫았습니다. 그렇지만 사용자의 니즈가 있는 곳에는 반드시 기회가 있다고 생각하고 실패를 두려워하지 않고 계속 도전한 것, 그것이 바로 우리에게 축적된 힘이 아닐까 생각합니다. 

 

여러 지표와 함께 알아보는 LINE의 성장

서비스 도전과 함께 LINE의 플랫폼도 거대해졌습니다. 플랫폼의 규모를 나타내는 몇 가지 수치를 살펴보겠습니다. 

먼저 초당 40만 요청. LINE의 메시지 전달 수가 정점에 올랐을 때의 수치입니다. LINE에서 굉장히 많은 커뮤니케이션이 오가고 있다는 것을 알 수 있습니다. 

또한 사용자가 주고받는 이미지나 동영상 등의 미디어 데이터량은 하루 11PB가 되었습니다. 

다음은 LINE 사용자 간의 연결을 나타내는 노드 링크 수로 약 720억입니다. 여러분이 많은 사용자와 연관돼 있다는 것을 알 수 있습니다. 

마지막으로 248만. LINE에 개설된 채널 개수입니다. 여기에는 서비스 계정이나 LINE 공식 계정 등이 포함돼 있는데요. 상당히 많은 비즈니스가 LINE 플랫폼에서 활동하고 있다는 것을 알 수 있습니다. 

이와 같이 LINE이 커뮤니케이션과 비즈니스 플랫폼으로 급속히 성장하고 있기 때문에 신뢰성을 확보하는 것이 매우 중요했는데요. 이에 따라 급격히 증가하는 데이터량이나 요청을 감당할 수 있는 분산 시스템 기술 개발에 주력해 왔습니다. 

 

기술에 투자해 온 LINE

LINE은 지난 10년간 다양한 기술에 투자해 왔습니다. 그중 몇 가지를 소개 드리겠습니다.

먼저 음성 영상 통화인 VoIP 기술과 동영상 스트리밍 기술에 적극적으로 투자해 서비스 품질을 꾸준히 개선해 왔습니다. 또한 클라우드 기술에 투자해서 2016년부터 OpenStack 기반 자체 프라이빗 클라우드인 Verda를 운영하고 있습니다. 2018년부터는 블록체인 기술에도 주목해서 2020년에는 블록체인 플랫폼 LINE Blockchain Developers를 본격적으로 출범시켰는데요. LINE의 블록체인 전략에 대해서는 추후 자세히 말씀드리겠습니다.

또한 LINE 플랫폼의 수많은 데이터를 효율적으로 관리하고 이용하기 위해서 하나의 큰 데이터 플랫폼을 구축하는 것에도 노력해 왔습니다. 이렇게 구축한 데이터 플랫폼이 Information Universe, 줄여서 IU라고 부르고 있는 플랫폼입니다. 현재 290 PB에 달하는 데이터가 축적되어 있고 매달 약 10 PB씩 증가하고 있습니다.

이렇게 모은 데이터를 ML(machine learning)에 응용하기 위해 공통 ML 플랫폼도 구축하고 있습니다. 공통 기반을 만드는 것인데요. 서비스를 가로질러 거대한 모델을 만들 수 있도록 설계해서 다양한 서비스에서 최대 8,000만 멘션의 특징을 모아 보다 정밀한 아웃풋을 얻을 수 있습니다. ML 기술을 적극적으로 이용할 수 있는 환경 덕분에 사용자들에게 보다 편리한 서비스를 더욱 빠르게 제공할 수 있게 되었습니다. 

간단하게 LINE의 10년을 돌아보았습니다. 더 좋은 서비스를 만들기 위해 기술적으로 도전하면서 여러 가지 서비스를 오픈하고 닫기도 했고 많은 시도와 오류를 반복해 왔는데요. 정말 10년이 훌쩍 지나간 것 같습니다. 이제 오프닝 키노트의 메인 주제인 HyperCLOVA와 LINE의 블록체인 전략에 대해 말씀드리겠습니다. 앞서 말씀드렸던 데이터 플랫폼, IU는 LINE 사내에서 사용하는 플랫폼이었는데요. 그와는 별도로 보다 범용적으로 LINE 사외 엔지니어 분들도 이용할 수 있는 AI 플랫폼, HyperCLOVA를 현재 NAVER와 협력해 개발하고 있습니다. 먼저 HyperCLOVA에 대해서 말씀드리고 이어서 LINE의 블록체인 전략에 대해서 알아보겠습니다. 

 

LINE CLOVA, 하이퍼 스케일 AI 구축을 목표로

이사고 님: AI 사업 책임자인 이사고입니다. 저는 LINE이 ‘하이퍼 스케일 AI’ 구축을 목표로 삼고 진행하고 있는 프로젝트를 소개하겠습니다. 

지금까지 AI 개발은 각 업무 요건에 맞춰 개별적으로 최적화한 비교적 작은 규모의 모델을 그때마다 구축하는 접근법이 일반적이었습니다. 최적화하기 때문에 성능을 보장하는 것은 수월했지만, 모델을 구축하는 전문 기술을 가진 모델러를 확보하는 게 병목이었습니다. 

그런 가운데 글로벌 AI 연구 개발로 눈을 돌려보면 GPU 성능이 향상돼 대규모 클러스터를 이용하는 것이 비교적 쉬워지면서 자연 언어를 처리할 때 OpenAI의 GPT-3나 Google의 T5, Hugging Face와 같이 대규모 범용 언어 모델을 구축하는 움직임이 보이고 있습니다. 

LINE과 NAVER가 공동으로 연구를 진행하고 있는 LINE CLOVA 역시 700 페타플롭스(PetaFlops, PFLOP)가 넘는 대규모 GPU 클러스터를 확보해 일본어와 한국어의 대규모 범용 언어 모델을 중심으로 한 하이퍼 스케일 AI를 구축하고 있습니다. 바로 HyperCLOVA입니다.

2020년에 열렸던 LINE DEVELOPER DAY에서 일본어 대규모 범용 언어 모델에 대해 발표하고 일본어와 한국어 모델 구축을 진행했습니다. 대규모 범용 언어 모델에서는 말들 간의 관련성을 나타내는 파라미터의 수가 매우 중요한데요. 일본어와 한국어 각각 13억에서 서서히 규모를 확대해 나가 현재는 390억 파라미터 모델 구축에 성공했습니다.

심플하게 학습 데이터를 모아서 파라미터 수가 많은 모델을 구축하고 있는 것이 아니라 이면의 기술적인 과제를 해결하면서 조금씩 규모를 키워가고 있습니다. 비교적 안정적인 파라미터 390억 개 모델의 응용 가능성을 검토하고 있으며 동시에 여러 언어를 다루는 820억 파라미터 모델 구축에도 도전하고 있습니다. 2022년에는 2040억 파라미터의 일본어 모델을 구축할 예정입니다.  

또한 학습용 말뭉치(corpus)는 외부 제공을 포함해 범용적으로 이용할 수 있도록 권리 관계를 최대한 고려하면서 지속적으로 정비하고 있으며, 여러분이 LINE에서 송수신한 메시지와 오픈 채팅 방 게시물을 포함해 LINE 서비스와 관련된 데이터는 일절 이용하지 않고 있습니다. 

HyperCLOVA 데모 시연

그럼 HyperCLOVA로 무엇을 실현할 수 있을까요. 현재 살펴보고 있는 가능성은 요약과 문서 생성, 대화 등의 분야인데요. 이번 발표에서는 문서 생성과 대화와 관련해 실제 작동하는 HyperCLOVA를 이용한 데모를 보여드리겠습니다.

먼저 HyperCLOVA를 GUI로 조작할 수 있는 HyperCLOVA Studio를 이용해서 상품의 개요부터 설명까지 생성하는 작업을 진행해 보겠습니다. HyperCLOVA에게 글쓰기를 시키기 위해서는 먼저 사람이 ‘이런 조건일 때는 이런 문장을 생성한다’는 샘플을 작성해야 합니다. 이 작업을 프롬프팅이라고 부르는데요. 이 샘플에 따라 HyperCLOVA의 아웃풋이 크게 달라지기 때문에 샘플을 작성할 때 약간의 요령이 필요합니다. 

데모 시연은 일본어로 진행됐습니다.

상품 개요를 바탕으로 무심코 사고 싶어지게 만드는 설명문 생성하기

상품명: 쌉싸름한 초콜릿 카카오 99%
개요: ○명칭 초콜릿 ○원재료명: 카카오매스(일본 국내 제조), 코코아파우더, 설탕, 코코아버터/유화제, 향료 ○내용량:200g ○보관방법: 24℃ 이하 서늘한 곳에 보관해 주세요.
설명: 건강만을 생각한 슈퍼 카카오 폴리페놀. 압도적으로 강한 쓴맛과 코를 찌르는 강렬한 향기 속에서 은은한 단맛을 느낄 수 있습니다. 게다가 200g 대용량으로 송년회 벌칙 게임에도 딱 알맞은?

###

상품명: 새콤 게맛 센베이
개요: ○스낵 과자 ○원재료명: 밀가루(일본 국내 제조), 식물성유, 전분, 게살, 분말 식초(밀가루 포함), 설탕, 소금, 게 파우더, 다시마 파우더, 설탕/팽창제, 감미료(우뭇가사리) ○내용량: 60g
설명: 어린이부터 어른까지 폭넓은 인기를 얻고 있는 게 맛 센베이입니다물론 화학조미료착색료는 사용하지 않았습니다!

실행 후 설명문이 생성됐습니다. 좀 더 재미있는 설명문을 생성하고 싶기 때문에 Temperature를 높여 다시 시도해 보았는데요. 아까보다 나아졌지만 마지막 문장이 좋지 않아 다시 한 번 생성해 보겠습니다. 또 다른 글이 됐습니다.

상품 개요를 바탕으로 무심코 사고 싶어지게 만드는 설명문 생성하기

상품명: 쌉싸름한 초콜릿 카카오 99%
개요: ○명칭 초콜릿 ○원재료명: 카카오매스(일본 국내 제조), 코코아파우더, 설탕, 코코아버터/유화제, 향료 ○내용량:200g ○보관방법: 24℃ 이하 서늘한 곳에 보관해 주세요.
설명: 건강만을 생각한 슈퍼 카카오 폴리페놀. 압도적으로 강한 쓴맛과 코를 찌르는 강렬한 향기 속에서 은은한 단맛을 느낄 수 있습니다. 게다가 200g 대용량으로 송년회 벌칙 게임에도 딱 알맞은?

###

상품명: 새콤 게맛 센베이
개요: ○스낵 과자 ○원재료명: 밀가루(일본국내 제조), 식물성유, 전분, 게살, 분말 식초(밀가루 포함), 설탕, 소금, 게 파우더, 다시마 파우더, 설탕/팽창제, 감미료(우뭇가사리) ○내용량: 60g
설명: 어린이부터 어른까지 폭넓게 사랑받는 게맛 센베이입니다. 진짜 게보다 너무 맛있어서 지나치게 먹지 않도록 주의하세요!

다음으로 ‘새콤 게맛’이라는 말로 시작하는 설명문을 생성해 보겠습니다. 잘 연결되는 문장이 생성됐지만 Repetition penalty를 낮추고 긴 문장을 생성해 보겠습니다. 아까보다 더 재밌는 표현의 설명문이 된 것 같습니다. 

상품 개요를 바탕으로 무심코 사고 싶어지게 만드는 설명문 생성하기

상품명: 쌉싸름한 초콜릿 카카오 99%
개요: ○명칭 초콜릿 ○원재료명: 카카오매스(일본 국내 제조), 코코아파우더, 설탕, 코코아버터/유화제, 향료 ○내용량:200g ○보관방법: 24℃ 이하 서늘한 곳에 보관해 주세요.
설명: 건강만을 생각한 슈퍼 카카오 폴리페놀. 압도적으로 강한 쓴맛과 코를 찌르는 강렬한 향기 속에서 은은한 단맛을 느낄 수 있습니다. 게다가 200g 대용량으로 송년회 벌칙 게임에도 딱 알맞은?

###

상품명: 새콤 게맛 센베이
개요: ○스낵 과자 ○원재료명: 밀가루(일본국내 제조), 식물성유, 전분, 게살, 분말 식초(밀가루 포함), 설탕, 소금, 게 파우더, 다시마 파우더, 설탕/팽창제, 감미료(우뭇가사리) ○내용량: 60g
설명: 살짝 새콤한 맛이 나는 게맛 센베이입니다. 입 안에 넣으면 살살 녹아 없어지는 식감이 끝내줍니다. 술안주나 간식으로 드셔보세요.

이렇게 짧은 문장 생성을 자동화하면 이커머스 영역에서 상품 설명을 자동 생성하거나 개인화한 메시지를 개별적으로 작성할 수도 있을 것 같습니다. 

 

키즈나 아이(キズナアイ) 데모

다음으로 대화 데모입니다. 몇 개의 기술을 조합해 구현했기 때문에 어디에서 HyperCLOVA가 사용됐는지 이해하기 조금 어려울 수도 있어서 먼저 구조를 간단히 소개하겠습니다. 데모는 사람과 같은 크기의 캐릭터와 음성으로 대화하는 형식입니다. 우선 음성 인식 기술로 음성을 텍스트로 변환해 HyperCLOVA 기반의 대화 모델에 입력합니다. 

HyperCLOVA는 받은 입력에 대한 답변으로 가장 자연스럽다고 생각하는 문구를 추출해 발화합니다. 이 데모는 Kizuna AI 주식회사에서 전면 협조해 주셔서 평소 게임 개발을 담당하고 있는 LINE Studio에서 개발한 것입니다. 그럼 실제로 해보겠습니다. 바로 시작해 볼까요?

아래 대화는 일본어로 진행된 대화를 한국어로 번역한 것입니다.



이사고: 안녕하세요.
키즈나 아이: 네 안녕하세요. 키즈나 아이입니다. 잘 부탁해요.
이사고: 생일과 키를 알려주세요.
키즈나 아이: 생일은 6월 30일입니다. 키는 156센티미터예요.
이사고: 지금 저희는 사무실 카페에 있습니다.
키즈나 아이: 네 맞아요. 여기서 보이는 경치는 아름답네요.
이사고: 네. 오늘 LINE 컨퍼런스에서 인공지능에 대한 이야기를 하고 있습니다. 아이 씨는 인공지능에 대해서 어떻게 생각하나요?
키즈나 아이: 인공지능의 힘으로 세상이 편리해졌으면 좋겠어요.
이사고: 네. 아이 씨도 꼭 끝까지 듣고 가세요.
키즈나 아이: 네. 우리의 미래에 대한 이야기니깐 기대하고 있을게요.
이사고: 고마워요. 또 봐요.
키즈나 아이: 네. See you. 또 봐요.

이사고 님: 어떠셨나요? 가상 아티스트의 라이브 방송뿐 아니라 게임이나 애니메이션 캐릭터 혹은 실제 인간에 가까운 가상 인간과도 궁합이 잘 맞는 것 같습니다.

자, 실제로 작동하는 데모 2개를 보셨습니다. 이미 HyperCLOVA가 완성된 것은 아닌가 생각하실 수도 있는데요. 아직 기술적으로 해결해야 할 과제가 많이 남아 있어서 함께 해결할 동료를 늘리고 싶습니다(다음 편으로 이어집니다).