새로운 기술을 실제 서비스 도메인에 적용해 보는 것을 좋아하는 엔지니어입니다. 현재 LINE에서 NLP 관련 업무를 수행하고 있고, AI-Text 필터, VOC 필터 등의 프로젝트에 참여하고 있습니다.
Tech-Verse 2022에서 김형락 님이 발표한 AI-Text 필터링 모델을 위한 거대 ML 모델 적용기 세션 내용을 옮긴 글입니다. 안녕하세요. 현재 Data & Machine Learning 조직에서 NLP 엔지니어로 일하며 AI-Text 필터 모델을 담당하고 있는 김형락입니다. 먼저 제가 가져온 그림을 하나 감상하겠습니다. 제가 그렸다고 하기엔 너무 잘 그린 그림인데요. 사실 이 그림은 AI에 'beautiful forest'라는 입력을 넣고 받은 AI가 그린 그림입니다. AI의 성능이 이와 같이 발전한 배경에는 거대 모델이 있는데요. 이번 글에서는 AI-Text 필터 모델에 거대 모델을 적용해서 성능을 개선한 경험을 공유하겠습니다. 글은 AI-Text 필터가 무엇이고 어떤 문제가 있어서 거대 모델을 사용했는지 먼저 설명한 뒤, 거대 모델을 훈련할 수 있는 기술이 무엇인지 살펴보고, 거대 모델을 활용해서 AI-Text 필터를 고도화한 경험을 공유하는 순으로 진행