Blog - LINE ENGINEERING

TAG ARCHIVES: HyperCLOVA

【インターンレポート】トピック判別器を利用した対話システムのための話題制御技術開発
Hiromasa Sakurai2023-05-26
NLP開発チーム
こんにちは。東京大学大学院情報理工学系研究科コンピュータ科学専攻修士1年の櫻井大雅と申します。8月8日から9月16日の6週間、LINE株式会社の2022年度夏季インターンシップの「技術職就業コース」に参加させていただきました。このレポートでは、NLP開発チームで私が取り組んだ内容について説明します。まず、基盤モデルを活用した対話システムにまつわる問題について紹介したのち、それを解決するために本インターンで何に取り組んだかを述べます。背景膨大なパラメータを大量のテキストで学習し、高い汎化性能によって様々な下流タスクに応用可能な基盤モデルは、自然言語処理の分野において重要性を増しています。LINEとNAVERも、日本語に特化した大規模な汎用言語モデルを内包するシステム群であるHyperCLOVAを共同開発しています。このHyperCLOVAをベースとした対話システムは様々なジャンルに関する自然な文章を生成することが可能で、広範囲の話題に対応できます。昨年度の対話システムライブコンペティションでも、LINEのNLP開発チームはHyperCLOVAを用いた対話システムによって、自由
【インターンレポート】6.7B日本語モデルに対するLoRAチューニング
Hao Wang2023-02-22
NLP開発チーム
はじめにこんにちは、王昊(オウコウ)と申します。現在、私は早稲田大学基幹理工学部情報理工学科4年で、河原研究室に在籍していて、自然言語処理の研究を行なっています。私は特にマルチリンガルに関する研究に興味を持っていて、多言語BERTの構築、漢文の日本語書き下し文の生成などの研究に取り組んでいます。 2022年8月上旬から6週間、LINE夏インターンシップ技術職就業型コースに参加させていただき、AIカンパニーのNLP開発チームにて「6.7B日本語モデルに対するLoRAチューニング」という課題に取り組みました。本レポートではその内容について紹介します。本レポートの内容は、2023年3月12日から沖縄で開催される、言語処理学会年次大会にて発表いたします。6.7Bモデルのファインチューニングなどのより詳細な情報はそちらで発表いたしますので、年次大会にご参加の方はよろしくお願いいたします。背景・目的近年、Wikipediaなどのテキストデータを使用した大規模な事前学習と特定のタスクやドメインへの適応(ファインチューニング)が自然言語処理において重要なパラダイムとなっています。GPT-3などの
【インターンレポート】シチュエーションを限定した対話における応答生成
Toshiki Kawamoto2022-02-02
こんにちは、川本稔己と申します。今回LINE夏インターンシップ技術職就業型コースに参加する機会を頂きましたので、その内容をご報告致します。現在、私は東京工業大学大学院修士課程1年で、奥村・船越研に在籍しており、自然言語処理という分野の研究を行っています。私は特に対話に関する研究を行っていて、身近な例でいうと音声アシスタントのような人とシステムで行う対話に興味があります。システムが何でも答えてくれるようになったり、話し相手になってくれたら楽しいですよね。そういった思いがあって、今回のLINEのインターンでは、AI開発室のNLPチームで業務に携わりました。業務内容は大規模汎用言語モデルを用いた対話システムを構築することで、その成果を対話システムライブコンペティション4に提出しました。その結果、オープントラックとシチュエーショントラックでどちらも1位を取ることができましたので、本記事では自分がメインで担当しましたシチュエーショントラックについて詳細をご報告致します。対話システムライブコンペティション4 対話システムライブコンペティション(以降ライブコンペ)とは、対話システムシンポジウム
【インターンレポート】大規模汎用言語モデルにおける対話応答へのキャラクタ性付与
Ayaka Ueyama2021-11-24
はじめにこんにちは！静岡大学大学院総合科学技術研究科情報学専攻 1年の上山彩夏と申します。8/16~9/24の6週間、LINE株式会社の2021年度夏季インターンシップ「技術職就業型コース」に参加させていただきました。今回のインターンシップでは、サーバーサイドエンジニアとしてAIカンパニー/AI開発室に配属され、大規模汎用言語モデルを用いて、対話応答にキャラクタ性を付与するという課題に取り組みました。本レポートでは、第一に「HyperCLOVA / 大規模汎用言語モデル」を紹介し、その後、インターンシップにて取り組んだ内容を説明したいと思います。 HyperCLOVA / 大規模汎用言語モデルとは？近年、深層学習によって自然言語処理技術は急激に発展しており、膨大な量のテキストデータを元に学習された言語モデルが多様なタスクを高い精度で解ける能力を有していることが知られています[1]。2020年6月に「GPT-3 (Generative Pretrained Transformer 3)」[2]が登場し、人間が書いた文章と見分けがつかないレベルの文章を生成したことから、自然言

1