overlast
2018-12-25LINE Engineer
メリークリスマス !!
LINE Advent Calendar 2018の最終日は、Clovaの自然言語理解システムの開発に携わっている佐藤敏紀(@overlast)が担当します。今年のクリスマスプレゼントは自分で自分に、超小型ジンバル付きカメラを買いました。いつかまた子供の頃の様にサンタさんからプレゼント貰いたいです。
はじめに: 今回のテーマについて
今回のテーマはタイトルにも含まれている、”人名の読み仮名候補の自動列挙”についてです。
このテーマがどんなものか具体例を挙げてご説明すると、以下の様な入力データに対して
入力データ
サンプル1
出澤剛
サンプル2
佐藤敏紀
サンプル3
Timothy Donald Cook
以下の様に、人名の範囲で考えられる読み仮名を列挙した出力データを返すだけです。とてもシンプルですね。
出力データ
サンプル1
イデサワタケシ, イデサワツヨシ, イデサワゴウ, イデザワタケシ, イデザワツヨシ, イデザワゴウ, デザワタケシ, デザワツヨシ, デザワ