SIGIR2019 聴講・発表報告

SIGIR2019

京都開発室 UnivRelチームの坂田です。私は2018年4月に新卒としてLINEに入社して以来、京都大学などと連携しながら自然言語処理技術を活用した社会課題解決手法の開発に取り組んでいます。

LINEには海外カンファレンスや学会への参加費用を支援する制度があり,会社負担で学会に参加することが可能です。私は今回、情報検索のトップカンファレンスであるSIGIRにて聴講・発表してきました。今年のSIGIRはフランス・パリで開催となり、参加者は1025名で過去最大だったようです。また論文の採択(投稿)数はFull:84(426)件 Short:108(443)件でこちらも最大だったようです。

LINEからはポスターセッションで1件採択されました。論文の詳細についてはこちらをご覧ください。

パリ到着〜学会参加まで

会場はパリ市内の北東部に位置するLa Villate公園のCité科学産業博物館でした。
会場内には科学産業に関する幅広い展示があり研究発表以外にも見るものが多く飽きません。

会場ではNAVERがスポンサーブースを出しておりLINEのロゴも発見しました。

また、学会初日にはWelcome Receptionがパリ中心部の進化グランドギャラリーで行われ、シャンパンと軽食が振る舞われました。会場では多くの参加者と情報交換を行うことができました。開催地の関係からか欧州からの参加者が多い印象でした。

パリではサマータイムが導入されていることもあり日没が大変遅く、22:00頃まで暗くなりません。そのため、会議の後には街に出て素敵な景色を観ることができました。

聴講報告

今回私は検索手法と質問応答のトピックを重点的に聴講してきました。検索手法・質問応答ともにELMoやBERTなど自然言語処理分野で最近流行した手法を利用したものがやはり多かったです。対話生成についての研究なども行われており、自然言語処理分野と情報検索分野の境界が薄くなってきている印象を受けました。

また検索や対話モデルの出力に説明性や透明性、安全性などを持たせる研究発表が多く見られました。これは検索・質問応答・対話モデルにニューラル手法を導入する事例が増えるとともにモデルがブラックボックス化した影響と思われます。実サービスでモデルが不適切な挙動を起こし問題となった例も存在するため、今後も重要なトピックになると感じました。

発表報告

私たちはFAQ Retrieval using Query-Question Similarity and BERT-Based Query-Answer Relevanceという題で発表いたしました。本研究では伝統的な手法であるBM25ベースの検索モデルと近年提案され自然言語処理分野で広く利用されるようになったBERTを両者の特徴を活かしながら統合することでFAQ検索の向上を行いました。

この研究は、LINEと国立情報学研究所(NII)の共同研究部門である、ロバストインテリジェンス・ソーシャルテクノロジー研究センター(CRIS)の研究プロジェクト「LINEを活用した社会課題解決手法の研究」の一環として行なったものです。このプロジェクトは、京都大学大学院情報学研究科黒橋研究室・兵庫県・尼崎市・丹波市・NII・LINEによるCRISの産官学連携研究であり、CRIS副センター長でもある京大黒橋教授主導のもと、昨年6月より兵庫県尼崎市および丹波市でそれぞれLINE上での行政対話サービスを運用する実証実験を行っており、その中で今回発表したFAQ検索技術も実運用されています。詳しくはこちらをご覧ください。

発表は合計2時間半ほどの時間が与えられていました。発表時には黒橋教授もいらっしゃいました。発表後、黒橋教授からは「この研究が進み対話ボットが賢くなれば、地域活性化や行政コストの削減に繋がる。社会課題解決に向けて研究を進めていきましょう。」とのコメントをいただきました。

幸運なことに絶えず多くの方に訪れていただき、大変興味深い指摘を多数いただくことができました。フィードバックを元に今後もサービス向上を進めていきたいと思います。また、BERT のようなパラメータの多いニューラルモデルを検索に用いる際、どの程度の計算機資源・時間が必要となるのかという質問が多く寄せられました。検索分野でもニューラルネットワークを用いた研究が多くなっていますが、計算機資源などのコスト問題がネックとなって実運用できていないケースが多いように感じました。情報検索の実運用時には検索対象がとても大きくなるケースも多く、ニューラル手法が流行している他の分野と比べても特にニューラル手法の低コスト化が重要となっていくと感じました。