Machine Learning Production Pitch #1 開催レポート

Clova開発室でエンジニアをしています服部 (keigohtr) です。

2019年3月7日に “Machine Learning Production Pitch (#MLPP)” という機械学習系のイベントをエムスリー株式会社LINE株式会社とで共同開催しました。LINE株式会社からはDataLabsの呂彩林さんとClova開発室の的場勇樹さんが登壇しました。エムスリー株式会社からはnishibaさんとvaaaaanquishこと河合俊典さんが登壇しました。

募集枠の2倍以上の応募があって非常に盛り上がりました。

Introduction: Machine Learning Production Pitchとは

Machine Learning Production Pitchは、機械学習について業務で培った知見や経験や苦労話を共有できる場を提供することを目的としたMeetupです。機械学習に取り組み、実社会への適用に日々もがき苦しみ楽しんでいる方々を対象としたイベントで、今後は2ヶ月に1度くらいの頻度で開催していきます。

Pitch 1: Anonymize Large-scale Sparse User Features at LINE Corp

トップバッターはLINE株式会社 Account Platform開発室エンジニアの呂彩林さんです。今回は、ユーザ属性推定や各サービスのレコメンデーションシステムで使われている大規模かつスパースなユーザ特徴量を匿名化するための取り組みについて登壇しました。Sparse Composite Document Vectors (SCDV)を使ってユーザ特徴量を匿名化しつつ情報量を減らさない工夫を行っています。

Pitch 2: Application of Graph Convolutional Network in M3

2番手はエムスリー株式会社 機械学習エンジニアのnishibaさんです。Graph Convolutional Network (GCN) の活用例を紹介しました。GCNは最近Hotなトピックで、私はGCNの実運用の事例は聞いたことがなかったので非常に参考になりました。

Pitch 3: NLU Architecture and ML Model Management in Clova

3番手はLINE株式会社 Clova VA開発室エンジニアの的場勇樹さんです。今回は、Clovaで使われているNLU (自然言語処理) において仕様の変更を素早く反映するために採用しているアーキテクチャの紹介と、機械学習の実運用のために構築したワークフローについてAirflowとRekcurdを連携させた事例を紹介しました。Rekcurdは私達が開発しているLINE製のOSSなので是非ともスターをお願いします!

Pitch 4: graph構造を利用した医療用語のタグ付け

最後はエムスリー株式会社 機械学習エンジニアの河合俊典さんです。今回は、エムスリーサービス内でのユーザの情報や行動、記事に紐付くタグなどのネットワーク情報をgraph構造としてモデル化し、レコメンドといったプロダクトに還元するまでの技術や運用、評価のノウハウを共有しました。河合さんはエムスリーに転職してまだ1ヶ月なのに既に発表できる成果を挙げていてすごいと思いました。

最後に、エムスリーから登壇いただいたお二人にLINEからClovaを贈呈しました。是非ともハックして頂きたい・・・!

懇親会

懇親会はエムスリー株式会社の提供で寿司でした!・・・すいません、話に夢中になっていたので写真は撮り忘れました・・・次回以降は絶対・・・!懇親会でも技術トークに華が咲いていたので、次回は懇親会場にホワイトボードをいくつか持ち込んでその場で議論みたいなことをしたいです。

おわりに

コミュニティページ作りました!

connpassはページがあるだけですが、既に120人の方が参加しています笑 今後はここからイベント情報の発信をしていきますので是非コミュニティに参加してください。登壇者や会場提供の立候補をお待ちしています!是非!