ICDE2021参加報告

LINE Data Scienceセンター、Machine Learning Researchチームの高橋です。2019年夏季インターンの高木さんとの共同研究成果をトップカンファレンスICDE2021で発表しました。

ICDE 2021について

IEEE主催のICDE 2021 (37th IEEE International Conference on Data Engineering)は、データベース・データ工学分野におけるトップカンファレンスです。SIGMODやVLDBと並ぶDB系三大会議として知られています。本年度は、4月19日〜22日にかけてギリシャのハニアで開催予定でしたが、昨今のCOVID-19の感染拡大の影響から、オンラインのバーチャルカンファレンスとして開催されました。LINEからは、高橋と2019年の夏にLINEのインターンに参加した高木駿さんとの共同研究の成果が採択され、発表の機会を頂きました。採択率は28%と例年と比べると高い水準でした (これまでは20%を下回るような採択率でした)。

発表内容

我々の発表内容は、生成モデルのプライバシ保護に関するものです。近年注目のプライバシ基準 Differential Privacy (以降、DP) を保証するようノイズを挿入しながら生成モデルを学習するアルゴリズムP3GM (Privacy Preserving Phased Generative Model) を提案しました。DPの制約下での生成モデルの学習は、ノイズの影響を強くうけてしまうために生成データの質に問題がありました。P3GMでは、学習の過程を簡素化することでノイズに頑健な生成モデルの学習法を実現しました。詳細は以下の論文および発表資料をご参照ください。

論文

P3GM: Private High-Dimensional Data Release via Privacy Preserving Phased Generative Model
– S. Takagi, T. Takahashi, Y. Cao, and M. Yoshikawa

発表資料

オンライン発表の様子と所感

オンライン開催となったICDEでは、発表者が事前に動画を収録し、当日はQ&Aセッションのみを口頭で行う形式でプレゼンテーションが進行しました。発表、Q&Aセッションともに高木さんに担当して頂きました。発表は本会議の初日に行われる予定でしたが、オンラインシステムの不具合等の理由で最終日翌日に延期されるといったオンライン会議ならではのトラブルに見舞われました。Q&Aセッションは、すべての発表動画を放送した後に座長の仕切りで行われました。座長や他の発表者から基本的なことから応用に関することまでいくつか質問を頂きました。今後の研究の参考としたいと考えています。

高木さんにショートインタビュー

高木さんにICDEに参加された感想やLINEでのインターンシップについてお伺いしました。

Q: トップカンファレンスであるICDEに参加してみていかがでしたか?
A: 自分の研究を含め、同じ分野の研究に関して同じ場所に集まって最先端な議論ができたので、刺激的で研究へのモチベーションにつながりました。

Q: ICDEに採択されるまでの道のりやその過程での苦労、採択されたときの感想を教えてください
A: 論述の仕方でリジェクトされたことがありました。そのため、隙のない論述をすることを意識してICDEに投稿して、採択された時はそれがうまくいったことに達成感がありました。

Q: インターンシップではメンターとどのように研究を進めましたか?
A: 多い時は毎日くらいの短いスパンでミーティングをしていました。ミーティングではお互いが一研究者として対等の立場で議論を繰り返し、研究を固めました。

Q: インターンシップやICDEでの経験は今後どのように活かせそうですか?
A: インターンシップでは一から研究を始めたので、サーベイから手法の考案、論文の執筆まで、トップカンファレンスに通すための研究の仕方が身につきました。その方法論は次に取り掛かる研究にも役立つと思います。

Q: LINEでインターンシップを検討している学生さんにメッセージをお願いします。
A: インターンを通して研究に必要な力が身につきます。将来、研究職につきたいと思っている方には最高のインターンだと思います。

ありがとうございました。高木さんのインターンシップのレポートは以下をご参照ください。

LINEのR&D体制

LINEのMachine Learning Researchチームでは、プライバシに配慮したデータサイエンス・機械学習を実現するための基礎研究や応用技術の開発に取り組んでいます。また、AI事業を戦略事業の一つとして位置付け、事業拡大に向けて積極的に展開しています。事業や担当領域を超えた横断的な大規模データを最大限に活用し、新たなAI関連サービス・新機能を創出するとともに、各種サービスのさらなるユーザ体験向上に注力しています。「データ基盤開発」「データ分析」「機械学習」「AI技術開発」「基礎研究」を担う各チームが連携することで、「研究 > 開発 > 事業化」のサイクルをスピードアップしています。

最後に

LINEでは、以下の職種にてプライバシ x データサイエンス・機械学習の研究者ならびにエンジニアを積極的に採用しています。ご興味がございましたら応募をご検討ください!!