LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog

Blog


VLDB 2022 参加報告

LINE Data Scienceセンター、ML Privacyチームの髙橋です。9月に世界トップレベルの国際会議、VLDB 2022にて発表しました。本ブログではその模様について報告いたします。

VLDB 2022について

Very Large Data Base Endowment Inc.主催のVLDB 2022 (48th International Conference on Very Large Data Bases)は、データベース・データ工学分野におけるトップカンファレンスです。SIGMODやICDEと並ぶデータベース系三大会議として知られています。本年度は、9月5日〜9日にかけてオーストラリアのシドニーで開催されました。会場は、Darling Harborを臨むThe International Convention Centre Sydney (ICC Sydney)です。

LINEからは、髙橋が京都大学の加藤さんとインターンシップで取り組み、その後、京都大学大学院情報学研究科 吉川正俊教授および北海道大学大学院情報科学研究院 曹洋准教授 (当時は京都大学 特定准教授)との共同研究に発展した研究成果が採択され、発表の機会を頂きました。

発表内容

今回のVLDBでは、データベースへの問合せ処理を差分プライバシーによって保護する際、任意のクエリに対し、少ないノイズで応答可能な中間データ(ビュー)を構築する手法「HDPView」を提案しました。差分プライバシーによる問合せ処理を実現する方法には、クエリ応答の度にノイズを加算する方法と、事前にノイズを加算した中間データを構築する方法があります。前者には問合せ回数等の制限があること、また後者の既存技術は事前に決められたクエリにのみ最適化されていることから、いずれも探索的なデータ解析には適していないという課題がありました。提案法「HDPView」は、これらの課題の解決を目指し、クエリに非依存、誤差の見積もりが可能、高次元データに適用可能、高い空間効率といった特徴を有しています。評価実験では、主に解析の誤差やビューのサイズの点で、既存の手法を大きく上回る性能を示しました。

詳細は以下の論文リンク、および発表資料をご参照ください。

発表論文

"HDPView: Differentially Private Materialized View for Exploring High Dimensional Relational Data"

- Fumiyuki Kato, Tsubasa Takahashi, Shun Takagi, Yang Cao, Seng Pei Liew, Masatoshi Yoshikawa

発表資料

発表の模様

(左: Oral 発表 by 加藤さん 右: ポスター発表 by 加藤さん)

発表は、第一著者である元インターンの加藤さんにOral発表とポスター発表を担当いただきました。加藤さんのメンターをした髙橋も、ポスター発表の一部を担当しました。特にポスター発表では多くの方々にご興味をお持ちいただき、いくつか質問や有益な示唆をいただきました。今後の検討に活かしていきたいと思います。

参加者との交流

VLDB 2022は、In-person + Onlineのハイブリッドで開催されました。現地のシドニーでIn-personで会議に参加し、世界の研究者と交流しました。

バンケット

(左:Luna Park 右: Luna Park送迎のフェリーにて)

バンケットはDarling HarbarにあるLuna Parkという遊園地で開催しました。ICC SydneyからLuna Parkまでは貸切のフェリーで向かいました。Luna Parkのアトラクションを利用できました(参加者との雑談や交流を優先したためアトラクションには乗りませんでしたが)。
我々は、ちょうど発表の直後がバンケットでしたので、リラックスして参加できました。ここでも世界中の研究者、技術者とたわいもない話から、最近の技術の動向まで、さまざまなトピックで交流することができました。

所感

私自身、国際会議に現地参加するのは約2年半ぶりのことでした。学会のコーヒーブレイクやランチタイム、バンケットでは、世界の様々な研究者、技術者と交流し、関係構築をしました。特に、我々の専門領域であるデータプライバシーの著名な研究者にご挨拶させていただいたり、最近の研究の動向等について情報交換をさせていただきました。参加者との交流の機会は大きな価値の一つであり、現地参加の魅力を改めて実感しました。
また、東アジア、東南アジアでは、LINEという会社、アプリの知名度がそこそこあり、興味を持ってもらえることが多々ありました。ただやはり、グローバルな有名企業と比べると、まだまだ差が大きいことは否めません。トップカンファレンスでの論文採択・発表を継続し、アカデミアでのLINEのプレゼンスをもっともっと高めていければと思っております。

LINEが注力するプライバシー保護技術の研究開発について

LINEでは、ユーザーデータを活用したパーソナライゼーションに力を入れており、同時にデータを扱う際のプライバシーへの配慮についても重要視しています。

近年、国際的な規制の整備も進み、プライバシー保護の技術や考え方もめざましい発展を遂げています。時流に即した最適なプライバシーモデルの追求と導入は、プラットフォーマーとしての重要な責任です。LINEでは、連合学習や差分プライバシー、秘密計算等の先端的なプライバシー保護型機械学習技術の検証や実装を推進し、十分なプライバシーへの配慮と多様なユーザーに向けた深いパーソナライズの両立を目指しています。

プライバシー保護に関する研究開発の成果として、これまでLINEとしては、「ICDE2021」や「ICLR2022」といった世界トップレベルの国際会議で、差分プライバシーに関する論文の採択実績があります。差分プライバシーはユーザーデータ収集・活用にあたって、所定のノイズやランダム性を追加することによって、あらゆる人と見分けがつかない出力結果とする際に用いられる、数学的に厳密なプライバシー基準です。現在、LINEでは差分プライバシーによるプライバシー保護型データ活用の実用化に向け、研究開発に取り組んでいます。

最後に

LINEでは、以下の職種にてプライバシーxデータサイエンス・機械学習の研究者ならびにエンジニアを積極的に採用しています。興味がございましたら応募をご検討ください!!