こんにちは。東京大学大学院修士1年の鈴木凌斗と申します。8月23日から6週間、技術職 就業型コースのインターンシップに参加しました。
今回のインターンではData Platform室 IU Devチームに所属し、LINE社内で利用している「IU Web」というデータカタログの検索機能改善に取り組みました。本ブログでは、その内容について紹介します。
背景
IU Webについて
参考:LINEがサービス横断で実現する"データ活用の民主化"
LINEでは全社横断でデータを活用するために「IU」(Information Universe) と呼ばれるデータプラットフォームを利用していて、LINEのほぼすべてのサービスのデータがここに集積されています。現時点でサーバ台数は2,000台以上、ストレージ使用量は約300PBとなっています。
「IU Web」はIUのデータを管理するデータカタログとして以下を提供します。
どのようなデータが存在するか
データの権限は誰にあるか
データのメタ情報
データの検索機能
社内ユーザは、IUに存在する大量のデータの中から目的のデータにアクセスするためにIU