DataScience

新卒エンジニアの仕事〜2020年入社のデータサイエンティスト編〜

こんにちは、2020年春に新卒としてLINE株式会社に入社した小坪琢人です。主にLINE Pay、LINEウォレット関連のデータ分析を行うチームに所属しています。

学生時代は時系列データ (株価や気温変化など)に関する解析手法について研究を行っていました。研究以外では企業・学会が主催するコンペティションやR言語の勉強会に参加していました。このような活動を通じて、データサイエンティストという職業に興味を持ちました。学部時代に就職活動をしていたときは、そもそもデータサイエンティストという職業すら知らなかったので、その点でも大学院に行く価値があったと思います。

就職活動はデータ分析チームがある事業会社かつR言語が使用できるという軸で行いました。LINEのデータサイエンスチームはRやpythonの得意な方、あるいは両方を業務に合わせて使用することができます。LINEには「OASIS」というデータ分析ツールがあり、SQLでデータを抽出→ Rやpythonで集計・分析という一般的なフローを誰でも簡単に行うことができます。

全体研修・エンジニア研修を終えて、興味を持っていた LINE Payに関する分析チームに配属しました。
この記事では、6月末にチームに配属されてからの自分の取り組みやデータサイエンティストの仕事についてお話ししていきたいと思います。

【Team & Project】LINE全社のデータ基盤のミドルウェアやData ingestion pipelineの開発・運用を担当しているチームを紹介します

LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。 

今回は、LINEグループ全体のデータ関連業務で根幹になる戦略・政策・技術に関わる業務を担当しているData Platform室から、データ基盤の開発をしている「Data Infrastructureチーム 」とData ingestion pipelineを開発する「Ingestion Pipelineチーム」をご紹介します。Wang Tianyiと齋藤智之に話を聞きました。 

DEIM2020にオンライン形式で参加・発表しました

Data Labsのデータサイエンティストの大木と、リサーチャーの高橋です。

3月2日(月)から4日(水)まで開催された DEIM 2020 (第12回データ工学と情報マネジメントに関するフォーラム) に協賛企業として参加しました。

まずはじめに、今回わずか準備期間2週間という非常に短い期間でありながら、急遽オンライン学会となったDEIM2020を成功させようと関わった運営ならびに参加者の皆様に心から感謝申し上げます。

発表者としてオンラインでの発表に慣れてないこともあり不安はありましたが、始まってみると特にトラブルなく無事発表を終えることができました。

また参加者として、オンライン上で学生の活き活きとした発表を聴講させていただきました。

会議全体を通じてとても2週間で準備したとは思えない完成度の高いオンライン学会に発表・参加することができ、運営側のパワーを非常に感じました。

以下に、技術報告セッションで発表しました大木と、セッションで座長を務めました高橋から、内容およびオンライン参加体験について紹介したいと思います。

The Web Conference 2019 参加レポート

Data Labs データサイエンティストのIdeです。
Data LabsはLINEのメッセンジャーを含めた全ファミリーサービスのデータの分析・研究・応用のための専門的な開発組織です。私の所属するData Scienceチームでは、最新の知見を業務に取り入れるべく論文の紹介や研究会への参加などを積極的に行なっています。
その一貫として、技術に関連する海外カンファレンスに会社負担で参加できる制度を利用して、2019年5月13日〜17日に開催された国際会議The Web Conference 2019に聴講参加してきた内容について報告します。

Japan.R 2017開催レポート

この記事はLINE Advent Calendar 2017の15日目の記事です。

こんにちは、LINEとLINE Fukuokaでデータサイエンティストをしております、stakaya、horikawa、oshiroです。

12月2日(土)に、Japan.R 2017というイベントが開催されました。弊社はJR新宿ミライナタワーの本社を会場として提供する形で協賛しましたので、当イベントについてご報告します。

Japan.Rとは

Japan.Rは、統計解析言語Rのコミュニティ関係者が集まる国内最大のカンファレンスで、日本各地で年に1度開催されます。

当日の様子

今年の参加者は、募集サイト上では162名にのぼりました。開場早々に机席はほぼ全て埋まってしまい、急きょ椅子席を追加しました。

01.04.opening