Interview

研究と社会実装の一気通貫を目指して。経済学で事業課題へ挑戦(リサーチインターン2019)

河中 祥吾 / 奈良先端科学技術大学院大学

Pocket

Interviewee

河中 祥吾

奈良先端科学技術大学院大学

 AI Lab 博士リサーチインターン 奈良先端科学技術大学院大学(NAIST) 情報科学領域 博士後期課程2年。ユビキタスコンピューティング研究室所属。日本学術振興会特別研究員DC1。大学院では、ユーザ参加型センシングによる都市環境情報収集・観光行動解析および行動変容を促すインセンティブメカニズムに関する研究に従事。

早川 裕太

AirTrack

 AirTrack データサイエンティスト 2019年サイバーエージェント新卒入社。広告プロダクト「AirTrack」データサイエンティスト。学生時代は位置情報による都市動態予測の研究などに取り組む。東京工業大学工学修士。

森脇 大輔

AI Lab

 AI Lab リサーチサイエンティスト  2017年サイバーエージェント中途入社。広告プロダクト「AirTrack」データサイエンティストを経て2018年よりAILabリサーチサイエンティスト。経済学/機械学習のオンライン広告への応用やビッグデータ(オルタナティブデータ)による経済予測に関する研究に従事。2015年ニューヨーク州立大学アルバニー校経済学博士。

博士課程の学生を対象としたリサーチインターンシップに参加し、AI LabのADEconチーム(経済学チーム)にて研究を行なっていた河中祥吾さんにお話を聞きました。

AI Lab のリサーチインターンシップとは

AI Labでは、若手研究者の実務経験価値が向上する機会を提供し、研究者育成に貢献したいと考えており、2018年度から博士後期課程の学生に向けてリサーチインターンシップを行なっています。リサーチインターンシップ中は、実際にAI Labの研究員と共にAI技術を用いた実践的かつより高度な研究テーマの課題解決に取り組み、ゴールのひとつとして各学術分野の国際カンファレンスへの論文寄稿・採択も目指しています。多くの優秀な若手研究者が、企業が保有する実データを用いた研究や社会実装を経験することは、研究者としてのキャリアの可能性を広げるきっかけになると期待しており、AILabでは今年も多くの博士学生の皆さんと研究に取り組んでいます。

経済学チームでのインターンシップ、お疲れ様でした。河中さんのこれまでの経歴や取り組んでいた研究について教えてください。

奈良先端科学技術大学院大学 情報科学領域 博士後期課程2年の河中です。これまでは、人々が持っているスマートフォン等に搭載されているセンサ群(GPS, 加速度 など)から広域的に収集されるデータを用いて都市環境情報を計測・推定する参加型センシングに関する研究を取り組んできました。最近では、主に観光分野へ適用して、人々が必要としているリアルタイム性の高い観光情報を効率的に収集するためのタスク介入の仕組みづくりや、収集されたデータを用いた観光行動解析などを行っております。

研究の可能性を広げるため、
未経験領域である因果推論へのチャレンジ

AI Lab のリサーチインターンへ参加したきっかけを教えてください。

博士課程修了後の進路として、企業か大学や研究機関かで迷っていた中、企業で働く経験をしてみたく思っていました。そこで、博士過程の学生でも参加可能なインターンシップを探し、サイバーエージェントの博士インターンを含め何社かのインターンを見つけて応募してみました。最終的に、AI Lab経済学チームで募集されていた研究テーマがこれまで自分が取り組んできた研究と類似している点も多く興味深かったことに加えて、2ヶ月とインターンシップとしては比較的長い期間であったため、より実務的な経験ができるのではないかと思い参加を決めました。

研究テーマに実施期間、実務的な経験が出来そうという点がポイントだったのですね!メンターの森脇さんにお聞きします。具体的な研究テーマや目標はどのように決めていきましたか?

(森脇)河中さんはもともとセンシングデータを用いた研究をしていて、より分析に寄った研究がしたいということでした。初挑戦の領域でややハードルは高い気もしましたが「因果推論系の研究はどうですか」と投げかけたところ、ぜひということだったので、ちょうど懸案事項だったAirTrackへのアップリフトモデリングの応用をテーマに設定しました。

2ヶ月間というのはひとつの論文を書くには短いので、インターン開始前から、先行研究調査を行うとともにどの学会に出すのかという出口について議論しました。その結果、インターン開始直後から手を動かせる状態にできました。

 

初挑戦で、因果推論に関する研究。そして実際に当社で提供している広告プロダクトの課題に取り組んだのですね!アップリフトモデリングを用いた研究について具体的に教えてください。

広告ターゲティングにおいて、どのような特徴を有した顧客に対して広告効果があったのかをアップリフトモデリングという手法を用いて解析を行いました。

アップリフトモデリングは、ABテストのデータを用いて、ある顧客に対してオンライン広告などによる介入を行った後、その顧客が取る行動が介入による効果であったかを推定するための方法です。ある顧客に対して介入を行ったときの結果と介入を行わなかったときの結果は、現実世界において同時に観測することはできないため、機械学習を用いて観測されなかった結果を推測し、介入を行った時の行動と介入を行わなかった時の行動の差分を確認することで因果効果を明らかにします。

広告事業においては、広告効果が高い顧客セグメントを明らかにすることで、次回からの広告配信においてそれらの顧客セグメントに対して優先的に配信することで費用対効果を改善することができます。

今回は、本手法をCyberAgent が保有する実データに対して適用し、どのような特徴量の組み合わせが広告効果を推定するのに役立つのか、また、その結果広告効果が高い顧客はどういった特徴を有しているのかを解析しました。早川さんをはじめとしたAirTrackのデータサイエンティストの皆さんとは週に一度の定例で密に連携を取りながら研究を進めました。

 

週1、広告プロダクト開発チームとのMTGの様子

 

リアルデータととことん向き合って生まれた、
二つの大きな成果

 

リサーチインターンで取組んだ研究で、どのようなことが達成できましたか?

大きな成果として二つあります。

一つ目は、ACM SIGSPATIALという国際会議で併催されているLocalRecという位置情報を元にした推薦システムに関するワークショップへの論文が採択され、11月にアメリカ、シカゴにて発表を行いました。

二つ目は、任意の広告キャンペーンに対して特徴量抽出を行い、アップリフトモデリングを適用するためのデータセットを自動的に生成するライブラリの作成を行い、実際プロダクトにでの活用がされたことです。加えて、今後はアップリフトモデリングから得られるスコアに応じて広告効果の高い顧客に対して優先的に広告配信がされるような仕組みが追加されるかもしれず、研究成果が事業に直接繋がるような結果を残せたことに嬉しく思います。

ACM SIGSPATIAL@シカゴでの発表の様子

 

 

 

 

驚いたのは、部門連携の柔軟性と研究を楽しむ雰囲気

 

国際学会での採択、さらに作ったライブラリが実際に広告プロダクトへの活用!素晴らしい結果ですね!約2か月間、企業研究所で働いてみて感じたことはありますか?

今回はAI Labのインターンシップとして参加させていただきましたが、プロダクトで収集されているデータを解析することができ、社員の方とほぼ同様の環境を経験できたことは非常に良い経験になりました。アップリフトモデリングでは大規模なABテストで収集されたデータから特徴量を抽出する必要があります。大学での研究では大量のデータを直接解析に使った経験がなく、慣れるまですごく苦労しましたが、森脇さんやAirTrackの方々に様々なアドバイスをいただき、最終的にはデータの前処理周りをライブラリ化まで落とし込むことができました。

 

その他、森脇さんがゼミ長をされているオルタナティブデータゼミにも参加しました。ゼミのメンバーは事業部横断で集まっており、AI事業本部のプロダクトのことを広く知ることができて刺激になりました。

AI Labは研究開発をおこなう独立した組織ではあるものの、ゼミやサイバーエージェント内の様々なプロダクトと連携しながら研究を進められるのはいい体制だなと思いました。

 

研究者としてプロダクトに向き合う理想の姿。
社員も感化された、河中さんの研究開発に対する姿勢

 

AirTrack データサイエンティストの早川さん、メンターのAI Lab森脇さんにお聞きします。河中さんの研究やその成果について、一緒研究やプロダクト開発を進める中で、お二人はどのように感じましたか?

(早川)河中さんの研究は、広告を見たからこそ来訪するユーザに広告を当てたい、という本来の来訪促進広告プロダクトがあるべき姿にリーチする成果だと思っています。
今回河中さんが取り組まれた研究では、「どういった要因が広告効果に効いていそうか」を丁寧に分析していると思うのですが、広告主に対する説明であったり直感的な気づきを与えるという意味でもプロダクト目線での嬉しさが大きいです。
印象的だったのは、研究成果をライブラリ化をしてもらったことです。これによってプロダクト内での再現や展開ができるというのは非常に嬉しいし、研究成果の社会実装までを実現するという意識にシンプルに感化されました。自分自身としてもきちんとアカデミックな成果の社会実装をしていきたいと改めて思いました。

 

(森脇)AI Labの研究活動の理想形は、論文を執筆しトップカンファレンスに出し、なおかつ事業貢献につながることです。今回は、ABテストのデータがある状況でどういうターゲティングが有効なのかというプロダクト側の課題感を、河中さんが素直に受け止めて研究として昇華してくれたので、プロダクトとAI Labが一緒に課題を解決していく、お手本のようなかたちになったのではないかと思います。

目指すは研究成果の社会実装。
そのために新しいアプローチを探し続けていきたい。

 

河中さんが今後、研究を通じて挑戦したいことを教えてください。

ユーザ参加型センシングのような人が介在している情報システムやオンライン広告のような人に対して介入する情報システムの中で、対象となる”ひと”をどう理解するのかが重要となってくると思います。その中で、僕自身の興味としては、情報介入によって人の行動にどのような影響を与えるのか、といったところにあり、心理学や行動経済学といった様々な分野を総合的に考えることが必要です。

今回は、因果推論といった経済学的なアプローチで研究を進めることができましたが、情報介入による人の行動への影響を学際的に研究していきたいと思います。また、研究において論文としてまとめて発表することももちろん大事ですが、最終的に社会実装することが特に大事なことだと思っています。そのため、研究成果をサービスとして社会へ実装・展開するところまで一貫してできるよう研究をしていきたいと思います。

関連記事