News

AI Lab、Yale大学・成田氏との共著論文「Efficient Counterfactual Learning from Bandit Feedback」が人工知能分野の国際会議「AAAI」にて採択


株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役社長:藤田晋、東証一部上場:証券コード4751)における人工知能技術(※1)の研究開発組織「AI Lab」は、当社の安井翔太と、Yale大学の成田悠輔氏・矢田紘平氏による共著論文が、人工知能分野の国際会議「AAAI 2019」(※2)に採択されたことをお知らせいたします。

「AAAI」は、世界中の様々な人工知能分野の研究者が一堂に集い毎年開催される国際会議で、「NIPS」「KDD」「ICML」「IJCAI」(※3)などと並んで、人工知能分野で権威ある国際会議の一つです。この度「AI Lab」から採択された論文は、2019年1月にアメリカ・ハワイで開催される「AAAI 2019」で発表されます。

■研究背景
「AI Lab」ではアドテクノロジーに関わる幅広い人工知能技術を研究開発しており、大学・学術機関との産学連携を強化しながら広告を取り巻く様々な技術課題に取り組んできました。本論文の主著で、Yale大学成田悠輔氏とは2016年より産学連携を進めており、因果関係を考慮してユーザーの行動により大きな変化をもたらすことが可能な広告配信技術を作るべく、因果推論と機械学習の融合や実験における制度設計についての議論と研究を進めてきました。

■論文研究の概要
このような取り組みのもと、今回採択された共著論文 「Efficient Counterfactual Learning from Bandit Feedback(※4) 」では、バンディットアルゴリズム(※5)を代表とするような機械学習を応用した意思決定の評価において、従来の手法よりも評価における不確実性が少なくなる方法を提案しました。

インターネット広告ではユーザーを取り巻く環境に応じてより良い広告クリエイティブを選択するためにバンディットアルゴリズムが応用されることが増えてきています。しかしながら、バンディットアルゴリズムは実際にプロダクトのシステムに導入してみなければその性能が評価出来ないことから、変数選択の問題(どの様なデータを利用するべきか)や、チューニングの問題(パラメーターの値をどの様に設定するべきか)などの実運用における意思決定が非常に難しい手法です。

今回の提案方法が該当するOff-Policy Evaluationは、配信ログデータを利用して、実際に導入を伴う実験をする事なく新しいクリエイティブ選択の方法を評価するものです。この時、配信したログデータにおいて選ばれていた広告クリエイティブと、新しいクリエイティブ選択の方法による選択が一致しない可能性があるために、評価データは偏った少数のサンプルでのみ得ることになります。Off-Policy Evaluationでは経済学などで用いられる因果推論のアイデアを応用する事で、この限られたサンプルから、「全ての結果が観測できていた場合の評価」を推測する方法が提案されています。

▼Off-Policy Evaluationイメージ図

①新規の配信方法で、新たにクリエイティブの選択を行わせる。
②ログとは違うクリエイティブを選ぶために、一部のデータで評価ができない。
③因果推論のアイデアを応用し、観測できなかった部分も加味した評価を行う。

今回の論文では、このOff-Policy Evaluationにおいて利用されうる評価方法の中で、評価の不確実性が最も小さくなる評価方法を提案し、実際のクリエイティブ選択データを用いた実験において、従来手法よりも提案手法で推定された評価の不確実性が小さくなる事を示しました。また、従来の方法では大量のシミュレーションを必要としていたのに対し、提案された方法ではより少ない工程での評価が可能であることも当社での応用を通じて分かってきました。

■広告展開への期待
今回提案された方法により、より良い性能を持った広告クリエイティブ選択アルゴリズムを、DSPやアドネットワークなどの広告配信プロダクトにおいて応用する事が可能になります。

今回の提案は、今後当社からリリースを予定している多くの広告配信プロダクトに導入を予定しております。「AI Lab」は今後も人工知能を用いた広告配信技術をプロダクトに取り入れるべく産学連携を推進するとともに、より品質の高い広告配信技術の実現を目指し、研究・開発に努めてまいります。

※1 人工知能とは、コンピュータ上において、人間と同様の知能を実現させようという試みや技術のこと。
※2 「AAAI」Association for the Advancement of Artificial Intelligence
※3 「NIPS」 Neural Information Processing Systems
「ICML」International Conference on Machine Learning
「KDD」International Conference on Knowledge Discovery and Data Mining
「IJCAI」 International Joint Conference On Artificial Intelilgence

※4 Narita, Yusuke, Yasui Shota and Yata Kohei. “Efficient Counterfactual Learning from Bandit Feedback.” AAAI. 2019.
※5 限られた情報から最適な選択肢を効率的に探すためのアルゴリズム。

 

■アドテクスタジオ
AI Labが所属する、サイバーエージェントグループのアドテクノロジー分野における各サービスの開発を行うエンジニアの横断組織です。2013年10月1日に設立し、現在では5つの子会社を包括し、約200名のエンジニアによって、RTB広告を支えるSSPやDSP・DMP、チャットボットサービスやロボットサービス事業など約20のサービスを提供しております。

関連記事