サイバーエージェントは、同社が運営する人工知能技術の研究開発組織「AI Lab」における、「AI Lab リサーチインターンシップ」参加者である早川知志氏および研究員の森村哲郎氏らによる主著論文が、機械学習分野の国際論文誌『Transactions on Machine Learning Research』(TMLR)にて採択されたことを、4月12日に発表した。
今回、『TMLR』に採択された論文「Policy Gradient with Kernel Quadrature」では、強化学習(Reinforcement Learning:RL)の計算量を減らすことを目的に報酬評価の回数を抑える新しいアプローチを提案している。
カーネル求積(Kernel Quadrature:KQ)という数学的手法を応用して、ガウス過程モデリングを利用することで、報酬計算に必要なエピソードの選択の効率化を検討した。大規模言語モデル(LLM)からロボットの学習まで、広く用いられている強化学習法である方策勾配法にKQを適用し、RLタスクにおける計算負荷の軽減を実現し、同時に高い学習効率を維持することを可能にしている。同論文にて提案されたアプローチによって、高コストの報酬評価を必要とするRLの実用性向上が期待できるという。
「AI Lab」ではマーケティング全般に関わる幅広いAI技術の研究・開発を行っており、大学・学術機関との産学連携を強化しつつさまざまな技術課題に取り組んでいる。その中でも、強化学習チームは理論的な研究から実世界の問題解決に至るまで、意思決定戦略の学習に幅広く取り組む。同技術は、ユーザーに合わせた広告の選択や広告文の生成といった、サイバーエージェントが提供する「極予測」シリーズに代表される具体的なビジネス課題に応用され、企業におけるデータに基づく意思決定といった、ビジネス上の課題に対処する際の新たな可能性を探求している。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です