SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers X Summit 2024 セッションレポート(AD)

日本経済新聞社の最新研究事例に学ぶ、マルチモーダルAI活用の勘所

【Session3】マルチモーダル AI 実装の課題と解決策

  • X ポスト
  • このエントリーをはてなブックマークに追加

思いがけない記事を身近な写真からレコメンド

 2例目はスマートフォンの画像からニュース記事を推薦するものだ。一般的に、ニュースサイトでおすすめされる記事は過去の閲覧履歴や、ユーザーが登録した興味ある分野から選出される。新規登録した読者にとっては「何から読み始めたらいいか分からない」、閲覧傾向に基づく推薦でもあまり刺さるものがないと、閲覧習慣が定着せずにサービス離脱も起きてしまう。

 そこで読者にとって慣れ親しんだ分野の記事ばかりではなく、新たな興味関心の発見につながる記事を推薦する方法はないだろうかと石原氏らは考えていた。ニュースサイトには多種多様な記事であふれている。身の回りを見渡したとき、そこにあるものと関連していて、興味を引くような記事を提示できないかという模索からつながった実験だ。

 ここでの実験は、まず画像を入力し、画像内から物体名を視覚言語モデル(Gemini 1.0 Pro Vision)から抽出し、日経電子版にあるニュース記事を全文検索システム(Elasticsearch)で検索して推薦する。

 インプットとなる画像は身近にあるものということで、オフィス、寝室、パン屋、キッチン、クローゼットの5カテゴリのデータセットを使う。実験の参加者はそれぞれのカテゴリから1枚選び、その画像から推薦された記事を評価する。

 評価観点は関連性(提示された物体名やニュース記事が妥当だと感じる)、新規性(提示された物体名やニュース記事を知らなかった)、意外性(提示された物体名やニュース記事をシステムのおかげで発見できたと感じる)、これらを満たすかどうかだ。3つの評価観点の全てを満たせばセレンディピティがあると判断する。

 例えば以下の画像だとデスク、ベッド、ランプなどの物体が抽出され、これらに対して5件のニュース記事「中小型株、地味にスゴい コメ兵やフランスベッド」「乳幼児用バウンサーの安全基準改正 米国で窒息死多発」「静岡のSUS、仮眠用個室生む2段ベッド JR東と開発」などが選出された。これらを実験参加者が関連性、新規性、意外性を判断するという地道な実験でもある。

サンプルとなる寝室の写真(投影資料より)
サンプルとなる寝室の写真(投影資料より)

 なお上記で1本目に選出された「中小型株、地味にスゴい コメ兵やフランスベッド」は日経ヴェリタスの記事で、中小型株の動向について深い分析でまとめられたものだ。石原氏は「なかなか普段のニュースを見るなかでは気づきにくいものなので、そうしたものをお届けできたら魅力的なアプローチになるかなと考えているところです」と話す。

 今回の実験では推薦したなかからセレンディピティがあると評価されたものは全体の12%ほど。そのため石原氏は「9枚の記事を提供すると1枚くらいはいい記事が提供できているのかなという比率で、これが大きいか小さいかはこれから議論していくところです」と話す。

 詳しい手法や評価結果は2024年11月に発表した論文「ニュースを身近に:日常風景からのニュース推薦」(第210回ヒューマンコンピュータインタラクション・第84回ユビキタスコンピューティング合同研究発表会)に掲載されている。

 マルチモーダルAIや生成AIとなるとRAG(検索拡張生成)の話題になりがちだが、石原氏は「マルチモーダルAIには、RAG以外にも泥臭いような業務を改善する余地があるのではないかと考えています。新聞社の研究開発部門として、いろんなことを試していくつもりです。あくまで目的は概念検証ですので、できるだけ実装には時間をかけずに分析や評価に時間を割きたいと考えています」と話す。

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers X Summit 2024 セッションレポート連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

フリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Onlineの取材・記事や、EnterpriseZine/Security Onlineキュレーターも担当しています。Webサイト:http://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山出 高士(ヤマデ タカシ)

雑誌や広告写真で活動。東京書籍刊「くらべるシリーズ」でも写真を担当。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:グーグル・クラウド・ジャパン合同会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/20506 2025/01/09 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング