SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers X Summit 2024 セッションレポート(AD)

生成AIでは対応が難しい検索もある? Elasticsearchが語るこれからの「検索」のポイント

【Session7】企業内でデータ活用を促進する Elastic 「検索AI」 の世界とは?

  • X ポスト
  • このエントリーをはてなブックマークに追加

生成AIでは対応が難しい検索のケースとは

 このようなソリューションとして発展させた背景にあるのは、ユーザー体験の向上や運用の回復力の向上、セキュリティのリスク軽減などのビジネスの課題はすべてデータにつながっていると考えられるからだ。杉本氏は「PoC段階のものもある」と前置きしたうえで、いくつか事例を紹介してくれた。

 例えばHRのヘルプデスクであれば、「私の部門の従業員に対する会社の401kポリシーの要点は何ですか。加入するにはどうすればよいですか」、ECサイトであれば、「町田市の200平方メートルの裏庭に散水システムを構築するには、どのような材料リストとツールが必要ですか」と問いが投げかけられたとしよう。このような問いに回答できるのは生成AIだが、前者の問いであれば「HR部門に聞いてください」という回答を返すことになる。また後者の問いであれば、生成AIは散水システムを構築するためのツールの一覧を出すことはできるが、自社のECサイト内から同じものを見つけてくるのは難しい。

 Elasticsearchでは生成AIを次の2つの目的で活用している。1つ目はRAG(Retrieval-Augmented Generation/検索拡張生成)アーキテクチャのコンテキスト情報を取得するための検索エンジンとしての活用である。これまでの検索の流れでは、ユーザーが質問をすると、裏側にあるデータベースやFAQなどのページの中から、質問に合った適切なページをいくつかピックアップして回答していた。しかしRAGを活用することで、質問と答えの元ネタを生成AIに投げ、より人間らしい回答をすることができるようになる。しかもピックアップされたすべての記事を読むことなく、生成AIが解釈した上で回答してくれるのだ。だがRAGの活用で重要になるのが、正しいコンテキストデータを持ってこれるかどうか。「そこができなければ、どんなにプロンプトを頑張って作成しても、生成AIのファインチューニングにコストをかけても、賢い検索エンジンにはなりません。Elasticsearchは大量のデータの中から最適な情報を探すのが得意。つまりElasticsearchはRAGの検索エンジンに最適なんです」と杉本氏は力強く語る。

 その理由としてまず杉本氏が挙げたのは、Elasticsearchが検索の手法としてベクトル検索と従来の全文検索を組み合わせたハイブリッド検索を採用していること。このような手法を採用している理由として、「個人的な意見ですが、日本語は解釈の幅が広いので、それをうまく解釈できるベクトルのエンペディングモデルがあるとは言えないため。これまでそれなりにうまく活用されてきたテキスト検索を使わない手はないと考えた」と杉本氏は話す。

ハイブリッド検索の採用が成功の秘訣
ハイブリッド検索の採用が成功の秘訣

 次にドキュメントレベルのセキュリティにも対応している点。「検索エンジンで忘れがちなのは、権限設定。これがきちんとできることも重要」と杉本氏。データベースはきちんと権限設定がされていることが一般的。だが検索エンジンに権限設定がされていなければ、「出してはいけないデータが出てしまう可能性がある」と杉本氏は指摘する。万が一、出してはいけないデータが検索によって流出すると大問題になる。「Elasticsearch は権限設定の機能を持っているため、仕組み的にリスクが減らせる」(杉本氏)という。

 生成AI活用の2つ目の目的はAIアシスタントである。Elastic AIアシスタントを活用すれば、オブザーバビリティやセキュリティのアラートに対し、アラートのサマリーや解決方法などについて、チャット形式で回答、分析できるようになるという。ElasticsearchにはGitHubのイシューを取り込む仕組みを用意している。そのGitHubのイシューを取り込んでおけば、あるアラートが上がってきたときに、「これは既知のエラーですか」とAIアシスタントに尋ねると、「GitHubのイシューナンバーの●●に書かれています」という答えを返してくれるような仕組みをつくることができるのだ。「情報を集約することがナレッジへの一歩となる。情報を機械的に取り込み、それを活用できるような世界にしていく。そのためのツールがAIアシスタントです」(杉本氏)

操作方法は簡単。Elasticsearchの導入により大きな効果を得ている事例も

 次に杉本氏は、どれだけ簡単にElasticsearchが使えるかデモを実施。「本文とタイトルに関する重み付けや、日付の古いものは関連付けを下げるなど、ロジックの設定もボタンをポチポチと押すだけでできます」(杉本氏)

 また全文検索だけの場合と、ベクトル検索を組み合わせた場合の回答の違いなどについても紹介してくれた。

 他にも、実際にElasticsearchを導入した企業の事例も紹介。ネットワーク機器ベンダーのシスコシステムズでは、Google Cloudの機械学習プラットフォームVertex AIとElasticsearchの組み合わせにより、73%の検索クエリを高速化。またサポートエンジニアの稼働時間を毎月5000時間削減したという。また学術論文検索サービスConsensusでは、ELSERというElasticsearchのスパースモデルを追加することで、検索精度を30%向上。検索待ち時間も75%短縮されたという。

 「当社ではElasticsearch Labs、Elastic Observability Labs、Elastic Security Labsというサイトを運営し、積極的に情報を発信。当社のソリューションに関する最新情報を得たいかたは是非、アクセスしてください」(杉本氏)

開発者による開発者のための情報発信サイト「Elasticsearch Labs」
開発者による開発者のための情報発信サイト「Elasticsearch Labs

 またそれらの情報を見て、さらにElasticsearchの可能性を試したい人は、クラウドのトライアルが使える。「Elasticsearchは検索AI、ログ分析、セキュリティ分析を得意としているソリューション。それらに課題を感じているのなら、14日間無料で試せるので、ぜひ、活用してほしい」と杉本氏は語り、セッションを締めた。

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers X Summit 2024 セッションレポート連載記事一覧

もっと読む

この記事の著者

中村 仁美(ナカムラ ヒトミ)

 大阪府出身。教育大学卒。大学時代は臨床心理学を専攻。大手化学メーカー、日経BP社、ITに特化したコンテンツサービス&プロモーション会社を経て、2002年、フリーランス編集&ライターとして独立。現在はIT、キャリアというテーマを中心に活動中。IT記者会所属。趣味は読書、ドライブ、城探訪(日本の城)。...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山出 高士(ヤマデ タカシ)

雑誌や広告写真で活動。東京書籍刊「くらべるシリーズ」でも写真を担当。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:Elasticsearch KK

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/20533 2025/01/08 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング