本記事は『生成AI時代のプロダクトマネジメント 勝てる事業の原則から戦略、デザイン、成功事例まで』(翻訳:曽根原春樹)の「第3章 技術基盤と業界構」を抜粋したものです。掲載にあたって編集しています。
本書はShyvee Shi、Caitlin Cai、Dr. Yiwen Rongによる『Reimagined: Building Products with Generative AI』(2024、PeakPioneer LLC)の邦訳です。
生成AIの3つの技術基盤
まずは生成AIの技術基盤(テックスタック)を見てみましょう。技術基盤とは、ソフトウェア開発や運用に必要なテクノロジー、フレームワーク、ツール、インフラなどの集合体を指します。生成AIの技術基盤は基盤層、ツール層、アプリケーション層の3つで構成されています(図1)。以下、それぞれの層について詳しく説明します。
基盤層
基盤層は、生成AIのすべてを支える土台です。ハードウェアやクラウドプラットフォーム、データソース、基本的なAIモデルといった必須要素が含まれます。いわば、AI技術のためのインフラと原材料にあたります。
これらは、AI技術のハードウェアとソフトウェアの両面で欠かせない要素です。
- ハードウェア:GPU(NVIDIA)、TPU(Google)
- クラウドプラットフォーム:Amazon Web Services(AWS)、Google Cloud、Microsoft Azure
- データ:オープンソースのデータライブラリとプロプライエタリデータ
- 基本的なAIモデル:クローズドソース基本モデル(OpenAI、Anthropic、Cohereなど)、オープンソース基本モデル(Stable Diffusion、GPT-J、Flan T-5、Meta Llamaなど)
ツール層
画家が美しい風景画を描くには適切な道具が必要なように、生成AI開発にも強力なツールが必要です。生成AIのツール層は、建築家や施工者が豊富な道具を手に入れ、デベロッパーがビジョンを実現させるための場所です。
生成AIインフラの複雑な仕組みを深く知らなくても、専門知識を活用することができます。
- 開発者ツールとフレームワーク:急速に進化するAI開発とアプリケーション開発プロセスを統合し、反復作業を強化します。
- データ特化ツール:データの準備、ラベリング、保存、索引(ベクトルデータベースなど)、データ管理(バージョン管理、ガバナンス)などを支援します。
- モデル特化ツール:モデルの選択、トレーニング、微調整、評価、検証、シミュレーション、監視などを支援します。
アプリケーション層
アプリケーション層は、生成AI技術を統合したユーザー向けのプロダクトで構成されます。水平アプリケーション(対象メディアや機能別)と垂直アプリケーション(業界別)に分類できます。
- コーポレート機能・ユースケース別:営業・顧客サポート、デザイン、検索、セキュリティ、生産性ツールなど
- 業界別:教育、消費者、エンターテインメント、法律、金融、医療、モビリティなど
- アウトプット形式・手段別:テキスト、音声、画像、動画、3D、コード、マルチモーダル、アクション、ロボット、エージェントなど
基盤層、ツール層、アプリケーション層の3つの層が連携して、強力かつ多用途な生成AIの風景を生み出します。図3-2はこれらの層に基づいた生成AI業界のランドスケープマップです。
生成AIの技術基盤を知っておくべき理由
技術基盤を知っておくべき3つの理由
起業家やプロダクトマネージャー、意思決定者は生成AIの技術基盤の基礎を理解しておく必要があります。その理由は以下の通りです。
- 意思決定の強化:適切なツールやテクノロジーを選択し、開発をプロジェクトの目標と適切に連携させることができます。
- 自社の適応性と将来への備え:進化する開発環境への柔軟性が高まり、新しいテクノロジーやトレンドへの適応が容易になります。
- 戦略的イノベーション:生成AIの新たな可能性や応用を見出し、イノベーションを促進することができます。
生成AIの技術基盤には何が含まれているか?
生成AIの技術基盤の基本要素は次の5つに大きく分けられます。
1. アプリケーションフレームワーク:AIソリューションを構築するための設計図
生成AIにおけるアプリケーションフレームワークとは、アプリケーションを標準化に対応した方法で開発するためにあらかじめ構築されたものです。LangChainやFixie.aiのようなフレームワークは、一連のツールとプロトコルを提供し、開発プロセスを合理化・高速化します。
プロダクトマネージャーにとって、これらのフレームワークはきわめて価値があります。なぜなら、迅速なイテレーションと早期市場投入を可能にするからです。
インフラレベルの専門性の高い技術を深く理解しなくても、コンテンツ生成からセマンティックシステム(単語やフレーズの意味、関係、文脈を理解し、情報を処理し解釈する)まで、さまざまなアプリケーションの構築を容易にします。
起業家やプロダクトマネージャー、企業の意思決定者は顧客ニーズとイノベーションに注力できるようになり、これらのフレームワークは生成AIプロダクトの開発と導入の礎石となります。
2. 基盤モデル:生成AIの脳
基盤モデル(Foundation Models)は、生成AIアプリケーションの脳として機能し、人間のような推論ができるものです。さまざまな形式で提供され、出力品質、コスト、遅延などを鑑みてクローズドソースの専用モデルか、増え続けるオープンソースかを選択します。基盤モデルは汎用モデル、特定目的モデル、ハイパーローカルモデルの3種類があり、それぞれ以下の特徴があります。
- 汎用モデル:OpenAIやAnthropicなどのベンダーが提供する、幅広いタスクを実行できる多用途エンジンです。
- 特定目的モデル:eコマースの商品説明など特定のタスクに特化したモデルです。
- ハイパーローカルモデル:専門的で独自のデータを使用して、非常に正確でカスタマイズされた出力を生成します。企業の内部データでトレーニングされたハイパーローカルモデルは、企業特有の市場環境やビジネス慣行に合わせたリアルタイムの事業予測を生成できます。
プロダクトマネージャーは、低レイテンシーのパフォーマンスや高品質の出力を目標とする場合など、プロダクトの目標に合わせて適切なモデルを選択または組み合わせるために、基盤モデルの複雑さを理解する必要があります。本書の第7章「MVPづくりとプロダクト設計」では、基盤モデルを選択する際の検討事項やオープンソースか自社独自モデルかのどちらを選ぶべきかという問題について説明します。
さらに、ホスティングオプションも多様化しています。OctoMLなどにより、エッジデバイスやブラウザへのデプロイが可能になり、プライバシー、セキュリティ、コスト要件においてより柔軟性が広がりました。これにより、プロダクト開発プロセスで利用できる選択肢が広がり、基盤モデルの深い理解が不可欠になっています。
3. データ:AIエンジンの燃料
データローダーとベクトルデータベースは、生成AIの技術基盤をよりスマートで機能的なモデルにする重要な要素です。起業家やプロダクトマネージャーや意思決定者にとって、これらのツールへの理解は欠かせません。
- データローダー:データベースから取得した構造化データや、PDFやPowerPointなどの非構造化データなど、さまざまな種類のデータを取り込むことができます。データローダーへの理解は、適切なデータソースがパーソナライズドコンテンツ生成やセマンティック検索(従来のキーワードベースの検索とは異なり、セマンティック検索は言語の意味や文脈を理解して、ユーザーが求める情報に合致するより正確な結果を返す)などのAI出力を、どのように形づくるかを検討するのに役立ちます。
- ベクトルデータベース:非構造化データを効率的に検索したい場合にベクトルデータベースを利用します。データを取り込み、AIが理解できる形式(エンベディングとよばれる)に変換し、迅速に検索するために保存します。これらを活用する方法を知っておくと、効率的でスケーラブルなソリューションを構築する指針となります。
- コンテキストウィンドウ:コンテキストウィンドウは、AIモデル自体を変更せずに、パーソナライズされたモデル出力を可能にして、アウトプットをさらに洗練させます。LangChainやLlamaIndexなどのプラットフォームは、基礎となる技術を修正せずに、カスタマイズされた情報をAIのワークフローに簡単に組み込むための手段を提供します。
4. 評価プラットフォーム:AIパフォーマンスのテスト場
大規模言語モデル(LLM:Large Language Model)を最適化するには、評価プラットフォームが必要です。プロンプトエンジニアリングツールは、技術的に高度な専門知識がなくてもさまざまなモデル間でプロンプトのイテレーションを可能にします。Statsigのような実験ツールは、機械学習エンジニアがプロンプト、ハイパーパラメーターを微調整できるようになります。
また、本番環境でのモデルパフォーマンスの評価にも役立ち、ステージング環境でのオフライン評価で生じる問題を避けることができます。さらに、WhyLabsのLangKitなどのオブザーバビリティプラットフォームは、モデル出力品質、誤用防止、AIの倫理的なふるまいなどのチェックを行います。
これらのツールを理解することで、より優れたプロジェクト管理とリスク評価ができるようになります。
5. デプロイメント:現実世界の活用のための発射台
開発において、Gradioなどのプラットフォームを使用してセルフホスティングするか、サードパーティサービスを利用することができます。Fixie.aiは、AIエージェントを本番環境で作成、共有、デプロイするためのソリューションとして際立っています。
このように、アプリケーションフレームワークからデプロイメントオプションに至るまで、生成AIの技術基盤を理解していれば、よりスマートな意思決定を行い、進化する技術トレンドに適応し、イノベーションを推進することができます。
これらの基本要素がどのようにさまざまな生成AIアプリケーションを実現するのかを本書で紹介していきます。