AIの選定で重要なのは性能の高さではない
「AIサービスを作ったが使ってもらえずに頓挫してしまった」といった経験はないだろうか。藤川氏は、AI活用には「期待と現実のギャップがある」と指摘し、よくある失敗パターンを説明。一言で言えば「ROIの不透明さ」、コストに対するリターンが不明であることが失敗の要因だという。
多くのAI開発の場合、ビジネス要件の精査が不十分で何ができたら正解なのかわからないままプロジェクトがスタートする。要件があいまいなため、とりあえず最新のAIモデルを導入するのだが、結果的に「コストが高い」という理由で中止になる。
しかし、AIの選定で重要なのは性能の高さではない。藤川氏は「これからは実務最適化の時代が来ます。『最高』よりも『最適』が重要」と指摘する。
その際、AI選定の基準で大事になるのは、次の3点だと説明した。
- 精度の最適化:ビジネス要件を満たすこと(過度な精度は不要)
- コストの最適化:長期運用を見据えたプロダクト実現性のあるコスト感
- 運用の最適化:セキュリティ、国内のコンプライアンスなどの業務要件に対応していること
こういった潮流に対して、アリババクラウドは、3つのAI戦略を持つ。「精度十分なオープン×多様なAIモデル」「利用効率の良いAIインフラ」「業界独自の要件を満たすAIソリューション」の3つだ。この戦略によって、アリババクラウドはAI選定に求められる最適化を実現し、生成AIの活用を支援する。
藤川氏は、それぞれの戦略を詳しく説明した。
オープン×多様なAIモデル「Qwen」と「Wan」
1つ目の「精度十分なオープン×多様なAIモデル」。アリババクラウドは、テキストや画像、音声などのモダリティや、用途に応じたサイズ、オープンかAPIかといった要件に柔軟に対応できるAIモデルファミリーをそろえている。多様な選択肢があることで、最適な解を選択できるのだ。
その代表的なモデルファミリーのひとつが、「Qwen」だ。テキスト生成AIのモデルファミリーである。
「世界最大のオープンソースモデルファミリーで、ダウンロード数は10億を上回っています。オープンソースのためファインチューニングが可能です。ファインチューニングされたモデルが20万モデル以上にのぼります」(藤川)
Qwenファミリーからは、最新のマルチモーダルAIモデル「Qwen3.5」(サイズ397B)が提供されている。
ここでは活用例として、医療業界のCT画像の分析などが挙げられた。マルチモーダルかつ高精度の分析が必要な場面にも対応できる点が特徴だ。オープンソースのため、自社インフラへのデプロイが可能であり、データの安全性を確保しつつファインチューニングが行える。
SNSでも話題の「Qwen3-TTS」は、多言語でクローン可能な音声生成モデルだ。モダリティは音声に特化し、サイズが1.7B/0.6Bと小さいのが特徴である。日本語を含む合計10種類の言語に対応し、テキストから音声を生成できる。
活用事例としては、ゲームのキャラクターに自分の声で発話させるような体験の実現が挙げられている。多言語対応によりグローバルなローカライズが可能なうえ、モデルサイズが小さいため開発が比較的手軽だ。オープンソースであるため、多様なデバイスへのデプロイも容易である。
また、アリババクラウドを代表するもうひとつのAIモデルファミリー「Wan」についても解説された。日本のアニメ・ゲーム業界でも活用されている、マルチモーダルの画像・動画生成基盤モデルファミリーだ。
最新リリースの「Wan2.6」は、高品質の動画参照型ビデオ生成モデル。キャラクターの参照動画をもとにビデオを生成できる。APIのみの提供で、サイズは非公開だがフルHDと呼ばれる高品質の動画生成にも対応できる。
例えば、キャラクターが商品を紹介する動画広告などに活用可能で、従量課金制のAPIであるため導入のハードルが低いうえ、テストも容易だ。試しに1、2個動画を生成し、数百円でテストすることも可能である。
利用効率の良いAIインフラとは?
あわせて、これらのAIモデルを導入するのに最適な、アリババクラウドのAIインフラも紹介された。セキュリティから、PaaS、MaaSに至るまで幅広いレイヤーのAIインフラが提供されている。
例えば、IaaSのレイヤーの「LINGJUN」。メモリやストレージの最適化を行い、LLM学習の際のGPUの効率を最適化するインフラだ。
PaaSプロダクトのひとつ、「PAI-EAS」は、オープンソースのデプロイサービスである。コンソール上のクリックだけでオープンソースのモデルをデプロイ、APIサーバ化。利用したいリソースをカーソルで選択していくだけで、プログラミングは一切不要である点が特徴だ。
また、「Model Studio」はMaaSレイヤーのAIモデルAPIサービス。先述のWanやQwenといったオープンソースAIモデルや、クローズドのモデルがすでにデプロイされている。
Model Studioには「Aegaeron」というGPU最適化技術が使われているのが特徴だ。
「LLMを使う際、テキストであればトークンで分けてGPUを使用するのが通常ですが、Aegaeronはトークンレベルで複数のGPUにわたって分散させます。GPUの使用量が82%削減できたという検証データもあり、低コストでのモデル利用を実現します」(藤川)
Model Studioは現在シンガポールリージョンから利用でき、今年中に日本リージョンにもローンチ予定だ。
業界に特化したソリューションであらゆる要件を満たす
アリババクラウドの3つのAI戦略の最後は、「業界独自の要件を満たすAIソリューション」。各業界に対して、どのようなソリューションを提供しているのか事例が示された。
事例の1つ目は、自動車メーカーBMWグループとの共同プロジェクト「Qwen LLMによる知能型車両向けAIエージェント」である。このプロジェクトでは、「Car Genius(車両天才)」と「Travel Companion(旅の相棒)」という2つのAIエージェントを自動車に導入する研究・検証が行われている。
運転者がAIエージェントに観光地の情報を尋ねたり、疲労時にシートを倒すよう指示したりするなど、AIが自動車の運転を支援するシステムである。
2つ目の事例は、東南アジア向けの高度多言語AI「SEA-LION」である。これはQwenをベースに、シンガポール政府の主導で開発された、多言語対応のAIモデルだ。藤川氏は「オープンソースのモデルだからできる事例」だと説明した。
3つ目の事例は、Qwen駆動の次世代会計プラットフォーム。会計はすべてをAIで置き換えるには難しい業界だが、シナリオごとにAIをチューニングすることで会計の自動化を実現した。書面からのOCRの精度95%、主導のレビュー時間の80%削減を達成したという。
こうしたソリューションは、アリババクラウド単独ではなく、複数の企業とのAIパートナーシップによって実現されている。日本国内でも、and factoryやグラッドキューブなどのパートナーと協業し、企業のAIアプリケーションの構築を支援している。
これまで説明してきた通り、アリババクラウド・ジャパンサービスではクラウドとAIの両方を提供している。
藤川氏は「拠点をシンガポールに置き、中国発のプロダクトですが、日本のデータ保護法に基づいて使えます。日本国内でAIを使ったソリューションを構築するにあたって、活用していただければ」と語る。
「近年のAI活用ではベンチマークのスコアにとらわれがちですが、本当に大事なのはプロダクトを通してユーザーにどのような価値を提供するかです。最適なAIモデルを活用し、必要十分な価値を生み出していただければ幸いです」(藤川)
アリババクラウド・ジャパンサービスからのお知らせ
本セッションでご紹介したサービスにご興味を持たれた方は、ぜひ公式サイトをご覧ください。

