「このままでは米国基準のバイアスの中で戦うことを強いられる」
国内で生成AI、LLM(大規模言語モデル)開発の最前線に立っている研究者には、どのような景色が見えているのだろうか。自ら「生成AI大好き」と目を輝かせるモデレーターの漆原氏が、まずは曽根岡氏に問いかける。
株式会社ELYZA代表の曽根岡氏は、2019年からLLMの研究開発と社会実装に取り組んできた。同社は今年6月末、日本語性能においてOpenAI社のGPT-4を上回るモデルの開発に成功しており、いわゆる国産LLM開発のパイオニアとして知られている。経済産業省主導のGENIAC(Generative AI Accelerator Challenge)プロジェクトにも採択されており、今最も勢いがある国内AIテック企業の一つだ。
参考:GENIAC|経済産業省
曽根岡氏によると、これまでは「どうやって国産LLMを作るか」という部分にばかり注目が集まっていたが、ELYZAがGPT-4並みのモデルを開発したことで、最近では「国産LLMをどうやって使ってもらえるか」に主眼が変わってきたという。
「現状、生成AIの選択肢は、GPT-4かGeminiかAzure OpenAIか、あるいはAmazon Bedrockあたりに限られている。これらと同程度の性能に留まっているようでは、『有名どころを使うのが無難』と判断されてしまう。では、どうすれば国内で選ばれるLLMを作れるのか。日本独自の性能や商慣習、例えば確定申告の相談ができるといった特徴などが突破口になりうる可能性はあるが、明確な解決策はまだ見えていない」
続いて、米田氏が見解を述べた。株式会社リクルートの人工知能研究所、Megagon Labsのリサーチエンジニアを務める米田氏は、検索技術やLLMの応用・利用に関するプロジェクトに取り組む、自然言語処理研究開発のスペシャリストだ。
米田氏によれば、Megagon Labsではかつて、自然言語処理モデルとしてBERTを利用していたという。GPT-3が話題になった頃は「まだBERTほどの性能は出ないだろう」と考えていた米田氏だったが、GPT-3.5を搭載したChatGPT、そしてGPT-4が登場すると状況は一変する。予想を上回る進化に「乗り遅れたら大変なことになる」と方針を転換した米田氏らは、LLMを中心とした研究開発を開始したというのだ。
米田氏は、BERT時代と今とを比較してこう評価する。「GPT-4によって、従来の機械学習のように大量のデータを作る必要はなくなった。適切なプロンプトを与えるだけで、機械学習と同じようなことが、それなりの精度でできるわけだ。これは期待が膨らむような進化だが、取り残される危機感も抱いている」
最後に口を開くのは髙橋氏だ。髙橋氏はLINEヤフーに所属しながら、今年3月よりソフトバンクグループのSB Intuitions株式会社へ出向している生粋の研究者だ。髙橋氏のリードするResponsible AIチームは、ソフトバンクグループの高いGPU調達力を背景として、1兆パラメーターを搭載予定の日本語に特化したLLM研究開発を行っている。また髙橋氏は、6月にCVPR(Computer Vision and Pattern Recognition)で著作権保護に関連する論文を発表しており、プライバシーや安全性の標準の整備に強い使命感を抱いている。
このような視点から髙橋氏は、「安心・安全なAI活用を推進するためには、日本独自のLLMやファウンデーションモデル(基盤モデル)を持っておくべき」と提言する。
「OpenAIによる完成度の高いプロダクトや安心・安全への取り組みには素直に感銘を受けている。しかしその一方で、ChatGPTには独自のバイアス(偏り、先入観)があることが知られており、このまま覇権を握られてしまえば、アメリカ基準のバイアスの中で戦うことを強いられる。これは国益の観点から大きなリスクだ。これを避けるには日本独自のモデルが欠かせず、それはここにいる登壇者を含め、皆で作っていくものだと考えている」
3名の発言を受けて漆原氏は、「グローバルプレイヤーによるさまざまなソリューションの素晴らしさは多くの人が知るところだ。それでも私たち国内企業は戦うべきであり、勝ち筋もあるのではと期待している」とまとめた。