エキスパート×AIで進める「第3世代」の自動運転
では、自動運転とLLMはどのように結びつくのか。青木氏は冒頭で紹介したコンセプトカーを再び紹介した。
「もちろん生成AIのみですべてを設計できたわけではなく、動力や空力、剛性など各分野のエキスパートに参画してもらった。そこで体感したのが、エキスパート×AIの強みだ。猛スピードで壁打ちが進み、驚異的なスピードでアイディアが練り上がっていった」
さらに、チューリングでは世界初のLLMで走る自動運転システムの開発も進めている。LLM導入の背景にあるのは、運転の「複雑かつ未知な状況」という要素だ。
日本では18歳を超えてから運転免許が取得できるが、これは「子どもや高齢者は転びやすいから注意しよう」「建材をいっぱい積んだトラックがそばに来たので距離を取ろう」といった運転に必要な常識を獲得しているのがこの年齢だからだ。しかし、こうした「知識基盤」は、車内カメラをつけた車を数千~数万時間走らせても、既存のソフトウェアでは学習できなかった。
一方で、ChatGPTやStableDiffusionのような生成AIはこの知識基盤を獲得しつつある。「車道に段ボールが落ちている」「進路上に猫が寝転んでいる」といった稀に発生する要素への対処もLLMなら実現できるかもしれないのだ。
技術的なブレイクスルーを前に、青木氏は期待を語る。「道路上の不確定要素をすべてルール化し、運用に落とし込むのは困難だ。しかしLLMの力を得た今、ビッグデータと基盤モデルがあれば課題を突破し、完全自動運転を実現できるかもしれない」
ここで青木氏は「自動運転は失敗の連続だった」と自動運転の歴史を回顧する。青木氏によればこれまでの自動運転は、3つの世代に分けられるという。
第1世代はDNN(ディープニューラルネットワーク)が出現した時代であり、「信号機をたくさん学習すれば、信号機が認識できるようになる」という歩みを進めていた時代だ。第2世代は高精度地図が発展したことを背景に、街じゅうの地図を3Dで撮影し、クラウドに置く試みが社会実装されずに終わった世代。そして現在は第3世代にあたり、生成AIやLLMによるブレイクスルーを試みる最中にある。
第3世代では、物体の検知・認識に留まらず、車をどう動かすのかといった行動決定まで一貫してAIが行う。このアプローチをとることにより、道路上で時々発生する「エッジケース」にも「賢く」対応することが可能になるという。
「驚くべきことに、LLMは画像のコンテクストを理解してくれる」と語る青木氏。たとえば画像を提示した際に、「少し霧がかかっており、前方には車がいてブレーキランプを踏んでいる」といった細かい点まで認識できるため、現在では動画生成AIを活用してシミュレーション環境をつくり、そのなかでLLMなどの技術と連携させてAI学習を進めるという試みも行われている。
第3世代の自動運転では、認識・判断・処理の一連の流れをすべてAIで行うというEnd-to-End(E2E)の議論も盛んだ。これはカメラから得た情報をアルゴリズムとして処理したのち、位置情報やプランニング等に反映してモジュールを立てるという方式であり、「開発のチームが作りやすい」ことが特徴の1つだ。
一方で「パーセプションチームでコードを変えると、コントロールチームでもコードを変えなければならない」といった難しさがあり、結果的に作業量が増えてしまう。青木氏は自身の体験を踏まえ、「AIさえあれば完全に手放しで開発が進むということはない。チームマネジメントの難しさなど、現実的な問題は当然ある」と苦笑する。