テスラを超えろ!日本発の自動運転ベンチャーがLLMを作る理由
「2030年に完全自動運転EVを1万台量産する」という日本発の自動運転スタートアップとして注目されるチューリング。同社の青木俊介CTOが語った、自動運転2.0を実現するテクノロジーとは。 by Koichi Motoda2024.06.22
自動運転は期待と現実とのギャップが大きい技術だ。10年以上前から多くの企業が完全自動運転の実現を掲げながら、現在も世界のごく限られた地域での運行にとどまっている。各種センサーやカメラなどのハードウェアは、すでに人間の目に代わる役割を十分に果たしている。一方で、人間の脳に相当するソフトウェアには、依然として課題が山積している。これらの課題を大規模なAIモデルと高速な生成AIで補完し、完全自動運転を実現しようとしているのが、日本発の自動運転スタートアップ、「チューリング」である。

2024年4月24日に開催されたMITテクノロジーレビュー[日本版]主催の「Emerging Technology Nite #28」では、「自動運転2.0 -生成AIで実現する次世代自律車両-」と題し、チューリングCTOの青木俊介氏が自動運転技術の変遷と自動運転2.0の技術動向を解説。「2030年に完全自動運転EVを1万台量産する」という同社の挑戦について紹介した。
自動車の世界もソフトウェアオリエンテッドに
チューリングは、CEOを含む創業メンバー全員がエンジニアで構成され、技術力に優れた自動運転企業を目指して設立された。初回の資金調達ではKDDIグループなどから出資を受け、2024年4月にはNTTドコモ・ベンチャーズやみずほキャピタルなどからも出資を得て、総額50億円を超える資金を調達した。加えて、政府からも10億円弱の補助金を獲得している。
青木氏は東京大学卒業後、米国のカーネギーメロン大学で博士課程に在籍中、ゼネラルモーターズやグーグルなどと協働で自動運転車開発プロジェクトに携わった。その経験から、日本が現在の自動車市場シェアを失う可能性を懸念するようになったという。
日本はモノづくりに秀でた国であり、製造業によって経済成長を遂げてきた。しかし、高性能な工業製品を生産しても、ソフトウェアによって業界が変革される際に、その流れに取り残されるケースが度々あった。その最たる例が、ウィンドウズ・オペレーティングシステムの登場であり、アイフォーンの爆発的な普及である。同様の変化が自動車業界で起これば、日本の産業界は極めて深刻な事態となりうる。
実際、現在テスラが製造している車両は物理的な鍵すら不要で、乗車時にユーザーを認識するとモーターが始動する、ソフトウェア中心の設計思想を採用している。こうしたテスラのコンセプトは世界的に評価されており、30年後に世界一の自動車メーカーになる可能性も指摘されている。「これは非常に悔しいことだ」と青木氏は率直な思いを語る。
ソフトウェア主体のモノづくりで情報のプラットフォーム化が進展すると、サービスが増加するほどプラットフォーマーへの利益集中が加速する。自動車業界においても、ガソリン車からEV車への移行と自動運転化の進展に伴い、サービスの拡大がプラットフォーマーへの利益集中を促進すると予想される。こうした認識から、「自動運転などを実現する車両ソフトウェアは日本で開発すべきだ」と考え、チューリングを設立したと青木氏は説明する。
自動運転技術に必要な社会常識や経験を補うAI
自動運転車の実用化は長らく期待されながら、なかなか実現に至っていない。日本のある自動運転車の例では、誘導線の敷設や車体への多数のセンサー搭載など、複合的なアプローチで安全性を高めている。一方、米国や中国ではすでに自動運転車が公道を走行し始めている事実に注目する必要がある。チューリングが「AI一発で自動運転を実現する」と主張する背景には、センサーの増設や規則の追加ではなく、より本質的なアプローチがある。
チューリングは世界初となる、大規模言語モデル(LLM)で動作する自動運転のコンセプトカーを開発した。生成AIやLLMは、自動運転車に不可欠な技術である。青木氏は、「LLMはある程度の常識や、人間が獲得してきた情報を持っています。実は自動車の運転を確実にするには、そういった社会的な常識や文化みたいなものも理解する必要があるのです」と強調する。
自動運転の研究では、無人走行距離などの定量的指標で評価されることが多い。しかし、人間の運転能力は単純に運転距離の長さだけで判断できるものではない。人間は日常生活から様々な常識を獲得し、自動車教習所で運転技術や交通ルール、運転文化を学ぶことで運転能力を身につける。つまり、人間は自動車の外で得た知識を運転に活用しているのであり、運転距離の長さだけでは事故リスクの低減を保証できない。この観点から、「LLMのように常識や社会的文化を理解するAIが、自動車の運転に重要な要素となる」と青木氏は話す。
例えば、人間のドライバーは道路工事現場で交通誘導員の行動を観察し、進行可否を判断する。交通誘導員の向きや合図、信号の状態、周囲の人々の動きなど、複合的な情報を瞬時に処理して適切な判断を下している。このような高度な状況理解と判断能力を自動運転車に実装することが求められている。
人間の想定を超えた状況でも判断できるAIの構築
こうした複雑な判断を自動運転車に実装するには、ルールベースのAIでは限界がある。道路上の人の存在を検知して停止や回避するだけでは、公道での実用は困難だ。そのため、ロングテールな事象を適切に管理できるAIの開発が不可欠となる。
チューリングは、この課題に対応するため、生成AIをマルチモーダルAIに拡張し、日英両言語に対応したマルチモーダル学習ライブラリ「Heron(ヘロン)」を開発した。マルチモーダルAIは、テキスト、画像、音声など多様な入力に対して出力を生成できるAIを指す。様々な情報を学習させることで、ルールベースでは対応が困難な状況にも対処できるようになった。

例えば、高速道路に予期せず動物が侵入した場合など、エンジニアが事前に想定してルールを設定することが困難な状況でも、Heronはマルチモーダル学習によって「動物に危害を加えないよう、前方車両に追従しつつ慎重に減速する」といった適切な判断を下すことができる。青木氏は、「エンジニアが想像してルールとして書くのは難しい状況にも、Heronは対処できる知識をすでに獲得しています」と説明する。
自動車業界は長年、安全性の追求に真摯に取り組んできた。それゆえ、LLMや生成AIが自動車の運転を判断することには、一定の懸念が存在する。チューリングは、LLMや生成AIによる自動運転車の実現に向けて、2段階のアプローチを採用している。
第一段階は、HeronのようなマルチモーダルAIの構築である。この段階は既に達成されており、次なる挑戦は「エンボディードAI」の実現となる。エンボディードAIには、身体性の獲得や物理空間の理解が求められる。現状のAIは、主にテキストや画像データに基づいて学習しているため、物理世界の本質的な理解が不足している。一方、人間は幼児期から成長過程で、様々な物体に触れたり体験したりすることで、物質の性質や物理法則を体得していく。
こうした理解が深まれば、例えば道路上の障害物に対して、その材質や形状に応じた適切な対応(回避や安全な通過など)を選択できるようになる。自動運転AIがこのレベルの物理世界理解を獲得できれば、運転タスクの遂行も可能になると考えられる。
AIの車載化など課題解決を進めながら自動運転2.0を実現
もう一つの重要な課題は、こうした高度なAIを車載モデルに実装することである。GPT-4やHeronなどの大規模言語モデルは、現状ではクラウド上で動作している。この課題に対し、チューリングは2つのアプローチを提案している。1つは、AIが車載可能な規模に収まるような専用半導体の開発。もう1つは、ナビゲーター・ドライバーモデルの構築である。
青木氏は、このモデルについて次のように説明する。「ナビゲーターとは、今自分がどこを走っていて、次はどうハンドルを切るのかや、今アクセル踏むべきかブレーキを踏むべきかなどを考える役割を持ちます。一方のドライバーは、目の前に起こっていることに反応して実際にハンドルやアクセル、ブレーキを操作する役割を持ちます。」このモデルでは、ナビゲーター機能をクラウドに配置し、ドライバー機能を車載のエッジ処理として実装する構想だ。
自然言語処理技術も、自動運転分野で注目を集めている。チューリングは現在、Heronを用いたマルチモーダル学習により、運転に関する知識や情報を集約し、自動運転に最適化されたAIの開発を進めている。さらに、「交通安全ガイドブック」の情報も学習に活用しており、これにより模範的な運転行動を実現している。
チューリングは2024年、東京の市街地で30分以上、人間が一切介入しない「完全自動運転」を2025年12月までに実施する「Tokyo30」プロジェクトを始動させた。複雑な信号機や交差点、狭隘道路、路上駐車車両、自転車、歩行者、電動キックボードなど、多様な要素の安全を確保しながら自動運転システムの走行を実証しようとしている。「このレベルの技術力は今でも日本にあるはずです。それくらいのことをしないともうテスラには勝てないでしょう」と青木氏は力強く語る。
AI技術をベースにした「自動運転2.0」というコンセプトは、実質的に2022年頃から始まった。生成AI技術の台頭により、自動運転業界は現在大きな変革期を迎えており、青木氏は「今が本当に面白いポイントだ」と評している。
- 人気の記事ランキング
-
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- A Google Gemini model now has a “dial” to adjust how much it reasons 推論モデルは「考えすぎ」、グーグルがGeminiに調整機能
- Meet the researchers testing the “Armageddon” approach to asteroid defense 惑星防衛の最終戦略 科学者たちが探る 「核爆発」研究の舞台裏
- Anthropic can now track the bizarre inner workings of a large language model 大規模言語モデルは内部で 何をやっているのか? 覗いて分かった奇妙な回路
タグ |
---|

- 元田光一 [Koichi Motoda]日本版 ライター
- サイエンスライター。日本ソフトバンク(現ソフトバンク)でソフトウェアのマニュアル制作に携わった後、理工学系出版社オーム社にて書籍の編集、月刊誌の取材・執筆の経験を積む。現在、ICTからエレクトロニクス、AI、ロボット、地球環境、素粒子物理学まで、幅広い分野で「難しい専門知識をだれでもが理解できるように解説するエキスパート」として活躍。