歩行者も乗客も守る、自動運転の急ブレーキを強化学習で防ぐ新研究
多くの自動運転自動車の研究は、歩行者の安全性を重視しているが、乗客の安全性と快適性を考えることも重要だ。たとえば、衝突を避けるためにブレーキをかけたとき、車が急停止するのではなく、ゆるやかに停止するのが理想だ。
機械学習の世界では、こうした考え方は「多目的問題」と呼ばれている。ブレーキをかける場合は、「目的1:歩行者に危害を加えない。目的2:乗客を犠牲にしない」となる。
カナダ・トロントにあるライアソン大学の研究者が、深層強化学習を活用してこの課題に取り組んだ。強化学習は機械学習のサブセットで、報酬と罰を使って人工知能(AI)エージェントに、1つまたは複数の目的を達成する方法を学習させるものだ。今回の場合では、車が歩行者に衝突したら罰を与えるが(高速で衝突した場合はより重い罰を与える)、ブレーキをかけた際に急停止した場合にも罰を与える(停止の仕方が乱暴な場合はさらに重い罰を与える)。
研究者はモデルを構築後、バーチャル環境において現実世界のデータに基づき歩行者が道路を横断する状況をシミュレーションしてテストした。モデルは、すべての事故の回避に成功した。また、乗客の快適さを考慮していないモデルよりも、ブレーキをかけた際の急停止の減少もできた。このモデルは、全体的な運転の安全性を損なうことなく、より快適な乗り心地を実現する方法についての概念を実証している。現実世界においてこの考え方を検証するためには、さらに多くの研究が必要だ。