強化学習AIに脆弱性、誤動作を引き起こす敵対的攻撃の新手法
ゲームプレイや自動運転など最先端の人工知能(AI)で使われている強化学習に、深刻な脆弱性が発見された。強化学習を使って訓練されたAIは、相手の奇妙な行動によってだまされる可能性があるというのだ。 by Will Douglas Heaven2020.03.10
サッカー・ボットがゴールを狙おうとする。しかし、ゴールキーパーは、シュートをブロックする準備をする代わりに、地面に倒れて足をクネクネさせ始める。 するとストライカーは混乱して奇妙な横向きの小躍りをし、足をジタバタさせ、片方の腕を振り回して倒れこむ。ゴールキーパーの勝ちだ。
これはプロが使う戦術ではないが、深層強化学習により訓練された人工知能(AI)が、これまで考えられていたよりも攻撃に対して脆弱だということを示している。強化学習は「アルファゼロ(AlphaZero)」や「オープンAI ファイブ(OpenAI Five)」など最先端のゲームプレイAIで使用されている技術であり、こうした脆弱性は深刻な結果をもたらす可能性がある。
過去数年間で研究者は、教師つき学習と呼ばれるラベル付きデータを使用して訓練されたAIをダメにする多くの方法を発見した。画像の数ピクセルを変更するなど、AIの入力にわずかな細工をするだけで完全に混乱させることが可能で、たとえばナマケモノの画像をレーシングカーと識別させることができる。こうしたいわゆる敵対的攻撃には確実な対応策はない。
教師あり学習と比較して強化学習は比較的新しい手法であり、まだあまり研究されていない。しかし、強化学習もまた、細工した入力に対して脆弱であることがわかった。強化学習ではさまざまな状況での振る舞いをAIに教えるために、正しいことをしたときに報酬を与える。 AIはやがてポリシーと呼ばれる行動計画を学習する。ポリシーはゲームをプレイするだけでなく、AIに車を運転させたり自動取引システムを実行させたりすることも可能だ。
2017年、ディープマインドに所属するサンディ・ファンらは、古典的なビデオゲーム「ポン(Pong)」をプレイするための強化学習で訓練したAIについて調べた。 そして、ビデオ入力のフレームに単一の不正ピクセルを追加す …
- 人気の記事ランキング
-
- Who’s to blame for climate change? It’s surprisingly complicated. CO2排出「責任論」、単一指標では語れない複雑な現実
- Exosomes are touted as a trendy cure-all. We don’t know if they work. 「奇跡の薬」エクソソーム、 効果不明も高額治療が横行
- Who’s to blame for climate change? It’s surprisingly complicated. CO2排出「責任論」、単一指標では語れない複雑な現実
- AI can now create a replica of your personality AIとの2時間の会話で「そっくりさん」、スタンフォードら新技術