ディープマインド(DeepMind)の研究者ヴォロジーミル・ムニは、アタリ2600の50本近いビデオゲーム(ポン(Pong)やスペースインベーダーなどを含む)を、人間と同レベルでプレイできる初のシステムを作った人物である。強化学習によってプレイ方法を学び、深層学習を使って人間の学習プロセスを反映させることで上達していくという、2つのアプローチが初めて組み合わせた。人間がプレイ中に試行錯誤を重ねてテクニックを磨き、徐々にスコアアップを目指すように、システムがゲームを学んだのだ。
(サイモン・パーキン)
- 人気の記事ランキング
-
- The winners of Innovators under 35 Japan 2024 have been announced MITTRが選ぶ、 日本発U35イノベーター 2024年版
- Kids are learning how to make their own little language models 作って学ぶ生成AIモデルの仕組み、MITが子ども向け新アプリ
- 2024 Climate Tech Companies to Watch: Kairos Power and its molten salt–cooled nuclear reactors 気候テック15:小型溶融塩炉で原発新時代を拓くカイロス
- These companies are creating food out of thin air 大豆・昆虫の次は微生物、 空気からタンパク質を作る 「夢の食品工場」