KADOKAWA Technology Review
×
IU35 2025受賞者が集結するSummitを12/17開催!来場申込受付中。
開拓者
35歳未満のイノベーター35人 2018開拓者
よりよい遺伝子編集、より賢い人工知能(AI)、より安全なインターネットへと導く。

John Schulman ジョン・シュルマン (30)

所属: オープンAI

AIエージェントが訓練で得た知識を新しい状況に適応できるように、自ら試行錯誤するという重要なアルゴリズムを開発している。

オープンAI(OpenAI)の研究科学者ジョン・シュルマンは、「強化学習」と呼ばれる機械学習の分野で、重要なアルゴリズムをいくつか開発した。その名の通り、強化学習は正しい反応に対して褒美を与えることで、犬を訓練するのと同じように人工知能(AI)エージェントを訓練する。機械にとっての「褒美」は、たとえばビデオゲームで高得点を獲得するといったことだ。

1991年に登場したビデオ・ゲーム「ソニック・ザ・ヘッジホッグ(Sonic the Hedgehog)」についてシュルマンが熱心に語るのは、それが理由だ。シュルマンによると、このゲームは、新しい機械学習アルゴリズムが学習したスキルを新しい状況にいかにうまく適用するかを測るのに理想的なベンチマークになるという。ソニックは世界最速のハリネズミなので、ゲームは猛スピードで進行する。ゲームではいくつかの興味深い物理現象も表現されており、AIエージェントがひとたびプレイ方法を学べば、その知識を異なるシナリオに適用するAIエージェントの能力を容易にテストできる。

これらのアルゴリズムは、一度、訓練すれば現実世界に適用できるかもしれない。たとえば、ロボットの移動の改善に利用できる可能性がある。従来のロボットの移動方法は、特定の状況に特化したものだった。つまり、新しい場所では、これまでの方法で移動するようにプログラムされたロボットは転倒してしまう可能性がある。シュルマンは、強化学習を用いるロボットであれば、転倒しないように何度でも起き上がって、新しい方法を試すようになるだろうと期待している。

(キャサリン・ブーザック)

人気の記事ランキング
  1. Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
  2. Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
  3. Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
  4. How to help friends and family dig out of a conspiracy theory black hole 家族が陰謀論にハマったら: 専門家が語る、 5つの現実的アプローチ
人気の記事ランキング
  1. Quantum physicists have shrunk and “de-censored” DeepSeek R1 量子技術でDeepSeekを55%小型化、「検閲解除」にも成功
  2. Promotion Innovators Under 35 Japan Summit 2025 2025年のイノベーターが集結「IU35 Summit」参加者募集
  3. Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent グーグルが「Gemini 3」発表、質問に応じて回答形式もAIが判断
  4. How to help friends and family dig out of a conspiracy theory black hole 家族が陰謀論にハマったら: 専門家が語る、 5つの現実的アプローチ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る