KADOKAWA Technology Review
×
始めるならこの春から!年間サブスク20%オフのお得な【春割】実施中
ディープマインド、改良型強化学習AIと脳の類似をマウスで確認
Wikimedia Commons
人工知能(AI) Insider Online限定
An algorithm that learns through rewards may show how our brain does too

ディープマインド、改良型強化学習AIと脳の類似をマウスで確認

グーグルのAI子会社であるディープマインドは、改良した強化学習アルゴリズムが、ドーパミンが脳の学習を手助けする際の神経細胞の振る舞いと一致することを示す研究を発表した。この結果は、AI研究の現在の方向性が正しいことを示すと同時に、神経科学の研究者に新たな知見を与えてくれるだろう。 by Karen Hao2020.01.23

1951年、当時ハーバード大学の学生だったマービン・ミンスキーは、動物の行動の観察からアイデアを得てインテリジェントマシンの設計を試みた。動物が罰と報酬を通じて学習する仕組みを犬を用いて示した生理学者イワン・パブロフの有名な実験を参考にして、それと同様の強化を通じて継続的に学習し、仮想の迷路を解くことができるコンピューターを開発したのだ。

当時の神経科学者は、動物が罰と報酬を通じて学習することを可能にする脳内のメカニズムをまだ解明できていなかった。だが、それでもミンスキーは動物の行動を大まかに模倣して人工知能(AI)を進化させることができた。その数十年後、強化学習は進化し続け、今度は神経科学の分野における強化学習メカニズムの発見を手助けし、2つの分野で進歩の好循環が生まれた。

1月15日にネイチャー誌に掲載された論文によると、アルファベット(グーグル)のAI関連子会社であるディープマインド(DeepMind)は、再び強化学習の知見を利用して、人間の脳内の報酬メカニズムに関する新しい理論を提唱した。初期の実験結果によって裏付けられたこの仮説により、メンタルヘルスやモチベーションに関する理解が深まるだろう。さらに、より人間に近い汎用人工知能の構築を目指しているAI研究の現在の方向が正しいことを実証するかもしれない。

大まかに言えば、強化学習はパブロフの犬から導かれた洞察に従っている。つまり、正のフィードバックと負のフィードバックのみを通じて、複雑な新しいタスクを習得するようエージェントに指示できるという洞察だ。強化学習のアルゴリズムは、どの行動が報酬をもたらす可能性があるかをランダムに予測することによって割り当てられたタスクの学習を開始する。次に、行動を実行し、実際の報酬を観察して、誤差の大きさに基づいて予測を調整する。数百万回あるいは数十億回と試行を重ねるうちにアルゴリズムの予測誤差はゼロに収束する。その時点でアルゴリズムは、どの行動を取れば報酬が最大化し、タスクを完了できるかを正確に理解しているという仕組みだ。

脳の報酬システムもほぼ同じ方法で機能することが分かっている。それは1990年代に強化学習アルゴリズムにヒントを得て発見された。人間または動物が行動を起こ …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
【春割】実施中!年間購読料20%オフ!
人気の記事ランキング
  1. Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
  2. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  3. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
  4. Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製
▼Promotion
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る