KADOKAWA Technology Review
×
2024年を代表する若きイノベーターたちに会える!【11/20】は東京・日本橋のIU35 Japan Summitへ
AIの「頭の中」で何が起きているのか? ディープマインドが新ツール
Photo Illustration by Sarah Rogers/MITTR | Photos Getty
人工知能(AI) Insider Online限定
Google DeepMind has a new way to look inside an AI’s “mind”

AIの「頭の中」で何が起きているのか? ディープマインドが新ツール

AIの問題点の一つに、もっともらしい出力がどのようにして生成されるのか、よくわかっていないことがある。グーグル・ディープマインドの新しいツールを使えば、ブラックボックスの中を覗いて、理解や制御が可能なAIを構築するのに役立つかもしれない。 by Scott J Mulligan2024.11.19

人工知能(AI)は、創薬やロボット工学の分野にブレークスルーをもたらし、機械やWebとやり取りする方法を根底から変えようとしている。問題は、AIがどのような仕組みで動いているのか、なぜこれほど効果的に機能するのか、正確には分かっていないことである。それなりの見当はつけられているものの、複雑すぎてすみずみまでは解明できずにいる。これは一大事だ。医療などのきわめてセンシティブな分野にAIシステムを導入する際に、重大な欠陥が潜んでいる可能性を見落としてしまうかもしれないからだ。

機械論的解釈可能性(mechanistic interpretability)を研究しているグーグル・ディープマインド(Google DeepMind)のチームは、AIの仕組みを解明する新たな方法を模索してきた。7月末には、AIが出力を生成する際の動作の理解を助ける研究者向けツール「ジェマ・スコープ(Gemma Scope)」をリリースした。AIモデル内部の事象の理解を深められれば、その出力を適切に制御できるようになり、将来的にはAIシステムの大きな改善につながると期待されている。

「モデルの内部を覗き込み、詐欺的な挙動をしていないか、確認できるようにしたいのです」。グーグル・ディープマインドで機械論的解釈可能性チームを率いるニール・ナンダは言う。「モデルの思考を読み取ることができれば、役に立つはずです」。

機械論的解釈可能性は「メック・インタープ(mech interp)」とも呼ばれ、ニューラル・ネットワークの実際の仕組みを理解することを目指す新しい研究分野だ。非常に大雑把に言えば、現時点では、大量のデータを入力としてモデルに与え、訓練が終わるとモデルの重みを取得する。モデルの重みとは、モデルがどのように判断するかを決めるパラメーターだ。入力からモデルの重み付けの間で何が起きているのかについては、ある程度の理解はある。 基本的にAIはデータの中からパターンを見つけ、そのパターンに基づいて結論を導き出す。だが、このパターンというのがきわめて複雑で、人間には解釈できないほど難しいことが多い。

教師が複雑な数学のテスト問題の回答を採点するところを想像してほしい。生徒(この場合はAI)は正しい答えを書いているが、それがくねくねとした線の集まりにしか見えないのだ。この例では、AIが常に正解を出すものと仮定しているが、現実は必ずしもそうではない。AIの生徒は、無関係なパターンを正解だと思い込んだだけかもしれない。たとえば、現在でもAIシステムは、9.11は9.8より大きいという結果を返してくることがある。機械論的解釈可能性の分野で開発されたさまざまな方法により、内部の動きが少しずつ分かってきて、線の集まりの意味の解明が始まっている。

ナンダは、「機械論的解釈可能性の最重要目標は、これらのシステム内のアルゴリズムをリバースエンジニアリングすることです」と説明した。「たとえば『詩を書いて』とプロンプトを投げると、モデルは韻を踏んだ文章を返してきます。どのようなアルゴリズムで詩が出てきたのでしょうか。私たちはそれをぜひ理解したいと思っています」。

グーグルのAIモデルである「ジェマ(Gemma)」内で特徴、つまりデータの大きな概念を表すカテゴリーを見つけるため、ディープマインドのチームは、「スパース・オートエンコーダー(sparse autoencoder)」と呼ばれるツールをモデルの各層で実行した。スパース・オートエンコーダーは、これらの層を拡大して細部を観察できる顕微鏡のようなものだ。たとえば、ジェマにチワワについて尋ねると、「犬」という特徴が引き出され、モデルが「犬」について知っている情報が活性化される。「スパース(希薄、まばら)」とされるのは、使用するニューロンの数を制限し、より効率的で一般的なデータ表現を …

こちらは有料会員限定の記事です。
有料会員になると制限なしにご利用いただけます。
有料会員にはメリットがいっぱい!
  1. 毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
  2. オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
    重要テーマが押さえられる。
  3. 各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。
人気の記事ランキング
  1. This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
  2. Promotion Innovators Under 35 Japan Summit 2024 in Nihonbashi 2024年のイノベーターが集結「U35 Summit」参加者募集中
  3. Inside a fusion energy facility 2026年の稼働目指す、コモンウェルスの核融合施設へ行ってみた
  4. How ChatGPT search paves the way for AI agents 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略
▼Promotion イノベーター under35 2024
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る