この記事は米国版ニュースレターを一部再編集したものです。
私の家には恥ずべき椅子がある。寝室の椅子の上に、洗濯するほどには汚れていない着用済みの服を積み上げているのだ。夜、寝るときに、それらの服を畳んで片付けるのは、説明できないような理由で著しく負担に感じる。そこで、「後で」やることにして椅子の上に投げ捨てている。椅子が服の山で覆われる前に、この仕事を自動化できるなら、大金を払ってもいい。
人工知能(AI)のおかげで、私たちは雑用をこなせる家庭用ロボットの目標に向かい、少しずつ前進している。私たちが気楽に作業を任せることができる、本当に役に立つ家庭用ロボットを作ることは、何十年も前から存在するSFの空想であり、多くのロボット工学者の最終目標である。しかし、ロボットは不器用で、私たちが簡単に感じることでもこなすのに苦労する。手術のように非常に複雑なことができる種類のロボットは、何十万ドルもすることが多く、法外に高価だ。
私はつい最近、スタンフォード大学の新たなロボット工学システム「モバイル・アロハ(Mobile ALOHA)」に関する記事を公開した。研究者たちはこのシステムを利用して、信じられないほど複雑なことをいくつか、安価な既製品の車輪付きロボットに自力でやらせた。エビの調理、表面の汚れの拭き取り、椅子の移動などである。さらに、3品のコース料理を作らせることにも成功した(ただし、人間の監視付きだ)。 詳細はこちらの記事を読んでほしい。
ロボット工学は転換期を迎えていると、このプロジェクトの顧問を務めたスタンフォード大学のチェルシー・フィン助教授は言う。これまで研究者たちは、ロボットの訓練に利用できるデータ量の制約を受けていた。今では利用可能なデータが大幅に増えた。ニューラル・ネットワークとより多くのデータがあれば、ロボットは複雑なタスクをかなり迅速かつ容易に学習できることを、モバイルALOHAのような研究が示しているとフィン助教授は言う。
チャットボットを動かしている大規模言語モデルのようなAIモデルは、インターネットからかき集められた膨大なデータセットで訓練されるが、ロボットは物理的に収集されたデータで訓練する必要がある。そのことが、大量のデータセットの構築を非常に難しくしている。ニューヨーク大学とメタの研究者チームは最近、この問題を回避できるシンプルで賢い方法を考えだした。マジックハンドに取り付けたアイフォーン(iPhone)を使い、自宅でタスクをこなしているボランティアの様子を記録したのだ。その後、「ドビー(Dobb-E)」と呼ばれるシステムを訓練し、100以上の家事を約20分で完了させることに成功した (詳しくはこちらの記事で読むことができる)。
ロボット工学のコミュニティには、そのようなタスクをこなすロボットの能力を妨げているのは、主にハードウェアの欠点であるという信念がある。モバイルALOHAは、その信念を覆すものでもあると、カーネギーメロン大学のディーパック・パタック助教授は言う(同助教授はモバイルALOHAの研究には参加していない)。「欠けているピースはAIです」。
AIはまた、口頭での命令にロボットを反応させたり、しばしば物が散らかっている現実世界の環境にロボットが適応するのを支援したりすることでも、有望視されている。たとえば、グーグルの「RT-2」システムは、ロボットと視覚-言語-行動モデルを組み合わせている。これにより、ロボットは世界を「見て」分析し、口頭での指示に反応して動くことができる。ディープマインド(DeepMind)の新たなシステム「オートRT(AutoRT)」は、同様の視覚-言語モデルを使用してロボットが見知らぬ環境に適応するのを支援し、大規模言語モデルを使用して一群のロボットに対する指示を生成する。
次は悪い知らせだ。最先端のロボットでも、まだ洗濯はできない。洗濯はロボットにとって、人間がやるよりも難しい作業である。クシャクシャになった衣服は奇妙な形になっており、ロボットにとっては処理したり扱ったりするのが難しい。
しかし、それも時間の問題かもしれないと、研究チームの一員であるスタンフォード大学の大学院生、トニー・ザオは言う。ザオは、この最も厄介なタスクでさえ、いつかはAIを使ってロボットに習得させることができるようになると楽観視している。まず必要なのは、データを集めることだけだ。ということは、私と私の椅子にも希望があるのかもしれない。
◆
AI関連のその他のニュース
サム・アルトマンをAIのアバターに変身させた女性。オープンAI(OpenAI)の国際渉外担当副社長、アンナ・マカンジュの素晴らしい経歴を見てみよう。マカンジュ副社長は、サム・アルトマンが世界のリーダーたちと会うグローバルツアーを手配し、その過程でアルトマンをAI分野の大使に変身させた女性である。(ワシントン・ポスト)
著作物なしでAIモデルを作成するのは「不可能」とオープンAIが指摘。英国貴族院の委員会に提出された資料の中で、オープンAIは、著作物へのアクセスなしに「GPT-4」や「チャットGPT(ChatGPT)」のような大規模AIモデルを訓練することはできないと述べた。同社はまた、著作権で保護されたコンテンツを除外することは、不十分なシステムにつながるとも主張した。ニューヨーク大学のゲイリー・マーカス名誉教授などの批評家たちは、これを「利己的なばかげた言動」と呼び、ライセンス料の支払いを避けようとする試みであるとした。(ガーディアン)
米国企業と中国の専門家がAIの安全性に関する秘密外交に参加。政府高官たちの賛同を得て、オープンAI、アンソロピック(Anthropic)、コーヒア(Cohere)が昨年、中国トップのAI専門家たちと会談した。会談のテーマは、このテクノロジーに関するリスクと、AIの安全性研究への投資奨励だった。「最終的な目標は、より高度なAI技術の安全な開発に向けた科学的な道筋を見つけることだった」と、フィナンシャル・タイムズ紙は書いている。 (フィナンシャル・タイムズ)
デュオリンゴが契約社員を10%削減、AIを使ったコンテンツ制作を強化。言語学習アプリ企業のデュオリンゴ(Duolingo)が契約社員の一部を解雇し、コンテンツ制作に生成AI(ジェネレーティブAI)をより多く使い始めた。同社によると、これは従業員を直接AIに置き換えたのではなく、従業員がより多くのAIツールを使うようになった結果であるという。生成AIが持ち得る欠陥や偏りを知るデュオリンゴにとって、このことが長期的にどの程度役立つのか、今後が興味深い。(ブルームバーグ)