グーグル、人間と試合できる卓球ロボット 戦績は29戦13勝
知性を宿す機械

Google DeepMind trained a robot to beat humans at table tennis グーグル、人間と試合できる卓球ロボット 戦績は29戦13勝

グーグル・ディープマインドは、卓球の試合で人間と対戦できるロボットを開発した。シミュレーション環境での訓練と、実世界のデータを利用した訓練を組み合わせて、アマチュア・レベルの人間が相手の場合には55%の勝率を記録した。 by Rhiannon Williams2024.08.14

ロボットを相手に卓球で勝てる見込みはあるのだろうか? グーグル・ディープマインド(Google Deepmind)は、アマチュアレベル相当の卓球の試合ができるようにロボットを訓練したと発表した。人間と同等のレベルで一緒にスポーツをするようにロボットを訓練した初の事例だとしている。

研究チームは、3Dプリンター製のラケットを装着したロボット・アームに、競技レベルが異なるさまざまな人間と卓球の試合を対戦させ、29試合中13試合に勝利することに成功した。研究内容はアーカイブ(arXiv)に査読前論文として発表されている。

このシステムはまだまだ完璧とは言い難い。卓球ロボットは、初心者の人間には全勝し、アマチュア・レベルの人間が相手の場合でも55%の勝率を記録したが、上級者を相手にすると全敗した。それでも、すばらしい進歩だ。

「数カ月前の時点でも、現実的に考えると、ロボットが対戦したことのない相手に勝つのは難しいと予想していました。このシステムは明らかに、我々の期待を上回りました」。グーグル・ディープマインドの上級ソフトウェア・エンジニアで、このプロジェクトを率いたパンナグ・サンケティは言う。「ロボットが強い相手をも打ち負かす姿には驚かされました」。

この研究は単なるお楽しみで終わるものではない。実際のところ、家庭や倉庫のような現実の環境における有用な作業を巧みにかつ安全にこなすロボット作りに向けた一歩であり、これはロボット工学界の長年の目標でもある。グーグル・ディープマインドの機械学習に対するアプローチは、他の多くの分野にも応用可能だと、ニューヨーク大学のコンピューター科学研究者、レレル・ピント助教授は言う(同助教授は今回のプロジェクトには参加していない)。

「私はロボット・システムが実際の人間と一緒に、またその周りで実際に働いているのを見るのが大好きですが、これはそのすばらしい例だと言えるでしょう。まだ強い選手ではないかもしれませんが、上達を続け、最終的には目標に到達できる材料は揃っています」(ピント助教授)。

人間が熟達した卓球選手になるには、手と目を協調させる優れた能力、すばやく動く能力、相手に反応するすばやい判断力が必要だが、これらの能力はロボットにとってすべて困難な課題だ。グーグル・ディープマインドの研究チームは、これらの能力を模倣するようにシステムを訓練するために、2種類の手法を使った。打撃技術を習得するようシステムを訓練するためにコンピュータ・シミュレーションを利用し、その後、実世界のデータで微調整することで、時間の経過と共に改善できるようにしたのだ。

研究チームは、位置、スピン、速度など、卓球のボールの状態を表すデータセットを構築。卓球ロボットのシステムは、卓球の試合を物理的に正確に反映するように設計されたシミュレーション環境で、このデータセットからデータを取得し、サーブのリターン、フォアハンドでのトップスピン、バックハンド・ショットの打ち方などのスキルを習得した。ロボットの制約によりサーブを打つことはできないため、実際の試合ではこれに合わせてルールを修正した。

人間相手の試合中、ロボットは自分のパフォーマンスに関するデータを収集し、スキル向上に役立てるようにした。ロボットは、2台のカメラが捉えたデータを使ってボールの位置を追跡し、対戦相手のラケットに付いているLEDを利用したモーション・キャプチャー・システムで、相手のプレー・スタイルを追跡する。ボールのデータは訓練用のシミュレーションにフィードバックされ、継続的なフィードバック・ループが形成される。

このフィードバックにより、ロボットは相手に勝つために新たに習得したスキルを試すことができる。つまり、人間と同じように戦術や振る舞いを調整できるのだ。これは、1試合を通じて、また試合を重ねるごとに、ロボットが戦術も振る舞いも徐々に上達させていくことを意味する。

このシステムは、非常に早いボールや、視界の外(卓球台から30センチ以上)、非常に低い位置に速球を打ち込まれると、打ち返すのに苦労した。ラケットを損傷させる可能性のある衝突を避けるように指示する仕組みがあるためだ。また、スピンを直接測定する機能を持たないため、ボールをスピンさせることが難しかった。上級者の選手にはこのロボットの限界がすぐに利用された。

シミュレーション環境で起こりうるあらゆる事態に対応できるようにロボットを訓練することは本当に難しい。こう指摘するのは、元テスラのロボット工学チーム責任者で、現在はロボット工学企業マイトラ(Mytra)の創業者兼最高経営責任者(CEO)を務めるクリス・ウォルティだ(今回のプロジェクトには参加していない)。

「突風や(テーブル上の)ホコリなど、本当に多くの変動要因があるので、現実世界のシミュレーションを実際にするのは、非常に、非常に難しいことです」。ウォルティCEOは言う。「非常に細かいところまで現実を再現したシミュレーションができない限り、ロボットの性能は限界に達してしまいます」。

グーグル・ディープマインドは、ボールの軌道を予測するように設計された予測AIモデルの開発や、より優れた衝突検知アルゴリズムの導入など、さまざまな方法でこうした限界を乗り越えられると考えている。

1つ重要なことは、人間の選手たちがロボット・アームとの試合を楽しんでいたことだ。ロボット・アームを打ち負かすことができた上級の選手でさえ、楽しく、興味をそそられる経験をしたと語り、技術を磨くための力強い練習パートナーとしての可能性を感じたという。

「時々試合をするトレーニング・パートナーとしてぜひ欲しいですね」。ある研究参加者は語った。