KADOKAWA Technology Review
×
【3/14東京開催】若手研究者のキャリアを語り合う無料イベント 参加者募集中
An AI Poker Bot Has Whipped the Pros

人工知能、ポーカーでもプロに圧勝

ポーカーでも人間が完敗したとはいえ、人工知能の戦略を可能にしたのはゲーム理論だ。しかし、3人以上の対戦になるとゲーム理論は使えないため、別の理論を作るところから始める必要がある。 by Jamie Condliffe2017.02.01

人工知能による習得は困難だと考えられたゲームで、人間がコンピューターにまた敗北した。

ピッツバーグのリバーズカジノでは、3週間以上にわたり、AIポーカーボットのリブレイタスがプロの熟練ポーカー・プレイヤー集団を相手に、数千回の無制限テキサス・ホールデム対戦をこなしてきた。そしてリブレイタスが圧勝した。

MIT Technology Reviewのウィル・ナイト記者による先日の記事では、リブレイタス(カーネギーメロン大学の研究者2人が開発に関わっている)が勝利する理由が語られており、実現すれば非常に大きなニュースになると書かれていた。

ポーカーは機械による再現が難しい、推理力と知性を要するゲームであり、リブレイタスの勝利は人工知能の大きな進歩といえる。ポーカーがチェッカーや囲碁と根本的に異なるのは、対戦中に相手の手札が見えないことだ。「不完全情報」に基づくゲームで、対戦相手が取りうるあらゆる手を考慮しつつ理想的な戦略を探り出すのはとてつもなく複雑な作業だ。無制限テキサス・ホールデムは実質的に相手の賭けられる金額に制限がないため、特に難易度が高い。

無制限テキサス・ホールデムでは、どの場面でも何か正しい手があるわけではなく、数千回の勝利は事実上不可能に近い。そこでAIはゲーム理論を使って、不確実な状況で最善の動きを計算した。

結局、試合はリブレイタスの圧勝だった。180万ドルのチップを獲得し、プロ4人は全員が最終的に持ち出しになった。人工知能が、無制限テキサス・ホールデムほど情報量の少ないゲームで一流プレーヤーに圧勝するのは初めてのことだ。かつて、ディープマインドが囲碁で勝利を収めたように、リブレイタスの勝利は機械学習の関係者にとって劇的な出来事だ。

では、人間にとってAIとの対戦はどんな感じだったのか? 対戦したプロのひとり、ジェイソン・レスは「ちょっと自信を失うような気分です」とガーディアンに語った。「人間相手の試合で負けても、そこで試合が終わり、休憩が取れます。ここには毎日足を運び、1日につき1時間も負け続けなければいけません。あれほど頻繁に負けるのには慣れていないので、普段とは全く違った感情を抱くことになります」

一方、別のプロであるダニエル・マコーレーはワイヤードに対して、AIがメモリー内に異なる動きを蓄えておける能力は、人間の対戦相手よりもずば抜けていると語った。マコーレーは「リブレイタスは掛け金を3つから5つの金額にわけるのです。そんなことは人間にはできません」という。ただし大敗したプレーヤーに同情する必要はない。負けても、トーナメント中の成績に応じて賞金20万ドルを分配した金額を受け取れるのだ。

AIにとって、今回の勝利は単なる始まりに過ぎない。プロのポーカー・プレイヤーが得意とするゲームでも勝利できると証明されたので、次に待ち受ける課題に備えなければならない。複数プレーヤーを相手にした、無制限テキサス・ホールデムだ。しかし、現在のソフトウェアに用いられているゲーム理論は、対戦相手が2人以上になると機能しない。しかもゲーム理論の代わりになる手法は不明なのだ。

とはいえ、現在の機械学習が進展や、AIポーカーボットは他でも開発されていることを考えると、複数プレーヤーを相手にした試合は不可能そうでも、しばらくすれば実現するかもしれない。

(関連記事:BloombergWired, The Guardian, “人工知能がポーカーのハッタリ勝負で人間に勝利する意味とは?,” “直感力を手に入れた人工知能は、ポーカーで人類を打ち負かすか?,” “Five Lessons from AlphaGo’s Historic Victory”)

人気の記事ランキング
  1. AI crawler wars threaten to make the web more closed for everyone 失われるWebの多様性——AIクローラー戦争が始まった
  2. Promotion Innovators Under 35 Japan × CROSS U 好評につき第2弾!研究者のキャリアを考える無料イベント【3/14】
  3. From COBOL to chaos: Elon Musk, DOGE, and the Evil Housekeeper Problem 米「DOGE暴走」、政府システムの脆弱性浮き彫りに
  4. What a major battery fire means for the future of energy storage 米大規模バッテリー火災、高まる安全性への懸念
  5. A new Microsoft chip could lead to more stable quantum computers マイクロソフト、初の「トポロジカル量子チップ」 安定性に強み
ジェイミー コンドリフ [Jamie Condliffe]米国版 ニュース・解説担当副編集長
MIT Technology Reviewのニュース・解説担当副編集長。ロンドンを拠点に、日刊ニュースレター「ザ・ダウンロード」を米国版編集部がある米国ボストンが朝を迎える前に用意するのが仕事です。前職はニューサイエンティスト誌とGizmodoでした。オックスフォード大学で学んだ工学博士です。
▼Promotion
U35イノベーターと考える 研究者のキャリア戦略 vol.2
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る