人工知能が
ポーカーのハッタリ勝負で
人間に勝利する意味とは?
AIがポーカーを極めるには不完全情報への対処が不可欠だ。現実世界でも情報が完全には得られない状況は多く、プロ・プレイヤーにAIが勝利できれば、AIの応用範囲はさらに広がる。 by Will Knight2017.01.24
偉大な歌手、ケニー・ロジャースがかつて歌ったように、優れたギャンブラーは堪えどきと諦めどきを知っている。ピッツバーグのリバーズ・カジノでは今週ついに、コンピューターはどんな人間プレーヤーよりもうまく勝負を見極められると、コンピューター・プログラム「リブレイタス(Libratus)」が証明するかもしれない。
https://www.youtube.com/watch?v=Jj4nJ1YEAp4
リブレイタスはプロの熟練ポーカー・プレイヤー4人を相手に、数千回の無制限テキサス・ホールデム対戦をこなしてきた。1月11日から30日までの日程で開催される大会の半ばを過ぎた今、リブレイタスは人間のプレーヤーを相手に約80万ドルを勝ちとった。まだ不確実ではあるが、勝利の見込みが高くなっている。
ポーカーは機械による再現が難しい、推理力と知性を要するゲームであり、リブレイタスの勝利は人工知能の大きな進歩といえる。ポーカーがチェッカーや囲碁と根本的に異なるのは、対戦中に相手の手札が見えないことだ。「不完全情報」に基づくゲームで、対戦相手が取りうるあらゆる手を考慮しつつ理想的な戦略を探り出すのはとてつもなく複雑な作業だ。無制限テキサス・ホールデムは実質的に相手の賭けられる金額に制限がないため、特に難易度が高い。
バイドゥのアンドリュー・ング主任科学者は「ポーカーはAIにとって最難関級のゲームでした。単一かつ最善の一手は存在しません。その代わり、AIプレーヤーは行動を無作為化することでハッタリをかけ、相手の確信を揺らがせるのです」という。
リブレイタスを開発したのは、コンピューター科学を専門とするカーネギーメロン大学(CMU)のツォーマス・サンドホルム教授と、サンドホルム教授に師事する大学院生のノーム・ブラウンだ。ゲーム理論とAIの専門 …
- 人気の記事ランキング
-
- What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
- A Google Gemini model now has a “dial” to adjust how much it reasons 推論モデルは「考えすぎ」、グーグルがGeminiに調整機能
- Meet the researchers testing the “Armageddon” approach to asteroid defense 惑星防衛の最終戦略 科学者たちが探る 「核爆発」研究の舞台裏
- Anthropic can now track the bizarre inner workings of a large language model 大規模言語モデルは内部で 何をやっているのか? 覗いて分かった奇妙な回路