「ゲームは長い間、人工知能の進歩におけるベンチマークやマイルストーンとして機能してきました。」こうして、チェコ共和国とカナダの研究者が、彼らがDeepStackと呼んだ人工知能ソフトウェアの成果を示す、本日サイエンス誌に発表された研究が始まります。このシステムは、圧倒的多数のプロ ポーカー プレーヤーを倒すことに成功しました。
このゲームの最も人気のあるバージョンであるテキサス ホールデムでは、人工知能が参加者 11 人中 10 人以上で大幅に勝利しました。研究者らは、2 人の間でプレイされ、賭け金制限のないヘッズアップバリアントでポーカーのプロと競争できるという考えで DeepStack を開発しました。一方、 Matej Moravc ̆íkのチームが説明しているように、ポーカーはチェスのような他のゲームと比較して、各プレーヤーがゲームの状態について非対称な情報を持っているため、人工知能システムにとってはるかに困難です。
各ゲームで参加者が持つ非対称データは、囲碁ゲームで利用できるものと似ています。囲碁では、 AlphaGoソフトウェアのおかげで、人工知能がすでに人間に勝利しています。ただし、ポーカーの決定ポイントはテキサス ホールデムの場合よりはるかに高く、 10,160という数字を超えています。研究者らがScience 誌の研究で説明しているように、DeepStack は CFR (反事実的後悔最小化) テクニックの再帰的推論を使用しますが、ゲーム中の「人間の直感」に似たメカニズムも使用します。
言い換えれば、DeepStack はゲームのあらゆる瞬間に戦略を分析します。このアルゴリズムは、考えられるすべての手を計算するのではなく、許可される手の深さと種類を制限します。このアプローチにより、考えられる既存の決定点の数が10,160から約 107 に減少し、アルゴリズムによってわずか 5 秒で解決できます。その機能をテストするために、研究者らは人工知能ソフトウェアに3,000 以上のポーカー ゲームをプレイさせ、その結果、参加者 11 人中 10 人に大幅に勝利しました。 11 人目のプレーヤーも負けましたが、サイエンス誌の研究では、統計的な観点からはそれほど重要ではないことが明らかになりました。
人工知能がポーカーで人間に勝つのはこれが初めてではありません。たとえば、以前、 Libratusアルゴリズムは、120,000 ラウンド以上のポーカーに参加した後、テキサス ホールデム バージョンで 4 人のプロ プレーヤーを破ったときに、すでにこれを達成していました。 DeepStack やその他の人工知能システムの開発のおかげで、研究者たちは、この種のアルゴリズムが戦略的情報を分析する必要がある現実の問題の解決に役立つことを期待しています。サイエンスの記事の中で、科学者たちは戦略的資源の防衛や重要な治療法の推奨について言及しています。人工知能が法廷、株式市場、あるいは自動車の中ですでにその可能性を実証しているとしたら、将来何ができなくなるのでしょうか?
参考資料一覧
- http://tecnologia.elpais.com/tecnologia/2017/02/03/actualidad/1486116304_957858.html
- http://science.sciencemag.org/lookup/doi/10.1126/science.aam6960
