【超上級編】GTO part1 〜はじめてのゲーム理論〜

ジョーズ

今回から全5回でGTO(Game Theory Optimal)の基本を解説していくね。できるだけ数式は使わず、身近な例とイラストで説明してみたよ。
具体的にGTOのこれこれが知りたい!っていう人はGTOのQ&A集(執筆中)を見てみてね。

目次

ポーカーはどこで勝ち負けが決まるのか

ジョーズ

ねえ、チンアナゴちゃん。人はいつ、どんなときにポーカーで勝つんだろう?「ポーカーで勝つ」って、結局どういうことなんだと思う?

チンアナゴ

え?ヤブから棒だね。うーん・・・ストレートみたいな強い役ができて、大きなポットが取れるときとか?

ジョーズ

確かにそういうシチュエーションはあるよね。でも、長い目で見ると相手にもストレートが来るはずだよ。

チンアナゴ

うん、そりゃそうだよね。

ジョーズ

長いスパンで見ると、ハンドやポジションは結局みんな平等なんだね。でも、アクション(とベットサイズ)だけはプレイヤーが選択できるんだ。

チンアナゴ

そっか、プレイヤーはベット、レイズ、チェック、フォールドだけで戦ってるんだもんね。

ジョーズ

そうそう。ということはだよ、ポーカーを長期的に見たとき、「相手に対して有効な(期待値が高い)戦略を取ること」が勝ち負けを決めるんだ。当たり前に聞こえるかもしれないけど、ゲーム理論を考える上でこれは大切なことなんだ。ひとまず押さえておくね。

チンアナゴ

うーん、ところでさ、アクションはわかるんだけど戦略ってなんかピンとこないなあ。

ジョーズ

例えばこんなのはどうかな。相手のリバーのベットがトップペア+のような強いハンドだけだとすると、自分はトップペアよりも弱いハンドはフォールドして、ナッツ級の強いハンドだけでコールやレイズをすればいいはずだよ。
そうすれば勝っているときは利益を大きくして、負けているときは損失を小さくすることができるんだ。

チンアナゴ

そっか、そうすればリバーが来れば来るほど、自分はどんどん勝っていきそうだね。

ジョーズ

相手は「リバーのベットにバリューしかない」という不利な戦略を使っているんだね。ポーカーはゼロサム・ゲームだから、もし相手がミスをして、そのミスをうまく突くような戦略を使えば、自分はその分だけ得をすることができるよ。

チンアナゴ

でもさ、相手も戦略を変えてくるかもよ?「そうか、リバーで全くブラフしてないから相手につけ込まれてるんだ!」って気づいちゃうかも。

ジョーズ

うん、そうだよね。相手は戦略を修正してくるかもしれない。でも、その相手の修正版の戦略に対して、こちらもさらに有効な戦略に変えることができるんだ。

チンアナゴ

そしたらお互いにどんどん戦略を変えていって・・・あれ?キリがないんじゃない?

ジョーズ

ところが終わりはあるんだ。戦略を変えても互いにこれ以上利益が増やせないような状態がポーカーにはあるんだよ。

チンアナゴ

戦略勝負の終点があるってこと?

ジョーズ

うん。その状態を数学ではナッシュ均衡というんだ。次の章から詳しく説明していくね。

GTO:ナッシュ均衡に基づいたプレイ

ジョーズ

さて、まずはナッシュ均衡の定義を改めて見てみようか。

  • ナッシュ均衡:
    互いのプレイヤーが戦略を変更してもそれ以上期待値を上げることができない状態・あるいはその戦略の組み合わせのこと
f:id:Poker_JAWS:20181213054208p:plain
チンアナゴ

うーん、なんかフワッとしてるなあ。お互いに戦略を競争してたはずなのに、いきなり「はい、ここから先は戦略を変えても期待値は増えません」って言われても・・・。っていうか、そんな状態になったらもう勝ち負けとか無いんじゃないの?

ジョーズ

鋭いね、そのとおりだよ。いろいろ疑問はあると思うけど、一つずつ説明していくから安心して。

チンアナゴ

ふーむ、いろいろ気になることはあるけど、まずは話を聞かせてもらおうかな。

ジョーズ

さっきも説明したとおり、ポーカーは相手に対して有利な戦略を使うことで初めて利益が出る(期待値が上がる)んだ。ゲーム理論ではこれをエクスプロイト(exploit)というよ。「搾取」という意味だね。

チンアナゴ

搾取って・・・。まるで大地主か悪代官だね。

ジョーズ

すごいストレートな言葉だよね。それはともかく、ポーカーにはお互いにそれ以上エクスプロイトできないような戦略の組み合わせがあるんだ。

チンアナゴ

それがナッシュ均衡ね。

ジョーズ

うん。そしてそのナッシュ均衡(戦略の組)になっているうちの、具体的な戦略のことをGTOっていうんだ。

ジョーズ

さて、ここまで説明したGTOの特徴をまとめてみようか。

GTOの特徴(1)

  • GTO=ナッシュ均衡に基づいたプレイ
    =ポーカーの最もスタンダードなプレイ。すべての戦略の基準点。
  • GTOはエクスプロイトされない
    =GTO以外の戦略は、何らかの戦略によってエクスプロイトされる可能性が常にある。
チンアナゴ

ふむ、エクスプロイトされないような戦略があるってことはよくわかったよ。そろそろ具体的なGTOが見てみたいなあ。

ジョーズ

OK。じゃあ次は具体的なスポットのGTOを一緒に見てみようか。GTOをどう解釈すればいいのか、詳しく説明していくね。

チンアナゴ

part2へ続くッ!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

©2018 PokerJAWS
※当サイトの文章、画像の無断転載は禁止です

コメント

コメントする

目次