【超上級編】GTO part1 〜はじめてのゲーム理論〜

ジョーズ
ジョーズ

今回から全5回でGTO(Game Theory Optimal)の基本を解説していくね。できるだけ数式は使わず、身近な例とイラストで説明してみたよ。
具体的にGTOのこれこれが知りたい!っていう人はGTOのQ&A集(執筆中)を見てみてね。

ポーカーはどこで勝ち負けが決まるのか

ジョーズ
ジョーズ

ねえ、チンアナゴちゃん。人はいつ、どんなときにポーカーで勝つんだろう?「ポーカーで勝つ」って、結局どういうことなんだと思う?

チンアナゴ
チンアナゴ

え?ヤブから棒だね。うーん・・・ストレートみたいな強い役ができて、大きなポットが取れるときとか?

ジョーズ
ジョーズ

確かにそういうシチュエーションはあるよね。でも、長い目で見ると相手にもストレートが来るはずだよ。

チンアナゴ
チンアナゴ

うん、そりゃそうだよね。

ジョーズ
ジョーズ

長いスパンで見ると、ハンドやポジションは結局みんな平等なんだね。でも、アクション(とベットサイズ)だけはプレイヤーが選択できるんだ。

チンアナゴ
チンアナゴ

そっか、プレイヤーはベット、レイズ、チェック、フォールドだけで戦ってるんだもんね。

ジョーズ
ジョーズ

そうそう。ということはだよ、ポーカーを長期的に見たとき、「相手に対して有効な(期待値が高い)戦略を取ること」が勝ち負けを決めるんだ。当たり前に聞こえるかもしれないけど、ゲーム理論を考える上でこれは大切なことなんだ。ひとまず押さえておくね。

チンアナゴ
チンアナゴ

うーん、ところでさ、アクションはわかるんだけど戦略ってなんかピンとこないなあ。

ジョーズ
ジョーズ

例えばこんなのはどうかな。相手のリバーのベットがトップペア+のような強いハンドだけだとすると、自分はトップペアよりも弱いハンドはフォールドして、ナッツ級の強いハンドだけでコールやレイズをすればいいはずだよ。
そうすれば勝っているときは利益を大きくして、負けているときは損失を小さくすることができるんだ。

チンアナゴ
チンアナゴ

そっか、そうすればリバーが来れば来るほど、自分はどんどん勝っていきそうだね。

ジョーズ
ジョーズ

相手は「リバーのベットにバリューしかない」という不利な戦略を使っているんだね。ポーカーはゼロサム・ゲームだから、もし相手がミスをして、そのミスをうまく突くような戦略を使えば、自分はその分だけ得をすることができるよ。

チンアナゴ
チンアナゴ

でもさ、相手も戦略を変えてくるかもよ?「そうか、リバーで全くブラフしてないから相手につけ込まれてるんだ!」って気づいちゃうかも。

ジョーズ
ジョーズ

うん、そうだよね。相手は戦略を修正してくるかもしれない。でも、その相手の修正版の戦略に対して、こちらもさらに有効な戦略に変えることができるんだ。

チンアナゴ
チンアナゴ

そしたらお互いにどんどん戦略を変えていって・・・あれ?キリがないんじゃない?

ジョーズ
ジョーズ

ところが終わりはあるんだ。戦略を変えても互いにこれ以上利益が増やせないような状態がポーカーにはあるんだよ。

チンアナゴ
チンアナゴ

戦略勝負の終点があるってこと?

ジョーズ
ジョーズ

うん。その状態を数学ではナッシュ均衡というんだ。次の章から詳しく説明していくね。

GTO:ナッシュ均衡に基づいたプレイ

ジョーズ
ジョーズ

さて、まずはナッシュ均衡の定義を改めて見てみようか。

  • ナッシュ均衡:
    互いのプレイヤーが戦略を変更してもそれ以上期待値を上げることができない状態・あるいはその戦略の組み合わせのこと

f:id:Poker_JAWS:20181213054208p:plain

チンアナゴ
チンアナゴ

うーん、なんかフワッとしてるなあ。お互いに戦略を競争してたはずなのに、いきなり「はい、ここから先は戦略を変えても期待値は増えません」って言われても・・・。っていうか、そんな状態になったらもう勝ち負けとか無いんじゃないの?

ジョーズ
ジョーズ

鋭いね、そのとおりだよ。いろいろ疑問はあると思うけど、一つずつ説明していくから安心して。

チンアナゴ
チンアナゴ

ふーむ、いろいろ気になることはあるけど、まずは話を聞かせてもらおうかな。

ジョーズ
ジョーズ

さっきも説明したとおり、ポーカーは相手に対して有利な戦略を使うことで初めて利益が出る(期待値が上がる)んだ。ゲーム理論ではこれをエクスプロイト(exploit)というよ。「搾取」という意味だね。

チンアナゴ
チンアナゴ

搾取って・・・。まるで大地主か悪代官だね。

ジョーズ
ジョーズ

すごいストレートな言葉だよね。それはともかく、ポーカーにはお互いにそれ以上エクスプロイトできないような戦略の組み合わせがあるんだ。

チンアナゴ
チンアナゴ

それがナッシュ均衡ね。

ジョーズ
ジョーズ

うん。そしてそのナッシュ均衡(戦略の組)になっているうちの、具体的な戦略のことをGTOっていうんだ。

ジョーズ
ジョーズ

さて、ここまで説明したGTOの特徴をまとめてみようか。

GTOの特徴(1)

  • GTO=ナッシュ均衡に基づいたプレイ
    =ポーカーの最もスタンダードなプレイ。すべての戦略の基準点。
  • GTOはエクスプロイトされない
    =GTO以外の戦略は、何らかの戦略によってエクスプロイトされる可能性が常にある。
チンアナゴ
チンアナゴ

ふむ、エクスプロイトされないような戦略があるってことはよくわかったよ。そろそろ具体的なGTOが見てみたいなあ。

ジョーズ
ジョーズ

OK。じゃあ次は具体的なスポットのGTOを一緒に見てみようか。GTOをどう解釈すればいいのか、詳しく説明していくね。

チンアナゴ
チンアナゴ

part2へ続くッ!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です