三竦みの現象

三竦みを辞書で調べると,「蛙は蛇を、蛇はナメクジを、ナメクジは蛙を、それぞれ恐れてすくむこと」とありますが,簡単に言うと「じゃんけん」です. 二人でじゃんけんをするときに,一般的には勝ち,負け,あいことなる確率はそれぞれ同じ確率であると認識されています.だから,誰が誰とやっても勝つ確率は同じで,一見じゃんけんの勝負に不公平はないようですが,実際には・・・,皆さんも心当たりがあることでしょう.

ここで一つ実験をしてみます. 0から9までの数字を選択し,30個適当に並べます. 「0478365839756638284764282187739」. 適当に選んだつもりでも,28,39,38のような比較的似た系列が幾つか見受けられます. このように,人間は適当に並べたつもりでも,個人の「くせ」のようなものが結果として現れる場合があります.

実は先に述べたじゃんけんで,「勝ち,負け,あいことなる確率はすべて同じ確率である」というのは,対戦する相手同士が「くせなし」,つまり全く適当にグー,チョキ,パーを選択するという条件を必要とします.しかし,実際には個人の「くせ」があるため,じゃんけんの強い人,弱い人,相性のいい人,わるい人が存在するわけです. 逆に言うと,じゃんけんの必勝法は「グーの後にパーを出しやすい」と言った相手の「くせ」を読むことであり,それが可能であれば勝率を上げることができます. 以下では,どのようにしたら相手の「くせ」を数学的に表現することができるかについて考えてみます.

三竦みからマルコフ連鎖へ

先に述べた洞察から,人間には「くせ」があることはわかりましたが,どのようにしたらそれをうまく表現することができるでしょうか?

人間には「くせ」があるといっても,「グーを出した後は必ずパーを出す」と言う人は滅多にいないでしょう.もしいたとすれば,その人とじゃんけんをするときは相手がグーを出したときはチョキを出せば絶対に勝てます.しかし,現実は相手が「グーを出した後にパーを出しやすい」という程度の情報しか得られません.つまり「グーを出した後は,7割方パーを出す」といった確率的な表現となります.

これをもう少し数学的に考察しましょう.ある人が,グーを出したあとに再度グーを続ける確率が0.7(70%)といった傾向が予めわかっているとします. 例えば,前に出した拳と次に出す拳の確率に関する対応は以下の表のように与えられると仮定します.

前の拳\次の拳 グー チョキ パー
グー 0.7 0.2 0.1
チョキ 0.2 0.5 0.3
パー 0.1 0.5 0.4

上記の表のように,前の状態に依存して次の状態に対する確率が決定する系列を「マルコフ連鎖」と呼び,確率的な変動を伴うシステムを数学的に解析するための基礎的ツールとなっています.

次に傾向に従って最適な戦略を考えてみましょう.今,相手に勝ったら1点,あいこは0点,負けたら−1点もらえるとすると,相手が前回「グー」を出したあとでは,自分は「パー」を出せば 1 * 0.7 + (-1) * 0.2 + 0 * 0.1 = 0.5 点もらえることが期待されます.このようにして算出した見込みの「報酬」に基づいて,最適な戦略を構成することができ,「確率」という不確定要素を考慮したシステムのふるまいについて分析することができます.