コンピュータ・トーナメント: 上品に生きることの勧め
Previous: 囚人のジレンマ
「囚人のジレンマ」を軽くおさらいしましょう。
お互いの選択が相手の選択に影響するような相互依存関係にある状態をゲームと呼びました。その状態で、①相手と意思疎通ができないときに、②相手に協力するか、裏切るかの選択を迫られているという二つの条件のもとで行われる駆け引きのことを、囚人のたとえになぞらえ、「囚人のジレンマゲーム」と名付けられているということでした。一対一での人間関係をシミュレーションする分かりやすいモデルとして重要な役割を果たしている、というところまで説明しました。
さて、この「囚人のジレンマゲーム」は一回のみ行われるという前提で議論されてきました。つまり、生涯で一回しか会わないような人間との間で生じる相互関係という非常に限定されたモデルであることが分かります。通常は友人関係、或いは恋愛関係といった半持続的な関係であることが多いですよね。
R.アクセルロッドは、この「ジレンマゲーム」が繰り返し行われたとしたら、人はどういった戦略を取れば高い成績を取れるのかということを明らかにするために、あるコンピューターシミュレーションを行いました。
まず、彼はゲーム理論の専門家たちに、最も高い成績を取れるであろう戦略プログラムを募集しました。14人が作成した戦略プログラムに加え、「ランダム戦略(協力か、裏切りかを50%の確率で選ぶプログラム)」を加えた15のプログラムを総当たり戦でそれぞれ200回マッチで行いました((1。そのプログラムの中には、相手の行動を読んだうえで自分の行動を決定するなど、複雑なものもあったそうです。
しかし、結果は驚くべきものとなりました。最も高い成績を収めたのは、①一回目は相手に協力し、②それ以降は前回出した相手の行動をまねするという「応報戦略」だったのです。アクセルロッドは、更に63の戦略プログラムを戦わせましたが、やはり結果は「応報戦略」の優勝となりました。
この結果からコンピューターシミュレーションで明らかになったのは、平均して高い成績を収めた戦略に共通する性質として、自ら裏切らない「上品さ」がある戦略が強いということです。逆に言えば、相手を裏切るような「汚い」戦略は高い成績を収めることはできなかったのです。応報戦略とは例えば、「初対面の人には優しく振舞い、同じように優しくしてくれた人間には優しく、ひどい対応をされたらひどい対応をし返す」という、とても単純な行動原理です。しかし、相互協力の状態を幅広く作り出せるという点で(優しい友人関係をごく自然に作れるということです)とても優れた戦略だと言えるでしょう。
人はどうして「上品」に振る舞わなければいけないのか。どうして知らない人に対しても「笑顔」でいなければいけないのか。その疑問に答えることはできなくても、「上品に振る舞った方が長期的な目で見れば自分の利益を高めてくれるだろう」といった可能性は示唆されています。一対一の友人関係、恋人関係において、お互いが協力し合うという美しい人間関係を保つのが良いということは、道徳感情によって良いことだからという漠然とした理由だけで正当化されるものではなく、理論的に得になるという科学的根拠を持っていることが明らかになったのです。
更にアクセルロッドは、「応報戦略」を「種の進化のための適応的道具」として優れているかどうかを実験するために、別のコンピューター・シミュレーションを行いました。「ジレンマゲーム」で高い得点を出した戦略は種に属する個体が増加し、低い得点を出した戦略は減少させるという進化アルゴリズムの元、それを1000世代まで繰り返し実行したところ、やはり「応報戦略」をとった種が集団内の比率を高めていったことが分かりました。
このことは、後に触れる「互恵関係」がどうして起こるのかという疑問に対する一つの答えの可能性を示しているように思えます。それについては、「互恵的利他主義」の項目でまた触れることにしましょう。
しかし、このコンピュータ・トーナメントでは「一対一」での人間関係が前提となっています。実は、三人以上でゲームを行ったときは、この「応報戦略」が機能しないことが分かっています。では、人は集団でこのようなジレンマに遭遇した場合、どのような行動原理を示すのでしょうか。それについては、また次に説明したいと思います。
Next: 社会的ジレンマ
「ねえ、先生。人間が適応して生き抜くためには、応報戦略を取るのが一番なんだよ。だから、僕に協力しなきゃ!単位ちょうだい」
「なにいってんだ。この前お前レポート持ってこなかっただろ。お前は俺を裏切ったんだから、俺もお前を裏切る。それが応報戦略ってもんだろ?」
‐‐‐‐‐‐‐脚注
1. 特に14人が作成した戦略プログラムを「実験群」、ランダム戦略プログラムを「統制群」と言います。統制群を実験に取り入れることで、説明したいデータが本当に効果が出ているのかを示すことができるようになります。
例えば、人間には「偽薬(プラシーボ)効果(薬みたいなものを飲むという気分だけで、まるで薬が効いているかのような現象が起きること)」というものが備わっていて、その薬の本当の効用を調べるには、その薬を飲むだけでは測ることはできません。そのためには、「統制群」である「ただのビタミン剤」を飲んでいるデータが必要になります。
この実験の場合は、「ランダム戦略」という何も考えずに本能のまま行動を起こすという戦略にならない戦略が「統制群」となっています。いくら最も高い成績を収めても何も考えない戦略に負けてしまっては意味がないですね。