脳 Brain, No Life(仮)

とあるニューロベンチャー企業の研究員のつぶやきを記録するブログ

訳語について(3)

 

くり返しゲームについても理論面、実験面からさまざまな研究が進んでいます。

 

1回限りの囚人のジレンマゲームでは、ナッシュ均衡を求めるという理論的な分析からは、お互いに「自白する」を選んで、パレート劣位な利得配分が実現するという結果になってしまいます。

 

しかし、ゲームをくり返しおこなうと、協調する余地が生まれ、お互いに黙秘する(C戦略を取り合う)という結果が均衡点として実現しうるのです。

 

有名なのは、政治学者アクセルロッドによる研究です。彼は、他の研究者たちに呼びかけ、くり返し囚人のジレンマをプレイするプログラムによるトーナメント大会を実施しました。プログラム同士に囚人のジレンマをくり返しプレイさせ、どんなプログラム(プレイヤー)が、もっとも多くの利得を稼ぐのかを調べようとしたわけです。

 

研究者たちは、シンプルなプログラムから、いろいろな趣向を凝らした複雑なプログラムまで、様々なプログラムを案出しました。

 

その中で、シンプルなアルゴリズムに則った挙動を示すとあるプログラムが優秀な成績を残したことが注目を集めました。

 

そのプログラムは、最初のターンでは協調する「C」戦略を選び、その後は相手がひとつ前のターンで選んだ戦略を選ぶという行動パターンをとります。

 

このプログラムは「tit-for-tat(TFT)」という名前がつけられました。

「しっぺ返し」という意味です。

 

プログラムは、自分につけられた名前を気にしないので構わないのですが、生身の人間が、戦略を練る場合、「しっぺ返し」という名前は感心できません。

 

これも「やられたらやり返す」という非中立的な意味合いのあるコトバだからです。

 

 

なので(慎重な)ゲーム理論家は、「tit-for-tat」を「しっぺ返し」戦略と呼ぶ代わりに、「オウム返し」戦略や「お返し」戦略と呼びます。

 

こうすると、相手がひとつ前にとった行動をくり返すだけ、という中立的な意味合いになるからです。

 

くり返しゲームを生身の人間にプレイさせる場合、戦略の選択肢として、

「しっぺ返し戦略を選びますか?」と参加者に尋ねる場合と、「オウム返し戦略を選びますか?」と尋ねる場合があったとしたら、参加者の心理面にある種の影響を及ぼしてしまう懸念のあることには、みなさんも同意してくださることと思います。