Spieltheorie
Gefangenendilemma
Warum zwei rational handelnde Akteure sich gegenseitig schaden, obwohl Kooperation beide besserstellen würde.
Definition
Das Gefangenendilemma ist das Grundmodell der nicht-kooperativen Spieltheorie. Zwei Akteure wählen unabhängig zwischen Kooperation und Defektion. Defektion ist für beide die strikt dominante Strategie, sodass beide im schlechteren Gleichgewicht (gegenseitige Defektion) landen, obwohl gegenseitige Kooperation überlegen wäre.
Struktur
Die definierende Ungleichung lautet T > R > P > S: T = Versuchung (defektieren, während der andere kooperiert), R = Belohnung für gegenseitige Kooperation, P = Strafe für gegenseitige Defektion, S = „Trottelauszahlung" (kooperieren, während der andere defektiert). Weil Defektion unabhängig von der Wahl des Gegenübers die höhere Einzelauszahlung bringt, defektieren beide rationalen Spieler — und erhalten P statt des besseren R. Es ist ein symmetrisches Variable-Summen-Spiel mit einem einzigen, suboptimalen Nash-Gleichgewicht.
Wann es auftritt
Überall dort, wo kurzfristige Eigeninteressen die langfristige gemeinsame Stabilität untergraben: Preiskriege in Oligopolen, Wettrüsten, Umweltverschmutzung, das Scheitern internationaler Abkommen. Wenn jeder Akteur einen Anreiz hat zu „betrügen", obwohl alle gemeinsam besser kooperieren würden.
Hebelpunkte
Die Auszahlungsmatrix oder die Spielregeln ändern, damit Kooperation rational wird: Iteration (wiederholtes Spiel ermöglicht Reziprozität und Reputationsaufbau und erhöht die Kosten der Defektion), externe Durchsetzung (Regulierung/Strafen senken die Versuchungsauszahlung unter die Belohnung) und bindende Verträge oder Schiedsverfahren, die die dominante Defektionsstrategie eliminieren.
Beispiele
Zwei Konkurrenten, die Preise senken, bis beide kaum noch Marge haben; Staaten, die aufrüsten, weil keiner dem anderen traut; Fischereiflotten, die einen gemeinsamen Bestand überfischen. Der N-Spieler-Fall wird zur Tragik der Allmende.
Auszahlungsmatrix
| Spieler 2: Kooperieren | Spieler 2: Defektieren | |
|---|---|---|
| Spieler 1: Kooperieren | (Belohnung, Belohnung) | (Trottel, Versuchung) |
| Spieler 1: Defektieren | (Versuchung, Trottel) | (Strafe, Strafe) |
T > R > P > S — Defektion dominiert, das Gleichgewicht (Strafe, Strafe) ist für beide schlechter als (Belohnung, Belohnung).
Baue dieses Muster als Wirkungsdiagramm und simuliere es.
Verwandte Konzepte
Quellen: von Neumann & Morgenstern (1944), Theory of Games and Economic Behavior