Spieltheorie
Die Theorie der Spiele und die Praxis des Wirtschaftens
„Sobald (die Zahl der Spieler) n > 1 ist, hängt das Schicksal eines jeden Spielers außer von seinen eigenen Handlungen auch noch von denen seiner Mitspieler ab, und deren Benehmen ist von genau denselben egoistischen Motiven beherrscht, die wir beim ersten Spieler bestimmen möchten“[1]. V. Neumann stellt bezüglich dieser unterstellten Motive nachdrücklich den Bezug zur klassischen Nationalökonomie her („homo oeconomicus“, ebenda, Fn. 2). Jedem Spieler wird unterstellt, die ihm zur Verfügung stehenden Strategien unter Vorwegnahme der Reaktionen des Gegners so anzuwenden, daß die mit den Strategien verbundenen Auszahlungen ihr Maximum erreichen. Von einigen späteren Vertretern der Spieltheorie wie Selten und Ockenfels[2] wird dies aus einer tief verwurzelten Abneigung gegen die „homo-oeconomicus“-Hypothese heraus insbesondere experimentell zu widerlegen versucht.
Der durch von Neumann hier ins Spiel gebrachte Zirkelgedanke war nicht neu: Bereits etwa 45 Jahre zuvor verwendete ihn Bertrand, allerdings um Cournots Dyopol-Modell zu widerlegen, wie soeben bemerkt. Gerade der Zirkelgedanke diente Bertrand zum Plausibilitätsnachweis für die Abwesenheit eines von wirtschaftlichen Erwägungen geprägten Ablaufs der Aktionen und Reaktionen im Cournot-Modell. So wird Bertrand sowohl in „Zur Theorie der Gesellschaftsspiele“ als auch in „Theory of Games and Economic Behavior“ beschwiegen. Letztlich überwältigend neu ist daher auch der Gedanke der Antizipation „gegnerischer“ Verhaltensweisen nicht, die Unterschiede zwischen neoklassischen Modellen und spieltheoretischen Modellen ergeben sich lediglich aus den Abweichungen der jeweilig unterstellten Marktformen, wenn es den Spieltheoretikern gelingt, ihre Spielsituationen tatsächlich in Marktgeschehen zu interpretieren (schließlich hat Bertrand seine Cournot-Kritik ja auch aus der neoklassischen Gedankenführung abgeleitet[3]. Der Grundgedanke der Strategieantizipation läuft z. B. ins Leere, wenn, gesetzt den Fall, Spieler seien einerseits Produzenten und andererseits Konsumenten, die Zahl der Spieler auf jeder Seite, angenommenen, 100 übersteigt und die Frage aktuell wird, wie weit man noch von der Marktform der vollkommenen Konkurrenz entfernt ist, wo die Bedeutung der Strategie eines Einzelnen gegen Null geht. Das Modell ist dann ökonomisch bedeutungslos, aber mathematisch immer noch zu lösen bzw. lösbar. In der Frage der Dienstbarkeit für die Ökonomie bietet die Spieltheorie lediglich Lyrik. Entfernt man sie, bleiben Skelette von Logicals, die durchaus ihre Bedeutung in der Denkschulung haben - ähnlich der auf Glücksspielbasis beruhenden Wahrscheinlichkeitstheorie, die im wirtschaftswissenschaftlichen Studium indessen gemeinsam mit der Statistik in der Propaedeutik des Vorstudiums geboten wird.
1.1.1 Strategien/Reaktionen, Abbildung der Ergebnisse
Eine einfache Form der Abbildung eines „gegnerischen“ Verhaltens in der Neoklassik ist die Marshallsche Preis-Absatzfunktion, die im Falle eines Anbieters und sehr zahlreicher Nachfrager dem Anbieter ein Bild über seine Möglichkeiten der Angebotssteuerung gibt. Sie klärt ihn über den für ihn erzielbaren Preis pro verkauftem Stück bei einer bestimmten abzusetzenden Menge auf, denn sie entspricht der aggregierten Nachfragefunktion der Konsumenten. Damit liegen auch die „Strategien“ der Konsumenten offen insoweit als kundgetan ist, dass sie auf eine Mengenverknappung des Produzenten (Produzentenstrategie a) mit der Bereitschaft, höhere Preise zu akzeptieren, reagieren (Konsumentenstrategie a‘) und auf die Gegenstrategie des Produzenten b (Mengenerhöhung) mit ihrer Gegenstrategie b‘ (Preissenkung). Im Vergleich entspricht diese Situation dem Wesentlichen der Theorie der Spiele: Jeder Spieler hat bei der Auswahl seiner Strategie die für ihn günstige Option ebenso zu antizipieren wie die für ihn ungünstige. Für beide Parteien lassen sich die mit ihren Strategien verbundenen „Auszahlungen“ definieren: Bei bekannter Kostenkurve sind dies für den Produzenten die sich ergebenden Gewinnveränderungen, auf Konsumentenseite sind dies die Veränderungen der Konsumentenrente gemäß den Bewegungen auf der Preis-Absatzfunktion.
Studenten lernen jedoch, dass diese Art der Abbildung obsolet sei, da sie die „Interaktion“ zwischen den Marktteilnehmern (hie Produzenten, da Konsumenten) nicht erfasse: „Es ist … hilfreich, das Wesen der Spieltheorie als interaktiver (oder interdependenter) Entscheidungstheorie von Anbeginn an zu verstehen, wenn man sie der gängigen (und allgemein akzeptierten) Entscheidungstheorie gegenüberstellt“. Mit „gängiger Entscheidungstheorie“ ist die analytische Methode unter einer Maximierungshypothese gemeint. „Wenn die spieltheoretische Methode also erlaubt, sowohl die für die Ökonomik charakteristische Rationalitäts- wie die Gleichgewichtsanalyse auf interaktive Entscheidungsprobleme zu erweitern, wird diese eine enorme Ausdehnung der Anwendung ökonomischer Methodologie mit sich bringen“[4]. Diesen Anspruch einzulösen unternimmt die Spieltheorie im wesentlichen durch Entwürfe von Versuchsanordnungen verschiedenster Art.
1.1.2 Beispiele
Ausgangspunkt ist eine Spielbeschreibung, die die Entscheidungssituation, die verschiedenen Strategien der Spieler und die mit diesen verbundenen Auszahlungen zum Gegenstand hat. Den Spielern sind dabei auch die Gegenstrategien und die damit verbundenen Auszahlungen bekannt. Spiele können wiederholt werden, wenn die jeweilig ergriffenen Strategien nicht zu Lösungen führen, für deren Änderungen keiner der Spieler einen Grund sieht. Ob diese „stabilen“ Lösungen auch andere wünschenswerte Kriterien einhalten (z. B. Pareto-Optimalität, Verwirklichung der maximal möglichen Auszahlung), wird zu prüfen sein. Zum Einstieg in die Problematik wird gerne die Konstruktion des „Gefangenen-Dilemmas“ gewählt, wenngleich sie nicht offenkundig ein wirtschaftliches Problem behandelt:
Zwei Delinquenten, die gemeinsam eine Straftat begangen haben, sitzen zu jeweils getrennten Verhören ohne die Möglichkeit der Kontaktaufnahme zueinander im Gefängnis. Jeder von Beiden hat die Möglichkeit, die Tat zu leugnen oder zu gestehen. Ein Geständnis eines Gefangenen wird mit einem Kronzeugenbonus belohnt, wenn der andere Gefangene hartnäckig leugnet und mit dem Geständnis des anderen Gefangenen überführt werden kann.
Die Strategien und die mit ihnen verbundenen Auszahlungen für jeden Gefangenen sind in einer Bimatrix darzustellen (mehr als zwei Spieler erfordern andere Schreibweisen).
Strategien des Gefangenen 1 (grün) sind horizontal zu lesen, die des Gefangenen 2 rosa) sind vertikal zu lesen; es bedeuten jeweils a: leugnen und b: gestehen. Die Auszahlungen für jeden Spieler hängen davon ab mit welcher Strategie des Gegners die eigene Strategie zusammentrifft:
Auszahlungen:
für Gefangenen 1 bei Strategie a: 4, wenn beide leugnen, 1, wenn der Gefangene 2 leugnet;
für Gefangenen 1 bei Strategie b: 5, wenn Gefangener 2 leugnet, 2, wenn beide gestehen. Spiegelbildliches gilt für den Gefangenen 2.
Ein deutlicher Kronzeugenbonus ist erkennbar gegenüber dem beiderseitigen Gestehen.
Spieltheoretisch wird die Lösung und das stabile Gleichgewicht für dieses Problem in der Strategiewahl „Gestehen“ für beide Gefangenen gesehen, wobei der Nutzen von jedem „2“ beträgt, weil sie die vernünftigste Antwort auf eine mögliche Wahl der Strategie b des Gegenspielers sei. Sie wird als diejenige bezeichnet, die sich bei erstrebtem Gewinnmaximum beider Spieler einstellt, aber auch als die, die nicht Pareto-optimal ist (nach der Summe der Auszahlungen wären [4/4], [1/5] und [5/1] überlegen[5]. Auch die Auffassung, dass mit dieser Lösung das Streben nach Gewinnmaximum erfüllt sei (z. B. durch Beschreibung der Handlungsmotive in einer Nutzenfunktionen der Spieler und deren Anwendung zur Ermittlung der besten Handlungsmöglichkeit) muß bei der hier besprochenen Methode genauso hinterfragt werden wie das in den Modellen der Neoklassik geschieht.
Liegt in diesem Beispiel ein Fall des Abwägens der eigenen Strategien durch eine Bewertung anhand der gegnerischen Optionen vor? Mag Mancher sich mit Wohlbehagen die unterstellte Situation der Gefangenen für zwei Kollaborateure im Cum-ex-Skandal vorstellen, er hätte im Rahmen unseres Themas gleichwohl zu belegen, welcher ökonomischen Situation die weiteren Erwägungen der Gefangenen entsprächen. Es sind nicht die Gefangenen, die den Spielausgang durch ihr Abwägen in einem Rationalitätskalkül ermittelt haben, sondern der Spieldesigner, der beiden Gefangenen symmetrische Strategien vorgelegt hat und bei beiden Gefangenen eine Strategie (b) hat stark über die andere (a) dominieren lassen: Sowohl bei der gegnerischen Strategie a als auch bei der Gegenstrategie b verspricht die eigene Strategie b einen höheren Auszahlungswert. Die Anwendung der reinen Logik ließ den Spielern keinen anderen Ausweg. Da die Spieltheorie den Grundsatz, niemals eine unterlegene Strategie zu ergreifen, lehrt[6], fällt die Strategie a bei allen beiden Gefangenen unter den Tisch. Werden aber die eigenen dominierten Strategien von vornherein nicht ergriffen, sind sie auch in der Entscheidung selbst nicht abzuwägen, es entfällt im Gefangenendilemma daher für beide Gefangenen die Strategie a, das Leugnen. Es ist aus diesem Grunde auch obsolet, nach einer der „Entscheidung“ zugrunde liegenden Rationalität zu fragen, da das Ergreifen der Handlungsmöglichkeit b nicht auf deduktivem Weg begründet ist. Wenn Strategie a aufgrund der Anwendung des Dominanzprinzips bei beiden Gefangenen aus den Handlungsmöglichkeiten fällt (wie das im übrigen auch die reine Lehre der wirtschaftlichen Entscheidung und die betriebswirtschaftliche Entscheidungstheorie vorsehen[7], bleibt ja nur übrig, die Strategie b zu ergreifen. Weder eine einzelwirtschaftliche noch eine kollektive Rationalität lässt sich hieraus ermitteln, demzufolge auch keine Antinomie zwischen beiden im Falle dieses Spiels[8]: „Widerspruch zwischen individueller und kollektiver (d. h. gesellschaftlicher) Rationalität“ ist so nicht festzustellen. Wo beide Spieler notwendigerweise ihre in der Dominanzsituation verbliebene Strategie anwenden, ist auch für eine andere Deduktion aufgrund von „Interaktion“ kein Raum.
Eine unter ökonomischen Gesichtspunkten realistisch beschriebene Entscheidungssituation des Gefangenendilemmas wäre die folgende: Der Entscheider hat zwei Handlungsmöglichkeiten, deren jeweiliger Ausgang ungewiss ist, denn jede Handlungsmöglichkeit erbringt je nach eintretender Zukunftslage ein günstiges oder ein ungünstiges Ergebnis. Er weiß, dass die Zukunftslagen vom Verhalten des Konkurrenten abhängen, hat aber keine genauere Erkenntnis über Art, Auswirkung und Wahlwahrscheinlichkeit der Maßnahmen. Nach entsprechenden, sorgfältigen Recherchen kann er seine Handlungsmöglichkeiten wie folgt beschreiben: Handlungsmöglichkeit a erbringt eine Chance von 4 : 1, Handlungsmöglichkeit b erbringt eine Chance von 5 : 2. Er überprüft das Ergebnis seiner Ermittlungen und bleibt überzeugt, daß er keine Fehler gemacht hat. Auch weiteres Nachdenken über die Eintrittswahrscheinlichkeit der Zukunftslagen und das eigentliche Messen der Handlungsergebnisse an der Zielfunktion kann er sich sparen: Die Handlungsmöglichkeit b ist der Handlungsmöglichkeit a auch ohne Anwendung einer Zielfunktion überlegen, denn sowohl in der günstigeren Zukunftslage als auch in der ungünstigeren Zukunftslage bringt sie ein höheres Ergebnis als Handlungsmöglichkeit a. Im Ergebnis fällt Handlungsmöglichkeit a allein durch Anwendung logischer Grundsätze aus; es findet keine Entscheidung statt. Die Anwendung von Logik zur Problemlösung ist keine Entscheidung im Sinne des Bewertens einer erwirtschafteten Zielgröße an der Handlungsmaxime zur Erreichung dieser Zielgröße (vgl. oben, S. 27 ff.)! Die Anwendung von Logik erübrigt die Entscheidung. Das Gefangenendilemma und seine Lösung bringen keinen ökonomischen Erkenntnisgewinn. Da voraussetzungsgemäß die Spieler als Gewinnmaximierer gelten, ist auch die Erörterung der Frage, welcher Art Gleichgewicht die Lösung erbracht habe, völlig unerheblich.
Mit der Gestaltung solcher Spiele, deren Ausgänge nichts Anderes erbringen können als die zuvor gemachten Voraussetzungen zulassen, kann daher nicht viel bewiesen werden, denn sie werden ihrer Natur nach niemals realisiert, sie sind Gedanken-„Spiele“ und nicht falsifizierbar. Sie sind allerdings nicht gegen logische Ungereimtheiten gefeit.
Auch die Ausgestaltung der Strategie b als z. B. schwach dominierende durch Streichung des „Kronzeugenbonus“ (Absenkung der Auszahlung für b in Kombination mit a auf 4 und in Kombination mit b auf 1) – d. h., die Strategien wären nicht mehr symmetrisch - erbrächte kein anderes Urteil über die Lehrkraft dieses Spiels, denn dominant ist dominant. Mit der unverändert sich ergebenden Lösung (b/b) wäre die Auszahlung von (2/1) realisiert.
Eine rationale Entscheidung ist die, welche sich aus der Anwendung einer Zielfunktion zur Auswahl einer Handlungsmöglichkeit unter mehreren ergibt. V. Neumann hatte keine Bedenken, den Spielteilnehmern das Streben nach höchstmöglicher Auszahlung bei ihrer Strategiewahl zu unterstellen. Das scheint jedoch noch nicht erschöpfend das (Nicht-)Verhalten der Spieler in Gefangenendilemma zu beschreiben. Bei weiteren Überlegungen dazu sind nicht nur Argumente der Logik anzuführen, sondern ganz wesentlich auch solche der Realitätsnähe – schließlich ist die Spieltheorie unter dem Banner angetreten, der Neoklassik mit der Betrachtung von Interaktionen der Beteiligten mehr Realitätsnähe entgegenzusetzen.
Unter diesem Gesichtspunkt eignet der Lösung des „Gefangenendilemmas“ mit der jeweils zweitschlechtesten Auszahlung unter allen Möglichkeiten keine Überzeugungskraft, obwohl das Spiel mit diesem Ergebnis als nicht wiederholbar und damit stabil gilt. Dem Leser ist angesichts der Handlungsmöglichkeiten „Leugnen“ oder „Bekennen“ klar, dass die Gefangenen Straftäter sind, die Möglichkeit einer unschuldig zu verbüßenden Haft scheidet aus (allerdings unglaubwürdigerweise auch die Verbüßung einer angemessenen Freiheitsstrafe, denn die einzig möglichen Ausgänge bestehen in positiven Auszahlungen). Die Risikozuneigung, die sie beim Begehen ihrer Straftat ausgezeichnet hat, ist offenbar einem extremen Sicherheitsbedürfnis gewichen. Dies gilt nicht nur für jeden Gefangenen für sich genommen, sondern auch für die Einschätzung, die jeder durch den anderen genießt. Das Spiel bietet keinen Raum für die Abbildung einer Risikoneigung. Sie spielt nur insoweit eine Rolle, als man beiden Delinquenten dieselbe Risikoneigung unterstellen muss. Wegen Auswirkungen des Nachdenkens eines Gefangenen über die Risikoneigung des anderen für das Spiel verweisen wir auf Schneider[9].
Man möchte diesem „Lehrbeispiel“ schon deswegen keinen ökonomischen Bezug bescheinigen, um ökonomisch Denkende und Handelnde nicht in die Nähe der hier betrachteten Idividuen zu rücken (wenngleich diese Grenzziehung im Juli 2021 nicht mehr so leicht fallen mag). Es ist doch geradezu die Aufgabe eines Unternehmers, für die die ökonomische Wissenschaft veranstaltet wird, sich nicht einfach mit einem Gleichgewicht zufriedenzugeben, bloß weil es ein Gleichgewicht ist. Sein Streben müß die Schaffung eines neuen Ungleichgewichts sein, das weitere Entwicklungen ermöglicht.
Das Rationalitätsversprechen, das die Spieltheorie abgibt, ist bis hierhin nicht eingelöst. Wir wenden uns daher einem eher für die ökonomische Problematik „designten“ Modell zu, das unter dem Stichwort „Weichen oder Bleiben“ behandelt wird.
1.1.3 Spieltheorie – ungewisse Strategien
Das Modell des Gefangenendilemmas sollte folgende Ungewissheit abbilden, was es jedoch nicht tat: Der Spielgegner hat zwei Strategien, von denen der Spieler nicht wusste, welche jener ergreifen würde. Wenn der Gegner die eine Strategie ergriff, würde die andere Strategie vollständig bedeutungslos. Für die Strategien a oder b bestand jeweils die Wahrscheinlichkeitsverteilung (0, 1) oder (1, 0) ohne Zwischenwerte (wegen der für beide Spieler gegebenen dominanten Strategien ging diese Un-terscheidung allerdings ins Leere).
In einem Spiel „Weichen oder Bleiben“ soll die Situation zweier Unternehmen abgebildet werden, die auf einem einheitlichen Markt für ihr identisches Produkt tätig sind, der eigentlich nur einem von ihnen ein Auskommen bietet. Als Strategien der Unternehmer sind a „Marktaustritt“ und b „Bleiben im Markt“ mit den damit verbundenen Konkurrenzverlusten, wenn der Gegenspieler ebenfalls im Markt verbleibt. Das Spiel ist, wie das Gefangenendilemma, symmetrisch, hat aber keine dominanten Strategien. Beim Spiel „reiner“ Strategien erhalten wir die nachstehende Auszahlungsmatrix:
Die Auszahlungen nach Strategie a für den Oberwirt (grün) sind horizontal zu lesen, diejenigen für den Unterwirt (rosa) vertikal.
Das Spiel hat zwei Lösungen:
- Oberwirt weicht vom Markt, Unterwirt weicht nicht mit Auszahlungen (100/300) und
- Oberwirt weicht nicht vom Markt, Unterwirt weicht mit Auszahlungen (300/100),
die sich allein nach Plausibilitätsannahmen richten: Da die Marktteilnehmer voraussetzungsgemäß keine Absprachen treffen können und Vorüberlegungen über die Risikobereitschaft des Gegenspielers wegen des v. Neumannschen „Zirkels“ die Lösung (b/b) mit dem beiderseitigen Existenzverlust enden könnte, ist dieses Lösungspaar nicht unwahrscheinlich, aber auch nicht mehr. Sie ist jedoch mathematisch möglich, obgleich sie eine (stillschweigend gesetzte) Nebenbedingung des Spiels verletzt, nämlich die Deckung des fortbestehenden Bierbedarfs der Bevölkerung. Unter Rationalitätsgesichtspunkten betrachtet: Dieses Spiel erlaubt keine Deduktion einer zielentsprechenden Lösung, denn Ziele, mit Berücksichtigung auch einer Risikoneigung, spielen keine Rolle. Gleichwohl geht die Spieltheorie von zwei Lösungen aus und bezeichnet diese als Nash-Gleichgewichte[10]. Auch in diesem Spiel sind jedem Spieler Strategien und deren Auszahlungen, auch die für den Spielgegner, bekannt. Da sie in ihren Strategien die der Spielgegner antizipieren, wissen auch sie, welches Ergebnis sie (mathematisch) damit festlegen. Es wird behauptet, in der ökonomischen Welt kämen solche Entscheidungssituationen als Überlebenskämpfe in schrumpfenden Märkten sehr häufig vor. Wenn das so ist, so kann die Spieltheorie zur Lösung solcher Situationen nichts beitragen. Die Spieltheorie bietet zwei einander widersprechende Lösungen an (Gleichgewichte) die nach der Logik der Spieltheorie gleichzeitig nebeneinander Bestand haben müssen: Sowohl Oberwirt als auch Unterwirt sind also zugleich weichende als auch bleibende Gastwirte (also Lösungen, die auch [a/a] und [b/b] entsprechen. So bewirkt die interaktive Lösung gleichsam die Aufhebung der Aufgabenstellung. Die ganze Szenerie scheint der Ökonomie Absurdistans entnommen zu sein.
Mit der Berücksichtigung gemischter Strategien könnte eine Öffnung zu mehr Raum für die Anwendung von Zielvorstellungen der Spielteilnehmer entstehen und damit Raum für die Anwendung deduktiver Theorien zur Entscheidungsfindung.
Gesetzt den Fall, die Wirte setzten hinsichtlich ihrer Strategien nicht mehr auf die Entweder-/Oder-Alternative, sondern der Oberwirt sähe für seine Strategie a die Wahrscheinlichkeit 20% und für seine Strategie b die Wahrscheinlichkeit 80%, hingegen der Unterwirt für seine Strategie a die Wahrscheinlichkeit 40% und seine Strategie b die Wahrscheinlichkeit 60%, zeigte sich folgendes Bild (den Kontrahenten sollen die wechselseitigen Wahrscheinlichkeiten nicht bekannt sein):
Aufteilung der Wahrscheinlichkeiten (Strategiemischung):
und daraus die Tabelle der Auszahlungserwartungen bei gemischten Strategien, die, da die Spieler unterschiedliche Wahrscheinlichkeiten für ihr Strategiemischung gewählt haben, nicht mehr ein Nullsummen-Spiel ist:
Hiernach sind die Strategien a des Oberwirts und a des Unterwirts äquivalent. Daneben dominiert die Strategie b des Oberwirts die Strategie b des Unterwirts schwach. Was bedeutet das für die möglichen Lösungen/Gleichgewichte?
Der Unterwirt wird die Strategie b nicht ergreifen, da dieselbe Strategie vom Oberwirt dominant ist. Seine Strategie a ist die ihm einzig verbliebene Lösung „Weichen“. Damit ist (b/a) die Lösung, an deren Veränderung keiner der Spieler mehr Interesse hat, sie ist stabil, jedoch nicht Pareto-optimal.
Wie am Beispiel gesehen, kann man in der Spieltheorie mit gemischten Strategien rechnen, aber auch ziemlich weit an einem ökonomischen Entscheidungsproblem vorbei argumentieren. Wer weicht, bleibt nicht noch ein bisschen da. Die Strategie „Weichen“ kann, wenn sie erwogen wird, für das Entscheidungsproblem nur die Wahrscheinlichkeit 1 erhalten und damit die Strategie „Bleiben“ nur den Wert 0. Soweit das Urteil der deduktiven Theorie. Im Spiel könnte eine gemischte Strategie durch Wiederholungen des Spiels fingiert werden, um den Gegenspieler vor jeder Wiederholung in die Ungewissheit zu stürzen, ob man Strategie „Weichen“ oder Bleiben“ anzuwenden gedenkt). In der hier gewählten Darstellung scheidet diese Möglichkeit aus, weil die gefundene Lösung stabil ist und keine Wiederholung erlaubt.
Für ein ähnlich gelagertes Spiel (Elfmeter-Duell mit den Strategien des Schützen „Schuss nach links“ bzw. „Schuss nach rechts“ und des Torwarts „Flug nach links“ bzw. „Flug nach rechts“), das allerdings seiner Natur und seinen Voraussetzungen gemäß wiederholbar ist und die Wahrscheinlichkeiten damit den Charakter bekannter Häufigkeitsverteilungen erlangen, haben Leininger und Amann gezeigt, dass die Auszahlungserwartungen der Spieler sich mit einer Änderung des Mischungsverhältnisses beider Strategien nicht verändern[11]. Obiges Beispiel bestätigt dieses Ergebnis nicht, was daran liegen kann, dass im obigen Beispiel kein Raum für die Anwendung des Unabhängigkeitsprinzips bleibt.
Im Sinne der einzelwirtschaftlichen Entscheidungstheorie ist eine Strategie eine Handlungsmöglichkeit, und eine Handlungsmöglichkeit kann je nach Zukunftslage mehrere Ergebnisse erbringen, deren Eintrittswahrscheinlichkeiten zu ermitteln sind. Jedoch berührt das Problem der gemischten Strategie nicht die Frage nach der Eintrittswahrscheinlichkeit der Auszahlungen, sondern die Frage der Formulierung von Handlungsmöglichkeiten: „Damit die Notwendigkeit einer Wahl zwischen Handlungsmöglichkeiten eintritt, muss der Fall ausgeklammert werden, dass die Handlungsmöglichkeiten nebeneinander verwirklicht werden können. Ein Zwang, sich zu entscheiden, besteht bei jeder einzelnen Handlungsmöglichkeit darin, sie auszuführen oder sie zu unterlassen. Bei mehreren Handlungsmöglichkeiten sind einzelne Handlungsmöglichkeiten zu sich gegenseitig ausschließenden Handlungsprogrammen zusammenzufassen“[12] Schneider, Dieter, Informations- und Entscheidungstheorie, a. a. O., S. 25, Hervorhebungen im Original). In der Praxis würde dieser Fall wie in unserer Darstellung auf S. 305 ff. mit den Handlungsmöglichkeiten A1, A‘1 und A‘‘1 gelöst werden.
Unabhängig davon, ob die Strategie a mit einer Wahlwahrscheinlichkeit (W) von 0 ≤ W ≤ 1 und die Strategie b mit der Restwahrscheinlichkeit angenommen werden, bleiben hier die Auszahlungen der Strategien „sicher“. Es ist daher weiter zu fragen, welche Folgen die Annahme hätte, die voraussichtlichen Auszahlungen seien selbst ungewiss. In der Spieltheorie wurde diese Frage von Harsanyi/Selten aufgegriffen für den Fall, dass dem Spieler i die Auszahlungen aller übrigen Spieler ≠ i unbekannt seien, über die eigenen habe er jedoch genaues Wissen[13]. Sie hatten hierfür ein Verfahren für eine Problemreduktion vorgeschlagen, das im Angesicht des Zwangs in der Spieltheorie eine Gleichgewichtslösung ermitteln zu müssen, an deren Veränderung keiner der Spieler mehr ein Interesse hat, verständlich sein mag. Der Lösungsbeitrag für ökonomische Entscheidungsprobleme ist, wie schon die Formulierung der Ausgangssituation zeigt, eher gering. Was hat man sich unter der dem Spieler i vollständig bekannten eigenen Auszahlungsverteilung vorzustellen, offenbar ist sie völlig ohne Rekurs auf die Auszahlungsverteilungen der übrigen Spieler gebildet, was sie unter diesen Umständen helfen soll, das bleibt Stochern mit der Stange im Nebel.
1.1.4 Abbildungsunterschiede zur ökonomischen Theorie
1.1.4.1 Entscheider
Wie gesehen, beginnt die ökonomische Entscheidungstheorie mit dem Haushalt oder dem Produzenten, der sich einem Markt gegenübersieht, auf dem alle Teilnehmer ihr Verhalten in einer eindeutigen Beziehung zwischen (nachgefragter bzw. angebotener) Menge eines Gutes und dessen von der Menge abhängigen Preis beschreiben und auf dem kein Einzelner in der Lage ist, Menge oder Preis zu beeinflussen. Das mathematische Handwerkszeug, in diesem Spannungsfeld von „hoher Preis, viel Angebot, aber wenig Nachfrage“ und „niedriger Preis viel Nachfrage, aber wenig Angebot“ das Leben nicht als Verschwender oder Hungerleider zu fristen, lag mit der Analysis (von Newton und Leibniz unabhängig voneinander entwickelt) vor. Die Zusammenhänge sind bei Inkaufnahme entsprechender einschneidender Voraussetzungen wie unendliche Teilbarkeit der Güter, vollständige Austauschbarkeit der Güter in kleinsten Mengen, störende ceteris-paribus-Bedingungen, instruktiv in Kurvendarstellungen (z. B. Parabeläste) zu zeigen und Optimalitäts- oder Gleichgewichtssituationen als Schnittpunkte, Tangentialpunkte oder auch als Flächen, die zwischen der Kurvenlinie und einer Kostenfunktion gebildet werden, darzustellen. Analytisch lassen sich die gleichen Ergebnisse durch die Methode der Infinitesimalrechnung veranschaulichen. Auf diese Weise wurde die ökonomische Wissenschaft bis in die erste Hälfte des 20. Jahrhunderts betrieben und auch das allseits beliebte, weil gesellschaft-lich tolerable Pareto-Optimum abgeleitet.
Die Analysis als Methode setzt die Einzelperson nicht voraus, um die Zusammenhänge zwischen Preisen und Mengen im Markt zu erörtern. Schon der Begriff „Haushalt“ legt nahe, an eine Theorie für die Ableitungen optimaler Konsumentscheidungen für eine Gemeinschaft zu denken. Auch bezüglich des Unternehmertums widerlegt spätestens seit Gründung der Kolonialgesellschaften und Schiffskonsortien die Empirie das Bild des einsam und unbeeinflusst von Anderen wirtschaftenden Unternehmers, für den eine Theorie zu entwerfen sei. Die Leistungsfähigkeit der Methode liegt in der Aufgliederung des ökonomischen Kalküls über den reinen Wirtschaftlichkeitsgrundsatz hinaus. Bewertung wird verstanden als ein Vergleich von Differenzen (mathematisch betrachtet: unendlich kleinen Differenzen) beim Übergang der betrachteten Variablen von einem Zustand zu einem nächsten Zustand. Wir haben bei der Erörterung der Pigou-Steuer gesehen, daß auch die Methoden der Neoklassik nicht vor dem Problem der „Interaktion“ (hier zwei Handelnde) kapitulieren muss.
Wie die neoklassische Theorie so wären auch die Modelle der Spieltheorie ohne eine vorgefundene mathematische Grundlage und ohne die elektronischen Möglichkeiten, zahlreiche iterative Prozesse in vertretbarer Zeit ablaufen zu lassen nicht reussiert. Auch die Spieltheorie hat ihre Entwicklung mit der Einschränkung ihrer Problemstellungen auf die durch die Rechenweisen vorgeschriebenen Modellstrukturen bezahlt. Der Begriff der Interaktion erfordert zweierlei: Es existiert neben dem ersten Entscheidenden ein zweiter, darüber hinaus wird dieser zweite auf die Handlung des ersten seinerseits mit einer Handlung reagieren, was der erste Entscheidende in seiner Handlung (Strategie) zu berücksichtigen hat. Es spielen daher beide dasselbe Spiel, haben also eine identische Aufgabenstellung. Wo ist das sonst noch zu finden? Dies wird als die entscheidende Abweichung von der Neoklassik herausgestellt, die den Gegenüber nur als anonymisierten Markt kenne, dessen Teilnehmer ihr Reaktionen auf Preis- oder Mengenänderungen des Handelnden bekanntgegeben hätten und sich daran hielten, wenn dieser eine Maßnahme ergriffe. Von Neumann nennt diese Abhängigkeit von Strategien Dritter einen „Zirkel“, denn theoretisch kann sich das Problem jede eigene Aktion auf weitere gegnerische Aktionen einzustellen, bis in die Unendlichkeit perpetuieren. Für einzelne Situationen des wirtschaftlichen Lebens mögen sich Vorteile gegenüber der Neoklassik aus einer geeigneteren Realitätsabbildung ergeben, sie dürften aber eine Ausnahme bleiben.
Diese auf der Grundlage der Spieltheorie entwickelten „ökonomischen“ Entscheidungsmodelle benötigen Vorgaben an die Spieler über die zu lösende Aufgabe, die Strategien der Spieler, wobei es sich für die Spieler jeweils um gleichlautende Strategien handelt (z. B. „Gestehen“ oder „Leugnen“ im Gefangenendilemma oder „Bleiben“ oder „Weichen“ im Feiglingsspiel) und die zu erwartende Auszahlungen unter Einrechnung der Effekte der vom Gegenspieler ergriffenen Strategien. Dies ist die jedem Spieler bekannte Spielanleitung. Auf die Welt der Ökonomie übertragen heißt das z. B. für vier Spieler: Sie haben übereinstimmende Problembeschreibungen, übereinstimmende Lösungswege und möglicherweise voneinander abweichende Auszahlungen; mithin sind das vier in einem Markt tätige völlig identische Unternehmen. Der „Realitätsgewinn“ durch die Betrachtung interaktiver Entscheidungen ist teuer erkauft.
1.1.4.2 Zielfunktionen / Rationalitätsannahmen
In den in der Neoklassik betrachteten Abhängigkeiten, soweit die Wahlentscheidung die Fähigkeit zur kardinalen Nutzenmessung voraussetzt, kommt nur ein Wille zum Ausdruck. Wie dieser Wille gebildet wurde, ist nicht Gegenstand der deduktiven Wissenschaft. Ein gesamtwirtschaftliches Optimum mag sich durch die Summe der auf diese Weise herbeigeführten Entscheidungen einstellen, wird aber nicht angestrebt. Sobald jedoch die Nutzenunterschiede verschiedener Wahlhandlungen nicht mehr numerisch anzugeben sind, sondern nur noch Höherschätzung, Gleichschätzung oder Minderschätzung anzugeben ist (Pareto), kann aus der optimierten Konsum- oder Produktionssituation aller Marktteilnehmer auch ein Optimum hergeleitet werden, bei dessen Veränderung der Vorteil des Veränderungswilligen nur durch Nachteile anderer erkauft werden kann (hierzu sind allerdings Abstriche vorzunehmen, z. B. durch Zulassen intransitiver Rangordnungen[14] [vgl. Schneider, Dieter, Informations- und Entscheidungstheorie, a. a. O., S. 55 und z. B. S. 115 dieses Buches]). Es wäre damit eine Art kollektiver Rationalität erreicht, wenngleich hier ein Kollektiv weder Ziele verfolgt noch Wahlhandlungen unternimmt.
Pareto, der sich mit seinen Annahmen über die Handlungsmaximen der Individuen im Einklang mit der übrigen Neoklassik befindet (Nutzenmaximierung), hat auch diese Überlegungen aus den Marginalkalkülen der Analysis hergeleitet (Ausgleich der Grenzraten der Substitution, Ausgleich der Grenzproduktivitäten der Produktionsfaktoren).
Bei der Vorstellung seiner mathematischen Theorie im Jahre 1928 war von Neumann bereits von dem Potential seiner Arbeit auch für die Nationalökonomie überzeugt und fragte sich: „Was wird unter gegebenen äußeren Umständen (der Zirkularität des Entscheidungsproblems, s. o.) der absolut egoistische ‚homo oeconomicus‘ tun?“[15]. Wenngleich hier von Neumann der neoklassischen Theorie zu Unrecht dieses Menschenbild unterschiebt, so hat er doch beim Wirtschaften nichts gegen Egoismus – was nicht wenige seiner Epigonen heute lebhaft bereinigen zu müssen glauben. Hinsichtlich von Neumanns formaler Maximen für wirtschaftliches Handeln und denen der Neoklassik bestand jedenfalls kein Unterschied: Für die Zielsetzung der Spieler galt die Maximierung des eigenen Vorteils als Grundannahme. Mit einer Spiellösung, die keine weitere Verbesserung für ihn bei einem neuen Spiel erbrächte, hätte der Spieler die für ihn beste, weil gemäß der Gewinnmaximierungshypothese unter der Nebenbedingung der Antizipation abgeleitete Entscheidung getroffen.
Die Spielergebnisse sind „Lösungen“ oder „Gleichgewichte“. Diese schließen auch die Spielergebnisse der übrigen Spieler ein, so dass die Lösungen „stabil“ sein können, dass sie ein „Gleichgewicht“ darstellen oder sogar „Pareto-optimal“ sein können. Solcher Art Lösungen können sich bei den mit ökonomischer Thematik konstruierten Spielen einstellen, sie sind jedoch nicht erstrebt im Sinne des Verfolgens eines Zieles. Ein Spielergebnis kann die Verwirklichung „kollektiver Rationalität“ erbringen, was aber nur bedeutet, dass jeder Spieler des Kollektivs sich rational im Sinne des Ziels der Maximierung seiner Auszahlung verhalten hat. Es gibt, zumindest in den nicht-kooperativen Spielen, auf die gewöhnlich die Entscheidungsprobleme mit ökonomischem Hintergrund bezogen werden, weder Zielvorstellungen eines Kollektivs noch Handlungen eines solchen und daher auch keinen Zielerreichungsgrad eines Kollektivs. Gleichwohl leiten wissenschaftliche Autoren, berufene und nicht-berufene Kommentatoren und auch das Publikum aus diesen Ergebnisbenennungen genau das Gegenteil ab: das Berufensein der Spieltheorie zur Schöpfung einer neuen Ökonomie ohne Gewinnstreben und Egoismus.
Die Frage, ob der Zwang zur Antizipation gegnerischer Strategien möglicherweise die Entscheidersouveränität beschneidet, muss hier noch offen bleiben, da diese eine autonom zu fassende Zielfunktion voraussetzt. Außer einem über den Wassern schwebenden Geist der Gewinnmaximierungshypothese für die Spieler enthält die Spieltheorie nichts Derartiges.
1.1.4.3 Handlungsmöglichkeiten / Erfolgsabbildung
Eine Handlungsmöglichkeit in der betriebswirtschaftlichen Entscheidungstheorie bezeichnet die Summe von einzelnen im Hinblick auf ein einzelnes und wohl unterscheidbares Konzept zu koordinierender Maßnahmen. Es sind alle Recherchen und Maßnahmen rechtlicher, technischer tatsächlicher Natur zur Ermittlung und Herbeiführung des angestrebten Erfolges des Konzepts. Das gilt unabhängig davon, ob eine Entscheidung unter sicheren Erwartungen oder unter Ungewissheit vorzubereiten ist. Zu einem Vergleich mit der Spieltheorie ist jedoch auch die Ungewissheitssituation in der betriebswirtschaftlichen Entscheidungstheorie zu betrachten. Ungewissheit heißt dort, dass die Handlungsmöglichkeit je nach sich realisierender Zukunftslage unterschiedliche Ergebnisse erwirtschaften wird. Die unterschiedlichen Ergebnisse werden in einer durch subjektive Wahrscheinlichkeiten auf der Grundlage möglichst objektiver Erwartungen ermittelten Verteilung abgebildet.
Im Sinne eines widerspruchsfreien Entscheidungsablaufs sind an die Formulierung von Handlungsmöglichkeiten verschiedene Anforderungen zu richten:
- Sie sind im Hinblick auf ein einheitliches Unterscheidungsmerkmal zu definieren;
- dieses Unterscheidungsmerkmal muss den Zielerfüllungsgrad angeben, es ist daher im Maßstab des Handlungszieles selbst zu formulieren;
- wie oben ausgeführt, müssen die Handlungsmöglichkeiten unabhängig voneinander sein, d. h. überschneidungsfrei und einander ausschließend formuliert sein.
- von anderen Handlungsmöglichkeiten dominierte andlungsmöglichkeiten sind von vornherein ausszuscheidenHandlungsmöglichkeiten sind von vorneherein auszuscheiden.
Sowohl Vertreter der reinen ökonomischen Wissenschaft als auch der präskriptiven Theorie (ja, sogar die Praktiker) wissen, dass Handlungsmöglichkeiten um die vorhandenen und um die beschaffbaren Ressourcen der Unternehmung konkurrieren. Zum Teil sind diese bekannt bzw. stehen fest, andere sind möglicherweise erst aufzuschließen und zu ermitteln, wobei die Erschließung neuer Ressourcen durchaus vom Erfolg der betrachteten Handlungsmöglichkeiten abhängen wird. Damit hat also die Betriebswirtschaftslehre auch ihr „Zirkel“-Problem, allerdings ist es der Entscheidung vorgelagert: Vollständig ist eine Handlungsmöglichkeit erst beschrieben, wenn die vom Erfolg abhängige Ressourcenbeschaffung planbar bestimmt ist. Die zur Durchführung einer Handlungsmöglichkeit hinzugebenden Ressourcen (vorhandene oder beschaffte) sind der erste Wertmaßstab der mit dieser Handlungsmöglichkeit erhofften Zahlungsüberschüsse; der resultierende Nettoüberschuss muß sich danach (im Entscheidungsprozess) noch mit dem der übrigen Handlungsmöglichkeiten messen.
Dagegen „kostet“ in den spieltheoretischen Modellen eine Strategie keinen Ressourceneinsatz, der Spielleiter hat sie freigebig eingeräumt. Der Bezug zur ökonomischen Wirklichkeit wird erneut zu einem wesentlichen Teil aufgegeben, indem die zur Gewinnung einer Handlungsmöglichkeit notwendige Hingabe betrieblicher Ressourcen gar nicht bewertet wird, weder im eigenen Unternehmen noch (per Versuch) im fremden Unternehmen.
Hinter der Formulierung von Handlungsmöglichkeiten spielt sich in der betriebswirtschaftlichen Entscheidungstheorie mehr „Ökonomie“ ab als in dem ganzen Brimborium der Spieltheorie, die diese einfach nur Strategie nennt und mit einer Auszahlung belegt.
Gegenüber der betriebswirtschaftlichen Entscheidungslehre erweist sich zudem der Spielregelzwang zur Antizipation in der Spieltheorie als erheblicher Nachteil: In der betriebswirtschaftlichen Entscheidungslehre stellt sich die Antizipation einer Gegenstrategie entweder als neue, bisher nicht gesehene Handlungsmöglichkeit oder als die Veränderung einer bereits ausformulierten Handlungsmöglichkeit dar. In der Regel ist die zu erwidernde Gegenstrategie zu beschreiben, ebenso wie die Antizipationsmaßnahmen des Entscheiders, und die Ergebnisauswirkungen für den Entscheider daraus abzuleiten. Am Ende dieses Prozesses hat der Entscheider ebenfalls ermittelt, mit welchen subjektiven Eintrittswahrscheinlichkeiten er für die Ergebnisbeiträge aus Gegenstrategien und Antizipationen zu rechnen hat. Der Antizipationsgedanke der Spieltheorie dagegen setzt Gegenstrategien dem Grunde und der Art nach als gegeben voraus, gegebenenfalls versehen mit einer Eintrittswahrscheinlichkeit, sie kann nur mit einer vorab definierten und im Ergebnis festgelegten Gegenstrategie beantwortet werden. Die Wahl der Gegenstrategie (die antizipierende) bedeutet in der Regel eine Auszahlungseinbuße gegen den Vorteil der Sicherheit der Auszahlungserwartung. Dieser Vorgang läuft ohne Rückgriff auf eine Zielfunktion ab, und, obgleich es sich hier um eine Ergebnisabsicherung handelt, auch ohne Rückgriff auf eine Risikoneigung des Entscheiders. So wirkt die Antizipation tententiell wie eine Strategie zur Absicherung des Existenzminimums.
Die Spieltheorie verschweigt, dass mit dem Antizipationsgedanken auch das Thema der Entscheidung unter Ungewissheit eingeführt ist, denn eine Auswahl unter zwei möglichen Strategien mit unterschiedlichen Ergebnisbeiträgen vornehmen zu müssen, wie im Gefangenendilemma, ist ein Problem der Entscheidung unter Ungewissheit. Nur werden diesem Thema die Lösungsgedanken nur auf niedrigstem Niveau gewidmet, weil inhärent die Gegenstrategie über den Antizipationszwang wieder als „sicher“ gelten muss. Über die Mathematik dieses Konzepts ist hier kein Urteil zu fällen, wer aber an der Lösung wirtschaftlicher Probleme orientiert ist, halte Abstand, auch wegen logischer Ungereimtheiten.
In der betriebswirtschaftlichen Entscheidungstheorie ist nach der Beschreibung der Handlungsmöglichkeiten ihr jeweiliger der Erfolgsbeitrag bekannt, der, wie erwähnt, notwendig gleichnamig mit der Zielfunktion sein muss. Der Eintritt des gewünschten Ergebnisses einer Handlungsmöglichkeit ist selten sicher, in den meisten Fällen hängt seine Höhe vom nur wahrscheinlichen Eintritt bestimmter Umstände ab. Auch die Ermittlung dieser Eintrittswahrscheinlichkeit ist ein betriebswirtschaftliches Problem[16].
Nach der bereits zitierten Einführung[17] (Leininger, Wolfgang, Amann, Erwin, Einführung in die Spieltheorie, a. a. O., S. 92) kennt diese zwei Formen der Ungewissheit: Spiele mit ‚unvollständiger Information‘ und Spiele mit ‚unvollkommener Information‘. Unvollständige Information bedeute mangelnde Kenntnis über die Identität oder wesentliche Eigenschaften eines Mitspielers (Beispiel: die Kostenfunktion des Gegenspielers sei unbekannt), während Unkenntnis über zurückliegende Spielzüge als unvollkommene Information (Beispiel: Produktionsmengen des Gegenspielers in der Vorperiode seien nicht bekannt) gilt.
Die Merkwürdigkeit des impliziten Umgangs der Spieltheorie mit der Ungewissheit, bedingt durch die Wesentlichkeit der Antizipation im Entscheidungsprozess, haben wir soeben angesprochen. Eigentlich müsste dieser Antizipationsgedanke die explizite Berücksichtigung von Ungewissheit erübrigen. Als entsprechend „in der Luft hängend“ erweist sich daher das gleichwohl eingeführte Begriffspaar „unvollkommene Information“ und „unvollständige Information“. Unklar ist der Erkenntnisnutzen aus der Betrachtung von in der Vergangenheit unbekannt gebliebenen “Spielzügen“. Erstens: Für Planungen/Entscheidungen ist der Blick in die Zukunft maßgeblich, und zweitens: Woher kommt der Anstoß, Spielzüge, die man bisher nicht kannte, aufzuklären (die Spieltheorie kennt keine Informationsaktivitäten, und woher kommt denn die Kenntnis, über etwas nicht informiert zu sein?). Am bereits dargestellten Gehalt der einzelwirtschaftlichen Entscheidungstheorie wäre allenfalls der Zustand der unvollständigen Information und seine Behandlung in der Spieltheorie zu messen.
Der für ökonomische Entscheidungen wichtigere Fall ist wohl der der unvollständigen Information, ihn in einem Vergleich der betriebswirtschaftlichen Entscheidungstheorie gegenüberzustellen. Ist ein Spieler den übrigen Mitspielern in seinen Eigenarten nicht (vollständig) bekannt, äußert sich das in der Ungewissheit über die Auszahlung. Eine unbekannte Auszahlung macht das Spiel jedoch unspielbar oder unlösbar. Da in der Spieltheorie Auszahlungen fest mit bestimmten Strategien verbunden sind Strategien erforderlich, die anstelle derjenigen des unvollständig bekannten Spielers treten können. Die „Träger“ der neuen Strategien entspringen einem Akt der Schöpfung. „Die Grundidee ist die, alle Typen eines Spielers… als Spieler eines größeren Spieles aufzufassen, in dem der zusätzliche Spieler ‚Natur‘ den 1. Zug erhält. Auf dieser Stufe (I) wählt die Natur jeweils aus der Spielermenge, die die Typen des Spielers repräsentiert, einen Typ aus, der auf Stufe II des Spieles aktiv werden wird. Ein gewählter Spieler wird darüber informiert, dass er aktiv sein wird, ein nicht gewählter Spieler wird darüber informiert, dass er inaktiv sein wird. Ein aktiver Typ – wie auch der inaktive Typ desselben Spielers – weiß jedoch nichts über die Information der Typen jedes seiner Mitspieler“[18]. Das Ganze geschieht, um das zuvor nicht befüllte Feld für die Auszahlung des unvollständig bekannten Spielers mit einer nunmehr bekannten Häufigkeitsverteilung für eine Menge von Auszahlungen zu versehen, für die der Spieler Natur verantwortlich zeichnet. Man nennt es eine Harsanyi-Transformation. Das gleiche Prinzip der Substitution eines unvollständig bekannten Spielers durch einen Homunculus mit Typentsprechung zum Auszutauschenden gilt im Bayes-Nash-Gleichgewicht. Auch hier liegt am Schluss eine bekannte Häufigkeitsverteilung der Auszahlungen vor, mit der nun endlich gerechnet werden kann. In beiden Fällen muß das Substitut nach dem Bayes-Theorem eine bekannte Häufigkeitsverteilung sein, deren Eintrittswahrscheinlichkeit derjenigen des zu substituierenden (unvollständig bekannten) Ereignisses entsprechen muss. Woher kommen die zusätzlich erforderlichen Kenntnisse? Logiker behelfen sich in diesen Situationen mit einem „Lemma“, der praktische Ökonom findet sich in der Rolle des Tausendfüßlers beim Arzt wieder.
Ein zentrales Problem der einzelwirtschaftlichen Entscheidungstheorie ist, Kenntnis über Erfolg und Misserfolg der eigenen Handlungsmöglichkeiten zu erlangen und diese so zu formulieren, dass ihr Ergebnis sich nach den Kriterien der Zielfunktion beschreiben lässt. Die Beeinflussung der Ergebnisse durch Konkurrenzmaßnahmen ist selbstredend dabei in Rechnung zu stellen. In der Spieltheorie werden solche Einflüsse nur auf die zu wählende Strategie betreffend angesehen, die mit den Strategien verbundenen Auszahlungen bleiben davon unberührt. Wer dennoch behauptet, mit solchen Modellen ökonomische Fragen zu lösen, ist auf dem Holzweg.
Das Gebiet der Entscheidungen unter Ungewissheit ist das hic sunt dracones der Spieltheorie (ohne, dass es dort zugegeben würde).
Das Urteil kann daher kaum anders ausfallen: „Bisher bietet … die Spieltheorie zum Problem der unvollkommenen Information (im Sinne der betriebswirtschaftlichen Entscheidungstheorie, d. Verf.) über die Handlungsalternativen der Gegenseite oder über deren Zielbeiträge in den Zukunftslagen nur ein am Problem-Vorbeigerede“[19].
1.1.4.4 Abbildung der Ungewissheit in der Spieltheorie
Das Maß der Ungewissheit wird bestimmt durch den Zwang zur Antizipation der gegnerischen Strategie: Je mehr Spieler (Gegner) die Spielregeln vorsehen und je mehr Strategien diesen eingeräumt werden, desto höher die Ungewissheit für den einzelnen Spieler, darüber, welche seine beste Strategie sein wird. Diesbezüglich ist die Ungewissheit also allgemein definiert durch die Anzahl der Spieler und Auszahlungsmöglichkeiten pro Spielzug je nach der einem gegnerischer Spieler unterstellten Strategie, eine Menge, die nach den Spielregeln ebenso abzählbar ist wie die Menge der Spieler. Für die anzuwendenden Regeln der Entscheidung unter Ungewissheit bedeutet dies die Anwendung der Grundsätze der Wahrscheinlichkeitstheorie der Glüchsspiele, also das Rechnen mit bekannten Häufigkeitsverteilungen. Wir verweisen daher auf Abschnitt 9.6)
1.1.4.5 Entscheidungsfindung
Sind die Handlungsmöglichkeiten aufgezählt, die sich einzig bei steigenden Zielbeiträgen noch durch abnehmende Eintrittswahrscheinlichkeiten für diese unterscheiden lassen, fällt in der betriebswirtschaftlichen Entscheidungslogik die Entscheidung nach der Risikonutzenfunktion des Handelnden (s. o., Entscheidungen unter Ungewissheit).
Wie in der Matrizendarstellung der Beispiele gesehen, ergibt sich die spieltheoretische Lösung des Spiels dagegen mit dessen Niederschrift. Das ist auch nicht anders, wenn die Zahl der Mitspieler oder deren Alternativen auf mehr als zwei erhöht wird. D. h. der eigentliche Entscheidungsvorgang wird in der Spieltheorie nicht betrachtet, bzw. auf die Handlungsmaxime reduziert, unter Beachtung aller Gegenstrategien nach den Gesetzen der Logik die eigene Strategie mit der höchsten Auszahlung zu wählen. Bei Befolgung dieser Regeln durch alle Spieler kann es keine überraschenden Ergebnisse geben, denn das Ergebnis ergibt sich nur aus logischen Schlüssen (bzw. der Anwendung von Mathematik), und schon gar keine „Dilemmata“ wie im Falle der beiden Gefangenen (S. 341 ff.). Die erste Feststellung wäre doch die, zu sagen, unter den gemachten Voraussetzungen ergibt sich eben, dass keiner der Gefangenen mit seiner optimalen Strategie in die Nähe seiner möglichen Höchstauszahlung gelangt, das gibt es eben auch, dass zwei Handelnde durch ihre Aktionen einander blockieren können. Mit einem zweiten Blick müsste man aber die Wirklichkeitsnähe der Spielvoraussetzungen prüfen. Dies geschieht im Folgenden.
Das Geständnis des ersten Gefangenen ist mehr wert, wenn der zweite Gefangene leugnet (und umgekehrt), als Straffreiheit, wenn beide Gefangene leugnen, die dann ja voraussetzungsgemäß sicher einträte. Mehr als Straffreiheit sollte der Bekennende jedoch nicht erwarten dürfen, ermäßigen wir also den Vorteil des Bekennenden bei Leugnen des anderen Gefangenen auf den Vorteil des beiderseitigen Leugnens von „5“ auf „4“:
Für beide Gefangenen wäre nun b immer noch die die Strategie der Wahl, denn sie dominiert jeweils Strategie a schwach. Aber an der Realitätsnähe der Voraussetzungen ist weiterhin nachzubessern: Die „Auszahlungen“ für Gefängnisaufenthalte erhalten negative Vorzeichen, um sie deutlich als Strafe zu kennzeichnen, und zwar als härtere Strafe für den hartnäckigen Leugner:
Immer noch bleibt die Strategie b für jeden der Gefangenen gegenüber der Strategie a die schwach dominierende, so dass wir nun noch eine kleine Veränderung vornehmen wollen, um ein echtes Entscheidungsproblem zu zeigen:
Hier haben wir die Kronzeugenregelung für beide Delinquenten noch um den Wert 1 weniger attraktiv gemacht (keine völlige Straffreiheit) mit der Folge, dass die Gefangenen wie zwei Esel zwischen den beiden Heuhaufen stehen und nicht wissen, in welchen sie hineinbeißen sollen.
Dies ist der Fall, den die betriebswirtschaftliche Entscheidungstheorie mit Hilfe einer vom Entscheidenden vorab festzulegenden Risikonutzenfunktion lösen würde. Die Spieltheorie hat diesen Weg der Deduktion nie betreten.
1.1.5 Aufgabe des Rationalitätsaxioms in der Spieltheorie
Diesen Mangel an ökonomisch-theoretischer Fundierung wirtschaftlicher Entscheidungen macht die Spieltheorie untauglich, zielentsprechende Entscheidungen im Zusammenhang der vorgeblich benötigten ökologischen Ökonomie herbeizuführen. Indessen scheint dies wohl gesehen, gleichwohl aber gewünscht worden zu sein: „From (now) on, however, we shall have to treat the games as games. Therefore we shall not mind if some points taken up have no economic connections whatever, - it would not be possible to do full justice tot he subject otherwise“[20]. Grundtyp der Spiele ist das Zwei-Personen-Nullsummen-Spiel, d. h. zwei Spieler treten unter der Voraussetzung an, daß „the sum of all payments received by players (is) alalways zero. … If it is zero, then one can say, that the players pay only to each other and that no construction or destruczion is involved“[21]. Diesem Spiel-Grundtyp sind Kontakte der Spieler untereinander unbekannt. Es gibt jedoch eine Fülle von Spielerweiterungen, insbesondere die Erlaubnis des Bildens von Koalitionen, aber auch der Null-Summen-Hypothese, von denen jedoch nicht erwartet werden kann, die Spielsituationen wieder in die Nähe ökonomischer Fragestellungen zu rücken. Es bleibt bei einer Wissenschaft der Spiele als solcher, „the theory of games as an independent subject“ (ebenda).
Das Gefangenendilemma hat andere Autoren als v. Neumann/Morgenstern und auch einen anderen sozio-philosophischen Hintergrund als die wirtschaftliches Verhalten simulieren sollenden Modelle der „Spieltheorie“, gleichwohl dient es beinahe stets als Einführung in diese. Es ist jedoch leicht erkennbar, dass es mit der Definition eines Nullsummenspiels durch v. Neumann/Morgenstern nicht kompatibel ist. Eine Kritik an der Aufgabe des Rationalitätsprinzips an das Gefangenendilemma zu knüpfen, würde daher an v. Neumann/Morgenstern vorbeigehen. Gleichwohl ist es natürlich ein Nullsummenspiel in der herkömmlichen Auffassung, wenn auch die Auszahlungsmatrix nicht unbedingt verdeutlicht, dass eine Einzahlung an den Spieler a eine Auszahlung des Spielers b voraussetzen würde und umgekehrt. Dieser Charakter des Nullsummenspiels bleibt auch in unseren Spielabwandlungen im vorigen Abschnitt erhalten. Im Spiel Bleiben oder Weichen geht der Charakter durch „Mischung“ der Strategien verloren, weil die der Mischung zu Grunde liegenden Wahrscheinlichkeiten bei beiden Spielern unterschiedlich sind: Die Summen der Ein- bzw. Auszahlungen sind für beide Spieler nach der Mischung nicht mehr gleich. Der Bereich der Zwei-Personen-Nullsummen-Spiele, der die wesentlichen Merkmale aller Spielsituationen bereits enthält, verlangt vom Spieler, sich mit Folgendem zu beschäftigen[22].
- Wie agiert ein Spieler mit Kenntnis der Informationen eines anderen Spielers?
- Welche Informationen sind dem Spieler in jeder Spielphase zugänglich?
- Wie ist ein exaktes Strategiekonzept zu formulieren? der Informationen eines anderen Spielers?
Das gesamte für die Beantwortung dieser Fragen notwendige Wissen erhält der Spieler in der Spielbeschreibung und der Auszahlungsmatrix für alle Phasen des Spiels, so dass die Antwort auf a) sich durch Anwendung von Logik, auf die zu b) und c) aus den erhaltenen Informationen ergibt, und zwar ohne Anwendung einer Zielfunktion (was der Spieler wolle, sei ja ausreichend durch die in der Auszahlungsmatrix enthaltenen Beträge belegt, s. o.). Auch der Ökonom beantwortet die Frage a) zuletzt, nachdem er zu Fragen b) und c) intensiv recherchiert hat. Wir haben bereits erwähnt, dass der Entscheider der ökonomischen Theorie in dieser Tätigkeit der Spieltheorie unbekannte Maß- und Bewertungsprobleme zu lösen hat. Eine Theorie rationaler Entscheidung müsste von einer Zielfunktion ausgehen, die den Maßstab für die auszuwählenden Handlungsmöglichkeiten abgibt.
Wie gehört, ist Ziel die höchstmögliche Auszahlung, unverändert durch korrigierende Komponenten der Zielerfüllung, wie z. durch Risikoneigung (ausgenommen vielleicht eine durchgängig unterstellte Risikoneutralität wegen der vorherrschend gewählten Erwartungswerte der Auszahlungen im Falle z. B. der gemischten Strategien). Wie Auszahlungsfolgen über mehrere Perioden behandelt werden, ist unklar, nicht nur wegen des Fehlens einer Zeitpräferenzkomponente in der „Zielfunktion“. Eine Folge von Spielen ist i. d. R. Gegenstand der Untersuchung, wenn Spiele zu wiederholen oder nach Einschätzung der Spieler wiederholbar sind. Sie betreffen dann aber auch wiederum nur eine mit anderen Perioden unverbundene Periode und enthalten keine Zeitkomponente weder als Bedingtheit einer späteren Auszahlung durch eine frühere solche noch als „Nutzen“-Komponente der Zielfunktion.
Woher werden in der Spieltheorie also die Handlungsergebnisse (Auszahlungen) genommen? Diese Aufgabe dürfte im Regelfall dem Spieldesigner zufallen. Den Spielern sind dagegen gegnerische Motive zu unterstellen, so dass es zweifelhaft erscheint, ob diese sich im Vorfeld auf Spielregeln und Auszahlungen einigen könnten. Demzufolge sind die obigen Tätigkeiten nach b) und c) völlig rezeptiver Natur. Damit wird die eigentliche Aufgabe und Potenz des Kaufmanns aus der Economic Behavior völlig ausgeblendet. Warum die Spieltheorie darum ausgerechnet an ökonomischen Fakultäten so gut vertreten ist, wäre noch zu beantworten.
Das Bleiben oder Weichen Spiel zeigt mit der Möglichkeit, eine Strategie zu „mischen“ eine Eingriffsmöglichkeit der Spieler auf die für sie vorgesehenen Auszahlungen. Wie gesehen, veränderte die daraufhin unterstellte Mischung die Verhältnisse zu Gunsten des Oberwirts, dem eine schwach dominierende Strategie zufiel. Warum hätte der Unterwirt auf eine dies bewirkende Veränderung der Spielsituation eingehen sollen?
Wer in der Spieltheorie einen Baustein ökonomischer Entscheidungstheorie sucht, wird bestenfalls einen Hängeordnerschrank voll mit Spielentwürfen finden, unter denen er den für seine ganz spezielle Fallgestaltung passenden Ordner suchen kann.
Die Annahme der individuellen Rationalität ist zu Gunsten eines Gleichgewichtsstrebens, nahegelegt durch Lösungen, an deren Änderung selbst deutlich hinter ihren maximal möglichen Auszahlungen zurückbleibende Spieler kein Interesse mehr hatten, zurückgedrängt. Selbst die Zuweisung dominanter Strategien an einzelne Spieler erhält auf diese Weise die Dignität der gemeinsamen Akzeptanz. Im Zug einer allgemeinen Konfliktvermeidungssehnsucht hat die „Berücksichtigung der gegnerischen Strategien“ der „Rücksichtnahme auf den Gegner“ Platz gemacht. Inzwischen ist das Publikum überzeugt, dass die sog. kollektive Rationalität eines Gleichgewichts aus dem Anfang der Spieltheorie tatsächlich einem kollektiven Wollen und der Zielverfolgung eines Kollektivs entspricht und nicht als eine Metapher für die höchstmögliche Zielverwirklichung jedes einzelnen Spielers gedacht war. Von den durch Nobel-Gedächtnispreise ausgezeichneten wirtschaftswissenschaftlichen Arbeiten werden mittlerweile acht zum Bereich der Spieltheorie gezählt, jeweils den gemeinwirtschaftlichen Aspekt und die Verdrängung des individuellen Rationalitätsstrebens in den preiswürdigen Arbeiten herausstreichend. Immer wird das Bemühen um Gleichgewichtslösungen gewürdigt – zum Schaden der Theorie: Sie erklärt nur das Ende der Welt, weil sie den willentlichen Anstoß zum Entstehen eines Ungleichgewichts, um eine Entwicklung in Gang zu setzen, aus ihren Gedanken ausklammert.
Das Verhalten der Delinquenten im Gefangenendilemma ist geschichtslos: Sie kennen keine Zielsetzungen, sie kennen einander nicht, obwohl sie gemeinsam eine Straftat begangen haben, gleichwohl glauben beide an den marxistischen Gedanken der notwendigen Vorzeichnung des geschichtlichen Ablaufs ihrer weiteren Haft oder Nichthaft. Die Angebote der Staatsanwaltschaft sind rätselhaft bis nicht nachvollziehbar.
1.2 Die Normierung des zu Erstrebenden
1.2.1 (Gemein-)wohlgefällige Ziele aus dem Labor
„At this point it is also opportune to recall that we consider all transactions at the end of a game as purely monetary ones - i. e. that we ascribe to all players an exclusive monetary profit motive“[23] (von Neumann, John; Morgenstern, Oskar Theory of Games, a. a. O., S. 47).
Die Spieltheorie selbst hat von Anfang an nicht recht klar gemacht, wo in dem Spannungsfeld zwischen reiner Beschreibung und Beratungsdienstleistung zur Zielerreichung sie den Platz ihres Erkenntniswunsches sieht. Diese Frage ist mit der Spielvorgabe der Auszahlung als Ergebnis von logischen Verknüpfungen noch nicht geleistet. Wegen dieser Zweifel wird die Spieltheorie bis heute noch weit überwiegend als reine Theorie eingeordnet. Eigentlich hat Rationalität im Sinne einer kohärenten Zielverfolgung eines Individuums in der Spieltheorie gar keinen Platz, denn sie ist durch Logik ersetzt. Epigonen sind an diese methodologische Ausrichtung nicht gebunden, sie sind sogar frei, die Entscheidung zwischen reiner Theorie und präskriptiver Theorie außer Acht zu lassen und sich der normativen Theorie zuzuwenden, der Theorie die das anzustrebende Ziel vorgeben will. Wer so vorgeht, wird allerdings, wenn er das Anzustrebende ausformuliert hat, auch darauf zu achten haben, dass es tatsächlich erstrebt und operativ durchgesetzt wird, also mit der neuen Zielsetzung eine präskriptive Wissenschaft zu betreiben. Die reine Beschreibung würde einer ökologischen Ökonomie keinen Nutzen stiften.
Entschiedener in der Aussage, aber diesen Punkt dennoch nicht aufklärend, äußerte sich Selten, dem der Satz „Die neoklassische Theorie ist zu Grabe zu tragen“ zugeschrieben wird. Nun ist die neoklassische Theorie, die ökonomische Wissenschaft der Analysis, eher eine präskriptive Theorie als eine deskriptive. Das legen Zielfunktion, Maximierungsvorschrift und Rationalitätserfordernis nahe. Auch mit Blick auf die Kritiker der Neoklassik aus Gründen des mit ihr verfolgten Rationalitätsansatzes wird man davon ausgehen müssen, dass sie die präskriptive Ausrichtung beanstandeten. Wenn nun Selten, der bisher einzige deutsche Empfänger eines Alfred-Nobel-Gedächtnis-Preises für Ökonomie die von ihm vertretene, auch noch in besonderer Weise von ihm ausgeprägter Form, die Spieltheorie über die neoklassische Theorie stellt, kann er nur im Sinn gehabt haben, die Spieltheorie als präskriptive Theorie an deren Stelle zu setzen, denn es ist ja das Versagen der Neoklassik als präskriptive Theorie, das es auszubügeln gilt.. Als solche hat aber die Spieltheorie bisher nicht gerade geglänzt und dies mit selbst gelieferten Belegen unterlegt.
Selten und sein bekennender Adept Ockenfels versuchen auf spieltheoretisch-experimentellem Weg, die Nichtexistenz des „homo oeconomicus“ zu beweisen. Und es geht dabei wirklich nicht darum, auf wissenschaftstheoretische Weise ein (unter Umständen: vermeintlich) nach logischen Grundsätzen entwickeltes Rationalitätskonzept eines Verhaltens mit ebensolchen Methoden in Frage zu stellen, sondern es geht tatsächlich um den Beweis der These, dass die Menschen eben nicht nur Gewinn erstrebten, sondern auch edlere Handlungsmotive verfolgten. Durch verschiedene Spielsituationen, die Gleichgewichtslösungen erbringen, in welchen die Teilnehmer nicht nur eigene Vorteile realisieren, sondern auch anderen Mitspielern bewusst Vorteile einräumen, soll dieser Beweis erbracht sein[24]. Eine am Wirtschaftlichkeitsprinzip orientierte präskriptive ökonomische Theorie und eine solche, die eher verhaltenswissenschaftlich deskriptiv arbeitet, müssen keine Antinomie bilden: Eine präskriptive Theorie, deren Zielannahmen in keiner Weise empirisch belegbar wären, wäre nur ein Spiel um Rechthaberei, für dessen Ergebnisse kein Unternehmer Geld ausgeben würde, und eine deskriptive Theorie deren Verhaltensbeschreibungen nicht den Test mittels eines an einer ausformulierten Zielfunktion ablaufenden Entscheidungsprozesses bestünde, wäre reine Fabulierkunst in Sachen Tautologismus. Jeder der beiden Wissenschaftszweige ist auch der Wirklichkeitstest für den anderen.
In diesem Sinne einer gegenseitigen Befruchtung wäre zu erwarten, dass die experimentelle Spieltheorie einen Weg wiese, für Individuen operationale Zielfunktionen zu gelangen, damit am Ende eines Entscheidungsprozesses über diesen ein Rationalitätsurteil abgegeben werden kann, denn, wie gesagt, auch die normative Theorie muss ein Durchsetzungsinteresse für ihre Auffassung haben. Dies ist bisher nicht geschehen. Diesem Manko scheint ein grundsätzliches Missverständnis über den Rationalitätsbegriff zu Grund zu liegen, dem einzig unter finanziellen Zielsetzungen (gegebenenfalls vielleicht noch dem Nutzenstreben) eine Bedeutung beigemessen wird. Die Ratio als Folgerichtigkeit des Handelns sollte aber auch dort erkennbar sein, wo Entscheidende sich an eine vorab geäußerte Vorstellung, mit ihrem Leben Anderen zu Dienste sein zu wollen, in überprüfbarer Weise halten und die ihnen gegebenen Handlungsmöglichkeiten gemäß diesem Ziel ergreifen. In diesem Sinne als Folgerichtigkeit verstanden würde der Rationalitätsbegriff von fruchtlosen inhaltlichen Zielverfolgungsfragen wie z. B. der von Gäfgen ins Spiel gebrachten substantiellen Rationalität befreit. Auf diese Weise würde der Anspruch auf Erfüllung eines Beratungsbedarfs der entscheidungsorientierten Betriebswirtschaftslehre auch außerhalb deren Grenzen wieder ernst genommen.
Gleichwohl besteht unter den methodologisch Unentschiedenen der Drang, sich zu den existentiellen Fragen der Zeit zu äußern, weil diese, da durch das „Wirtschaften“ verursacht, mit den Mitteln des Wirtschaftens für lösbar gehalten werden. Die spieltheoretisch-verhaltensorientierten Ansätze werden für diesen Zweck für besonders geeignet gehalten, da sie u. U. ermöglichen könnten, durch geeignete Annahmen über Ziele und Motive das ganze leidige Problem beseitigen zu können. Wir werden sehen, dass der verengende Blick auf die Beförderung altruistischer Handlungsmotive das vorgeblich zu lösende Problem kein Stück weiter an die Lösung heranführt. Denn soweit hier von Ökonomie gesprochen wird, ist lediglich die Produzentenseite im Blickfeld, und die Wirkungsweise der „Mitigations“-Vorschläge bleiben unbeleuchtet, es sind Folgerungen im Hinblick auf das Gewünschte, nämlich eine vorgeblich menschengemachte Erderwärmung zu verlangsamen, aus wissenschaftlich begründeten Handlungsempfehlungen nicht beabsichtigt.
Wir verdeutlichen die Probleme anhand des Beitrags von Ockenfels, Axel; Werner, Peter; Edenhofer, Ottmar: Pricing externalities and moral behaviour. Nature Sustainability, Vol. 3 (2020), S. 872 – 877, im Netz unter:. https://doi.org/10.1038/s41893-020-0554-1, im folgenden beziehen wir uns auf das gleichnamige Arbeitspapier der Universität Köln derselben Autoren). Nach dem abstract dieser Arbeit soll gemessen werden, wie moralisches Verhalten mit der Bepreisung von CO2-Emissionen „interagiert“. Die Bedeutung moralischer Kategorien für Entscheidungen in Märkten mit negativen externen Effekten sei zwar durch Untersuchungen belegt, indessen wisse man wenig über den Einfluss unterschiedlicher marktorientierter Methoden der Eindämmung von CO2-Emissionen auf individuelles moralisches Verhalten. Im übrigen ist die Situation der Wirtschaft wie folgt beschrieben: Produzenten streben nach Gewinnmaximierung, “Juroren“ setzen die zentralen Parameter des Handelns, die auch Anreize zur CO2-Emission enthalten. Die Setzungen der „Juroren“ münden in die „ceteris-paribus-Bedingungen“ die bei indirekter Bepreisung oder bei direkter Bepreisung von CO2-Emissionen durch die Juroren unverändert bleiben. In experimentellen Spielsituationen soll daher untersucht werden, wie indirekte Bepreisung von CO2-Emissionen (Emissionsrechtehandel) im Vergleich zur direkten Bepreisung (CO2-Steuer) das moralische Verhalten von Marktteilnehmern (hier: Produzenten) beeinflussen. Die Ausgangsfrage befremdet: Emissionsrechtehandel und CO2-Bepreisung sind zwei aktuell intensiv diskutierte Maßnahmen der Emissions-Mitigation; was dabei soll die moralische Frage sein? Soll die Frage, welche Methode die geeignetere ist, moralisch entschieden werden oder soll moralisch entschieden werden, ob überhaupt eine solche Methode anzuwenden ist? Das logische Problem, das die Autoren vor sich aufgebaut haben, ist, dass moralisches Verhalten sich (nur) dort entfaltet, wo es nicht durch Zwangsmittel befördert wird (so jedenfalls denkt der billig und gerecht denkende Mensch). Wer unter dem Regime des Emissionsrechtehandels oder der CO2-Steuer CO2-Immissionen reduziert, ist kein Moralist, sondern er will Geld sparen. Für moralisches Verhalten wäre daher nur Platz, wo keines der beiden Instrumente eingesetzt würde. Der Grundirrtum ist aber der, die CO2-Immission durch Produzenten überhaupt als moralisches Problem zu begreifen, denn die Frage, vor der diese Produzenten stehen ist angesichts der Tatsache, dass CO2 ein technisch bedingtes Kuppelprodukt z. B. der Zementherstellung ist, was aus moralischen Gründen die Weniger-Produktion von Zement erfordern würde (zum Leidwesen z. B. der KITA-Platz- Produktion), nur die welches der diskutierten Zwangsmittel das erfolgreichere ist, um die Zementproduzenten dazu zu ermuntern, Geld für die Aufbrechung des technischen Zusammenhangs in die Hand zu nehmen. Das hat mit Moral nichts zu tun. Der Moralist tut sich leicht mit der Ausblendung der Nachfrageseite und der wohlfeilen Produzentenschelte: Leicht beieinander wohnen die Gedanken, doch hart im Raume stoßen sich die Sachen.
Wodurch zeichnet sich moralisches Verhalten aus? Soll Verhalten, das sich nach lediglich moralischen Kriterien beurteilen lässt, also z. B. etwa das gesamte nicht wirtschaftlich bestimmte unter Einschluss auch des missliebigen? Wenn ja, wären auch Vermeidungsstrategien gegen die Belastungswirkungen der Bepreisungsmaßnahmen zu betrachten. Soll nur das moralisch zu billigende (von wem?) Verhalten untersucht werden und, wenn ja, in welcher Ausprägung – drückt sich die Moral des Wirtschaftens lediglich in der Vermeidung von CO2-Emissionen aus? Ist die Frage, ob eine CO2-Steuer oder der Emissionsrechtehandel die Betroffenen zu noch mehr oder weniger Emissionsvermeidung aus Altruismus-Regungen heraus eine Frage, die die zu beratende Politik überhaupt interessiert? Und andere Fragen mehr.
Die Probanden haben nach den Versuchsbedingungen drei Situationen zu unterscheiden, um die obige Frage zu beantworten:
- keine Eindämmungsmaßnahmen,
- Emissionsrechtehandel,
- CO2-Steuer.
Haben die Juroren keinerlei Eindämmungsmaßnahmen vorgesehen, so können die Produzenten ihr Gewinnstreben ausleben, müssen aber nicht. Das Ausweichen auf den Einsatz teurerer aber harmloserer Produktionsfaktoren, freiwillige Ausgleichsmaßnahmen zum Umweltschutz u.s.w. als positives moralisches Verhalten flössen nicht ins Modell ein, da ja die Abhängigkeit des Altruismus gerade von einer der beiden Bepreisungsmaßnahmen untersucht werden soll, die hier fehlt.
Unter der Herrschaft des Emissionsrechtehandels werden einzusparende Treibhausgasemissionen politisch festgelegt; je mehr Hoheitsgebiete sich in diesem Willen zusammenfassen lassen, desto wirkungsvoller ist diese Maßnahme bei globaler Betrachtungsweise. Auch die Zuteilung/der Primärverkauf an Treibhausgasemittenten dieser Hoheitsgebiete ist ein politischer Akt, über den Zuteilungs- bzw. Primärverkaufspreis kann die Menge der in Anspruch genommenen Zertifikate politisch gesteuert werden. Der Ausgleich weiteren Bedarfs oder Überflusses geschieht über das Preisregime einer Börse. Da eine realistische und naturwissenschaftliche Gegebenheiten respektierende Energiepolitik cum grano salis in der Lage sein müsste, angesichts des Erforderlichen einerseits und des Möglichen andererseits eine wirkungsvolle Anzahl der einzusparenden Tonnen an CO2-Emissionen festzulegen, ist die Frage erlaubt, ob ein darüber hinausgehender Altruismus überhaupt ein Politik-Kriterium sein kann bzw. vonnöten ist.
Gleichwohl zählen die Autoren erst einmal die Nachteile eines (eigentlich lobenswerterweise geübten) Altruismus‘ auf: Zusammengefasst ist es die Trittbrettfahrerei derjenigen, die durch den ausgeübten Verzicht auf den Erwerb von Emissionszertifikaten diese zu niedrigeren Preisen einkaufen können. Da die Autoren im gleichen Zusammenhang darauf verzichten, andere Bestimmungsgründe, z. B. im Unternehmen liegende, des Erwerbs von Emissionsrechten zu erörtern, wird deutlich: Kein Anlass des Nachdenkens liegt so weit, dass er nicht doch dazu herhalten könnte, den Ersatz des „homo oeconomicus“ durch den Moralisten zu propagieren. Eine beratende Wirtschaftswissenschaft hätte den Klienten darüber aufzuklären, wie der Alternativkalkül zwischen Einsatz einer Erlaubnis für eine Tonne Treibhausgasemission und der Installation einer Abgasreinigungsanlage aussieht, wie weit Daumenschrauben angezogen werden können, um gerade noch die Produktion gesamtwirtschaftlich notwendiger Produkte, bei deren Herstellung zwangsläufig schädliche Stoffe als Kuppelprodukte anfallen, zu behindern, welche Preiswirkungen von diesen Auflagen ausgehen u.s.w. u.s.w. So steht aber ein Untersuchungsergebnis schon vorher fest:
„With indirect pricing through cap-and-trade, voluntary reduction of CO2 emissions drives down prices and thus only makes room for polluters”[25]. Die von betroffenen Unternehmen anzustellenden Überlgegungen haben wir in Abschnitt 6.5 dargestellt. Beratungsauftrag verfehlt! Merke: Ein Energiepolitiker ist nicht so zu beraten, als ob er die Zahl der in den Himmel aufgenommenen Unternehmer zu erhöhen hätte, sondern dahingehend, als notwendig erachtete Zustandsveränderungen auf rationale Weise in die Wege setzen zu können.
Sollten die Juroren eine CO2-Steuer verhängen, müsste zunächst deren Form geklärt werden: Deutschland kennt diese als Verbrauchssteuer (z. B. die Mineralölsteuer mit einem Aufkommen von jährlich etwa 40 Mrd. €) und seit der Verabschiedung des Klimapakets auch als Importsteuer auf in Deutschland einzusetzende Mineralölprodukte (sollte allerdings wieder zurückgenommen werden, wobei Zweifel verbleiben). Als Verbrauchssteuer trifft die CO2-Steuer im wesentlichen Konsumenten, da diese keine Möglichkeit zur Aufwandsverrechnung haben. Welche Möglichkeit hat diese Personengruppe, Altruismus zu zeigen? Der Altruismus könnte sich im Mobilitätsverzicht zeigen, um Anderen, den Trittbrettfahrern, mehr Mobilität zu ermöglichen, aber der Charakter der Verbrauchssteuer verhindert diesen Effekt: Jede Ortsverlagerung mittels Verbrennungsmotoren wäre mit oder ohne altruistischen Verzicht gleich teuer für sie. Auch im Falle der Verhängung von CO2-Steuern sollen die spielteilnehmenden Personen ja Producer sein. Ohnehin ist das Spielergebnis durch die Einschätzung des Emissionsrechtehandels vorgegeben, und Edenhofer kann an die Reparatur früher geschleifter Bastionen gehen:[26] „Although judges restrict behaviour in similar ways across mechanisms, direct pricing more effectively accommodates moral behaviour than the quantity policy“. Wie bedeutsam für Ökonomen ist aber die Aussage, dass den Moralisten die direkte Bepreisung „mehr entgegenkommt“ als die Beschränkung durch einen Emissionsrechtehandel? Der Beitrag hat nicht geklärt, ob den Moralisten überhaupt eine Meinungsäußerung darüber abverlangt wurde. Wer hören will, was Moralisten wollen, muss nur sein Ohr aus dem Fenster halten.
Könnte ein solches Papier Grundlage einer Klimapolitik-Beratung z. B. für die Bundesregierung sein? Das ist schwer vorstellbar. Zumal noch fünf Monate zuvor Ockenfels in einem FAZ-Interview profunde Unkenntnis zum Thema CO2-Bepreisung eingeräumt hatte: „Ich kenne den optimalen (CO2-)Preis nicht“ und das Thema Moral abtat mit „Moralappelle bringen nichts“.
[1] Neumann, John von: Zur Theorie der Gesellschaftsspiele. In: Mathematische Annalen, 100ster Band (1928), S. 295 – 320, hier S. 295.
[2] vgl. Ockenfels, Axel: Fairneß, Reziprozität und Eigennutz, Ökonomische Theorie und experimentelle Evidenz, Tübingen 1999; Selten, Reinhard: Die Strategiemethode zur Erforschung des Eingeschränkt Rationalen Verhaltens im Rahmen eines Oligopolexperiments. In: Sauermann, Heinz [Hrsg.]: Beiträge zur experimentellen Wirtschaftsforschung. Tübingen 1967, S. 136 – 168; ders.: Experimentelle Wirtschaftsforschung. In: Rheinisch-Westfälische Akademie der Wissenschaften [Hrsg.] Vorträge N 287, Opladen 1979, S. 41 – 61; ders.: The Equity Principle in Economic Behavior. In: Gottinger, H. W.; Leinfellner; [Hrsg.], Decision Theory and Social Ethics: Issues in Social Choice, Dordrecht 1987, S. 289 – 301.
[3] vgl. Bertrand, Joseph Louis Francois, Thèorie Mathèmatique de la Richesse Sociale, a. a. O., S. 503.
[4] Leininger, Wolfgang; Amann, Erwin, Lehrstuhl Wirtschaftstheorie Universität Dortmund: Vorlesungsmanuskript: Einführung in die Spieltheorie, S. 3 f.
[5] vgl. Leininger, Wolfgang; Amann, Erwin, Einführung, a. a. O., S. 8 f.
[6] vgl. Leininger, Wolfgang; Amann, Erwin, Einführung, a. a. O., S. 17 f
[7] vgl. Gäfgen, Gerard, Theorie der wirtschaftlichen Entscheidung, a. a. O., S. 360, Schneider Dieter, Investition und Finanzierung, a. a. O., S. 111 ff., ders., Informations- und Entscheidungstheorie, a. a. O., S. 141 ff, hier insbesondere zum Gefangenendilemma mit weiteren Argumenten und Literaturnachweisen.
[8] Leininger, Wolfgang; Amann, Erwin, Einführung, a. a. O., S. 9.
[9] Schneider, Dieter, Informations- und Entscheidungstheorie, a. a. O., S. 144
[10] vgl. Leininger, Wolfgang, Amann, Erwin, Einführung in die Spieltheorie, a. a. O., S. 24.
[11] vgl. Leininger, Wolfgang, Amann, Erwin, Einführung in die Spieltheorie, a. a. O., S. 26 ff
[12] Schneider, Dieter, Informations- und Entscheidungstheorie, a. a. O., S. 25, Hervorhebungen im Original.
[13] vgl Harsanyi, John C.; Selten, Reinhard: A General Theory of Equilibrium Selection in Games. Cambridge, Londen 1988, S. 10 f.
[14] vgl. Schneider, Dieter, Informations- und Entscheidungstheorie, a. a. O., S. 55 und z. B. S. 115 dieses Buches.
[15] vgl. Neumann, John von: Zur Theorie der Gesellschaftsspiele a. a. O., S. 295)
[16] vgl. dazu Schneider, Dieter: Informations- und Entscheidungstheorie, a.a.O., S. 69-97.
[17] Vgl. Leininger, Wolfgang, Amann, Erwin, Einführung in die Spieltheorie, a. a. O., S. 92.
[18] vgl. Leininger, Wolfgang, Amann, Erwin, Einführung in die Spieltheorie, a. a. O., S. 96 f.
[19] Schneider, Dieter: Informations- und Entscheidungstheorie, a. a. O., S. 148 mit Verweis auf Harsany/Selten.
[20] von Neumann, John; Morgenstern, Oskar: Theory of Games, a. a. O., S. 46.
[21] Ders., ebenda
[22] vgl. von Neumann, John; Morgenstern, Oskar: Theory of Games, a. a. O., S. 47.
[23] von Neumann, John; Morgenstern, Oskar Theory of Games, a. a. O., S. 47.
[24] s. z. B. Ockenfels, Axel: Fairneß, Reziprozität und Eigennutz, Ökonomische Theorie und experimentelle Evidenz, Tübingen 1999, z. B. S. 46 – 64.
[25] Ockenfels, Axel; Werner, Peter; Edenhofer, Ottmar: Pricing Externalities and Moral Behavior, S. 3.
[26] Ockenfels, Axel; Werner, Peter; Edenhofer, Ottmar: Pricing Externalities and Moral Behavior, ebenda.