Zur Theorie des Wirtschaftsstrafrechts. Marco Mansdörfer
Szenarien lassen sich mithilfe der sog. Spieltheorie theoretisch in einer Weise aufarbeiten, dass auch die spezifischen Funktionen der Strafe als rechtlicher Sanktion deutlich werden.
a) Gegenstand der Spieltheorie
79
Die Spieltheorie analysiert in einem ersten Schritt Situationen, in denen (1) das Ergebnis bestimmter Handlungen von den Entscheidungen mehrerer Entscheidungsträger abhängt, (2) jeder Entscheidungsträger sich dieser Interdependenzen bewusst ist, (3) jeder Entscheidungsträger davon ausgeht, dass alle anderen sich ebenfalls dieser Interdependenz bewusst sind und (4) jeder bei seinen Entscheidungen die Voraussetzungen (1) – (3) berücksichtigt[188].
80
Diese sog. strategischen Entscheidungssituationen werden also durch Interessenkonflikte und Koordinationsprobleme charakterisiert, zu deren – auch ganz praktischer – Auflösung die Spieltheorie in einem zweiten Schritt soziale Mechanismen entwickelt (sog. Mechanismusdesign)[189] und Wege zu deren tatsächlicher Implementierung aufgezeigt[190].
b) Spieltheoretische Grundsituationen und die situationsspezifische Bedeutung von Strafe
81
Die Spieltheorie unterscheidet grundlegend zwischen kooperativen Spielen, in denen die Spieler sich an gemeinsame Absprachen binden können, sodass das Gruppeninteresse maßgeblich für die Strategiewahl ist, und nicht-kooperativen Spielen, in denen derartige Absprachen ausgeschlossen sind[191]. Die Akteure nicht-kooperativer Spiele werden jeweils die Handlungsalternative wählen, die ihnen unabhängig vom Verhalten des Gegenspielers den größten Gewinn garantiert (sog. dominante Strategie), oder sie lassen zumindest ineffiziente Handlungsalternativen außer Betracht (sog. dominierte Strategie). Wenn alle Akteure auf der Basis ihrer Erwartungen über das Verhalten des Gegenspielers ihre optimale Strategie wählen und diese Erwartungen einander wechselseitig bestätigen, liegt eine stabile Gleichgewichtssituation vor. Eine solche Situation wechselseitig bester Antworten wird auch als Nash-Gleichgewicht bezeichnet.
82
Beispiele:
Wie die Spieltheorie zu konkreten Verhaltensvorhersagen führt, lässt sich an den – einfachen – Beispielen des sog. homogenen Mengendypols (1) und an der Grundkonstellation des sog. Gefangenendilemmas (2) vorführen:
(1) | A und B produzieren als Konkurrenten mit demselben Verfahren Güter. Da der Markt nur eine fixe Menge dieser Güter nachfragt, hängt der Preis der Güter vom Umfang der Produktion von A und B ab. A und B werden daher je nur gerade so viele Güter produzieren, dass sie jeweils den höchsten Gewinn erzielen können (sog. Cournot-Nash-Gleichgewicht)[192]. Weder A noch B werden von dieser Menge abweichen, da jede Abweichung zu einer Verringerung des erzielten Gewinns führen würde. |
(2) | Zwei Gefangene stehen im Verdacht, gemeinsam eine Straftat begangen zu haben. Die Höchststrafe für das Verbrechen beträgt fünf Jahre. Beiden Gefangenen wird nun ein Deal angeboten, worüber auch beide informiert sind. Wenn einer gesteht und somit seinen Partner mitbelastet, kommt er ohne Strafe davon – der andere muss vier Jahre verbüßen. Entscheiden sich beide zu schweigen, bleiben nur Indizienbeweise, die aber ausreichen, um beide für ein Jahr einzusperren. Gestehen aber beide die Tat, muss jeder drei Jahre ins Gefängnis. Nun werden die Gefangenen unabhängig voneinander befragt. Weder vor noch während der Befragung haben die beiden die Möglichkeit, sich untereinander abzusprechen. In dieser Situation werden als rationale Akteure beide gestehen. Da wechselseitig vom Gebrauch der Kronzeugenregelung ausgegangen werden muss, werden die Verdächtigen wenigstens die sichere strafmildernde Wirkung eines Geständnisses (drei Jahre statt vier Jahre Freiheitsstrafe) für sich nutzen. Selbst wenn beiden Tätern für den Fall beiderseitigen Schweigens eine nur geringere Strafe (1 Jahr Freiheitsstrafe) droht, können sie sich selbst auf eine vorherige Absprache nicht verlassen[193]. |
(3) | Weitere Beispiele für nicht-kooperative Spiele sind Kontrollsituationen – zu deren Lösung das obige Konzept um Zufallsmomente erweitert wird – oder Koordinationssituationen – zu deren Lösung je nach Fall kommunikative Elemente eingeführt oder Abstriche von der uneingeschränkten Rationalitätsannahme gemacht werden. |
83
Die vorstehenden Beispiele sind jeweils durch den Umstand gekennzeichnet, dass auf die Reaktion des einen Akteurs die des anderen erfolgt und dann das Ergebnis feststeht (sog. einstufige Spiele)[194]. Rechtliche Sanktionen können der Stabilisierung solcher Kooperationen dienen oder – wie das Gefangenendilemma gezeigt hat – gezielt zur Destabilisierung unerwünschter Kooperationen eingesetzt werden.
84
Im wirklichen Leben müssen in der Regel freilich Situationen bewältigt werden, in denen mehrere – bis hin zu unendlich vielen – Reaktionen aufeinander folgen. Beispiele dafür sind etwa auf eine unbestimmte Zeit angelegte Anstellungsverhältnisse zwischen Geschäftsführern und Gesellschaftern einer GmbH im Unterschied zum Verhältnis mehrerer Gesellschafter einer für ein konkretes Projekt gebildeten Zweckgemeinschaft. In der Theorie werden solche Situationen durch komplexere Modelle in der Form von mehrstufigen, endlichen oder unendlichen Spielen abgebildet[195]. Empfehlungen für das strategisch richtige Verhalten werden hier ausgehend von der besten Entscheidung über den letzten Zug rückwärts vom letzten zum vorletzten zum vorvorletzten usw. bis hin zum ersten Zug entwickelt (sog. Rückwärtsinduktion)[196]. Rechtliche Sanktionen stabilisieren hier gerade auch die Erwartung eines integren Verhaltens des Kooperationspartners beim kritischen letzten Zug bzw. bei der Beendigung der Kooperation. Schädigendes Verhalten zu dem Zeitpunkt, in dem die Kooperation nicht mehr durch wechselseitige Vorteile gesichert ist, ist wegen der drohenden Sanktion weniger wahrscheinlich. Dies hat damit zur Folge, dass bereits bei den ersten Zügen zu Beginn der Kooperation insgesamt wechselseitiges Wohlverhalten als wechselseitig günstiges Verhalten erscheint.
85
Gibt es keinen „letzten“ Zug, weil die Beziehung auf Dauer angelegt und damit im Grundsatz „unendlich“ ist, sind all diejenigen Strategien optimal – und stützen daher ein Nash-Gleichgewicht – bei denen keiner der Akteure schlechter gestellt wird als bei einem Verzicht auf diese Interaktion (sog. Folk-Theorem)[197]. Da dann aber unendlich viele Verhaltensweisen als „optimal“ denkbar sind, lassen sich in diesen Situationen sinnvolle Verhaltensvorschriften nicht formulieren, es sei denn, einzelne Gleichgewichtssituationen lassen sich als unplausibel bzw. unglaubwürdig identifizieren[198]. Rechtliche Sanktionen stärken freilich auch insoweit das kalkulative Vertrauen in das wechselseitig vorteilhafte Verhalten. Strategien, die auf Misstrauen aufbauen und ökonomisch zu insgesamt höheren Transaktionskosten führen, werden auf diese Weise zu unplausiblen bzw. wenig wahrscheinlichen Verhaltenserwartungen.
86
Mangelnde Informationen über bedeutsame Eigenschaften anderer Spieler werden formal durch die erwartete Wahrscheinlichkeit dieser Eigenschaft in die Überlegungen mit einbezogen (sog. Spiele mit asymmetrischer Informationsverteilung)[199]. In dynamischen Situationen kann das beobachtbare Verhalten des anderen Akteurs zu Erwartungsänderungen und Verhaltensanpassungen in den Folgesituationen führen, sodass Lerneffekte in die Verhaltenserwartung integriert werden können[200]. Sanktionen für den Fall der Fehlinformation oder der Verletzung von Informationspflichten können das Vertrauen auf ein bestimmtes Informationsniveau bestärken.
c) Bewusste Gestaltung von Handlungssituationen im Wege des Mechanismusdesigns
87
Die Ausführungen zur Wirkung von Sanktionen auf