Nash Gleichgewicht: Unterschied zwischen den Versionen

Aus Mikroökonomie 1
Zur Navigation springen Zur Suche springen
 
(23 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
Das Nash Gleichgewicht ist nach John Nash benannte Kombination von Strategien zweier Spieler, bei der kein Spieler einseitig den Anreiz hat abzuweichen.
+
Das Nash Gleichgewicht ist die nach John Nash benannte Kombination von Strategien zweier Spieler, bei der kein Spieler einseitig den Anreiz hat abzuweichen.
  
 
__TOC__
 
__TOC__
Zeile 9: Zeile 9:
  
 
===In reinen Strategien===
 
===In reinen Strategien===
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
+
In einem gegebenen Gefangenendilemma ist das Nash Gleichgewicht NG=(Verrat, Verrat). Spieler 1 hat keinen Anreiz einseitig abzuweichen, wenn er allein durch seine Entscheidung zu keinem höheren Payoff gelangen kann. Da er nur bestimmen kann in welcher Zeile der Ausgang des Spiels liegen wird, muss geschaut werden, ob er ausgehend von der Entscheidung von Spieler 2 (Verrat) zu einem höheren Payoff gelangen kann. Wählt er statt Verrat doch Schweigen, hat er einen Payoff von -10, was geringer ist als -5. <br>
<br clear=all>
 
In dem Gefangenendilemma von unten ist das Nash Gleichgewicht NG=(Verrat, Verrat). Spieler 1 hat keinen Anreiz einseitig abzuweichen, wenn er alleine durch seine Entscheidung zu keinem höheren Payoff gelangen kann. Da er nur bestimmten kann in welcher Zeile der Ausgang des Spiels liegen wird, muss geschaut werden, ob er ausgehend von der Entscheidung von Spieler 2 (Verrat) zu einem höheren Payoff gelangen kann. Wählt er statt Verrat doch Schweigen, hat er einen Payoff von -10, was geringer ist als -5. <br>
 
 
Ist ein Ausgang kein Nash Gleichgewicht, wird dieser von rationalen Spielern in der Form nie erreicht, da immer ein einseitiger Anreiz zum Abweichen vorliegt. <br>
 
Ist ein Ausgang kein Nash Gleichgewicht, wird dieser von rationalen Spielern in der Form nie erreicht, da immer ein einseitiger Anreiz zum Abweichen vorliegt. <br>
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
 
<br clear=all>
 
<br clear=all>
Die Identifizierung eines Nash Gleichgewichts hängt stark mit der Idee der [[Besten Antwort]] zusammen.  
+
Die Identifizierung eines Nash Gleichgewichts hängt stark mit der Idee der [[Nash Gleichgewicht#Besten Antwort|Beste Antwort]] zusammen.
  
 
===In gemischten Strategien===
 
===In gemischten Strategien===
Ein Spieler sollte seine gemischte [[Strategie]] so wählen, dass sein Nutzen maximal ist. Im Beispiel eines Schere, Stein, Papier Spiels sollte er die Wahrscheinlichkeiten, mit denen er die jeweiligen reinen Strategien spielt, so wählen, dass der andere Spieler keine dominante Strategie besitzt. Der Nutzen eines Gewinns entspricht 1 und der Nutzen einer Niederlage 0. Die Payoffs ergeben, dass ein rationaler Spieler eine gemischte Strategie <math> \sigma=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> spielen. Wenn Spieler 1 mit einer größeren Wahrscheinlichkeit Schere spielen würde, müsste Spieler 2 immer Papier spielen, damit sich sein erwarteter Payoff erhöht. Das führt wiederum dazu, dass Spieler 1 einen Anreiz hat abzuweichen. Nur bei <math> \sigma_1^*=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> und <math> \sigma_2^*=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> existiert in dem speziellen Anwendungsbeispiel kein Anreiz für einen der beiden Spieler abzuweichen. <math> (\sigma_1^*,\sigma_2^*) </math> ist ein Nash Gleichgewicht in gemischten Strategien. <br>
+
Ein Spieler sollte seine gemischte [[Spiele#Strategien|Strategie]] so wählen, dass sein Nutzen maximal ist. Im Beispiel eines "Schere, Stein, Papier"-Spiels sollte er die Wahrscheinlichkeiten, mit denen er die jeweiligen reinen Strategien spielt, so wählen, dass der andere Spieler keine dominante Strategie besitzt. Der Nutzen eines Gewinns entspricht 1 und der Nutzen einer Niederlage 0. Die Payoffs ergeben, dass ein rationaler Spieler eine gemischte Strategie <math> \sigma=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> spielen. Wenn Spieler 1 mit einer größeren Wahrscheinlichkeit Schere spielen würde, müsste Spieler 2 immer Papier spielen, damit sich sein erwarteter Payoff erhöht. Das führt wiederum dazu, dass Spieler 1 einen Anreiz hat abzuweichen. Nur bei <math> \sigma_1^*=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> und <math> \sigma_2^*=(\frac{1}{3}, \frac{1}{3}, \frac{1}{3}) </math> existiert in dem speziellen Anwendungsbeispiel kein Anreiz für einen der beiden Spieler abzuweichen. <math> (\sigma_1^*,\sigma_2^*) </math> ist ein Nash Gleichgewicht in gemischten Strategien. <br>
  
 
==Beste Antwort==
 
==Beste Antwort==
 
Die Beste Antwort ist ein Konzept, bei dem untersucht wird welche Strategie eines Spielers die Beste Antwort auf die Strategie eines anderen Spielers ist. Die Beste Antwort von Spieler 1 auf die Strategie X ist Strategie 3, da dort der Payoff in der Spalte am größten ist (Zur Erinnerung: Spieler 1 ist der Zeilenspieler und kann bestimmen in welcher Zeile der Ausgang liegen wird). Spieler 2 betrachtet, bei welcher Strategie sein Payoff (der zweitgenannte) in jeder Zeile am größten ist. Wäre der Payoff in mehreren Spalten gleich groß, gibt es mehrere Beste Antworten. <br>
 
Die Beste Antwort ist ein Konzept, bei dem untersucht wird welche Strategie eines Spielers die Beste Antwort auf die Strategie eines anderen Spielers ist. Die Beste Antwort von Spieler 1 auf die Strategie X ist Strategie 3, da dort der Payoff in der Spalte am größten ist (Zur Erinnerung: Spieler 1 ist der Zeilenspieler und kann bestimmen in welcher Zeile der Ausgang liegen wird). Spieler 2 betrachtet, bei welcher Strategie sein Payoff (der zweitgenannte) in jeder Zeile am größten ist. Wäre der Payoff in mehreren Spalten gleich groß, gibt es mehrere Beste Antworten. <br>
Die Payoffs von (Strategie 1, Strategie X) lauten (3, 3). Ist dies ein Nash Gleichgewicht? Immerhin ist Strategie die Beste Antwort von Spieler 1 auf Strategie X. Tatsächlich hat Spieler 2 in (Strategie 1, Strategie X) einen Anreiz abzuweichen, denn wenn Spieler 1 Strategie 1 wählt, sollte Spieler 2 Strategie Z spielen. (Strategie1, Strategie Z) bietet für Spieler 1 wiederum den Anreiz auf Strategie 2 auszuweichen und so weiter. Nur der Ausgang, der für beide Spieler eine Beste Antwort bedeutet, hat keiner einen Anreiz abzuweichen. Fallen zwei Beste Antworten zusammen, ist der Ausgang ein [[Nash Gleichgewicht]]. <br>
+
Die Payoffs von (Strategie 1, Strategie X) lauten (3, 3). Ist dies ein Nash Gleichgewicht? Immerhin ist die Strategie die Beste Antwort von Spieler 1 auf Strategie X. Tatsächlich hat Spieler 2 in (Strategie 1, Strategie X) einen Anreiz abzuweichen, denn wenn Spieler 1 Strategie 1 wählt, sollte Spieler 2 Strategie Z spielen. (Strategie1, Strategie Z) bietet für Spieler 1 wiederum den Anreiz auf Strategie 2 auszuweichen und so weiter. Nur der Ausgang, der für beide Spieler eine Beste Antwort bedeutet, hat keiner einen Anreiz abzuweichen. Fallen zwei Beste Antworten zusammen, ist der Ausgang ein [[Nash Gleichgewicht]]. <br>
 
[[Datei:BesteAntwort.png|400px|rahmenlos]]
 
[[Datei:BesteAntwort.png|400px|rahmenlos]]
  
Zeile 29: Zeile 27:
 
[[Datei:DominanteStrategie.png|401px|rahmenlos]] <br>
 
[[Datei:DominanteStrategie.png|401px|rahmenlos]] <br>
 
<br clear=all>
 
<br clear=all>
Ist eine der beiden Strategien für Spieler 1 dominant, so ist diese Strategie immer besser. Sollte sich der Spieler 2 für die erste zweite Spalte entscheiden, bringt eine dominante Strategie genauso den größten Payoff der Spalte, wie wenn sich der Spieler zwei für die zweite Spalte entscheidet. In dem oben dargestellten Beispiel ist der Payoff in Spalte A größer, wenn sich Spieler 1 für Verrat entscheidet (-5>-10). Auch in Spalte B ist der Payoff von Verrat größer als der von Schweigen (0>-5). Egal wie sich der Spieler 2 entscheidet, Spieler 1 sollte immer Verrat spielen. Verrat ist eine dominante Strategie und Schweigen eine dominierte Strategie. Damit knüpft der Dominanzbegriff sehr sark an des Konzept der Besten Anwtort an. <br>
+
Ist eine der beiden Strategien für Spieler 1 dominant, so ist diese Strategie immer besser. Sollte sich der Spieler 2 für die erste zweite Spalte entscheiden, bringt eine dominante Strategie genauso den größten Payoff der Spalte, wie wenn sich der Spieler zwei für die zweite Spalte entscheidet. In dem oben dargestellten Beispiel ist der Payoff in Spalte A größer, wenn sich Spieler 1 für Verrat entscheidet (-5>-10). Auch in Spalte B ist der Payoff von Verrat größer als der von Schweigen (0>-5). Egal wie sich der Spieler 2 entscheidet, Spieler 1 sollte immer Verrat spielen. Verrat ist eine dominante Strategie und Schweigen eine dominierte Strategie. Damit knüpft der Dominanzbegriff sehr stark an des Konzept der Besten Antwort an. <br>
Es wird zwischen strikter dominanz und schwacher Dominanz unterschieden. Das oben dargestellte Beispiel stellt strikte Dominanz dar, denn jeder Payoff des Verrats ist strikt größer als der des Schweigens. Schwache Dominanz würde vorliegen, wenn die Payoffs größer oder gleich groß sind, solange mindestens ein Payoff strikt größer ist. <br>
+
Es wird zwischen strikter Dominanz und schwacher Dominanz unterschieden. Das oben dargestellte Beispiel stellt strikte Dominanz dar, denn jeder Payoff des Verrats ist strikt größer als der des Schweigens. Schwache Dominanz würde vorliegen, wenn die Payoffs größer oder gleich groß sind, solange mindestens ein Payoff strikt größer ist. <br>
 
Haben zwei Spieler eine dominante Strategie, spielen sie diese auch in einem der vorhandenen Nash Gleichgewichte. Nicht jede Strategie, die im Nash Gleichgewicht gespielt wird, ist jedoch auch eine dominante Strategie.
 
Haben zwei Spieler eine dominante Strategie, spielen sie diese auch in einem der vorhandenen Nash Gleichgewichte. Nicht jede Strategie, die im Nash Gleichgewicht gespielt wird, ist jedoch auch eine dominante Strategie.
 +
 +
==IESDS==
 +
Das IESDS (Iterated elimination of strictly dominated strategies) ist ein Verfahren, mit dessen Hilfe für Spieler irrationale Strategien eliminiert werden. Ist eine Strategie [[Spiele#Dominanz der Strategien|strikt dominiert]], wäre es irrational für einen Spieler diese zu spielen, da mindestens eine Strategie immer einen größeren Payoff liefert.
 +
Eine strikt dominante Strategie kann somit als Strategie gestrichen werden. <br>
 +
[[Datei:IESDS1.png|400px|rahmenlos]]
 +
[[Datei:IESDS2.png|400px|rahmenlos]] <br clear=all>
 +
<br>
 +
Für Spieler 2 wird die Strategie X von der Strategie Y strikt dominiert (1<4; 4<5; 3<4). Unter der Annahme, dass alle Spieler rational sind, weiß auch Spieler 1, dass Spieler 2 niemals Strategie X wählen wird. Daher muss er die Payoffs in der Strategie X Spalte nicht mehr betrachten. Wenn er dies tut, wird seine Strategie 3 von Strategie 2 strikt dominiert (0<2; 0<8). Dass Strategie 3 auch von Strategie 1 strikt dominiert wird, sei an dieser Stelle auch erwähnt. Es ergibt sich eine neue Spielmatrix, da Spieler 1 niemals Strategie 3 wählen wird. <br>
 +
[[Datei:IESDS3.png|400px|rahmenlos]]
 +
[[Datei:IESDS4.png|400px|rahmenlos]]
 +
[[Datei:IESDS5.png|400px|rahmenlos]]
 +
<br clear=all>
 +
Mit derselben Intuition können die restlichen strikt dominierten Strategien eliminiert werden und der einzig rationale Ausgang ist (Strategie 1, Strategie Y). Bleibt nur eine Strategiekombination übrig, bildet sie immer ein Nash Gleichgewicht. Es können jedoch nicht immer mit der Hilfe des IEDS alle Nash Gleichgewichte gefunden werden.
  
 
==Teilspielperfektes Nash-Gleichgewicht==
 
==Teilspielperfektes Nash-Gleichgewicht==
Ein Gleichgewicht ist teilspielperfekt, wenn es ein Nash Gleichgewicht in jedem Teilspiel ist. Hierbei wird das Konzept der Rückwärtsinduktion angewandt. Bei der Rückwärtsinduktion wird das sequenzielle Spiel rückwärts durchlaufen und untersucht, in welchem Entscheidungspunkt(Teilspiel) welcher Spieler wie handeln wird. Das wird für alle Entscheidungspunkte analysiert unabhängig, ob diese im Gleichgewicht erreicht werden oder nicht. <br>
+
Ein Gleichgewicht ist teilspielperfekt, wenn es ein Nash Gleichgewicht in jedem Teilspiel ist. Hierbei wird das Konzept der Rückwärtsinduktion angewandt. Bei der Rückwärtsinduktion wird das sequenzielle Spiel rückwärts durchlaufen und untersucht, in welchem Entscheidungspunkt (Teilspiel) welcher Spieler wie handeln wird. Das wird für alle Entscheidungspunkte analysiert unabhängig, ob diese im Gleichgewicht erreicht werden oder nicht. <br>
 
[[Datei:TSP.png|400px|rahmenlos]] <br clear=all>
 
[[Datei:TSP.png|400px|rahmenlos]] <br clear=all>
In dem letzten Knotenpunkt, in dem ein Spieler sich entscheiden muss, entscheidet sich Spieler zwei zwischen C oder D. Der zweitgenannte Payoff ist der von Spieler 2. Im linken Knoten erhält er bei C 2 und bei D 3. Da 3>2 wählt er im ersten Fall D. Im rechten Knoten erhält er 4 bei C und 1 bei D. Hier wählt er C. Seine Strategie lautet: "Spiele D, wenn der linke Fall eintritt (Spieler 1 wählt A) und wähle C, wenn der zweite Fall eintritt (Spieler 1 wählt B)". <br>
+
In dem letzten Knotenpunkt, in dem ein Spieler sich entscheiden muss, entscheidet sich Spieler 2 zwischen C oder D. Der zweitgenannte Payoff ist der von Spieler 2. Im linken Knoten erhält er bei C 2 und bei D 3. Da 3>2 wählt er im ersten Fall D. Im rechten Knoten erhält er 4 bei C und 1 bei D. Hier wählt er C. Seine Strategie lautet: "Spiele D, wenn der linke Fall eintritt (Spieler 1 wählt A) und wähle C, wenn der zweite Fall eintritt (Spieler 1 wählt B)". <br>
 
Spieler 1 weiß, dass das Resultat (A, D) lauten wird, sollte er sich für A entscheiden und (B, C), sollte er sich für B entscheiden. Bei (A, D) erhält er 2 und bei (B, C) erhält er 1. Daher entscheidet sich der rationale Spieler 1 für (A, D). <br>
 
Spieler 1 weiß, dass das Resultat (A, D) lauten wird, sollte er sich für A entscheiden und (B, C), sollte er sich für B entscheiden. Bei (A, D) erhält er 2 und bei (B, C) erhält er 1. Daher entscheidet sich der rationale Spieler 1 für (A, D). <br>
 
Das Teilspielperfekte Nash Gleichgewicht lautet: <br>
 
Das Teilspielperfekte Nash Gleichgewicht lautet: <br>
Zeile 43: Zeile 54:
  
 
==Nash Gleichgewicht und Pareto Effizienz==
 
==Nash Gleichgewicht und Pareto Effizienz==
Nash Gleichgewichte sind nicht immer [[Effizienz#Pareto Effizienz|parteo effizient]]. Paretoeffizienz besteht, wenn keine Partei besser gestellt werden kann, ohne die andere schlechter zu stellen. Pareto effiziente Strategiekombinationen lassen sich sehr gut in der Normalform erkennen. Dafür soll wieder das Gefangenendillema vom Anfang dienen <br>  
+
Nash Gleichgewichte sind nicht immer [[Effizienz#Pareto Effizienz|pareto effizient]]. Paretoeffizienz besteht, wenn keine Partei bessergestellt werden kann, ohne die andere schlechter zu stellen. Pareto effiziente Strategiekombinationen lassen sich sehr gut in der Normalform erkennen. Dafür soll wieder das Gefangenendillema vom Anfang dienen <br>  
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
 
<br clear=all>
 
<br clear=all>
(Schweigen, Verrat) bringt einen Payoff von (-10, 0). Spieler 1 kann sehr leicht besser gestellt werden. SPielt er zum Beispiel auch Verrat, hat er nicht mehr -10, sondern -5. Die Strategiekombination wäre (Verrat, Verrat). Dadurch wird jedoch Spieler 2 schlechter gestellt. Statt 0 hat er nun -5. (Schweigen, Verrat) ist somit eine Strategiekombination, von der aus keine Partei besser gestellt werden kann, ohne eine andere schlechter zu stellen. Es handelt sich um einen pareto effizienten Ausgang. Lediglich (Verrat, Verrat) ist nicht pareto effizient, da in (Schweigen, Schweigen) beide Spieler besser gestellt werden können. <br>
+
(Schweigen, Verrat) bringt einen Payoff von (-10, 0). Spieler 1 kann sehr leicht bessergestellt werden. Spielt er zum Beispiel auch Verrat, hat er nicht mehr -10, sondern -5. Die Strategiekombination wäre (Verrat, Verrat). Dadurch wird jedoch Spieler 2 schlechter gestellt. Statt 0 hat er nun -5. (Schweigen, Verrat) ist somit eine Strategiekombination, von der aus keine Partei bessergestellt werden kann, ohne eine andere schlechter zu stellen. Es handelt sich um einen pareto effizienten Ausgang. Lediglich (Verrat, Verrat) ist nicht pareto effizient, da in (Schweigen, Schweigen) beide Spieler besser gestellt werden können. <br>
 
Es ist deutlich geworden, dass der Begriff des Nash Gleichgewichts und der des Pareto Effizienz ganz andere Thematiken abdecken.
 
Es ist deutlich geworden, dass der Begriff des Nash Gleichgewichts und der des Pareto Effizienz ganz andere Thematiken abdecken.
 
  
 
==MC Aufgaben==
 
==MC Aufgaben==
 +
<quiz display=simple shuffleanswers=true>
 +
{Welche der folgenden Aussagen ist falsch?
 +
|type="()"}
 +
+ Nicht jedes Gleichgewicht in dominanten Strategien des Spiels in Normalform ist auch ein teilspielperfektes Nash-Gleichgewicht des Spiels in extensiver Form.
 +
- Nicht jedes Nash-Gleichgewicht des Spiels in Normalform ist auch ein teilspielperfektes Nash-Gleichgewicht des Spiels in extensiver Form.
 +
- Nicht jedes teilspielperfekte Nash-Gleichgewicht eines Spiels in extensiver Form ist auch ein Nash-Gleichgewicht des Spiels in Normalform.
 +
</quiz>
  
==Strategien==
+
<quiz display=simple shuffleanswers=true>
===Reine Strategien===
+
{Die folgenden Aussagen beziehen sich auf statische Spiele. Welche Aussage ist wahr?
Ein Spieler hat mehrere Möglichkeiten, wie er in bestimmten Situationen entscheidet. Diese Möglichkeiten werden Strategien gennant. Ein Spieler entscheidet sich für eine Strategie (<math> s </math>) aus allen möglichen Strategien (<math> S </math>). Die mathematische Schreibweise lautet <math> s \in S </math>. Dies bedeutet nichts anderes als dass die gewählte Strategie neben anderen Strategien zur Auswahl stand. Alle möglichen Strategien werden innerhalb einer geschwungenen Klammer dargestellt <math> S=\{s_1,s_2,s_3,...\}</math>. <br>
+
|type="()"}
''Beispiel'': Beim bekannten "Schere Stein Papier" Spiel hat jeder Spieler drei Möglichkeiten, von denen er sich für eine entscheiden muss. Die Spieler wählen beide aus <math> s \in S</math>, wobei <math> S=\{Schere,Stein,Papier\}</math>.
+
+ Jedes Nash Gleichgewicht in reinen Strategien überlebt das IESDS Verfahren.
 
+
- Jedes Strategieprofil, das das IESDS Verfahren überlebt, ist ein Nash Gleichgewicht.
===Gemischte Strategien===
+
- Es gibt gemischte Nash Gleichgewichte, in denen ein Spieler eine strikt dominierte Strategie spielt.
Ein Spieler hat, neben der Möglichkeit sich für eine reine Strategie (entweder Stein oder Papier oder Schere) zu entscheiden, auch die Möglichkeit eine Strategie mit einer bestimmten Wahrscheinlichkeit zu spielen. Das Randomisieren der reinen Strategien wird gemischte Strategie genannt. <math> \sigma=(p_1,p_2,p_3, ...) </math> ist die Schreibweise von gemischten Strategien. Die erste reine Strategie wird mit einer Wahrscheinlichkeit <math> p_1 </math> gespielt und so weiter.
+
</quiz>
 
 
==Die Normalform==
 
Die Normalform ist eine mögliche Darstellung von Spielen. Die grafische Darstellung ähnelt stark einer Tabelle, in der alle möglichen Strategien des einen Spielers (Spieler 1) an den Anfang jeder Zeile geschrieben werden. Die Strategien des anderen Spielers (Spieler 2) werden in die erste Zeile, an den Anfang jeder Spalte geschrieben. <br>
 
Als Beispiel soll das sehr bekannte Gefangenendillema dienen. Zwei Verbrecher stehen in unterschiedlichen Räumen unter Verhöhr und werden mit Vorwürden konfrontiert. Man kann ihnen beiden jeweils kleinere Verbrechen nachweisen, die zu einer Haftstrafe von 1 Jahren führen. Ihre möglichen Strategien lauten <math> S=\{Schweigen, Verrat\}</math>. Für wie lange sie verurteilt werden hängt davon ab welche Strategie sie selbst wählen und welche Strategie der andere Verbecher wählt. Die folgende Darstellung in Normalform soll die Haftstrafen beschreiben. <br>
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]] <br>
 
<br clear=all>
 
Verrät der eine Verbrecher (Spieler 1) den anderen Verbrecher (Spieler 2) und dieser verrät ihn ebenfalls, müssen beide für 5 Jahre. Wählt Spieler 1 Verrat und Spieler 2 Schweigen, bekommt Spieler 1 die Kronzeugenregelung und muss gar nicht ins Gefängnis. Spieler 2 hingegen muss sogar 10 Jahre hinter Gitter. Die anderen Payoffs sind mit einer ähnlichen Inutition zu verstehen.
 
 
 
==IESDS==
 
Das IESDS (Iterated elimination of strictly dominated strategies) ist ein Verfahren, mit dessen Hilfe für Spieler irrationale Strategien eliminiert werden. Ist eine Strategie [[Spiele#Dominanz der Strategien|strikt dominiert]], wäre es irrational für einen Spieler diese zu spielen, da mindestens eine Strategie immer einen größeren Payoff liefert.
 
Eine strikt dominante Strategie kann somit als Strategie gestrichen werden. <br>
 
[[Datei:IESDS1.png|400px|rahmenlos]]
 
[[Datei:IESDS2.png|400px|rahmenlos]] <br clear=all>
 
<br>
 
Für Spieler 2 wird die Strategie X von der Strategie Y strikt dominiert (1<4; 4<5; 3<4). Unter der Annahme, dass alle Spieler rational sind, weiß auch Spieler 1, dass Spieler 2 niemals Strategie X wählen wird. Daher muss er die Payoffs in der Strategie X Spalte icht mehr betrachten. Wenn er dies tut, wird seine Strategie 3 von Strategie 2 strikt dominiert (0<2; 0<8). Dass Strategie 3 auch von Strategie 1 strikt dominiert wird, sei an dieser Stelle auch erwähnt. Es ergibt sich eine neue Spielmatrix, da Spieler 1 niemals Strategie 3 wählen wird. <br>
 
[[Datei:IESDS3.png|400px|rahmenlos]]
 
[[Datei:IESDS4.png|400px|rahmenlos]]
 
[[Datei:IESDS5.png|400px|rahmenlos]]
 
<br clear=all>
 
Mit der selben Intution können die restlichen strikt dominierten Strategien eliminiert werden und der einzig rationale Ausgang ist (Strategie 1, Strategie Y). Bleibt nur eine Strategiekombination übrig, bildet sie immer ein [[Normalform#Nash Gleichgewicht|Nash Gleichgewicht]]. Es kann jedoch nicht immer mit der Hilfe des IEDS alle Nash Gleichgewichte gefunden werden.
 
 
 
==Umwandlung in Extensivform==
 
Die Normalform kann in die [[Extensivform]] übersetzt werden. Bisher wurde ein statisches Spiel betrachtet. Die Extensivform in der Spielbaumoptik beschreibt aber ohne weitere Modifikation ein sequentielles Spiel. Der Spieler, der weiter oben steht zieht zuerst und danach folgt der andere Spieler. Daher muss etwas eingeführt werden, was verdeutlicht, dass der zweite Spieler nicht weiß, wie sich der erste entschieden hat. <br>
 
[[Datei:Gefangenendilemma.png|401px|rahmenlos]]
 
[[Datei:NormalInExtensiv.png|399px|rahmenlos]]
 
<br>
 
<br clear=all>
 
Die gestrichelte Linie siganlisiert, dass Spieler 2 nicht weiß, in welchem Entscheidungsknoten er sich befindet. Die Payoffs selbst verändern sich nicht, nur durch die Übersettzung in die Extensivform. Spielen beide Verrat, erhalten beide auch weiterhin einen Payoff von -5.
 
  
==MC Fragen==
+
<quiz display=simple shuffleanswers=true>
 +
{Welche der folgenden Aussagen ist richtig?
 +
|type="()"}
 +
+ Beim IESDS  hängt das Ergebnis nicht von der Reihenfolge der Eliminierung ab.
 +
- Beim IESDS  hängt das Ergebnis von der Reihenfolge der Eliminierung ab.
 +
- Das IESDS eliminiert gegebenenfalls Nash Gleichgewichte in gemischten Strategien.
 +
- Das IESDS eliminiert gegebenenfalls Nash Gleichgewichte in reinen Strategien.
 +
</quiz>

Aktuelle Version vom 23. Januar 2024, 13:27 Uhr

Das Nash Gleichgewicht ist die nach John Nash benannte Kombination von Strategien zweier Spieler, bei der kein Spieler einseitig den Anreiz hat abzuweichen.

Nash Gleichgewicht

Definition

Mathematisch werden Nash Gleichgewichte wie folgt definiert:
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle (s_1^*,s_2^*) } ist ein Nash Gleichgewicht, wenn Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle U_1(s_1^*,s_2^*) \geq U_1(s_i,s_2^*) } und für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle s_i \in S } .

In reinen Strategien

In einem gegebenen Gefangenendilemma ist das Nash Gleichgewicht NG=(Verrat, Verrat). Spieler 1 hat keinen Anreiz einseitig abzuweichen, wenn er allein durch seine Entscheidung zu keinem höheren Payoff gelangen kann. Da er nur bestimmen kann in welcher Zeile der Ausgang des Spiels liegen wird, muss geschaut werden, ob er ausgehend von der Entscheidung von Spieler 2 (Verrat) zu einem höheren Payoff gelangen kann. Wählt er statt Verrat doch Schweigen, hat er einen Payoff von -10, was geringer ist als -5.
Ist ein Ausgang kein Nash Gleichgewicht, wird dieser von rationalen Spielern in der Form nie erreicht, da immer ein einseitiger Anreiz zum Abweichen vorliegt.
Gefangenendilemma.png

Die Identifizierung eines Nash Gleichgewichts hängt stark mit der Idee der Beste Antwort zusammen.

In gemischten Strategien

Ein Spieler sollte seine gemischte Strategie so wählen, dass sein Nutzen maximal ist. Im Beispiel eines "Schere, Stein, Papier"-Spiels sollte er die Wahrscheinlichkeiten, mit denen er die jeweiligen reinen Strategien spielt, so wählen, dass der andere Spieler keine dominante Strategie besitzt. Der Nutzen eines Gewinns entspricht 1 und der Nutzen einer Niederlage 0. Die Payoffs ergeben, dass ein rationaler Spieler eine gemischte Strategie spielen. Wenn Spieler 1 mit einer größeren Wahrscheinlichkeit Schere spielen würde, müsste Spieler 2 immer Papier spielen, damit sich sein erwarteter Payoff erhöht. Das führt wiederum dazu, dass Spieler 1 einen Anreiz hat abzuweichen. Nur bei und existiert in dem speziellen Anwendungsbeispiel kein Anreiz für einen der beiden Spieler abzuweichen. ist ein Nash Gleichgewicht in gemischten Strategien.

Beste Antwort

Die Beste Antwort ist ein Konzept, bei dem untersucht wird welche Strategie eines Spielers die Beste Antwort auf die Strategie eines anderen Spielers ist. Die Beste Antwort von Spieler 1 auf die Strategie X ist Strategie 3, da dort der Payoff in der Spalte am größten ist (Zur Erinnerung: Spieler 1 ist der Zeilenspieler und kann bestimmen in welcher Zeile der Ausgang liegen wird). Spieler 2 betrachtet, bei welcher Strategie sein Payoff (der zweitgenannte) in jeder Zeile am größten ist. Wäre der Payoff in mehreren Spalten gleich groß, gibt es mehrere Beste Antworten.
Die Payoffs von (Strategie 1, Strategie X) lauten (3, 3). Ist dies ein Nash Gleichgewicht? Immerhin ist die Strategie die Beste Antwort von Spieler 1 auf Strategie X. Tatsächlich hat Spieler 2 in (Strategie 1, Strategie X) einen Anreiz abzuweichen, denn wenn Spieler 1 Strategie 1 wählt, sollte Spieler 2 Strategie Z spielen. (Strategie1, Strategie Z) bietet für Spieler 1 wiederum den Anreiz auf Strategie 2 auszuweichen und so weiter. Nur der Ausgang, der für beide Spieler eine Beste Antwort bedeutet, hat keiner einen Anreiz abzuweichen. Fallen zwei Beste Antworten zusammen, ist der Ausgang ein Nash Gleichgewicht.
BesteAntwort.png

Dominante Strategien

Eine Strategie ist dominant, wenn diese Strategie ungeachtet der Reaktion der anderen Spieler immer zu einem größeren Payoff (das kann ein Nutzenniveau, Geld oder etwas anderes sein) als alle anderen Strategien führt. Als Beispiel soll die oben dargestellte Normalform dienen. Zur Vereinfachung soll nur untersucht werden, ob Spieler 1 (der Zeilenspieler) eine dominante Strategie hat. Daher wird nur der Payoff von Spieler 1 angegeben. Außerdem ist es irrelevant wie die Strategien des Spieler 2 lauten, deshalb lautet die erste Spalte einfach nur noch A und die zweite Spalte nur noch B.
DominanteStrategie.png

Ist eine der beiden Strategien für Spieler 1 dominant, so ist diese Strategie immer besser. Sollte sich der Spieler 2 für die erste zweite Spalte entscheiden, bringt eine dominante Strategie genauso den größten Payoff der Spalte, wie wenn sich der Spieler zwei für die zweite Spalte entscheidet. In dem oben dargestellten Beispiel ist der Payoff in Spalte A größer, wenn sich Spieler 1 für Verrat entscheidet (-5>-10). Auch in Spalte B ist der Payoff von Verrat größer als der von Schweigen (0>-5). Egal wie sich der Spieler 2 entscheidet, Spieler 1 sollte immer Verrat spielen. Verrat ist eine dominante Strategie und Schweigen eine dominierte Strategie. Damit knüpft der Dominanzbegriff sehr stark an des Konzept der Besten Antwort an.
Es wird zwischen strikter Dominanz und schwacher Dominanz unterschieden. Das oben dargestellte Beispiel stellt strikte Dominanz dar, denn jeder Payoff des Verrats ist strikt größer als der des Schweigens. Schwache Dominanz würde vorliegen, wenn die Payoffs größer oder gleich groß sind, solange mindestens ein Payoff strikt größer ist.
Haben zwei Spieler eine dominante Strategie, spielen sie diese auch in einem der vorhandenen Nash Gleichgewichte. Nicht jede Strategie, die im Nash Gleichgewicht gespielt wird, ist jedoch auch eine dominante Strategie.

IESDS

Das IESDS (Iterated elimination of strictly dominated strategies) ist ein Verfahren, mit dessen Hilfe für Spieler irrationale Strategien eliminiert werden. Ist eine Strategie strikt dominiert, wäre es irrational für einen Spieler diese zu spielen, da mindestens eine Strategie immer einen größeren Payoff liefert. Eine strikt dominante Strategie kann somit als Strategie gestrichen werden.
IESDS1.png IESDS2.png

Für Spieler 2 wird die Strategie X von der Strategie Y strikt dominiert (1<4; 4<5; 3<4). Unter der Annahme, dass alle Spieler rational sind, weiß auch Spieler 1, dass Spieler 2 niemals Strategie X wählen wird. Daher muss er die Payoffs in der Strategie X Spalte nicht mehr betrachten. Wenn er dies tut, wird seine Strategie 3 von Strategie 2 strikt dominiert (0<2; 0<8). Dass Strategie 3 auch von Strategie 1 strikt dominiert wird, sei an dieser Stelle auch erwähnt. Es ergibt sich eine neue Spielmatrix, da Spieler 1 niemals Strategie 3 wählen wird.
IESDS3.png IESDS4.png IESDS5.png
Mit derselben Intuition können die restlichen strikt dominierten Strategien eliminiert werden und der einzig rationale Ausgang ist (Strategie 1, Strategie Y). Bleibt nur eine Strategiekombination übrig, bildet sie immer ein Nash Gleichgewicht. Es können jedoch nicht immer mit der Hilfe des IEDS alle Nash Gleichgewichte gefunden werden.

Teilspielperfektes Nash-Gleichgewicht

Ein Gleichgewicht ist teilspielperfekt, wenn es ein Nash Gleichgewicht in jedem Teilspiel ist. Hierbei wird das Konzept der Rückwärtsinduktion angewandt. Bei der Rückwärtsinduktion wird das sequenzielle Spiel rückwärts durchlaufen und untersucht, in welchem Entscheidungspunkt (Teilspiel) welcher Spieler wie handeln wird. Das wird für alle Entscheidungspunkte analysiert unabhängig, ob diese im Gleichgewicht erreicht werden oder nicht.
TSP.png
In dem letzten Knotenpunkt, in dem ein Spieler sich entscheiden muss, entscheidet sich Spieler 2 zwischen C oder D. Der zweitgenannte Payoff ist der von Spieler 2. Im linken Knoten erhält er bei C 2 und bei D 3. Da 3>2 wählt er im ersten Fall D. Im rechten Knoten erhält er 4 bei C und 1 bei D. Hier wählt er C. Seine Strategie lautet: "Spiele D, wenn der linke Fall eintritt (Spieler 1 wählt A) und wähle C, wenn der zweite Fall eintritt (Spieler 1 wählt B)".
Spieler 1 weiß, dass das Resultat (A, D) lauten wird, sollte er sich für A entscheiden und (B, C), sollte er sich für B entscheiden. Bei (A, D) erhält er 2 und bei (B, C) erhält er 1. Daher entscheidet sich der rationale Spieler 1 für (A, D).
Das Teilspielperfekte Nash Gleichgewicht lautet:

TSP2.png

Nash Gleichgewicht und Pareto Effizienz

Nash Gleichgewichte sind nicht immer pareto effizient. Paretoeffizienz besteht, wenn keine Partei bessergestellt werden kann, ohne die andere schlechter zu stellen. Pareto effiziente Strategiekombinationen lassen sich sehr gut in der Normalform erkennen. Dafür soll wieder das Gefangenendillema vom Anfang dienen
Gefangenendilemma.png

(Schweigen, Verrat) bringt einen Payoff von (-10, 0). Spieler 1 kann sehr leicht bessergestellt werden. Spielt er zum Beispiel auch Verrat, hat er nicht mehr -10, sondern -5. Die Strategiekombination wäre (Verrat, Verrat). Dadurch wird jedoch Spieler 2 schlechter gestellt. Statt 0 hat er nun -5. (Schweigen, Verrat) ist somit eine Strategiekombination, von der aus keine Partei bessergestellt werden kann, ohne eine andere schlechter zu stellen. Es handelt sich um einen pareto effizienten Ausgang. Lediglich (Verrat, Verrat) ist nicht pareto effizient, da in (Schweigen, Schweigen) beide Spieler besser gestellt werden können.
Es ist deutlich geworden, dass der Begriff des Nash Gleichgewichts und der des Pareto Effizienz ganz andere Thematiken abdecken.

MC Aufgaben

Welche der folgenden Aussagen ist falsch?

Nicht jedes Gleichgewicht in dominanten Strategien des Spiels in Normalform ist auch ein teilspielperfektes Nash-Gleichgewicht des Spiels in extensiver Form.
Nicht jedes teilspielperfekte Nash-Gleichgewicht eines Spiels in extensiver Form ist auch ein Nash-Gleichgewicht des Spiels in Normalform.
Nicht jedes Nash-Gleichgewicht des Spiels in Normalform ist auch ein teilspielperfektes Nash-Gleichgewicht des Spiels in extensiver Form.


Die folgenden Aussagen beziehen sich auf statische Spiele. Welche Aussage ist wahr?

Es gibt gemischte Nash Gleichgewichte, in denen ein Spieler eine strikt dominierte Strategie spielt.
Jedes Strategieprofil, das das IESDS Verfahren überlebt, ist ein Nash Gleichgewicht.
Jedes Nash Gleichgewicht in reinen Strategien überlebt das IESDS Verfahren.


Welche der folgenden Aussagen ist richtig?

Das IESDS eliminiert gegebenenfalls Nash Gleichgewichte in reinen Strategien.
Das IESDS eliminiert gegebenenfalls Nash Gleichgewichte in gemischten Strategien.
Beim IESDS hängt das Ergebnis nicht von der Reihenfolge der Eliminierung ab.
Beim IESDS hängt das Ergebnis von der Reihenfolge der Eliminierung ab.