Spelteori i ekonomi: Viktighet, begränsning och andra detaljer

Spelteorin är en av de mest framstående senaste utvecklingen inom ekonomisk teori. Den presenterades först av Neumann och Morgenstern i sitt klassiska verk, Theory of Games and Economic Behavior, publicerad 1944, som har betraktats som en "sällsynt händelse" i idéhistoriken.

Spelteorin växte som ett försök att hitta lösningen på problemen med duopol, oligopol och bilateralt monopol. I alla dessa marknadssituationer är det svårt att hitta en bestämd lösning på grund av individers och organisationers motstridiga intressen och strategier.

Spelteorin försöker komma fram till olika jämviktslösningar baserade på marknadsaktörernas rationella beteende under alla tänkbara situationer. "Det omedelbara konceptet för en lösning är rimligen en uppsättning regler för varje deltagare som berättar för honom hur man beter sig i varje situation som kan uppstå."

Den bakomliggande idén bakom spelteori är att varje deltagare i ett spel står inför en situation vars utfall beror inte bara på sina egna strategier utan även på hans motståndares strategier. Det är alltid så i schack- eller pokerspel, militära strider och ekonomiska marknader.

Vi kommer främst att vara oroade över de olika lösningarna av det duopolproblem där förhandlingsprocessen är mellan två parter. Men innan vi börjar analysera teorin om spel kommer det att vara användbart att dela ut på vissa grundämnen i spelteori.

Ett spel har fastställt regler och förfaranden som två eller flera deltagare följer. En deltagare heter en spelare. En strategi är en speciell tillämpning av reglerna som leder till specifika resultat. Ett drag görs av en spelare som leder till en situation med alternativ. Ett val är det faktiska alternativet valt av en spelare.

Resultatet eller resultatet av strategin följd av varje spelare i förhållande till den andra kallas hans avlöning. Sadelpunkten i ett spel är jämviktspunkten. Det finns två typer av spel: konstant summa och icke-konstant summa. I ett spel med konstant summa vad en spelare vinner den andra förlorar. Deltagarnas vinst förblir densamma, medan i ett spel som inte är konstant summa, skiljer sig varje spelares vinster och de kan samarbeta med varandra för att öka vinsten.

Tvåpersons konstant summa eller noll summan Spel:

I ett spel med konstant summa eller nollsumma mellan två spelare är vinsten av en spelare precis lika med förlusten av den andra spelaren. "Det finns för varje spelare en strategi .... vilket ger honom den matematiska förväntan på en vinst som inte är mindre än, eller av en förlust som inte är större än ett visst värde. Det visar också att om spelarna faktiskt beter sig på detta sätt, så är de förväntade vinsterna och förlusterna faktiskt realiserade och spelet har en bestämd lösning. "

antaganden:

Tvåpersons konstant summa spel baseras på följande antaganden:

(i) En duopolistisk marknadssituation existerar med företag A och B, som försöker maximera sin vinst,

(ii) Alla är engagerade i ett konstant summa spel så att vad ett företag vinster, den andra förlorar,

(iii) Ett företags intresse är diametralt motsatt till andras,

(iv) Varje företag är i stånd att gissa strategin för den andra mot sin egen strategi för att konstruera utbetalningsmatrisen för båda. Slutligen förutsätter varje företag att dess motståndare alltid kommer att göra ett klokt drag och det skulle försöka motverka det för att skydda sig mot eventuella förluster.

Utbetalningsmatrix och strategier:

Antag att firma A har tre strategier för att maximera vinsten. De ska förbättra kvaliteten på sin produkt, annonsera den och sänka priset. Dess rivaliserande firma В har också samma alternativa strategier för att tjäna mer. A-utbetalningen visas i tabell 1. Eftersom vi är intresserade av spel med konstant summa visas strategierna för både A och В i en avbetalningsmatris, eftersom A: s vinst är B: s förlust och vice versa.

För att visa hur A och В ska välja de olika strategierna överväga det numeriska exemplet som anges i Tabell I. Om A väljer strategi 1 med ett utbetalning på 5, uppskattar det att В väljer strategi 3 med ett utbetalt 4, vilket minskar A: s vinst till dess lägsta värde eller säkerhetsvärde 4.

Detta registreras i slutet av rad 1 och början av kolumn 5. Om A väljer strategi 2 med ett värde av 3, kommer В anställa sin strategi 1 för att motverka A: s drag så att A kommer att få en minsta vinst på 2. Slutligen när En väljer strategi 3 med ett värde av 9, A: s utbetalning sänks till 8 av В när han använder strategi 3.

Vid användning av varje strategi går firma A försiktigt och antar att vilken strategi den använder, kommer dess konkurrent В alltid att anta den motstrategi som kommer att ge A minst utbetalning. Således varje gång A antar en teknik, reduceras dess vinst till det minsta av B: s motstrategi.

Därför väljer A den strategin som ger den lägsta av de tre maximala lönen i varje rad. Sålunda är A intresserad av "Row Min" -avbetalningarna 4, 2, 8 som visas i den sista kolumnen i Tabell 1. Den väljer strategi 3 eftersom den ger maximal eller bättre känd som maximinvinst på 8 vilket är den högsta bland radminima. Detta kallas maximin eller dominerande strategi som definieras som "värdet av spelet till den maximerande spelaren eftersom hans motståndare inte kan hindra honom från att förverkliga det".

Firman В är också försiktig mot motparten av sin rival A. Jag vet att vad som helst som det kommer att göra när man antar en viss strategi, kommer A att motverka det genom att anta en motstrategi och därigenom lämna В med en sämre avgång. B: s sämre avlöning innebär att A får mycket stor vinst och В lämnas med en mycket liten kvarvarande.

Det här är vad jag tycker om strategin för A. Därför väljer В det maximala utbetalningen i varje strategi eftersom den tycker att det inte kan hindra A från att vinna så mycket i varje kolumn av de tre strategierna. Om В adopterar strategi 1, väljer A strategi 3, så att den värsta avbetalningsnivån för är 10. På samma sätt, genom att anta strategi 2, ger det sämsta flyget  den maximala avgången 9; medan strategi 3 ger den avlöningen 8.

Maximal avlöning från varje strategi är således 10, 9 och 8 som visas i "Col. Max "(kolumn maxima) i Tabell 1, sista raden. Det bästa av dessa utbetalningar från B: s synvinkel är minsta kolumnmaksima, 8. Det kallas minimaxen, och metoden som används av minimatorn är minimaxstrategin. Detta är B: s dominerande strategi.

Sadelpunkten:

Sadelpunkten är jämviktspunkten. I utbetalningsmatrisen i Tabell 1 motsvarar A: s utbetalning från sin maximinstrategi 3 exakt B: s utbetalning från minimaxstrategin 3 (8 = 8). När minimaxen och maximin i en utbetalningsmatris är lika är det ett strikt bestämt spel. Båda spelarna (företag) garanteras en gemensam vinst (vinst). De kan inte vinna mer eftersom det finns en sadelpunkt i utbetalningsmatrisen som förekommer både i "Row Min" och "Col. Max”. Det är jämviktspunkten 8, som är gemensam för både A och B.

Således är ett spel med konstant summa-två personer strikt bestämt endast om det har en sadelpunkt som uppnåtts med ren strategi. Den bestämda lösningen av den duopoliska situationen som diskuterats ovan grundar sig helt på ren strategi, varigenom varje fast orsak utav vilken av de flera möjliga handlingssätten som är mest gynnsamma.

I ett unikt bestämt spel med ren strategi är det inte nödvändigt att erkänna ömsesidigt ömsesidigt beroende av delarna av duopolisterna. Den minimax-strategi som följs av В kan inte förbättras med den maximin-strategi som A har antagit om avbetalningsmatrisen har en sadelpunkt. Därför blir duopol situationen strikt bestämd. Minimaxstrategin är ett alternativ till vinstmaksimering. Genom denna strategi minimerar ett företag chanserna för maximal förlust.

Lösning utan sadelpunkt:

En mer realistisk lösning på duopolproblemet är emellertid i vilken en utbetalningsmatris inte har någon sadelpunkt. En sådan situation är obestämd eftersom det inte finns någon jämviktspunkt i "Row Min" och "Col. Max. "I den här lösningen väljer A, när A väljer en strategi med hög utbetalning, en annan strategi med ännu högre utbetalning. Utbetalningsmatrisen i tabell 2 illustrerar detta.

Om A väljer strategi 1 för att få en avgång på 7 finns det inget som hindrar В från att välja strategi 3 att få avlöningen 8. Om A väljer strategi 3 för avlöningen 5, kan В anta strategi 1 till vinst mer genom att ha 10, och så vidare. I denna avbetalningsmatris finns ingen jämviktspunkt (sadelpunkt). Om någon av de två företagen använder sin egen strategi kommer den att motverkas av den andra strategin om A håller fast vid sin maximin strategi 3, Â kommer att vinna genom att välja non minimax-strategin 1.

Det kommer att ha ett lön 10 mot A: s 6. Den enda lösningen på ett sådant problem är att använda maximin minimax strategierna. När A använder maximin-strategin, blir det 6 medan В får 7 genom att använda minimaxstrategin. Varje rädsla för att den andra kan upptäcka sitt val av strategi och vill spela det säkert för att vara säker på ett visst minimum av vinst 1, mäter skillnaden mellan 7 och 6 graden av obestämdhet. Detta beror på att maximin och minimax är ojämna, 67. Lösningen är inte stabil.

En grundläggande slutsats följer att, när avbetalningsmatrisen inte har någon sadelpunkt, överskrider minimax alltid maximin, vilket framgår av tabell 2. Anledningen är att spelaren (firmaet) A i spelet alltid väljer maximal minsta raden, medan В alltid väljer lägsta av de maximala kolumnerna.

Minimaxen är således bunden att överstiga maximin. Detta kan också bevisas algebraiskt. Antag att aij är maximin och aik minimaxen. Eftersom aij är en "Row Min.", Är den antingen mindre än eller lika med alla element i rad, inklusive aih. Aih kan dock inte överstiga aik av "Col. Max. "Vilket är maximalt i sin kolumn.

Således aij <aih <aik.

Blandade strategier:

Men duopolproblemet utan en sadelpunkt kan lösas genom att låta varje företag anta blandade strategier. En blandad strategi hänför sig till introduktionen av ett chanselement vid valmöjligheter på en probabilistisk grund. Det "är en sannolikhetsfördelning som tilldelar en bestämd sannolikhet för valet av varje ren strategi på så sätt att summan av sannolikheten är enhet för varje deltagare." Det ger bara en spelare en uppsättning tärningar att kasta och bestämma strategin att väljas. Varje spelare har ett par blandade strategier som leder till ett jämviktsläge.

Varje försöker ha det mest önskvärda förväntade värdet av spelet (eller avlöning) mot hans rival; och är därför på jakt efter en uppsättning sannolikheter för sin blandade strategi för att ha den högsta förväntade avlöningen. Detta kallas den optimala blandade strategin. Om spelet har värdet V, A försöker du ha det högsta förväntade utbetalningen V genom att spela sin blandade strategi. spelar samma blandade strategi, В kommer försöka hålla A: s förväntade utbetalning till minimum V.

För att illustrera används utbetalningsmatrisen i tabell 3 där varje duopolist har två strategier 1 och 2. Detta bord har ingen sadelpunkt. Båda ställer sig till tärningsspelet för att komma fram till en lösning. Regeln är att om A kastar tärningarna och resultatet är 1 eller 2 väljer han strategi 1 och om resultatet är 3, 4, 5 eller 6 väljer han strategi 2. Efter denna regel är sannolikheten för A att välja strategi 1 är 1/3, och för att välja strategi 2 är 2/3. В kommer att använda samma strategier men med motsatta sannolikheter för att hålla A: s förväntade utbetalning till ett minimum.

Sannolikheten att В välja strategi 1 är 2/3, och att välja strategi 2 är 1/3. Således måste var och en välja både sannolikheten. Det förväntade värdet av spelet V för A = 1/3 × 2/3 × 6 + 1/3 × 1/3 × 4 + 2/3 × 2/3 × 2 + 2 / 3x 1/3 × 6 = 36 / 9 = 4. På samma sätt är det förväntade värdet av spelet V för В = 2/3 × 1 / 3x 6 + 2/3 × 2/3 × 2 + 1/3 × 1/3 × 4 + 1/3 × 2/3 × 6 = 36/9 = 4.

Varje duopolist kommer att försöka maximera "matematisk förväntan på hans vinst" snarare än vinsten själv. Den förväntade avlöningen eller den matematiska förväntan på vinst för var och en av duopolisterna är lika med spelets värde, (F = 4) när båda antar sina optimala sannolikheter.

Om A använder sin optimala blandade strategi kan hans förväntade utbetalning inte vara mindre än V, oavsett B: s val av strategier kan vara. På samma sätt, om В använder sin optimala strategi, kan hans förväntade förlust inte vara större än V, oavsett A: s val av strategier kan vara. Sålunda är problemet alltid bestämt när blandade strategier används.

Non-Constant-Sum Games:

I spel med konstant summa kan ingen spelare påverka det kombinerade avlönet. Men i spel som inte är konstant summa om spelare A använder en optimal blandad strategi kan spelaren  öka sin förväntade utbetalning genom att inte följa samma blandade strategi. Lösningen ligger i antingen samverkan eller icke-samverkan mellan de två spelarna. Den förra är känd som kooperativ icke-konstant summa spel och det senare som icke-kooperativ icke-konstant summa spel.

Nash jämvikt:

I det kooperativa non-constant-sum-spelet är det mest rationella för de två spelarna att samla och därigenom öka sin kombinerade avlönning utan att minska någon ersättning. Men problemet är inte så enkelt som det verkar. Det är för mycket att förvänta sig att aktörerna ska agera rationellt, speciellt när problemet är att fördela sina gemensamma vinster rättvist. Nash Equilibrium försöker komma fram till en "rättvis division" genom att utvärdera utbetalningen för båda spelarna.

I Nash-jämvikt antar varje spelare en strategi som är hans bästa val, givet vad den andra spelaren gör. För att förklara Nash jämvikt, ta två spelare som är inblandade i ett enkelt spel att skriva ord. Spelet förutsätter att varje spelare skriver två ord självständigt på ett papper. Spelare A skriver "top" eller "bottom" och spelare В skriver "right" och "left". Då avslöjar granskningen av sina papper - det lönebidrag som varje har fått, vilket framgår av tabell 4.

Antag att spelare A föredrar topp och spelare В föredrar vänster från rutan Överst till vänster i matrisen. Det framgår att utbetalningen till spelare A är 2 som den första posten i den vänstra rutan och betalning till spelare В är den andra posten, 4 i den här rutan. Nästa om spelaren A föredrar botten och spelare В föredrar rätt då är utbetalningen till spelare A 2 och till spelare В är 0 i botten-höger rutan.

Från ovanstående kan vi dra slutsatsen att den spelare A har två strategier; han kan välja antingen toppen eller botten. Ur spelarens synvinkel är det alltid bättre för honom att föredra botten eftersom valen 4 och 2 är större än figurerna på toppen. Likaså är det alltid bättre för spelare В att föredra vänster eftersom val 4 och 2 är större än siffrorna till höger, dvs 2 och 0. Här är jämviktsstrategin för spelare A att föredra botten och för spelare В att föredra vänster.

Ovanstående matris avslöjar att det finns ett optimalt val av strategi för en spelare utan att överväga valet av den andra spelaren. När spelare A föredrar botten får han en högre utbetalning oavsett vilken spelare som helst föredrar. På samma sätt kommer spelare  att få en högre utbetalning om han föredrar lämnat oavsett vilken spelare A föredrar. Preferenserna längst ner och vänster dominerar de andra två alternativen och därigenom får vi jämvikt i dominerande strategier. Men den dominerande strategins jämvikt uppträder inte ofta. Matrisen i tabell 5 visar ett exempel på detta speciella fenomen.

I ovanstående matris när spelare В föredrar vänster är utbetalningarna till spelare A 4 och 0 eftersom han föredrar toppen. På samma sätt när spelare В föredrar rätt, är utbetalningarna till spelare A 0 och 2 eftersom han föredrar botten. När spelare В föredrar vänster, skulle spelare A föredra toppen, och igen när spelare В föredrar rätt, skulle spelare A föredra botten. Här är det optimala valet av spelare A baserat på vad han föreställer spelare В ska göra.

En Nash-jämvikt kan tolkas som ett par förväntningar om varje spelares val, så att när den andra spelarens val avslöjas i ovanstående matris är strategin Top-Left en Nash-jämvikt. I en Nash-jämvikt har ingen spelare ett incitament att avvika från det genom att ändra sitt eget beteende.

Non-Cooperative Non-Constant Summas Spel:

Om kollusion utesluts, går vi in ​​i riken av icke-kooperativa spel som inte är konstant summa där varje spelare agerar på sina gissningar om det andra valet av strategi. Icke-kooperativa icke-konstant summa spel kan vara av olika slag. De två spelarna styrs av egenintresse, eftersom de sannolikt kommer att vara, kan välja strategier som kan vara ömsesidigt skadliga. Prof. Tuckers "fånge dilemma" är ett intressant fall av ett icke-konstant summa spel där två fångar väcks för förhör separat.

Var och en är medveten om att båda kommer att släppas om ingen bekänner. Men var och en varnas att om en som bekänner kommer att släppas och den andra som inte bekänner kommer att bli utmärkad straff. Således, både i försök att skydda sig, kommer att bekänna och ta emot straff. Detta exempel är viktigt för att påpeka att de olika åtgärder som beskattning, rationering etc. som antagits av regeringen är utformade, åtminstone delvis, för att uppnå samarbete som ensam kan förhindra förlust för varje spelare från att han försöker skydda sig när Vie inte har någon garanti för att andra kommer att uppträda som krävs av deras gemensamma intresse. "

Ett icke-kooperativt icke-konstant summa spel kan ha flera par strategier med sadelpunkter, men de får inte ha samma lön. Om en 11 och b11 och en 2l och b2l är par av jämviktsstrategier är det vidare inte nödvändigt att en 11 och b2l eller en 21 och b11 också är jämviktspar. Om spelarna inte väljer jämviktspar av strategier kan båda vara förlorare.

Det är också möjligt att en spelare i ett icke-konstant summa spel kan publicera sin strategi som hotinformation eller för att ge information till sin motståndare för att ha någon form av kvasi-samverkan med honom som kan vara ömsesidigt fördelaktigt.

Begränsningar av spelteori:

Spelteorin har följande begränsningar:

För det första förutsätter spelteorin att varje företag har kunskap om strategierna hos den andra mot sina egna strategier och kan konstruera avbetalningsmatrisen för en möjlig lösning. Detta är ett mycket orealistiskt antagande och har liten genomförbarhet. En entreprenör är inte fullt medveten om de strategier som är tillgängliga för honom, mycket mindre de som är tillgängliga för sin rival. Han kan bara gissa på hans och hans rivals strategier.

För det andra antar teorin om spel att både duopolisterna är försiktiga män. Varje rival flyttar på den här presumtionen att hans motståndare alltid kommer att göra ett klokt drag och då antar han en motspelare. Detta är ett orealistiskt antagande eftersom entreprenörer inte alltid handlar rationellt. Men det är en entreprenör inte försiktig, han kan inte spela antingen maximin eller minimax-strategin. Således kan problemet inte lösas.

För det tredje leder de olika strategierna som följs av en konkurrent mot den andra till en oändlig tankegång som är mycket ogenomförbar. Till exempel i tabell 1 finns det inget slut på tankegången när A väljer en strategi och В antar en motstrategi och vice versa.

För det fjärde är det lätt att förstå ett tvåpersons konstant summa spel. Men som analysen utarbetas till tre eller fyra personer spel blir det komplicerat och svårt. Spelteorin har dock inte utvecklats för spel med mer än fyra spelare. De flesta ekonomiska problem medför många spelare. Antalet säljare och köpare är till exempel ganska stor i monopolistisk konkurrens och spelteorin ger inte någon lösning på det.

För det femte, även i dess tillämpning på duopol, är spelteori med sitt antagande om ett konstant summa spel orealistiskt. För det innebär att "intressanta intressen" är objektivt mätbara och överförbara. Vidare förutsätter minimax-principen som ger en lösning till det konstanta summan spelet att varje spelare gör det bästa av den värsta möjliga situationen. Hur kan den bästa situationen vara känd om det värsta inte uppstår? Dessutom handlar de flesta företagare om antagandet om att det finns gynnsamma marknadsförhållanden och frågan om att göra det bästa av det värsta uppstår inte alls.

För det sjätte är det osannolikt att användningen av blandade strategier för att bestämma icke-noll summa spelar sannolikt i reala marknadsförhållanden. Utan tvekan slumpmässigt val av strategier introducerar sekretess och osäkerhet, men de flesta företagare, som gillar sekretess i affärer, undviker osäkerhet. Det är emellertid möjligt att en oligopolist kanske önskar sina rivaler att känna till sina affärshemligheter och strategier för att komma i samverkan med dem för att tjäna maximala gemensamma vinster.

Slutsats:

Således som de andra duopolmodellerna, misslyckas spelteorin att ge en tillfredsställande lösning på duopolproblemet. "Även om spelteorin har utvecklats långt sedan 1944, " skriver Prof Watson, dess bidrag till teorin om oligopol har varit en besvikelse. "Hittills har det inte varit några allvarliga försök att tillämpa spelteori på faktiska marknadsproblem eller ekonomiska problem i allmänhet.

Trots dessa begränsningar är spelteori till hjälp för att tillhandahålla lösningar på några av de komplexa ekonomiska problemen, trots att den som en matematisk teknik fortfarande är i utvecklingsstadiet.

Betydelsen av spelteori:

Spelteori har följande fördelar:

1. Spelteorin visar vikten för duopolister att hitta något sätt att komma överens om. Det bidrar till att förklara varför duopolpriserna tenderar att administreras på ett styvt sätt. Om priserna skulle förändras ofta skulle tysta avtal inte hittas och det skulle vara svårt att genomdriva.

2. Spelteorin belyser också vikten av egenintresse i näringslivet. I spelteori dras egenintresse genom mekanismen för ekonomisk konkurrens för att sätta systemet i sadelpunkten. Detta visar existensen av den perfekt konkurrensutsatta marknaden.

3. Spelteori försöker förklara hur duopolproblemet inte kan bestämmas. För detta använder den lösningen utan sadelpunkt under spel med konstant summa-två personer. Samtidigt löses duopolproblemet utan en sadelpunkt genom att låta varje företag anta blandade strategier på sannolikhetsbasis. På detta sätt visas det att duopolproblemet alltid är bestämt.

4. Vidare har spelteori använts för att förklara marknadens jämvikt när mer än två företag är inblandade. Lösningen ligger i antingen samverkan eller icke-samverkan. Dessa är kända som kooperativ icke-konstant summa-spel respektive icke-kooperativ icke-konstant summa spel.

5. "Fångers dilemma" i spelteori pekar mot kollektivt beslutsfattande och behovet av samarbete och gemensamma regler för väg.

6. En spelare i spelteori kan betraktas som en enda person eller en organisation i den verkliga världen som är föremål för beslutsfattande med en viss mängd resurser. Strategin i spelteori är en komplett specifikation av vad en spelare kommer att göra under varje omständighet i spelets gång. Exempelvis kan en företags direktör berätta för sin säljare hur han vill att en reklamkampanj ska börja och vad ska de göra senare som svar på olika åtgärder från konkurrerande företag.

7. Betydelsen av utbetalningsvärdena ligger i att förutsäga resultatet av en rad alternativa val från spelarens sida. Således innebär en perfekt kunskap om utbetalningsmatrisen till en spelare perfekt förutsägelser av alla faktorer som påverkar resultatet av alternativa strategier. Dessutom visar minimax-principen för spelaren nästa handlingssätt som skulle minimera förlusterna om den värsta möjliga situationen uppstod.

8. Återigen är spelteori till hjälp för att lösa problemen med företag, arbete och ledning. Faktum är att en affärsman alltid försöker gissa sin motståndares strategi för att effektivisera sina planer. Liknande är fallet med ledningen för att försöka lösa problemet med fackföreningens förhandlingar om högre löner. Ledningen kan anta den mest lönsamma motstrategin för att hantera sådana problem. Vidare kan producenter fatta beslut där vinstbedömningen ska balanseras mot produktionskostnaden.

9. Sist men inte minst, det finns vissa ekonomiska problem som innebär risk och tekniska relationer. De kan hanteras med hjälp av matematisk teori om spel. Problem med linjär programmering och aktivitetsanalys kan ge huvudbasen för ekonomisk tillämpning av spelteorin.