Teoria dei giochi

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

La teoria dei giochi è una disciplina che studia modelli matematici di interazione strategica tra agenti razionali.[1] La teoria dei giochi ha applicazioni in vari campi delle scienze sociali, così come nella logica, nella teoria dei sistemi e nell'informatica. Sebbene originariamente si sia focalizzata sui giochi a somma zero, in cui i guadagni o le perdite di ogni partecipante sono perfettamente bilanciati da quelli degli altri, la teoria dei giochi contemporanea si applica ad una vasta gamma di relazioni comportamentali e indica ormai genericamente la scienza delle decisioni logiche negli esseri umani, negli animali e nei calcolatori.[2][3][4]

La teoria dei giochi moderna nasce con l'idea di equilibri in strategie miste per giochi a somma zero a due giocatori e con la corrispondente dimostrazione di esistenza proposta da John von Neumann.[5] La dimostrazione originale di von Neumann utilizza il teorema del punto fisso di Brouwer per le mappe continue su insiemi convessi compatti; questo metodo di dimostrazione è diventato standard nella teoria dei giochi e in economia matematica. L'articolo di von Neumann fu seguito dal suo libro del 1944, Theory of Games and Economic Behavior, scritto in collaborazione con Oskar Morgenstern, in cui vengono considerati anche giochi cooperativi a più giocatori. La seconda edizione di questo libro ha fornito una teoria assiomatica dell'utilità attesa, che ha permesso a studiosi di statistica ed economia di modellare ed analizzare i comportamenti decisionali in situazioni di incertezza.[6]

La teoria dei giochi è stata sviluppata negli anni cinquanta da molti studiosi. È stata esplicitamente applicata all'evoluzione naturale negli anni settanta, sebbene sviluppi simili risalgano già almeno agli anni trenta.[7] La teoria dei giochi è stata riconosciuta come uno strumento importante in molti campi. Alla data del 2014, anno in cui il premio Nobel per l'economia è stato assegnato al teorico dei giochi Jean Tirole, undici teorici dei giochi hanno vinto un premio Nobel per l'economia.[8] John Maynard Smith è stato insignito del Premio Crafoord per la sua applicazione della teoria dei giochi all'evoluzione naturale.[9]

John von Neumann
John Nash

Le prime discussioni sulla matematica dei giochi risalgono a ben prima della nascita della moderna teoria matematica dei giochi. Girolamo Cardano elabora un trattato sui giochi d'azzardo nel Liber de ludo aleae (Libro sui giochi d'azzardo), scritto nel 1564 circa ma pubblicato postumo nel 1663. Negli anni 1650, Pascal e Huygens sviluppano il concetto di valore atteso ragionando sulla struttura dei giochi d'azzardo, e Huygens pubblica la sua analisi dei giochi d'azzardo nel De ratiociniis in ludo aleæ (Sul ragionamento nei giochi d'azzardo) nel 1657.

Nel 1713, in una lettera attribuita a Charles Waldegrave, un giacobita, viene analizzato un gioco di carte chiamato le Her.[10][11] In questa lettera, Waldegrave fornisce una soluzione minimax in strategie miste per una versione a due giocatori di tale gioco.

Nel 1838, nel suo Recherches sur les principes mathématiques de la théorie des richesses (Ricerche sui principi matematici della teoria delle ricchezze), Antoine Augustin Cournot considera una situazione di duopolio e ne presenta una soluzione che corrisponde ad un equilibrio di Nash del gioco.

Nel 1913 Ernst Zermelo pubblica Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels (Su un'applicazione della teoria degli insiemi alla teoria del gioco degli scacchi), in cui dimostra che il gioco degli scacchi è "strettamente determinato", cioè che tale gioco ammette un equilibrio strategico.[12]

L'espressione "teoria dei giochi" viene usata per la prima volta da Emil Borel negli anni venti. Borel si occupa nella Théorie des jeux di giochi a somma zero con due giocatori e cerca di determinare una soluzione poi divenuta nota come concetto di von Neumann di soluzione di un gioco a somma zero.

La nascita della moderna teoria dei giochi può essere fatta coincidere con la pubblicazione dell'articolo On the Theory of Games of Strategy di John von Neumann nel 1928,[5] in cui von Neumann dimostra l'esistenza di equilibri per giochi a somma zero attraverso il teorema del punto fisso di Brouwer per mappe continue in insiemi convessi compatti, mettendo a punto un metodo che sarebbe poi diventato standard in teoria dei giochi e in economia matematica. L'articolo di von Neumann fu seguito nel 1944 dal libro Theory of Games and Economic Behavior di John von Neumann e Oskar Morgenstern[6]. La seconda edizione di questo libro fornisce una teoria assiomatica dell'utilità, una reincarnazione della vecchia teoria dell'utilità di Daniel Bernoulli in una nuova disciplina. Il fondamentale lavoro di von Neumann e Morgenstern include un metodo per determinare soluzioni mutuamente consistenti per giochi a somma zero con due giocatori.

Nel 1950 appaiono le prime discussioni del dilemma del prigioniero, uno scenario investigato dai matematici Merrill M. Flood e Melvin Dresher nell'ambito delle indagini della RAND Corporation sulla teoria dei giochi. La RAND intraprendeva questi studi per le loro possibili applicazioni alle strategie nucleari globali.[13] Più o meno contemporaneamente, John Nash elabora un criterio per la mutua consistenza delle strategie dei giocatori, noto come equilibrio di Nash, applicabile ad una gamma di giochi più ampia rispetto al criterio proposto da von Neumann e Morgenstern. Nash dimostra che ogni gioco non-cooperativo finito, con più giocatori, anche non a somma zero, ammette un cosiddetto equilibrio di Nash in strategie miste.

La teoria dei giochi si sviluppa grandemente negli anni cinquanta, durante i quali vengono elaborati i concetti di nucleo, gioco in forma estesa, gioco ripetuto, e valore di Shapley. Gli anni cinquanta vedono anche le prime applicazioni della teoria dei giochi alle scienze politiche e alla filosofia.

Risultati premiati

[modifica | modifica wikitesto]

Undici premi Nobel per l'economia sono stati assegnati a studiosi che si sono occupati di teoria dei giochi. Anche un Premio Crafoord è stato assegnato a John Maynard Smith, illustre biologo e genetista, professore alla University of Sussex per lungo tempo, per il suo contributo in questo campo.

Nel 1965, Reinhard Selten introduce il concetto di soluzione noto come equilibrio perfetto nei sottogiochi (subgame perfect equilibrium), che raffina ulteriormente il concetto di equilibrio di Nash. Più tardi, Selten introduce anche il concetto di equilibrio "della mano tremolante" (trembling hand equilibrium). Nel 1994, Nash, Selten e Harsanyi ricevono il premio Nobel per l'economia per i loro contributi alla teoria dei giochi.

Negli anni settanta, la teoria dei giochi è stata molto applicata in biologia, in gran parte come risultato dei lavori di John Maynard Smith e del suo concetto di strategie evolutivamente stabili. Vengono inoltre introdotti i concetti di equilibrio correlato, equilibrio della mano tremolante, e di conoscenza comune (common knowledge).

Nel 2005, anche i teorici dei giochi Thomas Schelling e Robert Aumann ricevono un premio Nobel per l'economia. Schelling si è occupato di modelli che anticipavano la teoria dei giochi evolutiva. Aumann ha introdotto il concetto di equilibrio correlato e ha sviluppato un'estesa analisi formale dell'assunzione della conoscenza comune e delle sue conseguenze.

Nel 2007, Leonid Hurwicz, Eric Maskin, e Roger Myerson hanno ricevuto il premio Nobel per l'economia "per aver gettato le basi della teoria del progetto di meccanismi (mechanism design)". I contributi di Myerson includono la nozione di equilibrio proprio, e un importante testo monografico: Game Theory, Analysis of Conflict.[14]. Hurwicz ha introdotto e formalizzato il concetto di "compatibilità con gli incentivi" (incentive compatibility).

Nel 2012, Alvin E. Roth e Lloyd S. Shapley hanno ricevuto il premio Nobel per l'economia "per la teoria delle allocazioni stabili e per la pratica della progettazione dei mercati". Nel 2014, il premio Nobel per l'economia è andato al teorico dei giochi Jean Tirole.

In Italia, un forte contributo allo sviluppo della teoria dei giochi è stato dato dal "Centro Interuniversitario per la Teoria dei Giochi e le sue Applicazioni" ("CITG"), grazie all'organizzazione di convegni nazionali e internazionali, scuole estive e diffusione via rete di informazioni (tra cui il Pool Listing, elenco aggiornato di preprint in tema, precedentemente curato dalla Università di Bielefeld e pubblicato sullo International Journal of Game Theory). Il CITG, che era stato promosso dagli atenei di Bergamo, Firenze e Pavia, è stato creato nel 1990[15] ed è stato chiuso nel 2005 per avere raggiunto i suoi scopi istituzionali.

Nel modello della teoria dei giochi la premessa indispensabile è che l'obiettivo è vincere; tutti devono essere a conoscenza delle regole del gioco, ed essere consapevoli delle conseguenze di ogni singola mossa. La mossa, o l'insieme delle mosse, che un individuo intende fare viene chiamata "strategia". In dipendenza poi delle strategie adottate da tutti i giocatori (o agenti), ognuno riceve un "pay-off" (che in inglese significa: compenso, vincita, pagamento, ma anche esito) secondo un'adeguata unità di misura. Tale compenso può essere positivo, negativo o nullo. Un gioco si dice "a somma costante" se per ogni vincita di un giocatore vi è una corrispondente perdita per altri. In particolare, un gioco che risulta "a somma zero" fra due giocatori rappresenta la situazione in cui il pagamento viene corrisposto da un giocatore all'altro. La strategia da seguire è strettamente determinata se ne esiste una che è soddisfacente per tutti i giocatori; altrimenti è necessario calcolare e rendere massima la speranza matematica del giocatore o valore atteso, che è la media ponderata dei possibili compensi (sia positivi sia negativi), ciascuno moltiplicato (pesato) per le rispettive probabilità di essere assunto (ossia di verificarsi).

Descrizione informale dei giochi

[modifica | modifica wikitesto]

In un gioco esistono uno o più contendenti che cercano di vincere, ovvero di massimizzare la propria vincita. La vincita è definita da una regola (funzione) che stabilisce quantitativamente qual è la vincita dei contendenti in funzione del loro comportamento. Tale funzione è detta "funzione dei pagamenti". Ogni giocatore può intraprendere un numero finito (o infinito, nel caso più astratto possibile) di azioni o decisioni che determinano una strategia. Ogni strategia è caratterizzata da una conseguenza per il giocatore che l'ha adottata e che può essere un premio o una penalità. Il risultato del gioco è completamente determinato infine dalla sequenza delle loro strategie e dalle strategie adottate dagli altri giocatori.

Ma come caratterizzare il risultato del gioco per ogni giocatore? Se si misura la conseguenza di una strategia in "termini monetari", ogni strategia può essere messa in corrispondenza con un valore: un valore negativo indicherà un pagamento all'avversario, ossia una penalità; mentre un valore positivo indicherà una vincita, ossia la riscossione di un premio. Il guadagno o la perdita spettante al generico giocatore associata alla sua strategia e alle strategie prese in un dato istante da tutti i restanti giocatori è espresso dal valore monetario indicato dalla funzione dei pagamenti. Le decisioni prese da un giocatore naturalmente si scontrano o sono in accordo con le decisioni prese dagli altri giocatori e da simili situazioni nascono varie tipologie di giochi (ad es.: giochi cooperativi o non-cooperativi).

Uno strumento utile per rappresentare le interazioni tra due giocatori, due imprese o due individui è una matrice o tabella delle decisioni a doppia entrata. Questa tabella delle decisioni serve a mostrare le strategie e le vincite di un gioco condotto da due giocatori.

La matrice delle decisioni è quindi una rappresentazione attraverso la quale cataloghiamo tutti i possibili risultati delle interazioni fra giocatori e assegniamo il valore della vincita che in ciascuna situazione compete a ciascun giocatore. Altra forma di rappresentazione riguarda la sequenza con la quale ogni decisione viene assunta o le azioni vengono condotte. Questa caratteristica di ogni gioco può essere descritta mediante un grafo ad albero, rappresentando ogni possibile combinazione di giocate dei contendenti da uno stato iniziale sino agli stati finali dove vengono ripartite le vincite.

Tipi di giochi

[modifica | modifica wikitesto]

I giochi possono essere classificati in base a diversi paradigmi:

  • Cooperazione;
  • Rappresentazione;
  • Somma.

Un gioco cooperativo si presenta quando gli interessi dei giocatori non sono in opposizione diretta tra loro, ma esiste una comunanza di interessi. I giocatori perseguono un fine comune, almeno per la durata del gioco, alcuni di essi possono tendere ad associarsi per migliorare il proprio "pay-off". La garanzia è data dagli accordi vincolanti.

Qual è la rappresentazione matematica di una comunanza di interessi? Il concetto di unione di singoli interessi individuali in una coalizione o alleanza è espresso dalla definizione di gioco essenziale; mentre il valore v di una generica coalizione G è misurato da una funzione detta funzione caratteristica. Indicato con R= l'insieme degli n giocatori, possono esistere arbitrari sottoinsiemi G⊆R che rappresentano una coalizione tali per cui G appaia agli effetti del gioco come un unico giocatore. La funzione caratteristica è proprio definita sull'insieme delle parti di R, ossia sull'insieme di tutti i sottoinsiemi G⊆R ed associa ad ogni coalizione un numero: V(G):= v. Naturalmente V(∅):= 0 in quanto è nullo il pagamento per la coalizione vuota, quella costituita da nessun giocatore. Un gioco ad n-persone è detto essenziale se

con k=1,..., e per ogni i≠j.

In sostanza un gioco essenziale è intrinsecamente di natura cooperativa quando tutte le possibili coalizioni costituibili tra gli n giocatori "vedono" che esiste un valore del gioco V(R) che domina la semplice unione dei pagamenti conseguibili dalle singole alleanze . In R tutti i giocatori interagiscono e dalle reciproche relazioni traggono il mutuo vantaggio V(R).

Si possono avere due sottogeneri, i giochi NTU ed i giochi TU.

"Non Transferable Utility": a utilità non trasferibile o senza pagamenti laterali. In questi casi, nel campo dell'economia industriale, in una situazione di oligopolio può insorgere il fenomeno della collusione.

"Transferable Utility": a utilità trasferibile o con pagamenti laterali, nei quali deve esistere un mezzo, denaro o altro, per il trasferimento dell'utilità.

La suddivisione della vincita avviene in relazione al ruolo svolto da ciascun giocatore, secondo la sua strategia ed i suoi accordi (per i "giochi TU" vanno aggiunti i pagamenti o i trasferimenti ottenuti durante il gioco).

Nei giochi a 2 persone con funzione dei pagamenti a somma costante, per definizione esistono due schieramenti G ed , quest'ultima è la coalizione avversa a G essendo l'insieme complementare di G. I giochi a due persone sono tali per cui per ogni coalizione G⊆R si ha

I giochi a due persone a somma costante mostrano quindi di non essere essenziali, ovvero la loro vera natura non è di carattere cooperativo. Quest'ultima asserzione è un teorema matematico per la cui dimostrazione formale si rimanda alla lettura del teorema 41 in E. Burger, Introduction to the Theory of Games. Nei giochi a somma costante se i giocatori si coalizzassero in R conseguirebbero il medesimo risultato se giocassero separatamente: . Nei giochi essenziali, per i quali vale l'adagio "l'unione fa la forza", i giocatori collaborando si garantiscono un guadagno superiore a quello che otterrebbero giocando individualmente. In generale la cooperazione può essere richiesta esplicitamente dalle regole del gioco: è il caso in cui è il gioco stesso ad imporre per ogni giocatore la scelta di uno o più partner; oppure la cooperazione può sorgere in quanto la funzione dei pagamenti non ammette a priori un valore unico. La funzione caratteristica descrive semplicemente quanto una coalizione ottenga dai propri avversari, ma non dice nulla di come i guadagni vengano divisi tra gli alleati della coalizione stessa. John von Neumann e Oskar Morgenstern si sono avvicinati al problema dei giochi cooperativi caratterizzandoli per il fatto che una coalizione di individui ha ragione di esistere se e solo se verificano due condizioni relative alla distribuzione delle vincite tra i membri della coalizione. Le due condizioni sono:

1) ogni spartizione dei "guadagni" conseguibili tra i giocatori non appartenenti alla coalizione è inferiore alla spartizione dei "guadagni" effettuata tra i giocatori appartenenti alla coalizione;

2) nessuna spartizione dei guadagni all'interno della coalizione è superiore a qualche altra possibile distribuzione dei "guadagni" all'interno della coalizione.

La proprietà 1) afferma che la coalizione è vincente perché è più remunerativa e, in conclusione, tutti vorrebbero entrarvi. In sintesi le soluzioni dei gioco devono essere efficienti: non esistono altre soluzioni che migliorano i risultati conseguibili dai membri della coalizione.

La proprietà 2) assicura che il credo (trust) adottato all'interno della coalizione è libero da contraddizioni interne che minerebbero la fiducia reciproca tra i membri; in poche parole le vincite vengono distribuite equamente tra tutti i membri della coalizione senza preferenze o favoritismi di sorta.

Giochi non cooperativi

[modifica | modifica wikitesto]

Nei giochi non cooperativi, detti anche giochi competitivi, i giocatori non possono stipulare accordi vincolanti (anche normativamente), indipendentemente dai loro obiettivi. A questa categoria risponde la soluzione data da John Nash con il suo Equilibrio di Nash, probabilmente la nozione più famosa per quel che riguarda l'intera teoria, grazie al suo vastissimo campo di applicabilità. Il criterio di comportamento razionale adottato nei giochi non-cooperativi è di carattere individuale ed è chiamato strategia del massimo.

Una definizione di razionalità siffatta caratterizza il comportamento di un individuo “intelligente ottimista” in quanto si prefigge l'obiettivo ottimista di prendere sempre la decisione che consegue il massimo guadagno possibile. In sostanza il comportamento di ogni giocatore è tale da perseguire sempre la strategia più vantaggiosa per se stesso. Qualora nel gioco esista una strategia che presenta il massimo guadagno per tutti i giocatori si parla di punto di equilibrio.

Un punto di equilibrio in un gioco in cui si attua la strategia del massimo esprime il fatto che tutti i giocatori conseguono sì il massimo guadagno individuale, ma anche quello collettivo. Il punto di equilibrio di Nash esprime in un certo senso un comportamento razionale socialmente utile dal momento che tutti i giocatori ottengono un pagamento che presenta la convergenza degli interessi di tutti i giocatori. John Nash ha dimostrato che ogni gioco finito ad n giocatori ammette almeno un punto di equilibrio in strategie miste, tale teorema faceva parte della sua tesi di dottorato.

Giochi ripetuti nel tempo

[modifica | modifica wikitesto]
Lo stesso argomento in dettaglio: Dilemma del prigioniero.

Alcuni tipi di gioco che portano gli agenti a giocare più di una volta, trasformando i pay off tramite un vincolo intertemporale, pur considerando lo stesso schema di gioco iniziale. Nel caso di giochi ad informazione perfetta essi possono essere ricondotti alla forma normale di Borel, ossia a giochi sprovvisti della dimensione temporale.

Un esempio di questi è il dilemma del prigioniero ripetuto infinite volte.

Giochi a informazione perfetta e completa

[modifica | modifica wikitesto]
Lo stesso argomento in dettaglio: Gioco a informazione completa.

Nei giochi a informazione perfetta, in ogni momento, si conosce con certezza la storia delle giocate precedenti. In termini più tecnici, si tratta di giochi in cui in ogni momento del gioco si può capire in quale nodo della rappresentazione ad albero del gioco (rappresentazione estesa) ci si trova. Un concetto molto simile è quello di gioco a informazione completa, in cui ogni giocatore ha una conoscenza completa del contesto ma non necessariamente delle azioni degli altri giocatori, per esempio perché le mosse dei diversi giocatori devono avvenire simultaneamente (vedi il dilemma del prigioniero).

Esempi di giochi a informazione perfetta:

Giochi finiti

[modifica | modifica wikitesto]

Giochi in cui il numero delle situazioni di gioco possibili è finito, ma il numero delle situazioni può essere assai elevato.

Esempi:

Rappresentazione

[modifica | modifica wikitesto]

Giochi a somma zero

[modifica | modifica wikitesto]

I giochi a somma zero sono un caso particolare dei giochi a somma costante in cui la costante è pari a zero. I giochi a somma zero modellano tutte quelle situazioni conflittuali in cui la contrapposizione dei due giocatori è totale: la vincita di un giocatore coincide esattamente con la perdita dell'altro. La somma delle vincite dei due contendenti in funzione delle strategie utilizzate è cioè sempre zero. Negli scacchi ad esempio significa che i soli tre risultati possibili (rappresentando la vittoria con 1, la sconfitta con -1 e il pareggio con 0) possono essere: 1,-1 se vince il bianco; -1,1 se vince il nero; 0,0 se pareggiano[16]. Non esiste ad esempio il caso in cui vincono entrambi o perdono entrambi.

Esempi a informazione perfetta

Esempi a informazione imperfetta

Un gioco di strategia viene descritto da Von Neumann come un certo numero di scelte ed eventi ognuno dei quali determina un numero finito di risultati diversi. Gli eventi sono fortuiti, ossia sono frutto del caso e come tale nessun individuo è in grado di determinarne il risultato o meglio di influenzarne l’esito. Al più gli individui conoscono le probabilità con le quali i diversi risultati appaiono. Le scelte invece dipendono dal libero arbitrio degli individui, ossia dalle decisioni prese liberamente dai giocatori. La teoria dei giochi si concentra sull'effetto che la scelta di ogni giocatore ha su tutti gli altri, ossia esamina l’effetto congiunto originato da scelte individuali laddove la ratio dietro ogni scelta è la ricerca del proprio vantaggio. Il destino di ogni giocatore appare così dipendere non solo dalle proprie scelte/azioni, ma influenza ed è influenzato dalle azioni degli altri individui allorquando tutti i giocatori sono guidati nel proprio agire unicamente dall'interesse personale. Von Neumann inoltre ritiene inaccettabile ipotizzare che un giocatore, prima di compiere la propria scelta, possa conoscere le scelte dei restanti giocatori ed il risultato dell’evento casuale. Al momento di prendere la decisione il giocatore non può prevedere o dire quali saranno le sue scelte nel corso del gioco in corrispondenza delle scelte prese dagli altri giocatori; se così fosse tale eventualità implicherebbe una restrizione al suo stesso libero arbitrio. Un giocatore infatti che conoscesse in anticipo le mosse degli altri, nel momento in cui dovesse effettuare la propria scelta, questa risulterebbe condizionata dalle scelte compiute dagli altri ed in ultima analisi dunque il giocatore non potrebbe fare altro che subire passivamente le scelte dei restanti giocatori e del caso. Ecco dunque motivata la ragione per cui si ipotizza che le scelte dei giocatori vengano prese simultaneamente.

Il numero di eventi che dipendono dal caso sia in numero ; indicato con il numero il numero di esiti possibili per ciascun evento, la probabilità associata a ciascun risultato originato dall'evento casuale l-esimo è

con  ed è tale che  con  per ogni .

I risultati che possono verificarsi sono in numero finito : tale numero costituisce tutte le combinazioni possibili degli eventi ed è pari a

in accordo alla regola fondamentale del calcolo combinatorio. Indicato con la probabilità con cui gli risultati casuali si realizzano, Von Neumann semplifica la descrizione dei giochi riconduce l’azione degli eventi separati casuali ad un singolo evento aleatorio semplicemente combinando gli eventi in accordo alla teoria delle probabilità e del calcolo combinatorio. Considerando un unico evento dipendente dal caso ed indicato con il suo risultato tra gli possibili, se i giocatori sono in numero n>1 e ciascuno dispone di scelte con ed indicato con la scelta di ogni giocatore i-esimo, allora il giocatore i-esimo ottiene dagli altri giocatori un certo ammontare (pagamento) che può essere descritto da una funzione a valori reali di variabili

La dipendenza funzionale dalle variabili esprime dunque sia la reciproca dipendenza dalle scelte compiute dagli giocatori che dell’effetto casuale . Considerati coralmente gli giocatori percepiscono all’unisono il seguente risultato:

L’equazione a fondamento dei giochi a somma zero è la seguente identità

che viene assunta da Von Neumann valere per qualsiasi . La sua validità esprime la circostanza che i giocatori effettuano dei pagamenti l’uno all’altro, ma come collettivo non guadagnano né perdono nulla. Ciò che avviene non è né creazione né distruzione di ricchezza, ma una sua semplice ridistribuzione tra gli giocatori a seguito delle loro scelte e di un’azione casuale (invisibile) che determinano il pagamento che ogni giocatore fa all’altro. Si osservi che nessun giocatore è in grado di stabilire in anticipo il valore di in quanto il suo valore dipende dalle variabili di cui una sola, la , è determinata dal giocatore i-esimo: le restanti variabili dipendono dalla scelta dei restanti giocatori e dal risultato casuale . In sintesi ogni giocatore effettua la propria scelta senza conoscere la scelta effettuata dagli altri partecipanti o dall’azione del caso o come si dice adottano le proprie decisioni simultaneamente. Von Neumann ricorrendo al concetto probabilistico di valore atteso è in grado di “eliminare” dalla struttura del gioco la nozione di evento aleatorio: se risultati casuali accadono ciascuno con probabilità e sono stabilite le scelte dei giocatori allora il valore atteso del risultato per il giocatore generico risulta essere

Poiché implica allora restringersi a considerare solo le scelte degli giocatori non altera la struttura del gioco che continua ad essere a somma zero.

Giochi a due persone, n=2

[modifica | modifica wikitesto]

Per definizione di gioco a somma zero è

dove indica la scelta del giocatore 1 e la scelta del giocatore 2. Il giocatore 1 dispone di scelte chiamate strategie, il giocatore 2 di scelte anch’esse denominate strategie. Se si indica la funzione dei pagamenti per il giocatore 1 con

la funzione dei pagamenti per il giocatore 2 risulta essere

pertanto un gioco a due persone a somma zero caratterizza un gioco in cui gli esiti per i due giocatori sono opposti: la perdita per uno corrisponde esattamente al guadagno per l’altro. Von Nuemann immagina che entrambi i giocatori agiscano unicamente in base ai propri interessi personali: il giocatore 1 e 2 perseguono l’obiettivo di massimizzare il proprio guadagno. Il giocatore cerca di massimizzare , mentre il giocatore 2 cerca di massimizzare e, dal momento che

,

il giocatore 2 cerca di minimizzare in riferimento alla funzione dei pagamenti dell’avversario. Il giocatore massimizzante 1 effettua una scelta e la sua perdita o il suo guadagno dipenderanno dalla scelta dell’avversario: in ogni caso può essere certo che

per qualsiasi scelta effettuata dal giocatore avverso. Il giocatore 1 se sceglie opportunamente , può essere certo del risultato seguente

indipendentemente dalla scelta compiuta dal giocatore 2. Il giocatore minimizzante 2 ragionando in modo analogo conclude che se sceglie opportunamente , può essere certo del risultato seguente

indipendentemente dalla scelta del giocatore 1. Dalla definizione di minimo si ha

per ogni

da cui si deduce che

Scelto tale che si può scrivere

per qualsiasi.

In particolare scelto risulta

Dalla definizione di massimo si ha

per ogni

da cui si deduce che

Scelto tale che si può scrivere

per qualsiasi.

In particolare scelto risulta

Per confronto si conclude che

Tutte le volte che vige la diseguaglianza appena scritta i due giocatori non sono certi di conseguire un risultato che costituisca il migliore risultato per sé stessi. Von Neumann conclude così che è impossibile per ognuno dei due giocatori agire in modo più intelligente dell’avversario in quanto l’esito del gioco risulta per entrambi imprevedibile. Nei giochi invece per cui si abbia

il giocatore massimizzante 1 ed il giocatore minimizzante 2 conseguono il comune valore . L’esito del gioco risulta quindi essere determinato dal momento che il criterio del massimo adottato dal giocatore 1 ed il criterio del minimo adottato dal giocatore 2 conducono ad un risultato comune che viene ritenuto razionale da entrambi i giocatori. Il giocatore massimizzante sceglie in modo tale che , il giocatore minimizzante sceglie tale che . L’eguaglianza implica che il giocatore 1 scegliendo percepirà la vincita

,

laddove il giocatore 2 scegliendo dovrà pagare la somma

.

In sintesi se vige l’eguaglianza, i giocatori, adottando la scelta ritenuta più razionale, fanno sì che l’esito del gioco sia determinato: qualora ripetano il gioco moltissime volte il risultato del gioco è e sarà sempre lo stesso indipendentemente da chi tra i due giocatori sia il miglior psicologo o stratega. Allorquando il gioco venga ripetuto diverse volte risulta chiara la ragione per cui un giocatore non voglia compiere sempre la medesima scelta: il giocatore avverso infatti potrebbe accorgersi e avvantaggiarsi del fatto che l’avversario effettui sempre la medesima scelta. In una lunga sequenza di giochi ripetuti un giocatore pertanto desidererà giocare irregolarmente, ossia compiere diverse scelte con diverse frequenze (probabilità). Von Neumann con il proposito di matematizzare questo modo di giocare introduce il concetto di strategia mista, ossia una strategia statistica che consiste nel mischiare i diversi modi di giocare selezionando le strategie con assegnate probabilità scelte dal giocatore. Sebbene il caso sia stato oscurato nei giochi mediante l’introduzione della nozione di valor atteso nell’esito delle decisioni, la dipendenza dei giochi dal caso riappare invero nelle vesti di strategia mista, ossia nel modo con cui i giocatori si affidano al caso per selezionare la propria scelta e nel mettersi così al riparo dall'eventualità che la propria strategia venga scoperta dall'avversario. Il giocatore 1 non sceglie più uno dei numeri , piuttosto specifica probabilità tali che , successivamente estrae da un’urna contenente i numeri con le probabilità associate ed appena specificate ed adotta come scelta il numero effettivamente estratto. Altrettanto fa l’altro giocatore associando a ciascuna scelta una probabilità: . Il valore atteso per il giocatore 1 risulta dunque essere

ed il valore atteso per il giocatore 2 è

.

Naturalmente, nessuno proibisce ad un giocatore di compiere una scelta ben determinata, ossia di indirizzarsi verso una specifica strategia escludendo tutte le altre. In tale circostanza il giocatore porrà pari a 1 la probabilità di tale scelta e pari a 0 la probabilità di scelta di tutte le restanti . Una simile circostanza si rappresenta con vettori del tipo

che vengono appellati come strategie pure. La libertà di scelta in mano ai giocatori risiede dunque nella possibilità di affidarsi o meno al caso per prendere decisioni. Il teorema del minimax garantisce che in tutti i giochi a due persone per la forma bilineare esiste sempre un punto di equilibrio costituito da strategie miste:

i due giocatori dispongono così di strategie miste che li proteggono completamente dall'eventualità che la loro strategia venga scoperta dall'avversario; si osservi che non tutte le strategie miste ottimali sono pure e per queste ultime in generale vale

Un gioco a somma zero in forma normale a due giocatori si esprime come: + ≡ 0 ∀ ∧ ∀ dove e

Se il gioco è finito, le funzioni dei pagamenti e possono essere rappresentate per mezzo di una matrice costituita da m righe ed n colonne. I due giocatori 1 e 2 conoscono il contenuto della matrice dei pagamenti ed il gioco consiste per ogni giocatore k nello scegliere una strategia senza conoscere la scelta dell'altro.

In riferimento alla matrice dei pagamenti del giocatore 1 si pone

= e = -

La scelta di una strategia da parte del giocatore 1 corrisponde alla scelta di una riga, mentre per il giocatore 2 corrisponde alla scelta di una colonna. Il giocatore 2 verserà al giocatore 1 la somma indicata all'intersezione della riga scelta dal giocatore 1 con la colonna scelta dal giocatore 2. Il desiderio del giocatore 2 sarà pertanto di minimizzare il pagamento dovuto al giocatore 1, ovvero il giocatore 2 volendo massimizzare = - cercherà di minimizzare . Il desiderio del giocatore 1 sarà invece di massimizzare il pagamento ricevuto dal giocatore 2, ovvero il giocatore 1 volendo massimizzare = cercherà di massimizzare . In sostanza il comportamento dei due giocatori è esattamente opposto: il giocatore 1 si dice giocatore massimizzante, mentre il giocatore 2 si dice giocatore minimizzante. In modo simmetrico se si desse al giocatore 2 la matrice dei pagamenti che lui dovrebbe ricevere dal giocatore 1, = , allora il giocatore 1 diverrebbe il giocatore minimizzante ed il giocatore 2 quello massimizzante.

A questo punto l'attenzione dei due giocatori si rivolge al medesimo oggetto: la matrice . Il giocatore 1 cerca di massimizzare , ma il suo controllo è limitato solo alla scelta di una riga. Idem per il giocatore 2 che cerca di minimizzare : il suo controllo è limitato solo alla scelta di una colonna. Quale sarà il criterio di scelta dei due giocatori antagonisti?

John von Neumann ha risposto a tale quesito mediante il seguente criterio: il giocatore 1 rileva dapprima il numero più piccolo di ogni riga e decide di scegliere la riga che contiene il più grande dei valori monetari considerati: in questo modo egli è certo che la sua vincita non sarà inferiore al valore

qualunque sia la scelta del giocatore 2. Il giocatore 2 da parte sua considera il numero più grande di ogni colonna e decide di scegliere la colonna che contiene il più piccolo dei numeri considerati: così egli è certo che la sua perdita non sarà superiore al valore

qualunque sia la scelta del giocatore 1. Quanto appena descritto rappresenta la definizione di comportamento razionale data da John von Neumann e ad essa comunemente ci si riferisce come principio della scelta minimax.

La coppia di strategie , costituiscono un punto di equilibrio, punto di sella, nel senso di Von Neumann se valgono le due condizioni:

1)

2)

La condizione 1) si riferisce al giocatore massimizzante, la 2) al giocatore minimizzante. Il punto di equilibrio in un gioco fondato sul principio minimax per la scelta delle strategia rappresenta il fatto che entrambi i giocatori attuano decisioni compatibili con i fini che entrambi si erano proposti di raggiungere: il punto di equilibrio , rappresenta ovvero la convergenza degli interessi dei due avversari e pertanto si è soliti riferirsi alle strategie di equilibrio come alle strategie ottimali. Von Neumann ha dimostrato che ogni gioco a somma zero a due persone a informazione completa e con albero del gioco finito ammette strategie ottimali per entrambi i giocatori. Alla luce del teorema appena menzionato il principio del minimax risulta essere giustificatamente a fondamento della teoria del comportamento razionale nei giochi a somma zero in quanto introduce in modo rigoroso le strategie minimax e queste si dimostrano essere le strategie ottimali in corrispondenza delle quali il gioco presenta un valore ottimale per entrambi

=V*= avendo scelto arbitrariamente =

J. von Neumann agli arbori della sua ricerca si era promesso di determinare se per un gioco qualsiasi esistesse una strategia/decisione migliore in riferimento ad un criterio di ottimalità prefissato. Nell'articolo "Communication on the Borel notes"[17] J. von Neumann riconobbe ad Emile Borel il merito di essere stato il primo autore ad aver introdotto il principio di scelta del maximin ed a sviluppare il concetto di strategia sia pura che mista; tuttavia nello stesso articolo J. von Neumann fece osservare che il matematico francese analizzò solo il caso dei giochi simmetrici a due persone e che la rilevanza del principio di scelta del maximin ebbe impatto limitato in quanto nel 1921 E. Borel pensò che il “teorema del minimax” fosse falso o possibilmente falso per un numero elevato di giocatori, maggiore di sette. Dunque senza il teorema del minimax non ci sarebbe la teoria dei giochi come oggi è conosciuta.

In ultimo si fa osservare che la definizione di equilibrio secondo Von Neumann data nei giochi a somma zero è la "traduzione" del concetto di equilibrio nel senso di Nash data per i giochi non-cooperativi. Nel seguito si illustra come passare dal concetto di equilibrio di Von Neumann al concetto di equilibrio di Nash: basta ricordare che per un gioco a somma zero si ha: = e = . Diviene allora lecito scrivere:

La prima condizione di equilibrio nel senso di Von Neumann pertanto è la prima condizione di equilibrio nel senso di Nash riferita al giocatore 1. Per il giocatore 2 invece diviene:

ovvero

Per concludere nel campo della programmazione matematica si ricorda che un gioco a somma zero a due giocatori può sempre essere ricondotto a una coppia di programmi lineari mutuamente duali, il cui valore ottimale dei due problemi corrisponde al valore del gioco V*.

Sia

la matrice dei pagamenti rappresentativa di un gioco a somma zero a due giocatori: avendo indicato con

Per il giocatore massimizzante si ha il seguente problema primale:

soggetta ai vincoli:

Per il giocatore minimizzante (problema duale) si ha:

soggetta ai vincoli:

Osservazioni sui vincoli

  • I primi n vincoli per il giocatore massimizzante (m per il giocatore minimizzante) indicano che la strategia da scegliere dovrà conseguire un guadagno (una perdita) non inferiore a (non superiore a ).
  • Il vincolo che pone uguale ad 1 la somma delle strategie fa sì che la somma delle probabilità delle strategie sia pari a 1 in quanto si riferiscono ad alternative disgiunte ed esaustive.
  • Le m strategie pure del giocatore 1 e le n strategie pure del giocatore 2 si esprimono come variabili booleane nelle componenti.

Giochi a tre o più persone, n>2

[modifica | modifica wikitesto]

I giochi a più di 2 giocatori presentano una natura diversa dai giochi a due giocatori dove si ha una pura opposizione negli interessi dei due giocatori; nei giochi a tre persone può invece emergere la cooperazione tra i partecipanti. La scelta di un giocatore infatti potrebbe essere svantaggiosa per entrambi gli altri due giocatori, ma potrebbe anche risultare vantaggiosa per uno e svantaggiosa per l’altro. La possibilità di un “parallelismo” nelle scelte conduce alla formazione di coalizioni o alleanze.

Giochi a somma non zero

[modifica | modifica wikitesto]

In cui la somma di cui al punto precedente non è zero almeno in un caso.

Esempi:

I giochi a somma non costante sono implicitamente giochi a somma non nulla; mentre tutti i giochi a somma costante sono riconducibili a giochi a somma zero senza alterare l'esito del gioco.

Le applicazioni e le interazioni della teoria sono molteplici: dal campo economico e finanziario a quello strategico-militare, dalla politica alla sociologia, dalla logica alla scienza dei sistemi, dalla psicologia all'informatica, dalla biologia allo sport, introducendo l'azione del caso, connessa alle possibili scelte che gli individui hanno a disposizione per raggiungere determinati obiettivi, che possono essere:

  • uguali
  • comuni, ma non identici
  • differenti
  • individuali
  • individuali e comuni
  • contrastanti.

Possono essere presenti anche aspetti aleatori.

Ecco alcuni esempi di situazioni che possono essere analizzate utilizzando la teoria dei giochi.

Se il giocatore è un venditore, le sue mosse possono essere: aumentare, diminuire o lasciare invariati i prezzi delle sue merci; le mosse di un acquirente possono invece essere: cambiare, restare fedeli a un prodotto o a un fornitore; le mosse di un responsabile di logistica militare possono essere: inviare un convoglio lungo un certo percorso, piuttosto che lungo un altro. Per esempio, i convogli possono essere inviati periodicamente, per il 30% dei viaggi su un percorso e per il 70% su un altro; i prezzi dei prodotti possono essere variati in rotazione e così via.

Un altro esempio di situazioni conflittuali è il celebre dilemma del prigioniero.

  1. ^ (EN) Myerson 1991, p.1
  2. ^ (EN) Aumann 1987
  3. ^ Teoria dei giochi. Enciclopedia Treccani.
  4. ^ (EN) Game theory. Stanford Encyclopedia of Philosophy. Jan 25, 1997
  5. ^ a b (EN) von Neumann 1928
  6. ^ a b (EN) von Neumann e Morgenstern 1944
  7. ^ (EN) Fisher 1930
  8. ^ (EN) All Prizes in Economic Sciences. NobelPrize.org.
  9. ^ (EN) The Crafoord Prize 1999.
  10. ^ (EN) David R. Bellhouse, The Problem of Waldegrave (PDF), in Journal Électronique d'Histoire des Probabilités et de la Statistique, vol. 3, n. 2, 2007.
  11. ^ (EN) David R. Bellhouse, Le Her and Other Problems in Probability Discussed by Bernoulli, Montmort and Waldegrave, in Statistical Science, vol. 30, n. 1, 2015, pp. 26–39, DOI:10.1214/14-STS469, arXiv:1504.01950.
  12. ^ (DE) Zermelo 1913
  13. ^ (EN) Prisoner's Dilemma. Steven Kuhn, Stanford Encyclopedia of Philosophy. 2 Aprile 2019.
  14. ^ (EN) Myerson 1991
  15. ^ Breve cronistoria dei convegni italiani di Teoria dei Giochi
  16. ^ Ai fini delle classifiche dei tornei in caso di pareggio il punteggio è (1/2, 1/2) quindi entrambi i due giocatori pareggiando "vincono" qualcosa rispetto ad un altro giocatore del torneo che perde con un avversario
  17. ^ John von Neumann, Communication on the Borel notes, Econometrica - Vol. 21, 1953, p. 124-125.

Manuali in italiano

[modifica | modifica wikitesto]
  • Robert Gibbons, Teoria dei giochi, Il Mulino, 2005, ISBN 8815108238.
  • Ferdinando Colombo, Introduzione alla teoria dei giochi, Carocci, 2003, ISBN 8843027980.

Testi di riferimento correnti

[modifica | modifica wikitesto]

Testi di importanza storica

[modifica | modifica wikitesto]

Voci correlate

[modifica | modifica wikitesto]

Altri progetti

[modifica | modifica wikitesto]

Collegamenti esterni

[modifica | modifica wikitesto]
Controllo di autoritàThesaurus BNCF 21854 · LCCN (ENsh85052941 · GND (DE4056243-8 · BNE (ESXX4576411 (data) · BNF (FRcb11941518c (data) · J9U (ENHE987007557922805171 · NDL (ENJA00574436
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica