Con fino a dieci anni di prigione in gioco, Wanda farà la spia su Fred? La teoria dei giochi è guardare le interazioni umane attraverso la lente della matematica.
******************
Quando esci con i tuoi amici, probabilmente non pensi troppo alla matematica dietro le decisioni che stai prendendo. Ma c’è un intero campo della matematica – e della scienza – che si applica alle interazioni sociali. Si chiama Teoria dei giochi.
La teoria dei giochi è stata pionierizzata negli anni ’50 dal matematico John Nash, il tipo che Russell Crowe ha interpretato in A Beautiful Mind. Ma la teoria dei giochi non riguarda i giochi nel modo in cui li pensiamo normalmente. Invece, un gioco è qualsiasi interazione tra più persone in cui il payoff di ogni persona è influenzato dalle decisioni prese dagli altri. Quindi, certo, questo potrebbe applicarsi a una partita di poker. Ma potrebbe anche applicarsi praticamente a qualsiasi situazione in cui le persone si riuniscono e si immischiano negli affari degli altri. Ad esempio, avete interagito con qualcuno oggi? Bene, probabilmente potete analizzare le decisioni che avete preso usando la teoria dei giochi.
La teoria dei giochi è incredibilmente ampia, ed è usata continuamente da economisti, scienziati politici, biologi, tattici militari e psicologi, per nominarne solo alcuni.
La teoria dei giochi ha due rami principali: teoria dei giochi cooperativi e non cooperativi, o competitivi.
La teoria dei giochi non cooperativi riguarda le interazioni sociali competitive, dove ci saranno alcuni vincitori… e alcuni perdenti. Probabilmente l’esperimento di pensiero più famoso nella teoria competitiva dei giochi è il Dilemma del prigioniero.
Il dilemma del prigioniero descrive un gioco – un’interazione sociale – che coinvolge due prigionieri. Li chiameremo Wanda e Fred. Wanda e Fred sono stati arrestati mentre fuggivano dalla scena di un crimine, e in base alle prove che la polizia ha già raccolto, dovranno passare due anni in prigione. Ma il procuratore vuole di più.
Così, offre a entrambi un accordo: se tu confessi il crimine, e il tuo partner non lo fa, ti sarà concessa l’immunità per aver collaborato. Sarai libero di andare. Il suo partner, invece, sconterà dieci anni di prigione. Se entrambi confessate e raccontate un sacco di fandonie l’uno sull’altro, allora entrambi finirete per passare cinque anni in prigione. Ma se nessuno dei due confessa, entrambi passerete solo due anni in prigione.
Queste sono le loro opzioni. Poi, Wanda e Fred si separano. Non sanno cosa farà il loro partner. Devono prendere le loro decisioni indipendentemente. Ora, Wanda e Fred – hanno passato dei momenti selvaggi rubando diamanti o altro, ma non hanno nessuna lealtà speciale l’uno verso l’altro. Non sono fratello e sorella; sono criminali incalliti.
Fred non ha motivo di pensare che Wanda non lo pugnalerà alle spalle, e viceversa. La teoria dei giochi competitivi organizza le loro scelte e le loro potenziali conseguenze in una griglia che assomiglia a questa: se sia Wanda che Fred scelgono di non confessare, entrambi sconteranno due anni.
In teoria, questo è il miglior risultato complessivo. Insieme, passerebbero il minor tempo possibile in prigione. Ma… l’immunità suona piuttosto bene. Se uno dei due sceglie di confessare e l’altro no, l’informatore se la cava. Allora i conti si fanno così:
Questo è il problema: Wanda e Fred non hanno motivo di fidarsi l’uno dell’altro. Wanda potrebbe considerare di non confessare, perché se anche Fred non confessa, entrambi scontano solo due anni. Se potessero davvero fidarsi l’uno dell’altra, sarebbe la loro migliore possibilità. Ma Wanda non può essere sicura che Fred non farà la spia. Ha molto da guadagnare confessando. Se lui decide di confessare e lei tace, lei rischia dieci anni di prigione mentre lui è libero. In confronto, i cinque anni che si prenderebbero per essersi messi l’uno contro l’altro non sembrano così male. E questa è la soluzione della teoria dei giochi: dovrebbero confessare entrambi e denunciarsi a vicenda.
Quindi, in questo momento state pensando: “Wow, la teoria dei giochi è un’idiozia”. Ma in realtà ha senso. Quel quadrato nella griglia dove entrambi confessano è l’unico risultato che ha raggiunto quello che è noto come Nash Equilibrium. Questo è un concetto chiave nella teoria dei giochi competitivi.
Un giocatore in un gioco ha trovato l’equilibrio di Nash quando fa la scelta che lo fa stare meglio indipendentemente da quello che i suoi avversari decidono di fare. Se Wanda confessa, e Fred non confessa … lei sta meglio. Riesce a andarsene libera! Confessando, è passata dal dover scontare due anni di prigione a non scontarne nessuno. Se Fred confessa… è ancora meglio per lei. Se avesse tenuto la bocca chiusa, avrebbe passato dieci anni in prigione. Ora ne deve scontare solo cinque. Certo, se lei decide di non confessare, e anche Fred mantiene la sua promessa, escono entrambi in due anni. Ma questo è uno stato instabile. Perché Wanda non può fidarsi di Fred: non sa cosa farà. Questo non è un gioco cooperativo: tutti i giocatori ci guadagnano a pugnalarsi alle spalle.
Il Dilemma del prigioniero è solo un esempio di gioco competitivo, ma l’idea di base della sua soluzione si applica a tutti i tipi di situazioni. In generale, quando si è in competizione con gli altri, ha senso scegliere il corso d’azione che porta più benefici, indipendentemente da ciò che gli altri decidono di fare.
Poi ci sono i giochi cooperativi, dove ogni giocatore ha accettato di lavorare insieme verso un obiettivo comune. Questo potrebbe essere qualsiasi cosa, da un gruppo di amici che decidono come dividere il costo per pagare il conto al ristorante, a una coalizione di nazioni che decidono come dividere il peso di fermare il cambiamento climatico.
Nella teoria dei giochi, una coalizione è come si chiama un gruppo di giocatori in un gioco cooperativo. Quando si tratta di giochi cooperativi, la questione principale della teoria dei giochi è quanto ogni giocatore dovrebbe contribuire alla coalizione e quanto dovrebbe beneficiarne. In altre parole, cerca di determinare ciò che è giusto.
Mentre la teoria dei giochi competitivi ha l’equilibrio di Nash, la teoria dei giochi cooperativi ha quello che viene chiamato il valore di Shapley. Il valore di Shapley è un metodo per dividere i guadagni o i costi tra i giocatori secondo il valore dei loro contributi individuali. Funziona applicando diversi assiomi.
Numero uno: il contributo di ogni giocatore è determinato da ciò che si guadagna o si perde eliminandolo dal gioco. Questo è chiamato il loro contributo marginale. Diciamo che ogni giorno di questa settimana tu e i tuoi amici state preparando dei biscotti. Quando ti ammali per un giorno, probabilmente per aver mangiato troppi biscotti, il gruppo produce cinquanta biscotti in meno rispetto ai giorni in cui c’eri tu. Quindi il vostro contributo marginale alla coalizione, ogni giorno, è di cinquanta biscotti.
Numero due: i giocatori intercambiabili hanno lo stesso valore. Se due parti portano le stesse cose alla coalizione, dovrebbero contribuire con la stessa quantità, e dovrebbero essere ricompensati per i loro contributi allo stesso modo. Come se due persone ordinassero la stessa cosa al ristorante, dovrebbero pagare lo stesso importo del conto. Se due lavoratori hanno le stesse capacità, dovrebbero ricevere lo stesso salario.
Numero tre: I giocatori fittizi hanno valore zero. In altre parole, se un membro di una coalizione non contribuisce a nulla, allora non dovrebbe ricevere nulla. Questo è controverso. Potrebbe significare che se vai a cena con i tuoi amici, ma non ordini nulla, non dovresti contribuire quando arriva il conto. Il che sembra giusto, in questo caso. Ma potrebbe anche significare che se qualcuno non può contribuire alla forza lavoro, non dovrebbe ricevere alcun compenso.
Il fatto è che ci sono buone ragioni per cui qualcuno potrebbe non essere in grado di contribuire: forse è in maternità. O ha avuto un incidente. O hanno qualche tipo di disabilità. In situazioni come questa, la coalizione potrebbe voler pagare qualcosa a loro nonostante non siano in grado di contribuire.
Il quarto assioma dice che se un gioco ha più parti, il costo o il pagamento dovrebbe essere decomposto su queste parti. Questo significa che, per esempio, se hai fatto un sacco di lavoro per il gruppo il lunedì, ma ti sei rilassato il martedì, le tue ricompense in ogni giorno dovrebbero essere diverse. O se hai ordinato un’insalata una sera, ma una cena a base di bistecca la sera successiva, probabilmente dovresti pagare di più la seconda sera.
In altre parole, non è sempre giusto usare la stessa soluzione ogni volta. I numeri dovrebbero essere rivisti regolarmente, in modo che la coalizione possa fare aggiustamenti. Se si trova un modo di dividere i costi o di dividere il pagamento a tutti i giocatori che soddisfa tutti questi assiomi, quello è il valore di Shapley.
Il valore di Shapley può essere espresso matematicamente.
Il che, sì, è un po’ complicato. Ma possiamo scomporre i concetti in qualcosa di meno… matematico.
Torniamo a guardare i biscotti. Tu stai cucinando dei biscotti e il tuo amico sta cucinando dei biscotti. In un’ora, potete cuocere dieci biscotti quando lavorate da soli. Il tuo amico, però, è un mago dei biscotti e nella stessa ora, lavorando da solo, riesce a fare venti biscotti. Quando si decide di fare squadra, quando si lavora insieme, si snellisce il processo.
Una persona può mescolare tutta la pastella in una volta sola o qualsiasi altra cosa, il che ti fa risparmiare un sacco di tempo. Così dopo un’ora hai quaranta biscotti. Ma se aveste lavorato da soli, avreste fatto solo 30 biscotti nella stessa ora. Poi vendete ognuno di quei biscotti per un dollaro. Ora avete quaranta dollari. Come si divide il bottino?
L’equazione del valore di Shapley ti dice di pensarla così (vedi video):
Se prendi il fatto che puoi fare dieci biscotti all’ora e li sottrai dal totale, il tuo amico avrà il credito per gli altri trenta biscotti. Questo è quello che succede quando togliete il vostro amico dal sistema: il suo contributo marginale per voi è di trenta biscotti. Ma se prendi il fatto che il tuo amico può fare venti biscotti all’ora, e lo sottrai dal totale, questo ti dà credito per venti biscotti. Perché se sei rimosso dal sistema di produzione di biscotti del tuo amico, il tuo contributo marginale per lui è di venti biscotti.
Nel primo caso, il tuo valore per la coalizione era solo dieci biscotti. Ma nel secondo caso, il tuo valore per la coalizione è di venti biscotti. Secondo l’equazione del valore di Shapley, dovresti fare la media di questi due numeri insieme. Dieci più venti fa trenta, diviso due fa quindici. Quindi, l’equazione di Shapley dice che tu dovresti ricevere quindici dollari e il tuo amico venticinque.
Questo metodo può essere scalato fino a coalizioni con centinaia di giocatori, trovando i loro contributi marginali ad ogni altro giocatore e poi calcolando la media di tutti questi numeri.
Le interazioni possono diventare molto più complicate del Dilemma del Prigioniero o della cottura dei biscotti, quindi c’è molto di più nella teoria dei giochi. Ma si riduce a questo: in una situazione competitiva, la teoria dei giochi può dirvi come essere intelligenti. E in una situazione di cooperazione, la teoria dei giochi può dirvi come essere giusti.