El caos estructurado

Comentarios
Índice

El dilema del prisionero

El siguiente juego fue formulado en 1950 por dos investigadores de la RAND, Melvin Dresher y Merrill Floyd, en el seno de la teoría de juegos. Aunque sería Albert W. Tacker, consejero de la RAND, quien le dio nombre a partir de la anécdota que utilizaba para contarlo.

Dos presuntos ladrones son detenidos por la policía. Cada uno de ellos porta un arma ilegal, por lo que deberían pasar seis meses en la cárcel, que se convierten en quince meses por el robo cometido. Sin embargo, la policía no tiene pruebas de esto último. Por eso se les ofrece a cada uno de ellos, por separado y si que puedan comunicarse entre sí, el siguiente trato: “si denuncias a tu compañero, tú quedas libre, siempre y cuando él no te denuncie también a ti, en cuyo caso, por haber colaborado, te rebajaríamos la pena a un año”.

Ahora nos ponemos en el pellejo de uno de los presos, llamémosle A: “si B me delata, a mí me interesa delatarle, porque así, al menos, me reducen la condena. Y si no me delata, también me interesa delatarle, porque en tal caso salgo libre”.

La conclusión es obvia: la estrategia más interesante para A es, en cualquier caso, delatar:

  • Si B no le delata
    • A delata: queda libre.
    • A no delata: 6 meses de cárcel.
  • Si B le delata
    • A delata: 12 meses.
    • A no delata: 15 meses.

El problema es que el compañero también pensará lo mismo, con lo cual, al delatarse mutuamente, pasaran cada uno un año en la cárcel, que es, sin embargo, y desde un punto de vista colectivo, la peor de las soluciones posibles:

  • A no delata y B no delata: 6 meses + 6 meses = 12 meses
  • A delata y B no delata: 0 meses + 15 meses = 15 meses
  • A no delata y B delata: 15 meses + 0 meses = 15 meses
  • A delata y B delata: 12 meses + 12 meses = 24 meses

Curiosamente, la paradoja desaparece si el juego se repite varias veces. En tal caso podemos establecer estrategias, formas de actuar en función de cómo vaya el juego. Robert Axelrod planteó un concurso en el que se enfrentarían ordenadores alimentados con distintas estrategias. La sorpresa fue que las estrategias tipo "toma y daca", es decir, aquellas que se comportan bien con el que colabora y mal con el que traiciona, resultaron ser las más eficientes... siempre y cuando no se sepa cuándo va a terminar el juego.

Y es que arrieritos somos y en el camino nos encontraremos: si nuestros actos pueden tener consecuencias en el futuro, nuestro comportamiento se verá evidentemente condicionado. Y aquí está el quid de la cuestión: cuando podemos predecir las consecuencias y cuando le podemos poner cara al otro, tendemos a la colaboración, al punto de vista colectivo, que es el que minimiza el daño y optimiza los beneficios: a un compañero, o a un tipo peligroso, no se le delata. Pero cuando no podemos precisar las consecuencias, cuando el otro no tiene cara, nos comportaremos como el preso individualista que delata. Y lo hacemos cada vez que decimos “qué más da”, cada vez que defraudamos a hacienda, cada vez que arrojamos basura al mundo, cada vez que somos negligentes trabajando, o conduciendo, incluso opinando, cada vez que nos decimos: “¿de qué va a servir que yo cumpla con las reglas si nadie lo hace?” o “si no lo hago yo lo hará otro”.


Comentarios
Índice

Fuentes:

  • En El dilema del prisionero, William Poundstone describe el dilema, su historia, las variantes y sus consecuencias éticas, políticas... Un libro muy interesante.

Última actualización: 9-5-2011


El caos estructurado
sector17