You are on page 1of 36

Microeconoma II

Teora de Juegos y Aplicaciones


Aldo Gonzalez T.

Daniel Hojman T.

Fabian Sep
ulveda C.
Esta version: 10 de marzo de 2014, Primera version: Agosto 2012

Captulo 1

Teora de Juegos
1.1.

Introducci
on

En muchas situaciones donde un sujeto debe tomar una decision, el resultado que obtenga depender
a no solo de sus propias acciones, sino tambien de las decisiones que tomen otros individuos. Por su
parte, los resultados de esos otros individuos tambien dependen de la decision del sujeto en cuesti
on.
As, un agente en este tipo de situaci
on se cuestionara que haran los demas... y que piensan los dem
as
que har
a el mismo. Esta interdependencia -que se puede observar en una amplia variedad de situaciones sociales- se conoce como interacci
on estrategica. Cuando la interaccion estrategica sea un elemento
fundamental en la toma de decisiones entre individuos, hablaremos de situacion estrategica.
El objetivo de la teora de juegos es estudiar el comportamiento de individuos en situaciones estrategicas. Y aunque el enfasis est
a puesto en las decisiones que son tomadas de forma individual, una
de las dimensiones m
as interesantes de la teora es que permite hacer predicciones respecto de los resultados agregados que divergen de los resultados clasicos en economa, en el sentido de que la motivaci
on
individual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. Mas en general, la teora de juegos es u
til para analizar diversas situaciones de interes economico, como mercados
poco competitivos, asimetras de informacion, cumplimiento bajo contratos incompletos, etc. Adem
as,
tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biologa.

Una tipologa de juegos


Algo que conviene tener en mente antes de comenzar el estudio formal de la teora de juegos es que,
dependiendo del contexto o la situaci
on que nos interese, la interaccion estrategica puede manifestarse en
diferentes formas. Por ejemplo, la situacion estrategica mas sencilla que podemos pensar es una en la cual
cada agente involucrado debe tomar una decision de forma simultanea considerando el efecto que tienen
las decisiones de los dem
as en el resultado propio. Pero pensemos, por otro lado, en un juego de ajedrez
donde cada jugador toma decisiones en funcion de lo que ha ocurrido previamente y de lo que espera que
ocurrir
a en el futuro. En este u
ltimo caso existe un elemento secuencial relevante, pues las decisiones
tomadas en por un jugador incidir
an en las jugadas subsecuentes. As, cuando analicemos situaciones del
primero tipo hablaremos de juegos est
aticos, mientras que en el segundo caso nos referiremos a juegos
din
amicos.
Otro elemento que puede diferir seg
un la situacion que nos interese dice relacion con la informaci
on
que posee cada jugador respecto de los demas. Por ejemplo, pensemos en una subasta a sobre cerrado,
donde cada potencial comprador debe hacer una u
nica oferta y aquel que ofrezca un mayor pago se lleva

Facultad de Economa y Negocios - Universidad de Chile

el bien subastado. Si un postor no conoce la valoracion de los demas por el bien en cuestion, entonces
se enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador,
u ofrecer un pago m
as bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En este
ejemplo, la valoraci
on que tiene cada comprador sobre el bien es informacion valiosa, en tanto el poseerla
o no incidir
a en la decisi
on tomada.
Cuando en una situaci
on estrategica no exista informacion privada como la descrita en el parrafo
anterior, hablaremos de juegos de informaci
on completa, mientras que cuando existe informacion sobre
los jugadores que no sea de conocimiento com
un se tratara de juegos de informaci
on incompleta. As, una
tipologa de juegos muy general nos permite clasificar las diferentes situaciones estrategicas en cuatro
categoras:
Juegos est
aticos de informaci
on completa
Juegos din
amicos de informaci
on completa
Juegos est
aticos de informaci
on incompleta
Juegos din
amicos de informaci
on incompleta
Cada uno de estos tipos de juego involucra -en terminos de la teora- conceptos e instrumentos levemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estara puesto sobre los
juegos de informaci
on completa, partiendo por los de tipo estatico, para luego analizar las situaciones
que requieran un elemento din
amico. Los juegos de informacion incompleta, aunque no seran estudiados
al mismo nivel de profundidad, ser
an relevantes en el captulo correspondiente a economa de la informaci
on.

Ejemplos clasicos
En las siguientes secciones estudiaremos en detalle la terminologa y las tecnicas que se utilizan al
analizar situaciones estrategicas bajo la perspectiva de la teora de juegos. Pero para introducir cu
ales
ser
an los elementos b
asicos en los que pondremos nuestra atencion, a continuacion se muestran algunos
juegos cl
asicos que son u
tiles para ejemplificar ciertos tipos de interaccion estrategica donde destaca
alguna dimensi
on como la cooperaci
on, la coordinacion, el conflicto, etc.
El primer ejemplo que revisaremos es probablemente uno de los juegos mas famosos, conocido como el
dilema del prisionero. La situaci
on consiste en dos sospechosos que han sido arrestados y son mantenidos
en celdas separadas. La polica solo tiene evidencia suficiente para acusar a cada uno de un delito menor,
pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro
(confesar). As, si ambos guardan silencio (callar) entonces cada uno sera sentenciado por el delito
menor y pasar
a un a
no en prisi
on. Si solo uno de ellos confiesa, entonces sera liberado por cooperar con
la polica, mientras que su c
omplice ser
a condenado a 9 meses. Finalmente, si ambos confiesan entonces
cada uno pasar
a 6 meses en prisi
on.
Aunque toda la informaci
on relevante para entender esta situacion se encuentra en el parrafo anterior,
muchos juegos en los que nos interesaremos pueden ser resumidos de forma comoda en lo que se conoce
como una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuaci
on:
Prisionero 2

Prisionero 1

Callar

Confesar

Callar

-1, -1

-9, 0

Confesar

0, -9

-6, -6

Figura 1.1: Dilema del prisionero

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

La forma en la que est


a escrita esta matriz nos indica que el jugador que llamamos prisionero 1
elige una acci
on entre las dos posibles filas callar y confesar. Por su parte, el prisionero 2 puede
elegir entre las mismas alternativas, pero que en la matriz estan representadas por las columnas. Los
n
umeros en cada celda de la matriz nos indican los pagos que recibe cada uno seg
un las estrategias
escogidas, donde convencionalmente se entiende que el primer n
umero corresponde al pago del jugador
que elige filas (prisionero 1 en este ejemplo), mientras el segundo corresponde al pago del jugador que
elige columnas. Por ejemplo, si el prisionero 1 elige confesar y el 2 callar, la celda correspondiente indica
(0, 9) porque aquel que confes
o saldra libre mientras que el que callo sera condenado a 9 meses. En
general, los n
umeros asociados a los pagos no tienen por que tener una interpretacion concreta como en
este caso, y los utilizaremos simplemente para indicar que aquellos resultados con un pago mayor son
preferidos a los que tienen un pago menor.
Viendo la matriz de pagos es f
acil notar que resulta mas conveniente para ambos la situacion en la
que cada uno guarda silencio por sobre la alternativa en la que cada uno confiesa. As, el resultado en
el que ambos eligen callar es uno cooperativo, en tanto les permite asegurar una sentencia menor. El
dilema est
a en el hecho de que bajo el resultado cooperativo, existe una tentacion individual a romper la
cooperaci
on y confesar para salir en libertad. Esta tension entre la cooperacion social y el interes propio
se presenta en diversas situaciones cotidianas (es el mismo principio que se aplica en el analisis de la
provisi
on de bienes p
ublicos), y es capturada de forma sencilla en este juego. El analisis de los posibles
resultados de este juego lo dejamos para las secciones siguientes.
Para motivar el siguiente ejemplo, pensemos en situaciones donde la cooperacion no es lo relevante,
sino que los intereses de los jugadores estan completamente contrapuestos porque -por ejemplo- lo que
gana uno lo pierde el otro.1 Un juego que ejemplifica esto se conoce como matching pennies y consiste
en dos jugadores, cada uno de los cuales tiene una moneda y debe mostrar una cara de esta. Si ambos
muestran la misma cara, entonces el jugador 1 gana el juego y se lleva las dos monedas; mientras que si
muestran distintas caras, entonces el jugador 2 gana el juego y el derecho a quedarse las monedas. Esta
mec
anica se resume en la siguiente matriz de pagos:
Jugador 2

Jugador 1

Cara

Sello

Cara

1, 1

1, 1

Sello

1, 1

1, 1

Figura 1.2: Matching Pennies


En este tipo de juegos el conflicto entre los jugadores es el elemento relevante, y la razon fundamental
por la que existe interacci
on estrategica es porque a cada uno le gustara saber que es lo que har
a el
otro pero que el otro no sepa lo que hara el primero. Podemos pensar -por ejemplo- en la ejecucion de
forma simplificada de un penal en un partido de f
utbol: el arquero debe elegir si saltar a la izquierda o
a la derecha, mientras que el tirador debe elegir si patear a la izquierda o a la derecha. Al igual que en
el juego de las monedas, el exito de uno de los jugadores significa el fracaso del otro.
Otro elemento que puede resultar relevante en ciertas situaciones, y que podemos capturar en un
juego sencillo, es la coordinaci
on. El ejemplo clasico en este contexto se conoce como la batalla de los
sexos 2 , cuya historia cuenta que una pareja tena una cita, pero cada uno olvido el lugar de encuentro
(que puede ser un partido de f
utbol o el museo) y ya no pueden ponerse en contacto para aclararlo.
1 A veces se denominan juegos de suma cero, pues no se generan ganancias netas de la interacci
on entre los agentes.
Esto es, dado alg
un resultado, la suma de los pagos de los jugadores es cero.
2 El nombre es un tanto anacr
onico, pues hace referencia a una concepci
on sexista de las preferencias por entretenci
on.
En los ejemplos modernos del juego, como el que se presenta aqu, se intenta eliminar este elemento aun cuando se conserva
el nombre.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

Adem
as, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el f
utbol y
Manuel por el museo), pero que de todos modos ambos prefieren la compa
na del otro por sobre ir a su
lugar favorito solos. As, la matriz de pagos asociada al juego es la siguiente:
Manuel

Josefa

F
utbol

Museo

F
utbol

2,1

0,0

Museo

0,0

1,2

Figura 1.3: Batalla de los sexos


En este caso el conflicto no es la dimension relevante, sino la necesidad de coordinacion para alcanzar
un resultado conveniente. Como cada uno tiene preferencias distintas respecto de los lugares de encuentro, no resulta obvio a cu
al de estos deben dirigirse y eventualmente pueden terminar en diferentes sitios,
lo que no es conveniente en ning
un caso.
Los ejemplos anteriores son una muestra del tipo de problematicas que se puede capturar de manera
muy sencilla en forma de juegos con dos estrategias y dos jugadores. Sin embargo, estudiaremos juegos
con estructuras m
as generales, donde puede haber mas jugadores u otros tipos de estrategias. Para esto,
en la siguiente secci
on se introducen los conceptos que utilizaremos a lo largo del curso y se define de
manera formal la idea de juego introducida con estos ejemplos.

1.2.

Conceptos b
asicos y definici
on de juego

Para el estudio formal de la teora de juegos requerimos de un marco teorico sobre el cual poder
trabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos en
juegos que b
asicamente son una situacion cotidiana y que resultan intuitivos de entender, para poder
utilizar el instrumental que la teora nos entrega necesitamos definir de forma concreta ciertos aspectos
que resultan claves para entender la interaccion estrategica que puede darse entre los agentes en la
situaci
on que queramos estudiar.
As, si queremos analizar situaciones estrategicas desde una perspectiva de juegos, es necesario que
nos preguntemos cuestiones como, quienes toman decisiones relevantes en esta situacion?, cuales son
las distintas opciones que tiene cada uno?, cuales son las preferencias que tienen sobre los posibles
resultados finales cada jugador?. Esta u
ltima pregunta es particularmente relevante ya que en ella
est
a implcita la potencial interacci
on estrategica presente en el juego.
En terminos generales, los elementos que hay que definir con precision para estructurar un juego son:
Jugadores: Son los agentes (individuos, firmas, organizaciones, pases, etc) que toman decisiones relevantes en la determinaci
on del resultado final.
Estrategias: Estas explicitan cu
al es la decision que debe tomar cada jugador, y entre cuales alternativas puede elegir. Notar que esta nocion es bastante general, ya que una estrategia puede ir desde
algo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaborado
como elegir un plan de acci
on completo para cada posible situacion en la que se encuentre el
jugador.
Pagos: Corresponde a alguna forma de definir la valoracion que tienen los individuos respecto de los
posibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

A por sobre el B, y este u


ltimo por sobre el C), o una funcion de utilidad definida sobre las
estrategias de todos los jugadores.
Reglas del juego: Es fundamental definir si las decisiones se toman en forma simultanea o existe alg
un
elemento temporal, y en este u
ltimo caso, determinar que informacion se maneja al momento de
tomar una decisi
on3 .
Podemos notar que son varias las dimensiones a tener en consideracion al momento de analizar
una situaci
on estrategica. Es por ello que nos gustara resumir todas las caractersticas de un juego en
alguna estructura relativamente simple y bien definida. Para este proposito existen dos maneras basicas
de plantear un juego: las denominadas forma normal y forma extensiva. En esta seccion vamos a definir
un juego en forma normal, y dejaremos la forma extensiva para el caso de juegos secuenciales, en donde
nos resultar
a m
as u
til.
Antes de entregar una definici
on formal de juego en forma normal estudiaremos un ejemplo diferente a
los vistos en la secci
on anterior. Se trata de un modelo de competencia imperfecta entre firmas, conocido
como modelo de Cournot. Pensemos en un mercado en el cual existen dos empresas que producen un
mismo bien, cuya demanda agregada esta dada por una funcion P (Q) = A Q, donde P es el precio de
mercado y Q la producci
on agregada. Cada una de las firmas i = 1, 2 elige una cantidad a producir qi ,
de modo que Q = q1 + q2 . Adem
as cada firma enfrenta un costo marginal constante que denotaremos c.
As, los beneficios de cada firma est
an dados, respectivamente, por:
1 = (A q1 q2 )q1 cq1
2 = (A q1 q2 )q2 cq2
La competencia que se da entre estas firmas al momento de elegir sus niveles de produccion en forma
simult
anea, puede ser entendida como un juego. En efecto, la interaccion estrategica es fundamental
en este caso, ya que el precio que enfrente la firma dependera de la produccion de su competidora, y
as depender
a tambien su nivel de produccion optimo.
Lo relevante del ejemplo -por el momento- es notar que este juego, aun cuando solo tiene 2 jugadores,
no puede ser escrito de forma matricial, porque cada jugador tiene un conjunto de posibilidades muy
grande sobre el cual elegir: cualquier nivel de produccion (n
umero real) es un nivel de produccion factible
para la firma. As, escribir este juego en forma matricial no es solo poco conveniente, sino que es imposible
ya que se trata de un espacio de estrategias continuo.
Pero adem
as de enfrentarnos a diferentes tipos de estrategias seg
un el tipo de juego, podemos enfrentarnos a otras situaciones que hacen de la matriz de pagos un esquema poco conveniente en varios casos.
Pensemos, por ejemplo, en el mismo juego de competencia a la Cournot, pero con n firmas, donde
Pn n es
un n
umero cualquiera mayor que 1. En este caso, la produccion agregada viene dada por Q = i=1 qi ,
y tenemos que la funci
on de beneficio es, para cada firma:

n
X
i = A
qj qi cqi
i = 1, ..., n
j=1

Tener una cantidad mayor de jugadores tambien hace complicado el uso de las matrices de pagos
para plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto mas general para definir
un juego, que nos permita utilizar los conceptos desarrollados por la teora en diversas situaciones,
independiente de cuestiones como el tipo de estrategias existentes o el n
umero de jugadores. Este esquema
es la forma normal de un juego.
3 Una cuesti
on clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidas
por los que jugaron antes que
el.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

Para definir formalmente esta estructura, introduciremos un poco de notacion que sera utilizada
regularmente en lo sucesivo. Consideraremos juegos de n jugadores, que seran indizados por la letra i,
de modo que i = 1, ..., n. Adem
as denotaremos con Si al conjunto de estrategias del jugador i-esimo, y
con si Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemos
como perfil de estrategias s = (s1 , s2 , ..., sn ) a una combinacion particular de estrategias individuales.
Finalmente, la informaci
on respecto a las preferencias o pagos puede ser resumidas en funciones de
utilidad que asocian a cada perfil de estrategias s un n
umero real ui (s), de modo que si un perfil s es
preferido a un perfil s por el individuo i, se cumple que ui (
s) > ui (
s).4
Definici
on 1. Un juego en forma normal viene dado por:
1. Un conjunto de n jugadores, denotado por I
2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponibles
para cada uno
3. Una funci
on de utilidad ui (s1 , ..., sn ) para cada jugador i = 1, ..., n, que define el pago que recibe
el jugador i si el juego se resuelve seg
un el perfil (s1 , ..., sn )
Formalmente, podemos resumir toda la informaci
on del juego en una estructura G = hI, {Si }ni=1 , {ui }ni=1 i
Esta forma de definir un juego es particularmente conveniente para el caso de juegos estaticos,
donde cada jugador elige simult
aneamente una accion entre un conjunto de posibilidades. Por ejemplo,
para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si =
{Callar, Confesar} y un posible perfil de estrategias sera (Callar, Callar).5 La funcion de utilidad en
este caso es discreta, y se puede escribir como:

1 si (s1 , s2 ) = (Callar, Callar)

9 si (s1 , s2 ) = (Callar, Confesar)


u1 (s1 , s2 ) =
0 si (s1 , s2 ) = (Confesar, Callar)

6 si (s1 , s2 ) = (Confesar, Confesar)


y de forma an
aloga para el jugador 2. Notar que en este ejemplo en particular se trata de un juego
simetrico, donde las estrategias y los pagos son iguales para cada jugador. En general, esto no tiene
por que ser as, y podemos pensar en juegos donde cada jugador toma distintas decisiones y/o tiene
diferentes preferencias sobre los potenciales resultados.
Por su parte, para el caso de la competencia a la Cournot con n firmas, el juego queda definido por
los siguientes elementos:
I = {1, 2, ..., n}
Si = R, para cada i en I


Pn
ui (q1 , ..., qn ) = A j=1 qj qi cqi , para cada i en I
Podemos notar que aunque este juego es mucho mas grande que los juegos de la introduccion, en
el sentido de que hay n jugadores e infinitas estrategias disponibles para cada uno, la forma normal del
4 Notar que, tal como estudiamos en Microeconom
a I, la funci
on de utilidad tiene un car
acter ordinal. Esto es, los
n
umeros que entrega no tienen necesariamente interpretaci
on en si mismo, sino que indican la preferencia de un resultado
del juego por sobre otro
5 Una aclaraci
on de notaci
on: en el primer caso utilizamos los smbolos { } porque estamos haciendo referencia a un
conjunto -el de todas las opciones disponibles para el jugador i-, mientras que en u
ltimo utilizamos ( ) porque se trata
de un par ordenado -el que indica las estrategias seguidas por los jugadores 1 y 2 respectivamente.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

juego resume toda la informaci


on relevante de una forma comoda y nos permitira utilizar el instrumental
que estudiaremos en las secciones siguiente sin restringirnos a estructuras muy particulares (como lo
son, por ejemplo, las matrices de pagos).

1.3.

Estrategias dominantes y dominadas

El objetivo de estudiar teora de juegos es ser capaces de hacer predicciones sobre cual resultado
podramos esperar que se diera en una situacion estrategica. As, el paso natural luego de formalizar
la idea de juego es preguntarse c
omo lo resolvemos, o mas en general, que podemos decir respecto del
comportamiento esperado de los jugadores. Los conceptos presentados a continuacion son una primera
aproximaci
on a estas preguntas.
Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuestion probablemente se estara preguntando si su c
omplice va a confesar o guardara silencio. Si el otro va a confesar,
entonces lo mejor para el sera confesar tambien, pues de ese modo pasara 6 meses en prision, en vez
de los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugador
preferira confesar, pues as sale libre por cooperar con la polica, en vez de pasar un mes cumpliendo
sentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le convendr
a confesar. En este caso, diremos que confesar es una estrategia dominante para el jugador, ya
que otorga un pago mayor sin importar cual es la estrategia que siga el otro.
Definici
on 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejor
pago para ese jugador, sin importar cu
al estrategia sigan los dem
as jugadores.
En el caso del dilema del prisionero, la estrategia confesar es dominante para cada jugador, por lo
que proponer que ambos seguir
an esta estrategia parece una prediccion natural. As, de acuerdo a este
criterio, el resultado del juego sera (confesar, confesar) seg
un lo cual cada jugador recibe un pago de
(9).
Aunque plantear que un jugador siempre preferira una estrategia dominante por sobre otras estrategias resulta muy intuitivo y es potencialmente una buena prediccion de los resultados de un juego,
nos enfrentamos al problema de que no siempre existiran este tipo de estrategias. En efecto, en general
tendremos que la estrategia
optima de cada jugador variara seg
un las estrategias que sigan los dem
as,
lo cual es un elemento la mayora de las veces relevante en situaciones estrategicas. As, el concepto de
estrategia dominante puede ser muy atractivo, pero poco u
til en muchas aplicaciones.
Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otro
concepto u
til e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existe
otra estrategia que siempre resulta m
as conveniente. Consideremos el siguiente ejemplo para ver de
que se trata:
Jugador B

Jugador A

Izquierda

Centro

Derecha

Arriba

10,10

14,12

14,15

Medio

12,14

20,20

28,15

Abajo

15,14

25,28

25,25

Figura 1.4: Estrategias dominadas


Comprobemos en primer lugar que no existen estrategias dominantes. En efecto, si el jugador B
juega centro, el A preferir
a abajo (porque 25 es preferido a 20 y a 14), mientras que si el B elige derecha,
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

entonces al A le convendr
a jugar medio (porque 28 es preferido a 25 y a 14). As, no existe una estrategia
para el jugador A que sea
optima en cualquier caso (de forma analoga se puede comprobar que para el
B tampoco existe).
No obstante, en este juego s existen estrategias dominadas. Por ejemplo, la estrategia arriba es
dominada por la estrategia medio para el jugador A, ya que esta u
ltima le entrega un pago mayor sin
importar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). As, aun cuando mediono es una estrategia
dominante seg
un lo discutido en el p
arrafo anterior, s es correcto afirmar que domina a la estrategia
arriba.
Definici
on 3. La estrategia s0i est
a estrictamente dominada por la estrategia s00i para el jugador i, si
00
es que ui (s1 , ..., si , ..., sn ) > ui (s1 , ..., s0i , ..., sn ) para cualquier combinaci
on de estrategias de los dem
as
jugadores (s1 , ..., si1 , si+1 , ..., sn ).
De la definici
on se desprende que la estrategia s00i no es necesariamente una estrategia dominante, ya
que es superior bajo cualquier circunstancia solamente respecto de la estrategia s0i . En nuestro ejemplo
vimos que la estrategia medio del jugador A no siempre es superior a la estrategia abajo, pues
dependa de la estrategia jugada por B; sin embargo, es claro que medio s es superior a arriba, sin
importar lo que haga B.
Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilema
del prisionero para proponer un potencial resultado del juego. En que nos pueden ayudar entonces las
estrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizara una estrategia estrictamente dominada, pues no importa que supuesto haga sobre la estrategia que seguira el otro jugador,
siempre tendr
a una alternativa superior a la estrategia que esta dominada. Mas aun, si nos ponemos en
el lugar del jugador B -quien est
a conjeturando sobre la posible estrategia que seguira su contrapartees razonable pensar que descartar
a la posibilidad de que el jugador A siga una estrategia estrictamente dominada, como lo es la estrategia arriba. As, ambos jugadores eliminaran esta posibilidad y se
enfocar
an en un juego reducido que no considera la estrategia estrictamente dominada:
Jugador B

Jugador A

Izquierda

Centro

Derecha

Medio

12,14

20,20

28,15

Abajo

15,14

25,28

25,25

Figura 1.5: Juego reducido


Si analizamos para este nuevo juego las posibilidades del jugador B, notaremos que la estrategia
centro es estrictamente dominante. Como la existencia de una estrategia estrictamente dominante
no es m
as que un caso en el que todas las estrategias -excepto una- estan estrictamente dominadas,
utilizando el mismo criterio que en el paso anterior podemos eliminar izquierda y derecha para
obtener una nueva versi
on reducida del juego.
Jugador B
Centro
Jugador A

Medio

20,20

Abajo

25,28

Figura 1.6: Juego reducido


En este u
ltimo juego, mucho m
as sencillo que el original, se tiene que el jugador A tiene certeza
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

respecto del resultado de su decisi


on, por lo que seguira la estrategia que le otorga un mayor pago:
abajo.6 Este proceso se denomina eliminacion iterativa de estrategias estrictamente dominadas. As,
bajo el criterio de eliminar estrategias estrictamente dominadas, podemos proponer que un resultado
probable de este juego ser
a el perfil (abajo, centro).
Definici
on 4. Un perfil de estrategias es un equilibrio por eliminaci
on iterativa de estrategias
estrictamente dominadas si es el u
nico perfil que sobrevive al procedimiento de eliminaci
on.
La eliminaci
on iterativa de estrategias estrictamente dominadas es un criterio mas general que el
de estrategias dominantes que revisamos en primer lugar, y por lo tanto es u
til en mas situaciones.
Sin embargo, seguir
an existiendo juegos donde no existiran estrategias estrictamente dominadas, por
lo cual requeriremos de otros instrumentos para analizarlos y poder proponer posibles resultados. La
siguiente secci
on se dedica a elaborar el concepto mas ampliamente utilizado en teora de juegos para
este prop
osito, conocido como equilibrio de Nash.

1.4.

Equilibrio de Nash

Probablemente el concepto m
as importante en teora de juegos es el denominado Equilibrio de Nash,
llamado as por el matem
atico estadounidense John F. Nash, quien gano el premio Nobel de economa
en el a
no 1994 por su contribuci
on fundamental a esta area. La potencia de este concepto radica en que
se basa en una idea sencilla, pero muy general, y por lo tanto es u
til al momento de analizar diversas
situaciones estrategicas sin que se requiera la existencia de conceptos mas exigentes, como el de estrategia
dominada.
La intuici
on detr
as del equilibrio de Nash (EN), es que si se propone que un juego tendra cierto perfil
de estrategias como resultado, lo mnimo que se puede pedir es que este perfil sea estrategicamente estable,
en el sentido de que ning
un jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otro
modo, si existe alguna raz
on para pensar que los jugadores seguiran ciertas estrategias7 , entonces cada
uno de ellos puede hacer esta conjetura. Si bajo esa conjetura alg
un jugador tiene incentivos a cambiar
de estrategia, entonces sera ingenuo proponer la conjetura como un resultado del juego, ya que aquel
jugador con incentivos a desviarse de la estrategia conjeturada probablemente tomara la alternativa que
le resulta m
as conveniente. Formalmente,
Definici
on 5. En un juego de n jugadores, el perfil de estrategias s = (s1 , ..., sn ) es un equilibrio de
Nash si, para cada jugador i, si es una mejor respuesta a las estrategias de los otros (n 1) jugadores.
Esto es, la desigualdad:
ui (s1 , ..., si , ...sn ) ui (s1 , ..., si , ..., sn )
se cumple para cada posible estrategia si en Si .
Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibrio
de los dem
as jugadores. Para entender como a partir de esta idea podemos proponer alg
un resultado
para un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuesta
de cada jugador a cualquier estrategia que pueda seguir su contraparte es confesar (una estrategia
dominante siempre ser
a una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN,
ya que ambos est
an jugando su mejor respuesta a la estrategia del otro. Tambien se puede ver que no
existen incentivos unilaterales a desviarse, ya que la alternativa callar disminuye el pago desde (6)
a (9) dado que el otro est
a jugando confesar.
6 Tambi
en podemos decir que la estrategia medio est
a estrictamente dominada por abajo y eliminarla tal como lo
hicimos en las iteraciones anteriores.
7 Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los dem
as.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

10

Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matricial es ir analizando cu
al es la mejor respuesta a cada posible estrategia del otro jugador, y subrayando
el mayor pago para indicar que la estrategia asociada a esa celda es la optima. Esto esta ejemplificado
para el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada al
perfil (confesar, confesar) ambos pagos esten subrayados, nos indica que encontramos un EN.
Prisionero 2

Prisionero 1

Callar

Confesar

Callar

-1, -1

-9, 0

Confesar

0, -9

-6,-6

Figura 1.7: Mejores respuestas en dilema del prisionero


El ejemplo del dilema del prisionero ilustra un resultado interesante: todo equilibrio bajo eliminaci
on
iterativa de estrategias estrictamente dominadas es un equilibrio de Nash. Sin embargo, la implicancia
va en una sola direcci
on, en tanto no todo EN sera un equilibrio seg
un eliminacion iterativa. El hecho de
que -como veremos a continuaci
on- es posible que exista EN cuando no existen estrategias dominadas
es evidencia de este u
ltimo punto.
Un caso m
as interesante que el dilema del prisionero sera un juego donde la eliminacion iterativa
no nos entregue ninguna predicci
on del resultado del juego (porque no existen estrategias estrictamente
dominadas), y sin embargo s exista un EN. Consideremos entonces el ejemplo dado por la matriz de la
figura 1.8.
Jugador Columna

Jugador Fila

0,4

4,0

5,3

4,0

0,4

5,3

3,5

3,5

6,6

Figura 1.8: Buscando EN cuando no existen estrategias dominadas


El lector ya debiese ser capaz de verificar que este juego no tiene estrategias estrictamente dominadas. Para buscar un EN, hacemos el analisis de mejor respuesta: si el jugador columna fuera a jugar I,
por ejemplo, la mejor respuesta del jugador fila sera M , puesto que 4 es mayor que 3 y que 0; por ello, la
ganancia de 4 que recibe el jugador fila en la celda (M , I) de la matriz esta subrayada. De forma an
aloga encontramos la mejor respuesta ante las estrategias C y D, que son A y B, respectivamente. Luego
buscamos las mejores respuestas del jugador columna (lo que es directo, ya que el juego es simetrico), y
obtenemos as que el perfil (B,D) es un EN para este juego.

Funcion de respuesta optima


Para computar el EN en los ejemplos anteriores, hemos analizado la mejor respuesta de un jugador a
cada posible estrategia del otro. Esto nos permite encontrar de forma directa el par de estrategias bajo
las cuales nadie tiene incentivos unilaterales a desviarse. En el caso de juegos con estrategias continuas
podemos encontrar un EN bajo el mismo principio, aunque con una tecnica diferente.
Consideremos el ejemplo de competencia a la Cournot planteado en la seccion (1.2). En ese caso,
como los jugadores tienen infinitas estrategias a su disposicion, no es posible ir verificando la respuesta
optima para cada caso como lo hacemos en los juegos matriciales. No obstante, podemos preguntarnos

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

11

cu
al es la respuesta
optima de una de las firmas ante una cantidad fija arbitraria de su competidora.
Por ejemplo, fijemos la producci
on de la firma 2 en un nivel q2 . Siendo ese el caso, la respuesta optima
de la firma 1 corresponde a la soluci
on del problema:
max (A q1 q2 )q1 cq1
{q1 }

La condici
on de primer orden del problema es A 2q1 q2 c = 0, a partir de la cual obtenemos la
soluci
on q1 = Aq22 c . Pero q2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es en
realidad la funci
on que nos indica cu
al es la cantidad optima para la firma 1 ante cualquier nivel de
producci
on de la firma 2:
A q2 c
q1 (q2 ) =
2
Esta u
ltima se conoce como funci
on de respuesta
optima o funci
on de reacci
on, en este caso, de la
firma 1.8 Como el problema es simetrico, la funcion de reaccion de la firma 2 es completamente analoga:
q2 (q1 ) =

A q1 c
2

La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencilla
el equilibrio de Nash de este juego. En efecto, si existe un par (q1 , q2 ) tal que ning
un jugador tenga
incentivos a desviarse, ese par constituira un EN. Pero esto ocurre en el punto donde las funciones
de reacci
on coinciden (gr
aficamente se intersectan), por lo que encontrar el EN del juego se reduce a
resolver el sistema de ecuaciones dado por las dos funciones de respuesta optima. Al resolver el sistema
se obtiene el resultado:
q1N = q2N =

Ac
3

donde utilizamos el suprandice N para indicar que corresponde a la cantidad de EN.


Cabe destacar que el procedimiento recien desarrollado no es diferente del aplicado en el caso de los
juegos matriciales, donde lo que hacemos es computar la funcion de reaccion para el caso en el cual los
espacios de estrategia son discretos y luego buscar un perfil donde estas coincidan. La u
nica diferencia
es que como en este caso las estrategias son continuas, podemos utilizar las herramientas de calculo
diferencial para obtener el resultado.

Sobre la unicidad del EN


Volvamos ahora al ejemplo de la Batalla de los Sexos, el cual resolveremos para aprender otro
elemento relevante del EN. A continuacion se muestra la matriz de pagos con los pagos asociados a las
mejores respuestas ya subrayados:
Manuel

Josefa

F
utbol

Museo

F
utbol

2,1

0,0

Museo

0,0

1,2

Figura 1.9: Batalla de los sexos y mejores respuestas


8 Notar que
esta es la respuesta
optima para niveles de q2 menores a A c. Si q2 > A c, la respuesta
optima es
producir cero porque ela firma 2 ha saturado el mercado y el precio asociado es muy bajo.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

12

En este caso, tal como en el juego de la figura 1.8, la mejor respuesta vara junto con la estrategia
del otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dos
perfiles en los cuales la mejor estrategia coincide. Significa esto que no existe equilibrio de Nash?. Al
contrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategias
cumple con la definici
on de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidas
por los dem
as. Adem
as, es f
acil ver que -por ejemplo- dado el perfil (f
utbol, f
utbol), ning
un jugador
tienen incentivos unilaterales a desviarse.
Este ejemplo nos muestra que el EN no tiene por que ser u
nico, y que pueden existir 2 o incluso m
as
perfiles que cumplan con la definici
on de equilibrio. Lo que s ocurre en este caso, es que se pierde la
posibilidad de hacer una predicci
on unvoca respecto del resultado que se observara en esta situaci
on
estrategica. En las secciones posteriores veremos cuales son las alternativas que tenemos en estos casos,
respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de predicci
on
que pueda ayudarnos a precisar el posible resultado del juego.

Sobre la existencia del EN


Una u
ltima arista del concepto de EN que es relevante discutir en este momento, dice relacion con
su existencia. Consideremos el juego de Matching Pennies que fue explicado en la introduccion, y cuya
matriz de pagos reescribimos aqu incluyendo las mejores respuestas:
Jugador 2

Jugador 1

Cara

Sello

Cara

1, 1

1, 1

Sello

1, 1

1, 1

Figura 1.10: Matching Pennies


Al analizar las mejores respuestas en este juego, se observa que no existe ning
un perfil de estrategias
en el cual se cumpla la definici
on de EN. Esto resulta intuitivo si consideramos el hecho de que no existe
ninguna combinaci
on de estrategias bajo la cual no existan incentivos a desviarse: si ambos mostraron la
misma cara, entonces el jugador 2 preferira cambiar de estrategia; mientras que si mostraron distintas
cara, el primer jugador tendr
a incentivos a desviarse.
Este ejemplo ilustra que el concepto de EN no sera una herramienta infalible al momento de analizar
los posibles resultados de un juego, por el simple hecho de que no siempre existira un EN, al menos
como lo conocemos hasta ahora. Al igual que con el problema de la multiplicidad de equilibrios, en las
secciones subsecuentes analizaremos algunos conceptos a los cuales podremos echar mano cuando no
exista equilibrio de Nash.

1.5.

Estrategias mixtas

Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de f
utbol
que planteamos en la introducci
on. Lo modelamos concretamente como se muestra en la matriz de pagos
de la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9
Adem
as, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notar
que en terminos estrategicos este juego no es diferente de matching pennies (el orden de preferencias
sobre los posibles resultados del juego es el mismo, aunque los n
umero en particular sean diferentes).
9 Para

los que no son seguidores del f


utbol, se aclara que Alexis sera el pateador e Iker el arquero.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

13

Iker

Alexis

0,0

1,-1

1,-1

0,0

Figura 1.11: Penal de f


utbol
En una situaci
on de este tipo existe un elemento fundamental para ambos jugadores, el cual es
la posibilidad de sorprender al otro. En efecto, si es que por alg
un motivo Alexis supiera con certeza
en que direcci
on saltar
a Iker, entonces podra lograr su mejor resultado pateando el balon en la otra
direcci
on. Del mismo modo, si Iker supiera de antemano la direccion del tiro, podra saltar correctamente
y atajarlo. As, dada la incertidumbre que tiene cada uno respecto de la estrategia del otro, a un delantero
o arquero en la realidad le convendr
a jugar algunas veces I y algunas otras D. Si Iker saltase siempre
en la misma direcci
on sera una estrategia perdedora, puesto que el otro sabra en que direccion tirar
para convertir con seguridad.
Otro ejemplo de una situaci
on que es interesante de modelar bajo la perspectiva de juegos, es la
relaci
on entre una entidad fiscalizadora y un agente que debe cumplir cierta obligacion por ley. Por
ejemplo, podemos pensar en el Servicio de Impuestos Internos (SII) y un contribuyente que se esta cuestionando si disminuye o no su carga tributaria de alguna forma ilegtima (evasion). Para el SII resulta
costoso hacer una auditora para fiscalizar si se esta evadiendo el pago de impuestos, por lo que no es
obvio que siempre deba auditar. Por su parte, el contribuyente obtiene un beneficio evadiendo el pago
de impuestos, pero se enfrenta a un castigo si es que es descubierto. As, la incertidumbre constituye
parte fundamental de la interacci
on estrategica, pues el contribuyente estara considerando cual es la
probabilidad de ser auditado al momento de decidir si evade, mientras que el SII eval
ua la probabilidad
de efectivamente descubrir un evasor al momento de realizar una auditora que le resulta costosa. Podemos pensar ejemplos similares con firmas que deben cumplir estandares medioambientales, y el ente
regulador que las fiscaliza.
Esta idea de darle relevancia a la incertidumbre y pensar que para un jugador lo optimo no es
comprometerse con una estrategia en particular (saltar siempre a la izquierda), sino que variar su
estrategia si el juego hipoteticamente se repitiese (algunas veces saltar a la izquierda y otras a la derecha),
tiene una expresi
on concreta en teora de juegos conocida como estrategias mixtas. Cuando analicemos
un juego desde esta perspectiva, pensaremos que los jugadores ya no eligen una estrategia particular
de su conjunto de posibilidades, sino que eligen una probabilidad con la cual jugaran cada estrategia.
Por ejemplo, en el juego del penal, una estrategia mixta particular sera jugar con probabilidad 1/3 la
estrategia I, y con probabilidad 2/3, la D. As, para un jugador que dispone de dos estrategias, una
estrategia mixta consiste en elegir un n
umero p en el intervalo [0, 1], de modo que p y (1 p) son las
probabilidades con las que jugar
a una estrategia o la otra.
En general, si un jugador i dispone de un conjunto Si con L estrategias, Si = {si1 , si2 , ..., siL }, una
estrategia pura consiste en elegir un elemento particular de este conjunto (este es el concepto que hemos
utilizado en las secciones anteriores y que de ahora en adelante llamaremos estrategia pura). En cambio,
una estrategia mixta consiste en elegir un vector p = (p1 , p2 , ..., pL ), donde pl denota la probabilidad
con la que jugar
a la estrategia sil Si . Como lo que esta eligiendo es una distribuci
on de probabilidades
sobre los elementos del conjuntos Si , este vector tiene que cumplir con las propiedades que por definici
on
posee una distribuci
on. Estas son:
1.

L
P

pl = 1

l=1

2. 0 pl 1, para cada l {1, 2, ..., L}

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

14

Es fundamental notar que al hacer esto, cambiamos la decision que debe tomar el individuo. Si antes
deba elegir un elemento de su conjunto de posibilidad Si , ahora debe elegir un vector entre todos aquellos
que cumplen las propiedades recien enunciadas. Para que este cambio en las posibilidades de cada agente
nos sea u
til, resulta necesario definir una funcion de utilidad acorde a las nuevas estrategias. La idea
natural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde a
la utilidad esperada que se deriva de las probabilidades elegidas por cada uno.
Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea p
la probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. As, tenemos
que -por ejemplo- el perfil (D, I) ocurre con probabilidad p (1 q), el cual entrega pagos 1 y -1 a
Alexis e Iker, respectivamente. Esta informacion, para cada perfil de estrategias puras, se resume en la
siguiente tabla:
Perfil

Probabilidad

Pago Alexis

Pago Iker

(D, D)
(D, I)
(I, D)
(I, I)

pq
p (1 q)
(1 p) q
(1 p) (1 q)

0
1
1
0

0
-1
-1
0

Con la informaci
on anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de
uA (p, q)

= p q 0 + p (1 q) 1 + (1 p) q 1 + (1 p)(1 q) 0
= p(1 2q) + q,

mientras que para Iker, de forma an


aloga se obtiene
uI (p, q)

p q 0 + p (1 q) (1) + (1 p) q (1) + (1 p)(1 q) 0

q(2p 1) p

As, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategias
son distintos10 y se tiene una funci
on de utilidad adecuada a aquellos espacios. La pregunta natural en
este punto sera, cu
al es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla,
no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definicion ya estudiada al
juego modificado.
Tal como hicimos en la secci
on anterior, utilizaremos la funcion de respuesta optima para computar
el EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su funcion de utilidad viene dada por
uA (p, q) = p(1 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, el
segundo termino de la suma est
a fijo para el jugador 1. As, basta notar que cuando (1 2q) > 0, lo
mejor que puede hacer Alexis es elegir p = 1, mientras que si (1 2q) < 0 la respuesta optima sera
elegir p = 0. En cambio, si es que (1 2q) = 0 cualquier valor de p sera optimo, en tanto su utilidad
no depender
a de su estrategia sino que estara fija. Reescribiendo las condiciones para cada caso como
alisis en la siguiente funcion de reaccion11 :
q R 21 , podemos resumir este an

si q < 12
1
0
si q > 12
p(q) =

[0, 1] si q = 12
10 En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras,
ya que el conjunto factible [0, 1] es un continuo de n
umeros reales.
11 T
ecnicamente, la mejor respuesta no es una funci
on, pues las funciones por definici
on asocian puntos de un conjunto
con puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 21 no obtenemos un punto
en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta
optima). En matem
aticas estas
funciones, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto es
relevante en el estudio formal de teora de juegos, no es parte de los temas del curso.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

15

Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidad
que I (q > 12 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto que
el perfil (I, D) lo hace ganar. Del mismo modo, cuando I es mas probable (q < 12 ), lo mejor que puede
hacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad en
ambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hay
informaci
on que pueda explotar para cargar la balanza a su favor.
Similarmente, la funci
on de reacci
on de Iker viene dada por:

si p < 12
0
1
si p > 21
q(p) =

[0, 1] si p = 12
Con lo anterior, resulta directo observar que el par de estrategias (p, q) = ( 21 , 12 ) es un EN, en tanto
ning
un jugador tiene incentivos unilaterales a cambiar de estrategias. As, hemos encontrado un EN en
estrategias mixtas para un juego que no tena equilibrio en estrategias puras. Esto no es casualidad,
pues uno de los resultados m
as importantes en teora de juegos es el teorema de existencia de Nash,
cuya versi
on simplificada se entrega a continuacion:
Teorema 1. En un juego G = hI, {Si }ni=1 , {ui }ni=1 i, donde la cantidad de jugadores y los espacios de
estrategias son finitos, siempre existir
a un equilibrio de Nash en estrategias mixtas.
Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo,
en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D, D).
As, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el u
nico EN
del juego, ya que el teorema no debe ser interpretado como que siempre existira un equilibrio donde las
probabilidades sean diferentes de 0 y 1.

Computando equilibrio en estrategias mixtas en juegos de 2 2


A continuaci
on se presenta un metodo relativamente heurstico para encontrar los EN de un juego de
2 2. Para ello, comenzaremos por graficar las funciones de reaccion obtenidas para el juego del penal.
En la figura 1.12 dibujamos en rojo la funcion de reaccion de Alexis, p(q), y en azul la Iker, q(p), seg
un
las condiciones descritas m
as arriba. Se puede observar que en este caso el u
nico perfil de estrategias
donde estas se intersectan es en el EN ya planteado, p = q = 12 .
p
q(p)

1
2

p(q)
1
2

1 q

Figura 1.12: Juego del penal: Funciones de reaccion


La propuesta para encontrar todos los EN se basa en la idea de que en estos juegos existen dos
tipos de equilibrio: (i) aquellos en estrategias puras, y (ii) aquellos en los cuales cada jugador, dado
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

16

lo que hace su contraparte, est


a indiferente respecto de su propia estrategia ya que no puede afectar
su utilidad. Estos u
ltimos son los que permiten una estrategia mixta que no sea un caso particular de
estrategia pura, esto es, una estrategia donde el parametro de probabilidad se encuentre en el intervalo
abierto (0, 1).
Para entender mejor la idea, consideremos el ejemplo de la batalla de los sexos, que como ya vimos
tiene dos EN en estrategias puras. Si denotamos por p y q la probabilidad con la que Josefa y Manuel,
respectivamente, juegan la estrategia f
utbol, podemos plantear las funciones de utilidad esperada para
obtener:
uJ (p, q)
uM (p, q)

2pq + (1 p)(1 q) = p(3q 1) q

= pq + 2(1 p)(1 q) = q(3p 2) 2p,

donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el analisis de
mejor respuesta para Josefa, tenemos que existe un punto crtico para la estrategia de su adversario, q =
1
a indiferente respecto de su estrategia p. Cuando q > 13 le convendra jugar
3 , en el cual ella se encontrar
p = 1 y, en caso contrario, le convendr
a p = 0. As, la funcion de reaccion queda de la forma:

1
0
p(q) =

[0, 1]

si q >
si q <
si q =

1
3
1
3
1
3

y haciendo el mismo an
alisis para Manuel, obtenemos:

si p >
1
0
si p <
q(p) =

[0, 1] si p =

2
3
2
3
1
2

Al dibujar estas funciones de reacci


on en el plano (p, q) obtenemos el grafico de la figura 1.13, donde
la lnea roja corresponde a la funci
on p(q), y la azul a q(p). En este caso observamos que las funciones
se intersectan en los perfiles asociados a estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), ademas del EN
en estrategias mixtas dado por ( 23 , 31 ).
p

p(q)

2
3

q(p)

1
3

1 q

Figura 1.13: Batalla de los sexos: Funciones de reaccion


Aplicando este mismo concepto a otros juegos -como el dilema del prisionero- podremos observar que
en general nos enfrentaremos a alguno de los casos de funciones de reaccion mostrados en los distintos
Microeconoma II

17

Facultad de Economa y Negocios - Universidad de Chile

paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un u
nico equilibrio en
estrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen
2 equilibrios en estrategias puras, con lo cual observamos que siempre existira un tercer equilibrio en
estrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrio
en estrategias puras, pero s existe uno en estrategias mixtas, tal como asegura el teorema de existencia
de Nash.
p
1

p
1

p
1

V C1

1 q

1 q

(a)

(b)

p
1

1 q

V C2
(c)

p
1

p
1

V C1
V C1

V C1
V C2

1 q

V C2

(d)

1 q

(e)

V C2

1 q

(f)

Figura 1.14: Casos generales de funcion de reaccion en juegos de 2 2


El valor V C1 corresponde a la estrategia p, bajo la cual el otro jugador se encuentra indiferente entre
cualquier estrategia disponible, esto es, q(V C1 ) = [0, 1]. Del mismo modo, V C2 corresponde al valor de
q que hace indiferente al jugador que elige p, esto es, p(V C2 ) = [0, 1]. As, una vez que encontramos los
equilibrios en estrategias puras (si es que estos existen), encontrar los equilibrios en mixtas se reduce
-para el caso de juegos de 2 2- a encontrar las probabilidades de cada jugador que deja indiferente al
otro. Notar que este valor no existe en juegos como los de los paneles (a) y (b), ya que en esos caso la
existencia de una estrategia pura dominante, hace imposible que el individuo se encuentre indiferente.

Linealidad del problema individual bajo estrategias mixtas


Para entender que es lo que subyace al metodo recien expuesto, consideremos un juego de 2 2
generico, donde p y q corresponden a las estrategias mixtas de los jugadores 1 y 2 respectivamente. Si A
y B son las estrategias puras del jugador 1 (donde p corresponde a la probabilidad de jugar la estrategia
A), entonces podemos escribir su utilidad esperada de la siguiente manera:
u1 (p, q)

pu1 (A, q) + (1 p)u1 (B, q)

p [u1 (A, q) u1 (B, q)] + u1 (B, q)

Donde u1 (A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y su
contraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1 (B, q), pero con la estrategia
pura B. As, dado que u1 (B, q) es un valor fijo cuando q esta fijo, se tiene que para cualquiera valor q
Microeconoma II

18

Facultad de Economa y Negocios - Universidad de Chile

tal que u1 (A, q) 6= u1 (B, q), entonces el valor de p que maximiza u1 (p, q) necesariamente tiene que ser 0
1, dependiendo del signo de la desigualdad u1 (A, q) u1 (B, q).
o
La u
nica forma en la que el valor
optimo de p puede ser estrictamente mayor que 0 y estrictamente
menor que 1, es cuando u1 (A, q) = u1 (B, q), pues en ese caso el jugador estara indiferente entre cualquier
valor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalizacion de lo observado en los
ejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspondan
al caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estaban
indiferentes respecto de su propia eleccion.
Si definimos p1 = p y p2 = (1 p), podemos graficar este argumento en el plano (p1 , p2 ), tal como se
muestra en los gr
aficos de la figura 1.15. La lnea oscura que une a los puntos (1, 0) y (0, 1) corresponde
al conjunto de posibilidades del jugador, ya que ah yacen todos los pares (p1 , p2 ) que cumplen las
condiciones (p1 + p2 = 1) y (0 p1 1). Las lneas azules corresponden a las curvas de nivel (curvas
de indiferencia) de la funci
on de utilidad esperada, dado un valor q fijo. En particular, las lnea azules
s
olidas son las asociadas al m
aximo nivel de utilidad esperada que puede alcanzar el jugador, mientras
que las punteadas muestran c
omo otras estrategias distintas a las optimas entregan una menor utilidad
esperada.
p2
1

p2
1

p2
1

1 p1

1 p1
(a) u1 (A, q) > u1 (B, q)

(b) u1 (A, q) < u1 (B, q)

1 p1
(c) u1 (A, q) = u1 (B, q)

Figura 1.15: Optimizacion bajo estrategias mixtas en un juego de 2 2


As, se observa que dependiendo de la relacion u1 (A, q) R u1 (B, q), se tendra que el valor optimo de
p ser
a una soluci
on esquina -como en los paneles (a) y (b)-, excepto cuando la pendiente de la curva
de indiferencia es igual a (-1) -como en el panel (c)-, en cuyo caso el individuo esta indiferente entre
cualquier par (p1 , p2 ).
n. Un punto que se deriva de la discusion anterior, y que conviene tener presente al
Observacio
momento de computar equilibrio en este tipo de juegos porque puede resultar un poco contra-intuitivo,
es que de la condici
on de indiferencia de un individuo se obtiene la estrategia de equilibrio del otro.
Por ejemplo, cuando planteamos la condicion u1 (A, q) = u1 (B, q), lo que podremos despejar ser
a un
valor q. Del mismo modo, la condici
on de indiferencia del jugador 2 nos permitira despejar un valor
p. As, la estrategia de cada jugador no sera relevante para s mismo, porque de hecho cada individuo
estar
a indiferente entre cualquiera de sus estrategias factibles. Sin embargo, la indiferencia nos permite proponer que, bajo ese par de estrategias en particular, no existiran incentivos unilaterales a desviarse.

Dominancia en estrategias mixtas


Una u
ltima dimensi
on de las estrategias mixtas que mencionaremos, dice relacion con el concepto
de dominancia estudiado anteriormente. Consideremos el juego abstracto planteado en la matriz de la
figura 1.16. Omitimos los pagos del jugador 2, porque no seran relevantes para el ejemplo.
En este caso, para el jugador 1 no existe ninguna estrategia dominada, al menos en el sentido que

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

19

Jugador 2

Jugador 1

3,

0,

0,

3,

1,

1,

Figura 1.16: Dominancia en estrategias mixtas


estudiamos anteriormente. Sin embargo, si consideramos estrategias mixtas en nuestro analisis, parece
razonable pensar que una combinaci
on de las estrategias A y M puede resultar mejor que la estrategia B.
En efecto, si tomamos la estrategia mixta p = (1/2, 1/2, 0) se tiene que la utilidad esperada del jugador
1 ser
a igual a 1.5, sin importar la estrategia que siga el jugador 2. As, esta estrategia mixta domina a la
estrategia pura D. Recordemos que las estrategias puras son un caso particular de estrategia mixta, que
en este caso sera p = (0, 0, 1). As, aunque en estrategias puras no exista dominancia, s puede existir
dominancia en estrategias mixtas.

1.6.

Juegos secuenciales

Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a la
tipologa mencionada en la introducci
on, a juegos est
aticos de informaci
on completa. Pero muchas situaciones de interes econ
omico que involucran interaccion estrategica tienen una dimension dinamica
relevante, que no es capturada por el marco teorico que manejamos hasta el momento. Pensemos, por
ejemplo, en una industria como el retail donde compiten pocas empresas de gran tama
no. Es natural
pensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propia
decisi
on, entonces su comportamiento sera diferente de aquel que seguira si las decisiones se tomaran
de forma simult
anea. Al mismo tiempo, si una de las firmas sabe que las demas observaran su decisi
on
antes de actuar, entonces tendr
a en cuenta como este elemento afecta lo que haran sus competidoras y
tendr
a un efecto sobre su propia decisi
on.
Por lo anterior, nuestro siguiente objetivo sera el estudio de juegos din
amicos de informaci
on completa. Es decir, incorporaremos la dimension temporal en el analisis de diferente situaciones estrategicas,
pero siempre manteniendonos bajo el supuesto de que las funciones de pago son conocidas por todos
(esto es lo que llamamos informaci
on completa en la introduccion). Esto implica que cada jugador tiene
perfecto conocimiento de los intereses que tienen los demas sobre los distintos resultados del juego, y
por lo tanto, que las decisiones observadas no entregan informacion adicional a este respecto.12
Como mencionamos anteriormente, la forma extensiva de un juego resultara mas conveniente e intuitiva cuando nos interesemos en juegos dinamicos. Pero antes de introducir este concepto formalmente,
analizaremos algunos ejemplos donde se observa cuales son los principales conceptos que se tienen en
mente al estudiar este tipo de situaciones. Pensemos que dos pases, A y B, se enfrentan en un conflicto
armado, en el cual A est
a decidiendo si invade o no a B. Si el primero decide invadir, entonces el segundo debe decidir entre batallar para defenderse o rendirse. Esta dinamica se resume en el arbol de la
figura 1.17, donde los crculos negros corresponden a nodos de decisi
on y las ramas que nacen de cada
uno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los crculos grises
corresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que se
llegar
a o no dependiendo de las decisiones de los jugadores.
12 La revelaci
on de informaci
on privada a trav
es de las decisiones -y la interacci
on estrat
egica que esto implica- es una
caracterstica fundamental de los juegos de informaci
on incompleta, como veremos en los modelos estudiados en el captulo
de economa de la informaci
on.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

Invadir

Pelear

(7,2)

Rendirse

(9,6)

20

A
No invadir

(8,8)

Figura 1.17: Arbol


de un juego dinamico
Es importante notar que cada nodo de decision tiene una etiqueta que indica quien decide en ese
nodo (o a quien le corresponde jugar), mientras que cada rama tiene una etiqueta que indica la acci
on a
la cual est
a asociada. Por su parte, cada nodo terminal tiene una etiqueta con los pagos asociados a ese
resultado particular del juego. En nuestro ejemplo, los pagos indican que el pas A prefiere la situaci
on
en la que invade y su enemigo se rinde, luego aquella en la que no invade, y finalmente aquella en la que
invade y su enemigo se defiende. Por su parte, el pas B prefiere no ser invadido, pero en caso de ser
invadido prefiere rendirse antes que pelear.
Que resultado podemos esperar en este juego? Para tener una primera aproximacion, escribiremos
el juego en su forma normal, lo que para este caso es sencillo ya que cada jugador solo enfrenta un nodo
de decisi
on, con dos posibles acciones cada uno (por lo tanto, queda como una matriz de 2 2). Esto
nos permitir
a encontrar los EN del juego tal como lo hemos venido haciendo hasta ahora.
Pas B

Pas A

Pelear

Rendirse

Invadir

7,2

9,6

No invadir

8,8

8,8

Figura 1.18: Juego de invasion en forma normal


Observemos que existen dos EN en este juego, dados por los perfiles (No invadir, Pelear) e (Invadir,
Rendirse). El primero es un EN porque si el pas B esta dispuesto a pelear, entonces el A prefiere no
invadir y nadie tiene incentivos a desviarse. El segundo es EN porque cuando el pas A invade el B
prefiere rendirse, y dado esto, ocurre que ninguno querra desviarse.
Al escribir el juego en forma normal estamos haciendo abstraccion de la dimension dinamica del
problema, y conviene preguntarnos si esto tiene implicancias sobre la precision del analisis que esto nos
permite hacer. Analicemos, en particular, el equilibrio (No invadir, Pelear): es claro que el pas A no
tiene incentivos a desviarse, porque el resultado en el que terminan batallando es el menos preferido para
el. Sin embargo, ese argumento se basa en una estrategia poco creble de parte del pas B: Pelear. Si
observamos el
arbol, salta a la vista que antes una invasion, la mejor respuesta del pas B es Rendirse. Por
lo tanto, parece natural mostrarse esceptico si alguien propone que (No invadir, Pelear) es un resultado
predecible para este juego.
Por su parte, el EN dado por el perfil (Invadir, Rendirse) no presenta este problema, puesto que
como ya hemos dicho, cuando el pas A ataca lo racional para el pas B es rendirse, y nadie tiene
incentivos a desviarse. Entonces surge la pregunta, es este equilibrio de alguna manera mejor que el
equilibrio (No invadir, Pelear)?. La respuesta es s: aunque ambos son equilibrios de Nash del juego, el
perfil (Invadir, Rendirse) es, adem
as, un Equilibrio Perfecto en Subjuegos (EPS). Aunque este nombre
parece extra
no dado que aun no hemos definido lo que es un subjuego, lo clave respecto del concepto es
lo que observamos en el ejemplo: el equilibrio no esta basado en amenazas no crebles.
Microeconoma II

21

Facultad de Economa y Negocios - Universidad de Chile

Induccion hacia atras


Dada la discusi
on de los p
arrafos anteriores, surge la pregunta de como diferenciar un EN de un
EPS. Afortunadamente existe un metodo muy sencillo para encontrar los EPS de los juegos en los que
estaremos interesados, conocido como inducci
on hacia atr
as. Este consiste, como su nombre lo indica,
en comenzar por los nodos de decisi
on finales y analizar que haran los jugadores en cada uno de ellos.
Una vez que se tiene la respuesta
optima, se avanza hacia los nodos predecesores, y en cada uno de ellos
se analiza cu
al es la estrategia m
as conveniente dado que en los nodos sucesores cada jugador
elegir
a su estrategia
optima.
Veamos c
omo funciona en el ejemplo anterior. El analisis comienza en el nodo donde decide el
pas B, y consiste en definir la acci
on optima si le tocase jugar en ese nodo en particular: esta acci
on
ser
a Rendirse, dado que el pago asociado a esta decision (6) es mayor que el pago de Pelear (2). El
siguiente paso es ir al nodo de decisi
on precedente (en el cual decide A), y determinar la accion optima
dado que el pas B elegir
a Rendirse en caso de llegar al nodo en el cual debe decidir. Como el pago de
8 asociado a No Invadir es menor que el de 9 asociado a Invadir (el que a su vez esta determinado por
la acci
on
optima Rendirse), entonces nos quedamos con la accion de Invadir. As, el EPS de este juego
viene dado por el perfil (Invadir, Rendirse), tal como habamos propuesto anteriormente.
Para enriquecer el entendimiento de la induccion hacia atras, consideremos un ejemplo un poco m
as
elaborado. Un sujeto entra a un banco, se acerca a un cajero y le dice que si no le entregan el dinero
de la b
oveda har
a explotar una bomba que lleva consigo. La situacion que nos interesa modelar en este
caso es din
amica, pues nos enfocamos en la decision del cajero de entregar o no entregar el dinero, y
dado esto, la decisi
on del asaltante de explotar o no la bomba. El arbol del juego se presenta en la figura
1.19.
I (Cajero)
No Entregar

Entregar
(Asaltante)IIa
Bomba
uc = 1
ua = 1

IIb (Asaltante)
No Bomba
uc = 1
ua = 1

Bomba
uc = 1
ua = 1

No Bomba
uc = 2
ua = 0

Figura 1.19: Asalto a un banco


Los pagos representan la idea de que, sea cual sea la decision del cajero, el resultado en el cual el
asaltante explota la bomba es el menos preferido para ambos. Respecto a los resultados en los cuales
no explota la bomba, el cajero prefiere aquel en el que no entrega el dinero, mientras que el asaltante
-obviamente- prefiere aquel en el cual le entregan su botn.
Resolvamos el juego por inducci
on hacia atras. Si el asaltante se ubica en el nodo en el que le entregan
el dinero, entonces su decisi
on
optima es No Bomba. Ahora, si lo ubicamos en el nodo en el cual no le
entregan el dinero, su decisi
on
optima tambien sera No Bomba (aqu esta la clave para la existencia de
una amenaza no creble). A continuaci
on analizamos la decision del cajero, dadas las decisiones optimas
del asaltante: si entrega el dinero recibira un pago de 1, mientras que si no lo entrega recibira un pago
de 2. Por lo tanto, la decisi
on
optima del cajero sera No Entregar. Por lo tanto, el resultado del juego
seg
un el metodo de inducci
on hacia atr
as sera que el cajero no entrega el dinero y el asaltante no entrega
la bomba.

Microeconoma II

22

Facultad de Economa y Negocios - Universidad de Chile

Estrategias en un juego dinamico


Es importante notar que en el p
arrafo anterior no hemos dicho que el EPS del juego sea (No Entregar,
No Bomba), porque aquello sera -en rigor- incorrecto. La razon de ello es que (No Entregar, No Bomba)
no es un perfil de estrategia por el simple hecho de que No Bomba no constituye una estrategia para
el asaltante. Esto nos lleva a la siguiente discusion, sobre que es lo que entenderemos por estrategia en
un juego din
amico.
En el juego recien expuesto, por ejemplo, es natural pensar que las estrategias que puede seguir el
asaltante son bomba y no bomba, cuando en realidad estas son simplemente acciones que puede
seguir en determinados nodos. En un juego en forma extensiva, una estrategia sera un plan de acci
on
que indique que acci
on seguir
a el jugador en cada nodo en los cuales le puede tocar jugar.
As, una estrategia posible para el asaltante sera no explotar la bomba si le entregan el dinero, y
s explotarla en caso que no se lo entreguen. Una forma comoda de describir esta estrategia es de la forma
(No Bomba, Bomba), donde el primer elemento del par indica la accion que seguira si se encuentra en
el nodo IIa , mientras que el segundo indica la accion ejecutada en el nodo IIb . Con lo anterior, tenemos
que el conjunto completo de estrategias posibles para el asaltante sera {(B,B), (B,NB), (NB,B), (NB,
NB)}. Por su parte, el cajero solo tiene que tomar una decision en un nodo, por lo que las acciones de
las que dispone coinciden con su espacio de estrategias {Entregar, No entregar}.
Esta forma de entender las estrategias en un juego en forma extensiva facilita ver la equivalencia que
existe con la forma normal de un juego. En efecto, si lo que tiene que decidir el asaltante es un plan de
acci
on para cada posible situaci
on en la que le toque jugar, entonces podemos entender el juego desde
una perspectiva est
atica, donde cada jugador debe tomar solo una decision: cual sera su plan de acci
on.
Para aclarar esta idea, en la matriz de la figura 1.20 se muestra el juego en su forma normal.
Asaltante

Cajero

(B,B)

(B,NB)

(NB,B)

(NB,NB)

Entregar

-1, -1

-1, -1

1, 1

1, 1

No Entregar

-1, -1

2, 0

-1, -1

2, 0

Figura 1.20: Asalto a un banco en forma normal


Esta matriz de pagos contiene exactamente la misma informacion que el arbol del juego. Consideremos por ejemplo la segunda columna de pagos, en la cual la estrategia del asaltante (B,NB) nos indica
que este explotar
a la bomba si le entregan el dinero y no la explotara en caso contrario.13 Si el cajero
sigue la estrategia entregar, entonces la estrategia del asaltante (B,NB) indica que explotara la bomba,
con lo que se obtiene los pagos de (-1, -1) indicados en la celda correspondiente. Si en cambio el cajero
no entrega el dinero, el plan de acci
on indica no explotar la bomba, con lo cual los pagos son de 2 para
el cajero y 0 para el asaltante, tal como se indica en la celda. De forma analoga se obtienen las dem
as
columnas de la matriz.
Al computar los EN del juego en la matriz de pagos, se observa que existen tres perfiles bajo los
cuales no existen incentivos a desviarse: (No Entregar, (B,NB)), (Entregar, (NB,B)) y (No Entregar,
(NB,NB)). De acuerdo al an
alisis bajo induccion hacia atras, concluimos que la estrategia optima para
el asaltante es (NB,NB), porque para el siempre era peor explotar la bomba. As, el u
nico EN que es a
la vez EPS viene dado por el perfil (No Entregar, (NB,NB)). Notar que lo clave para que este perfil sea
EPS es que la estrategia del asaltante es optima en cada uno en el que le podra tocar jugar. El perfil
(No Entregar, (B,NB)) implica el mismo resultado del juego que el perfil (No Entregar, (NB,NB)), sin
13 Es

posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es una
posibilidad para el asaltante y como tal podemos analizarla.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

23

embargo no constituye un EPS porque el asaltante esta siguiendo una estrategia suboptima en el nodo
IIa .
Notar que tambien es un EN el perfil (Entregar, (NB,B)), seg
un el cual el resultado del juego es que
el cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tenga
incentivos a desviarse, se basa en la amenaza no creble de que en el nodo IIb el asaltante explotara la
bomba. As, observamos que en este contexto el EN por s solo puede ser un criterio poco satisfactorio,
pues no considera la din
amica temporal del problema. El EPS aparece entonces como un refinamiento
u
til que nos permite quedarnos con un equilibrio mas creble, y en alg
un sentido mas racional.

Dentro y fuera de la senda de equilibrio


En la discusi
on previa se plantea que un perfil de estrategias -y por lo tanto un equilibrio- constituye
un plan de acci
on completo para cada jugador, y por lo tanto no basta con definir cual sera el resultado
del juego sino que es necesario definir cuales son las acciones que se llevaran a cabo en cada nodo, aun
cuando estos no ocurran seg
un nuestra prediccion de equilibrio. Esto no es solo una cuestion formal, sino
que es fundamental para el an
alisis completo del juego porque las decisiones de cada jugador estan a su
vez condicionadas por lo que espera este que haran los demas si se llegasen a encontrar en determinadas
coyunturas. M
as concretamente, si pensamos en una partida de ajedrez, es claro que antes de decidir
una jugada el ajedrecista analiza cu
al sera la respuesta de su oponente ante las distintas movidas que
est
a tanteando en un determinado momento.
En terminologa de juegos, si tenemos un perfil de equilibrio, aquellos nodos que seg
un las estrategias
definidas efectivamente ocurrir
an se dice que estan en la senda de equilibrio. De modo similar, los nodos
que no ocurren se dice que est
an fuera de la senda de equilibrio. En el ejemplo del asalto al banco, el
nodo los nodos I y IIb est
an en la senda de equilibrio, mientras que IIa esta fuera. Entonces, la idea del
p
arrafo anterior se puede resumir en que un equilibrio no se constituye solo por las acciones que ocurren
en la senda de equilibrio, sino tambien por aquellas que se tomaran fuera de esta (aun cuando nunca
se concreten seg
un nuestra predicci
on del resultado del juego).
Para observar la relevancia de las estrategias fuera de la senda de equilibrio en la determinacion del
mismo, analizaremos una extensi
on del juego de invasion, cuyo arbol se muestra en la figura 1.21. En
esta versi
on, agregamos un nodo en el cual el pas bajo amenaza tiene la posibilidad de constituir un
ejercito peque
no o grande antes de que el potencial invasor decida si ataca o no. Ademas, en el nodo
inicial el pas A puede elegir entre firmar un tratado de paz y terminar el conflicto o no hacerlo. As, los
nodos Ai y Bi corresponden a aquellos donde juega A y B, respectivamente.
De los pagos se desprende la idea de que, en contraste con la version original del juego, si el pas
B constituye un ejercito grande entonces ante una invasion preferira defenderse que rendirse. El caso
en el que constituye un ejercito peque
no es igual al juego original, por lo que preferira rendirse en
caso de ser invadido. Es decir, al realizar el analisis de induccion hacia atras, se tiene que en los nodos
B2 y B3 las decisiones
optimas son Rendirse y Pelear, respectivamente. Dado esto, en los nodos A2 y
A3 las decisiones
optimas para el pas A son Invadir y No invadir, respectivamente. El siguiente paso
es preguntarse que decidir
a B en el nodo B1 ; si constituye un ejercito peque
no, entonces el pago que
recibir
a -dadas las decisiones
optimas subsecuentes- sera de 6, mientras que si juega Ejercito Grande
el nodo final al que se llega tiene asociado un pago de 7. Por lo tanto, en el nodo B1 la decision optima
ser
a Ejercito Grande. Finalmente, en el nodo A1 la decision optima del pas A sera firmar el tratado, ya
que con eso recibe un pago de 8, en comparacion a los 7 que recibira si decide no firmar, y el juego se
desarrolla seg
un las decisiones
optimas ya discutidas.
En resumen, el EPS del juego vendra dados por la estrategia (Tratado, Invadir, No invadir) para el
pas A, y (Ejercito grande, Rendirse, Pelear) para el pas B (donde las acciones estan ordenadas siguiendo
la numeraci
on de los nodos para cada jugador). Por lo tanto, el resultado que parece razonable en este
caso es que los pases firmar
an el tratado de paz y el juego se acaba luego del primer nodo. Lo fundamental

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

Pelear

(7,2)

Rendirse

(9,6)

24

B2
Invadir

A2
Ej
ercito Peque
no
No inv.

(8,8)

B1
Pelear

(3,6)

Rendirse

(8,5)

B3

No firmar trat.

Invadir
Ej
ercito Grande

A3

A1

No inv.

(7,7)

Firmar tratado

(8,8)
Figura 1.21: Juego de invasion extendido
del ejemplo, es que este resultado se sostiene gracias a lo que ocurrira fuera de la senda de equilibrio
seg
un las estrategias propuestas. En efecto, el mejor escenario para el pas A sera aquel en el que invade
contra un ejercito peque
no y el pas B se rinde, pero la razon por la que firma el tratado y no intenta
llegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituira un ejercito
grande.14 As, el resultado que observamos en la senda de equilibrio es consecuencia de las decisiones
que se tomaran en aquellos nodos que finalmente no ocurren.

Estrategias continuas
Al igual que en el caso de los juegos estaticos, en los juegos dinamicos podemos analizar y encontrar
equilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de calculo diferencial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg.
Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot,
existe una firma que elige su nivel de produccion q1 primero, denominada lder. La segunda firma,
llamada seguidora, observa esta cantidad y luego elige su propia produccion q2 . Suponiendo la misma
funci
on de demanda utilizada anteriormente, P (Q) = A Q, resolveremos el modelo por inducci
on
hacia atr
as. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar sus
beneficios, dado el nivel de q1 observado.
max(A q1 q2 )q2 cq2
q2

De la CPO se tiene que q2 (q1 ) = Aq21 c . Esta funcion coincide con la respuesta optima de la firma
en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretaci
on
es diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta funci
on
resume un plan contingente a cada posible cantidad q1 que pueda observar.
El siguiente paso de la inducci
on hacia atras es resolver el problema de la firma lder, teniendo
en cuenta la estrategia
optima de la seguidora. Esto es, la lder elige q1 tomando en cuenta que la
14 Del

mismo modo que en el asalto al banco, el cajero saba que llegado el momento el asaltante no explotara la bomba.

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

25

seguidora reaccionar
a de acuerdo a la funcion q2 (q1 ) = Aq21 c . Esto es completamente analogo a lo
que hemos hecho con los juegos din
amicos hasta ahora, donde para encontrar la accion optima de un
jugador tomamos en cuenta las acciones subsecuentes que resultan optimas. Por lo tanto, el problema
que resuelve la lder es
m
ax(A q1 q2 (q1 ))q1 cq1
q1

donde escribimos q2 (q1 ) para explicitar que en su decision esta tomando en cuenta que la seguidora
reaccionar
a de forma
optima al nivel de produccion elegido. Al resolver la CPO se obtiene que:
q1S =

Ac
2

Aq1 c
As, el perfil de estrategias de EPS viene dado por (q1S = Ac
), donde tal como en
2 , q2 (q1 ) =
2
el juego de invasi
on definimos la estrategia de la firma seguidora como un plan de accion contingente,
y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cual es el
resultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad optima q1S en la funci
on
que define la estrategia de la seguidora para obtener

q2S (q1S ) =

Ac
4

Ac
Es decir, en la senda de equilibrio se observara q1 = Ac
on del EPS es
2 y q2 = 4 . Entonces la predicci
que la firma lder produce m
as que en el modelo de Cournot, mientras que la seguidora produce menos.
Es f
acil verificar, reemplazando estas cantidades en la funcion de beneficios, que la firma lder esta mejor
que en el modelo de Cournot y que la seguidora esta peor.

A partir de esta u
ltima observaci
on surge la pregunta de que ocurre si la firma seguidora elige la
estrategia q2 (q1 ) = Ac
,
esto
es,
su
plan consiste en producir la cantidad de Cournot independiente
3
de cu
al sea la cantidad producida por q1 . Si la firma lder toma esa estrategia como fija, entonces su
estrategia
optima tambien ser
a la cantidad de Cournot. As, el perfil de estrategias (q1 = Ac
3 , q2 (q1 ) =
Ac
)
constituye
un
EN
puesto
que
aun
cuando
la
firma
seguidora
reconsiderara
su
estrategia
rgida
3
de siempre producir la cantidad de Cournot, observaremos que no tendra incentivos a cambiar su plan
de acci
on.
Sin embargo, este equilibrio se basa en una amenaza no creble de parte de la firma seguidora, la
cual es que si la lder produce la cantidad de Stackelberg, q1S , de todos modos la seguidora responder
a con
la cantidad de Cournot a pesar de que esta no es optima. En efecto, a partir de la induccion hacia atr
as
sabemos que cuando la lder produce q1S la seguidora prefiere responder con q2S , de modo que cuando
dice que producir
a la cantidad de Cournot es lo mismo que cuando el asaltante de banco deca que de
no recibir el dinero entonces explotara la bomba.

1.6.1.

Informaci
on perfecta e imperfecta

Una dimensi
on de los juegos din
amicos que hemos ignorado hasta ahora dice relacion con el conocimiento que tienen los jugadores respecto de como se ha desarrollado el juego hasta el momento en el que
les toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador,
sin que este sepa con precisi
on que es lo que ha hecho su contraparte previamente. Cuando ocurra esto,
hablaremos de juegos de informaci
on imperfecta. 15
Un caso sencillo de un juego de informacion imperfecta corresponde al ejemplo de matching pennies,
tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego
15 Recordemos que informaci
on completa se refera al hecho de que las funciones de pago de cada jugador (o sus preferencias) son de conocimiento p
ublico. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo que
un juego puede ser de informaci
on completa pero imperfecta.

Microeconoma II

26

Facultad de Economa y Negocios - Universidad de Chile

est
atico, tambien podemos entenderlo como un juego dinamico, donde un jugador elige primero un lado
de la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva del
juego se representa en la figura1.22, donde la lnea punteadas denota el hecho de que cuando al jugador
2 le corresponde mover, no sabe si se encuentra en el nodo IIa o en el IIb .
I (Jugador 1)
S

C
(Jugador 2)IIa
C

IIb (Jugador 2)
S
u1 = 1
u2 = 1

u1 = 1
u2 = 1

u1 = 1
u2 = 1

u1 = 1
u2 = 1

Figura 1.22: Matching pennies en forma extensiva


Resulta claro que el hecho de que uno de los jugadores mueva primero no tiene implicancias estrategicas sobre la decisi
on del otro, ya que al no observar la moneda el juego es equivalente al caso en
el que muestran las monedas simult
aneamente. De hecho cualquier juego estatico puede ser entendido
como un juego din
amico de informaci
on incompleta, donde uno de los jugadores mueve primero pero el
otro no observa la jugada. Lo importante en terminos estrategicos no es si un jugador mueve primero
que el otro, sino que aquel que mueve despues pueda observar la jugada del primero. Por lo tanto, no
hay nada nuevo que decir sobre el equilibrio en este caso, pues tal como estudiamos en el contexto de
juegos est
aticos, el u
nico EN es aquel en estrategias mixtas donde cada uno elige probabilidad 0,5.
En la terminologa de juegos, cuando a un jugador le corresponde jugar y no sabe con precisi
on lo
que ha ocurrido antes, el conjunto de nodos en los cuales podra estar ubicado lo llamaremos conjunto
de informaci
on. En particular, cuando s sabe la historia del juego (y por lo tanto el nodo en el cual
est
a ubicado) el conjunto de informaci
on tiene un u
nico elemento. Por ejemplo, en la figura 1.22 observamos dos conjuntos de informaci
on: el que contiene al nodo I y el que contiene a los nodos IIa y IIb .
As, en este ejemplo cada jugador tiene un conjunto de informacion.
Consideremos, en cambio, una versi
on de informacion completa del mismo juego. Es decir, un jugador
muestra primero su moneda, y el otro juega una vez que la observa. Esta version del juego esta representada en la figura 1.23, donde la u
nica diferencia en terminos del dibujo es que no esta la lnea punteada
que une los nodos IIa y IIb . Por lo tanto, el jugador 2 ahora tiene dos conjuntos de informacion, aquel
que contiene solo al nodo IIa y el que contiene solo el IIb .
I (Jugador 1)
S

C
(Jugador 2)IIa
C
u1 = 1
u2 = 1

IIb (Jugador 2)
S
u1 = 1
u2 = 1

C
u1 = 1
u2 = 1

S
u1 = 1
u2 = 1

Figura 1.23: Matching pennies con informacion perfecta


En este caso, igual que en los juegos de informacion perfecta analizados anteriormente, una estrategia
corresponde a un plan de acci
on ante cada posible coyuntura en la que tenga que mover. As, el conjunto
de estrategias factibles para el jugador 2 viene dado por {(C, C), (C, S), (S, C), (S, C)}, mientras que el

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

27

del jugador 1 es {C, S}. En el caso de informacion incompleta, en cambio, el jugador 2 debe tomar una
u
nica decisi
on porque no sabe en cu
al nodo se ubicara. Dicho de otro modo, en los juegos de informaci
on
imperfecta, una coyuntura en la cual le corresponde mover a un jugador no es un nodo, sino que un
conjunto de informaci
on. As, para generalizar la nocion de estrategia desarrollada en la seccion anterior,
diremos que en juegos din
amicos una estrategia es un plan que indica que accion tomara el jugador en
cada posible conjunto de informaci
on en el cual le puede tocar jugar.

1.7.

Definici
on de juego en forma extensiva, subjuego y EPS

Con el concepto de conjunto de informaci


on explicado en la seccion anterior ya tenemos todo lo
necesario para definir la forma extensiva de un juego, ademas de aclarar que es un subjuego y por lo
tanto un EPS. En los ejemplos vistos hasta ahora hemos observado cuales son los elementos que son
necesarios determinar para definir de forma completa un juego dinamico. Estos los resumimos en la
siguiente definici
on,
Definici
on 6. Un juego en forma extensiva viene dado por:
1. Una lista de n 1 jugadores, indizados por i, i = 1, 2, ..., n. (conjunto de jugadores)
2.

a. Cu
ando le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores)
b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo)
c. Que es lo que el jugador sabe cuando mueve (conjuntos de informaci
on)

3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad)
Tal como planteamos en la secci
on 1.2, para analizar una situacion estrategica desde la teora de
juegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para el
caso de un juego din
amico se resumen en la definicion de juego en forma extensiva recien entregada.
Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de informaci
on
del juego original con un u
nico elemento. En terminos del arbol de un juego, corresponde al conjunto
de nodos y ramas que nacen en los conjuntos de informacion con un u
nico elemento y que pueden
ser entendidos como un juego m
as peque
no. Cabe destacar que el juego original es un subjuego en
s mismo. Por ejemplo:
El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original que
nace en el nodo A.
El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego.
El juego de la figura 1.21 tiene 6 subjuegos: los sub-arboles que nacen en cada uno de sus nodos.
De estos tres ejemplos ya debiese quedar claro que para juegos de informacion perfecta, la cantidad
de subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de informaci
on
con un u
nico elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego).
El juego de la figura 1.22 tiene un u
nico subjuego: el juego completo. La razon por la cual los
nodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecen
a un conjunto de informaci
on mayor, lo que contradice la definicion de subjuego.
De los ejemplos anteriores salta a la vista que un subjuego no es mas que lo que queda de un
juego una vez que se ha alcanzado cierto nodo decision. Esta definicion resulta sencilla y pareciera que

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

28

pudimos haberla entregado antes para explicar concretamente que es un EPS. Sin embargo, es importante
entender que los nodos que no son un conjunto de informacion en si mismo no son el nacimiento de un
subjuego, y para ello primero tenamos que conocer el concepto de informacion imperfecta. Ahora que
hemos aclarado este punto, podemos definir formalmente un EPS.
Definici
on 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidas
por el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego.
Es decir, el EPS se diferencia de los demas EN del juego en el hecho de que si analizamos los subjuegos,
las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta optima.
Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN del
juego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb , el cual consiste en una
simple decisi
on entre las alternativas {B,NB}, la estrategia B no es optima, y por lo tanto no es un
EN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo induccion hacia atr
as
s verifica la definici
on recien planteada.

Microeconoma II

Captulo 2

Informaci
on incompleta
Como ya mencionamos en la introduccion, una de las dimensiones mas importantes a considerar en
muchas situaciones estrategicas es que es lo que saben los jugadores respecto de las caractersticas de los
dem
as. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa que
la estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarse
que ocurre cuando cierta informaci
on (como las preferencias o alguna otra caracterstica) no es de
conocimiento p
ublico. El objetivo de este captulo es introducir los conceptos necesarios para analizar
este tipo de situaciones, bas
andonos fundamentalmente en ejemplos sencillos que nos permitiran resaltar
los puntos relevantes a tener en consideracion.

2.1.

Juegos est
aticos de informaci
on incompleta

Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competencia
a la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y la
demanda inversa del mercado en el que compiten viene dada por P (Q) = AQ. Supongamos que la firma
1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene informaci
on
privada sobre su costo, el cual puede ser alto (ca ) o bajo (cb ). Concretamente, supondremos que la firma 1
solo sabe que con probabilidad se trata de una firma con costo alto y con probabilidad (1), de costo
bajo. Recordemos que para el caso de informacion completa la funcion de reaccion de cada firma dependa
de los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respecto
de los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al analisis. En
particular, para obtener una noci
on de equilibrio satisfactoria en un contexto de informacion incompleta
ser
a necesario replantearnos la forma en la que analizamos el comportamiento de los individuos.
Analicemos primero la decisi
on de la firma 2. Dado que esta conoce su costo con certeza, entonces es
natural pensar que su decisi
on
optima sera distinta seg
un cual sea el costo que efectivamente enfrente.
En efecto, si fijamos la cantidad que produce la firma 1 en alg
un valor q1 , la funcion objetivo de la firma
2 viene dada por a = (A q1 q2 )q2 ca q2 si enfrenta costos altos. En cambio, si el costo verdadero
de la firma es bajo (cb ), su funci
on de beneficios sera B = (A q1 q2 )q2 cb q2 . Si maximizamos cada
una de estas funciones respecto de q2 obtendremos que la respuesta optima de la firma 2 en funci
on de
su costo, se puede escribir como:
q2 (ca )

q2 (cb )

A q1 ca
2
A q1 cb
2
29

Facultad de Economa y Negocios - Universidad de Chile

30

Podemos notar que corresponde a la misma funcion de reaccion que obtuvimos en el caso de informaci
on completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y su
comportamiento
optimo variar
a seg
un ocurra una o la otra.
Consideremos ahora la situaci
on que enfrenta la firma 1. Como ya se planteo, nuestro supuesto es que
esta no sabe si la firma 2 enfrenta costos altos o bajos, pero s sabe que existen solo dos valores posibles
(ca y cb ) y asigna cierta probabilidad a la ocurrencia de cada uno. Ademas, seguimos suponiendo que
cada jugador entiende que el otro act
ua de forma racional y buscando maximizar su ganancia, lo que
en este caso se traduce en que la firma 1 sabe que la 2 seguira una estrategia distinta seg
un sus costos
efectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia optima de la
firma 1, dadas ciertas cantidades q2 (ca ) y q2 (cb ) fijas, es aquella que maximiza su ganancia esperada:
1 = [(A q1 q2 (ca ))q1 cq1 ] + (1 ) [(A q1 q2 (cb ))q1 cq1 ]
Al derivar respecto de q1 y despejar obtenemos que la respuesta optima de la firma 1, a cualquier par
de cantidades q2 (ca ) y q2 (cb ), viene dada por:
q1 =

(A q2 (ca ) c) + (1 ) (A q2 (cb ) c)
2

As, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino que
para el caso de informaci
on completa: computar las funciones de reaccion. Las diferencias fundamentales
que se evidencian a partir del ejemplo son que: (1) hay que encontrar una funcion de reaccion para cada
caso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la funcion objetivo
relevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caractersticas de los
dem
as.
Una vez que hemos tenido en consideracion estas cuestiones, encontrar el equilibrio del juego se
reduce a calcular el perfil de estrategias en el cual las funciones de reaccion se intersectan. De la discusi
on
anterior se deduce que un perfil viene dado por las cantidades q1 , q2 (ca ) y q2 (cb ). Las tres funciones de
reacci
on ya planteadas constituyen un sistema que nos permiten calcular estas incognitas. En efecto, al
despejar se obtienen los siguientes resultados:

q1N

q2N (ca )

q2N (cb )

A 2c + ca + (1 )cb
3
A 2ca + c (1 )(ca cb )
+
3
6
A 2cb + c (ca cb )

3
6

El suprandice N hace referencia a Nash, pero en juegos de informacion incompleta muchas veces
se denomina equilibrio de Bayes-Nash. Aunque este u
ltimo concepto tiene una definicion formal que
da cuenta de las diferencias con el EN, lo importante para nuestros propositos lo podemos observar a
partir del ejemplo: el perfil de estrategias define una accion para cada posible realizacion de la firma
2 (ya que como discutimos esta actuara diferente seg
un los costos que enfrente) y la funcion objetivo
relevante da cuenta de la incertidumbre que implica la informacion incompleta (en este caso se trata de
la ganancia esperada dada la probabilidad ).

Una subasta a sobre cerrado


Una situaci
on de interes que naturalmente debe ser estudiada como un juego de informacion incompleta son las subastas. Esto, porque la valoracion que tiene cada postor o posible comprador es
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

31

informaci
on privada que afectar
a la oferta maxima que estara dispuesto a hacer. Esto es particularmente relevante cuando las ofertas son a sobre cerrado, lo que no permite revelar informacion como cuando
existen ofertas sucesivas.
Para analizar esta situaci
on consideremos un ejemplo sencillo: se subasta un u
nico bien a 2 postores,
1 y 2, quienes solo pueden ofertar 0
o 30 unidades monetarias (suponga que si la oferta ganadora es 0,
el bien se vende de todos modos). En caso de que ambos hagan la misma oferta, se sortea el ganador
lanzando una moneda. La valoraci
on que tiene cada postor por el bien, vi , es informacion privada. Sin
embargo, cada uno sabe que esta solo puede tomar los valores 20 o 50, con probabilidad (1 ) y ,
respectivamente.
Sea yi una variable que toma el valor yi = 1 si el postor i gana la subasta y el valor yi = 0 en
caso contrario. Adem
as, denotamos por pi el precio que paga el individuo cuando gana la subasta. As,
podemos escribir la funci
on de utilidad del agente i como
ui (yi , pi , vi ) = (vi pi )yi ,
es decir, el pago es igual al excedente de la compra en caso de ganar, y 0 en caso contrario.
Tal como en el ejemplo de Cournot, una estrategia para el jugador i es una accion para cada posible
valoraci
on que pueda ocurrir, por lo que la denotaremos por bi (vi ). Por ejemplo, una posible estrategia
es ofertar 50 cuando tengo valoraci
on alta (bi (50) = 30) y ofertar 0 cuando es baja (bi (20) = 0). Como
el individuo 1 desconoce la valoraci
on que tiene el 2, no puede saber con certeza la oferta que hara este
u
ltimo aun cuando conozca su plan de accion, descrito por b2 (v2 ). Dada esta incertidumbre, la utilidad
esperada que busca maximizar viene dada por:
1
(v1 b1 ) Pr(b1 > b2 ) + (v1 b1 ) Pr(b1 = b2 ),
2
donde se observa claramente el trade-off entre hacer una oferta menor, con lo que aumenta el excedente
(v1 b1 ), y hacer una oferta mayor aumentando la probabilidad Pr(b1 > b2 ).
Como ya es usual, un perfil de equilibrio es un par de estrategias (b1 (v1 ), b2 (v2 )) tal que nadie puede
mejorar cambiando su propia estrategia. As, lo primero que podemos decir respecto de la estrategia
de equilibrio es que necesariamente bi (20) = 0, ya que cuando la valoracion es baja comprar el bien en
pi = 30 deja un excedente negativo. Con esto, solo nos falta determinar cual es la estrategia optima
cuando vi = 50. Para ello, fijemos la estrategia del jugador 2 en b2 (50) = 0 y analicemos cual es la
respuesta
optima del individuo 1, dado que v1 = 50. La informacion relevante se resume en la siguiente
tabla:
b1 (50)

Excedente si gana

Pr(ganar)

Utilidad Esperada

b1 = 0

50

1
2

25

b1 = 30

20

20

Si b1 = 0 entonces los jugadores empatan (fijamos que 2 juega 0 independiente de su tipo) y en ese caso
gana con probabilidad 0.5. lo que le deja un pago de 25. En cambio, si juega b1 = 30 gana con certeza, lo
que le deja un pago de 20. As, cuando el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 0), la mejor
respuesta del individuo 1 es (b1 (20) = 0, b1 (50) = 0). Como el problema es simetrico, tambien es cierto
que la mejor respuesta del jugador 2 a la estrategia (b1 (20) = 0, b1 (50) = 0) es (b2 (20) = 0, b2 (50) = 0.
Entonces hemos encontrado un equilibrio del juego en el cual cada individuo oferta 0 independiente de
la valoraci
on vi que le corresponda.
Lo anterior no descarta la posibilidad de que exista otro equilibrio, ya que aun no consideramos el
caso en que el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 50). Fijando esta estrategia, construimos
la misma tabla con informaci
on relevante:
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

b1 (50)

Excedente si gana

b1 = 0

50

b1 = 30

20

Pr(ganar)
1
2 (1

32

Utilidad Esperada
25(1 )

20 1 2

Donde la columna Pr(ganar) se construye a partir de:


Si b1 = 0, s
olo empata si v2 = 20 (lo que ocurre con probabilidad (1 )). Dado el empate, gana
con probabilidad 0.5.
Si b1 = 30, gana si v2 = 20 y empata si v2 = 50. Dado esto, la probabilidad total de ganar es
(1 ) + 2 = 1 2 .
Con lo anterior, tenemos que b1 = 30 sera optimo solo si se verifica la condicion:


20 1
25(1 )
2
20 10 25 25
15

5
1

Por lo tanto, si > 1/3 se tiene que (b1 (20) = 0, b1 (50) = 30) es respuesta optima a (b2 (20) =
0, b2 (50) = 30) y este perfil -por simetra- sera de equilibrio. En caso contrario, la respuesta optima
ser
a (b1 (20) = 0, b1 (50) = 0), y por lo tanto el equilibrio en el que siempre se oferta cero sera u
nico.
Para analizar las implicancias de este resultado, fijemos por un momento un 1/3. En este caso se
obtiene una predicci
on interesante del comportamiento de los postores, ya que el sujeto i, aun teniendo
una valoraci
on de 50, no ofertar
a en equilibrio un monto de 30 que le asegura la posibilidad. En el
ejemplo esto se debe a que la probabilidad de que el individuo j tenga una valoracion alta (y por lo
tanto valga la pena competir ofertando 30) es relativamente baja. As, el incentivo a hacer una oferta
menor para obtener un mayor excedente domina -en este caso- al incentivo a hacer una oferta mayor
para llevarse el bien. En cambio, cuando > 1/3 el aumentar la probabilidad de ganar toma mayor
relevancia, por lo que en equilibrio los jugadores pueden terminar haciendo apuestas altas.

2.2.

Juegos din
amicos: Se
nalizaci
on

Cuando hablamos de juegos din


amicos de informacion incompleta, una de las aplicaciones mas interesantes e importantes (en terminos de aplicabilidad) son los juegos de se
nalizacion. En este tipo particular
de juegos existen, b
asicamente, dos tipos de jugadores: un emisor y un receptor. Este u
ltimo desconoce
cierta caracterstica (que en terminos genericos llamaremos tipo) del primero, la cual es relevante para
la interacci
on que se da entre los dos y para la decision sobre su propia estrategia. El emisor por su parte
s conoce la caracterstica en cuesti
on, y puede utilizar un mensaje para dar al receptor alguna se
nal
respecto de su tipo. La idea es modelar situaciones donde el mensaje puede ser utilizado para que un
cierto tipo de mensajero pueda diferenciarse de otro, y los incentivos que se generan para que aquellos
tipos menos favorecidos en la interacci
on enven mensajes confusos con el objetivo de no revelar su tipo.
Aplicaciones concretas de juegos de se
nalizacion se pueden encontrar, entre otros, en los modelos
del mercado laboral donde los trabajadores tienen diferente productividad y el empleador no es capaz
de observarla con certeza. En este contexto el nivel de educacion formal alcanzado puede ser utilizado
Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

33

como una se
nal, bajo el supuesto de que para los individuos mas productivos resulta menos costoso
educarse. Lo interesante es que en la realidad es posible argumentar que muchas veces la educaci
on
formal, m
as que aumentar la productividad de un trabajador, es relevante para los empleadores porque
revela informaci
on sobre sus capacidades. As, modelar esta situacion como un juego de se
nalizaci
on
permite encontrar la racionalidad del fenomeno y estudiar sus implicancias.
Otros ejemplos de interes son los que estudian la relacion entre agentes que requieren fondos para
realizar un proyecto y los bancos o inversionistas que pueden prestar estos fondos. Si la calidad o
rentabilidad del proyecto no es clara para el banco, entonces las se
nales que pueden enviar los agentes
-como el interes que est
an dispuestos a pagar- se vuelven relevantes. Ejemplos de este tipo pueden
variar en distintas dimensiones que en cada caso sean de interes, como la capacidad de negociacion de
cada parte o la posibilidad de que el monto financiado afecte la rentabilidad del proyecto. Mas adelante
estudiaremos un ejemplo de este tipo de modelos.
Los juegos de se
nalizaci
on tambien tienen aplicaciones en poltica economica y monetaria. Los modelos de expectativas racionales donde el banco central (BC) es un agente optimizador que tiene interes
tanto en el nivel de producto como en la inflacion, llevan a los conocidos resultados de equilibrios ineficientes donde el BC permite una inflacion mayor sin lograr su objetivo de aumentar el producto.
Subyacente a este resultado est
a el par
ametro de aversion a la inflacion del BC. As, en un modelo con
varios perodos, el ente monetario puede utilizar la inflacion de los primeros perodos como un mensaje
para se
nalizar que es averso a la inflaci
on (inverte en reputacion), lo que le permitira en perodos futuros
aumentar el producto a costa de una inflacion mayor.
Vemos as que los juegos de se
nalizacion tienen aplicaciones de interes en distintos temas y areas. Lo
ideal es tener una estructura relativamente sencilla que nos permita analizar estas situaciones con un
enfoque unificado, basado en la teora de juegos. Por lo tanto, a continuacion se enlistan los elementos
necesarios para definir un juego de se
nalizacion basico:
Existen dos jugadores, llamados Emisor y Receptor.
El emisor es de alg
un tipo ti perteneciente a un conjunto de tipos factibles T = {t1 , ..., tn }.
Cada tipo tiene a priori una probabilidad de ocurrencia p(ti ) > 0, conocida por el receptor.
El emisor observa su tipo ti y elige un mensaje mj de un conjunto de mensajes factibles M =
{m1 , ..., mj }.
El receptor observa mj (pero no ti ) y elige una accion ak del conjunto de acciones factibles
A = {a1 , ..., ak }.
Los pagos vienen dados por las funciones Ue (ti , mj , ak ) y Ur (ti , mj , ak ) para el emisor y receptor,
respectivamente.
Para observar una expresi
on concreta de esta estructura, estudiaremos un ejemplo basado en el
modelo de Myers y Majluf (1984) que analiza el problema de una empresa que requiere conseguir financiamiento de un inversionista que no conoce la rentabilidad del proyecto. As, la oferta de participaci
on
que le hace la empresa al inversionista constituye un mensaje que puede entregar informacion al respecto.

Inversion empresarial y estructura de capital


Existe una empresa que pretende realizar un nuevo proyecto de inversion. El tipo de la empresa
viene dado por sus beneficios que pueden ser altos (A) o bajos (B), con A > B > 0. Para realizar el
proyecto, que tiene un retorno de R, se requiere una inversion de I. Se supone que R > I de modo que
este siempre es rentable. La probabilidad de que = A es .

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

34

El empresario, una vez que observa su tipo, hace una oferta de participacion en los beneficios de la
empresa al inversionista s, de modo que 0 s 1. El inversionista observa s y decide si acepta o rechaza
participar del proyecto. En caso de rechazar la oferta, los pagos son de I(1 + r) para el inversionista y
para el empresario, ya que el proyecto no se realiza. En caso de aceptar, cada uno recibe su participaci
on
en el beneficio total generado por la empresa con proyecto: s( + R) para el inversionista y (1 s)( + R)
para el empresario.
En terminos de la estructura descrita anteriormente, tenemos que T = {A, B}, p(A) = y p(B) =
(1 ), M = [0, 1], A = {Acepta, Rechaza}, y las funciones de pago son:


si a = Rechaza
Ue (, s, a) =
(1 s)( + R)
si a = Acepta

I
si a = Rechaza
Um (, s, a) =
s( + R)
si a = Acepta
Una cuesti
on fundamental en los juegos de se
nalizacion son las conjeturas que hace el receptor
respecto del tipo del emisor una vez que observa los mensajes. Es natural pensar que estas deben
estar basadas en las probabilidades a priori definidas por p(ti ), pero como veremos tambien deben ser
coherentes con la estrategia del emisor. Por ahora, supongamos que dado un mensaje s fijo, el receptor
considera que con probabilidad q se trata de una firma tipo B. Dado esto, aceptara la oferta si y s
olo si
su beneficio esperado es mayor que el costo de oportunidad del proyecto, q s(B +R)+(1q)s(A+R)
I(1 + r). Esta condici
on se puede reescribir como:
s

I
(qB + (1 q)A + R)

Por su parte, un empresario de tipo solo estara dispuesto a recibir el financiamiento si la participaci
on
s que otorga al inversionista cumple la condicion de que el pago que recibe con proyecto es mayor que
el pago sin proyecto, (1 s)( + R) . Despejando s se obtiene la condicion:
s

R
+R

Para simplificar la exposici


on de los conceptos, vamos a resolver una version particular del modelo.
Consideremos los par
ametros A = 15, B = 5, R = 15, I = 10, y = 0,4. Ademas, supondremos que
las firmas solo pueden hacer dos ofertas de participacion, las cuales son 2/3 y 1/5, de modo que ahora
M = {2/3, 1/5}. Las condiciones de participacion ya calculadas siguen siendo validas, y las utilizaremos
para este caso particular.
Consideremos la posibilidad de un equilibrio mezclador, esto es, un perfil en el que tanto el tipo
A como el B juegan la misma estrategia s.1 Una primera condicion que le exigimos a las conjeturas
de equilibrio es que cuando todos los tipos envan el mismo mensaje, la conjetura debe ser igual a la
probabilidad a priori. Esto, porque al no resultar informativo el mensaje, el receptor no puede hacer
nada mejor que quedarse con las probabilidades originales.
Lo anterior implica que al proponer un equilibrio mezclador, en la condicion de participacion del
inversionista reemplazamos q = 0,6 (la probabilidad a priori de que la firma sea tipo B), con lo cual la
5
. Por lo tanto, tenemos que:
condici
on de participaci
on del inversionista se reduce a s 12
Si ambos tipos ofrecen s(A) = s(B) = 2/3, el inversionista acepta el proyecto ya que 2/3 > 5/12
por lo que se verifica la condici
on.
1 En

general, un equilibrio mezclador es aquel en que todos los tipos envan el mismo mensaje

Microeconoma II

Facultad de Economa y Negocios - Universidad de Chile

35

Si ambos tipos ofrecen s(A) = s(B) = 1/5, el inversionista rechaza el proyecto, ya que 1/5 < 5/12
por lo que no se cumple la condicion.
Notemos que la condici
on bajo la cual la firma A prefiere hacer el proyecto es, para los parametros
particulares, sA 21 . As, no puede haber un equilibrio mezclador en el que s(A) = 2/3, ya que la
firma preferir
a hacer la oferta 1/5 que le entrega mayor beneficio sin importar si el inversionista acepta
o rechaza. Por otro lado, el equilibrio mezclador s(A) = s(B) = 1/5 tampoco puede ocurrir, ya que
la firma tipo B preferir
a ofrecer 2/3 con tal de realizar el proyecto y obtener 1/3 de 20 en vez de su
beneficio sin proyecto (que es 5). Por lo tanto, concluimos que en este caso no puede existir un equilibrio
mezclador.
Analicemos ahora la existencia de un equilibrio separador, esto es, un perfil en el que los distintos
tipos envan distintos mensajes. Cuando ello ocurre, el mensaje es completamente informativo del tipo
del individuo y esto tiene que influenciar la conjetura del receptor. Por ejemplo, si tenemos que la firma
sigue la estrategia s(A) = 2/3 y s(B) = 1/5, entonces la conjetura de la firma cuando observa s = 2/3
es que la firma es tipo A con certeza, y cuando observa s = 1/5 es que la firma es tipo B con certeza.
Con la noci
on de conjetura aclarada para un equilibrio separador, podemos analizar entonces los
casos separadores:
Dado s(A) = 2/3 y s(B) = 1/5, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 20, que
es menor a la inversi
on de 10) y acepta ante 2/3. Dado esto, la firma tipo B tiene incentivos a
desviarse, ya que si enva el mensaje 2/3 el inversionista aceptara y obtendra mayor beneficio.
Dado s(A) = 1/5 y s(B) = 2/3, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 30, que es
menor a la inversi
on de 10) y acepta ante 2/3. En este caso la firma tipo A no tiene incentivos a
desviarse (porque prefiere su beneficio sin proyecto de 15 antes los 10 que recibe si se queda con
1/3 del proyecto), y la firma B tampoco porque siempre prefiere realizar el proyecto.
Por lo tanto, en nuestro ejemplo el u
nico equilibrio es uno separador en el que la firma tipo A
ofrece una porci
on peque
na de las ganancias, la tipo B ofrece una porcion grande, y por lo tanto el
inversionista solo acepta la propuesta de esta u
ltima. Aunque en el caso mas general puede existir un
equilibrio mezclador (donde la inversi
on siempre se realiza), la existencia del separador no se debe a la
particularidad del ejemplo pues este siempre existe. En el caso de que se de un equilibrio separador,
la implicancia del modelo es que el resultado es suboptimo dado que realizar el proyecto siempre es
rentable. El problema que genera la informacion incompleta se observa en la condicion de participaci
on
del inversionista ante un mensaje mezclador, donde la firma A esta sujeta a ofrecer una participaci
on
mayor al inversionista, ya que este no esta seguro si los beneficios seran altos o bajos.
As, los juegos de se
nalizaci
on se pueden usar en aplicaciones generales donde se observa que la
asimetra de informaci
on entre dos agentes genera alg
un problema de eficiencia. Por ejemplo, el modelo
de se
nalizaci
on en el mercado laboral mencionado mas arriba, en el cual la educacion se utiliza como
se
nal, se pueden generar ineficiencias en el caso en el que la educacion es productiva (los trabajadores
de alta productividad se educan m
as que lo eficiente con tal de se
nalizar y diferenciarse de los menos
eficientes).

Microeconoma II

You might also like