Professional Documents
Culture Documents
Daniel Hojman T.
Fabian Sep
ulveda C.
Esta version: 10 de marzo de 2014, Primera version: Agosto 2012
Captulo 1
Teora de Juegos
1.1.
Introducci
on
En muchas situaciones donde un sujeto debe tomar una decision, el resultado que obtenga depender
a no solo de sus propias acciones, sino tambien de las decisiones que tomen otros individuos. Por su
parte, los resultados de esos otros individuos tambien dependen de la decision del sujeto en cuesti
on.
As, un agente en este tipo de situaci
on se cuestionara que haran los demas... y que piensan los dem
as
que har
a el mismo. Esta interdependencia -que se puede observar en una amplia variedad de situaciones sociales- se conoce como interacci
on estrategica. Cuando la interaccion estrategica sea un elemento
fundamental en la toma de decisiones entre individuos, hablaremos de situacion estrategica.
El objetivo de la teora de juegos es estudiar el comportamiento de individuos en situaciones estrategicas. Y aunque el enfasis est
a puesto en las decisiones que son tomadas de forma individual, una
de las dimensiones m
as interesantes de la teora es que permite hacer predicciones respecto de los resultados agregados que divergen de los resultados clasicos en economa, en el sentido de que la motivaci
on
individual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. Mas en general, la teora de juegos es u
til para analizar diversas situaciones de interes economico, como mercados
poco competitivos, asimetras de informacion, cumplimiento bajo contratos incompletos, etc. Adem
as,
tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biologa.
el bien subastado. Si un postor no conoce la valoracion de los demas por el bien en cuestion, entonces
se enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador,
u ofrecer un pago m
as bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En este
ejemplo, la valoraci
on que tiene cada comprador sobre el bien es informacion valiosa, en tanto el poseerla
o no incidir
a en la decisi
on tomada.
Cuando en una situaci
on estrategica no exista informacion privada como la descrita en el parrafo
anterior, hablaremos de juegos de informaci
on completa, mientras que cuando existe informacion sobre
los jugadores que no sea de conocimiento com
un se tratara de juegos de informaci
on incompleta. As, una
tipologa de juegos muy general nos permite clasificar las diferentes situaciones estrategicas en cuatro
categoras:
Juegos est
aticos de informaci
on completa
Juegos din
amicos de informaci
on completa
Juegos est
aticos de informaci
on incompleta
Juegos din
amicos de informaci
on incompleta
Cada uno de estos tipos de juego involucra -en terminos de la teora- conceptos e instrumentos levemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estara puesto sobre los
juegos de informaci
on completa, partiendo por los de tipo estatico, para luego analizar las situaciones
que requieran un elemento din
amico. Los juegos de informacion incompleta, aunque no seran estudiados
al mismo nivel de profundidad, ser
an relevantes en el captulo correspondiente a economa de la informaci
on.
Ejemplos clasicos
En las siguientes secciones estudiaremos en detalle la terminologa y las tecnicas que se utilizan al
analizar situaciones estrategicas bajo la perspectiva de la teora de juegos. Pero para introducir cu
ales
ser
an los elementos b
asicos en los que pondremos nuestra atencion, a continuacion se muestran algunos
juegos cl
asicos que son u
tiles para ejemplificar ciertos tipos de interaccion estrategica donde destaca
alguna dimensi
on como la cooperaci
on, la coordinacion, el conflicto, etc.
El primer ejemplo que revisaremos es probablemente uno de los juegos mas famosos, conocido como el
dilema del prisionero. La situaci
on consiste en dos sospechosos que han sido arrestados y son mantenidos
en celdas separadas. La polica solo tiene evidencia suficiente para acusar a cada uno de un delito menor,
pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro
(confesar). As, si ambos guardan silencio (callar) entonces cada uno sera sentenciado por el delito
menor y pasar
a un a
no en prisi
on. Si solo uno de ellos confiesa, entonces sera liberado por cooperar con
la polica, mientras que su c
omplice ser
a condenado a 9 meses. Finalmente, si ambos confiesan entonces
cada uno pasar
a 6 meses en prisi
on.
Aunque toda la informaci
on relevante para entender esta situacion se encuentra en el parrafo anterior,
muchos juegos en los que nos interesaremos pueden ser resumidos de forma comoda en lo que se conoce
como una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuaci
on:
Prisionero 2
Prisionero 1
Callar
Confesar
Callar
-1, -1
-9, 0
Confesar
0, -9
-6, -6
Microeconoma II
Jugador 1
Cara
Sello
Cara
1, 1
1, 1
Sello
1, 1
1, 1
Microeconoma II
Adem
as, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el f
utbol y
Manuel por el museo), pero que de todos modos ambos prefieren la compa
na del otro por sobre ir a su
lugar favorito solos. As, la matriz de pagos asociada al juego es la siguiente:
Manuel
Josefa
F
utbol
Museo
F
utbol
2,1
0,0
Museo
0,0
1,2
1.2.
Conceptos b
asicos y definici
on de juego
Para el estudio formal de la teora de juegos requerimos de un marco teorico sobre el cual poder
trabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos en
juegos que b
asicamente son una situacion cotidiana y que resultan intuitivos de entender, para poder
utilizar el instrumental que la teora nos entrega necesitamos definir de forma concreta ciertos aspectos
que resultan claves para entender la interaccion estrategica que puede darse entre los agentes en la
situaci
on que queramos estudiar.
As, si queremos analizar situaciones estrategicas desde una perspectiva de juegos, es necesario que
nos preguntemos cuestiones como, quienes toman decisiones relevantes en esta situacion?, cuales son
las distintas opciones que tiene cada uno?, cuales son las preferencias que tienen sobre los posibles
resultados finales cada jugador?. Esta u
ltima pregunta es particularmente relevante ya que en ella
est
a implcita la potencial interacci
on estrategica presente en el juego.
En terminos generales, los elementos que hay que definir con precision para estructurar un juego son:
Jugadores: Son los agentes (individuos, firmas, organizaciones, pases, etc) que toman decisiones relevantes en la determinaci
on del resultado final.
Estrategias: Estas explicitan cu
al es la decision que debe tomar cada jugador, y entre cuales alternativas puede elegir. Notar que esta nocion es bastante general, ya que una estrategia puede ir desde
algo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaborado
como elegir un plan de acci
on completo para cada posible situacion en la que se encuentre el
jugador.
Pagos: Corresponde a alguna forma de definir la valoracion que tienen los individuos respecto de los
posibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado
Microeconoma II
n
X
i = A
qj qi cqi
i = 1, ..., n
j=1
Tener una cantidad mayor de jugadores tambien hace complicado el uso de las matrices de pagos
para plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto mas general para definir
un juego, que nos permita utilizar los conceptos desarrollados por la teora en diversas situaciones,
independiente de cuestiones como el tipo de estrategias existentes o el n
umero de jugadores. Este esquema
es la forma normal de un juego.
3 Una cuesti
on clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidas
por los que jugaron antes que
el.
Microeconoma II
Para definir formalmente esta estructura, introduciremos un poco de notacion que sera utilizada
regularmente en lo sucesivo. Consideraremos juegos de n jugadores, que seran indizados por la letra i,
de modo que i = 1, ..., n. Adem
as denotaremos con Si al conjunto de estrategias del jugador i-esimo, y
con si Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemos
como perfil de estrategias s = (s1 , s2 , ..., sn ) a una combinacion particular de estrategias individuales.
Finalmente, la informaci
on respecto a las preferencias o pagos puede ser resumidas en funciones de
utilidad que asocian a cada perfil de estrategias s un n
umero real ui (s), de modo que si un perfil s es
preferido a un perfil s por el individuo i, se cumple que ui (
s) > ui (
s).4
Definici
on 1. Un juego en forma normal viene dado por:
1. Un conjunto de n jugadores, denotado por I
2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponibles
para cada uno
3. Una funci
on de utilidad ui (s1 , ..., sn ) para cada jugador i = 1, ..., n, que define el pago que recibe
el jugador i si el juego se resuelve seg
un el perfil (s1 , ..., sn )
Formalmente, podemos resumir toda la informaci
on del juego en una estructura G = hI, {Si }ni=1 , {ui }ni=1 i
Esta forma de definir un juego es particularmente conveniente para el caso de juegos estaticos,
donde cada jugador elige simult
aneamente una accion entre un conjunto de posibilidades. Por ejemplo,
para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si =
{Callar, Confesar} y un posible perfil de estrategias sera (Callar, Callar).5 La funcion de utilidad en
este caso es discreta, y se puede escribir como:
Microeconoma II
1.3.
El objetivo de estudiar teora de juegos es ser capaces de hacer predicciones sobre cual resultado
podramos esperar que se diera en una situacion estrategica. As, el paso natural luego de formalizar
la idea de juego es preguntarse c
omo lo resolvemos, o mas en general, que podemos decir respecto del
comportamiento esperado de los jugadores. Los conceptos presentados a continuacion son una primera
aproximaci
on a estas preguntas.
Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuestion probablemente se estara preguntando si su c
omplice va a confesar o guardara silencio. Si el otro va a confesar,
entonces lo mejor para el sera confesar tambien, pues de ese modo pasara 6 meses en prision, en vez
de los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugador
preferira confesar, pues as sale libre por cooperar con la polica, en vez de pasar un mes cumpliendo
sentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le convendr
a confesar. En este caso, diremos que confesar es una estrategia dominante para el jugador, ya
que otorga un pago mayor sin importar cual es la estrategia que siga el otro.
Definici
on 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejor
pago para ese jugador, sin importar cu
al estrategia sigan los dem
as jugadores.
En el caso del dilema del prisionero, la estrategia confesar es dominante para cada jugador, por lo
que proponer que ambos seguir
an esta estrategia parece una prediccion natural. As, de acuerdo a este
criterio, el resultado del juego sera (confesar, confesar) seg
un lo cual cada jugador recibe un pago de
(9).
Aunque plantear que un jugador siempre preferira una estrategia dominante por sobre otras estrategias resulta muy intuitivo y es potencialmente una buena prediccion de los resultados de un juego,
nos enfrentamos al problema de que no siempre existiran este tipo de estrategias. En efecto, en general
tendremos que la estrategia
optima de cada jugador variara seg
un las estrategias que sigan los dem
as,
lo cual es un elemento la mayora de las veces relevante en situaciones estrategicas. As, el concepto de
estrategia dominante puede ser muy atractivo, pero poco u
til en muchas aplicaciones.
Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otro
concepto u
til e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existe
otra estrategia que siempre resulta m
as conveniente. Consideremos el siguiente ejemplo para ver de
que se trata:
Jugador B
Jugador A
Izquierda
Centro
Derecha
Arriba
10,10
14,12
14,15
Medio
12,14
20,20
28,15
Abajo
15,14
25,28
25,25
entonces al A le convendr
a jugar medio (porque 28 es preferido a 25 y a 14). As, no existe una estrategia
para el jugador A que sea
optima en cualquier caso (de forma analoga se puede comprobar que para el
B tampoco existe).
No obstante, en este juego s existen estrategias dominadas. Por ejemplo, la estrategia arriba es
dominada por la estrategia medio para el jugador A, ya que esta u
ltima le entrega un pago mayor sin
importar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). As, aun cuando mediono es una estrategia
dominante seg
un lo discutido en el p
arrafo anterior, s es correcto afirmar que domina a la estrategia
arriba.
Definici
on 3. La estrategia s0i est
a estrictamente dominada por la estrategia s00i para el jugador i, si
00
es que ui (s1 , ..., si , ..., sn ) > ui (s1 , ..., s0i , ..., sn ) para cualquier combinaci
on de estrategias de los dem
as
jugadores (s1 , ..., si1 , si+1 , ..., sn ).
De la definici
on se desprende que la estrategia s00i no es necesariamente una estrategia dominante, ya
que es superior bajo cualquier circunstancia solamente respecto de la estrategia s0i . En nuestro ejemplo
vimos que la estrategia medio del jugador A no siempre es superior a la estrategia abajo, pues
dependa de la estrategia jugada por B; sin embargo, es claro que medio s es superior a arriba, sin
importar lo que haga B.
Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilema
del prisionero para proponer un potencial resultado del juego. En que nos pueden ayudar entonces las
estrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizara una estrategia estrictamente dominada, pues no importa que supuesto haga sobre la estrategia que seguira el otro jugador,
siempre tendr
a una alternativa superior a la estrategia que esta dominada. Mas aun, si nos ponemos en
el lugar del jugador B -quien est
a conjeturando sobre la posible estrategia que seguira su contrapartees razonable pensar que descartar
a la posibilidad de que el jugador A siga una estrategia estrictamente dominada, como lo es la estrategia arriba. As, ambos jugadores eliminaran esta posibilidad y se
enfocar
an en un juego reducido que no considera la estrategia estrictamente dominada:
Jugador B
Jugador A
Izquierda
Centro
Derecha
Medio
12,14
20,20
28,15
Abajo
15,14
25,28
25,25
Medio
20,20
Abajo
25,28
1.4.
Equilibrio de Nash
Probablemente el concepto m
as importante en teora de juegos es el denominado Equilibrio de Nash,
llamado as por el matem
atico estadounidense John F. Nash, quien gano el premio Nobel de economa
en el a
no 1994 por su contribuci
on fundamental a esta area. La potencia de este concepto radica en que
se basa en una idea sencilla, pero muy general, y por lo tanto es u
til al momento de analizar diversas
situaciones estrategicas sin que se requiera la existencia de conceptos mas exigentes, como el de estrategia
dominada.
La intuici
on detr
as del equilibrio de Nash (EN), es que si se propone que un juego tendra cierto perfil
de estrategias como resultado, lo mnimo que se puede pedir es que este perfil sea estrategicamente estable,
en el sentido de que ning
un jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otro
modo, si existe alguna raz
on para pensar que los jugadores seguiran ciertas estrategias7 , entonces cada
uno de ellos puede hacer esta conjetura. Si bajo esa conjetura alg
un jugador tiene incentivos a cambiar
de estrategia, entonces sera ingenuo proponer la conjetura como un resultado del juego, ya que aquel
jugador con incentivos a desviarse de la estrategia conjeturada probablemente tomara la alternativa que
le resulta m
as conveniente. Formalmente,
Definici
on 5. En un juego de n jugadores, el perfil de estrategias s = (s1 , ..., sn ) es un equilibrio de
Nash si, para cada jugador i, si es una mejor respuesta a las estrategias de los otros (n 1) jugadores.
Esto es, la desigualdad:
ui (s1 , ..., si , ...sn ) ui (s1 , ..., si , ..., sn )
se cumple para cada posible estrategia si en Si .
Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibrio
de los dem
as jugadores. Para entender como a partir de esta idea podemos proponer alg
un resultado
para un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuesta
de cada jugador a cualquier estrategia que pueda seguir su contraparte es confesar (una estrategia
dominante siempre ser
a una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN,
ya que ambos est
an jugando su mejor respuesta a la estrategia del otro. Tambien se puede ver que no
existen incentivos unilaterales a desviarse, ya que la alternativa callar disminuye el pago desde (6)
a (9) dado que el otro est
a jugando confesar.
6 Tambi
en podemos decir que la estrategia medio est
a estrictamente dominada por abajo y eliminarla tal como lo
hicimos en las iteraciones anteriores.
7 Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los dem
as.
Microeconoma II
10
Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matricial es ir analizando cu
al es la mejor respuesta a cada posible estrategia del otro jugador, y subrayando
el mayor pago para indicar que la estrategia asociada a esa celda es la optima. Esto esta ejemplificado
para el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada al
perfil (confesar, confesar) ambos pagos esten subrayados, nos indica que encontramos un EN.
Prisionero 2
Prisionero 1
Callar
Confesar
Callar
-1, -1
-9, 0
Confesar
0, -9
-6,-6
Jugador Fila
0,4
4,0
5,3
4,0
0,4
5,3
3,5
3,5
6,6
Microeconoma II
11
cu
al es la respuesta
optima de una de las firmas ante una cantidad fija arbitraria de su competidora.
Por ejemplo, fijemos la producci
on de la firma 2 en un nivel q2 . Siendo ese el caso, la respuesta optima
de la firma 1 corresponde a la soluci
on del problema:
max (A q1 q2 )q1 cq1
{q1 }
La condici
on de primer orden del problema es A 2q1 q2 c = 0, a partir de la cual obtenemos la
soluci
on q1 = Aq22 c . Pero q2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es en
realidad la funci
on que nos indica cu
al es la cantidad optima para la firma 1 ante cualquier nivel de
producci
on de la firma 2:
A q2 c
q1 (q2 ) =
2
Esta u
ltima se conoce como funci
on de respuesta
optima o funci
on de reacci
on, en este caso, de la
firma 1.8 Como el problema es simetrico, la funcion de reaccion de la firma 2 es completamente analoga:
q2 (q1 ) =
A q1 c
2
La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencilla
el equilibrio de Nash de este juego. En efecto, si existe un par (q1 , q2 ) tal que ning
un jugador tenga
incentivos a desviarse, ese par constituira un EN. Pero esto ocurre en el punto donde las funciones
de reacci
on coinciden (gr
aficamente se intersectan), por lo que encontrar el EN del juego se reduce a
resolver el sistema de ecuaciones dado por las dos funciones de respuesta optima. Al resolver el sistema
se obtiene el resultado:
q1N = q2N =
Ac
3
Josefa
F
utbol
Museo
F
utbol
2,1
0,0
Museo
0,0
1,2
Microeconoma II
12
En este caso, tal como en el juego de la figura 1.8, la mejor respuesta vara junto con la estrategia
del otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dos
perfiles en los cuales la mejor estrategia coincide. Significa esto que no existe equilibrio de Nash?. Al
contrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategias
cumple con la definici
on de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidas
por los dem
as. Adem
as, es f
acil ver que -por ejemplo- dado el perfil (f
utbol, f
utbol), ning
un jugador
tienen incentivos unilaterales a desviarse.
Este ejemplo nos muestra que el EN no tiene por que ser u
nico, y que pueden existir 2 o incluso m
as
perfiles que cumplan con la definici
on de equilibrio. Lo que s ocurre en este caso, es que se pierde la
posibilidad de hacer una predicci
on unvoca respecto del resultado que se observara en esta situaci
on
estrategica. En las secciones posteriores veremos cuales son las alternativas que tenemos en estos casos,
respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de predicci
on
que pueda ayudarnos a precisar el posible resultado del juego.
Jugador 1
Cara
Sello
Cara
1, 1
1, 1
Sello
1, 1
1, 1
1.5.
Estrategias mixtas
Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de f
utbol
que planteamos en la introducci
on. Lo modelamos concretamente como se muestra en la matriz de pagos
de la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9
Adem
as, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notar
que en terminos estrategicos este juego no es diferente de matching pennies (el orden de preferencias
sobre los posibles resultados del juego es el mismo, aunque los n
umero en particular sean diferentes).
9 Para
Microeconoma II
13
Iker
Alexis
0,0
1,-1
1,-1
0,0
L
P
pl = 1
l=1
Microeconoma II
14
Es fundamental notar que al hacer esto, cambiamos la decision que debe tomar el individuo. Si antes
deba elegir un elemento de su conjunto de posibilidad Si , ahora debe elegir un vector entre todos aquellos
que cumplen las propiedades recien enunciadas. Para que este cambio en las posibilidades de cada agente
nos sea u
til, resulta necesario definir una funcion de utilidad acorde a las nuevas estrategias. La idea
natural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde a
la utilidad esperada que se deriva de las probabilidades elegidas por cada uno.
Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea p
la probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. As, tenemos
que -por ejemplo- el perfil (D, I) ocurre con probabilidad p (1 q), el cual entrega pagos 1 y -1 a
Alexis e Iker, respectivamente. Esta informacion, para cada perfil de estrategias puras, se resume en la
siguiente tabla:
Perfil
Probabilidad
Pago Alexis
Pago Iker
(D, D)
(D, I)
(I, D)
(I, I)
pq
p (1 q)
(1 p) q
(1 p) (1 q)
0
1
1
0
0
-1
-1
0
Con la informaci
on anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de
uA (p, q)
= p q 0 + p (1 q) 1 + (1 p) q 1 + (1 p)(1 q) 0
= p(1 2q) + q,
q(2p 1) p
As, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategias
son distintos10 y se tiene una funci
on de utilidad adecuada a aquellos espacios. La pregunta natural en
este punto sera, cu
al es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla,
no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definicion ya estudiada al
juego modificado.
Tal como hicimos en la secci
on anterior, utilizaremos la funcion de respuesta optima para computar
el EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su funcion de utilidad viene dada por
uA (p, q) = p(1 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, el
segundo termino de la suma est
a fijo para el jugador 1. As, basta notar que cuando (1 2q) > 0, lo
mejor que puede hacer Alexis es elegir p = 1, mientras que si (1 2q) < 0 la respuesta optima sera
elegir p = 0. En cambio, si es que (1 2q) = 0 cualquier valor de p sera optimo, en tanto su utilidad
no depender
a de su estrategia sino que estara fija. Reescribiendo las condiciones para cada caso como
alisis en la siguiente funcion de reaccion11 :
q R 21 , podemos resumir este an
si q < 12
1
0
si q > 12
p(q) =
[0, 1] si q = 12
10 En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras,
ya que el conjunto factible [0, 1] es un continuo de n
umeros reales.
11 T
ecnicamente, la mejor respuesta no es una funci
on, pues las funciones por definici
on asocian puntos de un conjunto
con puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 21 no obtenemos un punto
en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta
optima). En matem
aticas estas
funciones, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto es
relevante en el estudio formal de teora de juegos, no es parte de los temas del curso.
Microeconoma II
15
Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidad
que I (q > 12 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto que
el perfil (I, D) lo hace ganar. Del mismo modo, cuando I es mas probable (q < 12 ), lo mejor que puede
hacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad en
ambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hay
informaci
on que pueda explotar para cargar la balanza a su favor.
Similarmente, la funci
on de reacci
on de Iker viene dada por:
si p < 12
0
1
si p > 21
q(p) =
[0, 1] si p = 12
Con lo anterior, resulta directo observar que el par de estrategias (p, q) = ( 21 , 12 ) es un EN, en tanto
ning
un jugador tiene incentivos unilaterales a cambiar de estrategias. As, hemos encontrado un EN en
estrategias mixtas para un juego que no tena equilibrio en estrategias puras. Esto no es casualidad,
pues uno de los resultados m
as importantes en teora de juegos es el teorema de existencia de Nash,
cuya versi
on simplificada se entrega a continuacion:
Teorema 1. En un juego G = hI, {Si }ni=1 , {ui }ni=1 i, donde la cantidad de jugadores y los espacios de
estrategias son finitos, siempre existir
a un equilibrio de Nash en estrategias mixtas.
Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo,
en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D, D).
As, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el u
nico EN
del juego, ya que el teorema no debe ser interpretado como que siempre existira un equilibrio donde las
probabilidades sean diferentes de 0 y 1.
1
2
p(q)
1
2
1 q
16
donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el analisis de
mejor respuesta para Josefa, tenemos que existe un punto crtico para la estrategia de su adversario, q =
1
a indiferente respecto de su estrategia p. Cuando q > 13 le convendra jugar
3 , en el cual ella se encontrar
p = 1 y, en caso contrario, le convendr
a p = 0. As, la funcion de reaccion queda de la forma:
1
0
p(q) =
[0, 1]
si q >
si q <
si q =
1
3
1
3
1
3
y haciendo el mismo an
alisis para Manuel, obtenemos:
si p >
1
0
si p <
q(p) =
[0, 1] si p =
2
3
2
3
1
2
p(q)
2
3
q(p)
1
3
1 q
17
paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un u
nico equilibrio en
estrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen
2 equilibrios en estrategias puras, con lo cual observamos que siempre existira un tercer equilibrio en
estrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrio
en estrategias puras, pero s existe uno en estrategias mixtas, tal como asegura el teorema de existencia
de Nash.
p
1
p
1
p
1
V C1
1 q
1 q
(a)
(b)
p
1
1 q
V C2
(c)
p
1
p
1
V C1
V C1
V C1
V C2
1 q
V C2
(d)
1 q
(e)
V C2
1 q
(f)
Donde u1 (A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y su
contraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1 (B, q), pero con la estrategia
pura B. As, dado que u1 (B, q) es un valor fijo cuando q esta fijo, se tiene que para cualquiera valor q
Microeconoma II
18
tal que u1 (A, q) 6= u1 (B, q), entonces el valor de p que maximiza u1 (p, q) necesariamente tiene que ser 0
1, dependiendo del signo de la desigualdad u1 (A, q) u1 (B, q).
o
La u
nica forma en la que el valor
optimo de p puede ser estrictamente mayor que 0 y estrictamente
menor que 1, es cuando u1 (A, q) = u1 (B, q), pues en ese caso el jugador estara indiferente entre cualquier
valor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalizacion de lo observado en los
ejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspondan
al caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estaban
indiferentes respecto de su propia eleccion.
Si definimos p1 = p y p2 = (1 p), podemos graficar este argumento en el plano (p1 , p2 ), tal como se
muestra en los gr
aficos de la figura 1.15. La lnea oscura que une a los puntos (1, 0) y (0, 1) corresponde
al conjunto de posibilidades del jugador, ya que ah yacen todos los pares (p1 , p2 ) que cumplen las
condiciones (p1 + p2 = 1) y (0 p1 1). Las lneas azules corresponden a las curvas de nivel (curvas
de indiferencia) de la funci
on de utilidad esperada, dado un valor q fijo. En particular, las lnea azules
s
olidas son las asociadas al m
aximo nivel de utilidad esperada que puede alcanzar el jugador, mientras
que las punteadas muestran c
omo otras estrategias distintas a las optimas entregan una menor utilidad
esperada.
p2
1
p2
1
p2
1
1 p1
1 p1
(a) u1 (A, q) > u1 (B, q)
1 p1
(c) u1 (A, q) = u1 (B, q)
Microeconoma II
19
Jugador 2
Jugador 1
3,
0,
0,
3,
1,
1,
1.6.
Juegos secuenciales
Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a la
tipologa mencionada en la introducci
on, a juegos est
aticos de informaci
on completa. Pero muchas situaciones de interes econ
omico que involucran interaccion estrategica tienen una dimension dinamica
relevante, que no es capturada por el marco teorico que manejamos hasta el momento. Pensemos, por
ejemplo, en una industria como el retail donde compiten pocas empresas de gran tama
no. Es natural
pensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propia
decisi
on, entonces su comportamiento sera diferente de aquel que seguira si las decisiones se tomaran
de forma simult
anea. Al mismo tiempo, si una de las firmas sabe que las demas observaran su decisi
on
antes de actuar, entonces tendr
a en cuenta como este elemento afecta lo que haran sus competidoras y
tendr
a un efecto sobre su propia decisi
on.
Por lo anterior, nuestro siguiente objetivo sera el estudio de juegos din
amicos de informaci
on completa. Es decir, incorporaremos la dimension temporal en el analisis de diferente situaciones estrategicas,
pero siempre manteniendonos bajo el supuesto de que las funciones de pago son conocidas por todos
(esto es lo que llamamos informaci
on completa en la introduccion). Esto implica que cada jugador tiene
perfecto conocimiento de los intereses que tienen los demas sobre los distintos resultados del juego, y
por lo tanto, que las decisiones observadas no entregan informacion adicional a este respecto.12
Como mencionamos anteriormente, la forma extensiva de un juego resultara mas conveniente e intuitiva cuando nos interesemos en juegos dinamicos. Pero antes de introducir este concepto formalmente,
analizaremos algunos ejemplos donde se observa cuales son los principales conceptos que se tienen en
mente al estudiar este tipo de situaciones. Pensemos que dos pases, A y B, se enfrentan en un conflicto
armado, en el cual A est
a decidiendo si invade o no a B. Si el primero decide invadir, entonces el segundo debe decidir entre batallar para defenderse o rendirse. Esta dinamica se resume en el arbol de la
figura 1.17, donde los crculos negros corresponden a nodos de decisi
on y las ramas que nacen de cada
uno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los crculos grises
corresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que se
llegar
a o no dependiendo de las decisiones de los jugadores.
12 La revelaci
on de informaci
on privada a trav
es de las decisiones -y la interacci
on estrat
egica que esto implica- es una
caracterstica fundamental de los juegos de informaci
on incompleta, como veremos en los modelos estudiados en el captulo
de economa de la informaci
on.
Microeconoma II
Invadir
Pelear
(7,2)
Rendirse
(9,6)
20
A
No invadir
(8,8)
Pas A
Pelear
Rendirse
Invadir
7,2
9,6
No invadir
8,8
8,8
21
Entregar
(Asaltante)IIa
Bomba
uc = 1
ua = 1
IIb (Asaltante)
No Bomba
uc = 1
ua = 1
Bomba
uc = 1
ua = 1
No Bomba
uc = 2
ua = 0
Microeconoma II
22
Cajero
(B,B)
(B,NB)
(NB,B)
(NB,NB)
Entregar
-1, -1
-1, -1
1, 1
1, 1
No Entregar
-1, -1
2, 0
-1, -1
2, 0
posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es una
posibilidad para el asaltante y como tal podemos analizarla.
Microeconoma II
23
embargo no constituye un EPS porque el asaltante esta siguiendo una estrategia suboptima en el nodo
IIa .
Notar que tambien es un EN el perfil (Entregar, (NB,B)), seg
un el cual el resultado del juego es que
el cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tenga
incentivos a desviarse, se basa en la amenaza no creble de que en el nodo IIb el asaltante explotara la
bomba. As, observamos que en este contexto el EN por s solo puede ser un criterio poco satisfactorio,
pues no considera la din
amica temporal del problema. El EPS aparece entonces como un refinamiento
u
til que nos permite quedarnos con un equilibrio mas creble, y en alg
un sentido mas racional.
Microeconoma II
Pelear
(7,2)
Rendirse
(9,6)
24
B2
Invadir
A2
Ej
ercito Peque
no
No inv.
(8,8)
B1
Pelear
(3,6)
Rendirse
(8,5)
B3
No firmar trat.
Invadir
Ej
ercito Grande
A3
A1
No inv.
(7,7)
Firmar tratado
(8,8)
Figura 1.21: Juego de invasion extendido
del ejemplo, es que este resultado se sostiene gracias a lo que ocurrira fuera de la senda de equilibrio
seg
un las estrategias propuestas. En efecto, el mejor escenario para el pas A sera aquel en el que invade
contra un ejercito peque
no y el pas B se rinde, pero la razon por la que firma el tratado y no intenta
llegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituira un ejercito
grande.14 As, el resultado que observamos en la senda de equilibrio es consecuencia de las decisiones
que se tomaran en aquellos nodos que finalmente no ocurren.
Estrategias continuas
Al igual que en el caso de los juegos estaticos, en los juegos dinamicos podemos analizar y encontrar
equilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de calculo diferencial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg.
Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot,
existe una firma que elige su nivel de produccion q1 primero, denominada lder. La segunda firma,
llamada seguidora, observa esta cantidad y luego elige su propia produccion q2 . Suponiendo la misma
funci
on de demanda utilizada anteriormente, P (Q) = A Q, resolveremos el modelo por inducci
on
hacia atr
as. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar sus
beneficios, dado el nivel de q1 observado.
max(A q1 q2 )q2 cq2
q2
De la CPO se tiene que q2 (q1 ) = Aq21 c . Esta funcion coincide con la respuesta optima de la firma
en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretaci
on
es diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta funci
on
resume un plan contingente a cada posible cantidad q1 que pueda observar.
El siguiente paso de la inducci
on hacia atras es resolver el problema de la firma lder, teniendo
en cuenta la estrategia
optima de la seguidora. Esto es, la lder elige q1 tomando en cuenta que la
14 Del
mismo modo que en el asalto al banco, el cajero saba que llegado el momento el asaltante no explotara la bomba.
Microeconoma II
25
seguidora reaccionar
a de acuerdo a la funcion q2 (q1 ) = Aq21 c . Esto es completamente analogo a lo
que hemos hecho con los juegos din
amicos hasta ahora, donde para encontrar la accion optima de un
jugador tomamos en cuenta las acciones subsecuentes que resultan optimas. Por lo tanto, el problema
que resuelve la lder es
m
ax(A q1 q2 (q1 ))q1 cq1
q1
donde escribimos q2 (q1 ) para explicitar que en su decision esta tomando en cuenta que la seguidora
reaccionar
a de forma
optima al nivel de produccion elegido. Al resolver la CPO se obtiene que:
q1S =
Ac
2
Aq1 c
As, el perfil de estrategias de EPS viene dado por (q1S = Ac
), donde tal como en
2 , q2 (q1 ) =
2
el juego de invasi
on definimos la estrategia de la firma seguidora como un plan de accion contingente,
y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cual es el
resultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad optima q1S en la funci
on
que define la estrategia de la seguidora para obtener
q2S (q1S ) =
Ac
4
Ac
Es decir, en la senda de equilibrio se observara q1 = Ac
on del EPS es
2 y q2 = 4 . Entonces la predicci
que la firma lder produce m
as que en el modelo de Cournot, mientras que la seguidora produce menos.
Es f
acil verificar, reemplazando estas cantidades en la funcion de beneficios, que la firma lder esta mejor
que en el modelo de Cournot y que la seguidora esta peor.
A partir de esta u
ltima observaci
on surge la pregunta de que ocurre si la firma seguidora elige la
estrategia q2 (q1 ) = Ac
,
esto
es,
su
plan consiste en producir la cantidad de Cournot independiente
3
de cu
al sea la cantidad producida por q1 . Si la firma lder toma esa estrategia como fija, entonces su
estrategia
optima tambien ser
a la cantidad de Cournot. As, el perfil de estrategias (q1 = Ac
3 , q2 (q1 ) =
Ac
)
constituye
un
EN
puesto
que
aun
cuando
la
firma
seguidora
reconsiderara
su
estrategia
rgida
3
de siempre producir la cantidad de Cournot, observaremos que no tendra incentivos a cambiar su plan
de acci
on.
Sin embargo, este equilibrio se basa en una amenaza no creble de parte de la firma seguidora, la
cual es que si la lder produce la cantidad de Stackelberg, q1S , de todos modos la seguidora responder
a con
la cantidad de Cournot a pesar de que esta no es optima. En efecto, a partir de la induccion hacia atr
as
sabemos que cuando la lder produce q1S la seguidora prefiere responder con q2S , de modo que cuando
dice que producir
a la cantidad de Cournot es lo mismo que cuando el asaltante de banco deca que de
no recibir el dinero entonces explotara la bomba.
1.6.1.
Informaci
on perfecta e imperfecta
Una dimensi
on de los juegos din
amicos que hemos ignorado hasta ahora dice relacion con el conocimiento que tienen los jugadores respecto de como se ha desarrollado el juego hasta el momento en el que
les toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador,
sin que este sepa con precisi
on que es lo que ha hecho su contraparte previamente. Cuando ocurra esto,
hablaremos de juegos de informaci
on imperfecta. 15
Un caso sencillo de un juego de informacion imperfecta corresponde al ejemplo de matching pennies,
tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego
15 Recordemos que informaci
on completa se refera al hecho de que las funciones de pago de cada jugador (o sus preferencias) son de conocimiento p
ublico. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo que
un juego puede ser de informaci
on completa pero imperfecta.
Microeconoma II
26
est
atico, tambien podemos entenderlo como un juego dinamico, donde un jugador elige primero un lado
de la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva del
juego se representa en la figura1.22, donde la lnea punteadas denota el hecho de que cuando al jugador
2 le corresponde mover, no sabe si se encuentra en el nodo IIa o en el IIb .
I (Jugador 1)
S
C
(Jugador 2)IIa
C
IIb (Jugador 2)
S
u1 = 1
u2 = 1
u1 = 1
u2 = 1
u1 = 1
u2 = 1
u1 = 1
u2 = 1
C
(Jugador 2)IIa
C
u1 = 1
u2 = 1
IIb (Jugador 2)
S
u1 = 1
u2 = 1
C
u1 = 1
u2 = 1
S
u1 = 1
u2 = 1
Microeconoma II
27
del jugador 1 es {C, S}. En el caso de informacion incompleta, en cambio, el jugador 2 debe tomar una
u
nica decisi
on porque no sabe en cu
al nodo se ubicara. Dicho de otro modo, en los juegos de informaci
on
imperfecta, una coyuntura en la cual le corresponde mover a un jugador no es un nodo, sino que un
conjunto de informaci
on. As, para generalizar la nocion de estrategia desarrollada en la seccion anterior,
diremos que en juegos din
amicos una estrategia es un plan que indica que accion tomara el jugador en
cada posible conjunto de informaci
on en el cual le puede tocar jugar.
1.7.
Definici
on de juego en forma extensiva, subjuego y EPS
a. Cu
ando le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores)
b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo)
c. Que es lo que el jugador sabe cuando mueve (conjuntos de informaci
on)
3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad)
Tal como planteamos en la secci
on 1.2, para analizar una situacion estrategica desde la teora de
juegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para el
caso de un juego din
amico se resumen en la definicion de juego en forma extensiva recien entregada.
Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de informaci
on
del juego original con un u
nico elemento. En terminos del arbol de un juego, corresponde al conjunto
de nodos y ramas que nacen en los conjuntos de informacion con un u
nico elemento y que pueden
ser entendidos como un juego m
as peque
no. Cabe destacar que el juego original es un subjuego en
s mismo. Por ejemplo:
El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original que
nace en el nodo A.
El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego.
El juego de la figura 1.21 tiene 6 subjuegos: los sub-arboles que nacen en cada uno de sus nodos.
De estos tres ejemplos ya debiese quedar claro que para juegos de informacion perfecta, la cantidad
de subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de informaci
on
con un u
nico elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego).
El juego de la figura 1.22 tiene un u
nico subjuego: el juego completo. La razon por la cual los
nodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecen
a un conjunto de informaci
on mayor, lo que contradice la definicion de subjuego.
De los ejemplos anteriores salta a la vista que un subjuego no es mas que lo que queda de un
juego una vez que se ha alcanzado cierto nodo decision. Esta definicion resulta sencilla y pareciera que
Microeconoma II
28
pudimos haberla entregado antes para explicar concretamente que es un EPS. Sin embargo, es importante
entender que los nodos que no son un conjunto de informacion en si mismo no son el nacimiento de un
subjuego, y para ello primero tenamos que conocer el concepto de informacion imperfecta. Ahora que
hemos aclarado este punto, podemos definir formalmente un EPS.
Definici
on 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidas
por el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego.
Es decir, el EPS se diferencia de los demas EN del juego en el hecho de que si analizamos los subjuegos,
las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta optima.
Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN del
juego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb , el cual consiste en una
simple decisi
on entre las alternativas {B,NB}, la estrategia B no es optima, y por lo tanto no es un
EN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo induccion hacia atr
as
s verifica la definici
on recien planteada.
Microeconoma II
Captulo 2
Informaci
on incompleta
Como ya mencionamos en la introduccion, una de las dimensiones mas importantes a considerar en
muchas situaciones estrategicas es que es lo que saben los jugadores respecto de las caractersticas de los
dem
as. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa que
la estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarse
que ocurre cuando cierta informaci
on (como las preferencias o alguna otra caracterstica) no es de
conocimiento p
ublico. El objetivo de este captulo es introducir los conceptos necesarios para analizar
este tipo de situaciones, bas
andonos fundamentalmente en ejemplos sencillos que nos permitiran resaltar
los puntos relevantes a tener en consideracion.
2.1.
Juegos est
aticos de informaci
on incompleta
Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competencia
a la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y la
demanda inversa del mercado en el que compiten viene dada por P (Q) = AQ. Supongamos que la firma
1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene informaci
on
privada sobre su costo, el cual puede ser alto (ca ) o bajo (cb ). Concretamente, supondremos que la firma 1
solo sabe que con probabilidad se trata de una firma con costo alto y con probabilidad (1), de costo
bajo. Recordemos que para el caso de informacion completa la funcion de reaccion de cada firma dependa
de los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respecto
de los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al analisis. En
particular, para obtener una noci
on de equilibrio satisfactoria en un contexto de informacion incompleta
ser
a necesario replantearnos la forma en la que analizamos el comportamiento de los individuos.
Analicemos primero la decisi
on de la firma 2. Dado que esta conoce su costo con certeza, entonces es
natural pensar que su decisi
on
optima sera distinta seg
un cual sea el costo que efectivamente enfrente.
En efecto, si fijamos la cantidad que produce la firma 1 en alg
un valor q1 , la funcion objetivo de la firma
2 viene dada por a = (A q1 q2 )q2 ca q2 si enfrenta costos altos. En cambio, si el costo verdadero
de la firma es bajo (cb ), su funci
on de beneficios sera B = (A q1 q2 )q2 cb q2 . Si maximizamos cada
una de estas funciones respecto de q2 obtendremos que la respuesta optima de la firma 2 en funci
on de
su costo, se puede escribir como:
q2 (ca )
q2 (cb )
A q1 ca
2
A q1 cb
2
29
30
Podemos notar que corresponde a la misma funcion de reaccion que obtuvimos en el caso de informaci
on completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y su
comportamiento
optimo variar
a seg
un ocurra una o la otra.
Consideremos ahora la situaci
on que enfrenta la firma 1. Como ya se planteo, nuestro supuesto es que
esta no sabe si la firma 2 enfrenta costos altos o bajos, pero s sabe que existen solo dos valores posibles
(ca y cb ) y asigna cierta probabilidad a la ocurrencia de cada uno. Ademas, seguimos suponiendo que
cada jugador entiende que el otro act
ua de forma racional y buscando maximizar su ganancia, lo que
en este caso se traduce en que la firma 1 sabe que la 2 seguira una estrategia distinta seg
un sus costos
efectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia optima de la
firma 1, dadas ciertas cantidades q2 (ca ) y q2 (cb ) fijas, es aquella que maximiza su ganancia esperada:
1 = [(A q1 q2 (ca ))q1 cq1 ] + (1 ) [(A q1 q2 (cb ))q1 cq1 ]
Al derivar respecto de q1 y despejar obtenemos que la respuesta optima de la firma 1, a cualquier par
de cantidades q2 (ca ) y q2 (cb ), viene dada por:
q1 =
(A q2 (ca ) c) + (1 ) (A q2 (cb ) c)
2
As, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino que
para el caso de informaci
on completa: computar las funciones de reaccion. Las diferencias fundamentales
que se evidencian a partir del ejemplo son que: (1) hay que encontrar una funcion de reaccion para cada
caso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la funcion objetivo
relevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caractersticas de los
dem
as.
Una vez que hemos tenido en consideracion estas cuestiones, encontrar el equilibrio del juego se
reduce a calcular el perfil de estrategias en el cual las funciones de reaccion se intersectan. De la discusi
on
anterior se deduce que un perfil viene dado por las cantidades q1 , q2 (ca ) y q2 (cb ). Las tres funciones de
reacci
on ya planteadas constituyen un sistema que nos permiten calcular estas incognitas. En efecto, al
despejar se obtienen los siguientes resultados:
q1N
q2N (ca )
q2N (cb )
A 2c + ca + (1 )cb
3
A 2ca + c (1 )(ca cb )
+
3
6
A 2cb + c (ca cb )
3
6
El suprandice N hace referencia a Nash, pero en juegos de informacion incompleta muchas veces
se denomina equilibrio de Bayes-Nash. Aunque este u
ltimo concepto tiene una definicion formal que
da cuenta de las diferencias con el EN, lo importante para nuestros propositos lo podemos observar a
partir del ejemplo: el perfil de estrategias define una accion para cada posible realizacion de la firma
2 (ya que como discutimos esta actuara diferente seg
un los costos que enfrente) y la funcion objetivo
relevante da cuenta de la incertidumbre que implica la informacion incompleta (en este caso se trata de
la ganancia esperada dada la probabilidad ).
31
informaci
on privada que afectar
a la oferta maxima que estara dispuesto a hacer. Esto es particularmente relevante cuando las ofertas son a sobre cerrado, lo que no permite revelar informacion como cuando
existen ofertas sucesivas.
Para analizar esta situaci
on consideremos un ejemplo sencillo: se subasta un u
nico bien a 2 postores,
1 y 2, quienes solo pueden ofertar 0
o 30 unidades monetarias (suponga que si la oferta ganadora es 0,
el bien se vende de todos modos). En caso de que ambos hagan la misma oferta, se sortea el ganador
lanzando una moneda. La valoraci
on que tiene cada postor por el bien, vi , es informacion privada. Sin
embargo, cada uno sabe que esta solo puede tomar los valores 20 o 50, con probabilidad (1 ) y ,
respectivamente.
Sea yi una variable que toma el valor yi = 1 si el postor i gana la subasta y el valor yi = 0 en
caso contrario. Adem
as, denotamos por pi el precio que paga el individuo cuando gana la subasta. As,
podemos escribir la funci
on de utilidad del agente i como
ui (yi , pi , vi ) = (vi pi )yi ,
es decir, el pago es igual al excedente de la compra en caso de ganar, y 0 en caso contrario.
Tal como en el ejemplo de Cournot, una estrategia para el jugador i es una accion para cada posible
valoraci
on que pueda ocurrir, por lo que la denotaremos por bi (vi ). Por ejemplo, una posible estrategia
es ofertar 50 cuando tengo valoraci
on alta (bi (50) = 30) y ofertar 0 cuando es baja (bi (20) = 0). Como
el individuo 1 desconoce la valoraci
on que tiene el 2, no puede saber con certeza la oferta que hara este
u
ltimo aun cuando conozca su plan de accion, descrito por b2 (v2 ). Dada esta incertidumbre, la utilidad
esperada que busca maximizar viene dada por:
1
(v1 b1 ) Pr(b1 > b2 ) + (v1 b1 ) Pr(b1 = b2 ),
2
donde se observa claramente el trade-off entre hacer una oferta menor, con lo que aumenta el excedente
(v1 b1 ), y hacer una oferta mayor aumentando la probabilidad Pr(b1 > b2 ).
Como ya es usual, un perfil de equilibrio es un par de estrategias (b1 (v1 ), b2 (v2 )) tal que nadie puede
mejorar cambiando su propia estrategia. As, lo primero que podemos decir respecto de la estrategia
de equilibrio es que necesariamente bi (20) = 0, ya que cuando la valoracion es baja comprar el bien en
pi = 30 deja un excedente negativo. Con esto, solo nos falta determinar cual es la estrategia optima
cuando vi = 50. Para ello, fijemos la estrategia del jugador 2 en b2 (50) = 0 y analicemos cual es la
respuesta
optima del individuo 1, dado que v1 = 50. La informacion relevante se resume en la siguiente
tabla:
b1 (50)
Excedente si gana
Pr(ganar)
Utilidad Esperada
b1 = 0
50
1
2
25
b1 = 30
20
20
Si b1 = 0 entonces los jugadores empatan (fijamos que 2 juega 0 independiente de su tipo) y en ese caso
gana con probabilidad 0.5. lo que le deja un pago de 25. En cambio, si juega b1 = 30 gana con certeza, lo
que le deja un pago de 20. As, cuando el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 0), la mejor
respuesta del individuo 1 es (b1 (20) = 0, b1 (50) = 0). Como el problema es simetrico, tambien es cierto
que la mejor respuesta del jugador 2 a la estrategia (b1 (20) = 0, b1 (50) = 0) es (b2 (20) = 0, b2 (50) = 0.
Entonces hemos encontrado un equilibrio del juego en el cual cada individuo oferta 0 independiente de
la valoraci
on vi que le corresponda.
Lo anterior no descarta la posibilidad de que exista otro equilibrio, ya que aun no consideramos el
caso en que el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 50). Fijando esta estrategia, construimos
la misma tabla con informaci
on relevante:
Microeconoma II
b1 (50)
Excedente si gana
b1 = 0
50
b1 = 30
20
Pr(ganar)
1
2 (1
32
Utilidad Esperada
25(1 )
20 1 2
5
1
Por lo tanto, si > 1/3 se tiene que (b1 (20) = 0, b1 (50) = 30) es respuesta optima a (b2 (20) =
0, b2 (50) = 30) y este perfil -por simetra- sera de equilibrio. En caso contrario, la respuesta optima
ser
a (b1 (20) = 0, b1 (50) = 0), y por lo tanto el equilibrio en el que siempre se oferta cero sera u
nico.
Para analizar las implicancias de este resultado, fijemos por un momento un 1/3. En este caso se
obtiene una predicci
on interesante del comportamiento de los postores, ya que el sujeto i, aun teniendo
una valoraci
on de 50, no ofertar
a en equilibrio un monto de 30 que le asegura la posibilidad. En el
ejemplo esto se debe a que la probabilidad de que el individuo j tenga una valoracion alta (y por lo
tanto valga la pena competir ofertando 30) es relativamente baja. As, el incentivo a hacer una oferta
menor para obtener un mayor excedente domina -en este caso- al incentivo a hacer una oferta mayor
para llevarse el bien. En cambio, cuando > 1/3 el aumentar la probabilidad de ganar toma mayor
relevancia, por lo que en equilibrio los jugadores pueden terminar haciendo apuestas altas.
2.2.
Juegos din
amicos: Se
nalizaci
on
33
como una se
nal, bajo el supuesto de que para los individuos mas productivos resulta menos costoso
educarse. Lo interesante es que en la realidad es posible argumentar que muchas veces la educaci
on
formal, m
as que aumentar la productividad de un trabajador, es relevante para los empleadores porque
revela informaci
on sobre sus capacidades. As, modelar esta situacion como un juego de se
nalizaci
on
permite encontrar la racionalidad del fenomeno y estudiar sus implicancias.
Otros ejemplos de interes son los que estudian la relacion entre agentes que requieren fondos para
realizar un proyecto y los bancos o inversionistas que pueden prestar estos fondos. Si la calidad o
rentabilidad del proyecto no es clara para el banco, entonces las se
nales que pueden enviar los agentes
-como el interes que est
an dispuestos a pagar- se vuelven relevantes. Ejemplos de este tipo pueden
variar en distintas dimensiones que en cada caso sean de interes, como la capacidad de negociacion de
cada parte o la posibilidad de que el monto financiado afecte la rentabilidad del proyecto. Mas adelante
estudiaremos un ejemplo de este tipo de modelos.
Los juegos de se
nalizaci
on tambien tienen aplicaciones en poltica economica y monetaria. Los modelos de expectativas racionales donde el banco central (BC) es un agente optimizador que tiene interes
tanto en el nivel de producto como en la inflacion, llevan a los conocidos resultados de equilibrios ineficientes donde el BC permite una inflacion mayor sin lograr su objetivo de aumentar el producto.
Subyacente a este resultado est
a el par
ametro de aversion a la inflacion del BC. As, en un modelo con
varios perodos, el ente monetario puede utilizar la inflacion de los primeros perodos como un mensaje
para se
nalizar que es averso a la inflaci
on (inverte en reputacion), lo que le permitira en perodos futuros
aumentar el producto a costa de una inflacion mayor.
Vemos as que los juegos de se
nalizacion tienen aplicaciones de interes en distintos temas y areas. Lo
ideal es tener una estructura relativamente sencilla que nos permita analizar estas situaciones con un
enfoque unificado, basado en la teora de juegos. Por lo tanto, a continuacion se enlistan los elementos
necesarios para definir un juego de se
nalizacion basico:
Existen dos jugadores, llamados Emisor y Receptor.
El emisor es de alg
un tipo ti perteneciente a un conjunto de tipos factibles T = {t1 , ..., tn }.
Cada tipo tiene a priori una probabilidad de ocurrencia p(ti ) > 0, conocida por el receptor.
El emisor observa su tipo ti y elige un mensaje mj de un conjunto de mensajes factibles M =
{m1 , ..., mj }.
El receptor observa mj (pero no ti ) y elige una accion ak del conjunto de acciones factibles
A = {a1 , ..., ak }.
Los pagos vienen dados por las funciones Ue (ti , mj , ak ) y Ur (ti , mj , ak ) para el emisor y receptor,
respectivamente.
Para observar una expresi
on concreta de esta estructura, estudiaremos un ejemplo basado en el
modelo de Myers y Majluf (1984) que analiza el problema de una empresa que requiere conseguir financiamiento de un inversionista que no conoce la rentabilidad del proyecto. As, la oferta de participaci
on
que le hace la empresa al inversionista constituye un mensaje que puede entregar informacion al respecto.
Microeconoma II
34
El empresario, una vez que observa su tipo, hace una oferta de participacion en los beneficios de la
empresa al inversionista s, de modo que 0 s 1. El inversionista observa s y decide si acepta o rechaza
participar del proyecto. En caso de rechazar la oferta, los pagos son de I(1 + r) para el inversionista y
para el empresario, ya que el proyecto no se realiza. En caso de aceptar, cada uno recibe su participaci
on
en el beneficio total generado por la empresa con proyecto: s( + R) para el inversionista y (1 s)( + R)
para el empresario.
En terminos de la estructura descrita anteriormente, tenemos que T = {A, B}, p(A) = y p(B) =
(1 ), M = [0, 1], A = {Acepta, Rechaza}, y las funciones de pago son:
si a = Rechaza
Ue (, s, a) =
(1 s)( + R)
si a = Acepta
I
si a = Rechaza
Um (, s, a) =
s( + R)
si a = Acepta
Una cuesti
on fundamental en los juegos de se
nalizacion son las conjeturas que hace el receptor
respecto del tipo del emisor una vez que observa los mensajes. Es natural pensar que estas deben
estar basadas en las probabilidades a priori definidas por p(ti ), pero como veremos tambien deben ser
coherentes con la estrategia del emisor. Por ahora, supongamos que dado un mensaje s fijo, el receptor
considera que con probabilidad q se trata de una firma tipo B. Dado esto, aceptara la oferta si y s
olo si
su beneficio esperado es mayor que el costo de oportunidad del proyecto, q s(B +R)+(1q)s(A+R)
I(1 + r). Esta condici
on se puede reescribir como:
s
I
(qB + (1 q)A + R)
Por su parte, un empresario de tipo solo estara dispuesto a recibir el financiamiento si la participaci
on
s que otorga al inversionista cumple la condicion de que el pago que recibe con proyecto es mayor que
el pago sin proyecto, (1 s)( + R) . Despejando s se obtiene la condicion:
s
R
+R
general, un equilibrio mezclador es aquel en que todos los tipos envan el mismo mensaje
Microeconoma II
35
Si ambos tipos ofrecen s(A) = s(B) = 1/5, el inversionista rechaza el proyecto, ya que 1/5 < 5/12
por lo que no se cumple la condicion.
Notemos que la condici
on bajo la cual la firma A prefiere hacer el proyecto es, para los parametros
particulares, sA 21 . As, no puede haber un equilibrio mezclador en el que s(A) = 2/3, ya que la
firma preferir
a hacer la oferta 1/5 que le entrega mayor beneficio sin importar si el inversionista acepta
o rechaza. Por otro lado, el equilibrio mezclador s(A) = s(B) = 1/5 tampoco puede ocurrir, ya que
la firma tipo B preferir
a ofrecer 2/3 con tal de realizar el proyecto y obtener 1/3 de 20 en vez de su
beneficio sin proyecto (que es 5). Por lo tanto, concluimos que en este caso no puede existir un equilibrio
mezclador.
Analicemos ahora la existencia de un equilibrio separador, esto es, un perfil en el que los distintos
tipos envan distintos mensajes. Cuando ello ocurre, el mensaje es completamente informativo del tipo
del individuo y esto tiene que influenciar la conjetura del receptor. Por ejemplo, si tenemos que la firma
sigue la estrategia s(A) = 2/3 y s(B) = 1/5, entonces la conjetura de la firma cuando observa s = 2/3
es que la firma es tipo A con certeza, y cuando observa s = 1/5 es que la firma es tipo B con certeza.
Con la noci
on de conjetura aclarada para un equilibrio separador, podemos analizar entonces los
casos separadores:
Dado s(A) = 2/3 y s(B) = 1/5, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 20, que
es menor a la inversi
on de 10) y acepta ante 2/3. Dado esto, la firma tipo B tiene incentivos a
desviarse, ya que si enva el mensaje 2/3 el inversionista aceptara y obtendra mayor beneficio.
Dado s(A) = 1/5 y s(B) = 2/3, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 30, que es
menor a la inversi
on de 10) y acepta ante 2/3. En este caso la firma tipo A no tiene incentivos a
desviarse (porque prefiere su beneficio sin proyecto de 15 antes los 10 que recibe si se queda con
1/3 del proyecto), y la firma B tampoco porque siempre prefiere realizar el proyecto.
Por lo tanto, en nuestro ejemplo el u
nico equilibrio es uno separador en el que la firma tipo A
ofrece una porci
on peque
na de las ganancias, la tipo B ofrece una porcion grande, y por lo tanto el
inversionista solo acepta la propuesta de esta u
ltima. Aunque en el caso mas general puede existir un
equilibrio mezclador (donde la inversi
on siempre se realiza), la existencia del separador no se debe a la
particularidad del ejemplo pues este siempre existe. En el caso de que se de un equilibrio separador,
la implicancia del modelo es que el resultado es suboptimo dado que realizar el proyecto siempre es
rentable. El problema que genera la informacion incompleta se observa en la condicion de participaci
on
del inversionista ante un mensaje mezclador, donde la firma A esta sujeta a ofrecer una participaci
on
mayor al inversionista, ya que este no esta seguro si los beneficios seran altos o bajos.
As, los juegos de se
nalizaci
on se pueden usar en aplicaciones generales donde se observa que la
asimetra de informaci
on entre dos agentes genera alg
un problema de eficiencia. Por ejemplo, el modelo
de se
nalizaci
on en el mercado laboral mencionado mas arriba, en el cual la educacion se utiliza como
se
nal, se pueden generar ineficiencias en el caso en el que la educacion es productiva (los trabajadores
de alta productividad se educan m
as que lo eficiente con tal de se
nalizar y diferenciarse de los menos
eficientes).
Microeconoma II