You are on page 1of 36

Microeconomı́a II

Teorı́a de Juegos y Aplicaciones

Aldo González T. Daniel Hojman T.

Fabián Sepúlveda C.

Esta versión: 10 de marzo de 2014, Primera versión: Agosto 2012


Capı́tulo 1

Teorı́a de Juegos

1.1. Introducción

En muchas situaciones donde un sujeto debe tomar una decisión, el resultado que obtenga depen-
derá no solo de sus propias acciones, sino también de las decisiones que tomen otros individuos. Por su
parte, los resultados de esos otros individuos también dependen de la decisión del sujeto en cuestión.
Ası́, un agente en este tipo de situación se cuestionará qué harán los demás... y qué piensan los demás
que hará él mismo. Esta interdependencia -que se puede observar en una amplia variedad de situacio-
nes sociales- se conoce como interacción estratégica. Cuando la interacción estratégica sea un elemento
fundamental en la toma de decisiones entre individuos, hablaremos de situación estratégica.
El objetivo de la teorı́a de juegos es estudiar el comportamiento de individuos en situaciones es-
tratégicas. Y aunque el énfasis está puesto en las decisiones que son tomadas de forma individual, una
de las dimensiones más interesantes de la teorı́a es que permite hacer predicciones respecto de los resul-
tados agregados que divergen de los resultados clásicos en economı́a, en el sentido de que la motivación
individual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. Más en ge-
neral, la teorı́a de juegos es útil para analizar diversas situaciones de interés económico, como mercados
poco competitivos, asimetrı́as de información, cumplimiento bajo contratos incompletos, etc. Además,
tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biologı́a.

Una tipologı́a de juegos


Algo que conviene tener en mente antes de comenzar el estudio formal de la teorı́a de juegos es que,
dependiendo del contexto o la situación que nos interese, la interacción estratégica puede manifestarse en
diferentes formas. Por ejemplo, la situación estratégica más sencilla que podemos pensar es una en la cual
cada agente involucrado debe tomar una decisión de forma simultánea considerando el efecto que tienen
las decisiones de los demás en el resultado propio. Pero pensemos, por otro lado, en un juego de ajedrez
donde cada jugador toma decisiones en función de lo que ha ocurrido previamente y de lo que espera que
ocurrirá en el futuro. En este último caso existe un elemento secuencial relevante, pues las decisiones
tomadas en por un jugador incidirán en las jugadas subsecuentes. Ası́, cuando analicemos situaciones del
primero tipo hablaremos de juegos estáticos, mientras que en el segundo caso nos referiremos a juegos
dinámicos.
Otro elemento que puede diferir según la situación que nos interese dice relación con la información
que posee cada jugador respecto de los demás. Por ejemplo, pensemos en una subasta a sobre cerrado,
donde cada potencial comprador debe hacer una única oferta y aquel que ofrezca un mayor pago se lleva

1
Facultad de Economı́a y Negocios - Universidad de Chile 2

el bien subastado. Si un postor no conoce la valoración de los demás por el bien en cuestión, entonces
se enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador,
u ofrecer un pago más bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En este
ejemplo, la valoración que tiene cada comprador sobre el bien es información valiosa, en tanto el poseerla
o no incidirá en la decisión tomada.
Cuando en una situación estratégica no exista información privada como la descrita en el párrafo
anterior, hablaremos de juegos de información completa, mientras que cuando existe información sobre
los jugadores que no sea de conocimiento común se tratará de juegos de información incompleta. Ası́, una
tipologı́a de juegos muy general nos permite clasificar las diferentes situaciones estratégicas en cuatro
categorı́as:

Juegos estáticos de información completa


Juegos dinámicos de información completa
Juegos estáticos de información incompleta
Juegos dinámicos de información incompleta

Cada uno de estos tipos de juego involucra -en términos de la teorı́a- conceptos e instrumentos le-
vemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estará puesto sobre los
juegos de información completa, partiendo por los de tipo estático, para luego analizar las situaciones
que requieran un elemento dinámico. Los juegos de información incompleta, aunque no serán estudiados
al mismo nivel de profundidad, serán relevantes en el capı́tulo correspondiente a economı́a de la infor-
mación.

Ejemplos clásicos
En las siguientes secciones estudiaremos en detalle la terminologı́a y las técnicas que se utilizan al
analizar situaciones estratégicas bajo la perspectiva de la teorı́a de juegos. Pero para introducir cuáles
serán los elementos básicos en los que pondremos nuestra atención, a continuación se muestran algunos
juegos clásicos que son útiles para ejemplificar ciertos tipos de interacción estratégica donde destaca
alguna dimensión como la cooperación, la coordinación, el conflicto, etc.
El primer ejemplo que revisaremos es probablemente uno de los juegos más famosos, conocido como el
dilema del prisionero. La situación consiste en dos sospechosos que han sido arrestados y son mantenidos
en celdas separadas. La policı́a solo tiene evidencia suficiente para acusar a cada uno de un delito menor,
pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro
(confesar). Ası́, si ambos guardan silencio (callar) entonces cada uno será sentenciado por el delito
menor y pasará un año en prisión. Si solo uno de ellos confiesa, entonces será liberado por cooperar con
la policı́a, mientras que su cómplice será condenado a 9 meses. Finalmente, si ambos confiesan entonces
cada uno pasará 6 meses en prisión.
Aunque toda la información relevante para entender esta situación se encuentra en el párrafo anterior,
muchos juegos en los que nos interesaremos pueden ser resumidos de forma cómoda en lo que se conoce
como una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuación:

Prisionero 2
Callar Confesar
Callar -1, -1 -9, 0
Prisionero 1
Confesar 0, -9 -6, -6

Figura 1.1: Dilema del prisionero

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 3

La forma en la que está escrita esta matriz nos indica que el jugador que llamamos “prisionero 1”
elige una acción entre las dos posibles filas “callar” y “confesar”. Por su parte, el “prisionero 2” puede
elegir entre las mismas alternativas, pero que en la matriz están representadas por las columnas. Los
números en cada celda de la matriz nos indican los pagos que recibe cada uno según las estrategias
escogidas, donde convencionalmente se entiende que el primer número corresponde al pago del jugador
que elige filas (prisionero 1 en este ejemplo), mientras el segundo corresponde al pago del jugador que
elige columnas. Por ejemplo, si el prisionero 1 elige confesar y el 2 callar, la celda correspondiente indica
(0, −9) porque aquel que confesó saldrá libre mientras que el que calló será condenado a 9 meses. En
general, los números asociados a los pagos no tienen por qué tener una interpretación concreta como en
este caso, y los utilizaremos simplemente para indicar que aquellos resultados con un pago mayor son
preferidos a los que tienen un pago menor.
Viendo la matriz de pagos es fácil notar que resulta más conveniente para ambos la situación en la
que cada uno guarda silencio por sobre la alternativa en la que cada uno confiesa. Ası́, el resultado en
el que ambos eligen “callar” es uno cooperativo, en tanto les permite asegurar una sentencia menor. El
dilema está en el hecho de que bajo el resultado cooperativo, existe una tentación individual a romper la
cooperación y confesar para salir en libertad. Esta tensión entre la cooperación social y el interés propio
se presenta en diversas situaciones cotidianas (es el mismo principio que se aplica en el análisis de la
provisión de bienes públicos), y es capturada de forma sencilla en este juego. El análisis de los posibles
resultados de este juego lo dejamos para las secciones siguientes.
Para motivar el siguiente ejemplo, pensemos en situaciones donde la cooperación no es lo relevante,
sino que los intereses de los jugadores están completamente contrapuestos porque -por ejemplo- lo que
gana uno lo pierde el otro.1 Un juego que ejemplifica esto se conoce como matching pennies y consiste
en dos jugadores, cada uno de los cuales tiene una moneda y debe mostrar una cara de esta. Si ambos
muestran la misma cara, entonces el jugador 1 gana el juego y se lleva las dos monedas; mientras que si
muestran distintas caras, entonces el jugador 2 gana el juego y el derecho a quedarse las monedas. Esta
mecánica se resume en la siguiente matriz de pagos:

Jugador 2
Cara Sello
Cara 1, −1 −1, 1
Jugador 1
Sello −1, 1 1, −1

Figura 1.2: Matching Pennies

En este tipo de juegos el conflicto entre los jugadores es el elemento relevante, y la razón fundamental
por la que existe interacción estratégica es porque a cada uno le gustarı́a saber qué es lo que hará el
otro pero que el otro no sepa lo que hará el primero. Podemos pensar -por ejemplo- en la ejecución de
forma simplificada de un penal en un partido de fútbol: el arquero debe elegir si saltar a la izquierda o
a la derecha, mientras que el tirador debe elegir si patear a la izquierda o a la derecha. Al igual que en
el juego de las monedas, el éxito de uno de los jugadores significa el fracaso del otro.
Otro elemento que puede resultar relevante en ciertas situaciones, y que podemos capturar en un
juego sencillo, es la coordinación. El ejemplo clásico en este contexto se conoce como la batalla de los
sexos 2 , cuya historia cuenta que una pareja tenı́a una cita, pero cada uno olvidó el lugar de encuentro
(que puede ser un partido de fútbol o el museo) y ya no pueden ponerse en contacto para aclararlo.
1 A veces se denominan juegos de suma cero, pues no se generan ganancias netas de la interacción entre los agentes.

Esto es, dado algún resultado, la suma de los pagos de los jugadores es cero.
2 El nombre es un tanto anacrónico, pues hace referencia a una concepción sexista de las preferencias por entretención.

En los ejemplos modernos del juego, como el que se presenta aquı́, se intenta eliminar este elemento aun cuando se conserva
el nombre.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 4

Además, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el fútbol y
Manuel por el museo), pero que de todos modos ambos prefieren la compañı́a del otro por sobre ir a su
lugar favorito solos. Ası́, la matriz de pagos asociada al juego es la siguiente:

Manuel
Fútbol Museo
Fútbol 2,1 0,0
Josefa
Museo 0,0 1,2

Figura 1.3: Batalla de los sexos

En este caso el conflicto no es la dimensión relevante, sino la necesidad de coordinación para alcanzar
un resultado conveniente. Como cada uno tiene preferencias distintas respecto de los lugares de encuen-
tro, no resulta obvio a cuál de estos deben dirigirse y eventualmente pueden terminar en diferentes sitios,
lo que no es conveniente en ningún caso.
Los ejemplos anteriores son una muestra del tipo de problemáticas que se puede capturar de manera
muy sencilla en forma de juegos con dos estrategias y dos jugadores. Sin embargo, estudiaremos juegos
con estructuras más generales, donde puede haber más jugadores u otros tipos de estrategias. Para esto,
en la siguiente sección se introducen los conceptos que utilizaremos a lo largo del curso y se define de
manera formal la idea de juego introducida con estos ejemplos.

1.2. Conceptos básicos y definición de juego

Para el estudio formal de la teorı́a de juegos requerimos de un marco teórico sobre el cual poder
trabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos en
juegos que básicamente son una situación cotidiana y que resultan intuitivos de entender, para poder
utilizar el instrumental que la teorı́a nos entrega necesitamos definir de forma concreta ciertos aspectos
que resultan claves para entender la interacción estratégica que puede darse entre los agentes en la
situación que queramos estudiar.
Ası́, si queremos analizar situaciones estratégicas desde una perspectiva de juegos, es necesario que
nos preguntemos cuestiones como, ¿quiénes toman decisiones relevantes en esta situación?, ¿cuáles son
las distintas opciones que tiene cada uno?, ¿cuáles son las preferencias que tienen sobre los posibles
resultados finales cada jugador?. Esta última pregunta es particularmente relevante ya que en ella
está implı́cita la potencial interacción estratégica presente en el juego.
En términos generales, los elementos que hay que definir con precisión para estructurar un juego son:

Jugadores: Son los agentes (individuos, firmas, organizaciones, paı́ses, etc) que toman decisiones rele-
vantes en la determinación del resultado final.
Estrategias: Estas explicitan cuál es la decisión que debe tomar cada jugador, y entre cuáles alterna-
tivas puede elegir. Notar que esta noción es bastante general, ya que una estrategia puede ir desde
algo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaborado
como elegir un plan de acción completo para cada posible situación en la que se encuentre el
jugador.
Pagos: Corresponde a alguna forma de definir la valoración que tienen los individuos respecto de los
posibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 5

A por sobre el B, y éste último por sobre el C), o una función de utilidad definida sobre las
estrategias de todos los jugadores.
Reglas del juego: Es fundamental definir si las decisiones se toman en forma simultánea o existe algún
elemento temporal, y en este último caso, determinar qué información se maneja al momento de
tomar una decisión3 .

Podemos notar que son varias las dimensiones a tener en consideración al momento de analizar
una situación estratégica. Es por ello que nos gustarı́a resumir todas las caracterı́sticas de un juego en
alguna estructura relativamente simple y bien definida. Para este propósito existen dos maneras básicas
de plantear un juego: las denominadas forma normal y forma extensiva. En esta sección vamos a definir
un juego en forma normal, y dejaremos la forma extensiva para el caso de juegos secuenciales, en donde
nos resultará más útil.
Antes de entregar una definición formal de juego en forma normal estudiaremos un ejemplo diferente a
los vistos en la sección anterior. Se trata de un modelo de competencia imperfecta entre firmas, conocido
como modelo de Cournot. Pensemos en un mercado en el cual existen dos empresas que producen un
mismo bien, cuya demanda agregada está dada por una función P (Q) = A − Q, donde P es el precio de
mercado y Q la producción agregada. Cada una de las firmas i = 1, 2 elige una cantidad a producir qi ,
de modo que Q = q1 + q2 . Además cada firma enfrenta un costo marginal constante que denotaremos c.
Ası́, los beneficios de cada firma están dados, respectivamente, por:

π1 = (A − q1 − q2 )q1 − cq1

π2 = (A − q1 − q2 )q2 − cq2

La competencia que se da entre estas firmas al momento de elegir sus niveles de producción en forma
simultánea, puede ser entendida como un juego. En efecto, la interacción estratégica es fundamental
en este caso, ya que el precio que enfrente la firma dependerá de la producción de su competidora, y
ası́ dependerá también su nivel de producción óptimo.
Lo relevante del ejemplo -por el momento- es notar que este juego, aun cuando solo tiene 2 jugadores,
no puede ser escrito de forma matricial, porque cada jugador tiene un conjunto de posibilidades muy
grande sobre el cual elegir: cualquier nivel de producción (número real) es un nivel de producción factible
para la firma. Ası́, escribir este juego en forma matricial no es solo poco conveniente, sino que es imposible
ya que se trata de un espacio de estrategias continuo.
Pero además de enfrentarnos a diferentes tipos de estrategias según el tipo de juego, podemos enfren-
tarnos a otras situaciones que hacen de la matriz de pagos un esquema poco conveniente en varios casos.
Pensemos, por ejemplo, en el mismo juego de competencia a la Cournot, pero con n firmas, donde Pn n es
un número cualquiera mayor que 1. En este caso, la producción agregada viene dada por Q = i=1 qi ,
y tenemos que la función de beneficio es, para cada firma:
 
Xn
πi = A − qj  qi − cqi ∀i = 1, ..., n
j=1

Tener una cantidad mayor de jugadores también hace complicado el uso de las matrices de pagos
para plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto más general para definir
un juego, que nos permita utilizar los conceptos desarrollados por la teorı́a en diversas situaciones,
independiente de cuestiones como el tipo de estrategias existentes o el número de jugadores. Este esquema
es la forma normal de un juego.
3 Una cuestión clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidas

por los que jugaron antes que él.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 6

Para definir formalmente esta estructura, introduciremos un poco de notación que será utilizada
regularmente en lo sucesivo. Consideraremos juegos de n jugadores, que serán indizados por la letra i,
de modo que i = 1, ..., n. Además denotaremos con Si al conjunto de estrategias del jugador i-ésimo, y
con si ∈ Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemos
como perfil de estrategias s = (s1 , s2 , ..., sn ) a una combinación particular de estrategias individuales.
Finalmente, la información respecto a las preferencias o pagos puede ser resumidas en funciones de
utilidad que asocian a cada perfil de estrategias s un número real ui (s), de modo que si un perfil s̄ es
preferido a un perfil s̃ por el individuo i, se cumple que ui (s̄) > ui (s̃).4
Definición 1. Un juego en forma normal viene dado por:

1. Un conjunto de n jugadores, denotado por I


2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponibles
para cada uno
3. Una función de utilidad ui (s1 , ..., sn ) para cada jugador i = 1, ..., n, que define el pago que recibe
el jugador i si el juego se resuelve según el perfil (s1 , ..., sn )

Formalmente, podemos resumir toda la información del juego en una estructura G = hI, {Si }ni=1 , {ui }ni=1 i

Esta forma de definir un juego es particularmente conveniente para el caso de juegos estáticos,
donde cada jugador elige simultáneamente una acción entre un conjunto de posibilidades. Por ejemplo,
para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si =
{Callar, Confesar} y un posible perfil de estrategias serı́a (Callar, Callar).5 La función de utilidad en
este caso es discreta, y se puede escribir como:


 −1 si (s1 , s2 ) = (Callar, Callar)
−9 si (s1 , s2 ) = (Callar, Confesar)

u1 (s1 , s2 ) =
 0 si (s1 , s2 ) = (Confesar, Callar)

−6 si (s1 , s2 ) = (Confesar, Confesar)

y de forma análoga para el jugador 2. Notar que en este ejemplo en particular se trata de un juego
simétrico, donde las estrategias y los pagos son iguales para cada jugador. En general, esto no tiene
por qué ser ası́, y podemos pensar en juegos donde cada jugador toma distintas decisiones y/o tiene
diferentes preferencias sobre los potenciales resultados.
Por su parte, para el caso de la competencia a la Cournot con n firmas, el juego queda definido por
los siguientes elementos:

I = {1, 2, ..., n}
Si = R, para cada i en I
 Pn 
ui (q1 , ..., qn ) = A − j=1 qj qi − cqi , para cada i en I

Podemos notar que aunque este juego es mucho “más grande” que los juegos de la introducción, en
el sentido de que hay n jugadores e infinitas estrategias disponibles para cada uno, la forma normal del
4 Notar que, tal como estudiamos en Microeconomı́a I, la función de utilidad tiene un carácter ordinal. Esto es, los

números que entrega no tienen necesariamente interpretación en si mismo, sino que indican la preferencia de un resultado
del juego por sobre otro
5 Una aclaración de notación: en el primer caso utilizamos los sı́mbolos { } porque estamos haciendo referencia a un

conjunto -el de todas las opciones disponibles para el jugador i-, mientras que en último utilizamos ( ) porque se trata
de un par ordenado -el que indica las estrategias seguidas por los jugadores 1 y 2 respectivamente.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 7

juego resume toda la información relevante de una forma cómoda y nos permitirá utilizar el instrumental
que estudiaremos en las secciones siguiente sin restringirnos a estructuras muy particulares (como lo
son, por ejemplo, las matrices de pagos).

1.3. Estrategias dominantes y dominadas

El objetivo de estudiar teorı́a de juegos es ser capaces de hacer predicciones sobre cuál resultado
podrı́amos esperar que se diera en una situación estratégica. Ası́, el paso natural luego de formalizar
la idea de juego es preguntarse cómo lo resolvemos, o más en general, qué podemos decir respecto del
comportamiento esperado de los jugadores. Los conceptos presentados a continuación son una primera
aproximación a estas preguntas.
Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuestión probable-
mente se estarı́a preguntando si su cómplice va a confesar o guardará silencio. Si el otro va a confesar,
entonces lo mejor para él serı́a confesar también, pues de ese modo pasarı́a 6 meses en prisión, en vez
de los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugador
preferirı́a confesar, pues ası́ sale libre por cooperar con la policı́a, en vez de pasar un mes cumpliendo
sentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le con-
vendrá confesar. En este caso, diremos que “confesar” es una estrategia dominante para el jugador, ya
que otorga un pago mayor sin importar cuál es la estrategia que siga el otro.
Definición 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejor
pago para ese jugador, sin importar cuál estrategia sigan los demás jugadores.

En el caso del dilema del prisionero, la estrategia “confesar” es dominante para cada jugador, por lo
que proponer que ambos seguirán esta estrategia parece una predicción natural. Ası́, de acuerdo a este
criterio, el resultado del juego serı́a (confesar, confesar) según lo cual cada jugador recibe un pago de
(−9).
Aunque plantear que un jugador siempre preferirá una estrategia dominante por sobre otras estra-
tegias resulta muy intuitivo y es potencialmente una buena predicción de los resultados de un juego,
nos enfrentamos al problema de que no siempre existirán este tipo de estrategias. En efecto, en general
tendremos que la estrategia óptima de cada jugador variará según las estrategias que sigan los demás,
lo cual es un elemento la mayorı́a de las veces relevante en situaciones estratégicas. Ası́, el concepto de
estrategia dominante puede ser muy atractivo, pero poco útil en muchas aplicaciones.
Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otro
concepto útil e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existe
otra estrategia que siempre resulta más conveniente. Consideremos el siguiente ejemplo para ver de
qué se trata:

Jugador B
Izquierda Centro Derecha
Arriba 10,10 14,12 14,15
Jugador A Medio 12,14 20,20 28,15
Abajo 15,14 25,28 25,25

Figura 1.4: Estrategias dominadas

Comprobemos en primer lugar que no existen estrategias dominantes. En efecto, si el jugador B


juega centro, el A preferirá abajo (porque 25 es preferido a 20 y a 14), mientras que si el B elige derecha,

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 8

entonces al A le convendrá jugar medio (porque 28 es preferido a 25 y a 14). Ası́, no existe una estrategia
para el jugador A que sea óptima en cualquier caso (de forma análoga se puede comprobar que para el
B tampoco existe).
No obstante, en este juego sı́ existen estrategias dominadas. Por ejemplo, la estrategia “arriba” es
dominada por la estrategia “medio” para el jugador A, ya que esta última le entrega un pago mayor sin
importar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). Ası́, aun cuando “medio”no es una estrategia
dominante según lo discutido en el párrafo anterior, sı́ es correcto afirmar que domina a la estrategia
“arriba”.
Definición 3. La estrategia s0i está estrictamente dominada por la estrategia s00i para el jugador i, si
es que ui (s1 , ..., s00i , ..., sn ) > ui (s1 , ..., s0i , ..., sn ) para cualquier combinación de estrategias de los demás
jugadores (s1 , ..., si−1 , si+1 , ..., sn ).

De la definición se desprende que la estrategia s00i no es necesariamente una estrategia dominante, ya


que es superior bajo cualquier circunstancia solamente respecto de la estrategia s0i . En nuestro ejemplo
vimos que la estrategia “medio” del jugador A no siempre es superior a la estrategia “abajo”, pues
dependı́a de la estrategia jugada por B; sin embargo, es claro que “medio” sı́ es superior a “arriba”, sin
importar lo que haga B.
Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilema
del prisionero para proponer un potencial resultado del juego. ¿En qué nos pueden ayudar entonces las
estrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizará una estrategia estric-
tamente dominada, pues no importa qué supuesto haga sobre la estrategia que seguirá el otro jugador,
siempre tendrá una alternativa superior a la estrategia que está dominada. Más aun, si nos ponemos en
el lugar del jugador B -quien está conjeturando sobre la posible estrategia que seguirá su contraparte-
es razonable pensar que descartará la posibilidad de que el jugador A siga una estrategia estrictamen-
te dominada, como lo es la estrategia “arriba”. Ası́, ambos jugadores eliminarán esta posibilidad y se
enfocarán en un juego reducido que no considera la estrategia estrictamente dominada:

Jugador B
Izquierda Centro Derecha
Medio 12,14 20,20 28,15
Jugador A
Abajo 15,14 25,28 25,25

Figura 1.5: Juego reducido

Si analizamos para este nuevo juego las posibilidades del jugador B, notaremos que la estrategia
“centro” es estrictamente dominante. Como la existencia de una estrategia estrictamente dominante
no es más que un caso en el que todas las estrategias -excepto una- están estrictamente dominadas,
utilizando el mismo criterio que en el paso anterior podemos eliminar “izquierda” y “derecha” para
obtener una nueva versión reducida del juego.

Jugador B
Centro
Medio 20,20
Jugador A
Abajo 25,28

Figura 1.6: Juego reducido

En este último juego, mucho más sencillo que el original, se tiene que el jugador A tiene certeza

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 9

respecto del resultado de su decisión, por lo que seguirá la estrategia que le otorga un mayor pago:
“abajo”.6 Este proceso se denomina eliminación iterativa de estrategias estrictamente dominadas. Ası́,
bajo el criterio de eliminar estrategias estrictamente dominadas, podemos proponer que un resultado
probable de este juego será el perfil (abajo, centro).
Definición 4. Un perfil de estrategias es un equilibrio por eliminación iterativa de estrategias
estrictamente dominadas si es el único perfil que sobrevive al procedimiento de eliminación.

La eliminación iterativa de estrategias estrictamente dominadas es un criterio más general que el


de estrategias dominantes que revisamos en primer lugar, y por lo tanto es útil en más situaciones.
Sin embargo, seguirán existiendo juegos donde no existirán estrategias estrictamente dominadas, por
lo cual requeriremos de otros instrumentos para analizarlos y poder proponer posibles resultados. La
siguiente sección se dedica a elaborar el concepto más ampliamente utilizado en teorı́a de juegos para
este propósito, conocido como equilibrio de Nash.

1.4. Equilibrio de Nash

Probablemente el concepto más importante en teorı́a de juegos es el denominado Equilibrio de Nash,


llamado ası́ por el matemático estadounidense John F. Nash, quien ganó el premio Nobel de economı́a
en el año 1994 por su contribución fundamental a esta área. La potencia de este concepto radica en que
se basa en una idea sencilla, pero muy general, y por lo tanto es útil al momento de analizar diversas
situaciones estratégicas sin que se requiera la existencia de conceptos más exigentes, como el de estrategia
dominada.
La intuición detrás del equilibrio de Nash (EN), es que si se propone que un juego tendrá cierto perfil
de estrategias como resultado, lo mı́nimo que se puede pedir es que este perfil sea estratégicamente estable,
en el sentido de que ningún jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otro
modo, si existe alguna razón para pensar que los jugadores seguirán ciertas estrategias7 , entonces cada
uno de ellos puede hacer esta conjetura. Si bajo esa conjetura algún jugador tiene incentivos a cambiar
de estrategia, entonces serı́a ingenuo proponer la conjetura como un resultado del juego, ya que aquel
jugador con incentivos a desviarse de la estrategia conjeturada probablemente tomará la alternativa que
le resulta más conveniente. Formalmente,
Definición 5. En un juego de n jugadores, el perfil de estrategias s∗ = (s∗1 , ..., s∗n ) es un equilibrio de
Nash si, para cada jugador i, s∗i es una mejor respuesta a las estrategias de los otros (n − 1) jugadores.
Esto es, la desigualdad:
ui (s∗1 , ..., s∗i , ...s∗n ) ≥ ui (s∗1 , ..., si , ..., s∗n )
se cumple para cada posible estrategia si en Si .

Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibrio
de los demás jugadores. Para entender cómo a partir de esta idea podemos proponer algún resultado
para un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuesta
de cada jugador a cualquier estrategia que pueda seguir su contraparte es “confesar” (una estrategia
dominante siempre será una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN,
ya que ambos están jugando su mejor respuesta a la estrategia del otro. También se puede ver que no
existen incentivos unilaterales a desviarse, ya que la alternativa “callar” disminuye el pago desde (−6)
a (−9) dado que el otro está jugando “confesar”.
6 También podemos decir que la estrategia “medio” está estrictamente dominada por “abajo” y eliminarla tal como lo

hicimos en las iteraciones anteriores.


7 Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los demás.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 10

Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matri-
cial es ir analizando cuál es la mejor respuesta a cada posible estrategia del otro jugador, y subrayando
el mayor pago para indicar que la estrategia asociada a esa celda es la óptima. Esto está ejemplificado
para el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada al
perfil (confesar, confesar) ambos pagos estén subrayados, nos indica que encontramos un EN.

Prisionero 2
Callar Confesar
Callar -1, -1 -9, 0
Prisionero 1
Confesar 0, -9 -6,-6

Figura 1.7: Mejores respuestas en dilema del prisionero

El ejemplo del dilema del prisionero ilustra un resultado interesante: todo equilibrio bajo eliminación
iterativa de estrategias estrictamente dominadas es un equilibrio de Nash. Sin embargo, la implicancia
va en una sola dirección, en tanto no todo EN será un equilibrio según eliminación iterativa. El hecho de
que -como veremos a continuación- es posible que exista EN cuando no existen estrategias dominadas
es evidencia de este último punto.
Un caso más interesante que el dilema del prisionero será un juego donde la eliminación iterativa
no nos entregue ninguna predicción del resultado del juego (porque no existen estrategias estrictamente
dominadas), y sin embargo sı́ exista un EN. Consideremos entonces el ejemplo dado por la matriz de la
figura 1.8.

Jugador Columna
I C D
A 0,4 4,0 5,3
Jugador Fila M 4,0 0,4 5,3
B 3,5 3,5 6,6

Figura 1.8: Buscando EN cuando no existen estrategias dominadas

El lector ya debiese ser capaz de verificar que este juego no tiene estrategias estrictamente domina-
das. Para buscar un EN, hacemos el análisis de mejor respuesta: si el jugador columna fuera a jugar I,
por ejemplo, la mejor respuesta del jugador fila serı́a M , puesto que 4 es mayor que 3 y que 0; por ello, la
ganancia de 4 que recibe el jugador fila en la celda (M , I) de la matriz está subrayada. De forma análo-
ga encontramos la mejor respuesta ante las estrategias C y D, que son A y B, respectivamente. Luego
buscamos las mejores respuestas del jugador columna (lo que es directo, ya que el juego es simétrico), y
obtenemos ası́ que el perfil (B,D) es un EN para este juego.

Función de respuesta óptima


Para computar el EN en los ejemplos anteriores, hemos analizado la mejor respuesta de un jugador a
cada posible estrategia del otro. Esto nos permite encontrar de forma directa el par de estrategias bajo
las cuales nadie tiene incentivos unilaterales a desviarse. En el caso de juegos con estrategias continuas
podemos encontrar un EN bajo el mismo principio, aunque con una técnica diferente.
Consideremos el ejemplo de competencia a la Cournot planteado en la sección (1.2). En ese caso,
como los jugadores tienen infinitas estrategias a su disposición, no es posible ir verificando la respuesta
óptima para cada caso como lo hacemos en los juegos matriciales. No obstante, podemos preguntarnos

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 11

cuál es la respuesta óptima de una de las firmas ante una cantidad fija arbitraria de su competidora.
Por ejemplo, fijemos la producción de la firma 2 en un nivel q̄2 . Siendo ese el caso, la respuesta óptima
de la firma 1 corresponde a la solución del problema:

máx (A − q1 − q̄2 )q1 − cq1


{q1 }

La condición de primer orden del problema es A − 2q1 − q¯2 − c = 0, a partir de la cual obtenemos la
solución q1∗ = A−q̄22 −c . Pero q¯2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es en
realidad la función que nos indica cuál es la cantidad óptima para la firma 1 ante cualquier nivel de
producción de la firma 2:
A − q2 − c
q1 (q2 ) =
2

Esta última se conoce como función de respuesta óptima o función de reacción, en este caso, de la
firma 1.8 Como el problema es simétrico, la función de reacción de la firma 2 es completamente análoga:
A − q1 − c
q2 (q1 ) =
2

La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencilla
el equilibrio de Nash de este juego. En efecto, si existe un par (q1 , q2 ) tal que ningún jugador tenga
incentivos a desviarse, ese par constituirá un EN. Pero esto ocurre en el punto donde las funciones
de reacción coinciden (gráficamente se intersectan), por lo que encontrar el EN del juego se reduce a
resolver el sistema de ecuaciones dado por las dos funciones de respuesta óptima. Al resolver el sistema
se obtiene el resultado:

A−c
q1N = q2N =
3

donde utilizamos el supraı́ndice N para indicar que corresponde a la cantidad de EN.


Cabe destacar que el procedimiento recién desarrollado no es diferente del aplicado en el caso de los
juegos matriciales, donde lo que hacemos es computar la función de reacción para el caso en el cual los
espacios de estrategia son discretos y luego buscar un perfil donde éstas coincidan. La única diferencia
es que como en este caso las estrategias son continuas, podemos utilizar las herramientas de cálculo
diferencial para obtener el resultado.

Sobre la unicidad del EN


Volvamos ahora al ejemplo de la Batalla de los Sexos, el cual resolveremos para aprender otro
elemento relevante del EN. A continuación se muestra la matriz de pagos con los pagos asociados a las
mejores respuestas ya subrayados:

Manuel
Fútbol Museo
Fútbol 2,1 0,0
Josefa
Museo 0,0 1,2

Figura 1.9: Batalla de los sexos y mejores respuestas


8 Notar que ésta es la respuesta óptima para niveles de q menores a A − c. Si q > A − c, la respuesta óptima es
2 2
producir cero porque ela firma 2 ha saturado el mercado y el precio asociado es muy bajo.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 12

En este caso, tal como en el juego de la figura 1.8, la mejor respuesta varı́a junto con la estrategia
del otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dos
perfiles en los cuales la mejor estrategia coincide. ¿Significa esto que no existe equilibrio de Nash?. Al
contrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategias
cumple con la definición de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidas
por los demás. Además, es fácil ver que -por ejemplo- dado el perfil (fútbol, fútbol), ningún jugador
tienen incentivos unilaterales a desviarse.
Este ejemplo nos muestra que el EN no tiene por qué ser único, y que pueden existir 2 o incluso más
perfiles que cumplan con la definición de equilibrio. Lo que sı́ ocurre en este caso, es que se pierde la
posibilidad de hacer una predicción unı́voca respecto del resultado que se observará en esta situación
estratégica. En las secciones posteriores veremos cuáles son las alternativas que tenemos en estos casos,
respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de predicción
que pueda ayudarnos a precisar el posible resultado del juego.

Sobre la existencia del EN


Una última arista del concepto de EN que es relevante discutir en este momento, dice relación con
su existencia. Consideremos el juego de Matching Pennies que fue explicado en la introducción, y cuya
matriz de pagos reescribimos aquı́ incluyendo las mejores respuestas:

Jugador 2
Cara Sello
Cara 1, −1 −1, 1
Jugador 1
Sello −1, 1 1, −1

Figura 1.10: Matching Pennies

Al analizar las mejores respuestas en este juego, se observa que no existe ningún perfil de estrategias
en el cual se cumpla la definición de EN. Esto resulta intuitivo si consideramos el hecho de que no existe
ninguna combinación de estrategias bajo la cual no existan incentivos a desviarse: si ambos mostraron la
misma cara, entonces el jugador 2 preferirı́a cambiar de estrategia; mientras que si mostraron distintas
cara, el primer jugador tendrá incentivos a desviarse.
Este ejemplo ilustra que el concepto de EN no será una herramienta infalible al momento de analizar
los posibles resultados de un juego, por el simple hecho de que no siempre existirá un EN, al menos
como lo conocemos hasta ahora. Al igual que con el problema de la multiplicidad de equilibrios, en las
secciones subsecuentes analizaremos algunos conceptos a los cuales podremos echar mano cuando no
exista equilibrio de Nash.

1.5. Estrategias mixtas

Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de fútbol
que planteamos en la introducción. Lo modelamos concretamente como se muestra en la matriz de pagos
de la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9
Además, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notar
que en términos estratégicos este juego no es diferente de matching pennies (el orden de preferencias
sobre los posibles resultados del juego es el mismo, aunque los número en particular sean diferentes).
9 Para los que no son seguidores del fútbol, se aclara que Alexis serı́a el pateador e Iker el arquero.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 13

Iker
D I
D 0,0 1,-1
Alexis
I 1,-1 0,0

Figura 1.11: Penal de fútbol

En una situación de este tipo existe un elemento fundamental para ambos jugadores, el cual es
la posibilidad de sorprender al otro. En efecto, si es que por algún motivo Alexis supiera con certeza
en qué dirección saltará Iker, entonces podrı́a lograr su mejor resultado pateando el balón en la otra
dirección. Del mismo modo, si Iker supiera de antemano la dirección del tiro, podrı́a saltar correctamente
y atajarlo. Ası́, dada la incertidumbre que tiene cada uno respecto de la estrategia del otro, a un delantero
o arquero en la realidad le convendrá jugar algunas veces I y algunas otras D. Si Iker saltase siempre
en la misma dirección serı́a una estrategia perdedora, puesto que el otro sabrı́a en qué dirección tirar
para convertir con seguridad.
Otro ejemplo de una situación que es interesante de modelar bajo la perspectiva de juegos, es la
relación entre una entidad fiscalizadora y un agente que debe cumplir cierta obligación por ley. Por
ejemplo, podemos pensar en el Servicio de Impuestos Internos (SII) y un contribuyente que se está cues-
tionando si disminuye o no su carga tributaria de alguna forma ilegı́tima (evasión). Para el SII resulta
costoso hacer una auditorı́a para fiscalizar si se está evadiendo el pago de impuestos, por lo que no es
obvio que siempre deba auditar. Por su parte, el contribuyente obtiene un beneficio evadiendo el pago
de impuestos, pero se enfrenta a un castigo si es que es descubierto. Ası́, la incertidumbre constituye
parte fundamental de la interacción estratégica, pues el contribuyente estará considerando cuál es la
probabilidad de ser auditado al momento de decidir si evade, mientras que el SII evalúa la probabilidad
de efectivamente descubrir un evasor al momento de realizar una auditorı́a que le resulta costosa. Po-
demos pensar ejemplos similares con firmas que deben cumplir estándares medioambientales, y el ente
regulador que las fiscaliza.
Esta idea de darle relevancia a la incertidumbre y pensar que para un jugador lo óptimo no es
comprometerse con una estrategia en particular (saltar siempre a la izquierda), sino que variar su
estrategia si el juego hipotéticamente se repitiese (algunas veces saltar a la izquierda y otras a la derecha),
tiene una expresión concreta en teorı́a de juegos conocida como estrategias mixtas. Cuando analicemos
un juego desde esta perspectiva, pensaremos que los jugadores ya no eligen una estrategia particular
de su conjunto de posibilidades, sino que eligen una probabilidad con la cual jugarán cada estrategia.
Por ejemplo, en el juego del penal, una estrategia mixta particular serı́a jugar con probabilidad 1/3 la
estrategia I, y con probabilidad 2/3, la D. Ası́, para un jugador que dispone de dos estrategias, una
estrategia mixta consiste en elegir un número p en el intervalo [0, 1], de modo que p y (1 − p) son las
probabilidades con las que jugará una estrategia o la otra.
En general, si un jugador i dispone de un conjunto Si con L estrategias, Si = {si1 , si2 , ..., siL }, una
estrategia pura consiste en elegir un elemento particular de este conjunto (este es el concepto que hemos
utilizado en las secciones anteriores y que de ahora en adelante llamaremos estrategia pura). En cambio,
una estrategia mixta consiste en elegir un vector p = (p1 , p2 , ..., pL ), donde pl denota la probabilidad
con la que jugará la estrategia sil ∈ Si . Como lo que está eligiendo es una distribución de probabilidades
sobre los elementos del conjuntos Si , este vector tiene que cumplir con las propiedades que por definición
posee una distribución. Estas son:

L
P
1. pl = 1
l=1

2. 0 ≤ pl ≤ 1, para cada l ∈ {1, 2, ..., L}

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 14

Es fundamental notar que al hacer esto, cambiamos la decisión que debe tomar el individuo. Si antes
debı́a elegir un elemento de su conjunto de posibilidad Si , ahora debe elegir un vector entre todos aquellos
que cumplen las propiedades recién enunciadas. Para que este cambio en las posibilidades de cada agente
nos sea útil, resulta necesario definir una función de utilidad acorde a las nuevas estrategias. La idea
natural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde a
la utilidad esperada que se deriva de las probabilidades elegidas por cada uno.
Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea p
la probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. Ası́, tenemos
que -por ejemplo- el perfil (D, I) ocurre con probabilidad p · (1 − q), el cual entrega pagos 1 y -1 a
Alexis e Iker, respectivamente. Esta información, para cada perfil de estrategias puras, se resume en la
siguiente tabla:

Perfil Probabilidad Pago Alexis Pago Iker


(D, D) p·q 0 0
(D, I) p · (1 − q) 1 -1
(I, D) (1 − p) · q 1 -1
(I, I) (1 − p) · (1 − q) 0 0

Con la información anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de
uA (p, q) = p · q · 0 + p · (1 − q) · 1 + (1 − p) · q · 1 + (1 − p)(1 − q) · 0
= p(1 − 2q) + q,

mientras que para Iker, de forma análoga se obtiene


uI (p, q) = p · q · 0 + p · (1 − q) · (−1) + (1 − p) · q · (−1) + (1 − p)(1 − q) · 0
= q(2p − 1) − p

Ası́, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategias
son distintos10 y se tiene una función de utilidad adecuada a aquellos espacios. La pregunta natural en
este punto serı́a, ¿cuál es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla,
no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definición ya estudiada al
juego “modificado”.
Tal como hicimos en la sección anterior, utilizaremos la función de respuesta óptima para computar
el EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su función de utilidad viene dada por
uA (p, q) = p(1 − 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, el
segundo término de la suma está fijo para el jugador 1. Ası́, basta notar que cuando (1 − 2q) > 0, lo
mejor que puede hacer Alexis es elegir p = 1, mientras que si (1 − 2q) < 0 la respuesta óptima serı́a
elegir p = 0. En cambio, si es que (1 − 2q) = 0 cualquier valor de p será óptimo, en tanto su utilidad
no dependerá de su estrategia sino que estará fija. Reescribiendo las condiciones para cada caso como
q R 21 , podemos resumir este análisis en la siguiente función de reacción11 :
si q < 12

 1
p(q) = 0 si q > 12
[0, 1] si q = 12

10 En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras,

ya que el conjunto factible [0, 1] es un continuo de números reales.


11 Técnicamente, la mejor respuesta no es una función, pues las funciones por definición asocian puntos de un conjunto

con puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 21 no obtenemos un punto
en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta óptima). En matemáticas estas
“funciones”, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto es
relevante en el estudio formal de teorı́a de juegos, no es parte de los temas del curso.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 15

Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidad
que I (q > 12 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto que
el perfil (I, D) lo hace ganar. Del mismo modo, cuando I es más probable (q < 12 ), lo mejor que puede
hacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad en
ambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hay
información que pueda explotar para cargar la balanza a su favor.
Similarmente, la función de reacción de Iker viene dada por:
si p < 12

 0
q(p) = 1 si p > 21
[0, 1] si p = 12

Con lo anterior, resulta directo observar que el par de estrategias (p, q) = ( 21 , 12 ) es un EN, en tanto
ningún jugador tiene incentivos unilaterales a cambiar de estrategias. Ası́, hemos encontrado un EN en
estrategias mixtas para un juego que no tenı́a equilibrio en estrategias puras. Esto no es casualidad,
pues uno de los resultados más importantes en teorı́a de juegos es el teorema de existencia de Nash,
cuya versión simplificada se entrega a continuación:
Teorema 1. En un juego G = hI, {Si }ni=1 , {ui }ni=1 i, donde la cantidad de jugadores y los espacios de
estrategias son finitos, siempre existirá un equilibrio de Nash en estrategias mixtas.

Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo,
en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D, D).
Ası́, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el único EN
del juego, ya que el teorema no debe ser interpretado como que siempre existirá un equilibrio donde las
probabilidades sean diferentes de 0 y 1.

Computando equilibrio en estrategias mixtas en juegos de 2 × 2


A continuación se presenta un método relativamente heurı́stico para encontrar los EN de un juego de
2 × 2. Para ello, comenzaremos por graficar las funciones de reacción obtenidas para el juego del penal.
En la figura 1.12 dibujamos en rojo la función de reacción de Alexis, p(q), y en azul la Iker, q(p), según
las condiciones descritas más arriba. Se puede observar que en este caso el único perfil de estrategias
donde estas se intersectan es en el EN ya planteado, p = q = 12 .

p
1 q(p)

1
2

p(q)
1 1 q
2

Figura 1.12: Juego del penal: Funciones de reacción

La propuesta para encontrar todos los EN se basa en la idea de que en estos juegos existen dos
“tipos” de equilibrio: (i) aquellos en estrategias puras, y (ii) aquellos en los cuales cada jugador, dado

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 16

lo que hace su contraparte, está indiferente respecto de su propia estrategia ya que no puede afectar
su utilidad. Estos últimos son los que permiten una estrategia mixta que no sea un caso particular de
estrategia pura, esto es, una estrategia donde el parámetro de probabilidad se encuentre en el intervalo
abierto (0, 1).
Para entender mejor la idea, consideremos el ejemplo de la batalla de los sexos, que como ya vimos
tiene dos EN en estrategias puras. Si denotamos por p y q la probabilidad con la que Josefa y Manuel,
respectivamente, juegan la estrategia “fútbol”, podemos plantear las funciones de utilidad esperada para
obtener:

uJ (p, q) = 2pq + (1 − p)(1 − q) = p(3q − 1) − q


uM (p, q) = pq + 2(1 − p)(1 − q) = q(3p − 2) − 2p,

donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el análisis de
mejor respuesta para Josefa, tenemos que existe un punto crı́tico para la estrategia de su adversario, q =
1 1
3 , en el cual ella se encontrará indiferente respecto de su estrategia p. Cuando q > 3 le convendrá jugar
p = 1 y, en caso contrario, le convendrá p = 0. Ası́, la función de reacción queda de la forma:

1

 1 si q > 3
1
p(q) = 0 si q < 3 ,
1
[0, 1] si q =

3

y haciendo el mismo análisis para Manuel, obtenemos:


2

 1 si p > 3
2
q(p) = 0 si p < 3
1
[0, 1] si p =

2

Al dibujar estas funciones de reacción en el plano (p, q) obtenemos el gráfico de la figura 1.13, donde
la lı́nea roja corresponde a la función p(q), y la azul a q(p). En este caso observamos que las funciones
se intersectan en los perfiles asociados a estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), además del EN
en estrategias mixtas dado por ( 23 , 31 ).

p
p(q)
1

2
3 q(p)

1 1 q
3

Figura 1.13: Batalla de los sexos: Funciones de reacción

Aplicando este mismo concepto a otros juegos -como el dilema del prisionero- podremos observar que
en general nos enfrentaremos a alguno de los casos de funciones de reacción mostrados en los distintos

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 17

paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un único equilibrio en
estrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen
2 equilibrios en estrategias puras, con lo cual observamos que siempre existirá un tercer equilibrio en
estrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrio
en estrategias puras, pero sı́ existe uno en estrategias mixtas, tal como asegura el teorema de existencia
de Nash.
p p p
1 1 1

V C1

1 q 1 q V C2 1 q
(a) (b) (c)

p p p
1 1 1
V C1
V C1

V C1

V C2 1 q V C2 1 q V C2 1 q
(d) (e) (f)

Figura 1.14: Casos generales de función de reacción en juegos de 2 × 2

El valor V C1 corresponde a la estrategia p, bajo la cual el otro jugador se encuentra indiferente entre
cualquier estrategia disponible, esto es, q(V C1 ) = [0, 1]. Del mismo modo, V C2 corresponde al valor de
q que hace indiferente al jugador que elige p, esto es, p(V C2 ) = [0, 1]. Ası́, una vez que encontramos los
equilibrios en estrategias puras (si es que estos existen), encontrar los equilibrios en mixtas se reduce
-para el caso de juegos de 2 × 2- a encontrar las probabilidades de cada jugador que deja indiferente al
otro. Notar que este valor no existe en juegos como los de los paneles (a) y (b), ya que en esos caso la
existencia de una estrategia pura dominante, hace imposible que el individuo se encuentre indiferente.

Linealidad del problema individual bajo estrategias mixtas


Para entender qué es lo que subyace al método recién expuesto, consideremos un juego de 2 × 2
genérico, donde p y q corresponden a las estrategias mixtas de los jugadores 1 y 2 respectivamente. Si A
y B son las estrategias puras del jugador 1 (donde p corresponde a la probabilidad de jugar la estrategia
A), entonces podemos escribir su utilidad esperada de la siguiente manera:
u1 (p, q) = pu1 (A, q) + (1 − p)u1 (B, q)
= p [u1 (A, q) − u1 (B, q)] + u1 (B, q)

Donde u1 (A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y su
contraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1 (B, q), pero con la estrategia
pura B. Ası́, dado que u1 (B, q) es un valor fijo cuando q está fijo, se tiene que para cualquiera valor q

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 18

tal que u1 (A, q) 6= u1 (B, q), entonces el valor de p que maximiza u1 (p, q) necesariamente tiene que ser 0
ó 1, dependiendo del signo de la desigualdad u1 (A, q) ≷ u1 (B, q).
La única forma en la que el valor óptimo de p puede ser estrictamente mayor que 0 y estrictamente
menor que 1, es cuando u1 (A, q) = u1 (B, q), pues en ese caso el jugador estará indiferente entre cualquier
valor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalización de lo observado en los
ejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspondı́an
al caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estaban
indiferentes respecto de su propia elección.
Si definimos p1 = p y p2 = (1 − p), podemos graficar este argumento en el plano (p1 , p2 ), tal como se
muestra en los gráficos de la figura 1.15. La lı́nea oscura que une a los puntos (1, 0) y (0, 1) corresponde
al conjunto de posibilidades del jugador, ya que ahı́ yacen todos los pares (p1 , p2 ) que cumplen las
condiciones (p1 + p2 = 1) y (0 ≤ p1 ≤ 1). Las lı́neas azules corresponden a las curvas de nivel (curvas
de indiferencia) de la función de utilidad esperada, dado un valor q fijo. En particular, las lı́nea azules
sólidas son las asociadas al máximo nivel de utilidad esperada que puede alcanzar el jugador, mientras
que las punteadas muestran cómo otras estrategias distintas a las óptimas entregan una menor utilidad
esperada.

p2 p2 p2
1 1 1

1 p1 1 p1 1 p1
(a) u1 (A, q) > u1 (B, q) (b) u1 (A, q) < u1 (B, q) (c) u1 (A, q) = u1 (B, q)

Figura 1.15: Optimización bajo estrategias mixtas en un juego de 2 × 2

Ası́, se observa que dependiendo de la relación u1 (A, q) R u1 (B, q), se tendrá que el valor óptimo de
p será una solución esquina -como en los paneles (a) y (b)-, excepto cuando la pendiente de la curva
de indiferencia es igual a (-1) -como en el panel (c)-, en cuyo caso el individuo está indiferente entre
cualquier par (p1 , p2 ).
Observación. Un punto que se deriva de la discusión anterior, y que conviene tener presente al
momento de computar equilibrio en este tipo de juegos porque puede resultar un poco contra-intuitivo,
es que de la condición de indiferencia de un individuo se obtiene la estrategia de equilibrio del otro.
Por ejemplo, cuando planteamos la condición u1 (A, q) = u1 (B, q), lo que podremos despejar será un
valor q̄. Del mismo modo, la condición de indiferencia del jugador 2 nos permitirá despejar un valor
p̄. Ası́, la estrategia de cada jugador no será relevante para sı́ mismo, porque de hecho cada individuo
estará indiferente entre cualquiera de sus estrategias factibles. Sin embargo, la indiferencia nos permi-
te proponer que, bajo ese par de estrategias en particular, no existirán incentivos unilaterales a desviarse.

Dominancia en estrategias mixtas


Una última dimensión de las estrategias mixtas que mencionaremos, dice relación con el concepto
de dominancia estudiado anteriormente. Consideremos el juego abstracto planteado en la matriz de la
figura 1.16. Omitimos los pagos del jugador 2, porque no serán relevantes para el ejemplo.
En este caso, para el jugador 1 no existe ninguna estrategia dominada, al menos en el sentido que

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 19

Jugador 2
D I
A 3, 0,
Jugador 1 M 0, 3,
B 1, 1,

Figura 1.16: Dominancia en estrategias mixtas

estudiamos anteriormente. Sin embargo, si consideramos estrategias mixtas en nuestro análisis, parece
razonable pensar que una combinación de las estrategias A y M puede resultar mejor que la estrategia B.
En efecto, si tomamos la estrategia mixta p = (1/2, 1/2, 0) se tiene que la utilidad esperada del jugador
1 será igual a 1.5, sin importar la estrategia que siga el jugador 2. Ası́, esta estrategia mixta domina a la
estrategia pura D. Recordemos que las estrategias puras son un caso particular de estrategia mixta, que
en este caso serı́a p̃ = (0, 0, 1). Ası́, aunque en estrategias puras no exista dominancia, sı́ puede existir
dominancia en estrategias mixtas.

1.6. Juegos secuenciales

Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a la
tipologı́a mencionada en la introducción, a juegos estáticos de información completa. Pero muchas si-
tuaciones de interés económico que involucran interacción estratégica tienen una dimensión dinámica
relevante, que no es capturada por el marco teórico que manejamos hasta el momento. Pensemos, por
ejemplo, en una industria como el retail donde compiten pocas empresas de gran tamaño. Es natural
pensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propia
decisión, entonces su comportamiento será diferente de aquel que seguirı́a si las decisiones se tomaran
de forma simultánea. Al mismo tiempo, si una de las firmas sabe que las demás observarán su decisión
antes de actuar, entonces tendrá en cuenta cómo este elemento afecta lo que harán sus competidoras y
tendrá un efecto sobre su propia decisión.
Por lo anterior, nuestro siguiente objetivo será el estudio de juegos dinámicos de información com-
pleta. Es decir, incorporaremos la dimensión temporal en el análisis de diferente situaciones estratégicas,
pero siempre manteniéndonos bajo el supuesto de que las funciones de pago son conocidas por todos
(esto es lo que llamamos información completa en la introducción). Esto implica que cada jugador tiene
perfecto conocimiento de los intereses que tienen los demás sobre los distintos resultados del juego, y
por lo tanto, que las decisiones observadas no entregan información adicional a este respecto.12
Como mencionamos anteriormente, la forma extensiva de un juego resultará más conveniente e intui-
tiva cuando nos interesemos en juegos dinámicos. Pero antes de introducir este concepto formalmente,
analizaremos algunos ejemplos donde se observa cuáles son los principales conceptos que se tienen en
mente al estudiar este tipo de situaciones. Pensemos que dos paı́ses, A y B, se enfrentan en un conflicto
armado, en el cual A está decidiendo si invade o no a B. Si el primero decide invadir, entonces el se-
gundo debe decidir entre batallar para defenderse o rendirse. Esta dinámica se resume en el árbol de la
figura 1.17, donde los cı́rculos negros corresponden a nodos de decisión y las ramas que nacen de cada
uno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los cı́rculos grises
corresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que se
llegará o no dependiendo de las decisiones de los jugadores.
12 La revelación de información privada a través de las decisiones -y la interacción estratégica que esto implica- es una

caracterı́stica fundamental de los juegos de información incompleta, como veremos en los modelos estudiados en el capı́tulo
de economı́a de la información.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 20

Pelear (7,2)

B
Invadir
A
Rendirse (9,6)

No invadir (8,8)

Figura 1.17: Árbol de un juego dinámico

Es importante notar que cada nodo de decisión tiene una etiqueta que indica quién decide en ese
nodo (o a quién le corresponde jugar), mientras que cada rama tiene una etiqueta que indica la acción a
la cual está asociada. Por su parte, cada nodo terminal tiene una etiqueta con los pagos asociados a ese
resultado particular del juego. En nuestro ejemplo, los pagos indican que el paı́s A prefiere la situación
en la que invade y su enemigo se rinde, luego aquella en la que no invade, y finalmente aquella en la que
invade y su enemigo se defiende. Por su parte, el paı́s B prefiere no ser invadido, pero en caso de ser
invadido prefiere rendirse antes que pelear.
¿Qué resultado podemos esperar en este juego? Para tener una primera aproximación, escribiremos
el juego en su forma normal, lo que para este caso es sencillo ya que cada jugador solo enfrenta un nodo
de decisión, con dos posibles acciones cada uno (por lo tanto, queda como una matriz de 2 × 2). Esto
nos permitirá encontrar los EN del juego tal como lo hemos venido haciendo hasta ahora.

Paı́s B
Pelear Rendirse
Invadir 7,2 9,6
Paı́s A
No invadir 8,8 8,8

Figura 1.18: Juego de invasión en forma normal

Observemos que existen dos EN en este juego, dados por los perfiles (No invadir, Pelear) e (Invadir,
Rendirse). El primero es un EN porque si el paı́s B está dispuesto a pelear, entonces el A prefiere no
invadir y nadie tiene incentivos a desviarse. El segundo es EN porque cuando el paı́s A invade el B
prefiere rendirse, y dado esto, ocurre que ninguno querrá desviarse.
Al escribir el juego en forma normal estamos haciendo abstracción de la dimensión dinámica del
problema, y conviene preguntarnos si esto tiene implicancias sobre la precisión del análisis que esto nos
permite hacer. Analicemos, en particular, el equilibrio (No invadir, Pelear): es claro que el paı́s A no
tiene incentivos a desviarse, porque el resultado en el que terminan batallando es el menos preferido para
él. Sin embargo, ese argumento se basa en una estrategia poco creı́ble de parte del paı́s B: Pelear. Si
observamos el árbol, salta a la vista que antes una invasión, la mejor respuesta del paı́s B es Rendirse. Por
lo tanto, parece natural mostrarse escéptico si alguien propone que (No invadir, Pelear) es un resultado
predecible para este juego.
Por su parte, el EN dado por el perfil (Invadir, Rendirse) no presenta este problema, puesto que
como ya hemos dicho, cuando el paı́s A ataca lo racional para el paı́s B es rendirse, y nadie tiene
incentivos a desviarse. Entonces surge la pregunta, ¿es este equilibrio de alguna manera “mejor” que el
equilibrio (No invadir, Pelear)?. La respuesta es sı́: aunque ambos son equilibrios de Nash del juego, el
perfil (Invadir, Rendirse) es, además, un Equilibrio Perfecto en Subjuegos (EPS). Aunque este nombre
parece extraño dado que aun no hemos definido lo que es un subjuego, lo clave respecto del concepto es
lo que observamos en el ejemplo: el equilibrio no está basado en amenazas no creı́bles.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 21

Inducción hacia atrás


Dada la discusión de los párrafos anteriores, surge la pregunta de cómo diferenciar un EN de un
EPS. Afortunadamente existe un método muy sencillo para encontrar los EPS de los juegos en los que
estaremos interesados, conocido como inducción hacia atrás. Este consiste, como su nombre lo indica,
en comenzar por los nodos de decisión finales y analizar qué harı́an los jugadores en cada uno de ellos.
Una vez que se tiene la respuesta óptima, se avanza hacia los nodos predecesores, y en cada uno de ellos
se analiza cuál es la estrategia más conveniente dado que en los nodos sucesores cada jugador
elegirá su estrategia óptima.
Veamos cómo funciona en el ejemplo anterior. El análisis comienza en el nodo donde decide el
paı́s B, y consiste en definir la acción óptima si le tocase jugar en ese nodo en particular: esta acción
será Rendirse, dado que el pago asociado a esta decisión (6) es mayor que el pago de Pelear (2). El
siguiente paso es ir al nodo de decisión precedente (en el cual decide A), y determinar la acción óptima
dado que el paı́s B elegirá Rendirse en caso de llegar al nodo en el cual debe decidir. Como el pago de
8 asociado a No Invadir es menor que el de 9 asociado a Invadir (el que a su vez está determinado por
la acción óptima Rendirse), entonces nos quedamos con la acción de Invadir. Ası́, el EPS de este juego
viene dado por el perfil (Invadir, Rendirse), tal como habı́amos propuesto anteriormente.
Para enriquecer el entendimiento de la inducción hacia atrás, consideremos un ejemplo un poco más
elaborado. Un sujeto entra a un banco, se acerca a un cajero y le dice que si no le entregan el dinero
de la bóveda hará explotar una bomba que lleva consigo. La situación que nos interesa modelar en este
caso es dinámica, pues nos enfocamos en la decisión del cajero de entregar o no entregar el dinero, y
dado esto, la decisión del asaltante de explotar o no la bomba. El árbol del juego se presenta en la figura
1.19.

I (Cajero)
Entregar No Entregar
(Asaltante)IIa IIb (Asaltante)
Bomba No Bomba Bomba No Bomba

uc = −1 uc = 1 uc = −1 uc = 2
ua = −1 ua = 1 ua = −1 ua = 0

Figura 1.19: Asalto a un banco

Los pagos representan la idea de que, sea cual sea la decisión del cajero, el resultado en el cual el
asaltante explota la bomba es el menos preferido para ambos. Respecto a los resultados en los cuales
no explota la bomba, el cajero prefiere aquel en el que no entrega el dinero, mientras que el asaltante
-obviamente- prefiere aquel en el cual le entregan su botı́n.
Resolvamos el juego por inducción hacia atrás. Si el asaltante se ubica en el nodo en el que le entregan
el dinero, entonces su decisión óptima es No Bomba. Ahora, si lo ubicamos en el nodo en el cual no le
entregan el dinero, su decisión óptima también será No Bomba (aquı́ está la clave para la existencia de
una amenaza no creı́ble). A continuación analizamos la decisión del cajero, dadas las decisiones óptimas
del asaltante: si entrega el dinero recibirá un pago de 1, mientras que si no lo entrega recibirá un pago
de 2. Por lo tanto, la decisión óptima del cajero será No Entregar. Por lo tanto, el resultado del juego
según el método de inducción hacia atrás será que el cajero no entrega el dinero y el asaltante no entrega
la bomba.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 22

Estrategias en un juego dinámico


Es importante notar que en el párrafo anterior no hemos dicho que el EPS del juego sea (No Entregar,
No Bomba), porque aquello serı́a -en rigor- incorrecto. La razón de ello es que (No Entregar, No Bomba)
no es un perfil de estrategia por el simple hecho de que “No Bomba” no constituye una estrategia para
el asaltante. Esto nos lleva a la siguiente discusión, sobre qué es lo que entenderemos por estrategia en
un juego dinámico.
En el juego recién expuesto, por ejemplo, es natural pensar que las estrategias que puede seguir el
asaltante son “bomba” y “no bomba”, cuando en realidad éstas son simplemente acciones que puede
seguir en determinados nodos. En un juego en forma extensiva, una estrategia será un plan de acción
que indique qué acción seguirá el jugador en cada nodo en los cuales le puede tocar jugar.
Ası́, una estrategia posible para el asaltante serı́a no explotar la bomba si le entregan el dinero, y
sı́ explotarla en caso que no se lo entreguen. Una forma cómoda de describir esta estrategia es de la forma
(No Bomba, Bomba), donde el primer elemento del par indica la acción que seguirá si se encuentra en
el nodo IIa , mientras que el segundo indica la acción ejecutada en el nodo IIb . Con lo anterior, tenemos
que el conjunto completo de estrategias posibles para el asaltante será {(B,B), (B,NB), (NB,B), (NB,
NB)}. Por su parte, el cajero solo tiene que tomar una decisión en un nodo, por lo que las acciones de
las que dispone coinciden con su espacio de estrategias {Entregar, No entregar}.
Esta forma de entender las estrategias en un juego en forma extensiva facilita ver la equivalencia que
existe con la forma normal de un juego. En efecto, si lo que tiene que decidir el asaltante es un plan de
acción para cada posible situación en la que le toque jugar, entonces podemos entender el juego desde
una perspectiva estática, donde cada jugador debe tomar solo una decisión: cuál será su plan de acción.
Para aclarar esta idea, en la matriz de la figura 1.20 se muestra el juego en su forma normal.

Asaltante
(B,B) (B,NB) (NB,B) (NB,NB)
Entregar -1, -1 -1, -1 1, 1 1, 1
Cajero
No Entregar -1, -1 2, 0 -1, -1 2, 0

Figura 1.20: Asalto a un banco en forma normal

Esta matriz de pagos contiene exactamente la misma información que el árbol del juego. Considere-
mos por ejemplo la segunda columna de pagos, en la cual la estrategia del asaltante (B,NB) nos indica
que éste explotará la bomba si le entregan el dinero y no la explotará en caso contrario.13 Si el cajero
sigue la estrategia “entregar”, entonces la estrategia del asaltante (B,NB) indica que explotará la bomba,
con lo que se obtiene los pagos de (-1, -1) indicados en la celda correspondiente. Si en cambio el cajero
no entrega el dinero, el plan de acción indica no explotar la bomba, con lo cual los pagos son de 2 para
el cajero y 0 para el asaltante, tal como se indica en la celda. De forma análoga se obtienen las demás
columnas de la matriz.
Al computar los EN del juego en la matriz de pagos, se observa que existen tres perfiles bajo los
cuales no existen incentivos a desviarse: (No Entregar, (B,NB)), (Entregar, (NB,B)) y (No Entregar,
(NB,NB)). De acuerdo al análisis bajo inducción hacia atrás, concluimos que la estrategia óptima para
el asaltante es (NB,NB), porque para él siempre era peor explotar la bomba. Ası́, el único EN que es a
la vez EPS viene dado por el perfil (No Entregar, (NB,NB)). Notar que lo clave para que este perfil sea
EPS es que la estrategia del asaltante es óptima en cada uno en el que le podrı́a tocar jugar. El perfil
(No Entregar, (B,NB)) implica el mismo resultado del juego que el perfil (No Entregar, (NB,NB)), sin
13 Es posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es una
posibilidad para el asaltante y como tal podemos analizarla.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 23

embargo no constituye un EPS porque el asaltante está siguiendo una estrategia subóptima en el nodo
IIa .
Notar que también es un EN el perfil (Entregar, (NB,B)), según el cual el resultado del juego es que
el cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tenga
incentivos a desviarse, se basa en la amenaza no creı́ble de que en el nodo IIb el asaltante explotarı́a la
bomba. Ası́, observamos que en este contexto el EN por sı́ solo puede ser un criterio poco satisfactorio,
pues no considera la dinámica temporal del problema. El EPS aparece entonces como un refinamiento
útil que nos permite quedarnos con un equilibrio más creı́ble, y en algún sentido más racional.

Dentro y fuera de la senda de equilibrio


En la discusión previa se plantea que un perfil de estrategias -y por lo tanto un equilibrio- constituye
un plan de acción completo para cada jugador, y por lo tanto no basta con definir cuál será el resultado
del juego sino que es necesario definir cuáles son las acciones que se llevarı́an a cabo en cada nodo, aun
cuando estos no ocurran según nuestra predicción de equilibrio. Esto no es solo una cuestión formal, sino
que es fundamental para el análisis completo del juego porque las decisiones de cada jugador están a su
vez condicionadas por lo que espera este que harán los demás si se llegasen a encontrar en determinadas
coyunturas. Más concretamente, si pensamos en una partida de ajedrez, es claro que antes de decidir
una jugada el ajedrecista analiza cuál será la respuesta de su oponente ante las distintas movidas que
está tanteando en un determinado momento.
En terminologı́a de juegos, si tenemos un perfil de equilibrio, aquellos nodos que según las estrategias
definidas efectivamente ocurrirán se dice que están en la senda de equilibrio. De modo similar, los nodos
que no ocurren se dice que están fuera de la senda de equilibrio. En el ejemplo del asalto al banco, el
nodo los nodos I y IIb están en la senda de equilibrio, mientras que IIa está fuera. Entonces, la idea del
párrafo anterior se puede resumir en que un equilibrio no se constituye solo por las acciones que ocurren
en la senda de equilibrio, sino también por aquellas que se tomarı́an fuera de esta (aun cuando nunca
se concreten según nuestra predicción del resultado del juego).
Para observar la relevancia de las estrategias fuera de la senda de equilibrio en la determinación del
mismo, analizaremos una extensión del juego de invasión, cuyo árbol se muestra en la figura 1.21. En
esta versión, agregamos un nodo en el cual el paı́s bajo amenaza tiene la posibilidad de constituir un
ejército pequeño o grande antes de que el potencial invasor decida si ataca o no. Además, en el nodo
inicial el paı́s A puede elegir entre firmar un tratado de paz y terminar el conflicto o no hacerlo. Ası́, los
nodos Ai y Bi corresponden a aquellos donde juega A y B, respectivamente.
De los pagos se desprende la idea de que, en contraste con la versión original del juego, si el paı́s
B constituye un ejército grande entonces ante una invasión preferirá defenderse que rendirse. El caso
en el que constituye un ejército pequeño es igual al juego original, por lo que preferirá rendirse en
caso de ser invadido. Es decir, al realizar el análisis de inducción hacia atrás, se tiene que en los nodos
B2 y B3 las decisiones óptimas son Rendirse y Pelear, respectivamente. Dado esto, en los nodos A2 y
A3 las decisiones óptimas para el paı́s A son Invadir y No invadir, respectivamente. El siguiente paso
es preguntarse qué decidirá B en el nodo B1 ; si constituye un ejército pequeño, entonces el pago que
recibirá -dadas las decisiones óptimas subsecuentes- será de 6, mientras que si juega “Ejército Grande”
el nodo final al que se llega tiene asociado un pago de 7. Por lo tanto, en el nodo B1 la decisión óptima
será Ejército Grande. Finalmente, en el nodo A1 la decisión óptima del paı́s A será firmar el tratado, ya
que con eso recibe un pago de 8, en comparación a los 7 que recibirı́a si decide no firmar, y el juego se
desarrolla según las decisiones óptimas ya discutidas.
En resumen, el EPS del juego vendrá dados por la estrategia (Tratado, Invadir, No invadir) para el
paı́s A, y (Ejército grande, Rendirse, Pelear) para el paı́s B (donde las acciones están ordenadas siguiendo
la numeración de los nodos para cada jugador). Por lo tanto, el resultado que parece razonable en este
caso es que los paı́ses firmarán el tratado de paz y el juego se acaba luego del primer nodo. Lo fundamental

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 24

Pelear (7,2)
B2
Invadir
A2
Ejército Pequeño
Rendirse (9,6)
No inv. (8,8)
B1
Pelear (3,6)
B3
No firmar trat. Invadir

Ejército Grande
Rendirse (8,5)
A3
A1 No inv. (7,7)

Firmar tratado

(8,8)

Figura 1.21: Juego de invasión extendido

del ejemplo, es que este resultado se sostiene gracias a lo que ocurrirá fuera de la senda de equilibrio
según las estrategias propuestas. En efecto, el mejor escenario para el paı́s A serı́a aquel en el que invade
contra un ejército pequeño y el paı́s B se rinde, pero la razón por la que firma el tratado y no intenta
llegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituirá un ejército
grande.14 Ası́, el resultado que observamos en la senda de equilibrio es consecuencia de las decisiones
que se tomarı́an en aquellos nodos que finalmente no ocurren.

Estrategias continuas
Al igual que en el caso de los juegos estáticos, en los juegos dinámicos podemos analizar y encontrar
equilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de cálculo diferen-
cial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg.
Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot,
existe una firma que elige su nivel de producción q1 primero, denominada “lı́der”. La segunda firma,
llamada “seguidora”, observa esta cantidad y luego elige su propia producción q2 . Suponiendo la misma
función de demanda utilizada anteriormente, P (Q) = A − Q, resolveremos el modelo por inducción
hacia atrás. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar sus
beneficios, dado el nivel de q1 observado.

máx(A − q1 − q2 )q2 − cq2


q2

De la CPO se tiene que q2 (q1 ) = A−q21 −c . Esta función coincide con la respuesta óptima de la firma
en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretación
es diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta función
resume un plan contingente a cada posible cantidad q1 que pueda observar.
El siguiente paso de la inducción hacia atrás es resolver el problema de la firma lı́der, teniendo
en cuenta la estrategia óptima de la seguidora. Esto es, la lı́der elige q1 tomando en cuenta que la
14 Del mismo modo que en el asalto al banco, el cajero sabı́a que llegado el momento el asaltante no explotarı́a la bomba.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 25

seguidora reaccionará de acuerdo a la función q2 (q1 ) = A−q21 −c . Esto es completamente análogo a lo


que hemos hecho con los juegos dinámicos hasta ahora, donde para encontrar la acción óptima de un
jugador tomamos en cuenta las acciones subsecuentes que resultan óptimas. Por lo tanto, el problema
que resuelve la lı́der es
máx(A − q1 − q2 (q1 ))q1 − cq1
q1

donde escribimos q2 (q1 ) para explicitar que en su decisión está tomando en cuenta que la seguidora
reaccionará de forma óptima al nivel de producción elegido. Al resolver la CPO se obtiene que:
A−c
q1S =
2
A−q1 −c
Ası́, el perfil de estrategias de EPS viene dado por (q1S = A−c2 , q2 (q1 ) = 2 ), donde tal como en
el juego de invasión definimos la estrategia de la firma seguidora como un plan de acción contingente,
y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cuál es el
resultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad óptima q1S en la función
que define la estrategia de la seguidora para obtener
A−c
q2S (q1S ) =
4
Es decir, en la senda de equilibrio se observará q1 = A−c A−c
2 y q2 = 4 . Entonces la predicción del EPS es
que la firma lı́der produce más que en el modelo de Cournot, mientras que la seguidora produce menos.
Es fácil verificar, reemplazando estas cantidades en la función de beneficios, que la firma lı́der está mejor
que en el modelo de Cournot y que la seguidora está peor.
A partir de esta última observación surge la pregunta de qué ocurre si la firma seguidora elige la
estrategia q2 (q1 ) = A−c
3 , esto es, su plan consiste en producir la cantidad de Cournot independiente
de cuál sea la cantidad producida por q1 . Si la firma lı́der toma esa estrategia como fija, entonces su
estrategia óptima también será la cantidad de Cournot. Ası́, el perfil de estrategias (q1 = A−c
3 , q2 (q1 ) =
A−c
3 ) constituye un EN puesto que aun cuando la firma seguidora reconsiderara su estrategia “rı́gida”
de siempre producir la cantidad de Cournot, observaremos que no tendrá incentivos a cambiar su plan
de acción.
Sin embargo, este equilibrio se basa en una “amenaza” no creı́ble de parte de la firma seguidora, la
cual es que si la lı́der produce la cantidad de Stackelberg, q1S , de todos modos la seguidora responderá con
la cantidad de Cournot a pesar de que ésta no es óptima. En efecto, a partir de la inducción hacia atrás
sabemos que cuando la lı́der produce q1S la seguidora prefiere responder con q2S , de modo que cuando
dice que producirá la cantidad de Cournot es lo mismo que cuando el asaltante de banco decı́a que de
no recibir el dinero entonces explotarı́a la bomba.

1.6.1. Información perfecta e imperfecta

Una dimensión de los juegos dinámicos que hemos ignorado hasta ahora dice relación con el conoci-
miento que tienen los jugadores respecto de cómo se ha desarrollado el juego hasta el momento en el que
les toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador,
sin que este sepa con precisión qué es lo que ha hecho su contraparte previamente. Cuando ocurra esto,
hablaremos de juegos de información imperfecta. 15
Un caso sencillo de un juego de información imperfecta corresponde al ejemplo de matching pennies,
tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego
15 Recordemos que información completa se referı́a al hecho de que las funciones de pago de cada jugador (o sus prefe-

rencias) son de conocimiento público. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo que
un juego puede ser de información completa pero imperfecta.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 26

estático, también podemos entenderlo como un juego dinámico, donde un jugador elige primero un lado
de la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva del
juego se representa en la figura1.22, donde la lı́nea punteadas denota el hecho de que cuando al jugador
2 le corresponde mover, no sabe si se encuentra en el nodo IIa ó en el IIb .

I (Jugador 1)
C S
(Jugador 2)IIa IIb (Jugador 2)

C S C S

u1 = 1 u1 = −1 u1 = −1 u1 = 1
u2 = −1 u2 = 1 u2 = 1 u2 = −1

Figura 1.22: Matching pennies en forma extensiva

Resulta claro que el hecho de que uno de los jugadores mueva primero no tiene implicancias es-
tratégicas sobre la decisión del otro, ya que al no observar la moneda el juego es equivalente al caso en
el que muestran las monedas simultáneamente. De hecho cualquier juego estático puede ser entendido
como un juego dinámico de información incompleta, donde uno de los jugadores mueve primero pero el
otro no observa la jugada. Lo importante en términos estratégicos no es si un jugador mueve primero
que el otro, sino que aquel que mueve después pueda observar la jugada del primero. Por lo tanto, no
hay nada nuevo que decir sobre el equilibrio en este caso, pues tal como estudiamos en el contexto de
juegos estáticos, el único EN es aquel en estrategias mixtas donde cada uno elige probabilidad 0,5.
En la terminologı́a de juegos, cuando a un jugador le corresponde jugar y no sabe con precisión lo
que ha ocurrido antes, el conjunto de nodos en los cuáles podrı́a estar ubicado lo llamaremos conjunto
de información. En particular, cuando sı́ sabe la historia del juego (y por lo tanto el nodo en el cual
está ubicado) el conjunto de información tiene un único elemento. Por ejemplo, en la figura 1.22 obser-
vamos dos conjuntos de información: el que contiene al nodo I y el que contiene a los nodos IIa y IIb .
Ası́, en este ejemplo cada jugador tiene un conjunto de información.
Consideremos, en cambio, una versión de información completa del mismo juego. Es decir, un jugador
muestra primero su moneda, y el otro juega una vez que la observa. Esta versión del juego está represen-
tada en la figura 1.23, donde la única diferencia en términos del dibujo es que no está la lı́nea punteada
que une los nodos IIa y IIb . Por lo tanto, el jugador 2 ahora tiene dos conjuntos de información, aquel
que contiene solo al nodo IIa y el que contiene solo el IIb .

I (Jugador 1)
C S
(Jugador 2)IIa IIb (Jugador 2)

C S C S

u1 = 1 u1 = −1 u1 = −1 u1 = 1
u2 = −1 u2 = 1 u2 = 1 u2 = −1

Figura 1.23: Matching pennies con información perfecta

En este caso, igual que en los juegos de información perfecta analizados anteriormente, una estrategia
corresponde a un plan de acción ante cada posible coyuntura en la que tenga que mover. Ası́, el conjunto
de estrategias factibles para el jugador 2 viene dado por {(C, C), (C, S), (S, C), (S, C)}, mientras que el

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 27

del jugador 1 es {C, S}. En el caso de información incompleta, en cambio, el jugador 2 debe tomar una
única decisión porque no sabe en cuál nodo se ubicará. Dicho de otro modo, en los juegos de información
imperfecta, una “coyuntura” en la cual le corresponde mover a un jugador no es un nodo, sino que un
conjunto de información. Ası́, para generalizar la noción de estrategia desarrollada en la sección anterior,
diremos que en juegos dinámicos una estrategia es un plan que indica qué acción tomará el jugador en
cada posible conjunto de información en el cual le puede tocar jugar.

1.7. Definición de juego en forma extensiva, subjuego y EPS

Con el concepto de conjunto de información explicado en la sección anterior ya tenemos todo lo


necesario para definir la forma extensiva de un juego, además de aclarar qué es un subjuego y por lo
tanto un EPS. En los ejemplos vistos hasta ahora hemos observado cuáles son los elementos que son
necesarios determinar para definir de forma completa un juego dinámico. Estos los resumimos en la
siguiente definición,
Definición 6. Un juego en forma extensiva viene dado por:

1. Una lista de n ≥ 1 jugadores, indizados por i, i = 1, 2, ..., n. (conjunto de jugadores)


2. a. Cuándo le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores)
b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo)
c. Qué es lo que el jugador sabe cuando mueve (conjuntos de información)
3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad)

Tal como planteamos en la sección 1.2, para analizar una situación estratégica desde la teorı́a de
juegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para el
caso de un juego dinámico se resumen en la definición de juego en forma extensiva recién entregada.
Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de información
del juego original con un único elemento. En términos del árbol de un juego, corresponde al conjunto
de nodos y ramas que nacen en los conjuntos de información con un único elemento y que pueden
ser entendidos como un juego “más pequeño”. Cabe destacar que el juego original es un subjuego en
sı́ mismo. Por ejemplo:

El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original que
nace en el nodo A.
El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego.
El juego de la figura 1.21 tiene 6 subjuegos: los sub-árboles que nacen en cada uno de sus nodos.
De estos tres ejemplos ya debiese quedar claro que para juegos de información perfecta, la cantidad
de subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de información
con un único elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego).
El juego de la figura 1.22 tiene un único subjuego: el juego completo. La razón por la cual los
nodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecen
a un conjunto de información mayor, lo que contradice la definición de subjuego.

De los ejemplos anteriores salta a la vista que un subjuego no es más que lo que queda de un
juego una vez que se ha alcanzado cierto nodo decisión. Esta definición resulta sencilla y pareciera que

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 28

pudimos haberla entregado antes para explicar concretamente qué es un EPS. Sin embargo, es importante
entender que los nodos que no son un conjunto de información en si mismo no son el nacimiento de un
subjuego, y para ello primero tenı́amos que conocer el concepto de información imperfecta. Ahora que
hemos aclarado este punto, podemos definir formalmente un EPS.
Definición 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidas
por el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego.

Es decir, el EPS se diferencia de los demás EN del juego en el hecho de que si analizamos los subjuegos,
las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta óptima.
Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN del
juego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb , el cual consiste en una
simple decisión entre las alternativas {B,NB}, la estrategia B no es óptima, y por lo tanto no es un
EN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo inducción hacia atrás
sı́ verifica la definición recién planteada.

Microeconomı́a II
Capı́tulo 2

Información incompleta

Como ya mencionamos en la introducción, una de las dimensiones más importantes a considerar en


muchas situaciones estratégicas es qué es lo que saben los jugadores respecto de las caracterı́sticas de los
demás. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa que
la estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarse
qué ocurre cuando cierta información (como las preferencias o alguna otra caracterı́stica) no es de
conocimiento público. El objetivo de este capı́tulo es introducir los conceptos necesarios para analizar
este tipo de situaciones, basándonos fundamentalmente en ejemplos sencillos que nos permitirán resaltar
los puntos relevantes a tener en consideración.

2.1. Juegos estáticos de información incompleta

Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competencia
a la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y la
demanda inversa del mercado en el que compiten viene dada por P (Q) = A−Q. Supongamos que la firma
1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene información
privada sobre su costo, el cual puede ser alto (ca ) o bajo (cb ). Concretamente, supondremos que la firma 1
solo sabe que con probabilidad α se trata de una firma con costo alto y con probabilidad (1−α), de costo
bajo. Recordemos que para el caso de información completa la función de reacción de cada firma dependı́a
de los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respecto
de los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al análisis. En
particular, para obtener una noción de equilibrio satisfactoria en un contexto de información incompleta
será necesario replantearnos la forma en la que analizamos el comportamiento de los individuos.
Analicemos primero la decisión de la firma 2. Dado que ésta conoce su costo con certeza, entonces es
natural pensar que su decisión óptima será distinta según cuál sea el costo que efectivamente enfrente.
En efecto, si fijamos la cantidad que produce la firma 1 en algún valor q1 , la función objetivo de la firma
2 viene dada por πa = (A − q1 − q2 )q2 − ca q2 si enfrenta costos altos. En cambio, si el costo verdadero
de la firma es bajo (cb ), su función de beneficios será πB = (A − q1 − q2 )q2 − cb q2 . Si maximizamos cada
una de estas funciones respecto de q2 obtendremos que la respuesta óptima de la firma 2 en función de
su costo, se puede escribir como:
A − q1 − ca
q2∗ (ca ) =
2
A − q1 − cb
q2∗ (cb ) =
2

29
Facultad de Economı́a y Negocios - Universidad de Chile 30

Podemos notar que corresponde a la misma función de reacción que obtuvimos en el caso de informa-
ción completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y su
comportamiento óptimo variará según ocurra una o la otra.
Consideremos ahora la situación que enfrenta la firma 1. Como ya se planteó, nuestro supuesto es que
ésta no sabe si la firma 2 enfrenta costos altos o bajos, pero sı́ sabe que existen solo dos valores posibles
(ca y cb ) y asigna cierta probabilidad a la ocurrencia de cada uno. Además, seguimos suponiendo que
cada jugador entiende que el otro actúa de forma racional y buscando maximizar su ganancia, lo que
en este caso se traduce en que la firma 1 sabe que la 2 seguirá una estrategia distinta según sus costos
efectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia óptima de la
firma 1, dadas ciertas cantidades q2 (ca ) y q2 (cb ) fijas, es aquella que maximiza su ganancia esperada:

π1 = α [(A − q1 − q2 (ca ))q1 − cq1 ] + (1 − α) [(A − q1 − q2 (cb ))q1 − cq1 ]

Al derivar respecto de q1 y despejar obtenemos que la respuesta óptima de la firma 1, a cualquier par
de cantidades q2 (ca ) y q2 (cb ), viene dada por:

α (A − q2 (ca ) − c) + (1 − α) (A − q2 (cb ) − c)
q1∗ =
2

Ası́, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino que
para el caso de información completa: computar las funciones de reacción. Las diferencias fundamentales
que se evidencian a partir del ejemplo son que: (1) hay que encontrar una función de reacción para cada
caso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la función objetivo
relevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caracterı́sticas de los
demás.
Una vez que hemos tenido en consideración estas cuestiones, encontrar el equilibrio del juego se
reduce a calcular el perfil de estrategias en el cual las funciones de reacción se intersectan. De la discusión
anterior se deduce que un perfil viene dado por las cantidades q1 , q2 (ca ) y q2 (cb ). Las tres funciones de
reacción ya planteadas constituyen un sistema que nos permiten calcular estas incógnitas. En efecto, al
despejar se obtienen los siguientes resultados:

A − 2c + αca + (1 − α)cb
q1N =
3
A − 2ca + c (1 − α)(ca − cb )
q2N (ca ) = +
3 6
A − 2cb + c α(ca − cb )
q2N (cb ) = −
3 6

El supraı́ndice N hace referencia a Nash, pero en juegos de información incompleta muchas veces
se denomina equilibrio de Bayes-Nash. Aunque este último concepto tiene una definición formal que
da cuenta de las diferencias con el EN, lo importante para nuestros propósitos lo podemos observar a
partir del ejemplo: el perfil de estrategias define una acción para cada posible “realización” de la firma
2 (ya que como discutimos esta actuará diferente según los costos que enfrente) y la función objetivo
relevante da cuenta de la incertidumbre que implica la información incompleta (en este caso se trata de
la ganancia esperada dada la probabilidad α).

Una subasta a sobre cerrado


Una situación de interés que naturalmente debe ser estudiada como un juego de información in-
completa son las subastas. Esto, porque la valoración que tiene cada postor o posible comprador es

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 31

información privada que afectará la oferta máxima que estará dispuesto a hacer. Esto es particularmen-
te relevante cuando las ofertas son a sobre cerrado, lo que no permite revelar información como cuando
existen ofertas sucesivas.
Para analizar esta situación consideremos un ejemplo sencillo: se subasta un único bien a 2 postores,
1 y 2, quienes solo pueden ofertar 0 ó 30 unidades monetarias (suponga que si la oferta ganadora es 0,
el bien se vende de todos modos). En caso de que ambos hagan la misma oferta, se sortea el ganador
lanzando una moneda. La valoración que tiene cada postor por el bien, vi , es información privada. Sin
embargo, cada uno sabe que ésta solo puede tomar los valores 20 ó 50, con probabilidad (1 − α) y α,
respectivamente.
Sea yi una variable que toma el valor yi = 1 si el postor i gana la subasta y el valor yi = 0 en
caso contrario. Además, denotamos por pi el precio que paga el individuo cuando gana la subasta. Ası́,
podemos escribir la función de utilidad del agente i como

ui (yi , pi , vi ) = (vi − pi )yi ,

es decir, el pago es igual al excedente de la compra en caso de ganar, y 0 en caso contrario.


Tal como en el ejemplo de Cournot, una estrategia para el jugador i es una acción para cada posible
valoración que pueda ocurrir, por lo que la denotaremos por bi (vi ). Por ejemplo, una posible estrategia
es ofertar 50 cuando tengo valoración alta (bi (50) = 30) y ofertar 0 cuando es baja (bi (20) = 0). Como
el individuo 1 desconoce la valoración que tiene el 2, no puede saber con certeza la oferta que hará este
último aun cuando conozca su plan de acción, descrito por b2 (v2 ). Dada esta incertidumbre, la utilidad
esperada que busca maximizar viene dada por:
1
(v1 − b1 ) Pr(b1 > b2 ) + (v1 − b1 ) Pr(b1 = b2 ),
2
donde se observa claramente el trade-off entre hacer una oferta menor, con lo que aumenta el excedente
(v1 − b1 ), y hacer una oferta mayor aumentando la probabilidad Pr(b1 > b2 ).
Como ya es usual, un perfil de equilibrio es un par de estrategias (b1 (v1 ), b2 (v2 )) tal que nadie puede
mejorar cambiando su propia estrategia. Ası́, lo primero que podemos decir respecto de la estrategia
de equilibrio es que necesariamente bi (20) = 0, ya que cuando la valoración es baja comprar el bien en
pi = 30 deja un excedente negativo. Con esto, solo nos falta determinar cuál es la estrategia óptima
cuando vi = 50. Para ello, fijemos la estrategia del jugador 2 en b2 (50) = 0 y analicemos cuál es la
respuesta óptima del individuo 1, dado que v1 = 50. La información relevante se resume en la siguiente
tabla:

b1 (50) Excedente si gana Pr(ganar) Utilidad Esperada


1
b1 = 0 50 2 25
b1 = 30 20 1 20

Si b1 = 0 entonces los jugadores empatan (fijamos que 2 juega 0 independiente de su tipo) y en ese caso
gana con probabilidad 0.5. lo que le deja un pago de 25. En cambio, si juega b1 = 30 gana con certeza, lo
que le deja un pago de 20. Ası́, cuando el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 0), la mejor
respuesta del individuo 1 es (b1 (20) = 0, b1 (50) = 0). Como el problema es simétrico, también es cierto
que la mejor respuesta del jugador 2 a la estrategia (b1 (20) = 0, b1 (50) = 0) es (b2 (20) = 0, b2 (50) = 0.
Entonces hemos encontrado un equilibrio del juego en el cual cada individuo oferta 0 independiente de
la valoración vi que le corresponda.
Lo anterior no descarta la posibilidad de que exista otro equilibrio, ya que aun no consideramos el
caso en que el jugador 2 sigue la estrategia (b2 (20) = 0, b2 (50) = 50). Fijando esta estrategia, construimos
la misma tabla con información relevante:

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 32

b1 (50) Excedente si gana Pr(ganar) Utilidad Esperada


1
b1 = 0 50 2 (1 − α) 25(1 − α)
α
20 1 − α2

b1 = 30 20 1− 2

Donde la columna Pr(ganar) se construye a partir de:

Si b1 = 0, sólo empata si v2 = 20 (lo que ocurre con probabilidad (1 − α)). Dado el empate, gana
con probabilidad 0.5.
Si b1 = 30, gana si v2 = 20 y empata si v2 = 50. Dado esto, la probabilidad total de ganar es
(1 − α) + α2 = 1 − α2 .

Con lo anterior, tenemos que b1 = 30 será óptimo solo si se verifica la condición:


 α
20 1 − ≥ 25(1 − α)
2
20 − 10α ≥ 25 − 25α
15α ≥ 5
1
α ≥
3

Por lo tanto, si α > 1/3 se tiene que (b1 (20) = 0, b1 (50) = 30) es respuesta óptima a (b2 (20) =
0, b2 (50) = 30) y este perfil -por simetrı́a- será de equilibrio. En caso contrario, la respuesta óptima
será (b1 (20) = 0, b1 (50) = 0), y por lo tanto el equilibrio en el que siempre se oferta cero será único.
Para analizar las implicancias de este resultado, fijemos por un momento un α ≤ 1/3. En este caso se
obtiene una predicción interesante del comportamiento de los postores, ya que el sujeto i, aun teniendo
una valoración de 50, no ofertará en equilibrio un monto de 30 que le asegura la posibilidad. En el
ejemplo esto se debe a que la probabilidad de que el individuo j tenga una valoración alta (y por lo
tanto valga la pena competir ofertando 30) es relativamente baja. Ası́, el incentivo a hacer una oferta
menor para obtener un mayor excedente domina -en este caso- al incentivo a hacer una oferta mayor
para llevarse el bien. En cambio, cuando α > 1/3 el aumentar la probabilidad de ganar toma mayor
relevancia, por lo que en equilibrio los jugadores pueden terminar haciendo apuestas altas.

2.2. Juegos dinámicos: Señalización

Cuando hablamos de juegos dinámicos de información incompleta, una de las aplicaciones más intere-
santes e importantes (en términos de aplicabilidad) son los juegos de señalización. En este tipo particular
de juegos existen, básicamente, dos tipos de jugadores: un emisor y un receptor. Este último desconoce
cierta caracterı́stica (que en términos genéricos llamaremos tipo) del primero, la cual es relevante para
la interacción que se da entre los dos y para la decisión sobre su propia estrategia. El emisor por su parte
sı́ conoce la caracterı́stica en cuestión, y puede utilizar un mensaje para dar al receptor alguna señal
respecto de su tipo. La idea es modelar situaciones donde el mensaje puede ser utilizado para que un
cierto tipo de mensajero pueda diferenciarse de otro, y los incentivos que se generan para que aquellos
tipos menos favorecidos en la interacción envı́en mensajes confusos con el objetivo de no revelar su tipo.
Aplicaciones concretas de juegos de señalización se pueden encontrar, entre otros, en los modelos
del mercado laboral donde los trabajadores tienen diferente productividad y el empleador no es capaz
de observarla con certeza. En este contexto el nivel de educación formal alcanzado puede ser utilizado

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 33

como una señal, bajo el supuesto de que para los individuos más productivos resulta menos costoso
educarse. Lo interesante es que en la realidad es posible argumentar que muchas veces la educación
formal, más que aumentar la productividad de un trabajador, es relevante para los empleadores porque
revela información sobre sus capacidades. Ası́, modelar esta situación como un juego de señalización
permite encontrar la racionalidad del fenómeno y estudiar sus implicancias.
Otros ejemplos de interés son los que estudian la relación entre agentes que requieren fondos para
realizar un proyecto y los bancos o inversionistas que pueden prestar estos fondos. Si la calidad o
rentabilidad del proyecto no es clara para el banco, entonces las señales que pueden enviar los agentes
-como el interés que están dispuestos a pagar- se vuelven relevantes. Ejemplos de este tipo pueden
variar en distintas dimensiones que en cada caso sean de interés, como la capacidad de negociación de
cada parte o la posibilidad de que el monto financiado afecte la rentabilidad del proyecto. Más adelante
estudiaremos un ejemplo de este tipo de modelos.
Los juegos de señalización también tienen aplicaciones en polı́tica económica y monetaria. Los mo-
delos de expectativas racionales donde el banco central (BC) es un agente optimizador que tiene interés
tanto en el nivel de producto como en la inflación, llevan a los conocidos resultados de equilibrios in-
eficientes donde el BC “permite” una inflación mayor sin lograr su objetivo de aumentar el producto.
Subyacente a este resultado está el parámetro de “aversión a la inflación” del BC. Ası́, en un modelo con
varios perı́odos, el ente monetario puede utilizar la inflación de los primeros perı́odos como un mensaje
para señalizar que es averso a la inflación (inverte en reputación), lo que le permitirı́a en perı́odos futuros
aumentar el producto a costa de una inflación mayor.
Vemos ası́ que los juegos de señalización tienen aplicaciones de interés en distintos temas y áreas. Lo
ideal es tener una estructura relativamente sencilla que nos permita analizar estas situaciones con un
enfoque unificado, basado en la teorı́a de juegos. Por lo tanto, a continuación se enlistan los elementos
necesarios para definir un juego de señalización básico:

Existen dos jugadores, llamados Emisor y Receptor.


El emisor es de algún tipo ti perteneciente a un conjunto de tipos factibles T = {t1 , ..., tn }.

Cada tipo tiene a priori una probabilidad de ocurrencia p(ti ) > 0, conocida por el receptor.
El emisor observa su tipo ti y elige un mensaje mj de un conjunto de mensajes factibles M =
{m1 , ..., mj }.
El receptor observa mj (pero no ti ) y elige una acción ak del conjunto de acciones factibles
A = {a1 , ..., ak }.
Los pagos vienen dados por las funciones Ue (ti , mj , ak ) y Ur (ti , mj , ak ) para el emisor y receptor,
respectivamente.

Para observar una expresión concreta de esta estructura, estudiaremos un ejemplo basado en el
modelo de Myers y Majluf (1984) que analiza el problema de una empresa que requiere conseguir finan-
ciamiento de un inversionista que no conoce la rentabilidad del proyecto. Ası́, la oferta de participación
que le hace la empresa al inversionista constituye un mensaje que puede entregar información al respecto.

Inversión empresarial y estructura de capital


Existe una empresa que pretende realizar un nuevo proyecto de inversión. El tipo de la empresa
viene dado por sus beneficios π que pueden ser altos (A) o bajos (B), con A > B > 0. Para realizar el
proyecto, que tiene un retorno de R, se requiere una inversión de I. Se supone que R > I de modo que
éste siempre es rentable. La probabilidad de que π = A es α.

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 34

El empresario, una vez que observa su tipo, hace una oferta de participación en los beneficios de la
empresa al inversionista s, de modo que 0 ≤ s ≤ 1. El inversionista observa s y decide si acepta o rechaza
participar del proyecto. En caso de rechazar la oferta, los pagos son de I(1 + r) para el inversionista y π
para el empresario, ya que el proyecto no se realiza. En caso de aceptar, cada uno recibe su participación
en el beneficio total generado por la empresa con proyecto: s(π + R) para el inversionista y (1 − s)(π + R)
para el empresario.
En términos de la estructura descrita anteriormente, tenemos que T = {A, B}, p(A) = α y p(B) =
(1 − α), M = [0, 1], A = {Acepta, Rechaza}, y las funciones de pago son:

π si a = Rechaza
Ue (π, s, a) =
(1 − s)(π + R) si a = Acepta

I si a = Rechaza
Um (π, s, a) =
s(π + R) si a = Acepta

Una cuestión fundamental en los juegos de señalización son las conjeturas que hace el receptor
respecto del tipo del emisor una vez que observa los mensajes. Es natural pensar que estas deben
estar basadas en las probabilidades a priori definidas por p(ti ), pero como veremos también deben ser
coherentes con la estrategia del emisor. Por ahora, supongamos que dado un mensaje s fijo, el receptor
considera que con probabilidad q se trata de una firma tipo B. Dado esto, aceptará la oferta si y sólo si
su beneficio esperado es mayor que el costo de oportunidad del proyecto, q ·s(B +R)+(1−q)·s(A+R) ≥
I(1 + r). Esta condición se puede reescribir como:

I
s≥
(qB + (1 − q)A + R)

Por su parte, un empresario de tipo π solo estará dispuesto a recibir el financiamiento si la participación
s que otorga al inversionista cumple la condición de que el pago que recibe con proyecto es mayor que
el pago sin proyecto, (1 − s)(π + R) ≥ π. Despejando s se obtiene la condición:

R
s≤
π+R

Para simplificar la exposición de los conceptos, vamos a resolver una versión particular del modelo.
Consideremos los parámetros A = 15, B = 5, R = 15, I = 10, y α = 0,4. Además, supondremos que
las firmas solo pueden hacer dos ofertas de participación, las cuales son 2/3 y 1/5, de modo que ahora
M = {2/3, 1/5}. Las condiciones de participación ya calculadas siguen siendo válidas, y las utilizaremos
para este caso particular.
Consideremos la posibilidad de un equilibrio mezclador, esto es, un perfil en el que tanto el tipo
A como el B juegan la misma estrategia s.1 Una primera condición que le exigimos a las conjeturas
de equilibrio es que cuando todos los tipos envı́an el mismo mensaje, la conjetura debe ser igual a la
probabilidad a priori. Esto, porque al no resultar informativo el mensaje, el receptor no puede hacer
nada mejor que quedarse con las probabilidades originales.
Lo anterior implica que al proponer un equilibrio mezclador, en la condición de participación del
inversionista reemplazamos q = 0,6 (la probabilidad a priori de que la firma sea tipo B), con lo cual la
5
condición de participación del inversionista se reduce a s ≥ 12 . Por lo tanto, tenemos que:

Si ambos tipos ofrecen s(A) = s(B) = 2/3, el inversionista acepta el proyecto ya que 2/3 > 5/12
por lo que se verifica la condición.
1 En general, un equilibrio mezclador es aquel en que todos los tipos envı́an el mismo mensaje

Microeconomı́a II
Facultad de Economı́a y Negocios - Universidad de Chile 35

Si ambos tipos ofrecen s(A) = s(B) = 1/5, el inversionista rechaza el proyecto, ya que 1/5 < 5/12
por lo que no se cumple la condición.

Notemos que la condición bajo la cual la firma A prefiere hacer el proyecto es, para los parámetros
particulares, sA ≤ 21 . Ası́, no puede haber un equilibrio mezclador en el que s(A) = 2/3, ya que la
firma preferirá hacer la oferta 1/5 que le entrega mayor beneficio sin importar si el inversionista acepta
o rechaza. Por otro lado, el equilibrio mezclador s(A) = s(B) = 1/5 tampoco puede ocurrir, ya que
la firma tipo B preferirá ofrecer 2/3 con tal de realizar el proyecto y obtener 1/3 de 20 en vez de su
beneficio sin proyecto (que es 5). Por lo tanto, concluimos que en este caso no puede existir un equilibrio
mezclador.
Analicemos ahora la existencia de un equilibrio separador, esto es, un perfil en el que los distintos
tipos envı́an distintos mensajes. Cuando ello ocurre, el mensaje es completamente informativo del tipo
del individuo y esto tiene que influenciar la conjetura del receptor. Por ejemplo, si tenemos que la firma
sigue la estrategia s(A) = 2/3 y s(B) = 1/5, entonces la conjetura de la firma cuando observa s = 2/3
es que la firma es tipo A con certeza, y cuando observa s = 1/5 es que la firma es tipo B con certeza.
Con la noción de conjetura aclarada para un equilibrio separador, podemos analizar entonces los
casos separadores:

Dado s(A) = 2/3 y s(B) = 1/5, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 20, que
es menor a la inversión de 10) y acepta ante 2/3. Dado esto, la firma tipo B tiene incentivos a
desviarse, ya que si envı́a el mensaje 2/3 el inversionista aceptará y obtendrá mayor beneficio.

Dado s(A) = 1/5 y s(B) = 2/3, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 30, que es
menor a la inversión de 10) y acepta ante 2/3. En este caso la firma tipo A no tiene incentivos a
desviarse (porque prefiere su beneficio sin proyecto de 15 antes los 10 que recibe si se queda con
1/3 del proyecto), y la firma B tampoco porque siempre prefiere realizar el proyecto.

Por lo tanto, en nuestro ejemplo el único equilibrio es uno separador en el que la firma tipo A
ofrece una porción pequeña de las ganancias, la tipo B ofrece una porción grande, y por lo tanto el
inversionista solo acepta la propuesta de esta última. Aunque en el caso más general puede existir un
equilibrio mezclador (donde la inversión siempre se realiza), la existencia del separador no se debe a la
particularidad del ejemplo pues éste siempre existe. En el caso de que se dé un equilibrio separador,
la implicancia del modelo es que el resultado es subóptimo dado que realizar el proyecto siempre es
rentable. El problema que genera la información incompleta se observa en la condición de participación
del inversionista ante un mensaje mezclador, donde la firma A está sujeta a ofrecer una participación
mayor al inversionista, ya que éste no está seguro si los beneficios serán altos o bajos.
Ası́, los juegos de señalización se pueden usar en aplicaciones generales donde se observa que la
asimetrı́a de información entre dos agentes genera algún problema de eficiencia. Por ejemplo, el modelo
de señalización en el mercado laboral mencionado más arriba, en el cual la educación se utiliza como
señal, se pueden generar ineficiencias en el caso en el que la educación es productiva (los trabajadores
de alta productividad se educan más que lo eficiente con tal de señalizar y diferenciarse de los menos
eficientes).

Microeconomı́a II

You might also like