186
This is page i Printer: Opaque this LA MICRO DE CUARTO Antonio J. Morales UMA y LINEEX

apuntes_2010

Embed Size (px)

Citation preview

Page 1: apuntes_2010

This is page iPrinter: Opaque this

LA MICRO DE CUARTO

Antonio J. MoralesUMA y LINEEX

Page 2: apuntes_2010

ii

ABSTRACT �

Page 3: apuntes_2010

This is page iiiPrinter: Opaque this

Contents

References ix

I Los Fundamentos x

1 La Teoría de Elección en Condiciones de Incertidumbre 11.1 Introducción: Elección con condiciones de certidumbre. . . . 1

1.1.1 Conjunto de elección C . . . . . . . . . . . . . . . . 21.1.2 Conjunto asequible X . . . . . . . . . . . . . . . . . 21.1.3 Hipótesis de Comportamiento . . . . . . . . . . . . . 31.1.4 Las preferencias: axiomas. . . . . . . . . . . . . . . . 31.1.5 Existencia de la función de utilidad . . . . . . . . . . 4

1.2 La función de utilidad VNM . . . . . . . . . . . . . . . . . . 51.2.1 Conjunto de elección. . . . . . . . . . . . . . . . . . 51.2.2 ¿De dónde salen las probabilidades? . . . . . . . . . 61.2.3 Las preferencias: axiomas . . . . . . . . . . . . . . . 61.2.4 Existencia constructiva de la función de utilidad VNM 81.2.5 Propiedades de la función de utilidad VNM . . . . . 10

1.3 Riesgo y Aversión al Riesgo . . . . . . . . . . . . . . . . . . 121.3.1 Actitudes frente al Riesgo . . . . . . . . . . . . . . . 121.3.2 Equivalente Cierto y Prima de Riesgo . . . . . . . . 141.3.3 Cuanti�cación de la Aversión al Riesgo . . . . . . . 15

1.4 Aplicaciones I: Un Modelo Básico de Selección de Cartera . 181.4.1 La diversi�cación de la cartera óptima . . . . . . . . 19

Page 4: apuntes_2010

iv Contents

1.4.2 La elección entre un activo seguro y un activoarriesgado. . . . . . . . . . . . . . . . . . . . . . . . 21

1.5 Aplicaciones II: Un Modelo Básico de Demanda de Seguros 241.6 Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.6.1 Kahneman and Tversky (1979): Prospect Theory . . 27

2 Juegos con Información Perfecta 312.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Representación estratégica de un juego . . . . . . . . . . . . 322.3 Representación en forma extensiva de un juego . . . . . . . 342.4 Conceptos de solución. Nociones generales. . . . . . . . . . . 362.5 Conceptos de solución para juegos en forma estratégica . . . 37

2.5.1 Dominancia iterada . . . . . . . . . . . . . . . . . . 372.5.2 Estrategias racionalizables . . . . . . . . . . . . . . . 392.5.3 Equilibrio de Nash . . . . . . . . . . . . . . . . . . . 40

2.6 Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . 432.6.1 Sobre la interpretación de las estrategias mixtas . . 46

2.7 Conceptos de solución para juegos en forma extensiva . . . 472.7.1 Equilibrio de Nash Perfecto en Subjuegos . . . . . . 502.7.2 Estrategias en juegos en forma extensiva . . . . . . . 522.7.3 Lo importante de un equilibrio es lo que no se ve . . 52

3 Juegos con Información Imperfecta 553.1 Primeros ejemplos . . . . . . . . . . . . . . . . . . . . . . . 553.2 La Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . 58

3.2.1 El Show de Monty Hall . . . . . . . . . . . . . . . . 583.2.2 La Baraja Española . . . . . . . . . . . . . . . . . . 60

3.3 Creencias Consistentes . . . . . . . . . . . . . . . . . . . . . 623.4 Equilibrio Secuencial . . . . . . . . . . . . . . . . . . . . . . 653.5 Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.5.1 Ojo con la circularidad . . . . . . . . . . . . . . . . . 713.5.2 La lógica de tantos conceptos de solución distintos . 72

4 Juegos con Información Incompleta 754.1 Representación en forma estratégica de un juego bayesiano 76

4.1.1 Aplicación al Duopolio de Cournot con InformaciónIncompleta: . . . . . . . . . . . . . . . . . . . . . . . 77

4.1.2 Timing del juego: . . . . . . . . . . . . . . . . . . . . 794.1.3 De�nición de Equilibrio Bayesiano . . . . . . . . . . 79

4.2 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 804.2.1 El Duopolio de Cournot con Información Incompleta 804.2.2 El Teorema de Puri�cación de Harsanyi . . . . . . . 82

4.3 Introducción a las Subastas . . . . . . . . . . . . . . . . . . 854.4 Equilibrio Bayesiano Perfecto. Breve Introducción . . . . . 90

Page 5: apuntes_2010

Contents v

II Economía de la Información 92

5 Selección Adversa, Señalización y Screening 975.1 Selección Adversa: El Modelo de Akerlof . . . . . . . . . . . 97

5.1.1 Formulación Tradicional . . . . . . . . . . . . . . . . 975.1.2 Formulación con la Teoría de Juegos . . . . . . . . . 100

5.2 Señalización: El Modelo de Spence . . . . . . . . . . . . . . 1055.2.1 Juegos de Señalización. . . . . . . . . . . . . . . . . 1055.2.2 El Modelo de Spence . . . . . . . . . . . . . . . . . . 106

5.3 Racionamiento del Crédito: El Modelo de Stiglitz y Weiss . 1155.4 Screening: El Modelo de Rothschild y Stiglitz . . . . . . . . 122

5.4.1 Equilibrios Pooling . . . . . . . . . . . . . . . . . . . 1255.4.2 Equilibrios separadores . . . . . . . . . . . . . . . . 1265.4.3 Implicaciones del modelo . . . . . . . . . . . . . . . 127

6 Riesgo Moral e Incentivos 1296.1 Modelo básico . . . . . . . . . . . . . . . . . . . . . . . . . . 1306.2 El contrato óptimo cuando el esfuerzo es observable. . . . . 136

6.2.1 A modo de conclusión . . . . . . . . . . . . . . . . . 1396.3 El contrato óptimo cuando el esfuerzo no es observable. . . 140

6.3.1 Agente neutral al riesgo. . . . . . . . . . . . . . . . . 1416.3.2 Agente averso al riesgo . . . . . . . . . . . . . . . . . 143

6.4 Principal-agente con n=2 . . . . . . . . . . . . . . . . . . . 148

III El Diseño de Mecanismos 152

7 Economía del Bienestar 1537.1 Límites del Conocimiento y de la Acción . . . . . . . . . . . 1537.2 El Teorema de Imposibilidad de Arrow. La demostración de

John Geanakoplos . . . . . . . . . . . . . . . . . . . . . . . 1557.3 Después de Arrow hay vida: Funciones de Bienestar Social

y Funciones de Elección Social . . . . . . . . . . . . . . . . 1577.4 El Teorema de Gibbard-Satterhwaite . . . . . . . . . . . . . 158

8 El Principio de Revelación y el Diseño de Mecanismos 1618.1 Introducción. Turning Game Theory on its Head . . . . . . 1618.2 El Principio de Revelación de Myerson (1979) . . . . . . . . 1628.3 Provisión E�ciente de Bienes Públicos. El Mecanismo de

Clarke-Groves (1977) . . . . . . . . . . . . . . . . . . . . . . 1658.4 Juegos Bíblicos: El dilema de Salomón (950 bc) . . . . . . . 1678.5 Maskin (1977) by Maskin (2007) . . . . . . . . . . . . . . . 1698.6 El Principal como ser egoísta . . . . . . . . . . . . . . . . . 172

8.6.1 El intercambio bilateral . . . . . . . . . . . . . . . . 1728.6.2 El diseño óptimo de Subastas . . . . . . . . . . . . . 173

Page 6: apuntes_2010

vi Contents

8.6.3 El Mecanismo de Becker, DeGroot and Marshack . . 174

Page 7: apuntes_2010

Contents vii

Una nota sobre la bibliografíaLa bibliografía recomendada para la asignatura Microeconomía

Avanzada II es la siguiente:

Tema 1. Elección bajo incertidumbreUtilidad Esperada. Capítulo 4 de [7]Riesgo y Aversión al Riesgo. Pregunta 3.2 de [6]Modelo Básico de Cartera. Pregunta 3.3 de [6]Modelo Básico de Seguros. Pregunta 18.1 de [6]

Tema 2. Juegos con Información PerfectaCapítulos 1 y 2 de [4]Capítulos 1, 2 y 4 de [9]

Tema 3. Juegos con Información ImperfectaCapítulos 11 y 12 de [8]Capítulo 4 de [9]

Tema 4. Juegos con Información IncompletaCapítulo 3 de [4]Capítulo 12 de [8]

Tema 5. Selección Adversa, Señalización y AutoselecciónModelo de Akerlof. Capítulo 17 de [6]Modelo de Spence. Pregunta 4.2.B de [4]Modelo de Stiglitz-Weiss. Preguntas 5.3 y 5.4 de [2]Modelo de Rothschild-Stiglitz. Pregunta 7.2 de [9]

Tema 6. Riesgo Moral e IncentivosCapítulo 16 de [6]

Tema 7. Economía del BienestarEl Teorema de Imposibilidad de Arrow. La introducción de [3]La demostración de John Geanakoplos. La primera prueba de [3]Funciones de Bienestar Social y Funciones de Elección Social.

Capítulo 15 de [5]El Teorema de Gibbard-Satterhwaite. Pregunta 15.1 de [5]

Tema 8. El Principio de Revelación y el Diseño de MecanismosEl Principio de Revelación y el Diseño de Mecanismos. Pregunta 3.3

de [4]El Mecanismo de Clarke-Groves. Pregunta 18.3 de [6]El Teorema de Maskin. Ejemplo 186.3 de [8] y Pregunta 15.3 de [5]El Diseño Óptimo de Subastas. Pregunta 11.7 de [1]

Page 8: apuntes_2010

viii Contents

Page 9: apuntes_2010

This is page ixPrinter: Opaque this

References

[1] Binmore, Kenneth (1994). Teoría de Juegos, McGraw-Hill.

[2] Freixas, Xavier y Jean-Charles Rochet (1999). Economía Bancaria,Antoni Bosch Ed.

[3] Geanakoplos, John (2005) "Three Brief Proofs of Arrow�s ImpossibilityTheorem", Economic Theory 26(1), pp. 211-215.

[4] Gibbons, Robert (1992). Un Primer Curso de Teoría de Juegos, AntoniBosch Ed.

[5] Humphreys, Macartan (2005). Game Theory Notes, mimeo.

[6] Kreps, David, (1994). Curso de Teoría Microeconómica, McGraw-Hill.

[7] Jehle, Geo¤rey A. y Philip Reny (1998). Advanced MicroeconomicTheory, Addison-Wesley.

[8] Osborne, Martin J. y Ariel Rubinstein (1994). A Course in GameTheory, MIT Press.

[9] Vega-Redondo, Fernando (2000). Economía y Juegos, Antoni Bosch ed.

Page 10: apuntes_2010

Parte I

Los Fundamentos

x

Page 11: apuntes_2010

xi

Este título se lo debo a Karlos Arguiñano...

Page 12: apuntes_2010

xii

Page 13: apuntes_2010

This is page 1Printer: Opaque this

1La Teoría de Elección en Condicionesde Incertidumbre

El objetivo de este tema es extender la teoría de la elección que visteisel curso pasado al caso en el que no existe una relación uno a uno entreacciones y resultados. Una vez que nos centremos en resultados monetarios,podremos hablar de riesgo y actitudes frente al riesgo, y eso nos dará pie aanalizar la selección óptima de carteras y la demanda de seguros.

1.1 Introducción: Elección con condiciones decertidumbre.

Toda teoría de la elección que se precie tiene tres patas:

1. Conjunto de elección.

2. Conjunto de decisión.

3. Hipótesis de comportamiento.

En tercero visteis la teoría de elección en condiciones de certidumbre.Repasémosla para que podáis ver el paralelismo entre tercero y cuarto.

1. Conjunto de elección: Todas las cestas de consumo imaginables.

2. Conjunto de decisión: De las imaginables, las cestas asequibles(circunstancias personales).

3. Hipótesis de comportamiento: El decision maker elige lo mejor

Page 14: apuntes_2010

2 1. La Teoría de Elección en Condiciones de Incertidumbre

1.1.1 Conjunto de elección C

Supongamos que en la economía hay n bienes. Entonces los objetos deelección son todas las cestas de consumo imaginables compuestas por losn bienes. Matemáticamente hablando, una cesta de consumo es un vectorx (x1; :::; xn) donde xi es la cantidad de bien i.Por tanto, el conjunto deelección C es Rn+.Las propiedades relevantes del conjunto de elección son las siguientes:

1. ; 6=C� Rn+

2. C es cerrado.

3. C es convexo.

4. 0 2 C

1.1.2 Conjunto asequible X

Una cosa son las cestas que el consumidor puede imaginar, y otra muydistintas aquellas que puede permitirse. Eso signi�ca que tenemos que teneren cuenta las circunstancias personales del consumidor: su riqueza (wealth).

¿Cómo describimos el conjunto asequible o presupuestario? Tenemos quedecir algo acerca de la forma en la que el consumidor puede conseguir losbienes de consumo.

Supondremos

(a) Cada bien tiene su mercado.

(b) En cada mercado surge un precio

(c) El mercado es competitivo (precio aceptantes)

Los anteriores supuestos nos permiten escribir el conjunto presupuestariode la siguiente forma

X = fx 2 C j p � x � w;x � 0g (1.1)

El conjunto presupuestario tiene las siguientes propiedades

1. Cerrado (contiene a su frontera)

2. Acotado (tiene una "extensión" �nita)

3. Convexo

Page 15: apuntes_2010

1.1 Introducción: Elección con condiciones de certidumbre. 3

1.1.3 Hipótesis de Comportamiento

� El individuo elige lo mejor de lo disponible.

� ¿Cómo vamos a representar "lo mejor"? Mediante una relación depreferencias de�nida sobre el conjunto de elección.

1.1.4 Las preferencias: axiomas.

Relación binaria % de�nida sobre el conjunto de elección

x1 % x2se lee "x1es al menos tan bueno como x2" (1.2)

Axioma 1 Completitud. Para todo x1 6= x2 en C; o x1 % x2 o x2 % x1o ambos.

Axioma 2 Re�exividad. Para todo x 2 C; x % x.

Axioma 3 Transitividad. Para cualesquiera x1; x2 y x3 pertenecientes aC, si x1 % x2 y x2 % x3 entonces x1 % x3:

¿Qué hacemos con estos tres axiomas? Pues el libro de los gustos delconsumidor. Es decir, el libro que nos sirve para predecir el comportamientodel consumidor.

Pero vamos a utilizar más axiomas

� Los gustos no sufren cambios bruscos (continuidad)

� Más es mejor (más no es peor) (no existencia del punto G)(monotonicidad)

� La virtud es el punto medio (convexidad)

Axioma 4 Continuidad. Para todo x 2 C, el conjunto �tan bueno como�y el conjunto �no mejor que� son cerrados.

Axioma 5 Monotonicidad. Tiene dos versiones: la débil y la estricta:

� Monotonicidad débil: (i) Más de todos los bienes es mejor, (ii)Más de algún bien no es peor.

� Monotonicidad estricta: (i) Más de todos los bienes es mejor, (ii)Más de algún bien es mejor.

Axioma 6 Convexidad. Tiene su versión débil y estricta, como casi todoen esta vida: Si x1 6= x0 y x1 % x0, entonces tx1+(1� t)x0 % x0 para todot 2 (0; 1)

Page 16: apuntes_2010

4 1. La Teoría de Elección en Condiciones de Incertidumbre

1.1.5 Existencia de la función de utilidad

De�nicion 1 Un función real u :C! R se denomina Función de Utilidadrepresentativa de la relación de preferencia % si para cualesquiera x0; x1 2C; u(x0) � u(x0)() x0 % x1

Teorema 1 Debreu (1954). Si la relación binaria % es racionaly continua, entonces existe una función de utilidad continua que larepresenta.

Vamos a realizar una demostración utilizando el axioma demonotonicidad. Sean dos cestas x1 y x2. Sea e el vector de unos (1; 1; :::; 1).Calculemos

u(x1) � e � x1

u(x2) � e � x2

x1 % x2m por construcción

u(x1) � e � x1 % x2 � u(x2) � em por transitividad de %

u(x1) � e % u(x2) � em por monotonicidad de %

u(x1) � u(x2)

(1.3)

Esta demostración, para el caso de dos bienes, puede hacersegrá�camente.

Hay dos propiedades básicas de la función de utilidad u (�)

Page 17: apuntes_2010

1.2 La función de utilidad VNM 5

Remark 1 No es única, sino que admite transformaciones crecientes.

Remark 2 Tiene carácter ordinal, no cardinal.

1.2 La función de utilidad VNM

La Teoría de la Utilidad Esperada fue presentada por John Von Neumanny Oscar Morgenstern en su inmortal libro de 1944 LA TEORÍA DEJUEGOS Y EL COMPORTAMIENTO ECONÓMICO. Ha sido la base delanálisis con incertidumbre de todo análisis económico. Ahora bien, tienecompetidores siendo el más laureado de ellos la Teoría Prospectiva, deDaniel Kahnemann y Amos Tversky.

1.2.1 Conjunto de elección.

Sea C un conjunto de resultados fc0; : : : ; cg. Fíjate en que estamossuponiendo un par de cosas

1. El conjunto de elección es compacto (es algo que no supusimos parael caso con certeza)

(a) Existe el peor resultado (c0)

(b) Existe el mejor resultado (c).

2. OJO: Cada resultado ci es un resultado cierto. Por tanto, el decisionmaker puede ordenarlos en base a su función de utilidad u (�). Sinpérdida de generalidad voy a suponer que están ordenados de menosa más preferidos.

Los objetos de elección van a ser loterías de�nidas sobre el conjunto deresultados. Piensa en la siguiente clase de objeto (se llama lotería simple)

L =

8>>>>>><>>>>>>:

c0 con probabilidad p0c1 con probabilidad p1: : : : : :ci con probabilidad pi: : : : : :c con probabilidad p

(1.4)

conP

i pi = 1:

Una notación más compacta sería

L :

0BB@p0p1:::p

1CCA (1.5)

Page 18: apuntes_2010

6 1. La Teoría de Elección en Condiciones de Incertidumbre

Desde un punto de vista técnico, ¿qué son las loterías simples? Sondistribuciones de probabilidad de�nidas sobre el conjunto de resultados.

OJO: También hay loterías compuestas.

1.2.2 ¿De dónde salen las probabilidades?

Tenemos dos casos posibles:

1. Si son probabilidades objetivas, entonces hablamos de elección bajoriesgo. Por ejemplo, el billete de Lotería de Navidad. Resultadosmonetarios. Se conocen las distintas posibilidades de premios.

2. Si son subjetivas, entonces hablamos de elección bajo incertidumbre.Entonces, ESTADOS DELMUNDO. Comentario técnico importante:Small worlds Hypothesis. Si tenéis un poco de tiempo podéis leerla sección del Kreps sobre el tema que es muy interesante.

1.2.3 Las preferencias: axiomas

Por favor, ¿Alguien puede decirme cuáles son los cuatro primeros axiomas?

Axioma 7 Completitud.

Axioma 8 Re�exividad.

Axioma 9 Transitividad.

Axioma 10 Continuidad.

Es posible que tengáis la siguiente sensación: o sea, que cambiamos lainterpretación del conjunto de elección, aplicamos la misma maquinariay tenemos asegurada la existencia de una función de utilidad ¿y qué?¿Existirá alguna relación entre las distintas funciones de utilidad u (�) yU (�)? John Von Neumann y Oscar Morgenstern mostraron al mundo en1944 que, bajo ciertos supuestos adicionales, hay una relación muy estrecha.De hecho, el objetivo de esta pregunta es mostraros esta relación tanestrecha.

Piensa en el siguiente subconjunto de loterías.

L� :

8>>>><>>>>:c0 with probability 1� �c1 with probability 0c2 with probability 0::: :::c with probability �

(1.6)

Page 19: apuntes_2010

1.2 La función de utilidad VNM 7

¿Qué tienen de especial? Pues que sólo dan o el peor resultado del mundo,o el mejor resultado del mundo. Y claro, observa que a esta clase de loteríaspertenecen tanto la peor lotería del mundo

L� = L�=0 :

�c0 with probability 1c with probability 0

(1.7)

como la mejor lotería del mundo

L+ = L�=1 :

�c0 with probability 0c with probability 1

(1.8)

Esa es la gracia del supuesto que hemos hecho sobre la �nitud del conjuntode resultados. De esa forma, nos hemos asegurado la existencia de la mejorlotería y de la peor lotería. A partir de ahora vamos a hacer un uso intensivode las loterías L�.

Axioma 11 Continuity. For every lotery L there exists a number � 2[0; 1] such that L � L�

Remark 3 Este es calcadito al caso con certeza: Pequeños cambios enlas probabilidades no cambian el orden entre dos loterías. Considera queL0:"muerte segura" y L00:"ganar 11 euros seguros". Considera la loteríaL:"Ganar 10 euros seguros". Evidentemente la gente las ordenaría de lasiguiente forma

L00 � L � L0

Pues bien, el axioma de continuidad nos dice que existe una probabilidad pestrictamente positiva tal que

L � pL0 + (1� p)L00

Es decir, admitirías una probabilidad positiva de muerte con tal de conseguir1 euro más (u¤, u¤, cuidadito con lo que supones)

Axioma 12 Monotonicity. For every a; b 2 [0; 1] ; a � b, La � Lb

Remark 4 Este es calcadito al caso con certeza. Simplemente nos dice quelos resultados de las loterías son "bienes" en lugar de "males".

Axioma 13 Substitution. Let L be (p0; g0; : : : ; pi; gi; : : : ; p; g). If gi �di then L � (p0; g0; : : : ; pi; di; : : : ; p; g).

Remark 5 Este tiene su enjundia, porque no hay nada parecido en lateoría de la elección con certidumbre. Os esbozo la situación. Imaginaosque para vosotros la lotería L00 es preferida a la lotería L

0. Entonces si

mezclas estas dos loterías con una tercera L, el orden de preferencia nocambia, es decir, es independiente de la tercera.

L00 � L0 () pL00 + (1� p)L � pL0+ (1� p)L

Page 20: apuntes_2010

8 1. La Teoría de Elección en Condiciones de Incertidumbre

En la teoría del consumidor bajo certidumbre no hay nada parecido aeste. ¿Por qué? Pues porque no hay razón para creer que las preferenciasde un individuo sobre varias cestas de consumo de bienes 1 y 2 debanser independientes de las cantidades de otros bienes que también seránconsumidos. Bajo incertidumbre es naturral pensar que la preferencia deun individuo sobre dos loterías L00 y L0 debe determinar cual de las dosél pre�ere como parte de de una lotería compuesta independientementedel otro resultado L de la lotería compuesta. Este otro resultado debeser irrelevante porque, en contraste con el contexto bajo certidumbre, elindividuo no consume L00 y L0 junto con L, sino más bien a cambio de L(si es que el estado de la naturaleza así lo determina).

Axioma 14 Reduction to simple gambles. For any lottery L, L isindi¤erent to the associated reduced gamble.

Remark 6 Estamos diciendo que al individuo no le importa la forma enla que la incertidumbre se resuelve, sino las probabilidades con las que cadaresultado toca. La gente que juega a las quinielas o al bingo no piensaprecisamente eso.

1.2.4 Existencia constructiva de la función de utilidad VNM

En esta sección vamos a llevar a cabo la demostración constructivade la existencia de la función de utilidad VNM. Es, como todas lasdemostraciones que veremos este curso, corta e inteligente. En �n, unabelleza de demostración.

Pero ojo, toda demostración corta e inteligente es difícil de entender ala primera. Así que no te desesperes si necesitas unos cuantos intentos...porque una vez que lo consigas ver, ¡¡ya es tuya!!

Lo primero que haremos será de�nir la función de utilidad VNM. Despuésdemostraremos que en verdad funciona como función de utilidad y mástarde veremos la relación con la u pequeñita.

De�nicion 2 A la lotería L le asignamos U (L) tal que

L � LU(L)

Observa que por continuidad siempre existe.Demostracion. Veamos ahora que funciona realmente como función deutilidad para las loterías en el sentido de que a loterías mejores les asigna

Page 21: apuntes_2010

1.2 La función de utilidad VNM 9

números mayores.

L1 � L2 Sean dos loterías, una mejor que otram

LU(L1) � L1

LU(L2) � L2

Por continuidad

mLU(L

1) � LU(L2) Por transitividad

mU�L1�� U

�L2�

Por monotonicidad

(1.9)

Ahora utilicemos el resto de axiomas para ver la relación tan curiosa entreu (�) y U (�). Empecemos con cualquier lotería L. Si no es simple, entoncesla reducimos a su simple asociada.

L =

8>>>>>><>>>>>>:

c0 con probabilidad p0c1 con probabilidad p1: : : : : :ci con probabilidad pi: : : : : :c con probabilidad p

Por continuidad

ci indiferente a�c0 con probabilidad 1� uic con probabilidad ui

Por el axioma de sustituibilidad

L �

8>>>>>>>>>><>>>>>>>>>>:

�c0 con probabilidad 1� u0c con probabilidad u0

con probabilidad p0

: : : : : :�c0 con probabilidad 1� uic con probabilidad ui

con probabilidad pi

: : : : : :�c0 con probabilidad 1� uc con probabilidad u

con probabilidad p

El axioma de reducción a las loterías simples

L ��c0 con probabilidad 1� (p0u0 + p1u1 + :::+ piui + :::+ pu)c con probabilidad p0u0 + p1u1 + :::+ piui + :::+ pu

Por de�nición

U (L) = p0u0 + p1u1 + :::+ piui + :::+ pu

Page 22: apuntes_2010

10 1. La Teoría de Elección en Condiciones de Incertidumbre

Felicidades, ¿pero qué hemos demostrado? Lo pondré más grande

U

0BBBBBB@c0 con probabilidad p0c1 con probabilidad p1: : : : : :ci con probabilidad pi: : : : : :c con probabilidad p

1CCCCCCA = p0u (c0) + p1u (c1) + :::+ pu (c)

(1.10)Es decir, la utilidad de un gamble es la utilidad esperada de cada uno de

sus resultados.

1.2.5 Propiedades de la función de utilidad VNM

Hay básicamente dos propiedades interesantes que vamos a considerar.

1. Uniqueness up to a¢ ne transformations.

2. Carácter cardinal.

Recuerda el libro de preferencias del consumidor. Recuerda su índice u (�).Pues bien, en la demostración hemos supuesto una numeración especial: laprimera página es la 0 y la última página es la número 1.

¿Qué ocurre si cambio el índice v (�) de manera creciente? Pues querepresenta las mismas preferencias. ¿Qué relación hay entre U(�) y V (�)?

Originalmente, u (café bueno) = 1 y u (café malo) = 0. Entonces

U

0@ "Un café que esbueno con prob. pBuenoy malo con prob pMalo"

1A = pBuenou (café bueno) + (1� pBueno)u (café malo)

= pBueno

Supongamos ahora que cambiamos la función de utilidad de�nida sobrelas cestas de consumo: v (café bueno) = 5 y v (café malo) = 2. Ojo que latransformación tiene que ser creciente... Entonces tenemos

V

0@ "Un café que esbueno con prob. pBuenoy malo con prob pMalo"

1A = pBuenov (café bueno) + (1� pBueno) v (café malo)

= 5pBueno + 2 (1� pBueno)

Reorganizando esta última expresión tenemos

V

0@ "Un café que esbueno con prob. pBuenoy malo con prob pMalo"

1A = 2 + 3pBueno

Page 23: apuntes_2010

1.2 La función de utilidad VNM 11

¿Qué relación surge entonces entre la U (�) y la V (�)? Pues

V

0@ "Un café que esbueno con prob. pBuenoy malo con prob pMalo"

1A = 2 + 3

0@ "Un café que esbueno con prob. pBuenoy malo con prob pMalo"

1Ao lo que es lo mismo

V (�) = 2 + 3U (�)

Es decir, la nueva función de utilidad de�nida sobre las loterías es unatransformación lineal creciente de la antigua. El resultado general es que lasfunciones de utilidad de�nidas sobre las loterías no son únicas, pero todasellas son transformaciones lineales crecientes. Y ¿sabes por qué tienen queser transformaciones lineales? Pues porque la función de utilidad sobre lasloterías tienen la forma de utililidad esperada, es decir, son lineales así quesólo las transformaciones lineales funcionan. Así de fácil...1

De alguna forma el resultado es intuitivo: cuando hay riesgo, los agentesdeben tener alguna idea de la diferencia de utilidad entre diferentes paresde resultados (A y B por ejemplo) para poder juzgar si la posibilidad deganar cuando A ocurre es mayor que el riesgo de perder cuando B ocurre.

Pero claro, esta linealidad tiene sus implicaciones para la función deutilidad: ahora tiene caracter cardinal, es decir, los números asignadostienen un signi�cado.

Imagínate que en el mundo con certidumbre el individuo ordena lassiguientes cestas de la siguiente forma

x � x0 � x00

tal que

u (x)� u (x00) = 2 [u (x0)� u (x00)]

Podría ser

u (x) = 7

u (x0) = 5

u (x00) = 3

1Es algo completamente análogo a la relación entre la escala de temperatura Celsiusy Fahrenheit. En la Celsius, el punto de congelación del agua es 0o, mientras que elpunto de ebullución corresponde a 100o. En la Fahrenheit el punto de congelación secorresponde a los 32o celsius mientras que el de congelación a los 212o celsius. Como yahabrás sospechado, la conversión entre ambas escalas es lineal

�F o = 32 + 9

5Co�.

Page 24: apuntes_2010

12 1. La Teoría de Elección en Condiciones de Incertidumbre

Operando obtenemos la siguiente conclusión en el mundo conincertidumbre

u (x)� u (x00) = 2 [u (x0)� u (x00)]1

2u (x)� 1

2u (x00) = u (x0)� u (x00)

1

2u (x) +

1

2u (x00) = u (x0)

Es decir, el individuo mostraría indiferencia entre las dos siguientesloterías

L :

�x con probabilidad 005x00 con probabilidad 005

� L0 :�x0 con probabilidad 1

1.3 Riesgo y Aversión al Riesgo

Supongamos que es tu cumpleaños y te hago el siguiente regalo: un activo�nanciero que a veces te hace ganar un euro (la mitad de la veces) y a veceste hace perder un euro (la otra mitad de veces).

Este apartado del tema está dedicado a responder a la siguiente pregunta:¿Te gusta mi regalo? Vale, pero ¿Cuánto te gusta?

1.3.1 Actitudes frente al Riesgo

Para saber si te gusta el regalo debes comparar tu bienestar antes y después.Antes de tu cumple, disponías de una riqueza w (segura), mientras quedespués tu riqueza es una lotería LC.

Antes del regalo tu riqueza era la siguiente lotería

L = w con probabilidad 1

mientras que después del regalo tu riqueza viene dada por la siguientelotería

R =

�w + 1 con probabilidad 0�5w � 1 con probabilidad 0�5

Fíjate en que están relacionadas

1. Tienen el mismo valor esperado

E (L) = E (R) = w

Page 25: apuntes_2010

1.3 Riesgo y Aversión al Riesgo 13

2. Pero di�eren en la varianza

V AR (R) > V AR (L) = 0

Así pues, tu bienestar antes del regalo es

U (L) = u (w)

mientras que después del regalo es

U (R) =1

2u (w + 1) +

1

2u (w � 1)

Supongamos que eres un desagradecido, es decir, que no te gusta el regalo;eso signi�ca

U (L)>U (R)m

u (w)> 12u (w + 1)+

12u (w � 1)

mu�12 (w + 1) +

12 (w � 1)

�> 12u (w + 1)+

12u (w � 1)

mu00 (�)<0

mu (�) es cóncava en w

mEres averso al riesgo

Es decir, un averso al riesgo es un desagradecido cuando se le regala unjuego justo (aquel en el que en términos esperados ni ganas ni pierdes).Grá�camente se ve muy bien

La siguiente de�nición formaliza nuestros hallazgos.

De�nicion 3 Sea u (�) una función de utilidad VNM. Entonces ante unalotería simple L : (p0; p1; :::; pn), el individuo es

1. Averso al riesgo en L si u (E (L)) > U (L)

Page 26: apuntes_2010

14 1. La Teoría de Elección en Condiciones de Incertidumbre

2. Neutral al riesgo en L si u (E (L)) = U (L)

3. Amante al riesgo en L si u (E (L)) < U (L)

1.3.2 Equivalente Cierto y Prima de Riesgo

Sigamos con el cumpleaños. Ya sabemos que no te gusta mi regalo -desagradecido- y estás pensando en vendérselo a alguien -traidor- ... a ver sipor lo menos puedes sacarle algún rendimiento. El objetivo de esta secciónes ponerle precio.

La idea es encontrar el precio P tal que la lotería (w + P con probabilidad 1)te de la misma utilidad que la lotería R. Es decir

U (w + P ) = U (R)

El siguiente grá�co te aclarará las ideas

Es decir, la cantidad de dinero seguro que otorga la misma utilidad quela lotería de denomina Equivalente Cierto (EC) y en el caso de los aversosal riesgo, es menor que el valor esperado de la lotería. Eso signi�ca que elprecio de venta del activo �nanciero es NEGATIVO.

Estarás dispuesto a pagar una cantidad de dinero �el precio, con elsigno cambiado se denomina técnicamente prima de riesgo- por quitartede encima el riesgo inherente al activo �nanciero. Claro, por eso eres unaverso al riesgo.

La siguiente de�nición formaliza lo obtenido hasta el momento

De�nicion 4 El equivalente cierto a una lotería (EC) es la cantidadde riqueza segura cuya utilidad iguala a la utilidad de la lotería. La primade riesgo (PR)es la diferencia entre la riqueza esperada de la lotería y elequivalente cierto.

Ejemplo 1 Función de utilidad logarítmica. Supongamos la siguientefunción de utilidad de�nida sobre la renta o la riqueza u (w) = lnw.Es estrictamente cóncava (verifícalo -si quieres dibujala), por lo que el

Page 27: apuntes_2010

1.3 Riesgo y Aversión al Riesgo 15

consumidor es averso al riesgo. Supongamos que le ofrecemos la posibilidadde invertir en un proyecto de inversión que con probabilidad 1/2 gana h ycon probabilidad 1/2 pierde h. Su riqueza es por tanto la siguiente lotería

L :

�w + h prob 0; 5w � h prob 0; 5

El equivalente cierto cumple

U (EC) = U (L)

ln (EC) =1

2ln (w + h) +

1

2ln (w � h)

= ln ((w + h) (w � h))12

= ln�w2 � h2

� 12

de donde obtenemos

EC =�w2 � h2

� 12 < w

PR = w ��w2 � h2

� 12 > 0

1.3.3 Cuanti�cación de la Aversión al Riesgo

Muchas veces querremos no sólo decir que alguien es averso al riesgo sinocuanti�car cuánto de averso es para poder establecer comparaciones entredistintos individuos. Una primera idea es utilizar la "curvatura" de lafunción de utilidad u00 (�). Esta medida sin embargo tiene un problemay es que su tamaño es completamente arbitrario. Recuerda que cualquiertransformación lineal positiva también representa las mismas preferenciasdel individuo.

Por ello, y para mantener la constancia de la medida con respecto atransformaciones a�nes Pratt propuso en 1964 el siguiente coe�ciente.

De�nicion 5 El coe�ciente de aversión absoluta al riesgo deArrow-Pratt es

Ra (w) = �u00 (E (L))

u0 (E (L))(1.11)

Ejercicio 1 Demuestra que dicho coe�ciente es invariante a transforma-ciones a�nes.

Si alguien va a comprarnos esta medida como descriptora del grado deaversión al riesgo, entonces debemos demostrar que, en algún sentido, unmayor coe�ciente Arrow-Pratt implica un menor equivalente cierto, portanto una mayor prima de riesgo, o lo que es lo mismo estará dispuesto apagar un mayor precio por asegurarse frente al riesgo.

Page 28: apuntes_2010

16 1. La Teoría de Elección en Condiciones de Incertidumbre

Proposicion 1 Un mayor coe�ciente Arrow-Pratt de aversión absoluta alriesgo es sinónimo de una mayor prima de riesgo.

Demostracion. Vamos a demostrarlo para un activo �nanciero que ofrezcaresultado mi con probabilidad pi para i = 1; 2; ::; n, cuyo rendimientoesperado sea m = E (L). La prima de riesgo PR viene de�nida por lasiguiente expresión

u (E (L)� PR) =Xi

piu (mi) (1.12)

Recuerda la siguiente fórmula de matemáticas

f (x) ' f (a)+ f 0 (a) (x� a)1!

+ f 00 (a)(x� a)2

2!+ :::+ f (n) (a)

(x� a)n

n!+ :::

(1.13)que es la expansión de Taylor alrededor del punto a.El término de la izquierda vamos a expandirlo un grado alrededor de la

riqueza esperada mientras que el término de la derecha lo vamos a expandirhasta el segundo grado alrededor de la riqueza esperada.

u (E (L)� PR) = u (E (L)) + u0 (E (L)) E (L)� PR� E (L)1!

(1.14)

u (mi) = u (E (L)) + u0 (E (L))

wi � E (L)1

+1

2u00 (E (L)) (mi � E (L))

(1.15)de dondeX

i

piu (mi) = u (E (L)) + u0 (E (L))

"Xi

pimi � E (L)#+ (1.16)

+1

2u00 (E (L))

"Xi

(mi � E (L))2 pi

#(1.17)

= u (E (L)) +1

2u00 (E (L))V AR (L)

Insertando (1:16) y (1:14) en (1:12) llegamos a

u (E (L)) + u0 (E (L)) (�PR) ' u (E (L)) + 12u00 (E (L))V AR (L)

es decir�PRu0 (E (L)) ' 1

2u00 (E (L))V AR (L)

y por tanto

PR ' 1

2Ra (E (L))V AR (L) (1.18)

Aunque claro, siempre es mejor un dibujo.

Page 29: apuntes_2010

1.3 Riesgo y Aversión al Riesgo 17

Remark 7 La anterior proposición implica que individuos con mayorescoe�cientes Arrow-Pratt son de hecho más aversos en el siguientebehavioural respect: tienen menores equivalentes ciertos y por lo tanto estándispuestos a aceptar menores loterías.

Ejercicio 2 Convéncete demostrándolo intuitivamente.

Remark 8 (From Lengwiler Lecture Notes). Consider a simple binarylottery- you cannot win anything but can loose $10 with 50% probability.

1. (a) CARA:A millionaire requires the same payment to enter thislottery as a beggar would. (Constant Absolute Risk Aversion)

(b) IARA: A millionaire requires a larger payment than the beggar!(Increasing Absolute Risk Aversion)

(c) DARA:A millionaire takes it for a smaller payment than abeggar (more realistic case) (Decreasing Absolute Risk Aversion)

A veces sin embargo estaremos interesados en una medida relativa delriesgo, es decir, PR=E (L), que es el coste del riesgo por unidad de ingresoesperado. Partiendo de (1:18) vemos que

PR

E (L)' �1

2

u00

u0V AR (L)

E (L)

o lo que es lo mismo

PR

E (L)' �u

00

u0E (L)

1

2

V AR (L)

(E (L))2

PR

E (L)' RR (E (L))

1

2

V AR (L)

(E (L))2

donde

RR (E (L)) = �E (L)u00

u0(1.19)

Page 30: apuntes_2010

18 1. La Teoría de Elección en Condiciones de Incertidumbre

Fíjate en que el coe�ciente de aversión relativa al riesgo mide el riesgocomo la elasticidad de la utilidad marginal del ingreso con respecto alingreso

RR (E (L)) =du0

dE (L)

E (L)

u0

Acabamos esta sección con un par de funciones de utilidad muy utilizadasen economía.

Remark 9 (From Lengwiler Lecture Notes). Consider another simplebinary lottery- instead of losing $10 with 50% probability now we havea 50% probability of losing your wealth. For the beggar this amount tolosing a few cents for the millionaire it may be in $100,000. Who requiresa larger amount up front, in terms of percentage of his wealth, to enter thisgamble? Not easy to answer? Suppose the millionaire requires $70,000- thisis not unrealistic and the beggar requires 30 cents- also probable- then themillionaire requires a larger percentage of his wealth than the beggar =>the millionaire is thus more relatively risk averse than the beggar.

De�nicion 6 The constant absolute risk aversion (CARA) utility functionis given by

u (w) = � 1�e��x for � > 0

where � is the coe¢ cient of absolute risk aversion.

De�nicion 7 The constant relative risk aversion (CRRA) utility functionis given by

u (w) =x1�r

1� r for r > 0; 6= 1

= lnx for r = 1

where r is the coe¢ cient of relative risk aversion.

1.4 Aplicaciones I: Un Modelo Básico de Selecciónde Cartera

Ya que tenemos un modelo acerca del comportamiento de los individuosen presencia de riesgo, podemos desarrollar un pequeño modelo de elecciónentre activos �nancieros. De los datos experimenales se desprende que casitodo el mundo es averso al riesgo, por lo que en esta sección me centraré eninversores aversos al riesgo. Piensa que la idea de este ejercicio es mostrar lautilización del modelo desarrollado en este tema y no tanto la adquisiciónde habilidades para ganar la vida como diseñador de fondos de inversión.

Vamos a estudiar dos situaciones que suelen aparecer en los modelos deselección de cartera:

Page 31: apuntes_2010

1.4 Aplicaciones I: Un Modelo Básico de Selección de Cartera 19

1. La diversi�cación de la cartera óptima (one should never put all one�seggs in one basket)

2. La proporción óptima de activos arriesgados en la cartera (portfolioselection)

Podríamos estudiar las dos situaciones en un mismo modelo sin más queconsiderar la selección óptima de cartera en un mundo en el que existeun activo seguro y dos activos arriesgados, pero la cosa se complicaríainnecesariamente.

1.4.1 La diversi�cación de la cartera óptima

Supongamos que eres averso al riesgo y te dan a elegir entre dos activos�nancieros X e Y con riesgo tales que

1. Unit price of X = unit price of Y ,

2. E [X] = E [Y ].

3. V AR [X] = �2X > �2Y = V AR [Y ].

Imagínate que te obligo a comprar sólo uno de ellos: ¿Cuál comprarías?Pues dado que tienen el mismo valor esperado, pre�eres el de menorvarianza: el Y .

Dada esta relación de preferencia estricta entre los activos �nancierosY � X, ¿tiene sentido que el director del banco te ofrezca comprar delos dos? Es decir, ¿tu cartera óptima sólo debe contener low-risk asset Yo debes tener un mixed portfolio que incluya algo del high-risk asset X?Interesante a la vez que contraintuitivo... Veámoslo.

Sea � la proporción invertida en el high-risk asset X. Por tanto, turiqueza viene representada por una lotería Z = �X + (1� �)Y cuyorendimiento esperado E (Z) = E [X] = E [Y ] es independiente de lacombinación entre activo más arriesgado y menos arriesgado y cuyavarianza sí que depende del mix

�2Z = �2�2X + (1� �)

2�2Y + 2� (1� �)COV (X;Y ) (1.20)

Dado que eres averso al riesgo, tu elección óptima vendrá determinadapor la elección de la cartera de mínima varianza.

La condición de primer orden es

d�2Zd�

= 2��2X � 2 (1� �)�2Y + 2 (1� 2�)COV (X;Y )

Page 32: apuntes_2010

20 1. La Teoría de Elección en Condiciones de Incertidumbre

Utilicemos un atajo: veamos cuando el óptimo es la esquina � = 0 (esdecir, todos los huevos en la cesta Y ). Será óptimo cuando, a partir de lasituación � = 0 al aumentar � la varianza sea mayor. Es decir, cuando

d�2Zd�

�����=0

= �2�2Y + 2COV (X;Y ) > 0 (1.21)

COV (X;Y ) > �2Y

��X�Y > �2Y (1.22)

� >�Y�X

donde hemos utilizado la de�nición de coe�ciente de correlación

� =COV (X;Y )

�X�Y(1.23)

Conclusion 1 Si la correlación entre los dos activos �nancieros es losu�cientemente grande, entonces no se debe diversi�car la cartera deinversión. Es decir, debemos mezclar los activos siempre que no esténdemasiado correlacionados.

Por completitud te diré que el mixed óptimo interior viene dado por lasiguiente expresión

�� =�2Y � COV (X;Y )

�2Y + �2X � 2COV (X;Y )

(1.24)

Un grá�co aclarará un poco las cosas

VAR(X)

VAR(Y)

VAR(Z)

0 a*                             1a

Ejercicio 3 Demuestra el mix óptimo, veri�cando de paso la condición desegundo orden.

Ejemplo 2 (From Topics in Microeconomics, by Elmar Wolfstetter)Supongamos que la distribución conjunta de dos activos �nancieros X e

Page 33: apuntes_2010

1.4 Aplicaciones I: Un Modelo Básico de Selección de Cartera 21

Y es la siguiente

Prob. distrib. of returns

Prob (X,Y)Y=8 Y=16

PX=5 3/5 1/5 4/5X=30 3/20 1/20 1/5P

3/4 1/4 1

De los datos anteriores concluimos que

E (X) =4

5� 5 + 1

5� 30 = 10

E (Y ) =3

4� 8 + 1

4� 16 = 10

V AR (X) =4

5(5� 10)2 + 1

5(30� 10)2 = 100

V AR (Y ) =3

4(8� 10)2 + 1

4(16� 10)2 = 12

COV (X;Y ) =3

5(5� 10) (8� 10) + 1

5(5� 10) (16� 10) +

+3

20(30� 10) (8� 10) + 1

20(30� 10) (16� 10)

= 0

de donde

�� =�2Y � COV (X;Y )

�2Y + �2X � 2COV (X;Y )

=12

12 + 100' 0:1071 (1.25)

Es decir, cerca del 11% de la inversión total debería destinarse al activo deriesgo más alto.

Tiene todo el sentido del mundo que la diversi�cación dependa de lacorrelación entre los activos �nancieros. Se reduce el riesgo siempre quela correlación sea lo su�cientemente pequeña, como por ejemplo, cuandola correlación es cero o negativa. Para ver este caso más en profundidadestudiemos la elección óptima de la cartera de inversión cuando uno de losactivos �nancieros disponibles es el activo seguro.

1.4.2 La elección entre un activo seguro y un activoarriesgado.

Considera un inversor que debe decidir qué parte de su riqueza w invertir enun activo �nanciero con tasas de retorno (en exceso sobre el activo seguro)ri con probabilidades pi, i = 1; 2; :::; n. Sea � la parte de la riqueza invertidaen el activo �nanciero.

Page 34: apuntes_2010

22 1. La Teoría de Elección en Condiciones de Incertidumbre

Esto signi�ca que la riqueza del individuo viene representada por lasiguiente lotería

L :

8>>>>>><>>>>>>:

(w � �) + � (1 + r1) con probabilidad p1(w � �) + � (1 + r2) con probabilidad p2

� � � � � �(w � �) + � (1 + ri) con probabilidad pi

� � � � � �(w � �) + � (1 + rn) con probabilidad pn

Podemos escribir de forma formal el problema del consumidor de lasiguietne forma tan compacta

maxf�g

Pi piu (w + �ri)

s.t. 0 � � � w(1.26)

En lugar de construir el lagrangiano y complicarnos la vida con lascondiciones de Kuhn-Tucker, vamos a utilizar un viejo atajo: olvidarnosde la restricción, encontrar la solución y veri�car si la solución cumple larestricción.

La condición de primer orden es

dU (L)

d�=Xi

piu0 (w + �ri) ri

Veamos cuándo podemos descartar la solución esquina � = 0. Para ellosevaluemos la expresión anterior en � = 0.

dU (L)

d�

�����=0

=Xi

piu0 (w) ri = u

0 (w)Xi

piri

Observa queP

i piri es el rendimiento esperado del activo �nanciero.Por tanto, si es negativo, la utilidad esperada es decreciente en � = 0 y portanto no invertir nada en el activo �nanciero es el comportamiento óptimodel individuo.

Remark 10 Esto es evidente. Si no os gusta el riesgo, la elección entreuna riqueza segura y una menor riqueza esperada y encima con riesgo notiene color.

Centrémonos en el caso en el que el rendimiento esperado del activo�nanciero es positivo, i.e.

Pi piri > 0. Ahora si que no podemos saber a

priori el comportamiento del inversor porque ahora le damos a elegir entreuna riqueza segura y una riqueza esperada mayor pero con riesgo. Así pues,la cantidad a invertir dependerá de grado de aversión al riesgo del inversor.

Page 35: apuntes_2010

1.4 Aplicaciones I: Un Modelo Básico de Selección de Cartera 23

Las condiciones de primer y segundo orden son las siguientesXi

piu0 (w + ��ri) ri = 0 (1.27)

Xi

piu00 (w + ��ri) r

2i < 0 (1.28)

Observa que la de segundo orden se cumple sin problemas porque elinversor es averso al riesgo (u00 < 0). Por lo tanto, la condición de primerorden de�ne la cartera óptima del inversor.

Proposicion 2 Si la función de utilidad es DARA (Decreasing AbsoluteRisk Aversion), entonces los activos �nancieros son "bienes normales", esdecir, su demanda aumenta al aumentar la renta del inversor.

Demostracion. Vamos a utilizar el teorema de la función implícita paraobtener la variación de �� al variar w.

d��

dw= �@=@w

@=@�= �

Pi piu

00 (w + ��ri) riPi piu

00 (w + ��ri) r2i(1.29)

Queremos demostrar d��

dw > 0 y sabemos que el denominador es negativo(risk aversion). Entonces necesitamos mostrar que el numerador es positivo.X

i

piu00 (w + ��ri) ri > 0 (1.30)

Este signo es ambiguo porque aun cuando u00 sea negativa, la rentabilidadpuede ser negativa o positiva. Vamos a ir estudiando cada sumando anterioren función de si la rentabilidad es positiva o negativaSi ri es positiva entonces

RA (w) > RA (w + ��ri) (1.31)

RA (w)u0 (w + ��ri) ri > �u00 (w + ��ri) ri

u00 (w + ��ri) ri > �riRA (w)u0 (w + ��ri)Si ri es negativa entonces

RA (w) < RA (w + ��ri) (1.32)

RA (w)u0 (w + ��ri) ri > �u00 (w + ��ri) ri

u00 (w + ��ri) ri > �riRA (w)u0 (w + ��ri)Utilizando (1:31) y (1:32) en (1:30) obtenemos lo siguienteX

i

piu00 (w + ��ri) ri > �

Xi

piriRA (w)u0 (w + ��ri) (1.33)

= �RA (w)Xi

piriu0 (w + ��ri)| {z }foc

(1.34)

= 0 (1.35)

Page 36: apuntes_2010

24 1. La Teoría de Elección en Condiciones de Incertidumbre

1.5 Aplicaciones II: Un Modelo Básico deDemanda de Seguros

Esta sección está escrita para que realmente entiendas cómo la demandade seguros proviene de las preferencias por el riesgo. Y la clave para ello espensar en el seguro como un bien contingente.

De�nicion 8 Bien Contingente: Bien que compras hoy pero que sóloconsumes si se da determinado estado de la naturaleza.

Así, cuando compras un seguro estás comprando una compensaciónmonetaria que sólo puedes reclamar si un determinado estado de lanaturaleza se realiza. Obviamente, la decisión de asegurarte la tomas antesde que se realice el estado del mundo.

Ahora quiero que pienses en dos estados del mundo: el bueno y el malo(nos falta el feo, pero es que quiero dibujar en dos dimensiones). La ideaes dibujar curvas de indiferencia en dicho espacio. Para ello considera elsiguiente ejemplo:

Estados de la NaturalezaMalo Bueno

Riqueza 40 120Probabilidad 0,25 0,75

Riqueza Esperada 0,25x40+0,75x120=100

Lo primero que vamos a hacer es calcular las distintas combinaciones(riqueza BUENO, riqueza MALO) que proporcionan al consumidor lamisma riqueza esperada 100.

100 = 0; 25m+ 0; 75b

m =100

0; 25� 0; 750; 25

b

m = 400� 3b

Page 37: apuntes_2010

1.5 Aplicaciones II: Un Modelo Básico de Demanda de Seguros 25

Como ves es una línea recta con ordenada en el origen 400 y pendiente�3.

RiquezaMALO

RiquezaBUENO

120

40 E: Situación inicial

Línea iso­riquezaesperada (100)

400

E+

133,3

Piensa ahora en un individuo averso al riesgo y recuerda que esteindividuo, a igualdad de riqueza esperada, pre�ere las loterías que tienenmenor varianza. Por eso, este individuo preferirá la situación E+ frentea su situación inicial y no preferirá la situación E� frente a su situacióninicial. Es decir, las curvas de indiferencia de un individuo averso al riesgose curvan hacia el origen en el diagrama (riqueza BUENO, riqueza MALO);es decir, son convexas.

Imaginemos que existen mercados de seguros actuarialmente justos; esdecir, mercados en los que el precio iguala a la compensación esperada.¿Cuál será dicho precio?

� El bien �1 euro en el estado malo�tiene un precio hoy de 0,25 euros,es decir, antes de que el estado del mundo se revele.

� El bien �1 euro en el estado bueno�tiene un precio hoy de 0,75 euros,es decir, antes de que el estado del mundo se revele.

Fíjate en que estos precios no son sino las probabilidades de los estadosdel mundo. . . Bien, veamos cuales son las consecuencias que se derivan paraeste individuo de la existencia de los mercados de seguros. Ya te adelantoque va a ser la posibilidad de trasvasar riqueza entre estados del mundo.Veamos cómo funciona.

La situación inicial es (120; 40). Este individuo podría vender hoy el bien�1 euro en el estado bueno� al precio 0; 75 euros y dedicar ese dinero acomprar el bien �3 euros en el estado malo�. Fíjate en que ha trasvasado

Page 38: apuntes_2010

26 1. La Teoría de Elección en Condiciones de Incertidumbre

riqueza del estado bueno al estado malo. . . ahora estaría en la situación(119; 43).

Podría seguir así y situarse en situaciones (118; 46), (117; 49),. . . es decir,la existencia de los mercados de seguros actuarialmente justos le permitepoder trasvasar riqueza entre estados a una relación de intercambio de3. ¿Dónde hemos visto nosotros antes ese 3? Pues en la línea iso-riquezaesperada. . . La línea de iso-riqueza no es sino la línea de intercambioactuarialmente justo cuya pendiente es PBueno=PMalo.

Así pues, la decisión del consumidor es en qué punto de la línea deintercambio actuarialmente justo situarse. Evidentemente en aquel que seael más preferido, es decir, el que le proporcione mayor nivel de utilidad.

Todas las loterías disponibles tienen algo en común: proporcionan unmismo nivel de riqueza esperado (100) y algo en lo que se diferencian:la varianza. Pues bien, de todas ellas sólo una no tiene ningún riesgo; esdecir, sólo hay una en la que la riqueza en el estado bueno coincide conla riqueza en el estado malo: (100; 100). ¡¡Esta es la solución!! ¡¡Asegurarsecompletamente!!

Grá�camente la situación sería la siguiente:

RiquezaMALO

RiquezaBUENO

120

40 E: Situación inicial

Línea de intercambioactuarialmente justo

(pendiente Pbueno/Pmalo)

Línea de 45 grados

¡¡ Tangencia !!

Analizar la demanda de seguro desde la perspectiva de los bienescontingentes nos permite entender algo muy importante:

Conclusion 2 La decisión óptima es cobertura completa independiente-mente del grado de aversión al riesgo del consumidor. Lo relevante es laconcavidad de la función de utilidad, no el grado de concavidad.

Si te gusta la formalización -para no perder el hábito de todos estosaños estudiando micro- y quieres ver en acción relaciones marginales desustitución y precios relativos, entonces fíjate en lo siguiente.

Page 39: apuntes_2010

1.6 Apéndice 27

El conjunto de intercambio justo entre estados de la naturalezapuede entenderse como una "restricción presupuestaria" con pendiente� PBueno1�PBueno .

La utilidad asociada a la lotería inicial del consumidor es

U (L) = PBuenou (wBueno) + (1� PBueno)u (wMalo)

Así pues, las curvas de indiferencias tienen una pendiente determinadapor la siguiente expresión

dU = 0 = PBuenou0 (wBueno) @wBueno + (1� PBueno)u0 (wMalo) @wMalo

@wMalo

@wBueno= � PBueno

1� PBuenou0 (wBueno)

u0 (wMalo)< 0

Ya hemos visto grá�camente que en el óptimo tenemos que la riqueza enlos dos estados del mundo son iguales, es decir, wBueno = wMalo = w, yesto implica

@wMalo

@wBueno= � PBueno

1� PBuenou0 (w)

u0 (w)= � PBueno

1� PBueno

Es decir, que la curva de indiferencia sea tangente a la "restricciónpresupuestaria".

El análisis que hemos realizado en esta sección ha sido un análisis un pocoraro, puesto que hemos supuesto la existencia de un mercado de seguros. Loúnico que hemos mostrado es que si existe el mercado de seguros entoncesun agente averso al riesgo querrá, en las condiciones de nuestro modelo,asegurarse completamente. Ahora bien, ¿de verdad que si todos somosaversos al riesgo surgirá un mercado de seguros? El segundo problemade la hoja de ejercicios está pensado como una posible respuesta a esteinterrogante.

1.6 Apéndice

1.6.1 Kahneman and Tversky (1979): Prospect Theory

La teoría de la utilidad esperada se basa en tres principios básicos

1. Expectations: The ultimate evaluation of a prospect is given by theexpected utility of its outcomes.

2. Asset integration: The prospect (p0; c0; : : : ; pi; ci; : : : ; p; c) isacceptable at asset position w i¤ U(p0; c0 + w; : : : ; pi; ci +w; : : : ; p; c + w) > u (w).

Page 40: apuntes_2010

28 1. La Teoría de Elección en Condiciones de Incertidumbre

3. Risk aversion: u (�) is concave, i.e. u00 (�) < 0.

Daniel Kahneman y Amos Tversky demuestran experimentalmente queen muchas situaciones estos principios básicos son violados y proponen unmodelo alternativo para describir la elección bajo incertidumbre: ProspectTheory. Según esta teoría, el proceso de selección de loterías tiene dosfases:

1. Editing Phase (edición de los prospectos). Durante esta fase,los decision makers realizan una representación simpli�cada de losprospectos. (Muchas de las violaciones de la expected utility serealizan en esta fase)

2. Evaluating Phase (valoración de los prospectos). A partir dela representación simpli�cada de la fase de edición, los individuosvaloran cada prospecto y escogen el que tenga mayor valoración. Lafunción valor se compone de dos escalas: � (�) and v (�).

(a) La primera escala � (�) asociada a cada probabilidad p unpeso � (p) que no es una probabilidad (lo más normal es que� (p)+� (1� p) < 1)

(b) La segunda escala v (�) ofrece una valoración subjetiva de cadaresultado.

i. Se de�ne sobre pérdidas y ganancias en relación a algúnpunto de referencia (Focus on changes rather than wealthlevels as in expected utility theory re�ects the nature ofmental accounting: transactions are often evaluated step bystep rather than in conjunction with everything else)

ii. Both the gain and loss functions display diminishingsensitivities, i.e. the gain function is concave whereas theloss function is convex. (Este es un principio psicológico muybien establecido, a saber, que la diferencia entre 10C= y 20C=es percibida como mayor que la diferencia entre 1000C= y1010C=, independientemente de si son ganancias o pérdidas)

iii. Loss aversion: Losing 100C= hurts more than gaining C=100yields pleasure (v (x) < �v (�x)). (This might re�ect a basichuman mechanism: it is easier to make people unhappy thanhappy).

Page 41: apuntes_2010

1.6 Apéndice 29

Page 42: apuntes_2010

30 1. La Teoría de Elección en Condiciones de Incertidumbre

Page 43: apuntes_2010

This is page 31Printer: Opaque this

2Juegos con Información Perfecta

2.1 Introducción

En este tema empezamos con el estudio de situaciones en las que existeinterdependencia estratégica, es decir, lo que tú haces afecta a mibienestar, lo que yo hago afecta a tu bienestar, y los dos lo sabemos. Demomento, solamente hablaremos de juegos no cooperativos con informaciónperfecta y completa. El tema de la información imperfecta es tratado en elpróximo capítulo.

1. No cooperativos: Ningún tipo de acuerdo entre los jugadores esvinculante -es decir, puede ser llevado ante los Tribunales con éxito.

2. Información perfecta: Cualquier jugador, a la hora de elegir,conoce toda la historia del juego -es decir, todas las acciones pasadastomadas por jugadores que han elegido antes que él.

3. Información completa: Las funciones de pago de todos losjugadores son conocimiento común.

Es posible que toda esta jerga no te diga nada en estos momentos. Esperoque la situación sea distinta al �nal del tema 3 porque en caso contrario,estás perdido, forastero...

Page 44: apuntes_2010

32 2. Juegos con Información Perfecta

2.2 Representación estratégica de un juego

La representación en forma estratégica de un juego especi�ca los siguienteselementos:

1. Los jugadores del juego: En general, tendremos n jugadores. Unjugador genérico vendrá denotado por i, y por tanto diremos i =1; :::; n.

2. Las estrategias de las que dispone cada jugador. El conjunto deestrategias del jugador i vendrá denotado por Ai.

3. Los pagos para cada jugador en cada combinación posible deacciones. El pago para el jugador i viene denotado por ui (a1; :::; an),donde ui es una función de A1 � ::: � An a R: Es decir, ui :A1 � :::�An ! R.

Todo lo anterior motiva la siguiente de�nición

De�nicion 9 La representación en forma estratégica de un juego con njugadores especi�ca los espacios de estrategias de los jugadores, A1; :::; Any sus funciones de pagos u1; :::; un. Denotaremos estos juegos con G =fA1; :::; An;u1; :::; ung.

Ejemplo 3 TV Show. Imagínate que vas a un concurso de televisiónde los que hay ahora, de esos para intelectuales. Te enfrentas a otroconcursante y tu misión consiste en elegir un color, o bien rojo o bienazul. Si coincide con el color que previamente ha elegido de forma secretatu rival, entonces cada uno ganáis un millón de euros. En caso contrario,es decir, si no coincide con el color elegido por tu rival, entonces ganáiscero. Representa el juego en forma estratégica.

(i) Jugadores: Dos, tú y tu rival.

(ii) Espacio de estrategias: Es el mismo para los dos jugadores, Ai={Rojo,Azul} for i = 1; 2.

(iii) Función de pagos: ui (ai; aj) =�1 Millón euros si ai = aj0 Millones de euros si ai 6= aj

for i; j = 1; 2, j 6= i.

Toda esta información queda resumida de la siguiente forma en la matrizdel juego

ELRojo Azul

TU Rojo 1,1 0,0Azul 0,0 1,1

Page 45: apuntes_2010

2.2 Representación estratégica de un juego 33

Ahora bien, si quieres el típico ejemplo de teoría de juegos, entonces tere�eres al Dilema de Presos.

Ejemplo 4 Dilema de Presos. Dos ladrones son detenidos en relacióna una investigación sobre un robo. La policía no tiene evidencia su�cientepara condenar a los sospechosos a menos que uno de ellos con�ese el robo.Los encierra en celdas separadas y les explica las consecuencias derivadasde las decisiones que tomen. Si ninguno de ellos con�esa, ambos seráncondenados por un delito menor a 3 años de cárcel. Si ambos con�esan,entonces serán sentenciados a 10 años de cárcel. Finalmente, si uno deellos con�esa y el otro no, el primero se bene�ciará de una reducción depena por colaborar con la justicia y será puesto en libertad inmediatamente,mientras que el segundo será condenado a 15 años de cárcel.

(i) Jugadores: Dos presos, el preso 1 y el preso 2.

(ii) Espacio de estrategias: Ambos presos tienen el mismo espacio deacciones Ai = A = fCallar, Confesarg for i = 1; 2.

(iii) Función de pagos:

ui (ai; aj) =

8>><>>:3 años si ai =Callar and aj=Callar15 años si ai =Callar and aj=ConfesarLibertad si ai =Confesar and aj=Callar10 años si ai =Confesar and aj=Confesar

for i = 1; 2.

J2Callar Confesar

J1 Callar 3 años, 3 años 15 años, LibertadConfesar Libertad, 15 años 10 años, 10 años

Ejemplo 5 Beauty Contest. En un grupo de personas, cada una de ellasdebe decir un número mayor que 0 y menor que 100 (ambos inclusive).Ganará una cerveza el que adivine dos tercios del número medio.

� Jugadores: n jugadores, con n > 2

� Espacio de estrategias: Si = S = [0; 100] for all i.

� Función de pagos: ui (si; s�i) =�

Cervezag if

��si � 2s3

�� � ��sj � 2s3

�� for all j 6= i0 otherwise

donde g es el número de ganadores.

Page 46: apuntes_2010

34 2. Juegos con Información Perfecta

RIVAL

Rojo Azul

TU TU

ROJO         AZUL         ROJO        AZUL

1          0                    0          1

1          0                    0          1

2.3 Representación en forma extensiva de un juego

Cuando representamos una situación estratégica en forma extensiva,entonces debemos especi�car un montón de elementos más:

1. La lista de jugadores.

2. El árbol del juego.

3. Una asignación de los nodos de decisión a los jugadores.

4. Las listas de acciones disponibles en cada nodo de decisión y unacorrespondencia entre los inmediatos sucesores de cada nodo dedecisión y las acciones disponibles.

5. Los conjuntos de información; es decir, qué conoce el individuo acercade las acciones que han tomado sus rivales en nodos previos al suyo.

6. Una asignación de pagos para cada jugador en cada nodo terminal (ylas probabilidades asignadas a los nodos iniciales y a las acciones entodo nodo asignado a la naturaleza).

¿Por qué es más complicado que la forma estratégica o normal? Puesporque ahora queremos especi�car ciertos elementos que no aparecían deforma explícita en la forma estratégica: el orden de juego y, lo que es másimportante, lo que conocen los jugadores cuando les toca jugar.

Ejemplo 6 TV Show Revisited. Supongamos que durante un intermediodel concurso de televisión te camelas al presentador (¿JV?) y logras cambiarlas reglas del concurso: ahora, antes de elegir te comunican el color elegidopor tu rival. Representa este nuevo concurso en forma extensiva.

Page 47: apuntes_2010

2.3 Representación en forma extensiva de un juego 35

Grupoterrorista

Kidnap                    Do not kidnap

US Congress

Negociar No negociar

00

2­1

­2­2

Ejemplo 7 Armed Group. (Based on Macartan Humphreys� GameTheory Course Notes, Sept. 2005). Un grupo terrorista está pensando ensecuestrar al presidente de EEUU. En caso de secuestro, el Congreso deEEUU debe decidir si negociar con los secuestradores (en cuyo caso lossecuestradores consiguen sus objetivos y el presidente es dejado libre perocon la consiguiente conmoción para el país) o no negociar (en cuyo caso,se produce un enfrentamiento armado que se salda con la muerte de losterroristas y el presidente). En caso de no secuestro, no pasa nada (nuncamejor dicho). Represente el juego en forma extensiva, explicitando unafunción de pagos que recoja "�elmente" la valoración del grupo terroristay del US Congress sobre los posibles resultados del juego.

Ahora que has visto dos formas distintas de representar un juego, seguroque te estás preguntando por la relación que hay entre ellas. En términosgenerales se cumple el siguiente principio:

Proposicion 3 Para cualquier juego en forma extensiva existe un juegocorrespondiente en forma estratégica, donde consideramos que los jugadoreseligen sus estrategias de forma simultánea. Sin embargo, para un juego enforma estratégica existen múltiples juegos en forma extensiva.

Este principio general nos lleva a la siguiente cuestión: Siempre quequeramos modelizar una situación económica por medio de un juego,podemos elegir o bien su representación en forma estratégica, o bien surepresentación en forma extensiva. ¿Cuál debemos elegir? La respuesta aesta pregunta no la busques ni en este capítulo ni en ningún libro de Teoríade Juegos, puesto que dependerá de la situación que estemos considerando.Si creemos que toda la información relevante sobre la situación económicaviene recogida en la forma estratégica del juego, entonces estamos

Page 48: apuntes_2010

36 2. Juegos con Información Perfecta

aceptando implicitamente que no hay diferencia sustancial entre losdiferentes juegos extensivos asociados.

Ejercicio 4 (i) Considera el juego del concurso de televisión en su primeraversión. Halla la forma extensiva asociada y (ii) Considera ahora susegunda versión. Halla su forma estratégica asociada.

2.4 Conceptos de solución. Nociones generales.

Una vez especi�cados los jugadores, estrategias, orden de juego, informacióny relación de preferencia sobre el conjunto de resultados, quizá te preguntespor el objetivo de tal ejercicio. En general, la �nalidad es encontrar lasolución del juego y describir sus propiedades.

Por concepto de solución nos referimos a una regla para predecir elcomportamiento de los jugadores en el juego. Con todo el formalismo delque soy capaz, sea � el conjunto de todos los juegos y sea B el conjunto detodos los comportamientos. Pues bien, un concepto de solución es

� : �! B (2.1)

una correspondencia que va desde el conjunto de todos los juegos hasta elconjunto de todos los comportamientos posibles.

La pregunta del millón es: ¿cómo elegimos entre los distintos conceptosde solución? porque claro, conceptos de solución hay muchos. Considerapor ejemplo la correspondencia �r que asocia a cada juego el per�l deacciones formado por la primera estrategia de cada jugador.

Es una tautología decir que nos quedamos con la mejor porque lagracia del asunto está en la propia de�nición de "mejor" solución, quenecesariamente debe conjugar alguna/s de las siguientes propiedades

� Existencia: Que esté de�nida para todo juego.

� Sentido: � (�) sea razonable de acuerdo a algún criteriopreestablecido.

� Unicidad: Que sea una función en lugar de una correspondencia.

� Robustez: Que cambios irrelevantes en el juego no cambien lapredicción.

� Parsimonia: Que haga pocos supuestos acerca de los jugadores.

Ni que decir tiene que las distintas soluciones que veremos a lo largodel curso no satisfacen todas estas propiedades, sino que en todas ellashay un trade-o¤ entre distintas propiedades. Es por tanto una buena idea

Page 49: apuntes_2010

2.5 Conceptos de solución para juegos en forma estratégica 37

que conforme vayamos analizando distintas soluciones vayas veri�cando quépropiedades sacri�ca el concepto de solución.

Lo que sí van a compartir (casi) todos los conceptos de solución queestudiemos este curso es el criterio de "razonable" del comportamiento:éste debe ser acorde al criterio de racionalidad de los agentes económicos:la maximización de la utilidad (esperada, que para eso hemos estudiado eltema 1).

2.5 Conceptos de solución para juegos en formaestratégica

En esta sección veremos varios conceptos de solución para juegos en formaestratégica

1. Dominancia iterada.

2. Estrategias racionalizables.

3. Equilibrio de Nash.

La literatura sin embargo contiene una enorme variedad de conceptos,algunos de los cuales aparecen en el Apéndice de este tema. Échale unvistazo si te llama la atención.

2.5.1 Dominancia iterada

El primer concepto de solución se basa en la existencia de estrategiasestrictamente dominadas.

De�nicion 10 Estrategias estrictamente dominadas. En el juegorepresentado en forma estratégica G = fS1; :::; Sn;u1; :::; ung, sean s0i y s00idos estrategias del jugador i. La estrategia s0i está estrictamente dominadapor la estrategia s00i si para cada combinación posible de las estrategias de losrestantes jugadores, el pago para el jugador i por utilizar s0i es estrictamentemenor que el pago por utilizar s00i , es decir

ui (s0i; s�i) < ui (s

00i ; s�i) para todo s�i

Es débil si alguna desigualdad no es estricta.

A partir de esta de�nición, podemos plantear el primer concepto desolución de un juego en forma normal.

De�nicion 11 El conjunto de estrategias que sobreviven al proceso deeliminación iterativa de estrategias estrictamente dominadas.

Page 50: apuntes_2010

38 2. Juegos con Información Perfecta

Ejemplo 8 Prisoners� Dilemma. Considera el dilema de presos.Observa que para cada jugador la estrategia CALLAR está estrictamentedominada por la estrategia CONFESAR. Por tanto, una solución para eldilema de presos es la estrategia CONFESAR.

J2Callar Confesar

J1 Callar 3 años, 3 años 15 años, LibertadConfesar Libertad, 15 años 10 años, 10 años

Piensa ahora en las propiedades que satisface este primer concepto desolución. Nos lleva al mismo resultado independientemente del orden enel que se eliminen las estrategias. Cierto es que en juegos simples, comoel dilema de presos, este criterio nos ofrece una solución única, pero engeneral no será el caso. Cierto es que en juegos simples, como el dilemade presos, el único supuesto es el de racionalidad de los jugadores, pero engeneral necesitaremos asumir que la racionalidad de los agentes económicoses conocimiento común.

De�nicion 12 Algo es conocimiento común si todos los jugadores losaben, todos saben que todos lo saben, todos saben que todos saben quetodos los saben,... y así ad in�nitum.

La formalización del concepto de conocimiento común recayó en RobertAumann quien en 1976 publicó el artículo "Agreeing to Disagree". Paraque veas la importancia de este concepto, piensa en la siguiente situación.

Ejemplo 9 Rural Village. (From "A Mathematician plays the StockMarket", by John Allen Paulos). En un pueblo hay varias parejas casadasy cada mujer sabe inmediatamente cuándo el marido de otra ha sido in�el,pero no cuándo lo ha sido el suyo propio. Las normas del pueblo permitenmatar al marido ese mismo día siempre y cuando pueda demostrar suin�delidad. Supongamos que la racionalidad de las mujeres del pueblo esconocimiento común y que nunca informan a las demás mujeres de losdevaneos de sus maridos (o bien no es una prueba lo su�cientementesólida). Supongamos que 20 hombres han sido in�eles, pero que nadie puededemostrarlo. Sin embargo, el 1 de marzo llega el gurú de una ciudad vecinaque tiene una credibilidad a prueba de bombas; es decir, su palabra es ley.Reúne a los habitantes del pueblo y dice: "entre vosotros hay por lo menosun in�el". ¿Qué ocurre en el pueblo? Pues durante 10 días no pasa nada...pero el 20 de marzo, 20 hombres son asesinados por sus respectivas mujeres.

El siguiente ejercicio te muestra que hay casos en el que el hecho de quela racionalidad de los agentes sea conocimiento común no nos lleva muylejos.

Ejercicio 5 Fun and Games II. (From "Fun and Games" byKenneth Binmore) Demuestra que el procedimiento de eliminación

Page 51: apuntes_2010

2.5 Conceptos de solución para juegos en forma estratégica 39

iterada de estrategias estrictamente dominadas no selecciona un únicocomportamiento en el siguiente juego en forma estratégica

u vx 3,6 7,1y 5,1 8,0z 6,0 6,2

Fíjate en que de momento sólo hemos hablado de estrategiasestrictamente dominadas. Lo hemos hecho porque eliminar estrategiasdébilmente dominadas tiene sus riesgos... Te darás cuenta cuando hagasla hoja de ejercicios correspondiente a este tema.

2.5.2 Estrategias racionalizables

Es cierto que el que la racionalidad de los agentes económicos seaconocimiento común justi�ca la eliminación iterada de estrategiasestrictamente dominadas, y es más, nos dice algo más.

De�nicion 13 Una estrategia �i es mejor respuesta a las estrategias delos rivales ��i si

ui (�i; ��i) � ui (b�i; ��i) for all b�iSe dice que la estrategia �i es nunca una mejor respuesta si no existe��i tal que �i es mejor respuesta.

De�nicion 14 El conjunto de rationalizable strategies es el conjuntode estrategias que sobreviven a la eliminación de estrategias que nunca sonmejores respuesta.

Remark 11 Este concepto de racionalización fue desarrollado en 1984,de forma independiente por Bernheim y Pierce y se basa en el siguienteprincipio mínimo: "Yo, jugador i, elijo jugar �i porque creo que el jugadorj va a elegir �j porque cree que yo voy a jugar �0i porque ... " y así hastael in�nito.

Proposicion 4 El conjunto de estrategias racionalizables

1. Siempre existe.

2. No depende del orden de eliminación.

3. Puede calcularse en tiempo �nito (para juegos �nitos).

4. Es un subconjunto del conjunto de estrategias que sobreviven a laeliminación iterada de estrategias estrictamente dominadas.

5. No suele seleccionar un único resultado.

Page 52: apuntes_2010

40 2. Juegos con Información Perfecta

2.5.3 Equilibrio de Nash

Quizá el concepto de solución más conocido para juegos en formaestratégica sea el concepto de equilibrio de Nash, propuesto por John Nashen su tesis doctoral en el departamento de Matemáticas de Princeton aprincipios de la década de los 50.

De�nicion 15 A pro�le of strategies (a�1; :::; a�n) is a Nash Equilibrium

if for each i 2 Na�i 2 argmax

ai2Ai

ui�ai; a

��i�

Loosely speaking, a Nash equilibrium is a pro�le of strategies such thatstrategies are mutual best responses. Como es tan importante para eldesarrollo del curso, ahora la pongo en español.

De�nicion 16 Sea G = fS1; :::; Sn;u1; :::; ung un juego en forma normal oestratégica. El per�l de estrategias (s�1; s

�2; :::; s

�n) es un equilibrio de Nash si

para cada jugador i, s�i es su mejor respuesta a las estrategias de equilibriode los demás jugadores. Es decir

ui�s�i ; s

��i�� ui

�si; s

��i�para todo si 2 Si

Otra forma alternativa de escribirlo es la siguiente

s�i 2 argmaxfsigui�si; s

��i�

El propio Nash en su tesis doctoral ofreció el siguiente teorema deexistencia.

Teorema 2 Sea G = fS1; :::; Sn;u1; :::; ung un juego con informacióncompleta y perfecta. Si el número de jugadores n es �nito y el espaciode estrategias para cada jugador es �nito, entonces existe al menos unequilibrio de Nash.

Demostracion. No.Cuando John Nash le contó su noción de equilibrio a John Von Neumann,

éste dijo �Ah, sólo es un punto �jo�. Why? La clave es la siguiente:Utilicemos las funciones de mejor respuesta para, partiendo de un per�l

de estrategias (mixtas), asignar a cada jugador su mejor respuesta alas estrategias de los demás. Fíjate en que acabamos con otro per�l deestrategias. Si coincide el per�l con el que partimos con el per�l al quellegamos, entonces tenemos un equilibrio de Nash. ERGO: Sólo necesitamosdemostrar la existencia de ese punto �jo utilizando algún teorema deexistencia de puntos �jos: Teorema de Brower, de Kakutani...

De�nicion 17 Teorema del Punto Fijo de Brower. Sea f (�) unafunción continua y K un conjunto convexo y compacto. Entonces, f (�) :K ! K tiene un punto �jo, i.e. f (x) = x.

Page 53: apuntes_2010

2.5 Conceptos de solución para juegos en forma estratégica 41

Grá�camente la cosa se ve claramente

Con la ayuda de estos grá�cos es relativamente fácil entender por qué senecesitan todas las condiciones del teorema del punto �jo de Brower.

Page 54: apuntes_2010

42 2. Juegos con Información Perfecta

Veamos ahora cómo se relaciona este concepto de solución con los vistosanteriormente. Las dos siguientes proposiciones, también demostradas porNash, clari�can el asunto:

Proposicion 5 En el juego en forma estratégica G = fS1; :::; Sn;u1; :::; ung,si la eliminación iterativa de estrategias estrictamente dominadas elim-ina todos los per�les de estrategias menos uno, éste último es precisamenteun equilibrio de Nash.

Proposicion 6 En el juego en forma estratégica G = fS1; :::; Sn;u1; :::; ung,si las estrategias (s�1; s

�2; :::; s

�n) forman un equilibrio de Nash, entonces tales

estrategias sobreviven a la eliminación iterativa de estrategias estricta-mente dominadas.

Proposicion 7 The set of rationalizable strategies is a subset of the setof strategies that survive the iterated elimination of dominated strategies.Also, Nash equilibrium strategies are a subset of rationalizable strategies.

Bueno, ya que has visto cómo se calculan los equilibrios de Nash de unjuego, practica un poco con el siguiente juego estilizado de lanzamiento depenalties.

Ejemplo 10 Penalty shot. Un portero frente a un delantero. El delanteroelige hacia qué lado de la portería tirar el balón (izquierda o derecha) y elportero elige hacia qué lado de la portería tirarse (izquierda o derecha). Enel caso en el que ambos jugadores decidan el mismo lado, el portero parael penalty mientras que si balón y portero van a palos distintos entonces esgol. La representación en forma estratégica de este juego es la siguiente

ForwardL R

Goalie L 1,-1 -1,1R -1,1 1,-1

El conjunto de estrategias puras del portero es SPortero = fL;Rg mientrasque el conjunto de estrategias puras para el delantero es SDelantero =fL;Rg. Para calcular el equilibrio de Nash calculemos las funciones demejores respuestas de cada jugador.

MRPortero (L) = L

MRPortero (R) = R

MRDelantero (L) = R

MRDelanterio (R) = L

En la matriz de pagos están señaladas en negrita. Y como verás, no hayningún per�l de estrategias que sean mejores respuestas mutuas. ¿Por qué?Pues porque los intereses de los jugadores son perfectamente opuestos (poreso no puede haber un equilibrio de Nash en estrategias puras).

Page 55: apuntes_2010

2.6 Estrategias mixtas 43

Ahora bien, hemos visto antes que todo juego �nito (jugadores �nitos,espacio de estrategias �nito) con información perfecta y completa tiene unequilibrio de Nash. ¿Dónde está el equilibrio del penalty?

La siguiente sección te lo clari�ca.

2.6 Estrategias mixtas

Ya has sufrido en tus carnes el problema de restringirse a estrategias puras:a veces no existen estrategias puras de equilibrio. Para entender el equilibriode Nash y su poderío en toda su extensión, necesitamos ampliar la nociónde estrategia.

Notación 1 El espacio de estrategias puras para el jugador i se representapor Si y un elemento, es decir, una estrategia pura para el jugador i serepresenta por si. El espacio de estrategias mixtas se representa �Si y unelemento (una estrategia mixta) por �i.

De�nicion 18 Un típico per�l de estrategias puras puede escribirse s 2S1 � :::� Sn. Entonces, bajo el supuesto de randomización independiente,la utilidad esperada para un jugador dada la estrategia mixta � es

ui��i; �

��i�=

Xs2S1�:::�Sn

p (s)u (s) =X

s2S1�:::�Sn

Yi2N

�i (si)u (s)

Remark 12 El supuesto básico es que los jugadores eligen de formaindependiente sus estrategias, ya sean puras o mixtas, antes de jugar. Unavez elegida, los jugadores la utilizan en el juego.

Ahora ampliaremos la noción de equilibrio de Nash para el caso deestrategias mixtas, aunque la idea es la misma: buscamos per�les deestrategias que sean mejores respuestas mutuas, aunque claro, en el mundode las estrategias mixtas los jugadores utilizan la utilidad esperada.

De�nicion 19 El per�l de estrategias (��1; ��2; :::; �

�n) es equilibrio de Nash

si��i 2 arg max

�2�Siui��i; �

��i�

Vale, no hay nada como practicar un poco para entender las cosas, asíque vamos a calcular el equilibrio del lanzamiento de penalty.

Ejemplo 11 Penalty shot revisited. Una estrategia mixta para elportero es una distribución de probabilidad de�nida sobre su espacio deestrategias puras fL;Rg. En este caso sea (1� p; p) en donde p es laprobabilidad de que el portero se tire a la derecha. De la misma forma,una estrategia mixta para el delantero es una distribución de probabilidad

Page 56: apuntes_2010

44 2. Juegos con Información Perfecta

de�nida sobre su espacio de estrategias puras fL;Rg. En este caso, sea(1� q; q) en donde q es la probabilidad de que el delantero tire a la derechael penalty.

Forward1� q q

Goalie 1� p 1,-1 -1,1p -1,1 1,-1

Observa que cada estrategia mixta de cada jugador se corresponde con unnúmero real en el intervalo [0; 1] por lo que cada per�l de estrategias mixtasdel juego se corresponde con un punto (p; d) en [0; 1]2. ¡¡Eso tiene su graciaporque las estrategias mixtas en juegos 2x2 se pueden dibujar!!Calculemos, al igual que en el caso de estrategias puras, las

correspondencias de mejores respuestas para cada uno de los jugadores.Empecemos por el portero. Se enfrenta a un delantero que utiliza unaestrategia mixta �Del : (1� q; q). Por tanto

EU (L) = (1� q) (1) + q (�1) = 1� 2qEU (R) = (1� q) (�1) + q (1) = �1 + 2q

Como ya sabemos que el portero es racional, elegirá la dirección quemamixice su utilidad esperada

EU (L)� EU (R) = 1� 2q � (�1 + 2q)= 2 (1� 2q)

Por tanto, la correspondencia de mejor respuesta es la siguiente

MRPortero (�Del) =

8<: p = 0 q � 12

p 2 [0; 1] q = 12

p = 1 q � 12

Esta correspondencia de mejor respuesta ya la sabíamos... el portero, quequiere parar el penalty, quiere tirarse al sitio que con mayor probabilidaddispare el delantero. Bien, hagamos los mismos cálculos para el delantero.Se enfrenta a un portero que utiliza la siguiente estrategia mixta �Por :(1� p; p). Por tanto

EU (L) = (1� p) (�1) + p (1) = �1 + 2pEU (R) = (1� p) (1) + p (�1) = 1� 2p

Como ya sabemos que el portero es racional, elegirá la dirección quemamixice su utilidad esperada

EU (L)� EU (R) = �1 + 2q � (1� 2q)= 2 (2q � 1)

Page 57: apuntes_2010

2.6 Estrategias mixtas 45

Por tanto, la correspondencia de mejor respuesta del delantero es lasiguiente

MRDel (�Por) =

8<: q = 1 p � 12

q 2 [0; 1] p = 12

q = 0 p � 12

Esta correspondencia de mejor respuesta ya la sabíamos... el delantero,que quiere marcar gol, quiere disparar al lado contrario al que con mayorprobabilidad se tire el portero. Una vez calculadas las correspondenciasde mejores respuestas, debemos encontrar las estrategias mixtas queson mejores respuestas mutuas, es decir, aquellas para las que lascorrespondencias de mejores respuesta se cortan. Y para ello, un grá�coes lo mejor

p

q

0

Curva de reaccióndel portero

Curva de reaccióndel portero

Equilibriode Nash

Penalty shot

Fíjate en el equilibrio mixto que acabas de encontrar. Y fíjate en lo curiosoque es... cada jugador elige la dirección con la misma probabilidad: 50%.

¿Qué tienen de especial los equilibrios en estrategias mixtas? Pues que enellos, cada jugador es indiferente entre cualesquiera estrategias puras sobrelas que está randomizando. Esto es importante porque ilustra un principiogeneral y nos da un atajo para encontrar equilibrios de Nash en estrategiasmixtas.

Claim 1 Una estrategia mixta es mejor respuesta a algo si y solo si cadauna de las estrategias puras a las que asigna probabilidad positiva es tambiénmejor respuesta a la misma cosa. Un jugador que optimiza usando unaestrategia mixta necesariamente será indiferente entre todas las estrategias

Page 58: apuntes_2010

46 2. Juegos con Información Perfecta

puras a las que a mixta asigna probabilidad positiva. Debe ser así porquesi no, entonces la mixta no sería mejor respuesta, sino la pura con mayorpago esperado

Ejemplo 12 Penalty shot. Utilicemos este atajo para re-encontrar elequilibrio en estrategias mixtas del lanzamiento de penalty. Estamosbuscando un par de estrategias mixtas (p�; q�) que sean equilibrio. Hombrepues entonces debe ser para el portero que se enfrenta a q�

EU (L) = EU (R)

1� 2q� = �1 + 2q�

q� = 1=2

y para el delantero que se enfrenta a p�

EU (L) = EU (R)

�1 + 2p� = 1� 2p�

p� = 1=2

2.6.1 Sobre la interpretación de las estrategias mixtas

Las estrategias mixtas, que tan necesarias son en teoría de juegos para querealmente exita el equilibrio de Nash en una enorme variedad de juegos,tienen varias interpretaciones.

1. Los jugadores eligen al azar. El típico ejemplo se encuentra enel juego del póquer. Supongamos que estamos jugando una partidade póquer con las siguientes estrategias puras:{apuesto, me retiro}.La estrategia pura "apostar si tengo buenas cartas y retirarme encaso contrario} no es una estrategia que maximiza nuestra utilidadesperada puesto que después de un rato jugando, nuestros rivalessabrán que nunca faroleamos... una vez que hayamos ganado lareputación de "no faroleador" es cuando debemos falorear. Y cuandola gente piense que somos de los que faroleamos, es cuando debemosempezar a no farolear. Eso signi�ca que la estrategia óptima esfalorear de forma aleatoria. Así pues, la estrategia óptima es mixta,en la que se elige de forma aleatoria entre "apostar" y "no apostar".

2. El problema del argumento anterior es que no se aplica demasiadobien a one-shot games -el penalti se va a lanzar una sola vez-. Elsegundo argumento que consideraremos es el argumento de lapuri�cación. En este caso, los jugadores no eligen aleatoriamentesino que su decisión es completamente determinista. Sin embargo,los rivales no tienen por qué conocer necesariamente el procesodeterminista por el cual un jugador elige su estrategia pura. Por

Page 59: apuntes_2010

2.7 Conceptos de solución para juegos en forma extensiva 47

ejemplo, la decisión acerca de las devaluaciones de las monedas sontomadas por experto que desde luego no lanzan una moneda al aire ydeciden devaluar la moneda si sale cara. Sin embargo, sus decisionesson difíciles de predecir por los especuladores que, normalmente, noconocen ni el procedimiento ni los datos utilizados por el BancoCentral. Ahora bien, argumentos puri�cadores de este tipo debenir acompañados de una descripción detallada de cuál es el procesoque sigue cada jugador y de por qué es desconocido por sus rivales.Desde esta perspectiva, un equilibrio en estrategias mixtas es unadescripción de las probabilidades que jugadores racionales asignana las estrategias disponibles para sus rivales. En el tema cuartote presentaré un ejemplo del argumento de puri�cación de JohnHarsanyi.

2.7 Conceptos de solución para juegos en formaextensiva

Recuerda el juego del secuestro del Presidente de los EEUU por un grupoterrorista de Macartan Humphreys. Recuerda que hemos determinado suforma extensiva. Bien, ahora vamos a calcular sus equilibrios de Nashpara ver si podemos aventurar una predicción y saber si el Presidente será�nalmente secuestrado o no. A mi me resulta siempre más fácil expresarel juego en forma estratégica (Jugadores, estrategias puras, funciones depagos) y calcular allí los equilibrios de Nash. Mi representación del juegoes la siguiente

Grupoterrorista

Kidnap                    Do not kidnap

US Congress

Negociar         No negociar

00

2­1

­2­2

Neg No

Kid 2,­1 ­2,­2

No 0,0 0,0Predicción: Existen dos equilibrios de Nash

PERO OJO: En general, en el caso de juegos en forma extensiva, elconjunto de estrategias de los jugadores es más complicado que en el caso de

Page 60: apuntes_2010

48 2. Juegos con Información Perfecta

juegos en forma estratégica. Lo que viene a continuación no debes olvidarloen lo que te queda de vida, diga, de curso.

De�nicion 20 Una estrategia pura para un jugador es un cursocompleto de acción, es decir, debe especi�car una acción en cada nodo enel que el jugador tenga que tomar una decisión.

Bien, ¿cuál es el espacio de estrategias puras del grupo terrorista? Puedeelegir en un solo nodo y tiene dos acciones disponibles en ese nodo, así quetenemos S1 :

�K;K

. Para el Congreso de US, sólo actúa en uno nodo y

tiene dos acciones disponibles, así pues S2 :�N;N

. Ya podemos escribir

la forma estratégica del juego

US CongressN N

Armed K 2;�1 �2;�2group K 0;0 0;0

Una vez que tenemos la matriz de pagos, podemos calcular lascorrespondencias de mejores respuesta y �nalmente el equilibrio de Nashdel juego. Vemos que hay dos equilibrios de Nash:

�K;N

�y (K;N). Vale,

¿cuál es entonces nuestra predicción acerca del comportamiento en estejuego? Es posible que creas que no podemos hacer ninguna predicción,pero te equivocas, porque estás pasando por algo el hecho de que nuestrosconceptos de solución asumen que los jugadores son racionales... En estecaso, ¿cuál es la predicción en este juego?

Observa la forma extensiva y representa el equilibrio de Nash (K;N).

Grupoterrorista

Kidnap                    Do not kidnap

US Congress

Negociar         No negociar

00

2­1

­2­2

Estas estrategias de equilibrio implican el secuestro y posteriornegociación, dando lugar a unos pagos en equilibrio (2,-1). Forman unequilibrio de Nash porque nadie mejora desviándose unilateralmente. Los

Page 61: apuntes_2010

2.7 Conceptos de solución para juegos en forma extensiva 49

terroristas están encantados (consiguen un pago de 2, frente a un pago 0si se desvían y no secuestran) y el US Congress no mejora si le da por nonegociar (el pago sería -2).

Sin embargo, el segundo equilibrio de Nash�K;N

�es justamente lo

opuesto. Tiene una senda de equilibrio que desemboca en el pago deequilibrio (0; 0).

Grupoterrorista

Kidnap                    Do not kidnap

Negociar         No negociar

00

2­1

­2­2

Es ciertamente un equilibrio de Nash porque los terroristas no mejoran sisecuestran al US President (conseguirían un pago de -2) y el US Congressestá encantado, puesto que si se desvía no mejora (consigue el mismo pago0) porque la senda de equilibrio no pasa por su nodo y por lo tanto, enequilibrio el US Congress no debe decidir nada.

Los dos son equilibrios pero uno de ellos es sospechoso. El segundo notiene pinta de re�ejar el comportamiento de jugadores racionales porqueincorporan una amenaza increíble. No tiene sentido que los terroristas, quesaben que el Congreso es un jugador racional (maximizador inteligente desu bienestar) crean que cuando le toque jugar al Congreso, el Congreso seniegue a negociar, puesto que la no negociación no es un juego racionalpuesto que no maximiza el pago del US Congress (ofrece un pago de -2frente a un pago de -1 si se negocia con los terroristas).

Así pues, el equilibrio de Nash�K;N

�incorpora una amenaza

increíble que no es digna de jugadores racionales. Es decir, si queremospredecir el comportamiento de jugadores racionales, entonces no podemosquedarnos con el concepto de equilibrio de Nash... hay que ir más lejos yeliminar los Nash que incorporen amenazas increíbles.

Remark 13 ¿Por qué el concepto de Equilibrio de Nash no detecta laamenaza increíble? Pues porque solo exige racionalidad en la senda deequilibrio, y la amenaza no ocurre en equilibrio.

Page 62: apuntes_2010

50 2. Juegos con Información Perfecta

Grupo terrorista

Kidnap                    Do not kidnap

US Congress

Negociar         No negociar

00

2­1

­2­2

La forma técnica de quitarnos del medio estos equilibrios de Nashincreíbles es mediante el concepto de perfección en subjuegos: exigirun comportamiento racional en todo subjuego, no sólo en la senda deequilibrio.

2.7.1 Equilibrio de Nash Perfecto en Subjuegos

Lo primero que tenemos que hacer es calcular lo que técnicamente sedenominan subjuegos.

De�nicion 21 Un subjuego:

1. empieza en un conjunto de información que contiene un solo nodo.

2. Incluye todos los nodos que le siguen en el juego.

3. Nunca corta ningún conjunto de información.

Cuando el juego es �nito y no muy complicado, puede hacersegrá�camente sin ninguna di�cultad. Eso es lo que hemos hecho con el juegodel secuestro del Presidente.Tenemos un subjuego que empieza en el nodo donde decide el US

Congress. En este subjuego, la acción que maximiza los pagos del Congresoes Negociar. Como el grupo terrorista sabe que el Congreso es racional, sabeque el Congreso negociará. De esta forma, estamos descartando el equilibrio

Page 63: apuntes_2010

2.7 Conceptos de solución para juegos en forma extensiva 51

1000

3000

5000

1010

0200

0400

0600

1             2              1               2              1 2A            a              A               a              A a

D            d              D               d              D d

de Nash�K;N

�.

Grupoterrorista

Kidnap                    Do not kidnap

US Congress

Negociar         No negociar

00

2­1

­2­2

¿Qué tiene de raro este equilibrio de Nash?En este “subjuego”, US Congress hace algo raro

Amenaza Increíble

Neg No

Kid 2,­1 ­2,­2

No 0,0 0,0Equilibrio de Nash: (No kidnap, Nonegotiation)

Criterio 1 Fíjate en que el propio juego cumple la de�nición de subjuego,por lo que algunos autores sugieren que todo juego siempre tiene unsubjuego: the game itself. Vale. Está bien porque de esa forma todo juegotienen un equilibrio perfecto en subjuegos y éste puede entenderse como unre�namiento del concepto de equilibrio de Nash.

Todo lo anterior motiva la siguiente de�nición

De�nicion 22 Un per�l de estrategias �� en un juego en forma extensivaes perfecto en subjuegos si implica un equilibrio de Nash en cadasubjuego (propio).

Bien, si piensas que controlas la perfección en subjuegos,entonces pruebacon el siguiente ejercicio.

Ejercicio 6 Rosental�s Centipede. Dos amigos tienen un billete de1000 euros y están pensando en el reparto. El profesor de micro les cuentael siguiente juego.

Page 64: apuntes_2010

52 2. Juegos con Información Perfecta

2

1

130

11

20

02

L

L’’

L’

R

R’

R’’

El resto de esta sección está dedicada a

1. Reforzar el concepto de estrategia en un juego en forma extensiva

2. Entender que lo importante de un equilibrio es lo que pasa fuera delequilibrio.

2.7.2 Estrategias en juegos en forma extensiva

Esta sección aparece aquí para reforzar la comprensión del conceptode estrategia pura en juegos en forma extensiva. Piensa en la siguientesituación con interdependencia estratégica.Calculemos el espacio de estrategias puras para cada uno de los

jugadores.

� Jugador 1: Tiene dos nodos donde elegir, así pues, el conjunto deestrategias puras debe tener dos componentes: la primera que nosdiga qué hacer en el primer nodo y la segunda que nos diga quéhacer en el segundo nodo. Como en cada nodo hay dos acciones, elespacio de estrategias puras del jugador 1 tiene 2� 2 = 4 elementos:S1 = fLL00; LR00; RL00; RR00g

� Jugador 2: Tiene un solo nodo en donde elegir, con dos accionesdisponibles. Así pues su espacio de estrateigas tiene 1 � 2 = 2elementos; a saber, S2 = fL0; R0g

2.7.3 Lo importante de un equilibrio es lo que no se ve

Piensa en el siguiente juego en forma extensiva

Page 65: apuntes_2010

2.7 Conceptos de solución para juegos en forma extensiva 53

1

L                   R

2                                      2

L’ R’ L’ R’

31

12

21

00

El jugador 1 elige en un solo nodo (llamémoslo nodo a) y en ese nodotiene dos acciones fL;Rg. Así pues, su espacio de estrategias puras esS1 = fL;Rg, mientras que el jugador 2 tiene dos nodos en los que ponesu nombre -el de la izquierda (b) y el de la derecha (c)- y en cada unode ellos tiene dos acciones fL0; R0g. Por tanto, su espacio de estrategiaspuras tiene cuatro elementos: S2 = fLL;LR;RL;RRg, donde la primeraacción de cada elemento es la acción que realizará el jugador 2 en el nodode la izquierda (b) y la segunda acción de cada elemento es la acción querealizará en el nodo de la derecha (c).Calculemos los equilibrios de Nash del juego. Como ya sabes, ayuda

mucho escribir la forma normal del juego.

LL LR RL RRleft 1,0 1,0 2,3 2,3right 0,1 3,2 0,1 3,2

La correspondencia de mejor respuesta de cada jugador es la siguiente:

MR1 (LL) = L

MR1 (LR) = R

MR1 (RL) = L

MR1 (RR) = R

y

MR2 (l) = fRL;RRgMR2 (r) = fLR;RRg

Por tanto, existen tres equilibrios de Nash: f(R;LR) ; (L;RL) ; (R;RR)g.Ahora calculemos cuál de ellos es el perfecto en subjuegos. Para ello, utilizael método de la inducción hacia atrás. Esto nos revela que el equilibrio(R;RR) es el único perfecto en subjuegos.

Centrémonos en el equilibrio (R;LR). Este equilibrio prescribe al jugador2 que juegue la acción L en el nodo b. Pero esto es irracional, puesto que

Page 66: apuntes_2010

54 2. Juegos con Información Perfecta

en ese nodo, la acción R proporcionar un pago mayor (3>0). De formasimilar, el equilibrio (L;RL) prescribe que el jugador 2 juegue la acción Len el nodo c. De nuevo es irracional, puesto que la acción R da un pago 2que es mayor que el pago de L que es 1.

Es posible que alguien argumente que es irrelevante que el jugador 2juegue de forma irracional en el nodo c cuando el equilibrio es (L;RL),porque el nodo c no será alcanzado si el jugador 1 sigue su estrategia deequilibrio l. Sin embargo, esto es un enorme error. Si eres de los que piensasasí, lee con atención el párrafo que sigue.

La razón por la que los jugadores continuan usando sus estrategias deequilibrio es por lo que pasaría si se desviaran. Suponga por ejemploque algún libro de Teoría de Juegos recomendara al algún jugador racionalque jugara el equilibrio (L;RL). Después de leer el libro, el jugador 1anticiparía que el jugador 2 jugará R en el nodo b y L en el nodo c.El, por tanto, querría seguir el consejo del libro y utilizar la estrategiaL, puesto que ésta le asegura un pago de 2 mientras que la acción Rsólo proporciona un pago de 0. Así pues, el nodo c no será alcanzadoen equilibrio. Sin embargo, lo que recomienda el libro para el nodo c no esirrelevante. Es precisamente lo que pasa en este nodo lo que haceque el jugador 1 no juegue r!!! Pero el jugador 1 no debería asustarsetanto... En vez de creer en el libro de Teoría de Juegos, debería hacersela siguiente pregunta: Yo se que el jugador 2 es racional, por tanto, si medesvio de la recomendación del libro y juego r y el nodo c es alcanzado,¿de verdad que va a utilizar la estrategia L como dice el libro que tiene quehacer?. La respuesta es NO, puesto que la estrategia L en el nodo c es unaamenaza no creíble, puesto que el jugador 2, que es racional, lo que quierees maximizar su utilidad, y esto lo consigue jugando R y no L como diceel libro. Dado que es irracional jugar L en el nodo c, el jugador 1 concluyeque el consejo del libro no tiene valor ninguno.

Intenta hacer tu el mismo análisis para el caso del otro equilibrio de Nashque no es perfecto en subjuegos, es decir, detecta la amenaza no creíble deljugador 2.

Esta es la razón por la que la Teoría de Juegos no puede recomendarequilibrios de Nash que incorporen amenazas no creíbles en nodos que nopertenezcan a la senda de equilibrio. Esta es la razón por la que la Teoríade Juegos exige algo más que Nash para hacer una recomendación: LaPerfección en Subjuegos.

Page 67: apuntes_2010

This is page 55Printer: Opaque this

3Juegos con Información Imperfecta

En el tema anterior hemos estudiado juegos de información perfecta, esdecir, juegos en los que todos jugadores conocen la historia completa deljuego en cada nodo en los que tengan que jugar.

En este tema estudiaremos cómo ampliar los conceptos de soluciónque tenemos al caso de información imperfecta. Una vez que lo sepamos,pasaremos a considerar en el tema siguente la información incompleta.

3.1 Primeros ejemplos

Ahora quiero considerar juegos con información imperfecta, aunque sinsaberlo algún que otro juego con información imperfecta ya conocéis.¿Cuál? Piensa por ejemplo en el dilema de presos. Es un juego coninformación imperfecta, porque la elección de los jugadores se realiza deforma simultánea. Su forma extensiva es la siguiente. (-1 signi�ca un año

Page 68: apuntes_2010

56 3. Juegos con Información Imperfecta

de cárcel)

Confesar                    Callar

Confesar                  Callar  Confesar                Callar

­6                       0 ­9 ­1

­6 ­9            0 ­1

Preso 1

Preso 2

Dado que el concepto de información imperfecta implica que los jugadoresno saben para algún conjunto de información en qué nodo se encuentran¿No os parece razonable que habría que complementar la noción deequilibrio de Nash con la inclusión de creencias en cada conjunto deinformación?¿Cómo debería razonar el preso número 2? Tiene dos nodos cuando le

toca jugar. Él debe asignar creencias a cada uno de los nodos. Sea p sucreencia de estar en el nodo de la izquierda y 1-p la de estar en el nodode la derecha. Como es racional, debe elegir la estrategia que maximice suspagos esperados.Si elige confesar obtiene: -6p + 0(1-p) = -6pSi elige callar obtiene: -9p �(1-p) = -8p -1 = -6p �2p - 1La diferencia entre el pago de confesar y callarse es -6p �(-8p -1) = -6p

+ 8p + 1 = 1 + 2p > 0.Luego el preso 2 debe elegir la acción confesar.Como la racionalidad de los agentes es conocimiento común, el preso 1

puede hacer el razonamiento del preso 2 y saber que el preso 2 elegirá laacción confesar. Por tanto, él debe elegir la acción que maximice sus pagosesperados.Si elige confesar entonces su pago esperado es -6Si elige callar entonces su pago esperado es -9Como es racional, entonces elige la acción confesar.Ya tenemos el equilibrio: fConfesar; Confesar; p = 1gPiensa ahora en el siguiente juego con información imperfecta

I                     C

1 D

i            d                   i            d

2

2                    0                  0                  0

1                    0                  2                  1

1

3

Page 69: apuntes_2010

3.1 Primeros ejemplos 57

Fíjate en que cuando le toca jugar al jugador 2, lo único que sabe es queel jugador 1 no ha elegido la acción D, pero no sabe si ha elegido I o C.¿Qué es una estrategia pura para el jugador 1? Una acción (I, C o D)¿Qué es una estrategia pura para el jugador 2? Una acción (i o d)Para calcular los equilibrios de Nash, es una buena idea escribir la forma

estratégica del juego.

1,31,3D

0,10,2C

0,02,1I

di

1,31,3D

0,10,2C

0,02,1I

di

Como vemos, hay dos equilibrios de Nash: (I,i) y (D,d)

� Analicemos el primero de ellos: (I,i). El jugador 2 tiene una estrategiaestrictamente dominada (d está dominada por i) por lo que su decisiónde jugar i está más que justi�cada por su racionalidad. Como laracionalidad es conocimiento común, el jugador 1 cree que el jugador2 va a jugar i y por tanto elige la estrategia I que maximiza sus pagos.Hasta aquí todo perfecto.

� Veamos el segundo equilibrio (D,d). Fíjate en que el equilibrio (D,d)es curioso, porque está basado en una amenaza no creíble (pero muyprovechosa para el jugador 2). ¿Por qué no lo caza el concepto deequilibrio de Nash? Porque la irracionalidad ocurre fuera de la sendade equilibrio. Pues apliquemos la perfección en subjuegos que estádiseñada para cazar irracionalidades fuera de la senda... oh, oh...este juego no tiene subjuegos propios por lo que (D,d) es perfectoen subjuegos. ¿Qué hacemos entonces? Extendamos el espíritu de laperfección en subjuegos a juegos con información imperfecta

�En cada conjunto de información, el jugador que decide tieneque tener unas creencias acerca del nodo en el que se encuentra.Cuando el juego alcanza el conjunto de información del jugador2, éste debe tener una conjetura acerca de qué nodo ha sidoalcanzado �es decir, acerca de cuál ha sido la acción del jugador1. Sea [p; 1� p]

�Dadas las creencias, las estrategias de los jugadores debenser secuencialmente racionales. Es decir, en cada conjunto deinformación, la acción tomada por el jugador al que le tocajugar y su estrategia subsiguiente deben ser óptimas, dada laconjetura del jugador en ese conjunto de información y las

Page 70: apuntes_2010

58 3. Juegos con Información Imperfecta

subsiguientes estrategias de los demás jugadores. En este caso,el pago esperado de jugar i es p + 2(1 � p) mientras que elpago esperado de jugar d es (1� p) : Como vemos, es trivialcomprobar que el pago esperado de i supera al de d. Problemaarreglado: Hemos eliminado la amenaza increíble.

Fíjate en que hemos eliminado el equilibrio no razonable (D,d) mediantela introducción de creencias. Fíjate que como el jugador 2 tenía unaestrategia estrictamente dominada, no importa el valor particular de sucreencia acerca del nodo en el que se encuentra para poder eliminar elequilibrio poco razonable. Sin embargo, hay veces en las que el valorparticular de las creencias va a ser muy importante... Y esto nos llevaa la siguiente pregunta: ¿cuál es el proceso �racional� de formación decreencias?

3.2 La Regla de Bayes

En esta sección vamos a ver cuál es el proceso racional de formación decreencias. Ahora bien, por más que sea el proceso racional de formación decreencias, la mayoría de la gente (i) no sabe cuál es, (ii) no sabe aplicarloy (iii) no suele aplicarlo.Para que veas que no te miento, analicemos el llamado Show de Monty

Hall.

3.2.1 El Show de Monty Hall

Imagínate que participas en un concurso de televisión en el que hay trespremios (dos cabras y un coche) y tres puertas. Detrás de cada puerta(llámalas A, B y C) se esconde hay un regalo y sólo uno. Imagínate queeliges la puerta A. El presentador, Monty, que conoce dónde están lospremios, antes de abrir la puerta que ha elegido, abre otra, por ejemplola C, y te enseña una cabra.1 Y Monty te pregunta si te quedas con lapuerta que elegiste, la A, o quieres cambiar de puerta. ¿Qué harías tú?Los datos siguientes corresponden a las respuestas de los alumnos del

curso 2006/07:

� Da igual cambiar: Tengo el 50% de ganar el coche si me quedo y el50% si me cambio (80%)

� No cambio: Por diversas razones, pero una que me ha gustado muchoes MIN REGRET (18%)

1Siempre es posible abrir una puerta en la que haya una cabra puesto que hay dospuertas que esconden una cabra.

Page 71: apuntes_2010

3.2 La Regla de Bayes 59

� Cambiar: (2%)

Veamos cómo debemos responder a este problema. Para ello, la siguientetabla ayuda un montón

MundosPosibles

Probabilidad decada

mundo

Detrásde la

puertaelegidapor mi

hay

Probabilidad decoche en la

tercera puertacondicionada aver una cabraen la segunda

puerta

Si nocambio midecisión

inicial, ganoel coche

conprobabilidad

Si cambio ladecisión

inicial, ganoel coche

conprobabilidad

1 1/3 Cabra 1 0 12 1/3 Cabra 1 0 13 1/3 Coche 0 1 0

Probabilidad de ganar el coche: 1/3 2/3

Como ves, lo correcto es cambiar de puerta, puesto que multiplicas pordos las posibilidades de llevarte el coche. Como estoy seguro de que note parece lo correcto, te pongo un razonamiento genial que entontré eninternet.

Page 72: apuntes_2010

60 3. Juegos con Información Imperfecta

3.2.2 La Baraja Española

Como sigues sin enterarte �a lo mejor es que las cabras te pillan lejos�, estudiemos algo más próximo a ti: la baraja española. Respondamos ala siguiente pregunta: ¿cuál es la probabilidad de que al elegir una cartaal azar de una baraja española estándar, esta sea el as de espadas? Surespuesta es trivial 1=40 porque hay 40 cartas y sólo una de ellas es el Asde Espadas. Bien. Ahora mira la forma racional de hacerlo:Primera forma:

Pr (Espada \As) = Pr (Espadas)� Pr (AsjEspadas) = 1

4� 1

10=1

40

Segunda forma:

Pr (As \ Espadas) = Pr (As)� Pr (EspadasjAs) = 1

10� 14=1

40

Estas formas nos dicen varias cosas, entre ellas que tu respuesta intuitivaes correcta. Pero nos dice algo más

Pr (Espadas)� Pr (AsjEspadas) = Pr (As)� Pr (EspadasjAs)

de donde

Pr (AsjEspadas) = Pr (As)� Pr (EspadasjAs)Pr (Espadas)

=Pr (As \ Espadas)Pr (Espadas)

Esta formulilla extraída del juego de cartas es la llamada Regla de Bayes yes muy útil porque si donde pone �Espadas�pones �Estar en el conjunto deinformación�y donde pone �As�pones �Estar en el nodo de la izquierda�entonces ya sabes cómo a partir de las estrategias de los jugadores, sepueden calcular las creencias en los juegos con información imperfecta.Veamos los ejemplos anteriores, empezando por los presos y Bayes

Confesar                    Callar

Confesar                  Callar  Confesar                Callar

­6                       0 ­9 ­1

­6 ­9            0 ­1

Preso 1

Preso 2[p]                                  [1 –p]

Sea p es la probabilidad de que estando en el conjunto de información (eneste libro lo denotaremos por � ��), estemos en el nodo de la izquierda.

Page 73: apuntes_2010

3.2 La Regla de Bayes 61

Dadas las estrategias de equilibrio podemos calcular el valor de esta creenciap a partir de la Regla de Bayes:

p = Pr (Izqj � ��) = Pr (Izq)� Pr (���j Izq)Pr (���) =

1� 11

= 1

Veamos ahora el segundo ejemplo y el equilibrio (I,i)

I                     C

1 D

i            d                   i            d

[p]              2             [1­p]

2                    0                  0                  0

1                    0                  2                  1

1

3

La creencia que debe acompañar a este equilibrio es p, donde p es laprobabilidad de que estando en el conjunto de información (en este librolo denotaremos por ���), estemos en el nodo de la izquierda. Dadas lasestrategias de equilibrio podemos calcularla a partir de la Regla de Bayes:

p = Pr (Izqj � ��) = Pr (Izq)� Pr (���j Izq)Pr (���) =

1� 11

= 1

Considera ahora el equilibrio (D,d) de este segundo juego

I                     C

1 D

i            d                   i            d

2                    0                  0                  0

1                    0                  2                  1

1

3[p]              2             [1­p]

Calculemos de nuevo la probabilidad p a partir de la regla de Bayes ylas estrategias de equilibrio:

p = Pr (Izqj � ��) = Pr (Izq)� Pr (���j Izq)Pr (���) =

0� 10

=0

0

Fíjate en que nos hemos topado con algo curioso, con unaindeterminación... ¿Qué está fallando aquí? Pues que la Regla de Bayes

Page 74: apuntes_2010

62 3. Juegos con Información Imperfecta

sólo puede aplicarse a eventos que tienen probabilidad positiva de ocurrir...es decir, no pueden aplicarse a eventos imposibles. Sin embargo, a la luzde las estrategias de equilibrio que estamos analizando, pedirle al jugador2 que tenga creencias en su conjunto de información es pedirle que crea enalgo imposible, porque si el jugador 1 juega de acuerdo a su estrategia D,entonces nunca, nunca, nunca se va a dar el caso de que el jugador 2 tengaque elegir.

Es algo así como exigir al jugador 2 que nos diga de qué color cree él queson los extraterrestes... ¡¡si los extraterrestres no existen!! Ya, ya, ya sé queno existe, pero venga dime ¿de qué color crees que son? ¿Es más probableque sean verdes, como los pinta el imaginario popular, o es más probableque sean azules?

GOD

Greenaliens

Bluealiens

No aliens

TU[p] [1­p]

Aún cuando el color de los extraterrestres te pueda parecer frívolo (o siquieres algo con más enjundia piensa en la discusión bizantina acerca delsexo de los ángeles), en Teoría de Juegos sin embargo es muy importante loque crea el jugador 2 en su conjunto de información, porque esas creenciasdan sentido a su estrategia en ese conjunto de información (esa estrategiadebe ser lo que maximiza su utilidad) y esa estrategia en ese conjunto deinformación da sentido a la estrategia D del jugador 1: el jugador 1 eligeD porque es lo mejor para él, porque si se desvía entonces ganan menosporque el jugador 1 cree que el jugador 2 jugará d y cree eso porque d eslo que maximiza el pago del jugador 2...

¿Ves como en la base del concepto de Equilibrio en Teoría de Juegos estáel color de los extraterrestres?

3.3 Creencias Consistentes

Dado que el problema es que al considerar estrategias puras algunosconjuntos de información no se alcanzan en equilibrio, perturbemos lasestrategias puras y consideremos unas estrategias mixtas que converjan

Page 75: apuntes_2010

3.3 Creencias Consistentes 63

a las puras. En los mundos perturbados sí que podemos aplicar Bayespara calcular todas las creencias. . . Entonces podemos pensar en que sólovalen las creencias que sean el límite de la creencias según Bayes de algunaperturbación de las puras. De esta forma, estas creencias serán consistentescon las estrategias de equilibrio y con la Regla de Bayes.

De�nicion 23 Consistency: An assessment fp; bg for a �nite extensiveform game is consistent if there is a sequence of completely mixedstrategies bn, converging to b, such that the associated sequence of Bayes�rule induced system of beliefs pn converges to p.

Vayamos aplicando la idea de consistencia a los ejemplos anteriores,porque esa de�nición es la que vamos a manejar a lo largo del curso. Comosiempre, empecemos por nuestros viejos conocidos de Carabanchel.

lim"!0

0BBBBBBBB@p" =

(1�")(1�")+" = 1� "

1CCCCCCCCA=

0BBBBBBBB@p = 1

1CCCCCCCCALo primero es calcular el equilibrio de Nash del juego. Recuerda que

era Confesar, Confesar. Lo segundo es complementar dichas estrategiascon creencias consistentes. Para ello nos �jamos en unas estrategiascompletamente mixtas que convejan a la pura que nos interesa. La mixtaasociada es hacer que el preso 1 juegue Confesar con probabilidad 1� " yjuegue Callar con probabilidad ".2 Conforme " tiende a cero, tenemos quela estrategia mixta converge a la pura que nos interesa. Muy bien, ahoraen el mundo perturbado de las mixtas calculamos las creencias del preso 2dadas las estrategias de equilibrio y la Regla de Bayes.

p" =(1� ")

(1� ") + " = 1� "

Y �nalmente calculamos el límite de las creencias perturbadas conformela estrategia mixa converge a la pura, es decir, conforme "! 0.

lim"!0

p" = lim"!0

(1� ")(1� ") + " = lim

"!0(1� ") = 1

2También podemos hacer que el jugador 2 juegue una mixta que converja a la puraConfesar. Pero recuerda que queremos considerar mixtas para que todos los conjuntosde información sean alcanzados con probabilidad positiva, y claro después de que juegueel jugador 2 no existe ningún conjunto de información, por lo que su mixta es irrelevantepara el requisito de consistencia de las creencias.

Page 76: apuntes_2010

64 3. Juegos con Información Imperfecta

Y obtenemos p = 1. ¿Cómo interpretamos lo que hemos obtenido? Puesdecimos que la creencia p=1 es consistente con las estrategias (Confesar,Confesar) porque hemos encontrado una perturbación de las estrategiasoriginales que convergen a la pura y en la que la secuencia de creencias enel mundo perturbado calculadas a partir de la Regla de Bayes converge ap = 1.

Practiquemos con otro ejemplo... en este caso, el equilibrio (D,.d) en elsegundo juego... sí, ese en el que no podíamos aplicar la Regla de Bayes.Veamos si la creencia p=1/2 es consistente. Es decir, veamos si podemosencontrar la perturbación de la pura D tal que la secuencia de creenciasperturbadas calculadas según la Regla de Bayes converge a 1/2.

lim"!0

0BBBBBBBB@p" =

"2

"2+

"2= 1

2

1CCCCCCCCA=

0BBBBBBB@p = 1

2

1CCCCCCCAComo siempre, la mixta consiste simplemente en poner probabilidad 1�"

en la estrategia pura de equilibrio, en este caso D, y repartir la probabilidadque hemos quitado, ", entre las estrategias restantes. En este caso, laprobabilidad " la hemos repartido a partes iguales entre las estrategias I yC. Como vemos, esta perturbación nos enseña que p = 1=2 es consistente.

Pero no es la única creencia consistente en este caso, piensa si no en lacreencia p=3/4. La perturbación relevante es ahora repartir la probabilidad" de otra forma entre las estrategias I y C... ahora pongamos 3

4" a laestrategia I y 1

4" a la estrategia C.

lim"!0

0BBBBBBBBB@p" =

3"4

3"4 +

1"4

= 34

1CCCCCCCCCA=

0BBBBBBBB@p = 3

4

1CCCCCCCCABien, espero que ya le hayas pillado el truco. En este juego y para el

equilibrio de Nash (D; d), cualquier creencia bp 2 (0; 1) es consistente puestoque podemos encontrar una perturbación de las mixtas que converja a lapura D (en este caso la mixta sería jugar I con probabilidad bp", jugar Ccon probabilidad (1� bp) " y jugar D con probabilidad 1 � ") y en la que

Page 77: apuntes_2010

3.4 Equilibrio Secuencial 65

la secuencia de creencias en el mundo perturbado calculadas a partir de laRegla de Bayes converge a p = bp.Técnicamente hablando nos quedaría por demostrar que las creenciasbp = 0 y bp = 1 son también consistentes para este juego. Para ello no

podemos utilizar las perturbaciones anteriores porque necesariamente laperturbación debe considerar una estrategia completamente mixta. Porcompletitud, mostramos ahora la perturbación que genera la creenciaconsistente bp = 1 y dejamos al lector que piense la correspondiente a bp = 0.

lim"!0

0BBBBBBBB@p" =

""+"2 =

11+"

1CCCCCCCCA=

0BBBBBBBB@I                     C

1 D

i            d                   i            d

2                    0                  0                  0

1                    0                  2                  1

1

3[1]              2             [0]

p = 1

1CCCCCCCCA

3.4 Equilibrio Secuencial

A lo largo del tema estamos viendo cómo generalizar el espíritu de laperfección en subjuegos a juegos con información imperfecta. La clavedel asunto parece estar en exigir por un lado que en cada conjunto deinformación el jugador que juegue deba tener unas creencias acerca de enqué nodo de dicho conjunto se encuentra y por otro lado que la estrategiaque elija sea la mejor para él. En la sección anterior vimos el requisitoque deben cumplir las creencias de los jugadores. En esta sección vamos aformalizar el segundo requisito, el requisito sobre las estrategias, utilizandoel concepto de racionalidad secuencial.

De�nicion 24 Un assessment fp; bg para un juego �nito en formaextensiva es secuencialmente racional si para cada jugador i, cadaconjunto de información I de i y cada estrategia del jugador i, tenemosque

ui (p; bj I) � ui (p; (b0; b�i)j I)

Es decir, si ningún jugador en ningún conjunto de información del juegotiene un incentivo a cambiar de estrategia. Fíjate en que no decimosconjuntos de información alcanzados con probabilidad positiva...

Ya estamos en disposición de de�nir el concepto de equilibrio relevantepara los juegos con información imperfecta: El Equilibrio Secuencial deKreps y Wilson (1982).

De�nicion 25 Un assessment fp; bg en un juego �nito en forma extensivaes un Equilibrio Secuencial si (i) es consistente y (ii) secuencialmenteracional.

Page 78: apuntes_2010

66 3. Juegos con Información Imperfecta

Ya tenemos nuestro concepto de solución de�nido sobre juegos en formaextensiva con información imperfecta. Ahora debemos practicar un pococon él para que te des cuenta de que no es tan �ero como parece .

Considera el siguiente juego en forma extensiva con informaciónimperfecta.

I                     C

1 D

i            d                   i            d

2

3                    0                  1                  0

1                    0                  0                  1

2

2

Empecemos por calcular sus equilibrios de Nash. Para ello, construyamosla forma estratégica del juego

2,22,2D0,11,0C0,03,1Idi

2,22,2D0,11,0C0,03,1Idi

Como vemos este juego tiene dos equilibrios de Nash: (I,i) y (D,d).Tratemos ahora de completar estos equilibrios de Nash con creenciasque sean consistentes y veri�quemos �nalmente si las estrategias sonsecuencialmente racionales para poder decir que hemos encontrado losequilibrios secuenciales de este juego.

Empecemos por el equilibrio de Nash (I,i). Como siempre, dibújaloporque las cosas se ven mejor.

I                     C

1 D

i            d                   i            d

2

3                    0                  1                  0

1                    0                  0                  1

2

2[p]                                   [1­p]

� Consistencia:Dado que el conjunto de información pertenece a lasenda de equilibrio, podemos aplicar directamente la Regla de Bayes.En este caso, la creencia consistente con la Regla de Bayes y lasestrategias de equilibrio es p = 1.

Page 79: apuntes_2010

3.4 Equilibrio Secuencial 67

� Secuencialidad racional. Debemos ir jugador por jugador y demostrarque en cada conjunto de información, su estrategia de equilibriomaximiza sus pagos dadas sus creencias y las estrategias de los demás.

� Jugador 1. Su estrategia de equilibrio es I. Si hace caso, su pagoes u1 (I) = 3. Para ver que es lo mejor dadas sus creencias ylas estrategias de los demás jugadores veamos qué obtiene si sedesvia. Y va a ser que sí porque u1 (C) = 1 y u1 (D) = 2.

� Jugador 2: Su estrategia de equilibrio es i. Si la sigue, entoncessu pago, dadas sus creencias y las estrategias de los demásjugadores, es u2 (i) = 1. Si se desvía, tenemos u2 (d) = 0.

Acabamos de encontrar nuestro primer equilibrio secuencial: fI; i; p = 1g.Analicemos ahora el segundo equilibrio de Nash: (D; d). Como siempre,

empecemos por el dibujo.

I                     C

1 D

i            d                   i            d

2

3                    0                  1                  0

1                    0                  0                  1

2

2

[p]                                   [1­p]

� Creencias: No podemos aplicar directamente la Regla de Bayes porqueel conjunto de información del jugador 2 no pertenece a la senda deequilibrio. Considera la siguiente estrategia mixta para el jugador1: jugar I con probabilidad bp", jugar C con probabilidad (1� bp) "y jugar D con probabilidad 1 � ", con bp 2 [0; 1]. Observa que estamixta converge a la pura D -la del equilibrio de Nash que estamostratando de ascender a Secuencial- y que las creencias perturbadasp" =

bp"bp"+(1�bp)" convergen a bp, por lo que cualquier creencia bp 2 [0; 1]es consistente.3

� Secuencialidad Racional: Ahora debemos ir jugador por jugador yver que en cada conjunto de información, su estrategia de equilibriomaximiza sus pagos dadas sus creencias y las estrategias de los demás.

� Jugador 1: El equilibrio dice que juegue D, con un pago asociadou1 (D) = 2. Las dos desviaciones posibles son peores: u1 (I) = 0y u1 (C) = 0.

3A mi personalmente me gusta decir que en este caso las creencias están libres, puestoque el requisito de consistencia no impone ninguna restricción sobre los valores admisiblespara las creencias.

Page 80: apuntes_2010

68 3. Juegos con Información Imperfecta

� Jugador 2: El equilibrio dice que juegue la estrategia d, conun pago asociado u2 (d) = bp0 + (1� bp) 1 = 1 � bp. Para quese cumpla el requisito de secuencialidad racional tiene que serque las desviaciones sean peores, es decir que u2 (d) � u2 (i) =bp1 + (1� bp) 0 = bp. Es decir, debemos tener

u2 (d) � u2 (i)

1� bp � bp1

2� bp

Por tanto, hemos encontrado toda una familia de equilibrios secuencialesasociados al per�l de estrategias (D,d). La familia es

�D; d; p � 1

2

.

Finalizamos esta sección con un último juego un poco más complicadoque los anteriores porque es de tres jugadores. La forma extensiva es lasiguiente

1 L

A2

I                D3

i           d             i           d

1            3           0            02            3           1            11            3           2            1

200

Empecemos por calcular los equilibrios de Nash de este juego mediantela forma estratégica del juego.

di0,1,13,3,3A0,1,21,2,1A2,0,02,0,0L2,0,02,0,0L

DIDI

di0,1,13,3,3A0,1,21,2,1A2,0,02,0,0L2,0,02,0,0L

DIDI

Observa que existen cuatro equilibrios de Nash en estrategias puras peroque sólo uno de ellos es perfecto en subjuegos, porque este juego tiene unsubjuego que comienza con el nodo en el que el jugador 2 debe elegir suestrategia.

Page 81: apuntes_2010

3.4 Equilibrio Secuencial 69

En dicho subjuego, existe una estrategia dominante para el jugador 2 quees Izquierda, por lo que el único equilibrio de Nash Perfecto en Subjuegoses (A; I; d).

Ahora vamos a calcular los equilibrios secuenciales de este juego.Para que la cosa vaya funcionando �y de verdad el secuencial sea laextensión natural del perfecto en subjuegos cuando hay informaciónimperfecta� deberíamos ser capaces de demostrar que sólo se puedenconstruir equilibrios secuenciales en este juego a partir de equilibrios deNash perfectos en subjuegos.

Empecemos por el que sabemos que debe salir, el perfecto en subjuegos...como siempre el dibujo por delante

1 L

A2

I                D[p] 3 [1­p]

i           d             i           d

1            3           0            02            3           1            11            3           2            1

200

� Consistencia: Podemos aplicar directamente la Regla de Bayes porqueel conjunto de información del jugador 2 pertenece a la senda deequilibrio. Ergo p = 1 es la única creencia consistente dado estasestrategias de equilibrio.

� Secuencialidad Racional: Ahora debemos ir jugador por jugador yver que en cada conjunto de información, su estrategia de equilibriomaximiza sus pagos dadas sus creencias y las estrategias de los demás.

� Jugador 1: El equilibrio dice que juegue A, con un pago asociadou1 (A) = 3. La única desviación no mejora su pago puesto queu1 (L) = 2.

� Jugador 2: El equilibrio dice que juegue la estrategia I, con unpago asociado u2 (I) = 3. La única desviación posible tampocomejora su situación, puesto que u2 (D) = 1

� jugador 3: El equilibrio dice que juegue la estrategia d, con unpago asociado u3 (d) = 3. La única desviación posible tampocomejora su situación, puesto que u3 (i) = 1

Page 82: apuntes_2010

70 3. Juegos con Información Imperfecta

Felicidades, has encontrado el secuencial fA; I; d; p = 1g.

Estudiemos ahora el siguiente equilibrio de Nash fL;D; ig. Ya sabemosque no es perfecto en subjuegos y por lo tanto va a ser imposible ascenderloa secuencial. Veámosolo con calma, puesto que para este equilibrio, elconjunto de información no pertenece a la senda de equilibrio.

� Consistencia: No podemos aplicar directamente la Regla de Bayesporque el conjunto de información del jugador 2 no pertenece a lasenda de equilibrio. En la forma extensiva anterior he escrito la mixtaperturbada. La secuencia de creencias perturbadas es por tanto

p" =""

""+ " (1� ") = "

y como vemos tiende a 0. Por tanto, la única creencia consistente esp = 0.

� Racionalidad secuencial: Ahora debemos ir jugador por jugador yver que en cada conjunto de información, su estrategia de equilibriomaximiza sus pagos dadas sus creencias y las estrategias de los demás.

� Jugador 1: El equilibrio dice que juegue L, con un pago asociadou1 (L) = 2. La única desviación no mejora su pago puesto queu1 (A) = 0.

� Jugador 2: El equilibrio dice que juegue la estrategia D, con unpago asociado u2 (D) = 1. La única desviación posible mejorasu situación, puesto que u2 (I) = 2. Por tanto, la secuencialidadracional falla para el segundo jugador.

Page 83: apuntes_2010

3.5 Apéndice 71

Acabamos de demostrar que no podemos construir un equilibriosecuencial a partir del equilibrio de Nash fL;D; ig.

Tienes otros dos equilibrios con los que practicar antes de probar conlos problemas de este tema. Pero antes de terminar, déjame decirte queeste ejercicio nos muestra que el equilibrio secuencial es a la informaciónimperfecta lo que el equilibrio perfecto en subjuegos lo es a la informaciónperfecta. Es decir, tienen el mismo espíritu; es decir, no se contradicen.

3.5 Apéndice

Este apéndice recoge varias cosas interesantes respecto a los conceptos deequilibrio que hemos desarrollado hasta el momento.

3.5.1 Ojo con la circularidad

Hasta ahora estás acostumbrado a calcular equilibrios del tirón, pero esto yano será posible, puesto que el concepto de Equilibrio Secuencial es cirular:las estrategias determinan las creencias (requisito de consistencia) y lascreencias determinan las estrategias (racionalidad secuencial).

Ojo con la Circularidad

ESTRATEGIAS CREENCIAS

LAS ESTRATEGIAS DETERMINAN LAS CREENCIAS(Regla de Bayes)

LAS CREENCIAS DETERMINAN LAS ESTRATEGIAS(Secuencialidad Racional)

Esto abre la siguiente pregunta: ¿Qué fue primero, la gallina o el huevo?Esta circularidad implica que casi siempre necesitemos hacer dos pasadaspor el juego para encontrar los equilibrios secuenciales. La mejor estrategiaes la siguiente:

1. Primero calculamos los equilibrios de Nash porque cada equilibrio deNash será candidato a equilibrio secuencial.

2. Ampliamos cada equilibrio de Nash con creencias consistentes.

Page 84: apuntes_2010

72 3. Juegos con Información Imperfecta

3. Finalmente veri�camos si las estrategias son secuencialmenteracionales.

3.5.2 La lógica de tantos conceptos de solución distintos

Hasta ahora hemos visto unos cuantos conceptos de solución...

Clase de Juego Concepto Lógica

Juego estático coninformación perfecta

(Nash, 1950)

Equilibriode Nash(acuerdo

autovinculante)

La estrategia de cada jugadores mejor respuesta a lasestrategias de los otros

jugadores. Nadie jugará unaestrategia estrictamentedominada en la senda deequilibrio. Nash permite

amenazas no creíbles(estrictamente dominadas)

fuera de la senda de equilibrio.

Juego dinámico coninformación perfecta

(Selten, 1965)

EquilibrioPerfecto ensubjuegos

Evita amenazas no creíbles encualquier subjuego.

Información imperfectaya sea un juego estático

o dinámico(Kreps y Wilson, 1982)

Equilibriosecuencial

Hay conjuntos de informaciónque no pertenecen a un

subjuego. Este concepto tapaeste agujero. Nada de

amenazas increíbles en ningúnconjunto de información fuera

de la senda

y a lo mejor tienes la sensación de que cada vez que nos encontramos conuna situación nueva, tenemos que cambiar nuestro concepto de solución...es algo así como hacer trampas. Pues no es cierto: simplemente lo vamosreforzando para excluir equilibrios que pasarían por el cedazo de losconceptos diseñados para juegos más simples.

Page 85: apuntes_2010

3.5 Apéndice 73

Dado cualquier juego, los conceptos de solución que hemos estudiadoestán anidados

Conjunto de todos los perfiles de estrategias

Subconjunto de losEquilibrios de Nash

Subconjunto de losEquilibrios de Nash

Perfectos en Subjuegos

Subconjunto delos EquilibriosSecuenciales

Subconjunto de los perfiles quesobreviven a la eliminación iterada deestrategias estrictamente dominadas

Page 86: apuntes_2010

74 3. Juegos con Información Imperfecta

Page 87: apuntes_2010

This is page 75Printer: Opaque this

4Juegos con Información Incompleta

Hasta ahora hemos considerado juegos en los que un montón de elementoseran considerados conocimiento común, y entre ellos estaba la matriz depagos... es decir, cada jugador podía escribir la matriz de pagos del juego�o el arbolillo del juego con sus nodos terminales y sus pagos si estamosen el caso de juegos en forma extensiva�. Esto implica que la función depagos de los jugadores es conocimiento común, es decir, que tenemos unjuego con información completa.

Este supuesto tiene mucho sentido en ciertas situaciones estratégicas,como cuando se enfrentan el Madrid y el Barcelona en baloncesto. Todoel mundo sabe que el Real Madrid quiere ganarle al Barcelona y que elBarcelona quiere ganarle al Real Madrid. Pero hay otras situaciones en lasque suponer que la función de pagos es conocimiento común es suponermucho... Por ejemplo, piensa en la competencia en precios entre la empresa1 y la empresa 2. Bien está que cada empresa conozca los ingresos de surival, puesto que "sólo" hay que mirar en el mercado cuantas bebidas sevenden y a qué precio, pero cosa distinta es suponer que cada empresaconozca la función de costes de su rival. Supongamos por ejemplo que laempresa 1 no conoce los costes de la empresa 2 pero que la empresa 2sí conoce los costes de la empresa 1. Es más, vamos a suponer que estaestructura de conocimiento es conocimiento común. En este caso, estamosconsiderando un juego con información incompleta.1

1Como dice Ken Binmore, la distinción entre información completa e incompletano es equivalente a la distinción entre información perfecta e imperfecta. Decir que un

Page 88: apuntes_2010

76 4. Juegos con Información Incompleta

4.1 Representación en forma estratégica de unjuego bayesiano

Ahora vamos a estudiar los elementos que de�nen la representación enforma estratégica de un juego con información incompleta; también sonllamados Juego Bayesiano.

Recuerda que la representación en forma estratégica de un juego de njugadores con información completa es G (S1; :::; Sn;U1; :::; Un), donde Siy Ui son es el espacio de estrategias y la función de pagos del jugador i-ésimo respectivamente. Sin embargo, en estos juegos, una estrategia parael jugador i-ésimo es simplemente una acción, de forma que escribiremosG (A1; :::; An;U1; :::; Un), donde Ai es el espacio de acciones para el jugadori-ésimo y U1(a1; :::; an) es la función de pagos para el jugador i-ésimo si lasacciones elegidas fueron (a1; :::; an).

El primer paso para la representación de un juego bayesiano esrepresentar la idea de que cada jugador conoce su función de pagos peropuede desconocer las funciones de pagos de sus oponentes. Supongamosque la función de pagos del jugador i-ésimo viene representada porUi(a1; :::; an; ti), donde ti se denomina el tipo del jugador i-ésimo ypertenece al conjunto de todos los tipos posibles (o espacio de tipos) Ti,de forma que a cada tipo del jugador le corresponde una función de pagosdiferente.

Dada esta de�nición de tipo de un jugador, decir que el jugador iconoce su función de pagos es equivalente a decir que conoce su propiotipo, ti. Asimismo, decir que un jugador no conoce la función de pagosde los otros jugadores es equivalente a decir que no conoce el tipo delos otros jugadores, donde el tipo de los otros jugadores lo escribiremost�i = (t1; :::; ti�1; ti+1; :::; tn). Denotaremos por T�i el conjunto de todoslos valores de t�i, y usaremos la distribución de probabilidad pi(t�i j ti)para referirnos a la creencia del jugador i-ésimo sobre los tipos de los demásjugadores, dado que el jugador conoce su propio tipo.

Si ahora ponemos juntos los conceptos nuevos de tipos y creencias conlos conceptos más familiares de la representación estratégica de un juegocon información completa, tendremos una �maravillosa�descripción de unjuego bayesiano. Todo esto es lo que nos dice la siguiente de�nición:

juego es de información perfecta o imperfecta es decir algo acerca de las reglas deljuego. Decir si un juego es de información completa o incompleta es decir algo sobrelo que se conoce acerca de las circunstancias bajo las que el juego es jugado. Bajo elsupuesto de información completa, se supone que se ha recogido su�ciente informaciónsobre la situación económica objeto de estudio, de forma que el juego es susceptiblede ser modelizado como un juego. Para que esto puede llevarse a cabo, varias cosasdeben ser consideradas conocimiento común. Entre ellas, estaban las reglas del juego,las preferencias y las creencias.

Page 89: apuntes_2010

4.1 Representación en forma estratégica de un juego bayesiano 77

De�nicion 26 La representación en forma estratégica de un juegobayesiano de n jugadores especi�ca los espacios de acciones de cada jugador,el espacio de tipos, sus creencias y sus funciones de pagos.

A continuación seremos un poco más formales en la descripción detodos estos elementos. Además, para que estos elementos no parezcan tanabstractos, despues de su enumeración estudiaremos un ejemplo concreto:el duopolio de Cournot con Información Incompleta.

1. Jugadores: Sean n jugadores, donde el jugador i-ésimo serárepresentado por la letra i.

2. Acciones: Sea Ai el espacio de acciones disponibles para el jugadori-ésimo, donde Ai = faig . Sea A =

Qni=1Ai el espacio de

acciones de los jugadores. Un elemento arbitrario del conjunto A serárepresentado por a = (a1; :::; an):

3. Tipos: Sea Ti el espacio de tipos para el jugador i-ésimo, dondeTi = ftig. Sea T =

Qni=1 Ti el espacio de tipos de los jugadores.

Un elemento arbitrario del conjunto T será representado por t =(t1; :::; tn):

4. A-priori: Sea p(t1;:::;tn) una distribución de probabilidad objetivasobre el espacio T , de tal forma que para todo ti 2 Ti; p(ti) 2 [0; 1]yPn

i=1 pi(ti) = 1: Es importante tener en cuenta que todos losjugadores tienen el mismo a-priori, es decir, es conocimiento común.

5. Creencias: Sea pi la creencia que el jugador i-ésimo tiene sobre eltipo de los demás jugadores. Cada jugador conoce su tipo ti perodesconoce el tipo de los demás jugadores, t�i. Por tanto, este formulasus creencias sobre t�i. Como estamos suponiendo que los jugadoresson racionales, las creencias deben guardar relación con el a-priori, esdecir, los jugadores aplican la Regla de Bayes:

pi (t�i j ti) =p(t�i; ti)P

t�i2T�i p(t�i; ti)=p(t�i; ti)

pi(ti)

6. Pagos: Sea Ui el pago del jugador i-ésimo. Dado el tipo del jugadori-ésimo, ti, la función de pagos viene dada por Ui (a1; :::; an; ti)

4.1.1 Aplicación al Duopolio de Cournot con InformaciónIncompleta:

Consideremos 2 empresas que se enfrentan a una curva de demandaP = a � Q, donde Q es la cantidad agregada q1 + q2. Cada una delas empresas tiene una función de costes totales Ci(qi) = ciqi, donde ci

Page 90: apuntes_2010

78 4. Juegos con Información Incompleta

es el coste marginal constante de la empresa i. Cada empresa conoce sucoste marginal pero desconoce el coste marginal de la empresa rival. Estasituación la podemos describir como un juego en forma estratégica coninformación incompleta. Sus elementos son:

1. Jugadores: Tenemos dos jugadores, empresa 1 y empresa 2. Luegoi = 1; 2:

2. Acciones: El espacio de acciones disponibles para la empresa ies un nivel de producción qi que restringimos al intervalo (0; a);es decir, Ai = fqigqi2(0;a). El conjunto A =

Qni=1Ai es entonces

A = f(q1; q2) donde qi 2 (0; a)g :

3. Tipos: El espacio de tipos para la empresa i-ésima es Ti =fcH ; cLg, es decir, el coste marginal de la empresa i puede seralto (cH) o bajo (cL). El conjunto T =

Qni=1 Ti es entonces T =

f(cH ; cH); (cH ; cL); (cL; cH); (cL; cL)g, donde el primer elemento sere�ere al coste marginal de la empresa 1 y el segundo al coste marginalde la empresa 2:

4. A-priori: Sea p(t1;:::;tn) una distribución de probabilidad objetivasobre el espacio T , de tal forma que para todo ti 2 Ti; p(ti) 2 [0; 1]yPn

i=1 pi(ti) = 1: Un ejemplo de distribución de probabilidad puedeser p(cH ; cH) = 2=8; p(cH ; cl) = 3=8; p(cL; cH) = 2=8; p(cL; cL) = 1=8.

5. Creencias: Sea pi la creencia que la empresa i-ésima tiene sobre eltipo (coste marginal) de la empresa rival. Cada empresa conoce sutipo ti pero desconoce el tipo de la empresa rival, t�i. Por tanto,cada empresa formula sus creencias sobre el coste marginal de la otraempresa. Calculemos las creencias de la empresa 1 suponiendo que sutipo es cH : La creencia de que el coste de la empresa 2 sea cH dadoque la empresa 1 es cH es entonces:

p1 (cH j cH) =p(cH ; cH)

p(cH)=

2=8

2=8 + 3=8= 2=5

La creencia de que el coste de la empresa 2 sea cL dado que la empresa1 es cH es entonces:

p1 (cL j cH) =p(cL; cH)

p(cH)=

3=8

2=8 + 3=8= 3=5

De una forma similar pueden calcularse las creencias de la empresa 2sobre el coste marginal de la empresa 1.

6. Pagos: Sea Ui el pago de la empresa i-ésima. En nuestro ejemplo, elpago para la empresa i-ésima es su función de bene�cios, �i (q1; q2; ci),que por supuesto depende de su coste marginal, es decir, de su tipo.

Page 91: apuntes_2010

4.1 Representación en forma estratégica de un juego bayesiano 79

4.1.2 Timing del juego:

1. La natureleza extrae del espacio de tipos T , un per�l de tipos,t(t1; :::; tn), uno para cada jugador, con probabilidad p(t).

2. La naturaleza le dice al jugador i-ésimo su tipo ti, y éste formula suscreencias p(t�i j ti) de acuerdo a la Regla de Bayes.

3. Los jugadores eligen simultáneamente sus acciones ai 2 Ai.

4. Los jugadores reciben sus pagos Ui(a1; :::an; ti):2

Un juego bayesiano en forma estratégica viene estonces representado por

� (A1; :::; An;T1; :::; Tn; p;U1; :::; Un)

4.1.3 De�nición de Equilibrio Bayesiano

Una vez de�nido completamente el concepto de juego bayesiano, toca elturno de de�nir un concepto de equilibrio para este tipo de juegos. Paraello, lo primero que tenemos que hacer es de�nir el espacio de estrategiasde cada uno de los jugadores. Recuerda que una estrategia pura para unjugador es un plan completo de acción, es decir, una especi�cación completade la acción a elegir en cada una de las situaciones en las que el jugador sepuede encontrar en el desarrollo del juego.

Dado el timing especi�cado para un juego bayesiano, en donde el primermovimiento corresponde a la naturaleza y su elección de un tipo para cadajugador, una estrategia pura para un jugador debe especi�car una acciónpara cada uno de sus tipos posibles. Esto da lugar a la siguiente de�nición:

De�nicion 27 Una estrategia pura para el jugador i-ésimo es unafunción Si : Ti ! Ai, de tal forma que para todo ti 2 Ti; si(ti) 2 Ai

A diferencia de los juegos con información completa en forma estratégica,en un juego bayesiano los espacios de estrategias puras no forman partede la de�nición de la forma estratégica del juego, sino que tienen queser construidos a partir de los espacios de tipos y acciones. Por tanto,el conjunto de todas las acciones puras para el jugador i-ésimo, Si, es elconjunto de todas las funciones posibles con origen Ti y destino Ai.

Podemos considerar dos tipos de estrategias puras:

1. Estrategias separadoras: En este caso, 8ti 6= ti; si(ti) 6= si(ti), esdecir, cada tipo elige una acción distinta.

2Existen juegos en donde, en la etapa 2 del juego, el jugador i-esimo puede recibirinformacion sobre los tipos de los demas jugadores. En ese caso, los pagos del jugadori-esimo dependeran de los tipos conocidos de los jugadores

Page 92: apuntes_2010

80 4. Juegos con Información Incompleta

2. Estrategias pooling: En este caso, 8ti 6= ti; si(ti) = si(ti), es decir,todos los tipos eligen la misma acción.

Esta distinción entre estrategias separadores y pooling no es relevante demomento... pero lo será en el tema cuatro.

Es posible que a estas alturas todavía existan personas que se esténpreguntando por qué obligamos a un jugador a especi�car una acción paracada posible tipo si desde el principio del juego, el jugador ya conoce su tipopuesto que le ha sido revelado por la naturaleza. ¿No sería su�ciente conespeci�car la acción para el tipo que es y no preguntarle por lo que hubierahecho si su tipo fuera otro?. La respuesta es NO. Cada jugador necesitaconsiderar lo que los demás jugadores harán y, dado que se desconocen lostipos de los oponentes, lo que ellos harán depende de los que ellos crean quecada jugador hará en todos los tipos posibles. Es por ello que cada jugadortiene que pensar lo que haría en cada uno de sus tipos posibles.

Dada nuestra de�nición de estrategia pura en un juego bayesiano, yaestamos en disposición de de�nir lo que es un Equilibrio de Nash Bayesiano.No os asusteis por la aparente complejidad de la notación utilizada, sino porsu intuición: cada estrategia debe ser mejor respuesta a las estrategias de losdemás jugadores. Es decir, un Equilibrio de Nash Bayesiano es simplementeel Equilibrio de Nash de un Juego Bayesiano.

De�nicion 28 En el juego en forma estratégica de�nido por � (A1; :::; An;T1; :::; Tn; p;U1; :::; Un),las estrategias (s�1; :::; s

�n) constituyen un Equilibrio Bayesiano si 8i;8ti 2

Ti; s�i resuelve

Maxai2Ai

Xt�i2T�i

[Ui (s�1; :::; ai; :::s

�n; ti) pi (t�i j ti)]

Es decir, ningún jugador quiere cambiar su estrategia ni siquiera si esecambio implica cambiar la acción asociada a uno de sus posibles tipos.

4.2 Aplicaciones

4.2.1 El Duopolio de Cournot con Información Incompleta

Considera el modelo del Duopolio de Cournot con una función de demandainversa P (Q) = a � Q, donde Q = q1 + q2 es la cantidad agregada enel mercado. La función de costes de la empresa 1 es C1(q1) = cq1. Lafunción de costes de la empresa 2 es C2(q2) = cHq2 con probabilidad �y C2(q2) = cLq2 con probabilidad 1 � �, donde cH � cL. Además, lainformación es asimétrica: la empresa 2 conoce sus costes y la función decostes de la empresa 1, mientras que la empresa 1 conoce sus costes perono los costes de la empresa 2 (tan solo que con probabilidad � se enfrenta a

Page 93: apuntes_2010

4.2 Aplicaciones 81

una empresa con costes marginales altos).3 Todo lo anterior es conocimientocomún: la empresa 1 sabe que la empresa 2 tiene información superior, laempresa 2 sabe que la empresa 1 lo sabe, etc..

Naturalmente, la empresa 2 querría producir una cantidad distinta (ypresumiblemente menor) si su coste marginal fuera alto en vez de bajo. Laempresa 1, por su parte, debería anticipar que la empresa 2 puede tomardiferentes decisiones de producción en función de sus costes de producción.

Estudiemos primero la decisión de la empresa 1. Se enfrenta a unaespecie de lotería: con probabilidad � se enfrenta a una empresa con costesmarginales alto, y con probabilidad 1 � � se enfrenta a una empresa concostes marginales bajos. Por ello, la empresa 1 tratará de maximizar susbene�cios esperados

Maxq12(0;a)

� [(a� q1 � q�2(cH)� c) q1] + (1� �) [(a� q1 � q�2(cL)� c) q1]

donde q�2(cH) y q�2(cL) son las cantidades producidas por la empresa 2

en función de sus costes de producción.Por su parte, la empresa 2 esconocedora de su superior información, es decir, de que la empresa 1 sóloconoce la distribución de probabilidad sobre sus costes, y anticipa que elcomportamiento de la empresa 1 es el anterior. Es por ello, que aunque sucoste sea alto o bajo, necesitará computar tanto q�2(cH) como q

�2(cL) para

poder calcular su correspondencia de mejor respuesta. En este caso

q�2(cH) 2 argmaxq22(0;a)

[(a� q�1 � q2 � cH) q2]

q�2(cL) 2 argmaxq22(0;a)

[(a� q�1 � q2 � cL) q2]

Las condiciones de primer orden de estos problemas de maximización sonlas siguientes4 :

q�1 =� [a� c� q�2(cH)] + (1� �) [a� c� q�2(cL)]

2

q�2(cH) =a� q�1 � cH

2

q�2(cL) =a� q�1 � cL

2Resolviendo este sistema de tres ecuaciones con tres incógnitas obtenemosel Equilibrio Bayesiano del juego:

q�2(cH) =a� 2cH + c

3+1� �6

(cH � cL)

3La empresa 2 puede ser una empresa nueva en el mercado o bien ha podidodesarrollar una nueva tecnologia

4Suponemos que las condiciones de segundo orden se cumplen, por lo que no lasconsideramos explicitamente

Page 94: apuntes_2010

82 4. Juegos con Información Incompleta

q�2(cL) =a� 2cL + c

3� �6(cH � cL)

q�1 =a� 2c+ �cH + (1� �)cL

3

Resulta un ejercicio interesante comparar este equilibrio bayesiano con elequilibrio de Nash del modelo de Cournot con información completa enel que las empresas tienen costes marginales diferentes.5 Suponiendo quelas cantidades de equilibrio de las dos empresas son positivas, la empresai produce q�i =

a�2ci+cj3 en el modelo de información completa. Cuando

existe información incompleta, q�2(cH) es mayor quea�2cH+c

3 y q�2(cL) esmenor que a�2cL+c

3 . Esto ocurre porque la empresa 2, a la hora de tomarsu decisión de producción, no sólo tiene en cuenta que ella tiene un costemarginal determinado sino también el hecho de que la empresa 1 no loconoce. Si el coste de la empresa 2 es alto, produce poco porque su coste esalto pero algo más porque sabe que la empresa 1 producirá una cantidadque maximice su bene�cio esperado y, por tanto, menor que si la empresa1 supiera que el coste de la empresa 2 es alto.

4.2.2 El Teorema de Puri�cación de Harsanyi

Como mencionamos al �nal del tema anterior, Harsanyi sugirió que laestrategia mixta del jugador j representa la incertidumbre del jugador iacerca de la estrategia pura elegida por el jugador j, y que la elección dej depende de la realización de una cantidad de información privada. Lade�nición formal del Teorema es la siguiente:

Teorema 3 Fija un conjunto de n jugadores y espacio de estrategiasSi. Para un conjunto de pagosfui(s)gi2I;s2S con medida de Lebesgue 1,para todo a-priori p (p1; :::; pn) donde pi son independientes y dos vecesdiferenciables de�nidas sobre Ti = [�1; 1]#S, cualquier equilibrio de pagosui es el límite cuando �! 0 de una secuencia de equilibrios en estrategiaspuras del juego perturbado con pagos ui, donde tsi denota una variablealeatoria con rango en el intervalo cerrado [�1; 1] y � � 0 denota unaconstante positiva de tal forma que la función de pagos perturbados adoptala forma ui(s; �i) = ui(s) + ��

si :

En esta sección daremos una descripción un poco menos informal de esteteorema: un equilibrio en estrategias mixtas de un juego con informacióncompleta puede, casi siempre, ser interpretado como el equilibrio bayesianoen estrategias puras de un juego estrechamente relacionado con el originalen el que se ha introducido un poco de información incompleta.Considera

5Aun cuando no lo hayamos calculado, este se puede calcular simplemente tomandotetha igual a cero o uno

Page 95: apuntes_2010

4.2 Aplicaciones 83

el siguiente ejemplo de la Batalla de los Sexos.

B SB 2; 1 0; 0S 0; 0 1; 2

La batalla de los sexoscon información completa

Existen dos equilibrios de Nash en estrategias puras y un equilibrio enestrategias mixtas, en el que el jugador 1 juega B con probabilidad 2/3 yel jugador 2 juega S con probabilidad 2/3. Supongamos ahora que aunquelos jugadores se conocen desde hace mucho tiempo, éstos no están segurosde los pagos exactos del otro jugador. En particular, supongamos que elpago del jugador 1 por ir a la obra de Bach es 2+ t1, y el pago del jugador2 por acudir a la obra de Stravinsky es 2 + t2, donde ti es conocido por eljugador i, pero no por el jugador j. Además, t1 y t2 son variables aleatoriasindependientes con función de distribución uniforme en el intervalo [0; 1].Todos los demás pagos son los mismos.

B SB 2 + t1; 1 0; 0S 0; 0 1; 2 + t2La batalla de los sexos

con información incompleta

En términos de nuestra notación, el juego bayesiano en cuestión es� = fA1; A2;T1; T2; p1; p2;u1; u2g, donde los espacios de acciones son Ai =fB;Sg, los espacios de tipos son Ti = [0; x], las creencias son pi(tj) = 1=x ylos pagos son los descritos en la anterior �gura. Construiremos un equilibriobayesiano en estrategias puras de esta versión con información incompletade la Batalla de los Sexos en la que el jugador 1 juega B si t1 es mayorque un cierto valor crítico c1 y juega S en caso contrario, mientras que eljugador 2 juega S si t2 es mayor que un cierto valor crítico c2 y juega Ben caso contrario. En este equilibrio, la probabilidad de que el jugador 1juegue B es simplemente

prob(t1 � c1) =x� c1x

mientras que la probabilidad de que el jugador 2 juegue S es

prob(t2 � c2) =x� c2x

Demostraremos que cuando la información incompleta desaparece (esdecir, cuando x! 0), el comportamiento de los jugadores en este equilibriobayesiano en estrategias puras con información incompleta se aproxima al

Page 96: apuntes_2010

84 4. Juegos con Información Incompleta

comportamiento descrito por el equilibrio en estrategias mixtas del juegocon información completa. Es decir, lim

x!0

x�c1x = lim

x!0

x�c2x = 2

3 :

Supongamos que los jugadores juegan las estrategias descritas. Dado unvalor de x, determinaremos los valores de c1 y c2 tales que estas estrategiasson un equilibrio bayesiano.

Dada la estrategia del jugador 2, el pago esperado para el jugador 1 sijuega B y S viene dado por

c2x(2 + t1) +

h1� c2

x

i0 =

c2x(2 + t1)

yc2x0 +

h1� c2

x

i1 = 1� c2

xrespectivamente. Así pues, jugar B es óptimo si y solo si

t1 �x

c2� 3 = c1

Similarmente, dada la estrategia del jugador 1, el pago esperado para eljugador 2 de jugar B y S esh

1� c1x

i0 +

c1x(2 + t2) =

c1x(2 + t2)

y h1� c1

x

i1 +

c1x0 = 1� c1

xrespectivamente. Así pues, jugar S es óptimo si y solo si

t2 �x

c1� 3 = c2

Debemos resolver el sistema formado por las ecuacionesx

c2� 3 = c1

x

c1� 3 = c2

Resolviendo obtenemos c1 = c2 = c (las dos ecuaciones son simétricas)y c2 + 3c � x = 0. Resolviendo esta última ecuación de segundo gradotenemos:

c =�3�

p9 + 4x

2Ya podemos calcular la probabilidad, en equilibrio, de que el jugador 1

juegue B6

x� cx

=

�1� �3�

p9 + 4x

2x

�6O la probabilidad de que el jugador 2 juegue la accion S

Page 97: apuntes_2010

4.3 Introducción a las Subastas 85

Debemos quedarnos con la solución positiva puesto que una probabilidaddebe estar en el intervalo (0; 1). Ahora queremos calcular hacia dondeconverge esta probabilidad cuando desaparece la información incompleta,es decir, cuando x! 0. Así, y tras aplicar la Regla de L�Hopital, tenemos

limx!0

x� cx

= 1� limx!0

"124 (9 + 4x)

�1=2

2

#

de donde

limx!0

x� cx

= 1� 13=2

3

Así pues, cuando la información incompleta desaparece, el comportamientode los jugadores en el equilibrio bayesiano en estrategias puras del juegocon información incompleta se aproxima al comportamiento en el equilibriode Nash en estrategias mixtas del juego original con información completa.

Sin embargo, lo importante de esta sección no es ni el teorema ni elejemplo concreto que lo ilustra, sino lo que nos quiere decir este tipode argumento. La idea fundamental es que una cosa es la situaciónreal que queremos estudiar y otra es el juego que utilizamos para sumodelización y posterior análisis. Así, es posible que los juegos coninformacion completa sean una idealización, puesto que los jugadores, enel mundo real, típicamente disponen de al menos una pequeña cantidad deinformación incompleta acerca de los objetivos y preferencias de los demásjugadores. Al modelizarlo como un juego con información incompleta,estamos aproximando la realidad más que �describiéndola�. ¿Cómo deválida es esta aproximación?. Dependerá de la cantidad de informaciónprivada de los jugadores. El Teorema de Harsanyi nos muestra que en lamedida en que esta información privada sea pequeña, nuestra aproximaciónserá tanto mejor... Como consecuencia, el argumento de Harsanyi muestraque la distinción entre estrategias puras y mixtas puede ser arti�cial.

4.3 Introducción a las Subastas

La subasta más simple es take-it-or-leave-it (La de los comercios: cada bientiene su precio, aparece en una etiquete y si no aparece pues preguntasal vendedor y si se te ocurre preguntar por un descuento te dice: "noestamos en rebajas". Así que o lo tomas o lo dejas). Las más usuales sonlas siguientes

Page 98: apuntes_2010

86 4. Juegos con Información Incompleta

Pujas

Publicas (Con un subastador) Privadas (en un sobre cerrado)Subastador Nombre Precio pagado NombreAscendente Inglesa Primera puja perdedora VickreyDescendente Holandesa Puja ganadora ?

Pregunta interesante: ¿Cuál de ellas elegirías para vender tu objeto?ó ¿Cuál de ellas utiliza ebay? Pero hay subastas más exóticas. . . quetendrás que pensar en los ejercicios de este tema... de momento quedémonosanalizando la subasta de sobre cerrado de primer precio con dos pujadores.En este caso, cada jugador tiene una valoración del bien. Si paga un precio

p a cambio del bien, entonces su ganancia es su valoración menos el preciopagado. Además, cada participante conoce su valoración pero desconocela de su rival. Las valoraciones están uniformemente distribuidas de formaindependiente en el intervalo [0,1]. Cada participante entrega su puja enun sobre cerrado de forma simultánea. La puja más alta gana la subastay el ganador recibe el bien a cambio de pagar su puja. La puja más bajapierde la subasta, no recibe el objeto y no paga nada.Formulemos esta subasta como un juego bayesiano:G (A1; A2;T1; T2; p1; p2;u1; u2)

� Espacio de Acciones: A1 = A2 = [0;1). Una acción para el jugadori es el número que escribe dentro del sobre, lo que técnicamente seconoce como puja en la jerga de las subastas. Sea bi la puja del jugadori, con i = 1; 2.

� Espacio de Tipos: Ti = [0; 1] para i = 1; 2.

� Conjeturas: pi (tj=ti) se obtiene a partir de la distribución uniformepara i = 1; 2.

� Las ganancias son

ui (b1; b2; vi) =

8<: vi � bi si bi > bj(vi � bi) =2 si bi = bj0 si bi < bj

Lo primero que debemos hacer para construir un equilibrio bayesianoes describir las estrategias puras para un jugador. Recuerda que como entodo juego, una estrategia pura es un plan completo de acción. En nuestrocaso, una estrategia pura es un número (puja) para cada tipo (valoracióndel bien subastado) posible [0; 1]. Técnicamente hablando tendríamos unafunción bi : Ti ! Ai, donde bi (vi) 2 [0;1) para i = 1; 2.

De�nicion 29 El par de estrategias fb�1 (v1) ; b�2 (v2)g es Equilibrio Bayesianosi para cada tipo vi 2 [0; 1], b�i (vi) 2 argmaxfbig

(vi � bi) Pr�bi > b

�j (vj)

�+

vi�bi2 Pr

�bi = b

�j (vj)

Page 99: apuntes_2010

4.3 Introducción a las Subastas 87

Fíjate en que no hay nada nuevo bajo el sol... para tener un equilibrio(bayesiano en este caso), cada estrategia debe ser lo mejor que puedeconseguir el jugador dada la estrategia de su rival (y dadas sus creencias,porque tenemos un juego con información incompleta).La único un poco más complicado en este tipo de juegos es que aunque

sepamos la estrategia que va a jugar el rival, no vamos a saber a cienciacierta cuál es nuestro pago. Esto es lo nuevo... Veámoslo con calma.Imagínate que tu rival utiliza la siguiente estrategia: Puja 0 si su tipoes menor que 1/2 y puja 1 si su tipo es mayor o igual que 1/2. Frente aesta estrategia, ¿cuál es tu pago si tu tipo es 0.8 y pujas 0.6? Pues dependedel tipo del rival porque su puja depende de su tipo. Y la informaciónque tienes acerca del tipo del rival es que es extraído del intervalo [0; 1]siguiendo una distribución uniforme. Así pues, tu pago es

(0:8� 0:6)� Pr (tj < 1=2) + (0)� Pr (tj � 1=2) = (0:8� 0:6)�1

2

donde hemos usado la distribución uniforme para decir que laprobabilidad de que el tipo sea menor que 1/2 es 1/2. El siguiente ejemplográ�co te ayudará a entenderlo mejor. Supongamos que tu rival usa lasiguiente estrategia.

Tipo

0   0.2    0.4       0.7   0.9 1

b(v)

E

¿Cuál es la probabilidad de que tú ganes la apuesta si pujas E euros?Pues es simplemente la probabilidad de que el tipo (valoración) de tu rivalsea tal que su puja sea menor que la puja E. Hemos representado en rojodichas tipos valoraciones (tipos). Como los tipos son iid según la uniforme,tenemos por tanto que

Pr (Ganar diciendo E / Rival usa b (v)) =(0:2� 0) + (0:7� 0:4) + (1� 0:9)

(1� 0) =

=0:2 + 0:3 + 0:1

1= 0:6

Page 100: apuntes_2010

88 4. Juegos con Información Incompleta

Bien, poquito a poco estamos aprendiendo a pensar en términos de juegosbayesianos. Ahora demos un paso adelante y pensemos en qué estrategiasyo no quiero utilizar en este subasta.Considera los siguientes grá�cos

Tipo

0                                 1

b(v)

b(v)=v

Tipo

b(v)

Estrategia a Estrategia b

Fíjate en que en el grá�co de la izquierda �estrategia a�, hay tipos quepujan por encima de su valoración, por lo que si ganan tendrían pérdidas...La estrategia a está dominada por la estrategia b, en la que simplementehemos reemplazado los tipos que pujan por encima de su valoración poruna puja de cero...Todas estas consideraciones nos van a permitir responder de forma

elegante a la siguiente pregunta: ¿Existirá algún equilibrio bayesiano lineal?Fíjate en que no queremos restringirnos a estrategias lineales, sino que nosqueremos preguntar si existe un equilibrio en el que las estrategias seanlineales.Bien, pensemos en qué estrategia lineal puede ser una estrategia de

equilibrio. Fíjate en las siguientes �guras:

Page 101: apuntes_2010

4.3 Introducción a las Subastas 89

Tipo

0                                1

b(v)=v

b(v)

Tipo

0                                1

b(v)

Estrategia c Estrategia d

Claramente la estrategia c no puede, porque la estrategia c implicaque algunos tipos pujen por encima de su valoración (recuerda que estádominada y por tanto no puede formar parte de ningún equilibrio) mientrasque la estrategia d implica que algunos tipos pujen un número negativo, yeso no está permitido por las reglas de la subasta. Así pués, el candidatolineal a equilibrio es la siguiente estrategia

Tipo

0                                1

b(v)=v

bj (vj) = cjvj con cj 2 (0; 1)

OK. Estudiemos ahora la función de mejor respuesta frente a un jugadorque utiliza la estrategia bj (vj) = cjvj . Ya sabemos que la mejor respuestabi (vi) debe ser solución del siguiente problema de maximiazión

maxfbig

(vi � bi) Pr (bi > cjvj) +vi � bi2

Pr (bi = cjvj)

donde fíjate en que no estamos restringiendo el espacio de funciones bi(vi) a que sean lineales.

Page 102: apuntes_2010

90 4. Juegos con Información Incompleta

Como el tipo vj del jugador j es una variable aleatoria continua en elintervalo [0; 1], ya sabemos que Pr (bi = cjvj) = 0. Por tanto, el problemaque debemos resolver es

maxfbig

(vi � bi) Pr (bi > cjvj)

Es más, como el tipo vj del jugador j está distribuido según una uniforme,tenemos que

Pr (bi > cjvj) = Pr

�vj <

bicj

�=bicj

Por tanto, el problema a resolver es

maxfbig

(vi � bi)bicj

Antes de resolverlo, veamos por dónde andará:

(i) Subir la puja bi está bien por un lado porque aumenta la probabilidadde ganar Pr (bi > cjvj) pero está mal por otro porque hace que elpremio que se gana (vi � bi) sea menor.

(ii) Bajar la puja bi está mal por un lado porque disminuye la probabilidadde ganar Pr (bi > cjvj) aunque está bien por otro porque hace que elpremio que se gana (vi � bi) sea mayor.

Ya que sabemos algunas cosas sobre la función bi (vi) es hora de calcularlaexplícitamente. La condición de primer orden es

dLdbi

= � bicj+ (vi � bi)

1

cj= 0 =) �bi + vi � bi = 0 =) bi =

1

2vi

Lo que acabamos de demostrar es que la mejor respuesta (sinrestringirnos a estrategias lineales), a una estrategia lineal cjvj es laestrategia lineal 12vi. Por tanto, el único equilibrio lineal es b

�i (vi) =

12vi.

Remark 14 Para el caso de n jugadores, la estrategia lineal de equilibrioes b�i (vi) =

n�1n vi:

4.4 Equilibrio Bayesiano Perfecto. BreveIntroducción

(Adapted from A Course in Game Theory by Martin J. Osborne and ArielRubinstein).Fíjate en que hemos desarrollado en clase un concepto de solución que

puede aplicarse a cualquier juego con información imperfecta. Vale, es muy

Page 103: apuntes_2010

4.4 Equilibrio Bayesiano Perfecto. Breve Introducción 91

matemático y os cuesta trabajo entenderlo. En �n, que sepáis que hay unaclase especial de juegos en forma extensiva cuyo concepto de solución esmucho más fácil que el equilibrio secuencial pero que tiene propiedadessimilares. Es el llamado Equilibrio Bayesiano Perfecto.

Esa clase especial de juegos es aquella la llamada Juegos BayesianosExtensivos con Acciones Observables. En ellos, la naturaleza mueveen primer lugar eligiendo de forma independiente los tipos de los jugadores.Después, las acciones elegidas por los jugadores son observadas por todoslos jugadores. Es decir, la información imperfecta se re�ere a la acciónelegida por la naturaleza, no a las acciones elegidas por los rivales.

En el tema siguiente veremos ejemplos de esta clase de juegos, pero ahoraquiero avanzaros cuál es la de�nición de Equilibrio Bayesiano Perfecto(PBE).

De�nicion 30 Una evaluación (b; p) es un Equilibrio BayesianoPerfecto si

1. Sequential rationality: The strategy for each type is optimal after anysequence of events)

2. Correct initial beliefs: Initially, the other players� beliefs about thetype of each player i be given by nature�s apriori)

3. Action-determined beliefs: Only a player�s action in�uences the otherplayers�beliefs about his type; i.e. you cannot signal what you do notknow.

4. Bayesian Updating: from the observation of player i�s actions.

Es muy legítimo que te preguntes varias cosas: (i) por qué te tengo quecontar dos conceptos de equilibrio para juegos con información imperfectay (ii) Qué relación hay entre ellos. Ahí van mis respuestas:

� PBE no está de�nido para juegos en forma extensiva con accionesno observables. En estos casos, hay gente que simplemente habla deWeak Perfect Bayesian Equilibria (WPBE) que simplemente exigeBayes en la senda, sin imponer restricciones sobre las creencias fuerade la senda de equilibrio.

� En la clase de juegos bayesianos extensivos con acciones observables,todo equilibrio secuencial es bayesiano (pero no al revés)

Page 104: apuntes_2010

Parte II

Economía de laInformación

92

Page 105: apuntes_2010

93

En los capítulos anteriores hemos estudiado las bases teóricas que nos vana permitir abordar el núcleo duro del curso: la Economía de la Información.En este curso nos centraremos en dos temas: la Selección Adversa y elRiesgo Moral.

En el tema 5 estudiaremos la Selección Adversa: una de las partes deuna transacción conoce aspectos de la misma que, siendo relevantes parala transacción, son desconocidos por la otra parte. El típico ejemplo loconstituye la realización de un seguro de vida: el asegurado puede saber quetiene 6 meses más de vida por la presencia de un cáncer de pulmón mientrasque Mapfre no lo sabe... La �solución�a este problema es la transmisiónde señales, a través de la cuál la parte informada de la transacción tratade señalizar, a través de sus acciones, aquello que conoce y la autoselecciónsi es la parte no informada la que mueve en primer lugar.

El tema 6 se centra en el Riesgo Moral:7 una de las partes de latransacción puede realizar ciertas acciones que, afectando a la valoraciónde la transacción por la otra parte, ésta no puede controlar. El ejemplo mástípico puede ser la contratación de un seguro de incendios. El aseguradopuede, nada mas �rmar el seguro, incendiar �accidentalmente� su casa ono tomar medidas de precaución o prevención de incendios. La �solución�a este problema es la provisión de incentivos.

Sea cual sea la naturaleza del problema, es natural preguntarse cuál es elmejor contrato que podemos encontrar para estructurar las transacciones.La respuesta nos la dará el diseño de mecanismos, cuyo análisis quedarelegado a la tercer parte del temario.

Utilizaremos la teoría de juegos que hemos estudiado en los temas 2,3 y 4 para tratar los problemas de selección adversa y riesgo moral. Lacaracterística en común de estos problemas es que existen agentes en latransacción que tienen información superior, es decir, la información esasimétrica.. En este sentido, es útil utilizar el modelo del principal-agentepara analizar estos casos de información asimétrica.8 Los dos jugadores sonel principal y el agente, que generalmente son individuos representativos.El principal contrata a un agente para que lleve a cabo una misión, y elagente tiene una ventaja informacional a cerca de su tipo, sus acciones odel mundo exterior en el que se desenvuelve la situación. Normalmente sesupone que los jugadores �rman un contrato en algún momento del juego, olo que es lo mismo, el principal se obliga a pagar una determinada cantidadde dinero al agente si observa un cierto resultado. Implícitamente estamos

7Este es un caso �agrante de invasión linguística. El original inglés reza Moral Hazard,y que yo sepa Hazard no es azar...

8Aun cuando este término se suele reservar para al análisis de los problemas de riesgomoral, este paradigma será de valiosa utilidad en todos los contextos que analizaremosen este curso.

Page 106: apuntes_2010

94

suponiendo que existe un Tribunal que puede castigar a cualquier jugadorque rompa el contrato �rmado siempre y cuando esta alegación pueda serprobada utilizando información pública.

Las siguientes �guras recogen los dos tipos de problemas provocados porla información asimétrica en un contexto del modelo principal-agente.

� Riesgo Moral : El principal P ofrece al agente A un contrato, que éstepuede aceptar o rechazar. Acto seguido, el agente A realiza una acciónque no es observada por el principal P, pero que afecta a la funciónde pagos del principal.9 Los pagos para cada uno de los jugadores serealizan.10

En este sentido, el �problema�del principal es maximizar sus pagosesperados sujeto a dos restricciones: Compatibilidad de Incentivos:que el agente elija de motu propio la acción que el principal quiere,y Restricción de Participación: que el agente acepte el contrato.

� Selección Adversa: La naturaleza elige un tipo para el agente A quees desconocido para el principal P. El principal ofrece un contratoal agente A, que este puede aceptar o rechazar. Los pagos para losjugadores son realizados.11

Como ejemplo de este tipo de situaciones, considera el siguiente cuadro:En esta segunda parte del temario los temas siguen una estructura

similar:

1. Presentación del problema económico

2. Descripción según la Teoría de Juegos

3. Equilibrios del modelo (en estrategias puras)

(a) Nash

(b) Perfecto en Subjuegos

(c) Secuencial, según las características del modelo.

9Por ello existirá una acción que el principal pre�era, en el sentido de que maximizelos pagos del principal.10Técnicamente algunos autores llaman a este tipo de situación Riesgo Moral con

acción escondida, para diferenciarlo del Riesgo Moral con conocimiento escondido. Estadistinción no será relevante en este curso.11Es a veces útil diferenciar entre señal y mensaje. Una señal es una acción que conlleva

un coste para el agente. Un mensaje es un costless statement.

Page 107: apuntes_2010

95

MODELO PRINCIPAL AGENTE Clave

SelecciónAdversa

Banco Préstamo Inversor arriesgado

Compañía de seguros Tomador seguro Enfermedad mortal

Comprador Vendedor Calidad objeto venta

Empresa Trabajador Habilidad productiva

SeñalizaciónComprador Vendedor Garantía

Empresa Trabajador Master

Screening Compañía de seguros Tomador de seguro Varios contratos

Riesgo Moral

Compañía de seguros Tomador seguro Care to avoid theft

Compañía de seguros Tomador seguro Fumar y beber s.m.

Terrateniente Jornaleros Esfuerzo recolector

Accionista Directivos Riesgo inversión

Dueño casa alquiler Inquilino Cuidado hogar

INFORMACIÓN INFERIOR INFORM. SUPERIOR

Page 108: apuntes_2010

96

4. Resultado en equilibrio.

Detalle Técnico Importantísimo: En esta segunda parte del curso,cuando tengáis que aplicar el Equilibrio Secuencial nunca os exigiré que memostréis los trembles. Si hace falta lo haré yo, aunque sólo una vez: en elsiguiente caso, voy a calcular explícitamente el equilibrio secuencial en elejemplo de Cournot con información asimétrica.

El Secuencial de Cournot Asimétrico

( ) ( )

( ) ( )( )

( ) ( ) { }b,mallfor

m

b

trequiremenyConsistenc

≠•=×−+×

×=−−−•

−=×−+×

×−=−−−

=×−+×

×=−−−

0111

10Pr

1111

11Pr

1111Pr

:

θθ

θθθ

θ

θθθ

θ ( ){ }

[ ]( )

{ }[ ]

{ }( )[ ]

( ) ( )[ ]1*

21

1*

21*

1

22*

1*

2

22*

1*

2

1

maxarg

maxarg

maxarg

:

1

2

2

qccqqp

qccqqpq

qcqqpcq

qcqqpcq

yRationalitSequential

L

Hq

Lq

L

Hq

H

−−−−+

+−−−∈

−−−∈

−−−∈

θ

θ

GOD

2 2θ 1­θ

1

¿Quién dijo queDios no juega a

los dados?

a     b    c     d    e    f     g                                              h     i     j     k    l    m    n

( ) ( ){ }*1

*2

*2 ,, qcqcq

mEquilibriuSequential

LH

q2*(cH) q2*(cL)0        2  3  4   5  6                                                        0   1   2  3  4         6

Page 109: apuntes_2010

This is page 97Printer: Opaque this

5Selección Adversa, Señalización yScreening

5.1 Selección Adversa: El Modelo de Akerlof

5.1.1 Formulación Tradicional

Akerlof estimuló todo un campo de investigación cuando en 1970 publicó enla revista Quarterly Journal of Economics (Q.J.E.) su modelo del mercadode coches de segunda mano,1 en el que la selección adversa surge porque lacalidad de los coches es sólamente conocida por los vendedores. Es términosmás técnicos, el principal hace un contrato de compra de un bien cuyacalidad, que puede ser alta o baja, no es contratable. La característicabásica del modelo de los limones de Akerlof es que el mercado puedecolapsar incluso aunque existan ganancias asociadas al intercambio.

El modelo básico es el siguiente: tenemos un mercado de coches usadosdonde existen dos tipos de coches:

� Coches de alta calidad (h),

� Coches de baja calidad (l)

Por simplicidad, supondremos que:

1. El número de coches usados es N � 1:

1En inglés, se llaman lemons, por lo que este modelo suele denorminarse el modelode los limones de Akerlof.

Page 110: apuntes_2010

98 5. Selección Adversa, Señalización y Screening

2. La proporción de coches tipo h es x, donde 0 � x � 1:

3. Todos los agentes, tanto compradores como vendedores de coches, sonneutrales al riesgo.2

4. Sea bj la valoración que un comprador (buyer) hace de un coche tipoj, donde j 2 fh; lg : Sea sj la valoración que un vendedor (seller) hacede un coche tipo j, donde j 2 fh; lg : Así,

bj � sj para j 2 fh; lg

por lo que existen ganancias asociadas al intercambio.

5. A los precios bh; bl o inferiores, existe un número grandísimo decompradores. Sin embargo, la oferta de coches es inelástica..

En esta sección consideraremos tres diferentes escenarios:

(a) Información completa:

En este caso, todos los participantes del mercado conocen la calidad decada coche, por lo que se puede establecer un mercado de coches buenos(h) y un mercado de coches malos (l), cada uno de los cuales tendrá supropio precio de equilibrio. Bajo el supuesto 5, este precio se corresponderácon la valoración del comprador bj .

En este escenario, no existe ningún problema de selección adversa.

(b) Información incompleta pero simétrica:

En este escenario, ya no tendremos dos mercados diferentes porque lascalidades de los coches no son conocidas ni por los compradores ni porlos vendedores. Por lo tanto, tendremos un solo mercado y un solo precioP . ?�Cuál será la valoración que un comprador haga de un coche?. Elcomprador sabe que la proporción de coches de alta calidad es x, por loque su valoración será

E(b) = xbh + (1� x)bl

De la misma forma, la valoración que un vendedor hará de su propiocoche será

E(s) = xsh + (1� x)sl

Dado que bj � sj para j 2 fh; lg ; tenemos que E(b) � E(s) por loque existen ganancias esperadas asociadas al intercambio. Los coches sevenderán al precio P = E(b).

2Este es un supuesto que implicitamente hemos realizado en el ánalisis de los temas 2y 3. Frente a cualquier lotería, siempre hemos considerado que un jugador maximizabapagos esperados. Eso es cierto si el agente es neutral al riesgo.

Page 111: apuntes_2010

5.1 Selección Adversa: El Modelo de Akerlof 99

En este escenario, y pese a que existe información incompleta, tampoco seproduce ningún problema de selección adversa porque ningún participanteen el mercado de coches usados tiene información superior; es decir, lainformación es simétrica.

(c) Información incompleta pero asimétrica:

En este caso, los compradores toman acciones dependiendo de resultadosesperados pero no los vendedores, que sí conocen la calidad de los cochesque van a vender. Así, los vendedores tienen información superior. Esta esla causa que puede generar el problema de selección adversa.

Se puede dar la siguiente situación. Tomemos una proporción x de cochesde alta calidad y unas valoraciones bj y sj tal que E(b) sea menor que sh, esdecir, el precio de intercambio de coches es menor que la valoración de unvendedor de un coche de alta calidad. En este caso, el mercado de cochesde alta calidad colapsa, puesto que los vendedores de coches de alta calidadno querrán vender su coche a un precio menor que su valoración. Así, loscoches buenos desaparecen del mercado. Solo quedan coches malos que sevenderán a un precio bl.

Aquí tenemos el problema de selección adversa: sólo se venden coches desegunda mano (selección no aleatoria de la población). Este problema decolapso del mercado puede agravarse si

1. Aumenta el número de calidades de los coches en venta.

2. Las diferencias entre las valoraciones de los compradores y vendedoresson menores.

Para que juguemos un poco, considera el siguiente ejemplo numérico:

1       2       3       4        5

sL bL sH bH

Cacharros2/3

Normales1/3

Valoración

1. Información completa:

(a) Mercado de cacharros: p=2

(b) Mercado de coches normales: p=5

2. Información incompleta pero simétrica:

Page 112: apuntes_2010

100 5. Selección Adversa, Señalización y Screening

(a) Ningún lado del mercado es capaz de distinguir los dos tiposde coche por lo que sólo existe un mercado. Los compradoresestán dispuestos a pagar como mucho su valoración de un cocheque con probabilidad 2

3 es un cacharro y con probabilidad13

es normal. Por tanto, el precio que están dispuestos a pagar esp = E (b) = 2� 2

3 + 5�13 = 3. Un vendedor valora su coche en

E (s) = 1� 23 + 4�

13 = 2, por lo que está dispuesto a vender el

coche a 3.

3. Información incompleta y asimétrica:

(a) Los compradores están dispuestos a pagar E (b) = 3 pero elproblema es que un vendedor de un coche normal no aceptaporque su valoración es mayor: 4. Acaba de colapsar el mercadode coches normales... sólo se venden cacharros a un precio 2.

5.1.2 Formulación con la Teoría de Juegos

Ahora quiero modelizar el modelo de Akerlof utilizando el lenguaje de laTeoría de Juegos. ¿Es necesario? Pero si lo he entendido con el ejemplo...

1. Jugadores: Comprador y vendedor

2. Timing:

(a) La naturaleza elige la calidad del coche según una distribuciónde probabilidad p (�)

(b) La naturaleza revela la calidad al vendedor pero no alcomprador.

(c) Se negocia la compra-venta del coche

3. Pagos:

(a) Si se produce la venta, entonces el vendedor obtiene P-s y elcomprador obtiene b-P

(b) Si no se produce la venta, ambos obtienen utilidad 0.

¿Cómo modelizamos el proceso de negociación entre comprador yvendedor (bargaining procedure)? Hay muchísimos enfoques, yo os cuentouno: El vendedor ofrece un precio de venta P que el comprador puedeaceptar o rechazar (take-it-or-leave-it).

Page 113: apuntes_2010

5.1 Selección Adversa: El Modelo de Akerlof 101

Practiquemos pensando en Akerlof con información completa. El árbolde juego es el siguiente:

P                                                                P

Seller

00

00P­sH

bH­PP­sL

bL­P

x H          L 1­x

DIOS

Buyer

Seller

Buyer

Buyer

Buyer Buyer

Buyer

Como ves, es un juego dinámico con información completa, por lo que elconcepto de solución que debemos aplicar es la Perfección en subjuegos: Elbuyer acepta cualquier precio no superior a su valoración. El seller ofreceP = bj .

Por tanto, el resultado en equilibrio es que se produce la transacción a unprecio de venta que coincide con el valoración del comprador �el vendedorextrae todo el excedente del consumidor-. Esto está bien, porque acabamosde replicar el resultado con la formulación tradicional.

Page 114: apuntes_2010

102 5. Selección Adversa, Señalización y Screening

En el siguiente grá�co tienes resuelto formalmente el ejemplo numéricoanterior

Akerlof con información completaGOD

Vendedor 1­θ VendedorθTipo HTipo L

1       2       3       4        5

sL bL sH bH

1      2      3     4      5 1      2      3     4      5

A    R A    R A    R A    R A    R A    R A    R A    R A    R A    R

00

00

00

00

00

00

00

00

00

00

01

10

2­1

3­2

4­3

­34

­23

­12

01

10

Equilibrio de Nash Perfecto en Subjuegos– Comprador: Sbuyer: {L,H} x [1,5] à {A, R}

• Acepta si el precio es menor o igual a su valoración.• Rechaza en caso contrario

– Vendedor: Sseller: {L, H} à [1,5]• Ofrece precio 5 si el tipo alto.• Ofrece precio 2 si es tipo bajo.

Precios por encima de lamáxima valoración del

comprador y por debajo de lamínima del vendedor están

dominados, así que losignoro en la representación

estratégica del juego

Comprador Comprador Comprador Comprador Comprador Comprador Comprador Comprador Comprador Comprador

Si crees que te has enterado, entonces prueba a resolver el caso deinformación completa pero simétrica (es el problema 5.1). Te facilito las

Page 115: apuntes_2010

5.1 Selección Adversa: El Modelo de Akerlof 103

cosas dibujándote el árbol del juego:

Seller

Buyer

x H          L 1­x

DIOS

Buyer

Buyer

1       2       3       4        5

sL bL sH bH

BuyerBuyer

1 2 3 4 5 1 2 354

Remark 15 Baruch de Spinoza (1632-1677). Spinoza reduce las tressustancias descartianas a una sola: sustancia divina in�nita, que segúnla perspectiva que se adopte, se identi�ca bien con Dios o bien con laNaturaleza. De hecho, ambos términos llegan a ser equivalentes para él:Deus sive Natura -God is not distinguishable from Nature-

La gracia del asunto consiste ahora en estudiar el caso de informaciónincompleta y asimétrica. El árbol de juego es el siguiente:

Buyer

00

bH­sH

bH­bH bL­sL

bL­bL

Seller                                               Seller

x H             L 1­x

DIOS

No es secuencialmenteracional para el tipo L

poner el precio bL

Buyer

Buyer

bH bL

00

[1] [0]

[0] [1]bL

bH

bH­sL

bL­bH

[p] [1­p]

Page 116: apuntes_2010

104 5. Selección Adversa, Señalización y Screening

Es relativamente sencillo demostrar que el precio no señaliza la calidad.Es decir, que no existe un equilibrio secuencial separador que replique elequilibrio con información completa. Para verlo tratemos de construirlo yveamos dónde se rompe el candidato:

� Estrategia vendedor: Establece precio bH si tipo alto y bL si limón.

� Estrategia comprador: Acepta precios bL y bH .

� Creencias senda comprador: Cree j si ve precio bj . ¿Fuera senda?

¿DÓNDE SE ROMPE ESTE CANDIDATO A EQUILIBRIO SECUEN-CIAL? Pues el tipo L con querría poner el precio bL sino el precio bH

porque de esa forma ganaría más.

Pero es fácil demostrar que ambos tipos pongan un precio bH no esequilibrio, porque

� Consistencia: Buyer: p=x en la senda de equilibrio y libertad fuerade ella (por ejemplo, cree que el tipo es bajo siempre).

� Racionalidad secuencial: Buyer: Si rechaza gana 0 y si aceptagana x(bH-bH) + (1-x) (bL-bH) que es negativo. Ergo no essecuencialmente racional aceptar.

¿Existe la posibilidad de algún equilibrio pooling? Pues el pooling naturales que ambos tipos establezcan pongan el siguiente precio xbH +(1�x)bL.

� Consistencia: Buyer: p=x en la senda de equilibrio y libertad fuerade ella. Supongamos por ejemplo que cree que el tipo es bajo siempre.

� Racionalidad secuencial:

�Buyer: Acepta el precio de equilibrio y en los demás casos, aceptasiempre que el precio sea inferior a bL.

� Seller L: OK

� Seller H: Rechaza si sH>xbH+(1-x)bL

Si de verdad crees que entiendes, entonces ahora es el momento de realizarel ejercicio 5.2, en el que consideramos un proceso de negociación entrecompradores y vendedores distinto.

Page 117: apuntes_2010

5.2 Señalización: El Modelo de Spence 105

5.2 Señalización: El Modelo de Spence

5.2.1 Juegos de Señalización.

Un juego de señalización es un juego con información imperfecta con dosjugadores: un emisor (S) y un receptor (R).

El timing del juego es el siguiente:

1. La Naturaleza elige un tipo ti para el emisor a partir de un conjuntode tipos T = ft1; :::; tNg de acuerdo a una función de probabilidadp(ti), donde p(ti) � 0 para cada i y

PNi=1 p(ti) = 1:

2. El emisor observa su tipo ti y elige un mensaje o señal mj a partirde un conjunto de mensajes M = fm1; :::;mJg :

3. El receptor observa el mensaje enviadomj y entonces elege una acciónak a partir de un conjunto de acciones A = fa1; :::; aKg :

4. Los pagos vienen dados por US (ti;mj ; ak) y UR (ti;mj ; ak) :

En esta sección vamos a tratar de no complicarnos la vida así que hemossupuesto que los conjuntos T;M y A son �nitos.

Recuerda que para cualquier juego, incluidos los juegos de señalizaciónque estamos estudiando, una estrategia pura para un jugador es un plancompleto de acción.3 Por lo tanto, en este juego, una estrategia pura parael emisor debe especi�car el mensaje a emitir para cada uno de sus tiposposibles, mientras que una estrategia pura para el receptor debe especi�carla acción a tomar para cada posible mensaje que pueda recibir.

Ahora es el momento de utilizar la clasi�cación que hicimos en el temaanterior de las estrategias puras en un contexto bayesiano. Una estrategiapura es pooling en nuestro contexto si para cualquier tipo, la estrategia delemisor le dice que emita el mismo mensaje, mientras que una estrategiapura es separadora si para cada tipo especi�ca una acción distinta.4

El siguiente principio es el opuesto al principio de Akerlof.

De�nicion 31 Full Disclosure Principle: If there is a credible meansfor an individual to disclose that he is above the average of a group, he willdo so. This disclosure will implicitly reveal that other non-disclosers were

3Esta debe ser la n-ésima vez que escribimos la de�nición de estrategia pura para unjugador. Espero que nadie tenga dudas sobre lo que es una estrategia... Luego no medigáis en el examen que no lo sabéis.

4Si el número de tipos posibles es mayor que 2 y hay un subconjunto de tipos queespeci�can la misma acción hablaremos de estrategias parcialmente pooling o semi-separadoras.

Page 118: apuntes_2010

106 5. Selección Adversa, Señalización y Screening

below the average, which will give them the incentive to disclose, and so on. . . In equilibrium, everyone will explicitly or implicitly disclose his privateinformation.

Remark 16 El Principio de Revelación Máxima: Si existe unamanera creíble de que un individuo revele que está por encima de la mediade un grupo,la utilizará. Esta revelación implicitamente revelará que otrosestaban por debajo de la media, lo que les dará incentivos a revelar suinformación, y así sucesivamente... En equilibrio, todos revelarán, explícitao implícitamente, su información privada.

Ejemplo 13 El croar de las ranas al anochecer en las charcas del campono es sino el funcionamiento del Full Disclosure Principle. El espectáculonocturno en El Viso también, aunque yo pre�ero las charcas estivales.

5.2.2 El Modelo de Spence

La enorme literatura sobre juegos de señalización empieza con el modelode Spence5 (1973). En esta sección, estudiaremos una versión sencilla deeste modelo modelizado como un juego en forma extensiva y buscaremosalgunos de sus Equilibrios Secuenciales.

El timing del juego es el siguiente:

1. La naturaleza determina la habilidad productiva de los trabajadores,�, que puede ser alta (H) o baja (L). La probabilidad objetiva de quesea alta es q.

2. El trabajador conoce su habilidad productiva y elige un nivel deeducación, e > 0:

3. Dos empresas observan el nivel de educación elegido por cadatrabajador pero no su habilidad productiva y, simultáneamente,ofrecen un salario al trabajador.6

4. El trabajador acepta el mayor salario ofrecido. Sea w el salario queel trabajador acepta.

5. Los pagos son los siguientes:

(a) w� c (�; e) para el trabajador, donde c (�; e) es el coste para untrabajador de habilidad productiva � de conseguir un nivel deeducación e

5Es interesante tener en cuenta que precedió tanto al uso generalizado de los juegos enforma extensiva para la modelización de problemas económicos como a las de�nicionesde equilibrio tales como el Equilibrio Bayesiano Perfecto y el Equilibrio Secuencial.

6El hecho de que existan dos empresas en el papel de receptor hace que este modelono se ajuste demasiado bien a lo expuesto en la sección anterior...

Page 119: apuntes_2010

5.2 Señalización: El Modelo de Spence 107

(b) y (�; e) � w para la empresa que contrata al trabajador,donde y (�; e) es la producción de un trabajador de habilidadproductiva � y nivel de educación e y cero para la empresa queno ha contratado al trabajador.

En esta sección nos centraremos en el estudio de los EquilibriosSecuenciales en los que las empresas interpretan el nivel de educación delos trabajadores como una señal de su habilidad productiva y por lo tanto,ofrecen un salario mayor al trabajador con mayor nivel educativo.7

Los supuestos del modelo son los siguientes:

1. Los trabajadores menos habilidosos encuentran la señalización máscostosa que los trabajadores más habilidosos. En términos mástécnicos:

@c (L; e)

@e>@c (H; e)

@e

e

w IL

IH

APROBADO

NOTABLE

SOBRE

La interpretación de este supuesto es la siguiente: consideremos untrabajador de habilidad � con educación e1 que tiene un salario w1.Calculemos el incremento en el salario que sería necesario ofrecer paraque este trabajador incrementara su educación hasta el nivel e2: Larespuesta depende de la habilidad del trabajador: los trabajadoresmenos habilidosos encontrarían más costoso adquirir el nuevo nivel

7En este modelo interpretaremos e como las notas del trabajador en sus estudios masque como anos de estudio. Así pués, este modelo se puede aplicar a una promoción deestudiantes de una carrera, por ejemplo, la vuestra...

Page 120: apuntes_2010

108 5. Selección Adversa, Señalización y Screening

educativo que los trabajadores más habilidosos. En términos grá�cos,la curva de indiferencia de los trabajadores menos habilidosos seríamás inclinada que la de los trabajadores más habilidosos.8

2. El segundo supuesto dice que las empresas compiten entre ellas hastael punto en que los bene�cios esperados son cero. En este sentido,para cualquier nivel de educación e, el salario ofrecido es

w (e) = � (H j e) y (H; e) + [1� � (H j e)] y (L; e)

donde � (H j e) son las creencias de que el trabajador con nivel deeducación e sea de habilidad alta.

3. Las creencias de las dos empresas son idénticas9

La conclusión que podemos sacar de estos supuestos es que en cualquierEquilibrio Bayesiano Perfecto, los salarios van a venir determinados por laecuación

w (e) = � (H j e) y (H; e) + [1� � (H j e)] y (L; e)

Para poder entender más fácilmente los Equilibrios Secuenciales de estemodelo de señalización, empecemos por analizar el caso de informacióncompleta.

1. Información completa.

En este caso, la competencia entre las empresas hace que el salarioofrecido a cada trabajador sea simplemente w (e) = y (�; e)

e

w

y(η,e)

8En términos más ténicos, esta condición se denomina single-crossing condition, ocondición de Spence-Mierless.

9Dentro de la senda de equilibrio es obvio que tienen que ser iguales, puesto queambas empresas utilizarían la Regla de Bayes para determinarlas. Este supuesto loutilizaremos para forzar a las empresas a que sus creencias sean idénticas fuera de lasenda de equilibrio.

Page 121: apuntes_2010

5.2 Señalización: El Modelo de Spence 109

por lo que un trabajador con habilidad � elegirá su nivel de educacióne tal que

e 2 argmaxe

[y (�; e)� c (�; e)]

Sea esta solución e� (�) y sea w� (�) = y [�; e� (�)] :

2. Información Incompleta.

En el caso de que la habilidad del trabajador en cuestión seadesconocida por las empresas, pueden presentarse dos situacionesbásicas:

(a) Caso de no envidia.

Supongamos que la empresa ofrece los salarios w� (H) y w� (L),de tal forma que

w� (L)� c [L; e� (L)] > w� (H)� c [L; e� (H)]

Es decir, para un trabajador de calidad baja intentar llegar alnivel de educación e� (L) es tan costoso que pre�ere elegir elnivel de educación adecuado a su baja habilidad.

e

w

y(L,e)

IH

ILy(H,e)

(b) Caso de envidia.

En este caso, para el trabajador de habilidad baja es bene�ciosohacerse pasar por un trabajador de habilidad alta y conseguire� (H), para engañar a las empresas y conseguir un salario

Page 122: apuntes_2010

110 5. Selección Adversa, Señalización y Screening

mayor, es decir, w� (H).

e

w

IH

IL

Este modelo es tan interesante como complejo, por lo que no podemoshacer un estudio profundo de todos sus Equilibrios Secuenciales. En lugarde eso, vamos a considerar unos cuantos ejemplos de equilibrios baysianosperfecos, diferenciando, como no, entre equilibrios pooling y equilibriosseparadores.

Equilibrios pooling.

En esta sección estudiaremos equilibrios pooling sin hacer referenciaexplícita a si estamos considerando el caso de envidia o no envidia, puestosque en ambos casos existen equilibrios pooling que son secuenciales.

Como ya sabemos de temas anteriores, en un equilibrio pooling, ambostipos de trabajadores eligen un mismo nivel de educación. Denotemos estenivel de educación por ep, es decir, e (H) = e (L) = ep:

Page 123: apuntes_2010

5.2 Señalización: El Modelo de Spence 111

e

w

y(L,e)

y(H,e)

IL

q y(H,e) + (1­q) y(L,e)

eP

El requisito de consistencia implica que las creencias de las empresasdepués de observar ep deben ser � (H j ep) = q.Esto implica que el salario en equilibrio ofrecido por las empresas es

wp = w (e) = q (H; e) + (1� q) y (L; e)

Para completar la descripción del equilibrio pooling, necesitamos:

1. (a) Consistencia de las creencias fuera de la senda de equilibrio,es decir, para valores de educación distintos de ep. Así yatendríamos determinados los salarios ofrecidos por las empresasfuera de la senda de equilibrio.

(b) Racionalidad secuencial: Demostrar que la mejor respuesta decada tipo del trabajador es precisamente ep.

Una posibilidad es que las empresas crean que cualquier nivel deeducación distinto de ep implica un nivel de habilidad del trabajadorbaja. Así:

� (H j e) =�0 si e 6= epq si e = ep

Por tanto, el salario ofrecido por las empresas es

w (e) =

�y (L; e) si e 6= epwp si e = ep

Entonces, un trabajador con habilidad � eligirá un nivel de educacióne� tal que

e� 2 argmaxe

[w(e)� c (�; e)]

Page 124: apuntes_2010

112 5. Selección Adversa, Señalización y Screening

Sería interesante que comprobaras que los trabajadores encuentranóptimo elegir ep:

Este es un equilibrio secuencial de entre la multitud que podemosencontrar, porque cambios en las creencias fuera de la senda deequilibrio y cambios en los niveles de educación elegidos por losdistintos trabajadores nos llevan a otros equilibrios pooling.

Equilibrios Separadores.

En este caso, la diferencia es crucial entre el caso de envidia y no envidia.

1. Caso de no envidia.

En este caso, sólo existen equilibrios separadores, puesto que altrabajador de habilidad baja no le interesa �ngir y hacerse pasar porun trabajador de habilidad alta. Así, un posible equilibrio secuencialsería el siguiente:

(a) Nivel de educación elegido:

e (L) = e� (L)

e (H) = e� (H)

Los trabajadores eligen niveles de educación como siestuviéramos en el caso de información completa. Es fácilexplicar por qué: no hay envidia...

(b) Creencias en la senda de equilibrio:

� (H j e� (L)) = 0� (H j e� (H)) = 1

(c) Salarios ofrecidos en la senda de equilibrio:

w� (L) = y (L; e� (L))

w� (H) = y (H; e� (H))

(d) Fuera de la senda de equilibrio.

Tenemos que explicitar, para describir perfectamente elEquilibrio Bayesiano Perfecto, tanto las creencias como lossalarios fuera de la senda de equilibrio. Pensad un poco...encualquier caso, en el apéndice encontraréis una posible solución.

Page 125: apuntes_2010

5.2 Señalización: El Modelo de Spence 113

e

w

y(L,e)

IH

IL

y(H,e)

Racionalidad secuencial: La explicación del comportamiento de losagentes en este caso es bastante simple: dado que no hay envidia, eltrabajador con habilidad alta elige su nivel óptimo de educación coninformación completa porque sabe que un trabajador con habilidadbaja nunca va a tratar de hacerse pasar por uno de habilidad alta.Así, en este caso, e� (H) es su�ciente para señalizar que uno es dehabilidad alta.

2. Caso de envidia.

Equilibrios separadores con envidia.

El caso más interesante es el de los equilibrios separadores en elcaso de envidia. Aún cuando tengamos un equilibrio separador,el trabajador de habilidad alta nunca va a conseguir el salariow (e) = y (H; e), es decir, su salario óptimo con información completa,eligiendo el nivel de esfuerzo e� (H) de información completa, porqueen este caso, el trabajador con habilidad baja tiene incentivos a �ngiry adquirir el nivel de educación e� (H) para hacerse pasar por untrabajador de habilidad alta.

Page 126: apuntes_2010

114 5. Selección Adversa, Señalización y Screening

e

w

y(L,e)

IH

IL

y(H,e)

eSep

Por tanto, e� (H) no puede formar parte de un equilibrio separador !!

El nivel de educación elegido por un trabajador de habilidad altaes tendrá que ser mayor que e� (H), pero, ¿cuánto mayor? Hastael punto en que al trabajador de habilidad baja no le interese�ngir. La intuición de este resultado es bastante clara: El trabajadorde habilidad alta busca un nivel de educación para separarse(distinguirse) del trabajador de habilidad baja eligiendo un nivel deeducación que no puede ser replicado por el trabajador de habilidadbaja. Este es un maravilloso ejemplo que ilustra un maravillosoprincipio: La separación es costosa, emitir una señal (nivel deeducación) para que el emisor �reconozca� que somos de calidadalta tiene un coste: un nivel de educación mayor que en el caso deinformación completa.

Una vez que el trabajador de habilidad alta ha elegido es, la empresareconocerá sin problemas al trabajador de habilidad baja y por lotanto le ofrecerá un salario y (L; e (L)). Así, el nivel de educaciónelegido por este trabajador será aquel que maximice sus pagosesperados, es decir,

e� 2 argmaxe

[y (L; e (L))� c (L; e(L))]

que no es otro que e� (L), el nivel de educación elegido por estetrabajador en el caso de información completa.

Así, un ejemplo de un equilibrio separador sería:

(a) Nivel de educación elegido:

Page 127: apuntes_2010

5.3 Racionamiento del Crédito: El Modelo de Stiglitz y Weiss 115

i. e (L) = e� (L)e (H) = es

(b) Creencias en la senda de equilibrio:

i. � (H j e� (L)) = 0� (H j es) = 1

(c) Creencias fuera de la senda de equilibrio:

i. � (H j e) =�0 si e < es1 si e � es

(d) Esquema salarial :

i. w (e) =�y (L; e) si e < esy (H; e) si e � es

Lo único que nos queda por hacer es comprobar que realmente es unequilibrio secuencial. Para ello tenemos que ver que los trabajadoreseligen los niveles de educación de equilibrio, dado el esquema salarialy las creencias de las empresas. Además, que las empresas maximizanpagos esperados (eso ya lo sabemos, bene�cios esperados cero) y porúltimo que las creencias son consistentes. Como siempre, lo dejamospara que lo penséis un poco...

De nuevo surge la situación anterior, en la que este es un simpleejemplo de entre la multitud de equilibrios separadores que podemosencontrar. Sin embargo, eso es algo que no nos preocupa en estecurso...

5.3 Racionamiento del Crédito: El Modelo deStiglitz y Weiss

Esta sección versa sobre una de las respuestas típicas de los bancos en elmercado de créditos ante la posibilidad de selección adversa. Para verloempecemos por formalizar una de las ideas comunmente más aceptadas enel mundo bancario: a mayor probabilidad de impago de un crédito, mayortipo de interés.

Supongamos que eres un banco (neutral al riesgo) que puede conseguiruna determinada cantidad de recursos L a un tipo de interés iLT (porejemplo, en los mercados de capitales internacionales, o en el mercadointerbancario, o del Banco Central Europeo). Tu negocio consiste en prestarese dinero a individuos que vienen descritos por la probabilidad 1 � p deimpago.

Page 128: apuntes_2010

116 5. Selección Adversa, Señalización y Screening

Querrás prestar el dinero siempre que te sea rentable, es decir, siempreque tus ingresos p (1 + iL)L+ 0 (1� p) �donde iL es el tipo de interés quecargas�sean mayores que tus pagos

�1 + iLT

�M . Para que los paréntesis

(1 + algo) no nos enmarañen las expresiones, hagamos un cambio devariable: Sea r = 1 + i. Así, el banco prestará el dinero siempre que

prlL+ 0 (1� p) � rLTL

Esto implica la existencia de una cota inferior para tu tipo de interés

rL �rLT

p= brL

Si ahora suponemos que estás en un entorno competitivo, entonces lalucha de tipos de interés entre los bancos te llevará a establecer como tipode interés esa cota inferior, precisamente la que te da bene�cios cero. Comoves, brL es tal que cuanto mayor es la probabilidad de impago, mayor es eltipo de interés al que prestarás el dinero.

Lema 1 Conventional wisdom: A mayores probabilidades de impago, cobramayores tipos de interés

Pero ojo, este lema tiene sentido en el marco teórico que hemosdesarrollado hasta el momento: el banco conoce el perfectamente lascaracterísticas del deudor. En el caso en el que el banco no conozca todaslas características relevantes, entonces el anterior lema no tiene por qué sercierto; es más, no será cierto.

Supongamos que con el crédito L, el deudor quiere �nanciar un proyectode inversión con rentabilidad R. Supongamos que además el banco exigeuna garantía C (collateral). Entonces, el impago del crédito se producirásiempre que R+ C � rLL.

No nos hará falta pero es interesante que entiendas que los bene�cios delbanco son

�Bank = min f(1 + rL)L;R+ Cg

Sigamos adelante. Supongamos que la rentabilidad del proyecto deinversión Rx es una variable aleatoria que con probabilidad 1=2 es R0+x ycon probabilidad 1=2 es R0�x, con x > 0. Fíjate en que todos los proyectosde inversión tienen la misma rentabilidad esperada

E (Rx) = R0

pero di�eren en el riesgo, puesto que

V AR (Rx) =1

2(R0 �R0 � x)2 +

1

2(R0 �R0 + x)2 = x2 > 0

Page 129: apuntes_2010

5.3 Racionamiento del Crédito: El Modelo de Stiglitz y Weiss 117

Supongamos adicionalmente que nos restringimos a valores de lasvariables tales que si el proyecto no va bien, entonces el inversor no puededevolver el préstamo más los intereses pactados; es decir, supongamos

R0 � x+ C < (1 + rL)L

Finalmente supongamos que hay dos tipos de inversores equiprobables eindistinguibles para el banco: los buenos (poco riesgo, i.e. x pequeñita) ylos malos (más arriesgados, i.e. x más grande).El árbol del juego es el siguiente

GOD ½

BANCO

½ MaloBueno

1      2      rL 4      5 1      2      rL 4      5

A    R A    R A    R A    R A    R A    R A    R A    R A    R A    R

[½]

00

00

00

00

00

00

00

00

00

00

πB

πIπB

πIπB

πIπB

πIπB

πI

Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor

πB

πIπB

πIπB

πIπB

πIπB

πI

[½]

donde en cada nodo terminal en el que un inversor de tipo j acepta eltipo de interés rL del banco los pagos de los jugadores son

�Banco =1

2

�R0 � xj + C

�+1

2(1 + rL)L� L

�Invj =1

2(�C) + 1

2

�R0 + x

j � (1 + rL)L�

Pensemos en qué sería un equilibrio secuencial en este modelo. Para elloempecemos por las estrategias para los inversores, que son las más fáciles:este juego tiene un puñado de subjuegos: uno por cada tipo de interés quepone el banco y tipo del inversor. La racionalidad secuencial exige que encada subjuego el inversor acepte siempre que su bene�cio esperado no seanegativo

�Invj =1

2(�C) + 1

2

�R0 + x

j � (1 + rL)L�� 0

Si te �jas bien, el bene�cio para un inversor tipo j es decreciente en eltipo de interés rL ofrecido por el banco. Por ello, para un tipo de interés

Page 130: apuntes_2010

118 5. Selección Adversa, Señalización y Screening

dado, el inversor acepta el préstamo siempre que su rendimiento xj sealo su�cientemente grande, es decir, siempre que sea lo su�cientementearriesgado. Sea bx el rendimiento mínimo �es decir, el riesgo mínimo�necesario para que el inversor �rme el préstamo a un tipo de interés rL.

�Invj =1

2(�C) + 1

2(R0 + bx� (1 + rL)L) = 0bx = C + (1 + rL)L�R0

GOD ½

BANCO

½ MaloBueno

1      2      3     4      5 1      2      3     4      5

A    R A    R A    R A    R A    R A    R A    R A    R A    R A    R

[½]

00

00

00

00

00

00

00

00

00

00

πB

πIπB

πIπB

πIπB

πIπB

πI

Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor

πB

πIπB

πIπB

πIπB

πIπB

πI

[½]

Fíjate en que al considerar tipos de interés mayores, el primer tipo deinversor que deja de aceptar el préstamo es el bueno (en el grá�co estoocurre para un tipo de interés 2). El tipo malo empieza a no �rmar elpréstamo al tipo 4. Esta es la selección adversa causada por el tipo deinterés.

Sigamos con el comportamiento óptimo del banco. Este es fácil puestoque sus creencias son trivialeas �su conjunto de información pertenece ala senda de equilibrio y por tanto podemos aplicar la regla de Bayes parala formación de las creencias. La regla de Bayes nos dice que las creenciasdeben coincidir con la probabilidad con la que la naturaleza elige cadauno de los tipos�. En cuanto a su estrategia, esta es simplemente el tipo deinterés que cargará al préstamo. Para que cumpla la racionalidad secuencial,debemos ver cuál es el tipo de interés que maximiza los bene�cios del banco.

Sabemos que para los datos del ejemplo, para un tipo de interés menorque 2 los dos tipos aceptan el préstamo, por lo que los bene�cios del bancoson

�Banco =1

2

"1

2

�R0 � xB + C

�+1

2(1 + rL)L� L| {z }

#Inversor bueno

+1

2

"1

2

�R0 � xM + C

�+1

2(1 + rL)L� L| {z }

#Inversor malo

Page 131: apuntes_2010

5.3 Racionamiento del Crédito: El Modelo de Stiglitz y Weiss 119

Como ves, los bene�cios son crecientes en el tipo de interés, por lo quetendríamos el siguiente grá�co

rL0

1          2           3            4

Ahora bien, en el tramo en el que el tipo de interés se sitúa entre 2 y 4,tenemos que los bene�cios son menores

�Banco =1

2

h0|{z}i

Inversor bueno

+1

2

"1

2

�R0 � xM + C

�+1

2(1 + rL)L� L| {z }

#Inversor malo

porque justo al llegar al tipo de interés 2 los inversores buenos rechazan elpréstamo �recuerda que esta es la selección adversa�. Finalmente, cuandopasamos al tipo de interés 4, el inversor malo también rechaza el préstamo,por lo que los bene�cios del banco son 0.

rL

πBanco

0

1          2           3            4

La conclusión fundamental de este modelo es que ¡¡subir los tipos deinterés no es la solución para los bancos!! Porque los tipos de interésactúan como una variable que selecciona a los prestatarios, en este caso,negativamente para el banco.

El óptimo es establecer un tipo de interés menor (en el ejemplo, 2) alque ambos tipos quieren endeudarse. . . Es decir, no es bene�cioso para el

Page 132: apuntes_2010

120 5. Selección Adversa, Señalización y Screening

banco aumentar el tipo de interés para reducir el exceso de demanda decréditos.

Pero no hay dos préstamos �uno para cada tipo de inversor-, sino unosólo: así que el primero que aparezca por el banco se lo lleva, y el otro recibeun no por respuesta, aún cuando estaría dispuesto a �rmarlo: el crédito estáracionado. Veamos un ejemplo numérico.

Supongamos dos inversores que quieren pedir un préstamo de un euro.Uno es high-risk y el otro low-risk. El banco conoce la distribución deretornos de cada uno de los tipos, pero no sabe quién es quién... Se estableceun aval del 75% del valor del préstamo.

Retorno según inversor

0

0,2

0,4

0,6

0,8

1

0 2,2 3,8

Retorno

Prob

abili

dad Low­Risk

High­Risk

Estudiemos la demanda de préstamos en función de su tipo de interés.

� El inversor high-risk demanda el préstamo siempre que el tipo deinterés no supere 0.55

3

4(�0:75) + 1

4(3:8� 1� br) = 0! br = 0:55

� El inversor low-risk demanda el préstamos siempre que su tipo deinterés no supere 0.45

1

2(�0:75) + 1

2(2:2� 1� br) = 0! br = 0:45

Page 133: apuntes_2010

5.3 Racionamiento del Crédito: El Modelo de Stiglitz y Weiss 121

Por tanto, el demanda de préstamos es

r

L

0,55

0,45

0       1       2       3       4

donde hemos incluido la oferta de préstamos vertical al valor 1. ¿Cuálserá el equilibrio en el mercado de préstamos? Pues la teoría tradicional tediriía que en el punto de corte entre oferta y demanda, es decir, en un tipode interés comprendido entre 0.45 y 0.55. Si piensas de esta forma, entonceses que no te has enterado de nada, puesto que para tipos de interés porencima de 0.45 el único inversor que demanda el préstamo es el inversorhigh-risk por lo que los bene�cios del banco serían negativos...

�Banco =3

4(0:75� 1) + 1

4(1:55� 1) = �0:075 < 0

y para tener bene�cios negativos mejor no dedicarse al negocio de lospréstamos... ¿Te das cuenta como desaparece el mercado competitivo �oferta igual a demanda� de préstamos? En estas circunstancias, veamoscomo el racionamiento del crédito (negarle el préstamos a alguien queencuentra bene�cioso pedirlo) es una alternativa interesante.

La idea es que en lugar de subir el precio para disminuir la demandade crédito, que racione la cantidad. Por ejemplo, el banco puede poner untipo de interés 0.45, vienen los dos tipos y elige a qué persona le da elcrédito tirando una moneda (cara o cruz). Los bene�cios asociados a estaestrategia son

�Banco =1

2

�3

4(0:75� 1) + 1

4(1:45� 1)

�+1

2

�1

2(0:75� 1) + 1

2(1:45� 1)

�= 0:0125 > 0

es decir, positivos.

Page 134: apuntes_2010

122 5. Selección Adversa, Señalización y Screening

5.4 Screening: El Modelo de Rothschild y Stiglitz

Ahora presentamos otra respuesta del mercado a la selección adversa: elscreening o la Auto-selección de tipos. Ésta funciona siempre que:

1. Se pueda jugar con una variable adicional al precio que afecte a ladisposición marginal a pagar de los consumidores

- Cantidad en la discriminación monopolista

- Grado de cobertura en los seguros

- Garantía en los préstamos

- Trabajo en el mercado laboral

2. Y se pueda restringir a los consumidores a elegir entre combinacionesparticulares de las variables relevantes.

Veremos el modelo de Michael Rothschild y Joseph Stiglitz (1976) deSelección Adversa en el Mercado de Seguros. Para ello, recuerda la últimapregunta del primer tema: un modelo básico de demanda de seguros.

EstadoMALO

EstadoBUENO

w

w –d Sin seguro

Línea de intercambioactuarialmente justo

(pendiente Pbueno/Pmalo)Beneficios empresariales

cero

Línea de 45 grados

Con seguro

Prima delseguro

Pago netodel seguro

Supongamos que existen en el mercado dos tipos de individuos que sólose diferencian en la probabilidad de accidente.

� Los H que tienen una probabilidad alta de sufrir la pérdida (altoriesgo) y los L que la tienen más pequeña (la probabilidad) (bajoriesgo).

Page 135: apuntes_2010

5.4 Screening: El Modelo de Rothschild y Stiglitz 123

� La información está asimétricamente repartida: cada individuoconoce su probabilidad pero esta información no es conocida por lasempresas de seguros. El timing del juego es el siguiente:

� La naturaleza selecciona el tipo del individuo, es decir, su nivelde riesgo, que puede ser alto (H) o bajo (L), a partir de unadistribución de probabilidad (q, 1-q).

� La naturaleza revela su tipo al consumidor, pero no a lasempresas de seguros.

� Las empresas de seguros ofrecen de forma simultánea unconjunto �nito de pólizas (prima, indemnización).

�El individuo suscribe una de las pólizas.

Las características clave de este modelo son las siguientes:

1. Los individuos de menor riesgo (L) de accidente exigen mayorespagos por trasvasar riqueza del estado bueno al estado malo que losindividuos de mayor riesgo (H) de accidente. Recuerda que la utilidadde todos los individuos es la siguiente

U�w � d; pi;w; 1� pi

�= piu (w � d) +

�1� pi

�u (w)

Las curvas de indiferencia tienen la siguiente relación:

Altoriesgo

(H)

Bajoriesgo

(L)

Estadomalo

0

Fíjate en que tenemos una Single-Crossing Condition: Alrenunciar a un euro en el estado �no accidente�, los de bajo riesgoexigen un mayor pago de euros en el estado �accidente� porque laprobabilidad del estado �accidente�es menor para ellos que para losde alto riesgo.

Page 136: apuntes_2010

124 5. Selección Adversa, Señalización y Screening

2. Las empresas compiten entre ellas hasta el punto en el que losbene�cios son cero (Por eso queremos tener dos empresas, para poderconsiderar un mercado de seguros competitivo)

3. Las creencias de las dos empresas son idénticas. En este caso esto esmenos problemático que en el caso de Spence, porque las creenciasson triviales ya que la parte desinformada es la que mueve primero.Por tanto, las creencias acerca del tipo del consumidor (movimientode la naturaleza) surgen directamente de la Regla de Bayes y portanto han de coincidir con el a-priori (q, 1-q).

Las estrategias en el modelo de Rothschild y Stiglitz son muy sencillitasen comparación con las del modelo de Spence.

(i) Individuo: Una función que dice para cada tipo posible (H, L)qué póliza de seguros elige del menú ofrecido por las empresasaseguradoras.

(ii) Empresas: Un menú de pólizas (tantas como tipos distintos deconsumidores haya)

Como siempre estudiemos lo que ocurre con información completa parapoder entender mejor los efectos de la asimetría de la información. Elsiguiente grá�co resume la situación con información completa.

EstadoMALO

EstadoBUENO

w

w –d

Línea de coberturacompleta

Altoriesgo (H)

Bajoriesgo (L) Tenemos dos mercados, uno

para cada tipo.

CLAVE: Las curvas deindiferencia de los tipos de bajoriesgo son más inclinadas quelas de los tipos de alto riesgo.

RESULTADO: Los dos seaseguran a todo riesgo aunquelos de bajo riesgo (L) tienen unseguro más barato que los de

alto riesgo (H)

Prima tipo L

Prima tipo H

Si existe información asimétrica, pueden en principio aparecer dos tiposde situaciones:

Page 137: apuntes_2010

5.4 Screening: El Modelo de Rothschild y Stiglitz 125

� POOLING: Las compañías de seguros ofrecen una única póliza.

� SEPARATING: Las compañías de seguros ofrecen más de una pólizade seguros (deben ser dos porque hay dos tipos de clientes)

Analicémoslas por separado con cierta calma.

5.4.1 Equilibrios Pooling

Recuerda los modelos de Akerlof y Spence: La línea de bene�cios cero(actuarialmente justa) está de�nida a partir de las proporciones de tiposde alto riesgo y tipos de bajo riesgo. Para no complicarnos la vida, sea ésta50-50 en el grá�co siguiente, por aquello de poder dibujar el equilibrio.

EstadoMALO

EstadoBUENO

w

w –d

Línea de coberturacompleta

Altoriesgo

(H)

Bajoriesgo

(L)

Piensa en cualquier punto de la línea actuarialmente justa y veamoscomo no puede ser equilibrio. El contrato en rojo es mejor puesto que (i)No atrae a los de alto riesgo, (ii) Atrae a los de bajo riesgo y (iii) Haybene�cios empresariales. Así pués, ya tenemos el primer gran resultado deeste modelo:

Proposicion 8 No existen equilibrios secuenciales pooling.

Remark 17 Intuición. Si hay una única póliza, hay un único precio, quepagan tanto los L y los H. Pero los H (alto riesgo) pasan más partes y portanto reciben más indemnizaciones que los L (bajo riesgo). Es decir, losL están subsidiando a los H. Existen incentivos a separar ambos grupos,que es lo que hace la póliza alternativa. Por tanto, una única póliza nos esequilibrio.

Page 138: apuntes_2010

126 5. Selección Adversa, Señalización y Screening

5.4.2 Equilibrios separadores

Siguiendo la intuición anterior, la compañía de seguros va a ofrecer dospólizas de seguro:

� Una para los de bajo riesgo (L)

� Otra para los de alto riesgo (H)

De hecho, esta es la situación que se daría si el riesgo de los individuosfuera observable.

EstadoMALO

EstadoBUENO

w

w –d

Línea de coberturacompleta

Altoriesgo (H)

Bajoriesgo (L)

¿Son los contratosóptimos bajo

observabilidad deequilibrio?

FH

FL

¿Podemos encontrar un equilibrio secuencial que implique el mismoresultado en equilibrio que el equilibrio con informaicón completa? Puesva a ser que no porque no es secuencialmente racional para el tipo H elegirFH sino que pre�ere FL.

Page 139: apuntes_2010

5.4 Screening: El Modelo de Rothschild y Stiglitz 127

De hecho, lo mejor que podemos conseguir es el siguiente equilibrioseparador:

EstadoMALO

EstadoBUENO

w

w –d

Línea de coberturacompleta

Altoriesgo (H)

C

FH: Seguro más caro concobertura completa paralos de alto riesgo.

C: Seguro más baratocon cobertura incompletapara los de bajo riesgo.

FHC

Lo mejor quepodemos conseguir

es el par (FH, C)

C+

PRIMAPRIMA

Situación inicial

5.4.3 Implicaciones del modelo

Cuando la información es privada, el mercado no asigna los recursoseconómicos de forma e�ciente. Este modelo contraviene el llamado PrimerTeorema del Bienestar puesto que el mercado de seguros no ofrece unequilibrio pareto e�ciente.

¿Cómo de realista es el modelo para el mundo real? Pues bastante, porqueen el mundo real las personas conocen mejor su salud que las compañíasaseguradoras. Es cierto que puede parecerte un supuesto extremo queconozcas exactamente tu salud pero esto ha sido una simpli�cación parapoder tener un modelo manejable.

Page 140: apuntes_2010

128 5. Selección Adversa, Señalización y Screening

Page 141: apuntes_2010

This is page 129Printer: Opaque this

6Riesgo Moral e Incentivos

En el tema anterior estudiamos situaciones en las que la asimetría de lainformación se producía antes de que el principal propusiera el contratoal agente, es decir, el tipo del agente era elegido antes de que el principaltuviera ocasión de jugar... En este tema estudiaremos situaciones en lasque la asimetría se produce después de la proposición y �rma del contrato.

El típico ejemplo es la situación siguiente. Un empresario contrata a unmanager para que lleve la empresa. Después de la �rma del contrato, elpropietario de la empresa no siempre podrá observar el esfuerzo con el queel manager desempeña su trabajo. Anticipando este tipo de situaciones, elpropietario de la empresa tratará de diseñar un contrato que proporcioneal manager los incentivos necesarios para que éste realice celosamente sutrabajo, para que la empresa vaya bien y el propietario gane mucho dinero,etc...

La literatura ha distinguido tradicionalmente entre dos tipos deproblemas informacionales que pueden ocurrir en este escenario:

1. Aquellos que resultan de acciones escondidas (riesgo moral): es decir,el propietario de la empresa (el principal) no puede observar elesfuerzo del manager (agente), y

2. Aquellos que resultan de conocimiento escondido: así, el managerpuede tener un mejor conocimiento de las oportunidades de negociopara la empresa dado que está trabajando a pie de obra...

En este tema, nos centraremos en el riesgo moral y lo haremosdesarrollando el modelo del propietario-manager, aunque debeis tener

Page 142: apuntes_2010

130 6. Riesgo Moral e Incentivos

presente el amplio rango de situaciones económicas que pueden ser descritaspor el paradigma principal-agente.

PRINCIPAL AGENTEAcepta

Rechaza

ContratoNATURE

EsfuerzoAGENTE

6.1 Modelo básico

Imagina que el propietario de una empresa (principal) contrata aun manager (agente) para que dirija la empresa durante un periododeterminado de tiempo o para un proyecto en particular. No es difícilimaginar que los ingresos de la empresa van a depender de las accionesdel agente (en este caso, las acciones serán diferentes niveles de esfuerzo enel desempeño de su función). El problema al que se enfrenta el principales que no puede observar el esfuerzo en el trabajo del agente. Así, elcontrato no puede contemplar un salario para cada nivel de esfuerzorealizado por el agente, puesto que no hay forma de veri�car si el agente hacumplido realmente sus obligaciones. En estas circunstancias, el principaldeberá diseñar un esquema salarial que, de forma indirecta, proporcionelos incentivos adecuados al agente para que ponga todo su empeño en larealización de su trabajo.

Siendo más especí�cos, sean � los ingresos obtenidos por la empresa ysea e la acción elegida por el agente. En este tema suponemos que losingresos obtenidos por la empresa son siempre observados por el principal.El conjunto de acciones posibles para el agente es E. En nuestro tratamientodel problema, interpretaremos e como el esfuerzo realizado.

Para que la no observabilidad del esfuerzo del agente tenga consecuencias,evidentemente no puede haber una relación directa entre el esfuerzo delagente y el ingreso � de la empresa. Si la correlación entre � y e fueraperfecta, entonces el principal podría deducir el esfuerzo realizado a partirde la observación del ingreso. Por lo tanto, supondremos que los ingresosde la empresa pueden tomar valores en el intervalo [��; �+], y que estánestocásticamente relacionados con el nivel de esfuerzo e de una maneradescrita por una función de densidad condicionada

f (� je ) donde f (� je ) > 0 8e 2 E; 8� 2 [�; �] (6.1)

de forma que cada realización de � puede ocurrir a partir de cualquier valorde e.

Page 143: apuntes_2010

6.1 Modelo básico 131

Así pues, dado el nivel de esfuerzo elegido por el agente, el ingresoobtenido por la empresa es aleatorio, es decir, depende del estadode la naturaleza, que viene gobernado por la función de distribucióncondicionada f (� je ) :

Para que las cosas no sean tan complicadas como os estáis empezando atemer, nos referiremos al caso en el que el conjunto E tiene dos elementos,es decir, E = fL;Hg, donde L es un nivel de esfuerzo menor que H, y elconjunto de valores posibles de los ingresos es �nito, es decir, � 2 �; donde�= f�1; :::; �ng :

Así, sea pie la probabilidad de que habiendo elegido el agente el nivelde esfuerzo e el ingreso de la empresa sea �i, donde las funciones dedistribución condicionadas F (� jH ) y F (� jL ) cumplen1

F (�i jH ) < F (�i jL ) para todo �i 2 � (6.2)

Un ejemplo facilita las cosas

Ingresos L H Acc L Acc H LR1 0,53 0,14 0,53 0,14 3,78571

2 0,25 0,24 0,78 0,38 1,04167

3 0,12 0,29 0,9 0,67 0,41379

4 0,1 0,33 1 1 0,30303

Esperado 1,79 2,81 ­ ­ ­

Esfuerzos y Ratio de verosimilitud

0

0,1

0,2

0,3

0,4

0,5

0,6

1 2 3 4

Beneficios (mill euros)

Pro

babi

lida

d

00,511,522,533,54

LHLR

ingresos

1El término técnico de la siguiente expresión es que la función de distribucióncondicionada en el nivel de esfuerzo H domina estocásticamente de primer orden a lafunción de distribución condicionada en el nivel de esfuerzo L.

Page 144: apuntes_2010

132 6. Riesgo Moral e Incentivos

Funciones distribución acumuladas

0

0,25

0,5

0,75

1

0 1 2 3 4

Ingresos (en millones de euros)

Pro

b A

cum

ula

da LH

La primera gran implicación de la condición anterior es que el ingresoesperado de la empresa si el agente realiza el esfuerzo H es mayor que elingreso esperado si realiza L, es decir,

nXi=1

�ipiH >nXi=1

�ipiL (6.3)

E (�jH) > E (�jL) (6.4)

El agente quiere maximizar su utilidad, representada por función quedepende del salario recibido y del esfuerzo realizado, v (w; e), dondesuponemos que

v0w(�) > 0 8 (w; e)v00w(:) � 0 8 (w; e) (6.5)

v0e(�) < 0Es decir, el agente pre�ere más salario a menos (su función de utilidad

es creciente en w), es averso al riesgo (su función de utilidad es cóncava enw) y le disgusta esforzarse en el trabajo.

Por lo tanto, hemos encontrado un con�icto de intereses que es la piezaclave de todo este capítulo: el esfuerzo que proporciona un mayor ingresoesperado de la empresa es el que más disgusta al trabajador.

En este tema trabajaremos con una especi�cación de la función deutilidad del agente que es aditivamente separable:2 v (w; e) = u (w)� g (e).Para este caso particular, los supuestos anteriores implican:

u0 (w) > 0u00 (w) � 0 (6.6)

2Esta es la forma funcional estandar en la literatura de riesgo moral.

Page 145: apuntes_2010

6.1 Modelo básico 133

El principal recibe el ingreso total de la empresa menos el salario que hade pagarle al agente, teniendo una función de utilidad Q(� � w) = � � w,es decir, su función de utilidad es lineal: el principal es neutral al riesgo.

Una vez detallados todos los elementos del problema del principal-agente,expondremos el timing del juego:

1. El principal ofrece un contrato (un esquema salarial).

2. El agente acepta o rechaza el contrato.

(a) Si el agente lo rechaza, el principal no recibe un duro y el agenteconsigue en otro lugar un nivel de utilidad u3 ...

(b) Si el agente acepta el contrato, entonces:

3. El agente elige un nivel de esfuerzo.

4. La naturaleza elige el estado del mundo (o el estado de la naturalezase realiza).

5. La empresa consigue unos ingresos.

6. Los jugadores reciben sus pagos:

(a) El Agente recibe el salario establecido en el contrato.

(b) El Principal se queda con lo que sobra de los ingresos una vezpagado el salario del agente.

Como siempre, todo lo dicho hasta ahora sobre el juego es conocimientocomún.

Como podéis observar, en este juego no hay ningún jugador quedesconozca las funciones de utilidad de su adversario ni que no sepatodo el desarrollo del juego desde el comienzo hasta que tiene que mover.Así, contrariamente al caso de selección adversa, tenemos un juego coninformación perfecta y completa, pero con incertidumbre, porque losjugadores no conocen el estado de la naturaleza a la hora de tomar susdecisiones. Sin embargo, ambos jugadores están en pie de igualdad en esteaspecto, es decir, la incertidumbre es simétrica.

La pregunta que tenemos que hacernos es dónde afecta el hecho de que elesfuerzo realizado por el agente no sea observado por el principal. Esta esla fuente de asimetría de información: el agente siempre conoce su esfuerzopero el principal puede no conocerlo. La respuesta es en el tipo de contratodisponible. Si el esfuerzo es observable (y veri�cable ante los tribunales),

3Podemos pensar que siempre puede trabajar en Burger King por un salario tal quele proporciona ese nivel de utilidad, denominado Utilidad de Reserva.

Page 146: apuntes_2010

134 6. Riesgo Moral e Incentivos

entonces los salarios del contrato pueden condicionarse tanto al esfuerzorealizado como a los ingresos de la empresa (que siempre son observadospor el principal). Por contra, si el esfuerzo no es observable, entonces no escontratable en el sentido de que no puede aparecer escrito en el contratoy por lo tanto solo se pueden condicionar los salarios al bene�cio obtenidopor la empresa4 .

Como estamos ante un juego con información perfecta y completa, elconcepto de equilibrio que vamos a utilizar es el de Equilibrio de NashPerfecto en Subjuegos, pero teniendo presente que los pagos para losjugadores son inciertos, pues dependen del estado de la naturaleza.

Si queremos encontrar equilibrios, nos tenemos que preguntar qué esuna estrategia pura para el principal y qué es una estrategia pura para elagente. En este caso, como en todos los modelos estudiados en este curso,la respuesta no es demasiado difícil:

1. Una estrategia pura para el principal es simplemente un contrato aofrecer al agente, es decir, un esquema salarial. Esta respuesta ladetallaremos un poco más a lo largo del tema, a la hora de estudiarcuáles son exactamente los contratos disponibles para el principal,pues como sabemos, dependerán de si el esfuerzo es observable o no.

2. Una estrategia pura para el agente tiene dos componentes. En primerlugar debe decir, para cualquier contrato posible, si lo acepta o lo.En segundo lugar, debe decir para cualquier contrato posible, quéesfuerzo realizar.

Ya que buscamos equilibrios perfectos en subjuegos, parece naturalpreguntarse qué es un subjuego en nuestro juego. Empezando por el �nalde la representación en forma estratégica del juego vemos que los primerossubjuegos aparecen en los nodos en los que el agente ha aceptado el contratoy debe decidir qué acción tomar. En este caso, la perfección en subjuegosexige que el agente elija la acción e� que maximice su utilidad esperada.

e� 2 argmaxe2fL;Hg

nXi=1

pie [u (wi)� g(e)]

(Restriccion de Compatibilidad de Incentivos)Los siguientes subjuegos empiezan en cada nodo en el que el agente

tiene que decidir si acepta o rechaza el contrato ofrecido. Por tanto, laperfección en subjuegos exige que el agente elija aceptar el contrato si lautilidad asociada a la mejor acción es al menos igual a la utilidad asociada

4Más tarde seré más explícito a este respecto, un poco de paciencia...

Page 147: apuntes_2010

6.1 Modelo básico 135

al rechazo del contrato:5

Acepta siPn

i=1 pie� [u (wi)� g(e�)] � uRechaza en caso contrario

(Restriccion de Participacion)En este punto se acaban las decisiones del agente. El último subjuego

es el juego mismo, en donde el principal elige el contrato que maximice suutilidad teniendo en cuenta la estrategia pura del agente:

Maxfwig

nXi=1

pie� [�i � wi] cumpliendoRestricción de Compatibilidad de Incentivos)(Restricción de Participación

Ya podeis tener una idea un poco clara del problema fundamental delprincipal. Su utilidad depende en primer lugar de que el agente acepteel contrato (en caso contrario no gana un duro, por lo que estará muyinteresado en que el agente diga que sí) y en segundo lugar del esfuerzodel agente, porque afecta al estado del mundo elegido por la naturaleza ypor ende al ingreso obtenido por la empresa. Por tanto, el principal tendráun esfuerzo favorito en el sentido de que es el esfuerzo que hace que susingresos esperados sean los mayores, pero, ¿puede controlar el principal elesfuerzo realizado por el agente? Cuando supongamos que no es observable,el principal tendrá problemas...

PRINCIPAL AGENTEAcepta

Rechaza

ContratoNATURE

EsfuerzoAGENTE

RESTRICCIÓN DE COMPATIBILIDADDE INCENTIVOS

RESTRICCIÓN DE PARTICIPACIÓN

THAT’SALL

FOLKS!!5En el equilibrio, el agente estará indiferente entre aceptar o rechazar el contrato

propuesto por el agente, y supondremos que el agente acepta el contrato. Si noresolviéramos de esta forma el empate, entonces no existiría ningún contrato óptimo...

Page 148: apuntes_2010

136 6. Riesgo Moral e Incentivos

Quiero recordar por última vez que en este juego hay incertidumbre: lospagos de los jugadores son aleatorios porque deciden sus acciones antes deque se realice el estado de la naturaleza, ¿vale?

Y ya por último, quiero responder a la pregunda de por qué exigimosperfección en subjuegos y no nos contentamos solamente con equilibriosde Nash puros y duros. Principalmente para evitar equilibrios de Nashque describan situaciones de tiranía o ma�a por parte del agente; es decir,queremos eliminar equilibrios de Nash que involucren amenazas increíblesdel tipo: �o me das todos los ingresos de la empresa o no acepto ningúncontrato�. Espero que a estas alturas del curso tengas una idea un pococlara de lo que signi�ca perfección en subjuegos...

6.2 El contrato óptimo cuando el esfuerzo esobservable.

Es útil empezar por el caso en el que el esfuerzo es observable por elprincipal con objeto de ganar intuición en los resultados de las siguientessecciones.

Lo primero que vamos a hacer es ver qué tipo de contratos tiene asu disposición el principal. Recuerda que el principal ofrece al agente uncontrato que éste puede aceptar o rechazar. Como el esfuerzo es observabley veri�cable por el principal, el tipo de contrato disponible es un contratomuy completito porque puede condicionar el salario del trabajador tantoa los ingresos obtenidos por la empresa (�) como al nivel de esfuerzo deltrabajador (e). Así, un contrato es una función C : �� e! w. Puesto mássencillito un contrato es una tabla con el siguiente esquema

C :

0BBBBBB@

EsfuerzoIngresos Bajo Alto

�1 w1L w1H

�2 w2L w2H

� � � � � � ...�N wNL wNH

1CCCCCCADe una forma más compacta, un contrato es una colección de numeros

fwieg. Suponemos además que hay un mercado competitivo que hace queel agente pueda conseguir un nivel de utilidad u trabajando en cualquierotra empresa. Este nivel de utilidad se denomina utilidad de reserva, por loque si el principal quiere contratar al agente debe proporcionarle un nivelde utilidad esperada de al menos u. Si el agente rechaza el contrato, elprincipal no consigue un duro y el agente consigue su utilidad de reserva...

El equilibrio perfecto en subjuegos en el caso de observabilidad delesfuerzo es fácil de imaginar, porque el contrato especi�ca un esfuerzo

Page 149: apuntes_2010

6.2 El contrato óptimo cuando el esfuerzo es observable. 137

en concreto y un esquema salarial para ese esfuerzo en función de losingresos �nales de la empresa. Cualquier otro esfuerzo es recompensado,por ejemplo, con un salario cero o negativo.6 Por tanto, la estrategia purade equilibrio perfecto en subjuegos para el agente es: elijo el contrato siel esfuerzo explicitado en el contrato me da una utilidad esperada igual omayor que la utilidad de reserva. En caso contrario, rechazo el contrato.Si he aceptado el contrato, entonces realizo el esfuerzo explicitado en elcontrato. Una vez conocida la estrategia de equilibrio para el agente, laestrategia de equilibrio para el principal es simplemente el contrato quemaximiza su utilidad esperada, es decir, un esquema salarial para cadanivel de esfuerzo realizado por el agente. Este sería el equilibrio perfecto ensubjuegos. Así pues, a partir de ahora, nos centraremos en la estrategia deequilibrio del principal, es decir, en lo que todo el mundo llama contratoóptimo.

El contrato óptimo es aquel que maximiza los ingresos esperados delprincipal restringido a que el agente acepte el contrato, es decir, la condiciónRestriccion de Participacion7 , es decir, el contrato [e�; w� (�)] resuelve elproblema � Max

e2fL;Hg;fwig

Pni=1 [�i � wi] pie

r:a:Pn

i=1 u (wi) pie � g(e) � u(6.7)

donde la restricción se denomina restricción de participación.

Es conveniente pensar que es un problema de dos etapas. En la primerade ellas, podemos pensar cuál es el mejor esquema salarial que podemosofrecer al agente para cada nivel de esfuerzo, y en la segunda, cuál es el nivelde esfuerzo óptimo en el sentido de que maximiza los ingresos del principal.No olvidéis que quién diseña el contrato es el principal y trata de hacerlopara quedarse con la mayor parte del pastel (ingresos de la empresa), dondepor supuesto el pastel es un pastel aleatorio.

1. Primera Etapa: Esquema salarial óptimo para cada nivel deesfuerzo.

Supongamos que el esfuerzo a implementar es H. El principal tieneque elegir el esquema salarial w (�) = fw1H ; :::; wnHg que maximicesus ingresos esperados, o lo que es lo mismo, el que minimice el salarioa pagar en cada uno de los estados de la naturaleza8 . Es decir, elesquema salarial óptimo para e = H resuelve el siguiente problema:� Min

fwig

Pni=1 wiH piH

r:a:Pn

i=1 u (wiH) piH � g(H) � u(6.8)

6Esto tiene un nombre técnico: punishment7En caso contrario, el principal consigue un resultado cierto igual a cero...8Técnicamente se denomina maximización punto a punto.

Page 150: apuntes_2010

138 6. Riesgo Moral e Incentivos

La restricción de participación siempre se va a cumplir con igualdad9

por lo que simplemente necesitamos utilizar el método de Lagrange.Denotando por � el multiplicador lagrangiano de la restricción departicipación, el lagrangiano adopta la forma

L =nXi=1

fwiH piH + � [u+ g(H)� u (wiH) piH ]g

por lo que la solución al problema debe satisfacer las siguientescondiciones de primer orden

@L@wi

= piH � �u0 (wiH) piH = 0 para i = 1; 2; :::; n (6.9)

o lo que es lo mismo

1

u0 (wiH)= � para i = 1; 2; :::; n (6.10)

Como el agente es averso al riesgo, es decir, u00(w) < 0; tenemos que

u0 (wiH) = cte para i = 1; 2; :::; n

de dondewiH = bw para todo i = 1; 2; :::; n

Así, si el agente es averso al riesgo, la ecuación 6.10 implica que elsalario óptimo es una constante, es decir, el agente recibe el mismosalario independientemente del estado de la naturaleza. Este resultadoes simplemente un reparto del riesgo existente en la empresa. Ya que elpropietario es neutral al riesgo, que asuma todo el riesgo asegurandoal agente con un salario �jo.

Por lo tanto, el salario óptimo �jo para cada nivel de esfuerzo e, w�e ,es aquel que hace que el agente reciba su nivel de utilidad de reserva:

u (w�e) = g (e) + u (6.11)

Despejandow�e = u

�1 [u+ g (e)]

Si el agente fuera neutral al riesgo, por ejemplo, u (w) = w, lacondición 6.10 hace que cualquier esquema salarial sea óptimo siemprey cuando satisfaga la restricción de participación con igualdad. Así,el salario �jo anterior ya no sería el único esquema salarial óptimo.

9Si no entiendes por qué vienes a verme... Una pista: imagina que existe un contratoal que llamamos óptimo y que hace que la utilidad esperada del agente fuera mayor quesu nivel de utilidad de reserva. Entonces, podríamos encontrar otro contrato en el quelos salarios fueran un pelín más bajos... etc

Page 151: apuntes_2010

6.2 El contrato óptimo cuando el esfuerzo es observable. 139

2. Segunda Etapa: Elección del nivel de esfuerzo óptimo.

El principal debe elegir el nivel de esfuerzo que maximice los ingresosesperados de la empresa menos el salario a pagar, es decir,

e� 2 argmaxe2fH;Lg

nXi=1

pie (�i � w�e) (6.12)

e� 2 argmaxe2fH;Lg

nXi=1

pie�i

!�

nXi=1

piew�e

!(6.13)

e� 2 argmaxe2fH;Lg

E (�j e)� w�e (6.14)

dondew�e = u

�1 [u+ g (e)] (6.15)

El primer término de la ecuación 6.12 representa el ingreso esperadocuando el nivel de esfuerzo es e, mientras que el segundo términorepresenta el salario a pagar. Si L o H es el óptimo va a depender delincremento proporcional en los ingresos comparado con el incrementoen el salario a pagar por el principal.

6.2.1 A modo de conclusión

En el modelo del principal-agente con esfuerzo observable, el contratoóptimo especi�ca que el agente tiene que desarrollar el nivel de esfuerzoe�que maximiza

�E (�j e)� u�1 [u+ g (e)]

y recibe un salario �jo w� =

u�1 [u+ g (e�)]. Cualquier otro esfuerzo es recompensado con un salariocero o negativo, por ejemplo. Este es el único contrato óptimo que existesi el agente es averso al riesgo, es decir, si u00(w) < 0 para todo w.

El equilibrio perfecto es subjuegos es por tanto:

1. El principal ofrece el siguiente contrato: �Si haces el esfuerzo e�,recibes el salario �jo w� = u�1 [u+ g (e�)]. Si haces cualquier otroesfuerzo, recibes un salario �jo w = 0:�

2. El agente acepta un contrato si se cumple la condición Restriccion deParticipacion y realiza el esfuerzo dado por la condición Restriccionde Compatibilidad de Incentivos.

Como podéis observar, el agente está indiferente entre aceptar o rechazarel contrato, puesto que la utilidad esperada de ambas acciones es su utilidadde reserva. Como ya dijimos anteriormente, esto va a ocurrir en todoslos contratos óptimos que estudiemos en este tema y resolvemos estaindiferencia diciendo que el agente acepta el contrato. Si no lo hicieramosasí, no existiría un equilibrio perfecto en subjuegos...

Page 152: apuntes_2010

140 6. Riesgo Moral e Incentivos

6.3 El contrato óptimo cuando el esfuerzo no esobservable.

El contrato óptimo descrito en la sección anterior cumple dos grandesobjetivos:

1. Especi�ca un nivel de esfuerzo e�ciente por parte del agente.

2. Asegura completamente al agente frente al riesgo porque indepedien-temente del estado de la naturaleza, el salario recibido por el agentees el mismo.

Sin embargo, cuando el esfuerzo no es observable, el tipo de contratodisponible para el principal ya no puede incluir el nivel de esfuerzo arealizar por el agente, puesto que ahora, el principal es incapaz de veri�carel esfuerzo del agente10 . Un contrato tipo en el mundo no observable esahora la siguiente colección de números con la restricción contenida en laúltima columna

C =

0BBBBBB@

EsfuerzoIngresos Bajo Alto r.a.

�1 w1L w1H w1L =w1H

�2 w2L w2H w2L =w2H

� � � � � � ... ...�N wNL wNH wNL =wNH

1CCCCCCAComo ves, los contratos disponibles solo pueden contener un esquema

salarial en función del bene�cio observado de la empresa. Esto plantea unserio problema para el principal, porque ya no puede controlar directamenteel esfuerzo realizado por el agente, es decir, ya no puede decir �haz elesfuerzo tal porque si haces otro no te pago nada�¿Existe alguna formade forzar al agente a realizar un determinado nivel de esfuerzo?. La únicaforma es a través del esquema salarial: tiene que incentivar de alguna formaal agente para que realice el nivel de esfuerzo "óptimo" y la única manerade hacerlo es a través de los salarios percibidos por el agente. Así, lossalarios deben ser tales que la condición Restriccion de Compatibilidadde Incentivos seleccione el esfuerzo que el principal quiere. Tenemos queincluir esta restricción explícitamente, que se denomina Restricción deCompatibilidad de Incentivos.

Lo que tiene que quedar claro es que en el caso de no observabilidad,el principal no puede obtener un resultado mejor que en el caso

10Hombre, el principal podría incluir el esfuerzo y, el agente, como sabe que no esveri�cable, puede realizar el esfuerzo menor y decir al principal que realizó el esfuerzoalto pero que el estado de la naturaleza no fue el más favorable... Lógicamente, comoesto no es veri�cable, es su palabra contra la del principal... y no hay juez que puedadecidir quién tiene razón...

Page 153: apuntes_2010

6.3 El contrato óptimo cuando el esfuerzo no es observable. 141

de observabilidad. Este es un principio general de los problemas deoptimización con restricciones: si añadimos una restricción adicional, elóptimo será como mucho el óptimo sin esa restricción.

Así, es posible que los dos objetivos anteriores sean incompatibles. Es eneste caso cuando la no observabilidad del esfuerzo trae consigo ine�ciencia.

Para que veamos todo esto con mayor claridad, vamos a considerar enprimer lugar el caso en que el agente es neutral al riesgo y demostraremosque todavía es posible encontrar un equilibrio perfecto en subjuegos talque los pagos en equilibrio son los mismos que el equilibrio perfecto ensubjuegos en el caso de observabilidad del esfuerzo. Sin embargo, cuandoconsideremos el caso en que el agente es averso al riesgo, nos daremos cuentade que ya no vivimos en un mundo ideal y e�ciente...

Seguro que estáis pensando en cuál es la estrategia del agente. Porsupuesto que la estrategia pura de equilibrio perfecto en subjuegos para elagente sigue siendo la misma que en el caso de observabilidad: acepta si teinteresa y haz el esfuerzo que más te interese en el sentido de que maximizatus pagos esperados. A partir de este comportamiento del agente, elprincipal tiene que buscarse la vida... Por lo tanto, la estrategia óptima parael principal será el esquema salarial en función de los ingresos de la empresaque maximice sus ingresos esperados. Pero ahora tenemos que explicitarque el equilibrio cumple la condición Restriccion de Compatibilidad deIncentivos: esta es la restricción de compatibilidad de incentivos.

Así que a partir de ahora nos centraremos en la estrategia pura deequilibrio del principal, es decir, buscaremos como en la sección anterior loque se llama el contrato óptimo para el principal.

6.3.1 Agente neutral al riesgo.

Supongamos que u (w) = w. Ya sabemos que si el esfuerzo es observable,el principal elige a través del contrato el esfuerzo e� que resuelve

maxfeg

E (�j e)� g (e)� u (6.16)

Los ingresos del empresario vienen dados por esta expresión y el agenterecibe una utilidad esperada igual a u.

Considera ahora el caso en que el esfuerzo es no observable.Demostraremos que el empresario puede todavía conseguir el pagodel óptimo observable, puesto que vamos a diseñar un contrato queprecisamente consigue ese resultado.

Supongamos que el principal ofrece un esquema salarial del tipo wi =�i��, donde � es una constante. Este esquema salarial se puede interpretar

Page 154: apuntes_2010

142 6. Riesgo Moral e Incentivos

como que el principal vende la empresa al agente por un precio �, puestoque el agente consigue el bene�cio de la empresa menos el pago �.

Si el agente acepta el contrato elegirá el nivel de esfuerzo que maximice suutilidad esperada (condición Restriccion de Compatibilidad de Incentivos)

maxfeg

nXi=1

pieu(wi)� g (e)

pero como es neutral al riesgo, u (w) = w, tenemos

maxfeg

nXi=1

piewi � g (e)

que, como wi = �i � �, se reduce a

maxfeg

nXi=1

�ipie � g (e)� � (6.17)

Comparando la ecuación 6.17 con la ecuación 6.16 vemos que la solución e�

de la ecuación 6.16 resuelve la ecuación 6.17. Eso signi�ca que este contratohace que el agente elija el nivel de esfuerzo óptimo con observabilidad.

Ahora bien, el contrato tiene que ser tal que el agente lo acepte (condiciónRestriccion de Participacion). Para ello, le tiene que proporcionar al agenteuna utilidad esperada igual a su nivel de utilidad de reserva u , es decir,

nXi=1

�ipie� � �� g (e�) = u (6.18)

Sea �� el precio de venta resultante de la ecuación 6.18. Eso quiere decirque el pago para el principal es �� que es, precisamente, despejando � enla ecuación 6.18

�� =

nXi=1

�ipie� � g (e�)� u

Con este contrato, tanto el principal como el agente obtienen los mismopagos esperados que con el contrato óptimo con observabilidad del esfuerzo.

El equilibrio perfecto en subjuegos es por tanto:

1. El Principal ofrece el contrato: �Te pago el salario � � ���

2. El Agente acepta un contrato si se cumple la condición Restriccion deParticipacion y realiza el esfuerzo dado por la condición Restriccionde Compatibilidad de Incentivos.

Page 155: apuntes_2010

6.3 El contrato óptimo cuando el esfuerzo no es observable. 143

Como podéis observar, de nuevo el agente está indiferente entre aceptaro rechazar el contrato, puesto que la utilidad esperada de ambas acciones essu utilidad de reserva y resolvemos esta indiferencia diciendo que el agenteacepta el contrato.

La intuición es tan extraña como sencilla: Si el agente es neutral al riesgo,le vendemos la empresa. Con esto, el agente hará lo mejor para la empresaporque es suya. Así el objetivo del agente, la maximización de la utilidadesperada, que bajo neutralidad al riesgo se reduce a la maximización de losingresos esperados de la empresa, es el mismo que era el del principal en elcaso de observabilidad. Técnicamente, convertimos al agente en el residualclaimant.

Hemos demostrado que este es el mejor contrato posible, porque sabemosque lo mejor que se puede conseguir es el resultado del óptimo conobservabilidad y esto es precisamente lo que se obtiene con este contratode venta de la empresa.

Pero ojo, esto funciona sólo en el caso de que el agente sea neutral alriesgo. Si no fuera neutral al riesgo, su objetivo ya no sería la maximizaciónde los ingresos esperados y ya no podemos estar seguros de que la venta dela empresa sea el mejor contrato que se puede diseñar...

6.3.2 Agente averso al riesgo

Cuando el agente es averso al riesgo, las cosas se ponen un pocomás complicadas. Para caracterizar el contrato óptimo, vamos denuevo a considerarlo como un problema en dos etapas: en la primera,caracterizaremos el esquema salarial óptimo para cada nivel de esfuerzorequerido y en la segunda, elegiremos el nivel de esfuerzo óptimo.

1. Primera Etapa: Esquema salarial óptimo para un nivel de esfuerzodado.

Los incentivos apropiados para implementar el nivel de esfuerzoe deben ser tales que minimicen el salario pagado al agente.Sin embargo, dado que el esfuerzo es no observable, tenemos dosrestricciones que afectan a este problema de optimización: por unlado, el agente tiene que aceptar el contrato (esta es la mismarestricción que antes, la restricción de participación), pero, por otrolado, el principal se enfrenta a un problema adicional: el agente tieneque desear realizar el esfuerzo e que el principal encuentra óptimo.

Page 156: apuntes_2010

144 6. Riesgo Moral e Incentivos

Formalmente, el esquema salarial o de incentivos apropiado deberesolver

minfwig

Pni=1 wipie restringido a:

(i)Pn

i=1 u (wi) pie � g(e) � u(ii) e resuelve max

e

Pni=1 u (wi) pie � g(e)

(6.19)

La segunda restricción se denomina Restricción de Compatibilidad deIncentivos: simplemente dice que la utilidad esperada del agente esmayor si realiza el esfuerzo que el principal quiere implementar; esdecir, asegura que el agente realmente quiera elegir el esfuerzo e queel principal desea implementar.

Pero, ¿cómo se implementan estos niveles de esfuerzo?.

Consideremos el caso en que el principal quiere que el agente elija elesfuerzo e = L. La restricción de Compatibilidad de Incentivos seríaentonces

nXi=1

u (wi) piL � g(L) >nXi=1

u (wi) piH � g(H) (6.20)

El problema queda entonces con la siguiente función objetivo:

L =Pn

i=1 wipiL++� [u�

Pni=1 u (wi) piL + g(L)]+

+� [Pn

i=1 u (wi) piH � g(H)�Pn

i=1 u (wi) piL + g(L)]

donde � y � son los multiplicadores de Lagrange de este problema deoptimización. La condición de primer orden de Kuhn-Tucker es

@L@wi

= piL��u0 (wi) piL��u0 (wi) [piL � piH ] = 0 para todo i = 1; 2; :::; n

o, agrupando términos,

1

u0 (wi)= �+ �

�1� piH

piL

�para todo i = 1; 2; :::; n (6.21)

Suponiendo que la restricción de participación es activa en elequilibrio, es decir, � es distinto de cero, nos queda por considerar larestricción de compatibilidad de incentivos.

Supongamos que no está activa en el óptimo, es decir, que esirrelevante, que no hay problema de incentivos,.... Esto implica que� es cero. Así, la condición de primer orden sería

1

u0 (wi)= � para todo i = 1; 2; :::; n

Page 157: apuntes_2010

6.3 El contrato óptimo cuando el esfuerzo no es observable. 145

o bienu0 (wi) =

1

�= cte para todo i = 1; 2; :::; n

es decir, el salario del agente es constante e independiente del estadode la naturaleza. Sea el esquema salarial wi = w: Sustituyéndolo enla restricción de compatibilidad de incentivos tenemos

u (w)nXi=1

piL � g(L) > u (w)nXi=1

piH � g(H)

y como las distribuciones de probabilidad suman 1, la expresiónanterior implica

g(L) < g(H)

Por lo tanto, este caso solo puede ocurrir cuando el nivel de esfuerzopreferido por el principal es aquel que conlleva el menor coste parael agente. Así, no hay ningún con�icto de intereses entre el agentey el principal. La intuición es sencilla: si el esfuerzo a implementares el menor (L), la no observabilidad del esfuerzo no provoca ningúnproblema. El principal ofrece un salario �jo que cumpla la restricciónde participación y el agente, dado que el salario no depende de losingresos de la empresa hace el esfuerzo que le causa el menor coste,a saber, L.

Pero no siempre vamos a vivir en este mundo ideal. Si el esfuerzo aimplementar no es el de menor coste, sino H, entonces el salario nopuede ser �jo, porque si no, el agente realizaría el esfuerzo menor,sino que tiene que variar con el estado de la naturaleza, es decir, conlos ingresos de la empresa. Pero, ¿de qué forma ha de variar?. Eso lodescubriremos ahora mismo, aunque estad preparados para llevarosmás de una sorpresa...

El problema a resolver es por tanto

minfwig

Pni=1 wipiH restringido a:

(i)Pn

i=1 u (wi) piH � g(H) � u(ii)

Pni=1 u (wi) piH � g(H) >

Pni=1 u (wi) piL � g(L)

(6.22)

con el siguiente lagrangiano asociado

L =Pn

i=1 wipiH++� [u�

Pni=1 u (wi) piH + g(H)]+

+� [Pn

i=1 u (wi) piL � g(L)�Pn

i=1 u (wi) piH + g(H)]

y la condición de primer orden sería

1

u0 (wi)= �+ �

�1� piL

piH

�(6.23)

Page 158: apuntes_2010

146 6. Riesgo Moral e Incentivos

donde � y � son distintos de cero.

Podemos utilizar la ecuación 6.23 para conocer algunas propiedadesdel esquema salarial óptimo cuando las dos restricciones son activasen el óptimo. Considera el salario �jo bw tal que 1

u0( bw) = �.La ecuación 6.23 nos dice que

piLpiH

< 1) wi > bwy

piLpiH

> 1) wi < bwDemostración:

(a) Para el estado de la naturaleza i sabemos que el salario wisatisface la condición

1

u0 (wi)= �+ �

�1� piL

piH

�Pero como 1

u0[ bw] = �, esta condición la podemos escribir1

u0 (wi)=

1

u0 ( bw) + ��1� piL

piH

�Supongamos que piL

piH< 1. Entonces, tenemos que

1

u0 (wi)>

1

u0 ( bw)Pero como sabemos que la función u es tal que u0(�) > 0, tenemosque

u0 (wi) < u0 ( bw)

Además, como u00(�) < 0, tenemos

wi > bwLa demostración para el caso en que piL

piH< 1. es análoga y por

tanto es omitida.

c.q.d.

Page 159: apuntes_2010

6.3 El contrato óptimo cuando el esfuerzo no es observable. 147

Esta relación es bastante intuitiva. El salario óptimo es mayor quebw (son más altos) para aquellos niveles de ingresos que son másprobables que ocurran cuando el agente realiza H en vez de L, enel sentido de tener un ratio de verosimilitud piL

piHmenor que 1, y

son más bajos para niveles de ingresos que son más probables queocurran cuando el agente realiza el esfuerzo menor. Así, estamosproporcionando al agente unos incentivos geniales: cuanto mayor seael bene�cio de la empresa, mayor es el salario del agente. Pero paraque los ingresos sean altos con mayor probabilidad, el agente tiene queelegir el nivel de esfuerzo alto, que es precisamente el que nosotrosqueremos.

Si piLpiH

es decreciente en �i entonces el esquema salarial óptimo escreciente en ingresos . Es decir, mayores ingresos implican mayoressalarios para el agente. Esto tiene un nombre técnico: the monotonelikelihood ratio property11 .

Se puede demostrar que dada la variabilidad del salario en el casode no observabilidad del esfuerzo, el salario esperado para el agentees mayor que el salario óptimo con observabilidad, es decir, elcoste salarial para implementar el esfuerzo alto es mayor bajo noobservabilidad.

2. Segunda Etapa: Elección óptima del nivel de esfuerzo.

Este segundo paso es como en el caso de observabilidad del esfuerzo.El principal debe comparar el incremento en los ingresos con ladiferencia en el salario esperado a pagar al agente para elegir el nivelde esfuerzo óptimo. No hay nada nuevo que comentar...

A modo de conclusión.

Si el contrato óptimo bajo no observabilidad conlleva implementar elesfuerzo menor, entonces el principal debe elegir un salario �jo igual alóptimo con observabilidad, mientras que cuando el contrato óptimo bajono observabilidad implica implementar el nivel de esfuerzo alto, el salario noes �jo sino variable en función de los ingresos de tal forma que en términosesperados, el salario a pagar al agente es mayor que el salario en el caso deobservabilidad. Así pues, en este modelo, la no observabilidad del esfuerzoa realizar por el agente implica mayores costes para el principal a la hora deimplementar el esfuerzo alto y los mismos costes si se trata de implementar

11La traducción es algo así como la propiedad del ratio de verosimilitud monótono.Pero ojo, si no se cumple esta propiedad, entonces puede darse el caso de que mayoresbene�cios impliquen menores salarios para el agente... algo que en principio parece pocointuitivo.

Page 160: apuntes_2010

148 6. Riesgo Moral e Incentivos

el esfuerzo bajo. Es decir, bajo no observabilidad del esfuerzo se produceuna pérdida de bienestar para el propietario de la empresa.

Remark 18 La no observabilidad introduce ine�ciencia (�perjudica�) enel sistema económico, en particular para el dueño de la empresa, siempreque el agente sea averso al riesgo y el óptimo sea implementar el nivelde esfuerzo alto. En otros casos, implementación del esfuerzo bajo oneutralidad del agente, la no observabilidad es inocua.

6.4 Principal-agente con n=2

El problema del principal-agente cuando no hay observabilidad del esfuerzoes un problema de optimización en el que la función objetivo es lineal perolas restricciones son no lineales. Sin embargo, no es difícil encontrar unprograma de optimización equivalente en el que la función objetivo sea nolineal y las restricciones sean lineales, de forma que nos permita realizar unanálisis grá�co casi trivial...

Imaginemos que el principal quiere implementar el nivel de esfuerzo H.Así, el problema de maximización del principal es el siguiente:

maxfwig

Pni=1 [�i � wi] piH restringido a:

(PC)Pn

i=1 u (wi) piH � g(H) � u(IC)

Pni=1 u (wi) piH � g(H) >

Pni=1 u (wi) piL � g(L)

Sea ui la utilidad que consigue el agente si ocurre el bene�cio �i, es decir,u (wi) = ui. Sea f(�) = u�1(�), es decir, la inversa de la función de utilidaddel agente y escribamos wi = f (ui). La función f lo único que indica es elcoste para el principal (el salario a pagar al agente) si quiere proporcionarun nivel de utilidad ui:

Así, podemos reescribir el problema de maximización original de lasiguiente forma

maxfuig

Pni=1 [�i � f (ui)] piH restringido a:

(PC)Pn

i=1 ui piH � g(H) � u(IC)

Pni=1 ui piH � g(H) >

Pni=1 ui piL � g(L)

(6.24)

La variable de elección es ahora una distribución de utilidades para elagente, en donde el coste para el principal de proporcionar el nivel deutilidad ui es simplemente f (ui) = wi:

Este problema puede ser analizado grá�camente cuando n = 2: Así pues,estudiemos el caso en el que hay dos niveles posibles de ingresos , �1 y �2,donde �1 < �2, por lo que el principal solo necesita establecer dos niveles de

Page 161: apuntes_2010

6.4 Principal-agente con n=2 149

utilidad, a saber, u1 y u2, la utilidad recibida por el agente si el estado de lanaturaleza es 1 y 2, respectivamente. Además, suponemos que p2H > p2L.

El siguiente paso es representar grá�camente las restricciones departicipación y compatibilidad de incentivos. Para ello, es necesarioconsiderar las curvas de indiferencia del agente. Vayamos por partes.

Dados los niveles de utilidad u1 y u2 establecidos por el principal enel contrato, el agente puede calcular la utilidad esperada asociada a larealización del esfuerzo H y el nivel de utilidad esperada asociado a larealización del esfuerzo L.

Así, podemos calcular los pares (u1; u2) que proporcionan al agente lamisma utilidad esperada si realiza el esfuerzo H. Esta será su curva deindiferencia para el esfuerzo H y adopta la forma

p1Hu1 + p2Hu2 � g(H) = UH

Análogamente, podemos calcular los pares (u1; u2) que proporcionan alagente la misma utilidad esperada si realiza el esfuerzo L. Esta será sucurva de indiferencia para el esfuerzo L y adopta la forma

p1Lu1 + p2Lu2 � g(L) = UL

Tratemos en primer lugar de representar grá�camente la restricción decompatibilidad de incentivos (IC).

Considera el par (u1; u2) tal que el agente es indiferente entre elegir elnivel de esfuerzo H o el nivel de esfuerzo L, es decir UL = UH . Estos sonpares en el espacio u1 � u2 en los que se cruzan la curva de indiferenciapara el esfuerzo H y la curva de indiferencia para el esfuerzo L asociadas almismo nivel de utilidad. El locus de todos estos pares de utilidades vienedado por la ecuación

p1Hu1 + p2Hu2 � g(H) = p1Lu1 + p2Lu2 � g(L)

manipulando esta expresión obtenemos

UH � UL = u1 (p1H � p1L) + u2 (p2H � p2L)� g(H) + g(L) = 0 (6.25)

Resolviendo para u2 tenemos la siguiente expresión

u2 =� (p1H � p1L)p2H � p2L

u1 +g(H)� g(L)p2H � p2L

(6.26)

Como p2H > p2L , tiene que ser el caso de que p1L > p1H , puesto que lasprobabilidades tienen que sumar 1. Esto implica que el coe�ciente de u1en la ecuación 6.26 es positivo y, por lo tanto, la línea determinada por laecuación 6.26 tiene pendiente positiva. ?�Cuánto vale la pendiente de esta

Page 162: apuntes_2010

150 6. Riesgo Moral e Incentivos

curva? No es difícil demostrar que la pendiente es uno: el denominador esD = p2H � p2L. Sumando y restando p21H tenemos

D = p2H � p2L + p1H � p1Hpero como p1H + p2H = 1, obtenemos

D = 1� p2L � p1H

pero recordando que p1L + p2L = 1; obtenemos

D = p1L � p1H

que es precisamente el numerador.

?�Cuál es la interpretación de esta curva? Nos dice aquellos contratosen los que el agente está indiferente entre llevar a cabo el esfuerzo H o elesfuerzo L. Así, puntos situados fuera de esta curva nos dicen que el agentetiene un único nivel de esfuerzo preferido (el único que maximiza su utilidadesperada). ?�Qué región del espacio u1�u2 está asociada a contratos en losque el agente pre�ere el esfuerzo H?. La respuesta es aquella región situadapor encima de la curva 6.26. ?�Por qué?.

No es difícil responder a esta pregunta. Cuando los pares (u1; u2) cumplenla ecuación 6.26, el agente está indiferente entre las accionesH y L, es decir,UH �UL = 0 . Fijemos el valor de u1 e incrementemos el valor de u2 hastaeu2 = u2+ �; donde � > 0: Así, estamos en la región por encima de la curva.?�Qué esfuerzo es el preferido por el agente?. Observando la ecuación 6.25tenemos que UH � UL = 0 + � (p2H � p2L) > 0 porque p2H > p2L:Hemos llegado a la conclusión de que si queremos implementar el nivel de

esfuerzo H, como es nuestro propósito, el esquema de utilidades, es decir,el contrato ofrecido al agente, debe estar en la región situada por encimade la curva 6.26.

Estudiemos ahora la restricción de participación (PC). Esta requiereque la utilidad esperada asociada el esfuerzo H sea, como mínimo, su nivelde utilidad de reserva; analíticamente

p1Hu1 + p2Hu2 � g(H) � u

El conjunto de contratos (u1; u2) donde esta condición se satisface conigualdad es simplemente la curva de indiferencia para el esfuerzo H delagente asociada a UH = u.

La intersección de la región de compatibilidad de incentivos con lacurva de indiferencia de la restricción de participación nos da los contratos(u1; u2) que satisfacen las dos restricciones.

También hemos dibujado la línea de 45 grados. Esta línea es importanteporque nos dice aquellos pares (u1; u2) donde u1 = u2. Es decir, el agente

Page 163: apuntes_2010

6.4 Principal-agente con n=2 151

recibe el mismo salario independientemente del estado de la naturaleza:el agente está asegurado completamente. Según hemos estudiado en lassecciones anteriores, la solución al problema del principal estaría en estalínea si no existiera ningún problema de compatibilidad de incentivos y, portanto, la única restricción a satisfacer fuera la de participación u1 = u2 = u.

Pero ojo, debido a la presencia de la restricción de compatibilidad deincentivos, el punto de seguro completo puede no ser siempre el óptimo.La solución al problema del principal dependerá de cual es la desutilidadasociada a cada nivel de esfuerzo.

Para encontrar la solución al problema del principal, solo nos queda pordibujar las curvas de indiferencia del principal, es decir, sus curvas iso-bene�cio-esperado. Estas adoptan la forma siguiente

p1H [�1 � f (u1)] + p2H [�2 � f (u2)] = cte

Los ingresos -esperados del principal se incrementan cuando los salarios apagar, f (ui) ; son menores. Obvio. ¿Qué sabemos acerca de su pendiente?.La pendiente de las curvas iso-bene�cio-esperado viene dada por

M = �p1Hf0 (u1)

p2Hf 0 (u2)

Cuando u1 = u2 , es decir, en la diagonal principal, tenemos que M =�p1Hp2H

: Pero dado que las curvas de indiferencia del agente para el nivel deesfuerzo H responden a la ecuación p1Hu1 + p2Hu2 = cte, su pendientecuando u1 = u2 viene dada por �p1H

p2H: Por lo tanto, las curvas de

indiferencia del agente para el esfuerzoH y las curvas iso-bene�cio-esperadodel principal deben ser tangentes a lo largo de la curva de 45 grados.

Ya tenemos todos los elementos necesarios para encontrar la solucióngrá�ca al problema del principal:

1. Si el esfuerzo H es el más costoso para el agente, g(H) > g(L);entonces la región de compatibilidad de incentivos está situada porencima de la diagonal principal por lo que la línea de seguro completono es asequible. En este caso, la restricción de compatibilidad deincentivos está activa, es decir, es relevante, y la solución óptimaimplicará u1 6= u2; por lo que el agente tendrá que soportar algunriesgo.

2. Pero si el esfuerzo H es el menos costoso para el agente, g(H) <g(L); entonces la región de compatibilidad de incentivos está situadapor debajo de la diagonal principal, por lo que la línea de segurocompleto es asequible. En este caso, la restricción de compatibilidadde incentivos no es relevante, y la solución óptima implicará u1 = u2;por lo que el agente estará completamente asegurado.

Page 164: apuntes_2010

Parte III

El Diseño de Mecanismos

152

Page 165: apuntes_2010

This is page 153Printer: Opaque this

7Economía del Bienestar

7.1 Límites del Conocimiento y de la Acción

Lleváis toda la carrera (más de 4 años) describiendo el comportamientode los agentes económicos mediante problemas de maximización conrestricciones. (El paradigma Principal�Agente es un clarísimo ejemplo).El valor de los multiplicadores de Lagrange nos informa a cerca de cuánto

nos restringen las restricciones asociadas.

� �Restricción presupuestaria (DINERO)

�Restricción tecnológica (CIENCIA)

�Restricción cognitiva (Ausente en la carrera pero muy presenteen la investigación actual en Economía)

Vuestra visión puede estar por lo tanto �de hecho lo está- sesgadahacia una idea muy decimonónica de que todo lo deseable sería �nalmenterealizable, de que todo óptimo es posible, sin más que ir poco apoco levantando las restricciones. Este sentimiento queda resumidomagní�camente en las siguientes palabras de Laplace: "El presente es efectodel pasado y causa del futuro".

Claim 2 El demonio de Laplace. �Podemos mirar el estado presente deluniverso como el efecto del pasado y la causa de su futuro. Se podríacondensar un intelecto que en cualquier momento dado sabría todas lasfuerzas que animan la naturaleza y las posiciones de los seres que lacomponen, si este intelecto fuera lo su�cientemente vasto para someter los

Page 166: apuntes_2010

154 7. Economía del Bienestar

datos al análisis, podría condensar en una simple fórmula de movimiento delos grandes cuerpos del universo y del átomo más ligero; para tal intelectonada podría ser incierto y el futuro así como el pasado estarían frente susojos�

Hoy, a principios del siglo XXI, tenemos una visión más pesimista (¿?).Hoy sabemos que hay límites insuperables a lo que podemos hacer o saber.Esos límites están presentes en casi todas las ramas del conocimiento (ypor lo tanto, también en Economía)

Los límites a nuestro conocimiento o acción toman la forma de Teoremasde Imposibilidad. Estos Teoremas no nos dicen cómo son las cosas, sinocómo no pueden ser.

� Física:

�Leyes de la Termodinámica:

� (i) La energía se conserva� (ii) la energía se degrada� (iii) el cero absoluto es inalcanzable

� La velocidad de la luz en el vacío (c) es insuperable (limite almovimiento, y por ende, a la transmisión de información)

�Principio de Indeterminación de Heisenberg (límite ala determinación conjunta de la velocidad y posición de unapartícula)

� Matemáticas:

�Teorema de Incompletitud de Gödel: Una teoría aritméticano puede ser al mismo tiempo consistente, axiomatizable ycompleta.

� Economía:

�Teorema de Imposibilidad de Arrow (The impossibility of asocial ordering): Una agregación de las preferencias individualesno puede ser al mismo tiempo racional, paretiana, independientede alternativas irrelevantes y no dictatorial.

En la siguiente sección veremos cómo se demuestra este famoso teorema.

Page 167: apuntes_2010

7.2 El Teorema de Imposibilidad de Arrow. La demostración de John Geanakoplos 155

7.2 El Teorema de Imposibilidad de Arrow. Lademostración de John Geanakoplos

¿Qué signi�ca la frase "EEUU quiere deshacerse de Sadam Hussein"? ¿Quésigni�ca la frase "España quiere entrar en el G8"? Pues que España tieneuna relación de preferencias tal que entrar en el G8 se pre�ere a estar fueradel G8.

La pregunta que surge es cómo se construye dicha relación de preferenciassocial a partir de la relación de preferencias individuales de todos losespañoles. Kenneth Arrow en 1951 consideró una serie de principiosnormativos básicos que pensaba debía tener cualquier método de agregaciónde preferencias individuales racionales en una preferencia social racional:

� Universalidad: Que funcione para cualquier posible per�l depreferencias individuales.

� Pareto E�ciente: Si todos los individuos pre�eren x a y, entoncesla preferencia social también (unanimidad).

� No dictatorial: La preferencia social no se corresponde con lapreferencia de ningún individuo.

� Independencia de alternativas irrelevantes: La preferenciasocial sobre x e y sólo depende de las preferencias individuales sobrex e y.

Kenneth Arrow demostró que estas cuatro propiedades juntas implicanla intransitividad de la relación de preferencias social. O lo que es lo mismo,transitividad más tres de éstas contradice la cuarta.

(OJO: EN EL CASO DE SÓLO DOS OPCIONES, LA REGLA DE LAMAYORÍA FUNCIONA)

Teorema 4 Cualquier sistema de agregación social que respete latransitividad, la independencia de alternativas irrelevantes y la unanimidades una dictadura.

La demostración original de Arrow es un engorro. Hay demostracionesposteriores, algunas debidas a españoles insignes �fundamentalmenteSalvador Barberá�, que son un pelín más cortas. Pero yo os mostraré aquíuna demostración "preciosa"1 de John Geanakoplos de su artículo �Threebrief proofs of Arrow�s Impossibility Theorem�(1998).

Demostración. Vamos a demostrar que para cualquier par dealternativas a y c, un ranking social que cumpla T, IAI y U es D,

1Preciosa en el sentido de que es corta y elegante. Es, como diría Paul Erdos, dignadel libro de Dios.

Page 168: apuntes_2010

156 7. Economía del Bienestar

es decir el ranking social coincide con el ranking de una persona, quenaturalmente debe ser llamado dictador. La clave es usar mucho el principiode Independencia de Alternativas Irrelevantes (IAI). Por este principio, elranking social entre a y c no depende de dónde anden las demás alternativasa nivel individual. En toda la demostración vamos a trabajar con unaalternativa b cualquiera diferente de a y c, y vamos a ir subiéndola ybajándola a nivel individual pero sin tocar el ranking individual ac paralos individuos, por lo que estos cambios de subir y bajar la alternativa bno afectarán a la comparación social ac.

Paso 1. Concentrémonos en per�les en los que todos los miembrosde la sociedad consideran que la alternativa b es o la mejor o la peor.Entonces el ranking social pone la alternativa b o la primera o la última.La demostración es trivial. Supongamos que no sea cierto, sino que en elranking social existen las alternativas Q y R tales que Q �S b �S R. Fíjateen que por IAI, el ranking social Qb sólo depende del orden individual Qb,así que podemos sentirnos libres de cambiar a nivel individual la posiciónde la alternativa R sin afectar para nada al ranking social de Qb. Puesbien, hagamos que cada individuo suba la alternativa R por encima dela Q sin cambiar las posiciones relativas de Qb y bR -se puede hacerporque para cada individuo b está situado en un extremo-. Ahora bien,por unanimidad el ranking social debe preferir R a Q porque todos losindividuos lo pre�eren. Pero eso entra en contradicción con la transitividddel orden social que implica que Q es preferida a R.

Paso 2. Centrémonos en el per�l de preferencias en el que todos losmiembros de la sociedad consideran que la alternativa b es la peor. Eso noafecta a la comparación social ac (recuerda que ese es nuestro objetivo) perositua a b en el fondo del ranking social por unanimidad. Concentrémonosahora en el per�l en el que todos los miembros de la sociedad consideran quela alternativa b es la mejor. Eso no afecta a la comparación social ac (siguesiendo nuestro objetivo) pero situa a b en los más alto del ranking social.Ahora vamos a ir considerando mundos en los que individuo a individuo yde forma secuencial, la alternativa b pasa de ser la peor a la mejor. Llegaráun individuo para el que el ranking social cambie de situar a b la últimaa situarla la primera (por unanimidad sabemos que existe ese individuoLlámalo n� y recuerda que es especial...

Paso 3. Pensemos ahora en un per�l del individuo n� tal que a �n� cy demostremos que el ranking social coincide con el ranking del individuon�. Para ello, subamos y bajemos las alternativas ac sin cambiar su ordenrelativo en el individuo n� de tal forma que la alternativa especial b quedeen medio, es decir, a �n� b �n� c y pensemos en el ranking social ac.Por IAI, el ranking social ac no depende de dónde ande la alternativa ba nivel individual así que vamos a centrarnos en el per�l de preferenciasindividuales en el que todos los individuos a la izquierda de n� pongan

Page 169: apuntes_2010

7.3 Después de Arrow hay vida: Funciones de Bienestar Social y Funciones de Elección Social 157

a b en los más alto y todos los individuos a la derecha de n� pongan laalternativa b abajo del todo. La siguiente tabla ilustra esta situación:

Ranking Individuales Ranking1 2 ... N� ... N-1 N Social

b b ... ... ... ... ...a abc c

... ... ... ... ... b b

Piensa ahora en el ranking social de las alternativas ab. Sólo depende delas posiciones relativas ab a nivel individual... así pues debe ser igual queel ranking social en el per�l en el que el individuo especial n� pone b en elfondo. Pero claro, en ese mundo b es la peor alternativa social. Por tantodebe ser a �n� b.

Piensa ahora en el ranking social de las alternativas bc. Sólo depende delas posiciones relativas bc a nivel individual... así pues debe ser igual queel ranking social en el per�l en el que el individuo especial n� pone b enlo más alto. Pero claro, en ese mundo b es la mejor alternativa social. Portanto debe ser b �n� c.

Pero claro, por transitividad del orden social debemos tener a �n� c.Fíjate en que el ranking social replica �elmente el ranking individual delindividuo n� para cualquier par de alternativas ac. Este individuo especiales efectivamente un dictador. cqd2

7.3 Después de Arrow hay vida: Funciones deBienestar Social y Funciones de Elección Social

El Teorema de Imposibilidad de Arrow nos dice que no existe ningunaFunción de Bienestar Social que satisfaga simultáneamente estos cuatroprincipios normativos. La literatura ha seguido dos caminos bien distintos.

1. El primero es seguir pensando en términos de Funciones deBienestar Social y ver qué funciones no cumplen con qué principionormativo, o si cabe proponer principios alternativos:

� La Regla de Borda: Incumple el axioma de Independencia deAlternativas Irrelevantes.

2Faltaría mostrar que el ranking social también coincide con el individual cuandouna de las alternativas involucradas es la alternativa mágica b. Esto te lo dejo a ti comoejercicio.

Page 170: apuntes_2010

158 7. Economía del Bienestar

� La Regla de la Mayoría: Incumple el axioma de universalidad(single-peaked preferences).

2. Pensar en un concepto alternativo: Funciones de Elección Social:Si yo quiero la función de bienestar social para tomar una decisión,entonces con saber qué alternativa queda en primer lugar es su�ciente;es decir, no me interesa tanto qué alternativa queda en tercer o cuartolugar y luego ojo, requerir que sea transitiva. En este caso hablamosde una función de elección social. (REGLAS DE VOTACIÓN SONLAS MÁS TÍPICAS)

Pero ojo, las preferencias no se llevan escritas en la frente y sabemosde la segunda parte de este curso que es posible que esto cause ciertosproblemas estratégicos. La versión más ingenua pasa por preguntárselasdirectamente a los invididuos para luego enchufarlas en la regla de elecciónsocial, pero... necesitamos primero ver qué reglas de elección social inducena los individuos a relevar honestamente sus preferencias. En los años 70se demuestra un resultado negativo que tiene un gran paralelismo con elTeorema de Imposibilidad de Arrow. De hecho, Philip Reny proporciona lademostración en paralelo de los dos resultados.

7.4 El Teorema de Gibbard-Satterhwaite

En los 70 se demuestra un resultado negativo acerca de las reglas deelección social (tiene un tu�llo al Arrow�s Impossibility Theorem quequeda evidenciado en el artículo de Philip Reny "Arrow�s Theorem andthe Gibbard-Satterhwaite Theorem: A Uni�ed Approach", publicado enEconomics Letters a principios del siglo XXI). El Teorema es el siguiente:

Teorema 5 La única regla de elección social e�ciente no manipulable esla dictatorial.

Os voy a presentar una �especie�de demostración informal que utilizala e�ciencia de Pareto. Considera dos jugadores fA;Bg y tres opcionesfa; b; cg y con los siguientes tipos (per�les de preferencias)

A B

a bb ac c

Fíjate en que ambos están de acuerdo en que la c es la peor pero no seponen de acuerdo en cuál de las otras dos es la mejor. Supongamos que la

Page 171: apuntes_2010

7.4 El Teorema de Gibbard-Satterhwaite 159

regla de elección social elige la opción a (la mejor del jugador A).

f

0BB@A B

a bb ac c

1CCA=AAhora vamos a dejar �jas las preferencias del jugador A y pensemos en

las estrategias del jugador B en el juego de declaraciones de los tipos. Laidea es computar la función de mejor respuesta del jugador B tratando deevitar que el jugador B nos mienta . . .

El jugador B tiene 6 posibles tipos (hay 3! permutaciones posibles de 3elementos).

Socialoutcome

abacbcc

a,b,ca,ca,baaa

bacacbbccbbaaa

B6B5B4B3B2B1A

Socialoutcome

abacbcc

a,b,ca,ca,baaa

bacacbbccbbaaa

B6B5B4B3B2B1A

Para que ningún tipo B quiera �mentir�es necesario que:

� En el mundo B4 el resultado social sea a (Si el resultado fuese bentonces el tipo 3 querría decir que es tipo 4).

� En el mundo B5 el resultado social sea a (Si el resultado fuese c,entonces el tipo 4 querría decir que es tipo 5).

� En el mundo B6 el resultado social sea a (otherwise, el tipo 4 nosmentiría y nos diría que es tipo 6)

Es decir, para que el individuo B no nos mienta tenemos que hacer quesus declaraciones sean irrelevantes, es decir, debemos convertir al individuoA en un ¡¡dictador!! c.q.d.

Fíjate en el uso tan curioso que le hemos dado en esta pregunta a laTeoría de Juegos que hemos aprendido en esta asignatura. Estamos dándolela vuelta: Hasta ahora hemos considerado situaciones estratégicas dadas ylas hemos resuelto utilizando no se qué concepto de solución pero ahoraestamos pensando en que queremos conseguir no se qué solución y queremosver si podemos diseñar un juego que nos la proporcione.

Eso es la Teoría del Diseño de Mecanismos y no sólo atañe a los problemasde elección social. Es tan importante que el Nobel de Economía de 2007

Page 172: apuntes_2010

160 7. Economía del Bienestar

se le ha concedido a Leonid Hurwicz, Eric S. Maskin y Roger B. Myersonpor "haber establecido las bases de la teoría del diseño de mecanismos". Elsiguiente tema, el último de este curso, servirá como introducción al asunto.

Page 173: apuntes_2010

This is page 161Printer: Opaque this

8El Principio de Revelación y elDiseño de Mecanismos

8.1 Introducción. Turning Game Theory on itsHead

Un �principal� se enfrenta a múltiples �agentes� que tienen informaciónprivada. El principal querría condicionar sus decisiones a la informaciónque tienen los agentes. Pero lamentablemente no dispone de ella. Podríasimplemente preguntar a los agentes, pero ya sabemos que éstos no diríanla verdad a menos que el principal les proporcione los incentivos adecuados(recuerda el tema 6). A veces, la provisión óptima de incentivos es costosapor lo que lo más normal es que exista un trade-o¤ que resulte en unadecisión ine�ciente.

Esta estampa genérica se aplica a multitud de situaciones económicasdependiendo de quién sea el principal.

� Un gobierno (planeador social) cuyo objetivo es el bienestar de lasociedad

�Regulación monopolio con costes desconocidos (clásico de los 80)

�Provisión óptima de un bien público (clásico de los 50 y 60)

� Un mediador (entre dos partes)

�Dilema del Rey Salomón (clásico de Bernardo)

Page 174: apuntes_2010

162 8. El Principio de Revelación y el Diseño de Mecanismos

� Un egoísta (persona normal y corriente)

�Un vendedor quiere vender un objeto pero no sabe laspropensiones a pagar de los compradores (subastas)

� Intercambio bilateral

�Un monopolio discriminador de precios (tarifas no lineales)

�Una compañía de seguros que no conoce el tipo de sus asegurados(screening)

8.2 El Principio de Revelación de Myerson (1979)

En un mundo sin información privada, todo la información relevante seríaconocimiento común y por tanto el diseño de mecanismos sería innecesario.Pero no vivimos en ese mundo ideal así que el principal debe pensar cuáles la mejor forma de servir sus intereses . . . la pregunta clave es: Dados losobjetivos del principal, ¿es posible Y COMO descentralizar la decisión entrelos agentes de tal forma que, siendo ellos libres de elegir lo que quieran,terminen eligiendo lo que maximiza el bienestar del principal?

Fíjate que estamos hablando del diseño de instituciones . . . ¿cuál es lamejor institución?

¡¡La relevancia de la Teoría de Juegos en la economía es que le permiteestudiar más instituciones que el mercado competitivo!!

De�nicion 32 Un mecanismo es un juego en tres etapas con informaciónincompleta en el que los tipos de los agentes son su información privada.Etapa 1. El Principal diseña juego en el que los agentes envían mensajes

y en el que la decisión del principal se basa en los mensajes enviados.Etapa 2. Restricción de Participación: Los agentes eligen libremente si

participan o no en el mecanismo (obviamente, si el principal es el gobiernopuede considerarse ilegal la no participación)Etapa 3. Restricción de Compatibilidad de Incentivos: Los agentes que

aceptan jugar, deciden lo que quieren.

Debemos buscar respuestas a los siguientes dos interrogantes:

Q1 ¿Cuántos mecanismos hay? Pues in�nitos, y

Q2 De todos los que hay, ¿cuál es el que maximiza el bienestar delprincipal? U¤f, Pero si son in�nitos, ¿cómo vamos a ser capaces deresponder a esta pregunta...

Page 175: apuntes_2010

8.2 El Principio de Revelación de Myerson (1979) 163

Es posible que te parezca una misión imposible responder a la segundacuestión, pero hay una cosa que se llama Principio de Revelación que nosdice que en el fondo no es tan complicado. El Principio de Revelación esalgo del tipo �¿de qué color es el caballo blanco de Sant Yago?�

Ya hemos visto que no es posible implementar en estrategias dominantesuna función de decisión social e�ciente y no dictatorial. Pero es posible quecreas que es porque hemos considerado un mecanismo demasiado simple:hemos preguntado directamente a los ciudadanos acerca de sus tipos. . .¿Quién nos ha dicho que no puede existir un mecanismo/institución máscomplicada/general que sí pueda?

Supongamos que un chino (o un indio �así cubrimos un tercio de lahumanidad-) se inventa un mecanismo M (lo llamaremos Mecanismo Chinopor razones obvias) que tiene no se qué estrategias dominantes que resultanen una propiedad interesante, por ejemplo, elige el resultado e�ciente...Fíjate en que funciona con mensajes chinos y que para cada combinaciónde mensajes chinos, el mecanismo elige un resultado.

Introduzcamos al chino con su mecanismo en el interior de una máquinacon un turco que juega al ajedrez. Este nuevo mecanismo es el MecanismoTurco pero ojo, sólo habla de tipos. Así pues, los jugadores le transmitenal turco mensajes que versan sobre su tipo. El turco habla con el chino queestá escondido en el interior de la máquina y el resultado del mecanismoturco es el resultado del mecanismo chino para el per�l de mensajes chinosque hubieran sido enviados por los tipos enviados al mecanismo turco. El

Page 176: apuntes_2010

164 8. El Principio de Revelación y el Diseño de Mecanismos

siguiente grá�co te ayudará a entenderlo

Como en el mecanismo chino hay una estrategia dominante para cadajugador, en el mecanismo turco hay una estrategia dominante que es revelarel tipo verdadero. De esa forma cada jugador se asegura que el chinointroduce su mensaje �dominante�en el mecanismo chino.El siguiente esquema nos muestra el interior del mecanismo turco

A �nales de los años 70, Myerson (1979) extendió estos resultadosiniciales de Gibbard al mundo del equilibrio bayesiano. El siguiente teoremacontiene lo que se conoce como Principio de Revelación.

Page 177: apuntes_2010

8.3 Provisión E�ciente de Bienes Públicos. El Mecanismo de Clarke-Groves (1977) 165

Teorema 6 El Principio de Revelación. Cualquier equilibrio bayesianoen un juego bayesiano puede representarse mediante un mecanismo directocompatible con los incentivos.

Intuición: Hombre una proof no querrás a estas altuas del curso,simplemente voy a ponerte matemáticamente lo que hace el turco quejuega al ajedrez con el mecanismo chino en su interior. Considera unjuego bayesiano G = fA1; :::; An; T1; :::; Tn; p1; :::; pn;u1; :::; ung que tieneel siguiente equilibrio bayesiano s� = (s�1; :::; s

�n). De�namos el siguiente

mecanismo directo MD = fT1; :::; Tn; T1; :::; Tn;p1; :::; pn;u01; :::; u0ng tal queu0i (�1; :::; �1; ti) = ui (s

�1 (�1) ; :::; s

�n (�n) ; ti).

La grandeza del Principio de Revelación es su contrapositivoContrapositivo. Si una función de elección social no es truthfully

implementable usando un mecanismo bayesiano directo, entonces no existeningún mecanismo general que la implemente usando el concepto deequilibrio bayesiano.

Es decir, el principio de revelación implica que si somos capacesde identi�car una propiedad en el selecto grupo de los mecanismosdirectos bayesianos compatibles con los incentivos (dictadura, e�ciencia,imposibilidad) entonces dicha propiedad se extiende inexorablemente alconjunto de todos los mecanismos imaginables.

8.3 Provisión E�ciente de Bienes Públicos. ElMecanismo de Clarke-Groves (1977)

Piensa en el problema de provisión del bien público PMC por parte deun Gobierno (Piscina Municipal Cubierta). Cada ciudadano tiene unavaloración ti del bien. Si el Estado supiese la valoración de cada ciudadano,entonces podría comparar el bene�cio social (suma valoraciones) con elcoste de construcción para poder tomar una decisión e�ciente en cuanto ala construcción de la piscina. El problema es que no las conoce...

Gibbard�Satterthwaite (1973, 1975) nos dice que no podemos esperarimplementar la decisión e�ciente en estrategias dominantes... ¿Qué hacemosentonces?

Existe un teorema de posibilidad si restringimos el conjunto depreferencias de los ciudadanos. Pero más que restringirlas al caso single-peaked (más propio de Political Economy), pensemos en las preferenciascuasi-lineales.

ui (mi; vi) =

�vi +mi si hay piscinami si no hay piscina

Clarke�Groves (1971, 1977) nos presentan el siguiente mecanismo directo.

Page 178: apuntes_2010

166 8. El Principio de Revelación y el Diseño de Mecanismos

1. Cada ciudadano dice su valoración del bien público (lo quetécnicamente se conoce como su willingness to pay) wi

2. Se construye la piscina siempre que la suma de las valoracionesreportadas exceda del coste de provisión,

Pi wi � c.

3. Cada ciudadano recibe una transferencia igual a la suma de lasvaloraciones reportadas por los demás ciudadanos menos el coste delproyecto si el proyecto es aprobado (

Pj 6=i wj� c). Si no es aprobado,

¿qué?

Veamos que en este mecanismo decir la verdad es una estrategiadominante (supongamos para mayor facilidad de exposición que el costede provisión es cero y que la renta mi de cada individuo i también es cero).

Fíjate en que la función de pagos de cada individuo es la siguiente

ui (wi; w�i; vi) =

�vi +

Pj 6=i wj si

Pj wj > 0

0 otherwise

Supongamos que vi +P

j 6=i wj > 0. Entonces, si dice más que suvaloración no cambia la decisión del mecanismo, pero si dice menos entonceses posible que sea pivote haciendo que el mecanismo cambie su decisiónhacia la no provisión y por tanto haciendo que el ciudadano esté netamentepeor. El caso contrario es simétrico; si dice más que su valoración entonceses posible que cambie la decisión del mecanismo hacia la provisión yhaciendo por tanto que el ciudadano esté netamente peor.

Remark 19 Intuición: Lo que yo digo sólo afecta a la instalación o node la piscina, pero no a mi pago dado que hay piscina. Por eso, lo que a míme interesa es que se ponga la piscina si me interesa y no se ponga cuandono me interesa... es decir, a mí me interesa decir la verdad.

Así pues, este mecanismo no incentiva la misrepresentation de laspreferences y ¿no te recuerda a algo que hemos visto en el curso?

Uno de los problemas de este mecanismo es que no es budget balanced,es decir, que en general puede ser muy caro incentivar a los ciudadanosa decir la verdad (pagarles mucho dinero más del que recauda). Eso haceque aunque implemente la decisión e�ciente desde el punto de vista de laprovisión del bien público, no sea e�ciente si tomamos en cuenta el gastodel sector público.

Teorema 7 Teorema de Imposibilidad de Green y La¤ont (1979):No existe un mecanismo no manipulable, e�ciente y con presupuestoequilibrado.

Teorema 8 Teorema de Posibilidad de d�Aspremont y Gèrard-Varet(1979): Se puede implementar la solución e�ciente con un presupuestoequilibrado en entornos bayesianos.

Page 179: apuntes_2010

8.4 Juegos Bíblicos: El dilema de Salomón (950 bc) 167

8.4 Juegos Bíblicos: El dilema de Salomón (950 bc)

Dado que la implementación en estrategias dominantes es tan �imposible�podemos preguntarnos si utilizando conceptos de solución más exigentes �equilibrio de Nash por ejemplo- podemos encontrar teoremas de posibilidad.Y la verdad es que es cierto.

Vamos a pensar en un ejemplo bíblico: El dilema del Rey Salomón.

� Jugadores: Dos mujeres, A y B (y un niño)

� Resultados: {a:(Niño a la mujer A) , b:(Niño a la mujer B), c:(Niñocortado y cada madre recibe la mitad)}.

� La solución e�ciente es darle el niño a su madre verdadera. PeroSalomón no conoce quién es la madre verdadera.

� Las preferencias de las jugadoras son las siguientes:

� La madre verdadera pre�ere tener a su niño, pero en caso deque no se lo den, pre�ere que se lo den a la otra antes que verlocortado.

� La madre impostora pre�ere tener al niño, pero en caso de notenerlo, pre�ere verlo cortado antes que verlo con su madreverdadera.

El siguiente cuadro resume toda la situación

Solomon’sChoice f(U’)=bf(U)=a

cbacaccbbabaBABA

U’U

Solomon’sChoice f(U’)=bf(U)=a

cbacaccbbabaBABA

U’U

El problema es que Salomón no conoce quién es quién en este mundo dedisputas. Afortunadamente, Maskin (1977) auxilia al Sabio.

Teorema 9 Maskin (1977). Si f (�) es Nash-implementable entonces esmonótona.

De�nicion 33 Considera el per�l de preferencias U = fuigi=ni=1 y U0 =

fu0igi=ni=1 . Una función de decisión social f (�) es monótona en el sentido

Page 180: apuntes_2010

168 8. El Principio de Revelación y el Diseño de Mecanismos

de Maskin si para cualquier resultado x 2 f (U) y x =2 f (U 0) tenemosque existe un jugador i y otro resultado y tal que ui (x) � ui (y) perou0i (x) < u

0i (y) :

Es decir, si x es el resultado social para el per�l de preferencias U pero nopara el per�l U 0 es porque x ha debido "moverse para abajo" en el rankingde al menos un jugador. Es muy fácil su demostración directa.

Demostración.La clave del asunto está en que tenemos un juego en forma estratégica que

de forma "mágica" para el per�l de preferencias U tiene un único equilibriode Nash cuyo resultado es x y que para el per�l de preferencias alternativoU�tiene un único equilibrio de Nash cuyo resultado es y. Ten en cuenta queel juego es el mismo independientemente del per�l de preferencias... el per�lde preferencias lo que hace es cambiar la estructura de mejores respuestasde los jugadores. Con esto en la cabeza, empecemos con la demostración.

Empecemos por el per�l de preferencias U y por el hecho de que elresultado x sea el elegido por la función de elección social. Esto signi�caque existe un equilibrio de Nash tal que su resultado en equilibrio es x. Lomás fácil es visualizar la matriz de pagos

Us��i

ai ys�i xti z

Por de�nición de equilibrio de Nash, signi�ca que para cada jugador i,la mejor respuesta a s��i es s

�i , es decir

ui�s�i ; s

��i�� ui

�si; s

��i�para todo si 2 Si

Fíjate que esta función de mejor respuesta nos dice que el individuo itiene las siguientes preferencias sobre los resultados que aparecen en lamatriz x � y, x � z. Es decir, para este individuo tenemos ui (x) � ui (y)y ui (x) � ui (z).Pensemos ahora en el segundo per�l de estrategias U�. Para este per�l,

la función de elección social ya no elige el resultado x sino otro. Es decir, elequilibrio de Nash del juego tiene que se otro diferente al per�l

�s�i ; s

��i.

Esto signi�ca que la estrategia s�i ya no es mejor respuesta a s��i para algún

jugador i, sino que es otra estrategia... llamémosla ai. Veamos esto en lamatriz de pagos

U 0

s��iai ys�i xti z

Page 181: apuntes_2010

8.5 Maskin (1977) by Maskin (2007) 169

Tenemos por tanto que

u0i�s�i ; s

��i�< u0i

�ai; s

��i�

y que puestos en términos resultados nos dice que para este individuoy � x, es decir, u0i (x) < u0i (y). Fíjate en que ya hemos encontrado lo quebuscábamos, la monotonía de la función de decisión social. c.q.d.

El contrapositivo de nuevo es el que tiene poder: si una función dedecisión social no es monótona, entonces no es Nash-implementable! Y estoes lo que ocurre con el ejemplo bíblico

Solomon’sChoice f(U’)=bf(U)=a

cbacaccbbabaBABA

U’U

Solomon’sChoice f(U’)=bf(U)=a

cbacaccbbabaBABA

U’U

Como vemos, para el resultado a, el único cambio que protagoniza cuandopasamos de U a U�es que se hace más deseable para la jugadora B. Parael resultado b tenemos lo mismo (por simetría). Por tanto, no es monótona. . . ergo no se puede implementar en Nash.

Presentamos un mecanismo que implementa la solución e�ciente aunqueutilizando un concepto de solución aún más exigente: la perfección ensubjuegos, siempre que una madre verdadera valore más a un niño (V)que una impostora (v). La pregunta del millón es: ¿Es el niño tuyo?

NO

SIA B

NO

SI

Niño a B Niño a A

Niño a B, quien paga unamulta v<M<V mientras quela mujer A paga una pequeñamulta e>0.

8.5 Maskin (1977) by Maskin (2007)

Voy a cerrar esta sección utilizando el ejemplo que utiliza Eric Maskin ensu discurso Nobel de 2007 para ilustrar su concepto de monotonicidad y

Page 182: apuntes_2010

170 8. El Principio de Revelación y el Diseño de Mecanismos

su relación con la implementación. Hay dos consumidores de energía, Aliceand Bob y una autoridad energética que tiene que decidir qué políticaenergética seguir, sabiendo que hay cuatro posibles fuentes de energía

� Gas (Gas)

� Oil (Petróleo)

� Nuclear power (nuclear)

� Coal (carbón)

Supongamos que hay dos posibles estados del mundo:

Estado 1 Los ciudadanos no se preocupan por el futuro.

Estado 2 Los ciudadanos valoran el futuro.

con las siguientes preferencias de los consumidores:

State 1 State 2Alice Bob Alice BobGas Nuclear Nuclear OilOil Oil Gas GasCoal Coal Coal CoalNuclear Gas Oil NuclearOil optimal Gas optimal

Fíjate en que estas preferencias re�ejan que Alice se preocupa por laconveniencia practica de cada fuente de energía mientras que Bob sepreocupa por la seguridad.

La Autoridad Energética quiere conseguir un compromiso entre lasdistintas visiones de los ciudadanos y por tanto piensa que OIL sería elóptimo social en el estado 1 (es la segunda preferida de cada ciudadano) yGAS sería el óptimo social en el estado 2 (es la segunda preferida de cadaciudadano). Pero el problema es que no conoce el estado del mundo...

Preguntarle directamente a los ciudadanos es un enfoque demasiadoingenuo, porque los ciudadanos van a mentir.

� Alice dirá que el estado del mundo es el 2, porque para ella GAS essiempre mejor que OIL independientemente de qué estado del mundosea.

� Bob dirá que el estado del mundo es el 1, porque para él, OILes siempre mejor que GAS, independientemente de qué estado delmundo sea.

Page 183: apuntes_2010

8.5 Maskin (1977) by Maskin (2007) 171

Sin embargo, considera el siguiente mecanismo -juego-

BobL R

Alice U Oil CoalD Nuclear Gas

en el que Alice puede elegir las estrategias (Up, Down) mientras queBob puede elegir las estrategias (Left, Right). En función de las estrategiaselegidas por los ciudadanos, el mecanismo selecciona una de las fuentes deenergía.

El punto del asunto es demostrar que este simple juego consigueimplementar la fuente de energía óptima para cualquier estado del mundo.

� Estado 1: Calculemos las mejores respuestas de cada jugador (Estánsubrayadas)

Estado 1 BobL R

Alice U Oil, Oil Coal, CoalD Nuclear, Nuclear Gas, Gas

Como vemos, el único equilibrio de Nash tiene como resultado OIL,que es el óptimo social en este estado.

� Estado 2: Las mejores respuestas son las siguientes (de nuevo aparecenen negrita)

Estado 2 BobL R

Alice U Oil, Oil Coal, CoalD Nuclear, Nuclear Gas, Gas

Como vemos, el único equilibrio de Nash tiene como resultado GAS,que es el óptimo social en este estado.

¿Por qué hemos podido implementar esta función de elección social? Puesporque es monótona... Para Alice, el óptimo social en el estado 1 -Oil- caeen su ranking al pasar al estado 2 (pasa de ser la segunda a ser la última...es decir, cae en relación a la energía nuclear y al carbón).

State 1 State 2Alice Bob Alice BobGas Nuclear Nuclear OilOil Oil Gas GasCoal Coal Coal CoalNuclear Gas Oil NuclearOil optimal Gas optimal

Page 184: apuntes_2010

172 8. El Principio de Revelación y el Diseño de Mecanismos

8.6 El Principal como ser egoísta

8.6.1 El intercambio bilateral

Mucho más económico es el problema del intercambio bilateral analizadopor Myerson and Satterthwaite en 1983. Fíjate en que es uno de losproblemas básicos con los que empezábamos el curso allá por el mesde febrero. A lo largo del curso hemos visto algunas formas de abordarel problema, y casi todas ellas recuerdan al mecanismo de competenciaperfecta (precio-aceptante)

No os he contado los esfuerzos axiomáticos iniciados por Nash.

La solución de Nash (1951)

Propuso una serie de axiomas (razonables) que en su opinión debía cumplirel proceso de reparto de un excedente. Veámoslo aunque sea brevemente.

1. El resultado debe depender de las preferencias de los individuos, node la función de utilidad particular que las represente

2. Si el problema de negociación es simétrico, entonces la solución debeser simétrica

3. E�ciencia económica

4. Independencia de alternativas irrelevantes, es decir, si del conjuntode negociación se eliminan alternativas que no son la solución delproblema, entonces la solución del problema de negociación no debecambiar.

La solución de Kalai - Smorodinsky (1975)

Estos autores reemplazan el último de los axiomas de Nash y proponen lasiguiente solución.

1. El resultado debe depender de las preferencias de los individuos, node la función de utilidad particular que las represente

2. Si el problema de negociación es simétrico, entonces la solución debeser simétrica

3. E�ciencia económica

4. Monotonicidad: Si para cualquier demanda del jugador 1, el máximonivel de utilidad que puede conseguir el jugador 2 se incrementa,entonces el nivel de utilidad asignado al jugador 2 debe aumentar.

Page 185: apuntes_2010

8.6 El Principal como ser egoísta 173

Myerson y Satterthwaite (1983)

Todas las formas analizadas a lo largo del curso de reparto de un excedentecomparten una característica común: Información completa, en el sentidode que el tamaño del excedente es conocimiento común.Myerson y Satterthwaite (1983) analizaron el siguiente caso extremo de

información asimétrica:

� Un vendedor con un coste de producción c de un objeto (conocidosólo por él)

� Un comprador con una valoración del objeto v (conocido sólo por él)

Bajo información completa:Si v > c, existen ganancias asociadas al intercambio (e�ciencia), ambos

quieren por tanto entrar en negociaciones (restricción de participación) ydeterminar un precio de intercambio (equilibrio presupuestario). Nada deesto ocurre en caso contrario.

Bajo información incompleta, se preguntan si existe una institución(mecanismo) que tenga las mismas propiedades que bajo informacióncompleta

� E�ciente.

� Presupuesto equilibrado.

� Ambas partes quieran participar.

Demuestran que no existe.

8.6.2 El diseño óptimo de Subastas

Imagínate que quieres vender un objeto pero no sabes la valoración de loscompradores. Alguien te habla de las típicas subastas y entonces empiezasa considerarlas seriamente.

1. Subasta take-it-or-leave-it.

2. Subasta de sobre cerrado de primer precio.

3. Subasta de sobre cerrado de segundo precio.

4. Subasta inglesa (oral ascendente).

5. Subasta holandesa (oral descendente).

¿Con cuál te quedas?¿Seguro que no puedes diseñar tu propia subasta para que te dé más

dinero? ¿Qué tal la subasta inversa?

Page 186: apuntes_2010

174 8. El Principio de Revelación y el Diseño de Mecanismos

Teorema 10 The Revenue Equivalence Principle

Demostración. c.q.d.

8.6.3 El Mecanismo de Becker, DeGroot and Marshack

Hasta ahora hemos supuesto que hay dos compradores para la casa. . . peroqué ocurre si solo hay uno. Sea la siguiente situación:

� Un objeto a la venta

� Un único agente con una valoración v belonging to [v�; v+] y confunción de utilidad quasilineal: u(�) = v � p (si compra el objeto alprecio p) y 0 si no lo compra.

� Una distribución G (�) con soporte [v�; v+]

El mecanismo de Becker, DeGroot and Marshack (BDM) es elsiguiente:

� El agente anuncia un precio de reserva bv.� Obtenemos un precio p según la distribución G (�).

� Si p < bv entonces el agente obtiene el objeto al precio p. Si p > bventonces no adquiere el objeto (y no paga nada). Si p = bv entoncesse lanza una moneda y se decide si se adquiere o no el bien.

Claim 3 It is optimal (a weakly dominant strategy) for the agent to choosehis valuation as the reservation price.

Demostración. Dado que el agente no puede in�uir en el precio deventa y dado que sólo puede in�uir en la decisión de comprar o no a unprecio dado, su objetivo debe ser por tanto tomar la decisión de compracorrecta para cada posible precio de venta realizado. Y eso se consigueeligiendo como precio de reserva bv su propia valoración. Puesto que esteargumento funciona para cualquier G (�), no importa si ésta viene de unaruleta o del comportamiento de otros agentes (equilicuá). Esto hace queeste mecanismo sea igualito, igualito al mecanismo de Clarke y Groves y ala subasta de Vickrey. c.q.d.