You are on page 1of 255

Departamento de F sica, Facultad de Ciencias, Universidad de Chile. noa.

. Casilla 653, Correo 1, Santiago Las Palmeras 3425, Nu fono: 562 678 7276 fax: 562 271 2973 e-mail: secretaria@sica.ciencias.uchile.cl

Apuntes de un curso de

F ISICA MATEMATICA

Jos e Rogan C. V ctor Mun oz G.

Indice
I An alisis Vectorial
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
5 5 8 11 12 14 17 21 23 24 30 35 39 39 46 53 62 65 72 79 79 83 96 100 103

1 An alisis vectorial en coordenadas curvil neas y tensores. 1.1 Coordenadas ortogonales. . . . . . . . . . . . . . . . . . . 1.2 Operadores diferenciales vectoriales. . . . . . . . . . . . . . 1.3 Sistemas especiales de coordenadas: introducci on . . . . . 1.4 Coordenadas circulares cil ndricas (, , z ). . . . . . . . . . 1.5 Coordenadas polares esf ericas (r, , ). . . . . . . . . . . . 1.6 An alisis tensorial. . . . . . . . . . . . . . . . . . . . . . . . 1.7 Contracci on y producto directo. . . . . . . . . . . . . . . . 1.8 Regla del cuociente. . . . . . . . . . . . . . . . . . . . . . . 1.9 Pseudotensores y tensores duales. . . . . . . . . . . . . . . 1.10 Tensores no cartesianos, diferenciaci on covariante. . . . . . 1.11 Operadores diferenciales de tensores. . . . . . . . . . . . . 2 Determinantes y matrices. 2.1 Determinantes. . . . . . . . . . . . . . . 2.2 Matrices. . . . . . . . . . . . . . . . . . . 2.3 Matrices ortogonales. . . . . . . . . . . . 2.4 Matrices Herm ticas, matrices unitarias. 2.5 Diagonalizaci on de matrices. . . . . . . . 2.6 Matrices normales. . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

3 Teor a de grupo. 3.1 Introducci on. . . . . . . . . . . . . . . . . . . . . . . 3.2 Generadores de grupos continuos. . . . . . . . . . . . 3.3 Momento angular orbital. . . . . . . . . . . . . . . . 3.4 Grupo homog eneo de Lorentz. . . . . . . . . . . . . . 3.5 Covarianza de Lorentz de las Ecuaciones de Maxwell. 4 Series innitas. 4.1 Conceptos fundamentales . . . . . . . . . . . . . . . . 4.2 Pruebas de Convergencia . . . . . . . . . . . . . . . . 4.2.1 Pruebas de comparaci on. . . . . . . . . . . . . 4.2.2 Prueba de la ra z de Cauchy. . . . . . . . . . . 4.2.3 Prueba de la raz on de D Alembert o Cauchy. iii

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

109 . 109 . 112 . 112 . 113 . 114

iv 4.2.4 Prueba integral de Cauchy o Maclaurin. . . . . . . . . . . . 4.2.5 Prueba de Kummer. . . . . . . . . . . . . . . . . . . . . . . 4.2.6 Prueba de Raabe. . . . . . . . . . . . . . . . . . . . . . . . . 4.2.7 Prueba de Gauss. . . . . . . . . . . . . . . . . . . . . . . . . 4.2.8 Mejoramiento de convergencia. . . . . . . . . . . . . . . . . Series alternadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Criterio de Leibniz. . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Convergencia absoluta. . . . . . . . . . . . . . . . . . . . . . Algebra de series. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Mejoramiento de la convergencia, aproximaciones racionales. 4.4.2 Reordenamiento de series dobles. . . . . . . . . . . . . . . . Series de funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Convergencia uniforme. . . . . . . . . . . . . . . . . . . . . . 4.5.2 Prueba M de Weierstrass. . . . . . . . . . . . . . . . . . . . 4.5.3 Prueba de Abel. . . . . . . . . . . . . . . . . . . . . . . . . . Expansi on de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Teorema de Maclaurin. . . . . . . . . . . . . . . . . . . . . . 4.6.2 Teorema Binomial. . . . . . . . . . . . . . . . . . . . . . . . 4.6.3 Expansi on de Taylor de m as de una variable. . . . . . . . . . Series de potencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Convergencia. . . . . . . . . . . . . . . . . . . . . . . . . . . Convergencia uniforme y absoluta. . . . . . . . . . . . . . . . . . . 4.8.1 Continuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . 4.8.2 Diferenciaci on e integraci on. . . . . . . . . . . . . . . . . . . 4.8.3 Teorema de la singularidad. . . . . . . . . . . . . . . . . . . 4.8.4 Inversi on de series de potencia. . . . . . . . . . . . . . . . . Integrales el pticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.9.1 Deniciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.9.2 Expansi on de series. . . . . . . . . . . . . . . . . . . . . . . 4.9.3 Valores l mites. . . . . . . . . . . . . . . . . . . . . . . . . . N umeros de Bernoulli. . . . . . . . . . . . . . . . . . . . . . . . . . 4.10.1 Funciones de Bernoulli. . . . . . . . . . . . . . . . . . . . . . 4.10.2 F ormula de integraci on de Euler-Maclaurin. . . . . . . . . . 4.10.3 Funci on zeta de Riemann. . . . . . . . . . . . . . . . . . . . 4.10.4 Mejoramiento de la convergencia. . . . . . . . . . . . . . . . Series asint oticas o semiconvergentes. . . . . . . . . . . . . . . . . . 4.11.1 Funci on gama incompleta. . . . . . . . . . . . . . . . . . . . 4.11.2 Integrales coseno y seno. . . . . . . . . . . . . . . . . . . . . 4.11.3 Denici on de series asint oticas. . . . . . . . . . . . . . . . . 4.11.4 Aplicaciones a c alculo num erico. . . . . . . . . . . . . . . . . Productos innitos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.12.1 Convergencia de un producto innito. . . . . . . . . . . . . . 4.12.2 Funciones seno, coseno y gama. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

INDICE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 117 117 118 119 120 120 121 122 123 124 126 127 128 129 130 132 134 136 136 136 137 137 137 137 139 140 141 142 143 144 146 147 148 151 151 152 154 155 156 157 157 158

4.3

4.4

4.5

4.6

4.7 4.8

4.9

4.10

4.11

4.12

INDICE 5 Funciones de una variable compleja I. 5.1 Algebra compleja. . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Conjugaci on compleja. . . . . . . . . . . . . . . . 5.1.2 Funciones de una variable compleja. . . . . . . . . 5.2 Condiciones de Cauchy-Riemann. . . . . . . . . . . . . . 5.3 Teorema integral de Cauchy. . . . . . . . . . . . . . . . . 5.3.1 Integrales de contorno. . . . . . . . . . . . . . . . 5.3.2 Prueba del teorema de Stoke. . . . . . . . . . . . 5.3.3 Prueba de Cauchy-Goursat. . . . . . . . . . . . . 5.3.4 Regiones multiplemente conexas. . . . . . . . . . 5.4 F ormula integral de Cauchy. . . . . . . . . . . . . . . . . 5.4.1 Derivadas. . . . . . . . . . . . . . . . . . . . . . . 5.4.2 Teorema de Morera. . . . . . . . . . . . . . . . . 5.5 Expansi on de Laurent. . . . . . . . . . . . . . . . . . . . 5.5.1 Expansi on de Taylor. . . . . . . . . . . . . . . . . 5.5.2 Principio de Reexi on de Schwarz. . . . . . . . . 5.5.3 Continuaci on anal tica. . . . . . . . . . . . . . . . 5.5.4 Permanencia de la forma algebraica. . . . . . . . 5.5.5 Serie de Laurent. . . . . . . . . . . . . . . . . . . 5.6 Mapeo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.1 Traslaci on. . . . . . . . . . . . . . . . . . . . . . . 5.6.2 Rotaci on. . . . . . . . . . . . . . . . . . . . . . . 5.6.3 Inversi on. . . . . . . . . . . . . . . . . . . . . . . 5.6.4 Puntos de ramicaci on y funciones multivaluadas. 5.7 Mapeo conforme . . . . . . . . . . . . . . . . . . . . . .

v 161 . 162 . 164 . 165 . 166 . 169 . 169 . 170 . 172 . 174 . 175 . 176 . 177 . 179 . 179 . 180 . 181 . 182 . 183 . 185 . 186 . 186 . 187 . 189 . 193 195 . 195 . 195 . 196 . 198 . 198 . 200 . 202 . 203 . 204 . 205 . 206 . 207 . 213 . 216 . 216 . 218 . 218 . 219

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . .

6 Funciones de variable compleja II. 6.1 Singularidades. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Polos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Puntos de ramicaci on. . . . . . . . . . . . . . . . . . . . 6.2 C alculo del residuo. . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Teorema del residuo. . . . . . . . . . . . . . . . . . . . . 6.2.2 Valor principal de Cauchy. . . . . . . . . . . . . . . . . . 6.2.3 Expansi on en polos de funciones merom orcas. . . . . . . 6.2.4 Expansi on en producto de funciones enteras. . . . . . . . 6.2.5 Evaluaci on de integrales denidas. . . . . . . . . . . . . . 2 6.2.6 Evaluaci on de integrales denidas: 0 f (sen , cos )d . 6.2.7 Evaluaciones de integrales denidas: f (x)dx. . . . . 6.2.8 Evaluaci on de integrales denidas: f (x)eiax dx. . . . 6.2.9 Evaluaci on de integrales denidas: formas exponenciales. 6.2.10 Residuos de un polo de orden m. . . . . . . . . . . . . . 6.3 Relaciones de dispersi on. . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Relaciones de Simetr a. . . . . . . . . . . . . . . . . . . . 6.3.2 Dispersi on optica. . . . . . . . . . . . . . . . . . . . . . . 6.3.3 La relaci on de Parseval. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

vi

INDICE 6.3.4 Causalidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 6.4 El m etodo de steepest descents. . . . . . . . . . . . . . . . . . . . . . . . . . . 221

7 Ecuaciones diferenciales. 7.1 Ecuaciones diferenciales parciales . . . . . . 7.1.1 Ejemplos de PDE. . . . . . . . . . . 7.1.2 Clases de PDE y caracter stica. . . . 7.1.3 Las PDE no lineales. . . . . . . . . . 7.1.4 Condiciones de borde. . . . . . . . . 7.2 Ecuaciones diferenciales de primer orden. . . 7.2.1 Variables separables. . . . . . . . . . 7.2.2 Ecuaciones diferenciales exactas. . . . 7.2.3 Ecuaciones diferenciales ordinarias de 7.2.4 Conversi on a una ecuaci on integral. . 7.3 Separaci on de variables. . . . . . . . . . . . 7.3.1 Coordenadas cartesianas. . . . . . . . 7.3.2 Coordenadas cil ndricas circulares. . 7.3.3 Coordenadas polares esf ericas. . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . primer . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . orden lineales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

229 . 229 . 230 . 232 . 234 . 235 . 235 . 236 . 237 . 238 . 241 . 241 . 241 . 243 . 244

Indice de Figuras
1.1 Elemento de volumen curvil neo. . . . . . . . . . . . . . 1.2 Elemento de area curvil neo con q1 =constante. . . . . 1.3 Coordenadas circulares cil ndricas. . . . . . . . . . . . . 1.4 Vectores unitarios en coordenadas circulares cil ndricas. 1.5 Elementos de area en coordenadas polares esf ericas. . . 1.6 Coordenadas polares esf ericas. . . . . . . . . . . . . . . 1.7 Inversi on de coordenadas cartesianas, vector polar. . . 1.8 Inversi on de coordenadas cartesianas, vector axial. . . . 1.9 (a) Espejo en el plano xz ; (b) Espejo en el plano xz . . 2.1 2.2 2.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 10 12 13 15 16 24 25 26

Sistemas de coordenadas cartesianos. . . . . . . . . . . . . . . . . . . . . . . Sistemas de coordenadas rotados en dos dimensiones. . . . . . . . . . . . . . (a) Rotaci on respecto al eje x3 en un angulo ; (b) Rotaci on respecto a un eje x2 en un angulo ; (c) Rotaci on respecto a un eje x3 en un angulo . . . . . 2.4 Vector jo con coordenadas rotadas. . . . . . . . . . . . . . . . . . . . . . . . 2.5 Elipsoide del momento de inercia. . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Vector jo con coordenadas rotada. . . . . . . . . . . . . . . . . . . . . . . . 3.1 3.2 3.3 3.4 3.5 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 5.1 Ilustraci on de la ecuaci on (3.13). . . . . . . . . . Ilustraci on de M = UMU ecuaci on (3.42). . . . Octeto bari onico diagrama de peso para SU(3). Separaci on de masa bari onica. . . . . . . . . . . Separaci on de masa bari onica. . . . . . . . . . . Test de comparaci on. . . . . Comparaci on de integral con Rearreglo de serie arm onica Series dobles. . . . . . . . . Series dobles. . . . . . . . . Series dobles. . . . . . . . . Convergencia uniforme. . . . P endulo simple . . . . . . . Integrales el pticas. . . . . . Funci on zeta de Riemman. . Sumas parciales. . . . . . . . . . . . . suma de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. 54 . 56 . . . . . . . . . . . . . . . . . . . . 59 61 66 75 84 89 94 95 96 113 116 124 125 125 126 127 140 142 149 153

Plano complejo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 vii

viii 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 5.19 5.20 5.21 5.22 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 Mapeo en el plano complejo . . . . . . . . . . . . Complejo conjugado . . . . . . . . . . . . . . . . Aproximaciones a z0 , . . . . . . . . . . . . . . . . Camino de integraci on . . . . . . . . . . . . . . . Dominio simplemente conexo. . . . . . . . . . . . Contorno de Cauchy-Goursat. . . . . . . . . . . . Contorno cerrado en regi on multiplemente conexa. Conversi on a simplemente conexa. . . . . . . . . . Exclusi on de un punto singular. . . . . . . . . . . Centro de expansi on y puntos singulares. . . . . . Reexi on de Schwarz. . . . . . . . . . . . . . . . . Continuaci on anal tica. . . . . . . . . . . . . . . . Regi on anular. . . . . . . . . . . . . . . . . . . . . Translaci on. . . . . . . . . . . . . . . . . . . . . . Rotaci on. . . . . . . . . . . . . . . . . . . . . . . Inversi on. . . . . . . . . . . . . . . . . . . . . . . Inversi on, l neac rculo. . . . . . . . . . . . . . . . Mapeo en coordenadas hiperb olicas. . . . . . . . . L nea de corte. . . . . . . . . . . . . . . . . . . . Supercie de Riemann para ln z . . . . . . . . . . . Mapeo conforme. . . . . . . . . . . . . . . . . . . Contorno en torno a punto de ramicaci on. Singularidades aisladas. . . . . . . . . . . . Bypass de puntos singulares. . . . . . . . . Cerrando el contorno. . . . . . . . . . . . . Valor principal de Cauchy. . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Desigualdad. . . . . . . . . . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Contorno de integraci on. . . . . . . . . . . Punto de ensilladura. . . . . . . . . . . . . Contornos para las funciones de Hankel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

INDICE DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 165 167 170 171 173 174 174 176 179 181 181 183 186 187 188 189 190 191 192 194 197 199 200 201 202 206 208 210 211 213 215 217 223 224

INDICE DE FIGURAS

Segundo Curso

METODOS DE LA F ISICA MATEMATICA I

INDICE DE FIGURAS

Parte I An alisis Vectorial

Cap tulo 1 An alisis vectorial en coordenadas curvil neas y tensores.


versi on nal 1.7-0204011

Anteriormente nos hemos restringido casi por completo a coordenadas cartesianas. Estas coordenadas ofrecen la ventaja de que los tres vectores unitarios, x , y , z , son constantes tanto en direcci on como en magnitud. Infortunadamente, no todos los problemas f sicos se adaptan bien a una soluci on en coordenadas cartesianas. Por ejemplo, si tenemos un problema de fuerzas centrales, F = r F (r), tal como una fuerza gravitacional o electroest atica, las coordenadas cartesianas son particularmente inapropiadas. Tales problemas llaman a usar un sistema de coordenadas en el cual la distancia radial es tomada como una de las coordenadas, es decir, coordenadas polares esf ericas. El sistema de coordenadas debe ser elegido apropiadamente para el problema, explotando cualquier restricci on o simetr a presente en el. Naturalmente, hay un precio que pagar por usar un sistema no cartesiano de coordenadas. Debemos desarrollar nuevas expresiones para el gradiente, la divergencia, el rotor y el laplaciano en estos nuevos sistemas de coordenadas. En este cap tulo desarrollaremos tales expresiones de una manera muy general para luego particularizarla a los sistemas de coordenadas m as usados: coordenadas circulares cil ndricas y coordenadas polares esf ericas.

1.1

Coordenadas ortogonales.

En coordenadas cartesianas nosotros tratamos con tres familias de planos mutuamente perpendiculares: x =constante, y =constante, y z =constante. Imaginemos que imponemos sobre este sistema otras tres familias de supercies. Las supercies de una familia no necesariamente son paralelas unas con otras y ellas pueden no ser planos. Las tres nuevas familias de supercies no necesariamente son mutuamente perpendiculares, pero por simplicidad, r apidamente impondremos esta condici on. Podemos describir cualquier punto (x, y, z ) como la intersecci on de tres planos en coordenadas cartesianas o como la intersecci on de las tres supercies que forman nuestras nuevas coordenadas curvil neas. Describiendo las supercies de las coordenadas curvil neas por q1 = constante, q2 = constante, q3 = constante, podemos identicar nuestro punto por (q1 , q2 , q3 ) tanto como por (x, y, z ). Esto signica que en
Este cap tulo est a basado en el segundo cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
1

6CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. principio podemos escribir Coordenadas generales curvil nea, Coordenadas circulares cil ndricas

q1 , q2 , q3 x = x(q1 , q2 , q3 ) y = y (q1 , q2 , q3 ) z = z (q1 , q2 , q3 )

, , z < x = cos < < y = sen < < z = z < ,

(1.1)

especicando x,y ,z en t erminos de los qi y las relaciones inversas, q1 = q1 (x, y, z ) q2 = q2 (x, y, z ) q3 = q3 (x, y, z ) 0 = (x2 + y 2 )1/2 < 0 arctan(y/x) < 2 z = z < . (1.2)

Como una ilustraci on espec ca de los abstractos (q1 , q2 , q3 ) inclu mos las ecuaciones de transformaci on para las coordenadas circulares cil ndricas. Para cada familia de supercies qi =constante, podemos asociar un vector unitario e i normal a la supercie qi =constante y en la direcci on de crecimiento de qi . Entonces un vector V puede ser escrito V =e 1 V1 + e 2 V2 + e 3 V3 . (1.3)

Los e i est an normalizados por e 2 i = 1 y forman un sistema de coordenadas diestro con volumen e 1 ( e2 e 3 ) > 0. Diferenciando a x en (1.1) conduce a dx = x x x dq1 + dq2 + dq3 , q1 q2 q3 (1.4)

de la misma manera diferenciando y y z . A partir del teorema de Pit agoras en coordenadas cartesianas, el cuadrado de la distancia entre dos puntos vecinos es ds2 = dx2 + dy 2 + dz 2 . (1.5)

El cuadrado del elemento de distancia en nuestras coordenadas curvil neas puede ser escrito
2 2 ds2 =g11 dq1 + g12 dq1 dq2 + g13 dq1 dq3 + g21 dq2 dq1 + g22 dq2 2 g23 dq2 dq3 + g31 dq3 dq1 + g32 dq3 dq2 + g33 dq3 = ij

gij dqi dqj ,

(1.6)

donde2 gij =
2

x x y y z z + + . qi qj qi qj qi qj

(1.7)

Los dqi son arbitrarios. Por ejemplo, haciendo dq2 = dq3 = 0 aislamos g11 .

1.1. COORDENADAS ORTOGONALES.

Estos coecientes gij pueden verse como especicando la naturaleza del sistema de coordenadas (q1 , q2 , q3 ). Colectivamente estos coecientes son referidos como la m etrica. Mostraremos m as adelante que forman un tensor sim etrico de segundo rango. En Relatividad General los componentes son determinados por las propiedades de la materia. La Geometr a se mezcla con la F sica. En este punto nos limitamos a sistemas de coordenadas ortogonales (supercies mutuamente perpendiculares) gij = 0 , i=j , (1.8)

ye i e j = ij . Veremos algo de sistemas no ortogonales en la secci on del an alisis tensorial. Para simplicar la notaci on escribimos gii = h2 tal que i ds2 = (h1 dq1 )2 + (h2 dq2 )2 + (h3 dq3 )2 =
i

(hi dqi )2 .

(1.9)

Los espec cos sistemas de coordenadas ortogonales son descritos en las secciones siguientes, especicando estos factores de escala h1 , h2 y h3 . Por otra parte, los factores de escala pueden ser identicados por la relaci on dsi = hi dqi , (1.10)

para alg un dqi dado, manteniendo los otros qi constantes. Notemos que las tres coordenadas curvil neas (q1 , q2 , q3 ) no necesariamente son una longitud. Los factores de escala hi pueden depender de las qi y pueden tener dimensiones. Los productos hi dqi deben tener dimensiones de longitud y ser positivos. El vector de desplazamiento diferencial ds puede ser escrito ds = h1 dq1 e 1 + h2 dq2 e 2 + h3 dq3 e 3 =
i

hi dqi e i .

Usando las componentes curvil neas, encontramos que la integral de l nea llega a ser V ds =
i

Vi hi dqi .

De la ecuaci on (1.10) podemos inmediatamente desarrollar los elementos de area y de volumen dij = dsi dsj = hi hj dqi dqj y d = ds1 ds2 ds3 = h1 h2 h3 dq1 dq2 dq3 . (1.12) (1.11)

Estas expresiones coinciden con los resultados obtenidos al usar las transformaciones expl citamente y el Jacobiano. A partir de la ecuaci on (1.11) un elemento de area puede ser expandido: d = ds2 ds3 e 1 + ds3 ds1 e 2 + ds1 ds2 e 3 = h2 h3 dq2 dq3 e 1 + h3 h1 dq3 dq1 e 2 + h1 h2 dq1 dq2 e 3 .

8CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Una integral de supercie llega a ser V d = V1 h2 h3 dq2 dq3 + V2 h3 h1 dq3 dq1 + V3 h1 h2 dq1 dq2 . (1.13)

Debemos dejar claro que el algebra vectorial es la misma en coordenadas curvil neas ortogonales que en coordenadas cartesianas. Espec camente, el producto punto A B = A1 B1 + A2 B2 + A3 B3 , donde los sub ndices indican componentes curvil neas. Para el producto cruz e 1 e 2 e 3 A B = A 1 A2 A3 B1 B2 B3 (1.15) (1.14)

1.2

Operadores diferenciales vectoriales.

Gradiente. El punto de partida para desarrollar los operadores gradiente, divergencia y el rotor en coordenadas curvil neas es nuestra interpretaci on del gradiente como un vector que tiene la magnitud y direcci on de la m axima raz on de crecimiento. A partir de esta interpretaci on las componentes de (q1 , q2 , q3 ) en la direcci on normal a la familia de supercies q1 =constante es dado por e 1 =
1

= , s1 h1 q1

(1.16)

ya que esta es la raz on de cambio de para variaciones de q1 , manteniendo q2 y q3 jos. La cantidad ds1 es un diferencial de longitud en la direcci on de incremento de q1 . El vector unitario e 1 indica la direcci on. Si repetimos este c alculo para las otras componentes q2 y q3 y sumamos vectorialmente obtenemos la expresi on del gradiente (q1 , q2 , q3 ) = e 1 +e 2 +e 3 s1 s2 s3 =e 1 +e 2 +e 3 h1 q1 h2 q2 h3 q3 1 = e i . hi qi i

(1.17)

Divergencia. El operador divergencia puede obtenerse de una de sus deniciones V (q1 , q2 , q3 ) = lim V d , d (1.18)

d 0

1.2. OPERADORES DIFERENCIALES VECTORIALES.

z ds3= h 3 dq 3
4 1 3 2

ds2= h 2 dq 2 x

ds1= h 1 dq 1 y

Figura 1.1: Elemento de volumen curvil neo.

con un volumen diferencial h1 h2 h3 dq1 dq2 dq3 (gura 1.1). Notemos que la direcci on positiva ha sido escogida tal que (q1 , q2 , q3 ) o ( e1 , e 2 , e 3 ) formen un sistema diestro, e 1 e 2 = e 3 . La integral de area sobre las dos caras q1 = constante es dada por V1 h2 h3 + (V1 h2 h3 )dq1 dq2 dq3 V1 h2 h3 = (V1 h2 h3 )dq1 dq2 dq3 , q1 q1 (1.19)

considerando las otras componentes V (q1 , q2 , q3 ) d = (V1 h2 h3 ) + (V2 h3 h1 ) + (V3 h1 h2 ) dq1 dq2 dq3 . q1 q2 q3 (1.20)

Dividiendo por la diferencial de volumen produce V (q1 , q2 , q3 ) = 1 (V1 h2 h3 ) + (V2 h3 h1 ) + (V3 h1 h2 ) h1 h2 h3 q1 q2 q3 . (1.21)

En la ecuaci on anterior, Vi es la componente de V en la direcci on e i en la que crece qi . Esto es, Vi = e i V es la proyecci on de V sobre la direcci on e i . Podemos obtener el Laplaciano combinando las ecuaciones (1.17) y (1.21), usando V = (q1 , q2 , q3 ). Esto produce (q1 , q2 , q3 ) = 2 = 1 h1 h2 h3 q1 h2 h3 h1 q1 + q2 h3 h1 h2 q2 + q3 h1 h2 h3 q3 . (1.22)

10CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Rotor. Finalmente, para desarrollar V , apliquemos el teorema de Stokes y, como con la divergencia, tomemos el l mite en que el area de la supercie llega a ser despreciablemente peque na. Trabajando sobre una componente a la vez, consideremos un diferencial de area en la supercie curvil nea q1 = constante. A partir de V d = e 1 ( V ) h2 h3 dq2 dq3 ,
S

(1.23)

el teorema de Stokes produce e 1 ( V ) h2 h3 dq2 dq3 = V ds , (1.24)

con la integral de l nea sobre la supercie q1 =constante. Siguiendo el loop (1, 2, 3, 4) en la gura 1.2, V (q1 , q2 , q3 ) ds = V2 h2 dq2 + V3 h3 + V2 h2 + (V3 h3 )dq2 dq3 q2 (1.25)

(V2 h2 )dq3 dq2 V3 h3 dq3 q3 = (V3 h3 ) (V2 h2 ) dq2 dq3 . q2 q3

Tomamos el signo positivo cuando vamos en la direcci on positiva sobre las partes 1 y 2 y negativa sobre las partes 3 y 4 porque aqu vamos en la direcci on negativa. Los t erminos m as altos en las expansiones de Taylor son omitidos. Ellos desaparecer an en el l mite en que la supercie llega a ser despreciablemente peque na (dq2 0, dq3 0).

z 4 (q 2 ,q 3 ) ^2 e 1

3 2 ds3= h 3 dq 3 ^3 e y

ds2= h 2 dq 2 x

Figura 1.2: Elemento de area curvil neo con q1 =constante.

1.3. SISTEMAS ESPECIALES DE COORDENADAS: INTRODUCCION Desde la ecuaci on (1.24) V = 1 (V3 h3 ) (V2 h2 ) h2 h3 q2 q3 .

11

(1.26)

Las dos componentes restantes pueden ser evaluadas tomando una permutaci on c clica de los ndices. Finalmente, podemos escribir el rotor en forma de determinante e 1 h1 e 2 h2 e 3 h3 V = 1 h1 h2 h3 q1 q2 q3 . (1.27)

h1 V1 h2 V2 h3 V3 Notemos que esta ecuaci on no es id entica a la forma del producto cruz de dos vectores, ya que no es un vector ordinario, es un vector operador.

1.3

Sistemas especiales de coordenadas: introducci on

Hay once sistemas de coordenadas en los cuales la ecuaci on tridimensional de Helmholtz puede separarse en tres ecuaciones diferenciales ordinarias3 . Algunos de estos sistemas adquirieron importancia en el desarrollo hist orico de la Mec anica Cu antica. Otros como el bipolar satisfacen necesidades espec cas. Debido al desarrollo de computadores de alta velocidad y a la eciencia de las t ecnicas de programaci on se ha reducido la necesidad de utilizar estos sistemas. Nos limitaremos a coordenadas cartesianas, coordenadas polares esf ericas, y coordenadas circulares cil ndricas. Coordenadas cartesianas rectangulares. Este es el sistema m as simple de todos: h1 = hx = 1 , h2 = hy = 1 , h3 = hz = 1 .

(1.28)

Las familias de supercies coordenadas son tres conjuntos de planos paralelos: x =constante, y =constante, y z =constante. Las coordenadas cartesianas es el u nico sistema en que todos los hi son constantes. Notemos tambi en que los vectores unitarios, e 1 , e 2 , e 3 o x , y , z tienen direcciones jas. Los operadores vectoriales corresponden a = x
3

+y +z , x y z

(1.29)

Ver por ejemplo, Morse and Feshbach.

12CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. V = Vx Vy Vz + + , x y z 2 2 2 + 2 + 2 , x2 y z x V = x Vx y y Vy z . z Vz (1.32) (1.30)

= 2 =

(1.31)

1.4

Coordenadas circulares cil ndricas (, , z ).

En el sistema de coordenadas circulares cil ndricas las tres coordenadas curvil neas (q1 , q2 , q3 ) son reetiquetadas por (, , z ). Las supercies coordenadas mostradas en la gura 1.3 son:

Figura 1.3: Coordenadas circulares cil ndricas.

1. Cilindros circulares derechos que tienen el eje-z como eje com un, = x2 + y 2 2. Semiplanos a trav es del eje-z , = tan1 y = constante. x
1/2

= constante.

1.4. COORDENADAS CIRCULARES CIL INDRICAS (, , Z ). 3. Planos paralelos al plano xy como en el sistema cartesiano z = constante. Los l mites para , y z son 0<, 0 2 , y <z < .

13

Notemos que estamos usando como la distancia perpendicular al eje z . Las relaciones de transformaci on inversas x = cos , y = sen , z=z , de acuerdo a las ecuaciones anteriores los factores de escala son h1 = h = 1 , h2 = h = , h3 = hz = 1 .

(1.33)

(1.34)

Los vectores unitarios e 1 , e 2 , e 3 son reetiquetados ( , , z ), gura 1.4. El vector unitario es normal a la supercie cil ndrica apuntando en la direcci on de crecimiento del radio . El vector unitario es tangencial a la supercie cil ndrica, perpendicular al semiplano = constante y apuntando en la direcci on de crecimiento del angulo . El tercer vector unitario, z , es el vector unitario cartesiano usual.

z z

Figura 1.4: Vectores unitarios en coordenadas circulares cil ndricas.

Un vector diferencial de desplazamiento ds puede ser escrito ds = ds + ds +z dz = d + d +z dz . (1.35)

14CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Los operadores diferenciales que involucran (, , z ) = 1 + +z , z (1.36)

V =

1 1 V Vz (V ) + + , z 1 2 2 + 2 , 2 2 z V z . z Vz

(1.37)

2 =

(1.38)

V =

1 V

(1.39)

1.5

Coordenadas polares esf ericas (r, , ).

Reetiquetando (q1 , q2 , q3 ) como (r, , ), vemos que el sistema de coordenadas polares esf ericas consiste en lo siguiente: 1. Esferas conc entricas centradas en el origen, r = x2 + y 2 + z 2
1/2

= constante.

2. Conos circulares centrados sobre el eje z y vertice en el origen = arccos z (x2 + y2 + z 2 )1/2 = constante.

3. Semiplanos a trav es del eje-z , = tan1 y = constante. x

Por nuestra elecci on arbitraria de la denici on de , el angulo polar, y , el angulo azimutal, el eje z queda particularizado para un tratamiento especial. las ecuaciones de transformaci on son x = r sen cos , y = r sen sen , z = r cos , (1.40)

1.5. COORDENADAS POLARES ESFERICAS (R, , ).

15

midiendo desde el eje z positivo y en el plano xy desde el eje x positivo. Los intervalos de valores son 0 r < , 0 , y 0 2 . A partir de la ecuaci on (1.7) h1 = hr = 1 , h2 = h = r, h3 = h = r sen . El elemento de arco ds = r dr + rd + r sen d . En este sistema de coordenadas esf ericas el elemento de area (para r = constante) es dA = d = r2 sen dd , (1.42)

(1.41)

el area sombreada en la gura 1.5. Integrando sobre el azimutal , encontramos que el elemento de area llega a ser un anillo de ancho d,

d d x

Figura 1.5: Elementos de area en coordenadas polares esf ericas.

dA = 2r2 sen d .

(1.43)

Esta forma aparece con frecuencia en problemas en coordenadas polares con simetr a azimutal. Por denici on el stereoradian, un elemento de angulo s olido d es dado por d = dA = sen dd . r2 (1.44)

Integrando sobre la supercie esf erica completa, obtenemos d = 4 .

16CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES.


z r y

(x,y,z)

r r

Figura 1.6: Coordenadas polares esf ericas.

A partir de la ecuaci on (1.12) el elemento de volumen es d = r2 dr sen dd = r2 drd . (1.45)

Los vectores unitarios en coordenadas polares esf ericas son mostrados en la gura 1.6 Debemos enfatizar que los vectores unitarios r , y var an en direcci on cuando los angulos y var an. Cuando diferenciamos vectores en coordenadas polares esf ericas (o en cualquier otro sistema no cartesiano) estas variaciones de los vectores unitarios con respecto a la posici on no deben ser despreciadas. Escribamos los vectores unitarios r , y en t ermino de los vectores unitarios cartesiano de direcci on ja x , y , z r = x sen cos + y sen sen + z cos , = x cos cos + y cos sen z sen , = x sen + y cos .

(1.46)

Notemos que un vector dado puede ser expresado en un n umero de diferentes (pero equivalentes) maneras. Por ejemplo, el vector posici on r puede ser escrtito r = = = = r r 1/2 r x2 + y 2 + z 2 x x + y y + z z x r sen cos + y r sen sen + z r cos .

(1.47)

Podemos seleccionar la forma que nos es m as u til para nuestro problema particular. A partir de la secci on 1.2 reetiquetando los vectores unitarios en coordenadas curvil neas e 1 , e 2 , e 3 como r , , y tenemos (, , z ) = r 1 1 + + , r r r sen (1.48)

1.6. ANALISIS TENSORIAL. V = 1 V sen (r2 Vr ) + r (sen V ) + r sen r r r ,

17 (1.49)

r2

2 =

1 sen 2 r sen r

r2

sen

1 2 sen 2

(1.50)

r V = r2 1 sen r Vr

r sen . (1.51)

rV r sen V

1.6

An alisis tensorial.

Introducci on, deniciones. Los tensores son importantes en muchas areas de la F sica, incluyendo relatividad y electrodin amica. Escalares y vectores son casos especiales de tensores. Como ya vimos, una cantidad que no cambia bajo rotaciones del sistema de coordenadas en un espacio tridimensional, un invariante, fue etiquetado como un escalar. Un escalar es especicado por un n umero real y es un tensor de rango cero. Una cantidad cuyas componentes transforman bajo rotaciones como las de la distancia de un punto a un origen elegido fue llamado un vector. La transformaci on de las componentes del vector bajo una rotaci on de las coordenadas preserva el vector como una entidad geom etrica (tal como una echa en el espacio), independiente de la orientaci on del sistema de referencia. En un espacio tridimensional, un vector es especicado por 3 = 31 n umeros reales, por ejemplo, sus componentes, y es un un tensor de rango uno. En un espacio N dimensional un tensor de rango n tiene N n componentes los cuales transforman de una manera denida. Hay una posible ambig uedad en la ley de transformaci on de un vector Ai =
j

aij Aj ,

(1.52)

en la cual aij es el coseno del angulo entre el eje xi y el eje xj . Si partimos con un vector diferencial de distancia dr, entonces, tomando dxi como una funci on de las variables sin primas, dxi =
j

xi dxj , xj

(1.53)

tomando la diferencial. Si jamos aij = xi , xj (1.54)

18CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. las ecuaciones (1.52) y (1.53) son consistentes. Cualquier conjunto de cantidades Aj que transforman de acuerdo a xi Ai = Aj , (1.55) x j j es denido como un vector contravariante. Sin embargo, hemos ya encontrado un tipo de transformacion vectorial un poco diferente. El gradiente de un escalar ,, denido por = x +y +z , x1 x2 x3 xj , xj xi (1.56)

usando (x1 , x2 , x3 ) para (x, y, z ), transforma como = xi (1.57)

usando = (x, y, z ) = (x , y , z ) = , denida como una cantidad escalar. Notemos que esta diere de la ecuaci on (1.55) en que tenemos xj /xi en vez de xi /xj . Tomemos la ecuaci on (1.57) como la denici on de un vector covariante y al gradiente como el prototipo. En coordenadas cartesianas xj xi = = aij , (1.58) xi xj y no hay diferencia entre transformaciones covariantes y contravariantes. En otros sistemas la ecuaci on (1.58) en general no se aplica, y la distinci on entre covariante y contravariante es real y debe ser observado. Esto es de primera importancia en espacios curvos de Riemmann en relatividad general. En lo que resta de esta secci on las componentes de un vector contravariante son denotados i por super ndices, A , mientras un sub ndice es usado para las componentes de un vector covariante Ai .4 Denici on de tensores de rango dos. Ahora procedemos a denir tensores de rango dos contravariantes, mixtos y covariantes por las siguiente ecuaciones para sus componentes bajo transformaci on de coordenadas: A
ij

=
kl

xi xj kl A , xk xl xi xl k B , xk xj l xk xl Ckl . xi xj (1.59)

Bj=
kl

Cij =
kl
4

Esto signica que las coordenadas (x, y, z ) deben ser escritas (x1 , x2 , x3 ) ya que r trasforma como un vector contravariante. Ya que nos restringiremos r apidamente a tensores cartesianos (donde la distinci on entre contravariante y convariante desaparece) continuaremos usando sub ndices para las coordenadas. Esto evita la ambig uedad de x2 representa el cuadrado de x o y .

1.6. ANALISIS TENSORIAL.

19

Claramente, el rango va como el n umero de derivadas parciales ( o cosenos directores) en la denici on: cero para un escalar, una para un vector y dos para un tensor de segundo rango, y as sucesivamente. Cada ndice (sub ndice o super ndice) corre sobre el n umero de dimensiones del espacio. El n umero de ndices (rango del tensor) es independiente de las dimensiones del espacio. Vemos que Akl es contravariante con respecto a ambos ndices, Ckl es covariante respecto a ambos ndices, y Blk transforma contravariantemente con respecto al primero de los ndices (k ) y covariantemente con respecto al segundo ndice (l). Si usamos coordenadas cartesianas, las tres formas de tensores de segundo rango, contravariante, mixto y covariante son la misma. Como con las componentes de un vector, las leyes de transformaci on para las componentes de un tensor, ecuaci on (1.59), produce entidades (y propiedades) que son independientes de la elecci on de un sistema de referencia. Esto es lo que hace el an alisis tensorial importante en F sica. La independencia del sistema de referencia (invariancia) es ideal para expresar armaciones en F sica. El tensor de segundo rango A (de componentes Akl ) puede ser convenientemente escrito por sus componentes en un arreglo cuadrado (de 3 3 si estamos en un espacion tridimensional), 11 A A12 A13 (1.60) A = A21 A22 A23 . A31 A32 A33 Esto no signica que cualquier arreglo de n umeros o funciones formen un tensor. La condici on esencial es que las componentes transformen de acuerdo a la ecuaci on (1.59). Suma y resta de tensores. La suma y resta de tensores est a denida en t erminos de los elementos individuales de la misma manera que para vectores. Para sumar o restar dos tensores, debemos sumar o restar sus correspondientes elementos. Si A+B=C , entonces Aij + B ij = C ij . Naturalmente, A y B deben ser tensores del mismo rango y ambos expresados en un espacio del mismo n umero de dimensiones. Convenci on de suma. En an alisis tensorial es costumbre adoptar una convenci on de suma para poner la ecuaci on (1.59) y las subsecuentes ecuaciones tensoriales en forma m as compacta. Siempre y cuando distingamos entre covariante y contravariante, acordemos que cuando un ndice aparezca a un lado de una ecuaci on, una vez como super ndice y una vez como sub ndice (excepta para las (1.61)

20CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. coordenadas donde ambos son sub ndices), autom aticamente sumaremos sobre aquel ndice. Entonces podemos escribir la segunda expresi on en la ecuaci on (1.59) como Bj=
i

xi xl k B , xk xj l

(1.62)

con las sumas sobre k e i impl citas en el lado derecho. Esta es la convenci on de suma. Para ilustrar el uso de la convenci on de suma y algunas t ecnicas del an alisis tensorial, mostremos que la familiar delta de Kronecker, kl , es realmente un tensor mixto de rango dos, lk .5 la pregunta es: La lk transformar a de acuerdo a la ecuaci on (1.59)? Este es nuestro criterio para llamarlo un tensor. Usando la convenci on de suma tenemos lk xi xl xi xk = , xk xj xk xj (1.63)

por denici on de la delta de Kronecker. Ahora xi xk xi = , xk xj xj (1.64)

a partir de la regla de la cadena. Sin embargo, xi y xj son coordenadas independientes, y por tanto la variaci on de una respecto a la otra debe ser cero si ellas son diferentes y uno si ellas coinciden, esto es xi i =j . xj Por tanto j =
i

(1.65)

xi xl k , xk xj l

mostrando que lk son realmente las componentes de un tensor mixto de rango dos. Notemos que el resultado es independiente del n umero de dimensiones de nuestro espacio. La delta de Kronecker posee adem as una interesante propiedad. Tiene las mismos componentes en todos los sistemas de coordenadas rotados y por lo tanto es llamada isotr opica. Tensores de primer rango (vectores) no isotr opicos existen. Simetr aAntisimetr a. El orden en el cual los ndices aparecen en nuestra descripci on de un tensor es importante. En general, Amn es independiente de Anm , pero hay algunos casos de inter es especial. Si, para todo m y n, Amn = Anm ,
5

(1.66)

Es pr actica com un referirse a un tensor A especicando una componente t pica Aij .

Y PRODUCTO DIRECTO. 1.7. CONTRACCION lo llamaremos un tensor sim etrico. Si, por otra parte, Amn = Anm ,

21

(1.67)

el tensor lo llamaremos antisim etrico. Claramente, cada tensor (de segundo rango) puede ser resuelto en una parte sim etrica y otra antisim etrica por la identidad 1 mn 1 (A + Anm ) + (Amn Anm ) , (1.68) 2 2 el primer t ermino de la derecha es un tensor sim etrico y el segundo un tensor antisim etrico. Una similar resoluci on de las funciones en una parte sim etrica y otra antisim etrica es de extrema importancia en mec anica cu antica. Amn = Spinores. Podriamos pensar que un sistema de escalares, vectores, tensores ( de rango dos) y superiores forman un sistema matem atico completo, uno que es adecuado para describir una F sica independiente de nuestra elecci on de sistema de coordenadas. Pero el universo y la f sica matem atica no es as de simple. En el reino de las part culas elementales, por ejemplo, part culas de spin cero (mesones , part culas ) pueden ser descritos con escalares, part culas de spin 1 (deuterones) por vectores, y part culas de spin 2 (gravitones) por tensores. Esta lista omite a las part culas m as comunes: electrones, protones y neutrones, todas ellas con 1 spin 2 . Estas part culas son propiamente descritas por spinores. Un spinor no es un escalar, vector o tensor.

1.7

Contracci on y producto directo.

Contracci on. Cuando tratamos con vectores, formamos un producto escalar sumando el producto de las componentes correspondientes: A B = Ai Bi . (1.69)

La generalizaci on de esta expresi on en el an alisis tensorial es un proceso conocido como contracci on. Dos indices, uno covariante y el otro contravariante, se igualan uno con otro y luego sumamos sobre ese ndice repetido. Por ejemplo, veamos la contracci on del tensor i mixto de segundo orden Bj . BjBi=
i i

xi xl k xl k Bl = B , xk xi xk l

(1.70)

por la ecuaci on (1.64) y luego por la ecuaci on (1.65)


l k k B i = k Bl = Bk . i

(1.71)

Nuestro tensor contra do es invariante y por lo tanto un escalar. Esto es exactamente lo que obtuvimos anteriormente para el producto punto de dos vectores y para la divergencia de un vector. En general, la operaci on de contracci on reduce el orden de un tensor en 2.

22CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Producto Directo. Las componentes de un vector covariante (tensor de rango uno) ai y aquellos de un vector contravariante (tensor de rango uno) bj puede ser multiplicado componente a componente para dar el t ermino general ai bj . Esto, por la ecuaci on (1.59) es realmente un tensor de segundo orden, por a ib = Contrayendo, obtenemos ai b = ak b k ,
i j

xk xj l xk xj ak b = (ak bl ) . xi xl xi xl

(1.72)

(1.73)

como en las ecuaciones (1.70) y (1.71) para dar el producto escalar regular. La operaci on de asociar dos vectores ai y bj como en el u ltimo p arrafo es conocido como el producto directo. Para el caso de dos vectores, el producto directo es un tensor de segundo rango. En ese sentido podemos atribuir signicado a E , el cual no estaba denido dentro del esquema del an alisis vectorial. En general, el producto directo de dos tensores es un tensor de rango igual a la suma de los dos rangos iniciales; esto es,
kl ikl Ai j B = Cj , ikl donde Cj es un tensor de cuarto rango. A partir de la ecuaci on (1.59)

(1.74)

ikl j

xi xn xk xl mnq C . xm xj xp xq n

(1.75)

El producto directo aparece en f sica matem atica como una t ecnica para crear nuevos tensores de mayor rango. Cuando T es un tensor cartesiano de n- esimo rango, /xi Tjkl . . . , un elemento de T, es un tensor cartesiano de rango n + 1. Sin embargo, /xi Tjkl . . . no es un tensor bajo transformaciones m as generales. En sistemas no cartesianos /xi actuar a sobre las derivadas parciales xp xq y destruir a la relaci on simple de transformaci on tensorial. Hasta aqu la distinci on entre una transformaci on covariante y una contravariante ha sido mantenida ya que existe en espacio no cartesiano y porque es de gran importancia en relatividad general. Ahora, sin embargo, nos restringimos al tensor cartesiano. Como se hizo notar, en el caso cartesiano, la distinci on entre contravariancia y covariancia desaparece y todos los ndices est an a partir de ahora en adelante mostrado como sub ndice. Convenci on de la suma. Cuando un sub ndice (letra, no n umero) aparece dos veces sobre un lado de una ecuaci on, implica que se suma con respecto a este sub ndice. Contracci on. La contracci on consiste en jar dos ndices distintos (sub ndices) igualar uno a otro y luego sumarlos seg un la convenci on de suma.

1.8. REGLA DEL CUOCIENTE.

23

1.8

Regla del cuociente.

Si Ai y Bj son vectores, podemos f acilmente mostrar que Ai Bj es un tensor de segundo rango. Aqu , estamos interesados en una variedad de relaciones inversas. Consideremos tales ecuaciones como K i Ai Kij Aj Kij Ajk Kijkl Aij Kij Ak =B , = Bi , = Bik , = Bkl , = Bijk . (1.76a) (1.76b) (1.76c) (1.76d) (1.76e)

En cada una de esas expresiones A y B son tensores conocidos cuyo rango est a indicado por el n umero de ndices y el tensor A es arbitrario. En cada caso K es una cantidad desconocida. Deseamos establecer las propiedades de transformaci on de K . La regla del cuociente arma que si la ecuaci on de inter es se mantiene en todos los sistemas (rotados) de coordenadas cartesianas, K es un tensor del rango indicado. La importancia en f sica te orica es que la regla del cuociente puede establecer la naturaleza tensorial de las cantidades. La regla del cuociente (ecuaci on 1.76b) muestra que la matriz de inercia que aparece en la ecuaci on de momento angular L = I , es un tensor. Para probar la regla del cuociente, consideremos la ecuaci on (1.76b) como un caso t pico. En nuestro sistema de coordenadas prima K ij A j = B i = aik Bk , (1.77)

usando las propiedades de transformaci on vectorial de B . Ya que la ecuaci on se mantiene en todos los sistemas de coordenadas rotados, aik Bk = aik (Kkl Al ) . (1.78)

Ahora, transformando A regresamos al sistema de coordenadas prima (compare la ecuaci on (1.55)), tenemos K ij A j = aik Kkl ajl A j . Reordenando, tenemos (K
ij

(1.79)

aik ajl Kkl )A j = 0 .

(1.80)

Esto debe mantenerse para cada valor del ndice i y para cada sistema de coordenadas prima. Ya que Aj es arbitrario, concluimos K
ij

= aik ajl Kkl ,

(1.81)

la cual es nuestra denici on de un tensor de segundo rango. Las otras ecuaciones pueden ser tratadas en forma similar, dando origen a otras formas de la regla del cuociente. Un peligro menor deber a ser tomado en cuenta, la regla del cuociente no se aplica necesariamente si B es igual a cero. Las propiedades de transformaci on de cero son indeterminadas.

24CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES.

1.9

Pseudotensores y tensores duales.

Hasta aqu nuestras transformaciones de coordenadas han sido restringidas a rotaciones puras. Ahora consideramos el efecto de reexiones o inversiones. Si tenemos coecientes de transformaciones aij = ij , entonces por la ecuaci on (1.53) xi = xi , (1.82)

la cual es una inversi on o transformaci on de paridad. Notemos que esta transformaci on cambia nuestro sistema de coordenadas inicialmente diestro a un sistema de coordenadas siniestro.6 Nuestro vector prototipo r con componentes (x1 , x2 , x3 ) se transforma al vector r = (x1 , x2 , x3 ) = (x1 , x2 , x3 ). Este nuevo vector r tiene componentes negativas, relativas al nuevo conjunto de ejes transformados. Como se muestra en la gura 1.7, invirtiendo las direcciones de los ejes de coordenadas y cambiando los signos de las componentes da r = r. El vector (una echa en el espacio) permanece exactamente como estaba antes de que la transformaci on se llevara a cabo. El vector posici on r y todos los otros vectores cuyas componentes se comporten de esta manera (cambiando el signo con una inversi on de los ejes de coordenadas) son llamados vectores polares y tienen paridad impar.
x2 x3 r x1 x1 r

x3 x2

Figura 1.7: Inversi on de coordenadas cartesianas, vector polar.

Una diferencia fundamental aparece cuando encontramos un vector denido como el producto cruz de dos vectores polares. Sea C = A B , donde tanto A como B son vectores polares. Las componentes de C est an dadas por C1 = A2 B3 A3 B2 . (1.83)

y as sucesivamente. Ahora cuando los ejes de coordenadas son invertidos, Ai Ai , Bj Bj pero de su denici on Ck +Ck ; esto es, nuestro vector producto cruz, vector C , no se comporta como un vector polar bajo inversi on. Para distinguir, lo etiquetamos como pseudo vector o vector axial (ver gura 1.8) que tiene paridad par.
6

Esta es una inversi on del sistema de coordenadas, los objetos en el mundo f sico permanecen jos.

1.9. PSEUDOTENSORES Y TENSORES DUALES.


y C z

25

z C y

Figura 1.8: Inversi on de coordenadas cartesianas, vector axial.

Ejemplos son: velocidad angular, momento angular, torque, campo magn etico, v =r , L=rp , =rF , B = c E . t

En v = r, el vector axial es la velocidad angular , y r y v = dr/dt son vectores polares. Claramente, los vectores axiales ocurren frecuentemente en F sica elemental, aunque este hecho usualmente no es recalcado. En un sistema de coordenadas de mano derecha un vector axial C tiene un sentido de rotaci on asociado con el lado por la regla de la mano derecha. En el sistema invertido de mano izquierda el sentido de la rotaci on es una rotaci on de la mano izquierda. Esto es indicado por las echas curvadas en la gura 1.8. La distinci on entre vectores polares y axiales tambi en pueden ser ilustradas por una reexi on. Un vector polar se reeja en un espejo como un echa f sica real, gura1.9a. En la guras 1.7 y 1.8 las coordenadas est an invertidas; el mundo f sico permanece jo. Aqui los ejes de coordenadas permanecen jos; el mundo es reejado como en un espejo en el plano xz . Espec camente, en esa representaci on mantenemos los ejes jos y asociamos un cambio de signo con la componenete del vector. Para un espejo en el plano xz , Py Py . Tenemos P = (Px , Py , Pz ) , P = (Px , Py , Pz ) ,

vector polar.

Un vector axial tal como un campo magn etico B o el momento magn etico (= corriente area de loop ) se comporta muy diferentemente bajo reexi on. Consideremos el campo magn etico B y el momento magn etico como producidos de una carga el ectrica moviendose circularmente. La reexi on revierte el sentido de la rotaci on de la

26CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES.

(a) y P P I x

(b) y I x

Figura 1.9: (a) Espejo en el plano xz ; (b) Espejo en el plano xz .

carga. Los dos loops de corriente y el resultante de los momentos magn eticos son mostrados en la gura 1.9b. Tenemos = (x , y , z ) , = (x , y , z ) vector axial. Si concordamos que el universo no se preocupa si usamos sistemas de coordenadas ya sea mano derecha o mano izquierda, luego no tiene sentido sumar un vector axial a un vector polar. En la ecuaci on vectorial A = B , ambos A y B son tanto vectores polares como vectores axiales7 . Restricciones similares se aplican a los escalares y pseudoescalares y, en general, a los tensores y pseudotensores. Usualmente, los pseudoescalares, pseudovectores, y pseudotensores transforman como S = |a|S Ci = | a | aij Cj , Aij = | a | aik ajl Akl ,

(1.84)

donde | a | es el determinante de un arreglo de coecientes amn . En nuestra inversi on el determinante es 1 0 0 | a | = 0 1 0 = 1 0 0 1 Para la reexi on de un eje, el eje x, 1 0 0 | a | = 0 1 0 = 1 0 0 1
7

(1.85)

(1.86)

La gran excepci on a esto esta en el decaimiento beta, interaciones d ebiles. Aqu el universo distingue entre sistemas derechos y sistemas izquierdos.

1.9. PSEUDOTENSORES Y TENSORES DUALES.

27

y nuevamente el determinante es | a | = 1. Por otra parte, para todas las rotaciones puras el determinante | a | es siempre +1. A menudo las cantidades que transforman de acuerdo a la ecuaci on (1.84) son conocidas como densidad tensorial. Ellos son tensores regulares en cuanto a rotaciones se reere, diferenci andose de los tensores solamente en reexiones o inversiones de las coordenadas, y luego la u nica diferencia es la aparici on de un signo menos adicional del determinante | a |. Anteriormente mostramos que el producto escalar triple S = A B C es un escalar (bajo rotaciones). Ahora considerando la transformaci on de paridad dada por la ecuaci on (1.82), vemos que S S , probando que el producto escalar triple es un pseudoescalar. Este comportamiento fue presagiado por la analog a geom etrica de un volumen. Si los tres par ametros del volumen, longitud, ancho, profundidad, cambian de distancias positivas a distancias negativas, el producto de los tres ser a negativo. S mbolo de Levi-Civita. Para usos futuros es conveniente introducir el s mbolo tridimensional de Levi-Civita ijk denido por 123 = 231 = 312 = 1 , 132 = 213 = 321 = 1 , todos los otros ijk = 0 .

(1.87)

Note que ijk es totalmente antisim etrico con respecto a todo par de ndices. Suponga que tenemos un pseudovector de tercer grado ijk , el cual en un sistema de coordenadas particular es igual a ijk . Luego ijk = | a | aip ajq akr pqr , por denici on de pseudotensor. Ahora a1p a2q a3r pqr = | a | , (1.89) (1.88)

por directa expansi on del determinante, mostrando que 123 = | a |2 = 1 = 123 . Considerando las otras posibilidades una a una, encontramos ijk = ijk , (1.90)

para rotaciones y reexiones. Luego ijk es un pseudotensor. Adem as, se ve como un pseudotensor isotr opico con las mismas componentes en todos los sistemas de coordenadas cartesianos rotados. Tensores duales. A cualquier tensor antisim etrico de segundo rango Cjk (en el espacio tridimensional) podemos asociarle un pseudo vector dual Ci denido por 1 Ci = ijk Cjk . 2 (1.91)

28CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Aqu el antisim etrico Cjk puede ser escrito 0 C12 C31 0 C23 . Cjk = C12 C31 C23 0

(1.92)

Sabemos que Ci debe transformar como un vector bajo rotaciones a partir de la doble contracci on del (pseudo) tensor de quinto rango ijk Cmn pero este es realmente un pseudovector desde la naturaleza pseudo de ijk . Espec camente, los componentes de C est an dados por (C1 , C2 , C3 ) = (C23 , C31 , C12 ) . (1.93)

Note que el orden c clico de los ndices que vienen del orden c clico de los componentes de ijk . Esta dualidad, dada por la ecuaci on (1.93), signica que nuestro producto vectorial tridimensional puede, literalmente, ser tomado ya sea como un pseudovector o como un tensor antisim etrico de segundo rango, dependiendo de como escojamos escribirlo. Si tomamos tres vectores (polares) A, B , y C , podemos denir Vijk Ai Bi Ci = Aj Bj Cj = Ai Bj Ck Ai Bk Cj + . . . . Ak Bk Ck (1.94)

Por una extensi on del an alisis de la secci on 1.6 cada t ermino Ap Bq Cr es visto como un tensor de tercer rango, haciendo Vijk un tensor de rango tres. A partir de su denici on como un determinante Vijk es totalmente antisim etrico, cambiando signo bajo el intercambio de cualquier par de ndices, esto es, el intercambio de cualquier par de las del determinante. La cantidad dual es 1 V = ijk Vijk , (1.95) 3! claramente un pseudo escalar. Por expansi on se ve que A1 B1 C1 V = A2 B2 C2 , A3 B3 C3 (1.96)

nuestro conocido producto escalar triple. Para poder escribir las ecuaciones Maxwell en forma covariante, necesitamos extender este an alisis vectorial dual a un espacio de cuatro dimensiones y, en particular, indicar que el elemento de volumen cuadridimensional, dx1 , dx2 , dx3 , dx4 , es un pseudoescalar. Introducimos el s mbolo Levi-Civita ijkl , el an alogo cuadridimensional de ijk . Esta cantidad ijkl es denida totalmente antisim etrica respecto a sus cuatro ndices. Si (ijkl) es una permutaci on par de (1,2,3,4), luego ijkl es denido como +1; si es una permutaci on impar, luego ijkl es -1. El ijkl de Levi-Civita puede probarse que es un pseudotensor de rango cuatro por an alisis similar al usado para establecer la naturaleza de ijk . Introduciendo un tensor de rango cuatro, Ai A = j Ak Al Bi Bj Bk Bl Ci Cj Ck Cl Di Dj , Dk Dl

Hijkl

(1.97)

1.9. PSEUDOTENSORES Y TENSORES DUALES.

29

construyendo a partir de los vectores polares A, B , C y D podemos denir la cantidad dual H= 1 ijkl Hijkl . 4! (1.98)

Realmente tenemos una cu adruple contracci on la cual reduce el orden a cero. A partir de la naturaleza pseudo de ijkl , H es un pseudo escalar. Ahora tomemos A, B , C y D como desplazamientos innitecimales a lo largo de cuatro ejes de coordenadas (espacio de Minkowski), A = (dx1 , 0, 0, 0) , y H = dx1 dx2 dx3 dx4 . (1.100) B = (0, dx2 , 0, 0) , C = (0, 0, dx3 , 0) , D = (0, 0, 0, dx4 ) , (1.99)

El elemento de volumen cuadridimensional est a ahora identicado como un pseudo escalar. Este resultado era de esperarse a partir de los resultados de la teor a especial de relatividad. La contracci on de Lorentz-Fitzgerald de dx1 , dx2 , dx3 justo se compensa con la dilataci on temporal de dx4 . Nos introducimos a este espacio cuadridimensional como una simple extensi on matem atica del espacio tridemensional y, por supuesto, podr amos haber discutido f acilmente espacios de 5, 6 o N dimensiones. Esto es t pico del poder del an alisis de componentes. F sicamente, este espacio tetradimensional puede ser tomado como un espacio de Minkowski, (x1 , x2 , x3 , x4 ) = (x, y, z, ict) , (1.101)

donde t es el tiempo. Esto es la mezcla de espacio y tiempo realizada en la relatividad especial. Las transformaciones que describen las rotaciones en un espacio cuadridimensional son las transformaciones de Lorenzt de la relatividad especial. Tensores irreducibles. Para algunas aplicaciones, particularmente en la teor a cu antica del momento angular, nuestros tensores cartesianos no son particularmente convenientes. En el lenguaje matem atico nuestro tensor general de segundo orden Aij es reducible, lo que signica que puede ser descompuesto en partes de un tensor de menor orden. En efecto, ya hemos hecho esto. De la ecuaci on (1.71) A = Aii , es una cantidad escalar, la traza de Aij . La parte antisim etrica 1 Bij = (Aij Aji ) 2 han sido mostrada como equivalente a un (pseudo) vector, o Bij = Ck , permutaci on c clica de i, j , k . (1.104) (1.103) (1.102)

30CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Sustrayendo el escalar A y el vector Ck de nuestro tensor original, tenemos un tensor de segundo orden irreducible, sim etrico y de traza nula, Sij , en el cual 1 1 Sij = (Aij + Aji ) A ij , 2 3 (1.105)

con cinco componentes independientes. Luego, nalmente, nuestro tensor cartesiano original puede ser escrito 1 Aij = A ij + Ck + Sij . 3 (1.106)

Las tres cantidades A, Ck , y Sij forman el tensor esf erico de orden 0, 1 y 2 respectivamente, M transformando como los armonicos esf ericos YL para L =0, 1 y 2. Un ejemplo espec co de la reducci on anterior est a dada por el tensor cuadrupolo el ectrico sim etrico Qij = (3xi xj r2 ij )(x1 , x2 , x3 ) d3 x .

El t ermino r2 ij representa una resta de la traza escalar (los 3 terminos i = j ). El resultante Qij tiene traza cero.

1.10

Tensores no cartesianos, diferenciaci on covariante.

La distinci on entre transformaciones contravariante y transformaciones covariante fueron establecidas en la secci on 1.6. Luego, por conveniencia, nos restringimos a coordenadas cartesianas (en la cual la distinci on desaparece). Ahora en estas dos secciones volvemos a las coordenadas no cartesianas y resurge la distinci on entre contravariante y covariante. Como en la secci on 1.6, un super ndice ser a usado para denotar la dependencia contravariante y un sub ndice para diferenciar la covariante. El tensor m etrico de la secci on 1.1 ser a usado para relacionar los ndices contravariante y covariante. El enfasis en esta secci on es sobre diferenciaci on, culminando en la construcci on de una derivada covariante. Vimos en la secci on 1.7 que la derivada de un campo vectorial es un tensor de segundo orden en coordenadas cartesianas. La derivada covariante de un campo vectorial es un tensor de segundo orden en sistemas de coordenadas no cartesianas. Tensor m etrico, subida y bajada de ndices. Empecemos con un conjunto de vectores base i tal que un desplazamiento innitesimal dr podr a estar dado por dr = 1 dq 1 + 2 dq 2 + 3 dq 3 . (1.107)

Por conveniencia tomamos 1 , 2 , 3 formando un sistema diestro. Estos tres vectores no son necesariamente ortogonales. Tambi en, se requerir a una limitaci on al espacio tridimensional solamente para la discusi on de los productos cruz y rotores. De lo contrario estos i pueden

COVARIANTE. 1.10. TENSORES NO CARTESIANOS, DIFERENCIACION

31

estar en un espacio de N -dimensiones, incluyendo la cuarta dimensi on espacio-tiempo de la relatividad especial y general. Los vectores base i pueden ser expresados por i = r , q i (1.108)

Note, sin embargo, que los i no tienen necesariamente magnitud uno. Se puede probar que los vectores unitarios son e i = y por lo tanto i = hi e i , (no hay suma). (1.109) 1 r , hi q i (no hay suma),

Los i est an relacionados a los vectores unitarios e i por el factor de escala hi de la secci on 1.2. Los e i no tienen dimensiones, los i tienen dimensiones de hi . En coordenadas polares esf ericas, como un ejemplo espec co, r = e r , = r e , = r sen e . (1.110)

Como en la secci on 1.1, construimos el cuadrado de un desplazamiento diferencial (ds)2 = ds ds = (i dq i )2 = i j dq i dq j . (1.111)

Comparando esto con (ds)2 de la secci on 1.1, ecuaci on (1.6), denimos i j como el tensor m etrico covariante i j = gij . (1.112)

Claramente gij es sim etrico. La naturaleza del tensor gij se deduce a partir de la regla del cuociente. Tomemos la relaci on
i g ik gkj = j ,

(1.113)

para denir el correspondiente tensor contravariante g ik . El contravariante g ik entra como el inverso8 del covariante gkj . Usemos este contravariante g ik para subir ndices, convirtiendo un ndice covariante en uno contravariante, como se muestra m as adelante. As mismo el covariante gkj ser a usado para bajar ndices. La elecci on de g ik y gkj para esta operaci on de subir y bajar es arbitraria. Cualquier tensor de segundo orden (y su inverso) podr a hacerlo. Espec camente, tenemos g ij j = i , relaci on de covariante y contravariante de vectores bases g ij Fj = F i , relaci on de covariante y contravariante de componentes vectoriales.
8

(1.114)

Si el tensor gij es escrito como una matriz, el tensor g ij est a dado por la matriz inversa.

32CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Entonces gij j = i , son las correspondientes relaciones gij F j = Fi , de bajada de ndices. (1.115)

Como un ejemplo de esas transformaciones comenzaremos con la forma contravariante del vector F = F i i . De las ecuaciones (1.114) y (1.115) F = Fj g ji gik k = Fj j , (1.117) (1.116)

la igualdad nal viene de la ecuaciones (1.113). La ecuaci on (1.116) da la representaci on contravariante de F . La ecuaci on (1.117) da la correspondiente representaci on covariante del mismo F . Deber amos enfatizar de nuevo que i y j no tienen unidades. Esto puede verse en la ecuaciones (1.110) y en el tensor m etrico gij para coordenadas polares esf ericas y su inverso ij g : 1 0 0 1 0 0 1 2 0 0 (gij ) = 0 r (g ij ) = 0 r2 . 2 2 1 0 0 r sen 0 0 r2 sen2 Derivadas y s mbolos de Christoel. Formemos la diferencial de un escalar d = i dq . q i (1.118)

Ya que la dq i son las componentes de un vector contravariante, las derivadas parciales, /q i debieran ser un vector covariante, por la regla del cuociente. El gradiente de un escalar llega a ser = i . q i (1.119)

Deberiamos notar que /q i no son las componentes del gradiente de la secci on 1.2 ya que i =e i de la secci on 1.2. Continuando con las derivadas de un vector, encontramos que la situaci on es mucho m as complicada por que los vectores bases i en general no son constantes. Recordemos que no estamos m as restingidos a las coordenadas cartesianas con sus conveniente x , y , z . La diferenciaci on directa es V V i i = i + V i j . j j q q q (1.120)

COVARIANTE. 1.10. TENSORES NO CARTESIANOS, DIFERENCIACION

33

Ahora i /q j ser a alguna combinaci on lineal de k con coecientes que dependen de los ndices i y j de las derivadas parciales y el ndice k del vector base. Escribimos i = k ij k . q j
m Multiplicando por m y usando m k = k (pru ebelo). m m ij =

(1.121)

i . q j

(1.122)

El k mbolo de Christoel (del segundo tipo). Tambi en se le conoce como coeciente ij es un s k de conexi on. Estos ij no son tensores de rango tres y el V i /q j de la ecuaci on (1.120) no son tensores de segundo rango. En coordenadas cartesianas, k = 0 para todos los valores ij de los ndices i, j , k . Usando la ecuaci on (1.108), obtenemos i 2r j = = i == k ji k . j j i q q q q Luego estos s mbolos de Christoel son sim etricos en los dos ndices inferiores:
k k ij = ji .

(1.123)

(1.124)

Derivada covariante. Con los s mbolos de Christoel, la ecuaci on (1.120) puede ser reescrita V V i = i + V i k ij k . q j q j Ahora i y k en el u ltimo t ermino son ndices mudos. Intercambiando i y k , tenemos V = q j V i + V k i kj i . j q (1.126) (1.125)

i La cantidad entre par entesis es denominada derivada covariante, V;j . Tenemos i V;j

V i + V k i kj . j q

(1.127)

Los sub ndices convierte en

;j

indican que la diferenciaci on es con respecto a q j . La diferencial dV se V j i dq = [V;j dq j ]i . q j

dV =

(1.128)

Una comparaci on con las ecuaciones (1.107) o (1.116) muestran que la cantidad entre par entesis cuadrados es la i- esima componente de un vector contravariante. Ya que dq j es la j - esima

34CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES.


i componente de un vector contravariante, V;j debe ser la componente ij - esima de un tensor mixto de segundo rango (regla del cuociente). Las derivadas covariantes de las componentes i contravariantes de un vector forma un tensor mixto de segundo rango, V;j . Ya que los s mbolos de Christoel desaparecen en coordenadas cartesianas, la derivada covariante y la derivada parcial ordinaria coinciden

V i i = V;j , j q

(En coordenadas cartesianas).

(1.129)

Se puede demostrar que la derivada covariante de un vector covariante Vi est a dada por V i; j = Vi Vk k ij . q j (1.130)

i Como V;j , el tensor Vi;j es de rango dos. La importancia f sica de la derivada covariante es:

Un reemplazo consistente de las derivadas parciales regulares por derivadas covariantes lleva las leyes de la F sica (por componentes) desde un espacio tiempo plano al espacio tiempo curvo (Riemannian) de la relatividad general. Realmente, esta sustituci on puede ser tomada como una declaraci on matem atica del principio 9 de equivalencia. Los s mbolos de Christoel como derivadas del tensor m etrico. A menudo es conveniente tener una expresi on expl cita para los s mbolos de Christoel en t erminos de derivadas del tensor m etrico. Como un paso inicial, denimos el s mbolo de Christoel del primer tipo [ij, k ] por [ij, k ] gmk m ij . Este [ij, k ] no es un tensor de rango tres. De la ecuaci on (1.122) [ij, k ] = gmk m i , q j (1.131)

i = k j . q Ahora diferenciamos gij = i j , ecuaci on (1.112): gij i j = k j + i k , k q q q = [ik, j ] + [jk, i] , por la ecuaci on (1.132).
9

(1.132)

(1.133)

C.W. Misner, K.S. Thorne, and J.A. Wheeler, Gravitation. San Francisco: W. H. Freeman (1973), p 387.

1.11. OPERADORES DIFERENCIALES DE TENSORES. Luego [ij, k ] = y


ks s ij = g [ij, k ] , 1 gik gjk gij = g ks + k 2 q j q i q

35

1 2

gik gjk gij + k q j q i q

(1.134)

(1.135)

Estos s mbolos de Christoel y las derivadas covariantes son aplicadas en la pr oxima secci on.

1.11

Operadores diferenciales de tensores.

En esta secci on la derivada covariante de la secci on 1.10 es aplicada para derivar las operaciones diferenciales vectoriales de la secci on 1.2 en la forma tensorial general. Divergencia. Reemplazando las derivadas parciales por la derivada covariante, tomamos la divergencia como
i V = V;i =

V i + V k i ik . i q

(1.136)

Expresando i on (1.135), tenemos ik por la ecuaci 1 im i ik = g 2 gim gkm gik + m q k q i q . (1.137)

Cuando contraemos con g im los dos u ltimos t erminos en el par entesis de llave se cancelan, ya que g im Entonces 1 im gim i . ik = g 2 q k Por la teor a de determinantes g gim = gg im k , k q q (1.140) (1.139) gkm mi gki im gik = g = g . q i q m q m (1.138)

donde g es el determinante de la m etrica,g = det(gij ). Sustituyendo este resultado en la ecuaci on (1.139), obtenemos i ik = 1 g 1 g 1/2 = . 2g q k g 1/2 q k (1.141)

36CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES. Esto da


i V = V;i =

1 g 1 /2

1/2 k (g V ) . q k

(1.142)

Para comparar este resultado con la ecuaci on (1.21), note que h1 h2 h3 = g 1/2 y V i (coeciente contravariante de i )= Vi /hi (no hay suma), donde Vi es el coeciente de e i . Laplaciano. En la secci on 1.2 reemplazamos el vector V en V por para obtener al Laplaciano . Aqu tenemos un V i contravariante. Usando el tensor m etrico para crear un contravariante , hacemos la sustituci on V i g ik Entonces el Laplaciano se convierte = 1 g 1/2 1/2 ik (g g ). q i q k (1.144) . q k (1.143)

Para los sistemas ortogonales de la secci on 1.2 el tensor m etrico es diagonal y el contravariante g ii (no hay suma) llega a ser g ii = (hi )2 . La ecuaci on (1.144) se reduce a = 1 h1 h2 h3 ( ). h1 h2 h3 q i h2 q k i

en concordancia con la ecuaci on (1.22). Rotor. La diferencia de derivadas que aparece en el rotor (ecuaci on (1.26)) ser a escrita Vi Vj i . q j q Nuevamente, recordemos que las componentes de Vi aqu son los coecientes contravariantes i de los vector no unitarios base . Los Vi de la secci on 1.2 son coecientes de los vectores unitarios e i . Usando
k k ij = ji ,

obtenemos Vi Vj Vi Vj i = j Vk k + Vk k ij ji j q q q q i = Vi;j Vj ;i . (1.145)

1.11. OPERADORES DIFERENCIALES DE TENSORES.

37

Las caracter sticas diferencias de derivadas del rotor llega a ser diferencias en derivadas covariantes y por lo tanto es un tensor de segundo orden (covariante en ambos ndices). Como enfatizamos en la secci on 1.9, la forma vectorial especial del rotor existe solamente en el espacio tridimensional. De la ecuaci on (1.135) es claro que todos los s mbolos de Christoel de tres ndices se anulan en el espacio de Minkowski y en el espacio-tiempo real de la relatividad especial con 1 0 0 0 0 1 0 0 g = (1.146) 0 0 1 0 . 0 0 0 1 Aqu x0 = ct , x1 = x , x2 = y , y x3 = z .

Esto completa el desarrollo de los operadores diferenciales en la forma tensorial general. En adici on a los campos el asticos y electromagn eticos, estas formas diferenciales encuentran aplicaci on en mec anica (mec anica Lagrangiana, Hamiltoniana, y las ecuaciones de Euler para la rotaci on de cuerpos r gidos); mec anica de u dos, y quiz as mucho m as importante que todas, en el espacio-tiempo curvado de la teor a moderna gravitacional.

38CAP ITULO 1. ANALISIS VECTORIAL EN COORDENADAS CURVIL INEAS Y TENSORES.

Cap tulo 2 Determinantes y matrices.


versi on nal 1.31-1604011

2.1

Determinantes.

Comenzamos el estudio de matrices resolviendo ecuaciones lineales las cuales nos llevan a determinantes y matrices. El concepto de determinante y su notaci on fueron introducidos por Leibniz. Ecuaciones lineales homogeneas. Una de las mayores aplicaciones de los determinantes est a en el establecimiento de una condici on para la exixtencia de una soluci on no trivial de un conjunto de ecuaciones algebraicas lineales hom ogeneas. Supongamos que tenemos tres inc ognitas x1 , x2 , x3 (o n ecuaciones con n inc ognitas). a1 x 1 + a2 x 2 + a3 x 3 = 0 , b1 x 1 + b2 x 2 + b3 x 3 = 0 , c1 x1 + c2 x2 + c3 x3 = 0 .

(2.1)

El problema es: en qu e condiciones hay alguna soluci on, aparte de la soluci on trivial x1 = 0, x2 = 0, x3 = 0? Si usamos notaci on vectorial x = (x1 , x2 , x3 ) para la soluci on y tres las a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ), c = (c1 , c2 , c3 ) para los coecientes, tenemos que las tres ecuaciones, ecuaci on (2.1), se convirten en ax=0 , bx=0 , cx=0 . (2.2)

Estas tres ecuaciones vectoriales tienen la interpretaci on geom etrica obvia que x es ortogonal a a, b, c. Si el volumen sustentado por a, b, c dado por el determinante (o el producto escalar triple) a1 a2 a3 D3 = (a b) c = det(a, b, c) = b1 b2 b3 , c1 c2 c3
1

(2.3)

Este cap tulo est a basado en el tercer cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.

39

40

CAP ITULO 2. DETERMINANTES Y MATRICES.

no es cero, claramente s olo existe la soluci on trivial x = 0. Vice-versa, si el anterior determinante de coecientes se anula, luego uno de los vectores columna es una combinaci on lineal de otros dos. Supongamos que c est a en el plano que sustenta a, b, i.e., la tercera ecuaci on es una combinaci on lineal de las primeras dos y no es independiente. Luego x es ortogonal a ese plano tal que x a b. Ya que las ecuaciones homog eneas pueden ser multiplicadas por n umeros arbitrarios, solamente las relaciones de xi son relevantes, para lo cual obtenemos razones de determinantes de 2 2 x1 (a2 b3 a3 b2 ) = , x3 (a1 b2 a2 b1 ) x2 (a1 b3 a3 b1 ) = , x3 (a1 b2 a2 b1 ) a partir de los componentes del producto cruz a b. Ecuaciones lineales no homog eneas. El caso m as simple es de dos ecuaciones con dos inc ognitas a1 x 1 + a2 x 2 = a3 , b1 x 1 + b2 x 2 = b3 , (2.5)

(2.4)

puede ser reducido al caso previo embebi endolo en un espacio tridimensional con una soluci on vectorial x = (x1 , x2 , 1) y el vector la a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ). Como antes, ecuaci on (2.5) en notaci on vectorial, a x = 0 y b x = 0, implica que x a b tal que el an alogo de la ecuaci on (2.4) se mantiene. Para que esto se aplique la tercera componente de a b debiera ser distinta de cero, i.e., a1 b2 a2 b1 = 0, ya que la tecera componente de x es 1 = 0. Esto produce que los xi tengan la forma a3 b3 (a3 b2 a2 b3 ) x1 = = (a1 b2 a2 b1 ) a1 b1 a1 b1 (a1 b3 a3 b1 ) x2 = = (a1 b2 a2 b1 ) a1 b1 a2 b2 a2 b2 a3 b3 . a2 b2

(2.6a)

(2.6b)

El determinante en el numerador de x1 (x2 ) es obtenido a partir del determinante de los a a a3 coecientes 1 2 reemplazando el primer vector columna (segundo) por el vector b1 b2 b3 del lado inhomog eneo de la ecuaci on (2.5). Estas soluciones de ecuaci on lineal en t erminos de determinantes pueden ser generalizados

2.1. DETERMINANTES. a n dimensiones. El determinante es un arreglo cuadrado a1 a2 b b Dn = 1 2 c1 c2 ... ... ... ... an bn , cn

41

(2.7)

de n umeros (o funciones), los coecientes de n ecuaciones lineales en nuestro caso. El n umero n de columnas (y de las) en el arreglo es llamado algunas veces el orden del determinante. La generalizaci on de la expansi on del producto escalar triple (de vectores la de las tres ecuaciones lineales) tiende al siguiente valor del determinante Dn en n dimensiones, Dn =
i,j,k,...

ijk... ai bj ck . . . ,

(2.8)

donde ijk . . . ., an alogo al s mbolo de Levi-Civita de la secci on (1.2), es +1 para permutaciones pares (ijk . . . ) de (123 . . . n), 1 para permutaciones impares, y cero si alg un ndice es repetido. Espec camente, para el determinante de orden tres D3 de las ecuaciones (2.3) y (2.8) tenemos D3 = +a1 b2 c3 a1 b3 c2 a2 b1 c3 + a2 b3 c1 + a3 b1 c2 a3 b2 c1 . (2.9)

El determinante de orden tres, entonces, es esta particular combinaci on lineal de productos. Cada producto contiene uno y s olo un elemento de cada la y de cada columna. Cada producto es sumado si las columnas (los ndices) representan una permutaci on par de (123) y restando si corresponde a una permutaci on impar. La ecuaci on (2.3) puede ser considerada en notaci on abreviada de la ecuaci on (2.9). El n umero de t erminos en la suma (ecuaci on (2.8))es 24 para un determinante de cuarto orden, en general n! para un determinante de orden n. A causa de la aparici on de signos negativos en la ecuaci on (2.9) pueden haber cancelaciones. Debido a esto es muy posible que un determinante de elementos grandes tenga un valor peque no. Algunas propiedades u tiles de los determinantes de n- esimo orden siguen de la ecuaci on (2.8). De nuevo, para ser espec co, la ecuaci on (2.9) para determinantes de orden tres es usada para ilustrar estas propiedades. Desarrollo laplaciano por las menores. La ecuaci on (2.9) puede ser reescrita D3 = a1 (b2 c3 b3 c2 ) a2 (b1 c3 b3 c1 ) + a3 (b1 c2 b2 c1 ) = a1 b2 b3 b b b b a2 1 3 + a3 1 2 . c2 c3 c1 c3 c1 c2 (2.10)

En general, el determinante de orden n- esimo puede ser expandido como una combinaci on lineal de productos de elementos de alguna la (o columna) por determinantes de orden (n 1) formados suprimiendo la la y la columna del determinante original en el cual aparece

42

CAP ITULO 2. DETERMINANTES Y MATRICES.

el elemento. Este arreglo reducido (2 2 en el ejemplo espec co) es llamado una menor. Si el elemento est a en la i- esima la y en la j - esima columna, el signo asociado con el producto i+j es (1) . La menor con este signo es llamada el cofactor. Si Mij es usado para designar la menor formado omitiendo la la i y la columna j y cij es el cofactor correspondiente, la ecuaci on (2.10) se convierte en
3 3

D3 =
j =1

(1)j +1 aj M1j =
j =1

aj c 1 j .

(2.11)

En este caso, expandiendo a lo largo de la primera la, tenemos i = 1 y la suma es sobre j , las columnas. Esta expansi on de Laplace puede ser usada para sacar ventaja en la evaluaci on de determinantes de alto orden en el cual muchos de los elementos son nulos. Por ejemplo, para encontrar el valor de el determinante 0 1 D= 0 0 1 0 0 0 0 0 0 1 0 0 , 1 0

(2.12)

expandimos a trav es de la la superior para obtener D = (1)


1+2

1 0 0 0 1 . (1) 0 0 1 0

(2.13)

Nuevamente, expandimos a trav es de la la superior para obtener D = (1) (1)1+1 (1) 0 1 = =1. 1 0 0 1 1 0

(2.14)

Este determinante D (ecuaci on (2.12)) est a formado de una de las matrices de Dirac que aparecen en la teor a relativista del electr on de Dirac. Antisimetr a. El determinante cambia de signo si cualquier par de las son intercambiadas o si cualquier par de columnas son intercambiadas. Esto deriva del car acter par-impar del Levi-Civita en la ecuaci on (2.8) o expl citamente de la forma de las ecuaciones (2.9) y (2.10). Esta propiedad fue usada en la secci on 1.9 para desarrollar una combinaci on lineal totalmente antisim etrica. Esto es tambi en frecuentemente usado en Mec anica Cu antica en la construcci on de una funci on de onda de muchas part culas que, en concordancia con el principio de exclusi on de Pauli, ser a antisim etrica bajo el intercambio de cualquier par de part culas id enticas con spin 1/2 (electrones, protones, neutrones, etc).

2.1. DETERMINANTES.

43

Como un caso especial de antisimetr a, cualquier determinante con dos las iguales o dos columnas iguales es nulo. Si cada elemento en una la o de una columna es cero el determinante completo es nulo. Si cada elemento en una la o de una columna es multiplicado por una constante, el determinante completo es multiplicado por esa constante. El valor de un determinante es inalterado si un m ultiplo de una la es a nadido (columna por columna) a otra la o si un m ultiplo de una columna es a nadido (la por la) a otra columna. Tenemos a1 a2 a3 a1 + ka2 a2 a3 b1 b2 b3 = b1 + kb2 b2 b3 . c1 c2 c3 c1 + kc2 c2 c3 Usando el desarrollo de Laplace sobre el lado derecho, obtenemos a1 + ka2 a2 a3 a1 a2 a3 a2 a2 a3 b1 + kb2 b2 b3 = b1 b2 b3 + k b2 b2 b3 , c1 + kc2 c2 c3 c1 c2 c3 c2 c2 c3 (2.16) (2.15)

entonces por la propiedad de antisimetr a el segundo determinante del lado derecho se anula, vericando la ecuaci on (2.15). Un caso especial, un determinante es igual a cero, si cualquier par de las o columnas son proporcionales. Volviendo a las ecuaciones homog eneas (2.1) y multiplicando el determinante de los coecientes por x1 , y luego sumando x2 veces la segunda columna y x3 veces la tercera columna, podemos establecer directamente la condici on para la presencia de una soluci on no trivial para la ecuaci on (2.1): 0 a2 a3 a1 x 1 + a2 x 2 + a3 x 3 a2 a3 x 1 a1 a2 a3 a1 a2 a3 x1 b1 b2 b3 = x1 b1 b2 b3 = b1 x1 + b2 x2 + b3 x3 b2 b3 = 0 b2 b3 = 0 . (2.17) 0 c2 c3 c1 x1 + c2 x2 + c3 x3 c2 c3 x1 c1 c2 c3 c1 c2 c3 Por lo tanto x1 (x2 y x3 ) deber an ser cero a menos que el determinante de los coecientes sea nulo. Podemos mostrar que si el determinante de los coecientes es nulo, existe realmente una soluci on no trivial. Si nuestras ecuaciones lineales son inhomog eneas, esto es, como en la ecuaci on (2.5) o si los ceros en el lado derecho de la ecuaci on (2.1) fueran reemplazados por a4 , b4 , c4 respectivamente, luego de la ecuaci on (2.17) obtenemos, a4 b4 c4 x1 = a1 b1 c1 a2 b2 c2 a2 b2 c2 a3 b3 c3 , a3 b3 c3

(2.18)

la cual generaliza la ecuaci on (2.6a) a la dimensi on n = 3. Si el determinante de los coecientes se anula, el conjunto de ecuaciones no homog eneas no tiene soluci on a menos que el numerador tambi en se anule. En este caso las soluciones pueden existir pero ellas no son u nicas.

44

CAP ITULO 2. DETERMINANTES Y MATRICES.

Para el trabajo num erico, esta soluci on del determinante, ecuaci on (2.18), es enormemente dif cil de manejar. El determinante puede involucrar grandes n umeros con signos alternados, y en la resta de dos n umeros grandes el error relativo podr a remontarse al punto que hace que el resultado no tenga valor. Tambi en, aunque el m etodo del determinante es ilustrado aqu con tres ecuaciones y tres inc ognitas, podr amos f acilmente tener 200 ecuaciones con 200 inc ognitas las cuales, involucran sobre 200! t erminos por determinante, lo que pone un desaf o muy alto a la velocidad computacional. Deber a haber una mejor manera. En efecto, hay una mejor manera. Una de las mejores es un proceso a menudo llamado eliminaci on de Gauss. Para ilustrar esta t ecnica, consideremos el siguiente conjunto de ecuaciones. Resolvamos 3x + 2y + z = 11 2x + 3y + z = 13 (2.19) x + y + 4z = 12 . El determinante de la ecuaci on lineal no homog enea ecuaci on (2.19) es 18, por lo tanto existe una soluci on. Por conveniencia y para una optima precisi on num erica, las ecuaciones son reordenadas tal que los coecientes mayores corran a lo largo de la diagonal principal (superior izquierda a inferior derecha). Esto ha sido hecho en el conjunto anterior. La t ecnica de Gauss es usar la primera ecuaci on para eliminar la primera inc ognita x de las ecuaciones restantes. Entonces la (nueva) segunda ecuaci on es usada para eliminar y de la u ltima ecuaci on. En general, descendemos poco a poco a trav es del conjunto de ecuaciones, y luego, con una inc ognita determinada, avanzamos gradualmente para resolver cada una de las otras inc ognitas en sucesi on. Dividiendo cada la por su coeciente inicial, vemos que las ecuaciones (2.19) se convierten en 1 11 2 x+ y+ z = 3 3 3 3 1 13 (2.20) x+ y+ z = 2 2 2 x + y + 4z = 12 . Ahora, usando la primera ecuaci on, eliminamos x de la segunda y la tercera: 2 1 11 x+ y+ z = 3 3 3 5 1 17 y+ z= 6 6 6 1 11 25 y+ z= , 3 3 3 y 2 1 11 x+ y+ z = 3 3 3 17 1 y+ z= 5 5 y + 11z = 25 .

(2.21)

(2.22)

2.1. DETERMINANTES.

45

Repitiendo la t ecnica, usamos la segunda ecuaci on para eliminar y a partir de la tercera ecuaci on: 2 1 11 x+ y+ z = 3 3 3 1 17 (2.23) y+ z= 5 5 54z = 108 , o z=2. Finalmente, al reemplazar obtenemos y+ o y=3. Luego con z e y determinados, x+ y x=1. La t ecnica podr a parecer no tan elegante como la ecuaci on (2.17), pero est a bien adaptada a los computadores modernos y es m as r apida que el tiempo gastado con los determinantes. Esta t ecnica de Gauss puede ser usada para convertir un determinante en una forma tri angular: a1 b 1 c 1 D = 0 b2 c 2 , 0 0 c3 para un determinante de tercer orden cuyos elementos no deben ser confundidos con aquellos en la ecuaci on (2.3). De esta forma D = a1 b2 c3 . Para un determinante de n- esimo orden la evaluaci on de una forma triangular requiere solamente n 1 multiplicaciones comparadas con las n! requeridas para el caso general. Una variaci on de esta eliminaci on progresiva es conocida como eliminaci on de GaussJordan. Comenzamos como si fuera el procedimiento de Gauss, pero cada nueva ecuaci on considerada es usada para eliminar una variable de todas las otras ecuaciones, no s olo de aquellas bajo ella. Si hemos usado esta eliminaci on de Gauss-Jordan, la ecuaci on (2.23) llegar a a ser 1 7 x+ z = 5 5 17 1 y+ z= 5 5 z=2, 2 1 11 3+ 2= , 3 3 3 1 17 2= , 5 5

(2.24)

46

CAP ITULO 2. DETERMINANTES Y MATRICES.

usando la segunda ecuaci on de la ecuaci on (2.22) para eliminar y de ambas, la primera y tercera ecuaciones. Entonces la tercera ecuaci on de la ecuaci on (2.24) es usada para eliminar z de la primera y segunda ecuaciones, dando x=1 y=3 z=2,

(2.25)

Volveremos a la t ecnica de Guass-Jordan cuando invertamos matrices. Otra t ecnica disponible para el uso computacional es la t ecnica de Gauss-Seidel. Cada t ecnica tiene sus ventajas y desventajas. Los m etodos de Gauss y Gauss-Jordan pueden tener problemas de precisi on para un determinante grande. Esto tambi en es un problema para la inversi on de matrices. El m etodo de Gauss-Seidel, como un m etodo iterativo, puede tener problemas de convergencia.

2.2

Matrices.

El an alisis matricial pertenece al algebra lineal ya que las matrices son operadores o mapas lineales tales como rotaciones. Supongamos, por ejemplo, que rotamos las coordenadas cartesianas de una espacio bidimensional tal que, en notaci on vectorial, x1 x2 = x1 cos x2 sen x2 sin x1 cos =
j

aij xj

(2.26)

Etiquetamos el arreglo de elementos aij por la matriz A de 2 2 consistente de dos las y dos columnas, adem as, consideramos los vectores x, x como matrices de 2 1. Tomemos la suma de productos de la ecuaci on (2.26) como una denici on de la multiplicaci on matricial que involucra el producto escalar de cada uno de los vectores la de A con el vector columna x. As en notaci on matricial la ecuaci on (2.26) se convierte en x = Ax . (2.27)

Para extender esta denici on de multiplicaci on de una matriz por un vector columna a el producto de dos matrices de 2 2, consideremos la rotaci on de coordenada seguida por una segunda rotaci on dada por la matriz B tal que x = Bx . Por componentes xi =
j

(2.28)

bij xj =
j

bij
k

ajk xk =
k j

bij ajk

xk .

(2.29)

La suma sobre j es la multiplicaci on matricial deniendo una matriz C = BA tal que xi =


k

cik xk ,

(2.30)

2.2. MATRICES.

47

o x = Cx en notaci on matricial. Nuevamente, esta denici on involucra el producto escalar de vectores las de B con vectores columnas de A. Esta denici on de multiplicaci on matricial se puede generalizar a matrices de m n y es u til, realmente su utilidad es la justicaci on de su existencia. La interpretaci on f sica es que el producto matricial de dos matrices, BA, es la rotaci on que conduce del sistema sin prima directamente al sistema de coordenadas con doble prima. Antes de pasar a la denici on formal, podemos notar que el operador A est a descrito por sus efectos sobre las coordenadas o vectores base. Los elementos de matriz aij constituyen una representaci on del operador, una representaci on que depende de la elecci on de una base. El caso especial donde una matriz tiene una columna y n las es llamada un vector columna, |x , con componentes xi , i = 1, 2, . . . ., n. Si A es una matriz de n n, |x es un vector columna de n componentes, A|x est a denida como en la ecuaci on (2.27) y (2.26). Similarmente, si una matriz tiene una la y n columnas, es llamada un vector la, x| con componentes xi , i = 1, 2, . . . .n. Claramente, x| resulta de |x > por el intercambio de las y columnas, una operaci on matricial llamada transposici on, y pora cualquier matriz A, A )ik = Aik . Transponiendo un es llamada 2 la transpuesta de A con elementos de matriz (A producto de matrices AB se invierte el orden y da BA; similarmente, A|x se transpone como x|A. El producto escalar toma la forma x|y . Deniciones b asicas. Una matriz puede ser denida como una arreglo cuadrado o rectangular de n umeros o funciones que obedecen ciertas leyes. Esto es una extensi on perfectamente l ogica de los conceptos matem aticos familiares. En aritm etica tratamos con n umeros simples. En la teor a de variable compleja tratamos con pares ordenados de n umeros, (1, 2) = 1 + 2i, en el cual el orden es importante. Ahora consideremos n umeros (o funciones) ordenados en un arreglo cuadrados o rectangular. Por conveniencia en el trabajo posterior los n umeros son distinguidos por dos sub ndices, el primero indica la la (horizontal) y el segundo indica la columna (vertical) en la cual aparecen los n umeros. Por ejemplo, a13 es el elemento de matriz en la primera la y tercera columna. De este modo, si A es una matriz con m las y n columnas, a11 a21 A= . . . a12 a22 . . . .. . a1 n a2 n . . . .

(2.31)

am1 am2 amn

Quiz as el hecho m as importante a notar es que los elementos aij no est an combinados unos con otros. Una matriz no es un determinante. Es un arreglo ordenado de n umeros, no un simple n umero. La matriz A hasta ahora de s olo es un arreglo de n umeros que tiene las propiedades que le asignamos. Literalmente, esto signica construir una nueva forma de matem aticas. Postulamos que las matrices A, B y C, con elementos aij , bij y cij , respectivamente, combinan de acuerdo a las siguientes reglas.
2

Algunos textos denotan A transpuesta por AT .

48 Igualdad.

CAP ITULO 2. DETERMINANTES Y MATRICES.

Matriz A= Matriz B si y s olo si aij = bij para todos los valores de i y j . Esto, por su puesto, require que A y B sean cada uno arreglos de m n (m las y n columnas). Suma. A + B = C si y s olo si aij + bij = cij para todos los valores de i y j , los elementos se combinan de acuerdo a las leyes del algebra lineal (o aritm etica si hay n umeros simples). Esto signica que A + B = B + A, la conmutaci on. Tambi en, se satisface la ley de asociatividad (A + B) + C = A + (B + C). Si todos los elementos son cero, la matriz es llamada matriz nula y se denota por 0. Para todo A, A+0=0+A=A , con 0 0 0 = . . . 0 0 0 0 . . ... . . . . . 0 0 0

(2.32)

Tal que las matrices de m n forman un espacio lineal con respecto a la suma y la resta. Multiplicaci on (por un escalar). La multiplicaci on de la matriz A por una cantidad escalar est a denida como A = (A) , (2.33)

en la cual los elementos de A son aij ; esto es, cada elemento de la matriz A es multiplicado por el factor escalar. Esto contrasta con el comportamiento de los determinantes en el cual el factor multiplica solamente una columna o una la y no cada elemento del determinante. Una consecuencia de esta multiplicaci on por escalar es que A = A , conmutaci on. (2.34)

Multiplicaci on (multiplicaci on matricial) producto interno. AB = C si y solo si cij =


k

aik bkj .

(2.35)

Los elementos i y j de C est an formados como un producto escalar de la i- esima la de A con el j - esima columna de B (el cual demanda que A tenga el mismo n umero de columnas como B tiene de las). El ndice mudo k toma los valores 1, 2, . . . , n en sucesi on, esto es, cij = ai1 b1j + ai2 b2j + ai3 b3j , (2.36)

2.2. MATRICES.

49

para n = 3. Obviamente, el ndice mudo k pude ser reemplazado por alg un otro s mbolo que no est e en uso sin alterar la ecuaci on (2.35). Quiz as la situaci on puede ser aclarada armando que la ecuaci on (2.35) dena el m etodo de combinar ciertas matrices. Este m etodo de combinaci on, es llamado multiplicaci on matricial. Para ilustrar, consideremos dos matrices (matrices de Pauli) 1 = 0 1 1 0 y 1 0 0 1 . (2.37)

El elemento 11 del producto, (1 3 )11 est a dado por la suma de productos de elementos de la primera la de 1 con el correspondiente elemento de la primera columna de 3 : Aqu (1 3 )ij = 1 i1 31j + 1 i2 32j . Una aplicaci on directa de la multiplicaci on de matrices muestra que 3 1 = y por la ecuaci on (2.35) 1 3 = 1 3 . Excepto en casos especiales, la multiplicaci on de matrices no es conmutativa.3 AB = BA . (2.40) (2.39) 0 1 1 0 (2.38)

Sin embargo, de la denici on de multiplicaci on de matrices podemos mostrar que se mantiene una ley de asosiatividad, (AB)C = A(BC). Tambi en se satisface una ley de distributividad, A(B + C) = AB + AC. La matriz unidad tiene elementos ij , la delta de Kronecker, y la propiedad de que 1A = A1 = A para toda A, 1 0 0 0 1 0 1 = . (2.41) . . .. . . . . . . . . 0 0 1 Notamos que es posible que el producto de dos matrices sea una matriz nula sin ser ninguna de ellas una matriz nula. Por ejemplo, si A= 1 1 0 0 y B= 1 0 1 0 .

AB = 0. Esto diere de la multiplicaci on de n umeros reales o complejos los cuales forman un campo, mientras que las estructura aditiva y multiplicativa de las matrices es llamada anillo por los matem aticos.
La perdida de la propiedad conmutativa es descrita por el conmutador [A, B] = AB BA. La no conmutatividad se expresa por [A, B] = 0.
3

50

CAP ITULO 2. DETERMINANTES Y MATRICES.

Si A en una matriz de n n con determinante |A| = 0, luego tiene una unica inversa A1 tal que AA1 = A1 A = 1. Si B es tambi en una matriz de n n con inversa B1 , luego el producto de AB tiene la inversa (AB)1 = B1 A1 , (2.42)

ya que ABB1 A1 = 1 = B1 A1 AB. El teorema del producto el cual dice que el determinante de un producto,|AB|, de dos matrices de n n A y B es igual al producto de los determinantes, |A B|, uniendo matrices con determinantes. El anterior teorema puede ser f acilmente probado. Producto directo. Un segundo procedimiento para multiplicar matrices, conocido como el tensor producto directo o de Kronecker. Si A es una matriz de m m y B una matriz de n n, luego el producto directo es AB=C . C es uan matriz de mn mn con elementos C = Aij Bkl , con = n(i 1) + k , = n(j 1) + l . (2.44) (2.43)

Por ejemplo, si A y B ambas son matrices de 2 2, AB= a11 B a12 B a21 B a22 B a11 b11 a11 b12 a11 b21 a11 b22 = a21 b11 a21 b12 a21 b21 a21 b22

a12 b11 a12 b21 a22 b11 a22 b21

a12 b12 a12 b22 . a22 b12 a22 b22

(2.45)

El producto directo es asociativo pero no conmutativo. Como un ejemplo de producto directo, las matrices de Dirac pueden ser desarrolladas como productos directos de las matrices de Pauli y de la matriz unidad. Otros ejemplos aparecen en la construcci on de grupos en teor a de grupos y en espacios de Hilbert en teor a cu antica. El producto directo denido aqu es algunas veces llamado la forma standard y es denotado por . Otros tres tipos de producto directo de matrices existe como posibilidades o curiosidades matem aticas pero tienen muy poca o ninguna aplicaci on en f sica matem atica.

2.2. MATRICES. Matrices diagonales.

51

Un tipo especial muy importante de matrices es la matriz cuadrada en la cual todos los elementos no diagonales son cero. Espac camente, si una matriz A de 3 3 es diagonal, a11 0 0 A = 0 a22 0 . 0 0 a33 Una interpretaci on f sica de tales matrices diagonales y el m etodo de reducir matrices a esta forma diagonal son considerados en la secci on 2.5. Aqu nos limitamos a notar la importante propiedad de que la multiplicaci on de matrices es conmutativa, AB = BA, si A y B son cada una diagonales. Traza. En cualquiera matriz cuadrada la suma de los elementos diagonales es llamada la traza. Claramente la traza es una operaci on lineal: traza(A B) = traza(A) traza(B) . Una de sus interesantes y u tiles propiedades es que la traza de un producto de dos matrices A y B es independiente del orden de la multiplicaci on: traza(AB) =
i

(AB)ii =
i j

aij bji (BA)jj


j

=
i j

bji aij =

(2.46)

= traza(BA) . Esto se mantiene a un cuando AB = BA. La ecuaci on (2.46) signica que la traza de cualquier conmutador, [A, B] = AB BA, es cero. De la ecuaci on (2.46) obtenemos traza(ABC) = traza(BCA) = traza(CAB) , lo cual muestra que la traza es invariante bajo permutaciuones c clicas de la matriz en un producto. Para una matriz sim etrica o una matriz Herm tica compleja la traza es la suma, y el determinante el producto, de sus autovalores, y ambos son coecientes del polinomio caracter stico. La traza servir a una funci on similar para las matrices como la ortogonalidad sirve para los vectores y funciones. En t erminos de tensores la traza es una contracci on y como el tensor de segundo orden contra do es un escalar (invariante). Las matrices son usadas ampliamente para representar los elementos de grupos. La traza de las matrices representando los elementos de grupo es conocido en teor a de grupos como el car acter. La raz on de este nombre especial y espacial atenci on es que mientras las matrices pueden variar la traza o car acter se mantiene inavariante.

52 Inversi on de matriz.

CAP ITULO 2. DETERMINANTES Y MATRICES.

Al comienzo de esta secci on la matriz A fue presentada como la representaci on de un operador que (linealmente) transforma los ejes de coordenadas. Una rotaci on podr a ser un ejemplo de tal transformaci on lineal. Ahora buscaremos la transformaci on inversa A1 que restablecer a los ejes de coordenadas originales. Esto signica, ya sea como una ecuaci on matricial o de operador4 , AA1 = A1 A = 1 . Podemos probar (ejercicio) que
1 a ij =

(2.47)

Cji , |A|

(2.48)

con la suposici on que el determinante de A (|A|) = 0. Si es cero, etiquetaremos a A como singular. No existe la inversa. Como fue explicado en la secci on 2.1 esta forma con determinante es totalmente inapropiado para el trabajo num erico con grandes matrices. Hay una amplia variedad de t ecnicas alternativas. Una de las mejores y m as com unmente usada es la t ecnica de inversi on de matrices de Gauss-Jordan. La teor a est a basada en los resultados que muestran que existen matrices ML tal que el producto ML A ser a A pero con a. una la multiplicada por una constante, o b. una la reemplazada por la la original menos un m ultiplo de otra la, o c. las intercambiadas. Otras matrices MR operando sobre la derecha de (AMR ) puede llevar a las mismas operaciones sobre las columnas de A. Esto signica que las las y las columnas de la matriz pueden ser alteradas (por multiplicaci on de matrices) como si estuvi eramos tratando con determinantes, as podemos aplicar las t ecnicas de eliminaci on de Gauss-Jordan a los elementos de matriz. Por tanto existe una matriz ML (o MR ) tal que5 ML A = 1 . (2.49)

La ML = A1 . Determinamos ML realizando las operaciones de eliminaci on id enticas sobre la matriz unidad. Luego ML 1 = ML . Para claricar esto consideremos un ejemplo espec co. Deseamos invertir la matriz 3 2 1 A = 2 3 1 . 1 1 4
4 5

(2.50)

(2.51)

Aqu y a trav es de todo el cap tulo nuestras matrices tienen rango nito. Recordemos que det(A) = 0.

2.3. MATRICES ORTOGONALES. Por conveniencia escribimos A y 1 una de ellas 3 2 1

53

lado a lado realizando operaciones id enticas sobre cada 2 1 3 1 1 4 1 0 0 0 1 0 . 0 0 1 para obtener ak1 = 1, 1 0 0 3 1 0 2 0 . 0 0 1

(2.52)

Para ser sistem aticos, multiplicamos cada la 2 1 1 3 3 3 1 1 2 2 1 1 4

(2.53)

Restando la primera la de la segunda y tercera, obtenemos 1 2 1 1 3 3 0 0 3 5 1 1 1 0 6 6 3 2 0 . 1 11 0 3 3 1 0 1 3

(2.54)

Entonces dividimos la segunda la (de ambas matrices) por 5/6 y sustray endola 2/3 veces de la primera la, y 1/3 veces de la tercera la. Los resultados para ambas matrices son 3 1 0 1 2 0 5 5 5 2 3 (2.55) 0 1 1 5 5 0 . 5 18 1 1 0 0 5 5 5 1 Dividimos la tercera la (de ambas matrices) por 18/5. Luego como u ltimo paso 1/5 veces la tercera la es sustra da de cada una de las dos primeras las (de ambas martices). Nuestro par nal es 11 7 1 1 0 0 18 18 8 7 1 18 (2.56) . 0 1 0 18 11 18 1 5 1 0 0 1 18 18 18 El chequeo es multiplicar la original A por la calculada A1 para ver si realmente obtuvimos la matriz unidad 1. Como con la soluci on de Gauss-Jordan de ecuaciones algebraicas simult aneas, esta t ecnica est a bien adaptada para computadores.

2.3

Matrices ortogonales.

El espacio de tres dimensiones ordinario puede ser descrito con las coordenadas cartesianas (x1 , x2 , x3 ). Consideremos un segundo conjunto de coordenadas cartesianas (x1 , x2 , x3 ) cuyo origen y sentido coinciden con el primero pero su orientaci on es diferente (gura 2.1). Podemos decir que el sistema de ejes prima ha sido rotado respecto al inicial sistema de coordenadas sin prima. Ya que esta rotaci on es una operaci on lineal, esperamos una ecuaci on matricial que relaciones la base con primas con la sin primas.

54

CAP ITULO 2. DETERMINANTES Y MATRICES.


x3 x 3 x 2

x1

x2 x1

x1 x 1

Figura 2.1: Sistemas de coordenadas cartesianos.

Cosenos directores. Un vector unitario a lo largo del eje x1 ( x1 ) puede ser resuelto en sus componentes a lo largo de los ejes x1 , x2 y x3 por las usuales t ecnicas de proyecci on. 2 cos(x2 , x2 ) + x 3 cos(x3 , x3 ) . x 1 = x 1 cos(x1 , x1 ) + x (2.57)

Por conveniencia estos cosenos, los cuales son los cosenos directores, son etiquetados cos(x1 , x1 ) = x 1 x 1 = a11 , cos(x1 , x2 ) = x 1 x 2 = a12 , cos(x1 , x3 ) = x 1 x 3 = a13 . Continuando, tenemos cos(x2 , x1 ) = x 2 x 1 = a21 , cos(x2 , x2 ) = x 2 x 2 = a22 , Ahora la ecuaci on (2.57) puede ser reescrita como x 1 = x 1 a11 + x 2 a12 + x 3 a13 y tambi en x 2 = x 1 a21 + x 2 a22 + x 3 a23 x 3 = x 1 a31 + x 2 a32 + x 3 a33 . (2.60) (a21 = a12 ) , y as sucesivamente. (2.59)

(2.58)

Tambi en podemos ir de la otra manera resolviendo x 1 , x 2 y x 3 en sus componentes en el sistema con primas. Entonces x 1 = x 1 a11 + x 2 a21 + x 3 a31 3 a32 x 2 = x 1 a12 + x 2 a22 + x x 3 = x 1 a13 + x 2 a23 + x 3 a33 .

(2.61)

2.3. MATRICES ORTOGONALES. Aplicaciones a vectores. Si consideramos un vector cuyas componentes son funciones de la posici on, entonces V (x1 , x2 , x3 ) = x 1 V1 + x 2 V2 + x 3 V3 = V (x1 , x2 , x3 ) = x 1 V1 + x 2 V2 + x 3 V3 ,

55

(2.62)

ya que el punto puede ser dado en cualquiera de los dos sistema de coordenadas (x1 , x2 , x3 ) o (x1 , x2 , x3 ). Notemos que V y V son geom etricamente el mismo vector (pero con diferentes componentes). Si los ejes de coordenadas son rotados, el vector se mantiene jo. Usando la ecuaci on (2.60) para eliminar x 1 , x 2 , x 3 , podemos separar la ecuaci on (2.62) en tres ecuaciones escalares V1 = a11 V1 + a12 V2 + a13 V3 V2 = a21 V1 + a22 V2 + a23 V3 V3 = a31 V1 + a32 V2 + a33 V3 . (2.63)

En particular, estas relaciones se mantendr an para las coordenadas de un punto (x1 , x2 , x3 ) y (x1 , x2 , x3 ), dando x1 = a11 x1 + a12 x2 + a13 x3 x2 = a21 x1 + a22 x2 + a23 x3 x3 = a31 x1 + a32 x2 + a33 x3 , (2.64)

y similarmente para las coordenadas primas. En esta notaci on el conjunto de tres ecuaciones (2.64) pueden ser escritas como
3

xi =
j =1

aij xj ,

(2.65)

donde i toma los valores 1, 2 y 3 y el resultado son tres ecuaciones separadas. De la ecuaci on anterior podemos derivar interesante informaci on sobre los aij los cuales describen la orientaci on del sistema de coordenadas (x1 , x2 , x3 ) relativa al sistema (x1 , x2 , x3 ). La distancia respecto al origen es la misma en ambos sistemas. Elevando al cuadrado, x2 i =
i i

xi

=
i j

aij xj
k

aik xk

(2.66)

=
j,k

xj xk
i

aij aik .

Esto s olo puede ser cierto para todos los puntos si y s olo si aij aik = jk ,
i

j, k = 1, 2, 3 .

(2.67)

56

CAP ITULO 2. DETERMINANTES Y MATRICES.

La ecuaci on (2.67) es una consecuencia de requerir que la longitud permanezca constante (invariante) bajo rotaciones del sistema de coordenadas, es llamada la condici on de ortogonalidad. Los aij escritos como una matriz A, forman una matriz ortogonal. Notemos que la ecuaci on (2.67) no es una multiplicaci on matricial. En notaci on matricial la ecuaci on (2.65) llega a ser |x = A|x . Condiciones de ortogonalidad, caso bidimensional. Podemos ganar un mejor entendimiento de los aij y de la condici on de ortogonalidad considerando con detalle rotaciones en dos dimensiones. Esto lo podemos pensar como un sistema tridimensional con los ejes x1 y x2 rotados respecto a x3 . De la gura 2.2, (2.68)

x 2

x2 x2

x2

n e s

x 1 x1 x1

s o x 1c

Figura 2.2: Sistemas de coordenadas rotados en dos dimensiones.

x1 = x1 cos + x2 sen , x2 = x1 sen + x2 cos . Por lo tanto por la ecuaci on (2.68) A= cos sen sen cos .

(2.69)

(2.70)

Notemos que A se reduce a la matriz unidad para = 0. La rotaci on cero signica que nada ha cambiado. Es claro a partir de la gura 2.2 que a11 = cos = cos(x1 , x1 ) , (2.71) a12 = sen = cos = cos(x1 , x2 ) , y as sucesivamente, 2 de este modo identicamos los elementos de matriz aij con los cosenos directores. La ecuaci on (2.67), la condici on de ortogonalidad, llega a ser sen2 + cos2 = 1 , sen cos sen cos = 0 . (2.72)

2.3. MATRICES ORTOGONALES.

57

la extensi on a tres dimensiones ( rotaci on de las coordenadas a lo largo del eje z en un angulo en el sentido de los punteros del reloj) es simplemente cos sen 0 A = sen cos 0 . 0 0 1

(2.73)

El a33 = 1 expresa el hecho que x3 = x3 , ya que la rotaci on ha sido en torno al eje x3 Los ceros garantizan que x1 y x2 no dependen de x3 y que x3 no depende de x1 y x2 . En un lenguaje m as sosticado, x1 y x2 se extienden sobre un subespacio invariante, mientras que x3 forma un subespacio invariante por si solo. La forma de A es reducible. La ecuaci on (2.73) da una posible descomposici on. Matriz inversa A1 . Volviendo a la matriz de transformaci on general A, la matriz inversa A1 es denida tal que |x = A1 |x . (2.74)

Esto es, A1 describe el inverso de la rotaci on dada por A y retorna el sistema de coordenadas a su posici on original. Simb olicamente, las ecuaciones (2.68) y (2.74) combinadas dan |x = A1 A|x , y ya que |x es arbitrario, A1 A = 1 , la matriz unidad, Similarmente, AA1 = 1 . usando las ecuaciones (2.68) y (2.74) y eliminando |x en vez de |x . . Matriz transpuesta, A Podemos determinar los elementos de nuestra postulada matriz inversa A1 empleando la condici on de ortogonalidad. La ecuaci on (2.67), la condici on de ortogonalidad, no est a de acuerdo con nuestra denici on de multiplicaci on matricial, pero la podemos denir de acuerdo tal que a una nueva matriz A a ji = aij . La ecuaci on (2.67) llega a ser =1. AA (2.79) (2.78) (2.77) (2.76) (2.75)

58

CAP ITULO 2. DETERMINANTES Y MATRICES.

Esta es una reformulaci on de la condici on de ortogonalidad y puede ser tomada como una denici on de ortogonalidad. Multiplicando (2.79) por A1 por la derecha y usando la ecuaci on (2.77), tenemos = A1 . A (2.80)

Este importante resultado que la inversa es igual a la transpuesta se mantiene s olo para matrices ortogonales y puede ser tomado como una reformulaci on de la condici on de ortogonalidad. Multiplicando la ecuaci on (2.80) por A por la izquierda, obtenemos =1, AA o aji aki = jk ,
i

(2.81)

(2.82)

lo cual es otra forma m as de la condici on de ortogonalidad. Resumiendo, la condici on de ortogonalidad puede ser enunciada de varias maneras equivalentes: aij aik = jk
i

(2.83a) (2.83b) (2.83c) (2.83d)

aji aki = jk
i

= AA =1 AA = A1 . A

Cualquiera de estas relaciones es condici on necesaria y suciente para que A sea ortogonal. Es posible ahora ver y enteder por qu e el nombre ortogonal es apropiado para estas matrices. Tenemos la forma general a11 a12 a13 A = a21 a22 a23 , a31 a32 a33 de una matriz de cosenos directores en la cual aij es el coseno del angulo entre xi y xj . Por lo tanto, a11 , a12 , a13 son los cosenos directores de x1 relativo a x1 , x2 , x3 . Estos tres elementos 1 , de A denen una unidad de longitud a lo largo de x1 , esto es, un vector unitario x x 1 = x 1 a11 + x 2 a12 + x 3 a13 . La relaci on de ortogonalidad (ecuaci on (2.82)) es simplemente una declaraci on que los vectores unitarios x 1 , x 2 , y x 3 son mutuamente perpendiculares o ortogonales. Nuestra matriz de transformaci on ortogonal A transforma un sistema ortogonal en un segundo sistema ortogonal de coordenadas por rotaci on y/o reexi on.

2.3. MATRICES ORTOGONALES. Angulos de Euler.

59

Nuestra matriz de trasformaci on A contiene nueve cosenos directores. Claramente, s olo tres de ellos son independientes, la ecuaci on (2.67) proveen seis restricciones. De otra manera, uno puede decir que necesita dos par ametros ( y en coordenadas polares esf ericas) para jar el eje de rotaci on, m as uno adicional para describir la magnitud de la rotaci on en torno a ese eje. En la formulaci on Lagrangiana de la mec anica es necesario describir A usando alg un conjunto de tres par ametros independientes m as que los redundantes cosenos directores. La elecci on usual de estos par ametros es la de los angulos de Euler6

x 3= x 3 x 3= x 3 x 3 x1 x 1 x2

x 3 = x 3

x 3= x 3

x 2 x 1 x 1 (a) x2 (b) x= 2 x 2 x 1 x 2 x= x 2 2 x 1 (c)

Figura 2.3: (a) Rotaci on respecto al eje x3 en un angulo ; (b) Rotaci on respecto a un eje x2 en un angulo ; (c) Rotaci on respecto a un eje x3 en un angulo . El objetivo de describir la orientaci on de un sistema nal rotado (x1 , x2 , x3 ) relativo a algun sistema de coordenadas inicial (x1 , x2 , x3 ). El sistema nal es desarrollado en tres pasos cada paso involucra una rotaci on descrita por un angulo de Euler (gura 2.3): 1. Los ejes x1 , x2 , y x3 son rotados respecto al eje x3 en un angulo en el sentido horario relativo a x1 , x2 y x3 . (Los ejes x3 y x3 coinciden.) 2. los ejes x1 , x2 , y x3 son rotados respecto al eje x2 en un angulo en el sentido horario relativo a x1 , x2 y x3 . (Los ejes x2 y x2 coinciden.) 3. la tercera y nal rotaci on es en un angulo en sentido horario respecto al eje x3 produciendo el sistema (x1 , x2 , x3 ). (Los ejes x3 y x3 coinciden.) Las tres matrices que describen estas rotaciones son: cos sen Rz () = sen cos 0 0
6

0 0 , 1

(2.84)

No hay una u nica manera de denir los angulos de Euler. Usamos la elecci on usual en Mec anica Cu antica de momento angular.

60

CAP ITULO 2. DETERMINANTES Y MATRICES.

exactamente como en la ecuaci on (2.73,

cos 0 sen 1 0 Ry ( ) = 0 sen 0 cos

(2.85)

y cos sen 0 Rz ( ) = sen cos 0 . 0 0 1 La rotaci on total es descrita por el producto matricial triple, A(, , ) = Rz ( )Ry ( )Rz () . (2.87) (2.86)

Notemos el orden: Rz () opera primero, entonces Ry ( ), y nalmente Rz ( ). La multiplicaci on da cos cos cos sen sen cos cos sen sen cos cos sen sen sen . A = sen cos cos cos sen sen cos sen + cos cos sen cos sen sen cos (2.88) Comparando A(aij ) con A(, , ) elemento por elemento, nos produce los cosenos directores en t erminos de los angulos de Euler. Propiedades de simetr a. Nuestra descripci on matricial conduce al grupo de rotaciones SO(3) en el espacio tridimensional R3 , y la descripci on en t erminos de angulos de Euler de las rotaciones forman una base para desarrollar el grupo de rotaciones. Las rotaciones pueden tambi en ser descritas por el 2 grupo unitario SU (2) en el espacio bidimensional C . La matriz transpuesta es u til en la discusi on de las propiedades de simetr a. Si , A=A la matriz es llamada sim etrica, mientras que si , A = A aij = aji , (2.90) aij = aji , (2.89)

es llamada antisim etrica. Los elementos de la diagonal son nulos. Es f acil mostrar que cualquier matriz cuadrada puede ser escrita como la suma de una matriz sim etrica y una antisim etrica. Consideremos la identidad A= 1 + 1 AA . A+A 2 2 (2.91)

es claramente sim es claramente antisim A+A etrica, mientras que A A etrica. Esta es la an aloga matricial a la ecuaci on tensorial (1.68).

2.3. MATRICES ORTOGONALES.

61

r y y

r 1= A r x

Figura 2.4: Vector jo con coordenadas rotadas.

Hasta ahora hemos interpretado las matrices ortogonales como rotaciones del sistema de coordenadas. Estas cambian las componentes de un vector jo. Sin embargo, una matriz ortogonal A puede ser interpretada igualmente bien como una rotaci on del vector en la direcci on opuesta (gura 2.4). Estas dos posibilidades, (1) rotar el vector manteniendo la base ja y (2) rotar la base (en el sentido opuesto) manteniendo el vector jo. Supongamos que interpretamos la matriz A como rotar un vector r en una nueva posici on r1 , i.e., en un particular sistema de coordenadas tenemos la relaci on r1 = Ar . (2.92)

Ahora rotemos las coordenadas aplicando una matriz B, la cual rota (x, y, z ) en (x , y , z ), r 1 = Br1 = BAr = (Ar) = BA(B1 B)r = (BAB1 )Br = (BAB1 )r .

(2.93)

Br1 es justo r1 en el nuevo sistema de coordenadas con una interpretaci on similar se mantine para Br. Ya que en este nuevo sistema (Br) es rotado a la posici on (Br1 ) por la matriz BAB1 . Br1 = (BAB1 ) Br r1 = A r . En el nuevo sistema las coordenadas han sido rotadas por la matriz B, A tiene la forma A , en la cual A = BAB1 . A opera en el espacio x , y , z como A opera en el espacio x, y , z . (2.94)

62

CAP ITULO 2. DETERMINANTES Y MATRICES.

La transformaci on denida por la ecuaci on (2.94) con B cualquier matriz, no necesariamente ortogonal, es conocida como trasformaci on de similaridad. Por componentes la ecuaci on (2.94) llega a ser aij =
k,l

bik akl (B1 )lj .

(2.95)

Ahora si B es ortogonal, )lj = bjl , (B1 )lj = (B y tenemos aij =


k,l

(2.96)

bik bjl akl .

(2.97)

La matriz A es la representaci on de un mapeo lineal en un sistema de coordenadas dado o base. Pero hay direcciones asociadas con A, ejes cristalinos, ejes de simetr a en un s olido rotando y etc. tal que la representaci on depende de la base. La transformaci on de similaridad muestran justo como la representaci on cambia con un cambio de base.

2.4

Matrices Herm ticas, matrices unitarias.

Deniciones. Hasta aqu hemos generalmente supuesto que nuestro espacio vectorial es un espacio real y que los elementos de las matrices (la representaci on de los operadores lineales) son reales. Para muchos c alculos en F sica Cl asica los elementos de matriz reales ser an sucientes. Sin embargo, en Mec anica Cu antica las variables complejas son inevitables por la forma de las reglas de conmutaci on b asicas (o la ecuaci on tiempo dependiente de Sch odinger). Con esto en mente, generalizamos al caso de matrices con elementos complejos. Para manejar estos elementos, denamos algunas propiedades. 1. Compleja conjugada, A , formada por tomar los complejos conjugados (i i) de cada elemento, donde i = 1. 2. Adjunta, A , formada por transponer A , . A = A = A 3. Matriz herm tica: La matriz es etiquetada como herm tica (o autoadjunta) si A = A . (2.99)

(2.98)

, y las matrices herm Si A es real, entonces A = A ticas reales son matrices reales y sim etricas. En Mec anica Cu antica las matrices son herm ticas o unitarias.

2.4. MATRICES HERM ITICAS, MATRICES UNITARIAS. 4. Matriz unitaria: La matriz U es etiquetada como unitaria si U = U1 .

63

(2.100)

, tal que las matrices reales unitarias son matrices Si U es real, entonces U1 = U ortogonales. Este representa una generalizaci on del concepto de matriz ortogonal. 5. (AB) = B A , (AB) = B A . Si los elementos son complejos, a la F sica casi siempre le interesan las matrices adjuntas, herm ticas y unitarias. Las matrices unitarias son especialmente importantes en Mec anica Cu antica porque ellos dejan el largo de un vector (complejo) inalterado, an aloga a la operaci on de una matriz ortogonal sobre un vector real. Una importante excepci on a este inter es en las matrices unitarias es el grupo de matrices de Lorentz. En un espacio n-dimensional complejo el cuadrado del largo de un punto x = (x1 , x2 , . . . , xn ), 2 o el cuadrado de su distancia al origen, es denido como x x = i x x = i i i | xi | . Si una trasformaci on de coordenadas y = Ux deja la distancia inalterada, entonces x x = y y = (Ux) Ux = x U Ux. Ya que x es arbitrario concluimos que U U = 1n , i.e., U es una matriz unitaria de n n. Si x = Ax es un mapa lineal, entonces su matriz en las nuevas coordenadas llega a ser una transformaci on unitaria (an alogo de una de similaridad) A = UAU , porque Ux = y = UAx = UAU1 y = UAU y . Matrices de Pauli y de Dirac. El conjunto de tres matrices de Pauli de 2 2 , 1 = 0 1 1 0 , 2 = 0 i i 0 , 3 = 1 0 0 1
1 2

(2.101)

fueron introducidas por W. Pauli para describir una part cula de spin no relativista. Se puede demostrar que las satisfacen i j + j i = 2ij 12 , i j = ik , (i )2 = 12 ,

en Mec anica Cu antica (2.102) (2.103) (2.104)

anticonmutaci on permutaci on c clica de los ndices

donde 12 es la matriz unidad de 2 2. As , el vector /2 satisface las mismas reglas de conmutaci on [i , j ] i j j i = 2iijk k , (2.105)

que el momento angular L. Las tres matrices de Pauli y la matriz unitaria forman un conjunto completo tal que cualquier matriz de 2 2 M puede ser expandida como M = m0 1 + m1 1 + m2 2 + m3 3 = m0 1 + m , (2.106)

64

CAP ITULO 2. DETERMINANTES Y MATRICES.

2 donde los mi son constantes. Usando i = 1 y tr(i ) = 0 nosotros obtenemos a partir de la ecuaci on (2.106) los coecientes mi de la expansi on formando las trazas,

2m0 = tr(M) ,

2mi = tr(M i ) ,

i = 1, 2, 3 .

(2.107)

En 1927 P.A.M. Dirac extendi o este formalismo para part culas de spin 1 movi endose a 2 velocidades cercana a la de la luz tales como electrones Para inclu r la relatividad especial su punto de partida es la ecuaci on de Einstein para la energ a E 2 = p 2 c2 + m2 c4 en vez de la energ a cin etica y potencial no relativista E = p 2 /2m + V . La clave para la ecuaci on de Dirac es factorizar E 2 p 2 c2 = E 2 (c p)2 = (E c p)(E + c p) = m2 c4 , usando la identidad matricial en 2 2 (c p)2 = p 2 12 . (2.109) (2.108)

La matriz unidad de 2 2 12 no es escrita expl citamente en la ecuaci on (2.108) y (2.109). 2 2 2 Podemos presentar las matrices 0 y para factorizar E p c directamente,
2 2 (0 E c p)2 = 0 E + 2 c2 ( p)2 Ec p(0 + 0 ) = E 2 p 2 c2 = m2 c4 . (2.110)

Si reconocemos 0 E c p = p = (0 , ) (E, cp) , (2.111)

como el producto escalar de dos cuadrivectores y p , entonces la ecuaci on (2.110) con 2 2 2 2 p = p p = E p c puede ser visto como una generalizaci on cuadrivectorial de la ecuaci on (2.109). Claramente, para que la ecuaci on (2.110) mantenega las condiciones
2 0 = 1 = 2 ,

0 + 0 = 0 ,

(2.112)

debe satisfacerse que las cuatro matrices anticonmuten, justo como las tres matrices de Pauli. Ya que estas u ltimas son un conjunto completo de matrices anticonmutantes de 2 2, la condici on (2.112) no puede ser satisfacerse para matrices de 2 2, pero ella puede ser satisfecha para matrices de 4 4 1 0 0 0 0 1 0 0 12 0 0 = 0 = 0 0 1 0 = 0 12 , 0 0 0 1 (2.113) 0 0 0 1 0 0 1 0 0 12 = 0 1 0 0 = 12 0 . 1 0 0 0 Alternativamente, el vector de matrices de 4 4 = 0 0 = = 1 , (2.114)

DE MATRICES. 2.5. DIAGONALIZACION

65

puede obtenerse como el producto directo en el mismo sentido de la secci on 2.2 de las matrices de 2 2 de Pauli. De la misma manera, 0 = 3 12 y 14 = 12 12 . Resumiendo el tratamiento no relativista de una part cula de spin 1 , produce matrices de 2 1 4 4, mientras que las part culas no relativistas de spin 2 son descritas por las matrices de Pauli de 2 2.

2.5

Diagonalizaci on de matrices.

Momento de la matriz de inercia . En muchos problemas en F sica que involucran matrices reales sim etricas o complejas herm ticas es deseable llevar a cabo una real transformaci on de similaridad ortogonal o una transformaci on unitaria (correspondiente a una rotaci on del sistema de coordenadas) para reducir la matriz a una forma diagonal, con todos los elementos no diagonales nulos. Un ejemplo particularmente directo de esto es la matriz del momento de inercia I de un cuerpo r gido. A partir de la dinici on del momento angular L tenemos L = I , (2.115)

donde viene a ser la velocidad angular. La matriz de inercia I tiene elementos diagonales Ixx =
i 2 mi (ri x2 sucesivamante, i ) , y as

(2.116)

el sub ndice i referencia la masa mi localizada en ri = (xi , yi , zi ). Para las componentes no diagonales tenemos Ixy =
i

mi xi yi = Iyx .

(2.117)

Por inspecci on la matriz I es sim etrica. Tambi en, ya que I aparece en una ecuaci on f sica de la forma (2.115), la cual se mantiene para todas las orientaciones del sistema de coordenadas, esta puede ser considerada un tensor (regla del cuociente). La clave ahora es la orientaci on de los ejes (a lo largo de un cuerpo jo) tal que Ixy y los otros elementos no diagonales desaparezcan. Como una consecuencia de esta orientaci on y una indicaci on de ella, si la velocidad angular est a a lo largo de tales realineados ejes, la velocidad angular y el momento angular ser an paralelos. Autovectores y autovalores (eigenvector y eigenvalues). Es quiz as instructivo considerar un cuadro geom etrico asociado a este problema. Si la matriz de inercia I es multiplicada a cada lado por un vector unitario cuya direcci on es variable, n = (, , ), entonces en notaci on de Dirac n |I|n =I , (2.118)

66

CAP ITULO 2. DETERMINANTES Y MATRICES.

donde I es el momento de inercia respecto a la direcci on n y es un n umero positivo (escalar). Llevando a cabo la multiplicaci on, obtenemos I = Ixx 2 + Iyy 2 + Izz 2 + 2Ixy + 2Ixz + 2Iyz . Si introducimos n n = = (n 1 , n2 , n3 ) , I la cual es variable en direcci on y magnitud entonces la ecuaci on (2.119) llega a ser
2 2 1 = Ixx n2 1 + Iyy n2 + Izz n3 + 2Ixy n1 n2 + 2Ixz n1 n3 + 2Iyz n2 n3 ,

(2.119)

(2.120)

(2.121)

una forma cuadr atica positiva la cual debe ser un elipsoide (ver gura 2.5).
n 3 n3

n 1 n1 n 2

n2

Figura 2.5: Elipsoide del momento de inercia. A partir de la geometr a anal tica es sabido que los ejes de coordenadas pueden ser rotados para coincidir con los ejes de nuestro elipsoide. En muchos casos elementales, espacialmente cuando hay simetr a, estos nuevos ejes, llamados ejes principales, pueden ser encontrados por inspecci on. Ahora nosotros procederemos a desarrollar un m etodo general de hallazgo de los elementos diagonales y los ejes principales. es la correspondiente matriz ortogonal real tal que n = Rn, o |n = R|n en Si R1 = R la notaci on de Dirac, son las nuevas coordenadas, luego obtenemos usando n |R = n| en la ecuaci on (2.121) |n = I n 2 + I n 2 + I n 2 , n|I|n = n |RIR 1 1 2 2 3 3 (2.122)

donde los Ii > 0 son los momentos de inercia principales. La matriz de inercia I en la ecuaci on (2.122) es diagonal en las nuevas coordenadas, I1 0 0 = 0 I2 0 . I = R1R (2.123) 0 0 I3

DE MATRICES. 2.5. DIAGONALIZACION Si reescribimos la ecuaci on (2.123) usando R1 = R = IR , RI

67

(2.124)

= (v1 , v2 , v3 ) compuesto de tres vectores columnas, entonces la ecuaci y tomando R on (2.124) se separa en tres ecuaciones de autovalores Ivi = Ii vi , i = 1, 2, 3 , (2.125)

con autovalores Ii y autovectores vi . Como estas ecuaciones son lineales y homog eneas (para un i jo), por la secci on 2.1 los determinantes tienen que anularse: I11 I1 I12 I13 I21 I22 I2 I23 =0. I31 I32 I33 I3

(2.126)

Reemplazando los autovalores Ii por una variable veces la matriz unidad 1, podriamos reescribir la ecuaci on (2.125) como (I 1)|v = 0 , cuyo determinante |I 1| = 0 , (2.128) (2.127)

es un polinomio c ubico en ; sus tres raices, por supuesto, son los Ii . Sustituyendo una ra z de regreso en la ecuaci on (2.125), podemos encontrar los correspondientes autovectores. La ecuaci on (2.126) (o la (2.128)) es conocida como la ecuaci on secular. El mismo tratamiento se aplica a una matriz sim etrica real I, excepto que sus autovalores no necesitan ser todos positivos. Tambi en, la condici on de ortogonalidad en la ecuaci on (2.83a-2.83d) para R dice que, en t erminos geom etricos, los autovectores vi son vectores mutuamente ortogonales unitarios. Por cierto ellos forman las nuevas coordenadas del sistema. El hecho que cualquier par de autovectores vi , vj son ortogonales si Ii = Ij se deduce de la ecuaci on (2.125) en conjunci on con la simetr a de I multiplicando con vi y vj , respectivamente, vj |I|vi = Ii vj |vi = vi |I|vj = Ij vj |vi . (2.129)

Ya que Ii = Ij y la ecuaci on (2.129) implica que (Ii Ij ) vi vj = 0, por lo tanto vi vj = 0. Matrices herm ticas. Para espacios vectoriales complejos las matrices unitarias y herm ticas juegan el mismo rol como las matrices ortogonales y sim etricas sobre los espacios vectoriales reales, respectivamente. Primero, generalicemos el importante teorema acerca de los elementos diagonales y los ejes principales para la ecuaci on de autovalores A|r = |r . (2.130)

68

CAP ITULO 2. DETERMINANTES Y MATRICES.

Ahora mostramos que si A es una matriz herm tica, sus autovalores son reales y sus autovectores ortogonales. Sean i y j dos autovalores y |ri y |rj , los correspondientes autovectores de A, una matriz herm tica. Entonces A|ri A|rj La ecuaci on (2.131) es multilicada por |rj rj |A|ri = i rj |ri . La ecuaci on (2.132) es multiplicada por |ri para dar ri |A|rj = j ri |rj . Tomando la adjunta conjugada de esta ecuaci on, tenemos rj |A |ri = j rj |ri o rj |A|ri = j rj |ri , (2.136) (2.135) (2.134) (2.133) = i |ri = j |rj . (2.131) (2.132)

ya que A es herm tica. Sustrayendo la ecuaci on (2.136) de la ecuaci on (2.133), obtenemos (i j ) rj |ri . (2.137)

Este es un resultado general para todas las combinaciones posibles de i y j . Primero, sea j = i. Luego la ecuaci on (2.137) se convierte en (i i ) ri |ri = 0 . Ya que ri |ri = 0 ser a una soluci on trivial de la ecuaci on (2.138), concluimos que i = i , es decir, i es real, para todo i. Segundo, para i = j y i = j , (i j ) ri |rj = 0 o ri |rj = 0 (2.141) (2.140) (2.139) (2.138)

lo cual signica que los autovectores de distintos autovalores son ortogonales, la ecuaci on (2.141) siendo la generalizaci on de ortogonalidad en este espacio complejo. Si i = j (caso degenerado), ri | no es autom aticamente ortogonal a |rj , pero podr a hacerse ortogonal. Consideremos el problema f sico de la matriz del momento de inercia

DE MATRICES. 2.5. DIAGONALIZACION

69

nuevamente. Si xi es un eje de simetr a rotacional, entonces encontraremos que 2 = 3 . Los autovectores |r2 y |r3 son cada uno perpendiculares al eje de simetr a, |r1 , pero ellos yacen en alguna parte en el plano perpendicular a |r1 ; esto es, alguna combinaci on lineal de |r2 y |r3 es tambi en un autovector. Considere (a2 |r2 + a3 |r3 ) con a2 y a3 constantes. Entonces A(a2 |r2 + a3 |r3 ) = a2 2 |r2 + a3 3 |r3 = 2 (a2 |r2 + a3 |r3 ) , (2.142)

como es esperado, para x1 un eje de simetr a rotacional. Por lo tanto, si |r1 y |r2 son jos, |r3 , puede simplemente escogerse yaciendo en el plano perpendicular a |r1 y tambi en perpendicular a |r2 . Un m etodo general para ortogonalizar soluciones conocido como proceso de Gram-Schmidt, es aplicado a funciones m as adelante. El conjunto de n autovectores ortogonales de nuestra matriz herm tica de n n forma un conjunto completo, generando el espacio de n dimensiones complejo. Este hecho es u til en un c alculo variacional de los autovalores. Los autovalores y los autovectores no est an limitados a las matrices herm ticas. Todas las matrices tienen autovalores y autovectores. Por ejemplo, la matriz T de poblaci on estoc astica satisface una ecuaci on de autovalores TPequilibrio = Pequilibrio , con = 1. Sin embargo, solamente las matrices herm ticas tienen todos los autovectores ortogonales y todos sus autovalores reales. Matrices antiherm ticas. Ocasionalmente, en Mec anica Cu antica encontramos matrices antiherm ticas: A = A . Siguiendo el an alisis de la primera porci on de esta secci on, podemos mostrar que a. Los autovalores son imaginarios puros (o cero). b. Los autovectores correspondientes a autovalores distintos son ortogonales. La matriz R formada de los autovectores normalizados es unitaria. Esta propiedad antiherm tica es preservada bajo transformaciones unitarias. Ejemplo: Autovalores y autovectores de una Sea 0 A= 1 0 La ecuaci on secular es 1 0 1 0 = 0 , 0 0 (2.144) matriz real sim etrica. 1 0 0 0 . 0 0

(2.143)

70 o

CAP ITULO 2. DETERMINANTES Y MATRICES.

(2 1) = 0 ,

(2.145)

expandi endolo por las menores. Las raices son = 1, 0, 1. Para encontrar el autovector correspondiente a = 1, sustituimos este valor de vuelta en la ecuaci on de autovalores, ecuaci on (2.130), 1 0 x 0 1 0 y = 0 . (2.146) 0 0 z 0 Con = 1, esto produce x+y =0 , z=0. (2.147)

Dentro de un factor de escala arbitrario, y un signo arbitrario (factor de fase), r1 | = (1, 1, 0). Notemos que (para el real |r en el espacio ordinario) el autovector dene una l nea en el espacio. El sentido positivo o negativo no est a determinado. Esta indeterminaci on puede ser entendida si notamos que la ecuaci on (2.130) es homog enea en |r . Por conveniencia requeriremos que los autovectores est en normalizados a la unidad, r1 |r1 = 1. Con esta elecci on de signo r1 | = r 1 = 1 1 , , 0 2 2 , (2.148)

est a jo. Para = 0, la ecuaci on (2.130) produce y=0, x=0, (2.149)

r2 | o r2 = (0, 0, 1) es un autovector aceptable. Finalmente, para = 1, tenemos x + y = 0 , o r3 | = r 3 = 1 1 , ,0 2 2 . (2.151) z=0, (2.150)

La ortogonalidad de r1 , r2 y r3 , correspondientes a los tres autovalores distintos, puede ser f acilmente vericada. Ejemplo: Autovalores degenerados. Consideremos 1 0 0 A = 0 0 1 . 0 1 0 (2.152)

DE MATRICES. 2.5. DIAGONALIZACION La ecuaci on secular es 1 0 0 0 1 = 0 , 0 1 o (1 )(2 1) = 0 , = 1, 1, 1 ,

71

(2.153)

(2.154)

un caso degenerado. Si = 1, la ecuaci on de autovalores (2.130) produce 2x = 0 , Un autovector normalizado adecuado es r1 | = r1 = para = 1, tenemos y + z = 0 . (2.157) 1 1 0, , 2 2 . (2.156) y+z =0 . (2.155)

Cualquier autovector que satisface la ecuaci on (2.157) es perpendicular a r1 . Tenemos innito n umero de opciones. Tomemos una elecci on posible tomando r2 | = r 2 = 1 1 0, , 2 2 , (2.158)

la cual claramente satisface la ecuaci on (2.157). Entonces r3 debe ser perpendicular a r1 y puede ser escogido perpendicular a r2 por7 r3 = r1 r2 = (1, 0, 0) . Funciones de matrices. Polinomios con uno o m as argumentos matriciales est an bien denidos y ocurren a menudo. Series de potencias de una matriz tambi en pueden estar denidas para dar la convergencia de la serie para cada uno de los elementos de matriz. Por ejemplo, si A es cualquiera matriz de n n entonces la serie de potencia

(2.159)

exp(A) =
i=0

Ai , i! (1)i A2i+1 , (2i + 1)! A2i , (2i)!

(2.160a) (2.160b) (2.160c)

sen(A) =
i=0

cos(A) =
i=0
7

(1)i

El uso del producto cruz es limitado a tres dimensiones.

72

CAP ITULO 2. DETERMINANTES Y MATRICES.

son matrices de n n bien denidas. Para todas las matrices de Pauli k la identidad de Euler para real y k =1, 2 o 3 exp(ik ) = 12 cos() + ik sen() , (2.161)

2 sale a partir de colectar las potencias pares e impares en series separadas usando k = 1. ij ij 2 Para las matrices de Dirac de 4 4 con ( ) = 1, si j = k = 1, 2 o 3, obtenemos de manera similar (sin escribir las obvias matrices 14 nunca m as)

exp(i jk ) = cos() + i jk sen() , mientras exp(i 0k ) = cosh( ) + i 0k senh( ) ,

(2.162)

(2.163)

manteniendo real porque (i 0k )2 = 1 para k = 1, 2 o 3. Para una matriz herm tica A hay una matriz unitaria U que la diagonaliza, es decir, UAU = [a1 , a2 , . . . , an ]. Entonces la f ormula de la traza det(exp(A)) = exp(tr(A)) Puede ser f acilmente demostrado. Otra importante relaci on es la de f ormula de Baker-Hausdor exp(iG)H exp(iG) = H + [iG, H] + [iG, [iG, H]] + 2! (2.165) (2.164)

lo cual resulta de multiplicar las serie de potencia para exp(iG) y recolectar los t erminos de la misma potencia en iG. Aqu denimos [G, H] = GH HG como el conmutador de G con H.

2.6

Matrices normales.

En la secci on 2.5 nos concentramos principalmente en matrices herm ticas o reales sim etricas y en el proceso de encontrar autovalores y autovectores. En esta secci on generalizaremos a matrices normales con matrices herm tica y unitario como casos especiales. Consideramos los casos f sicamente importantes como el problema de los modos de vibraciones y el problema num erico importante de matrices patol ogicas. Una matriz normal es una matriz que conmuta con su adjunta, [A, A ] = 0 . Ejemplos obvios e importante son las matrices herm ticas y unitarias. Mostraremos que las matrices normales tienen autovectores (ver tabla 2.1)

2.6. MATRICES NORMALES. Autovectores Matriz Autovalores (para diferentes autovalores) Herm tica Real Ortogonal Antiherm tica Imaginaria puro (o cero) Ortogonal Unitaria Magnitud uno Ortogonal Normal Si A tiene autovalor Ortogonal A tiene autovalor A y A tienen los mismos autovectores Tabla 2.1: I. Sea |x un autovector de A con correspondiente autovalor . Entonces A|x = |x o (A 1)|x = 0 .

73

(2.166)

(2.167)

Por conveniencia la combinaci on A 1 la etiquetamos B. Tomando la adjunta de la ecuaci on (2.167), obtenemos x|(A 1) = 0 = x|B . Porque [(A 1), (A 1) ] = [A, A ] = 0 , tenemos [B, B ] = 0 . La matriz B es tambi en normal. A partir de las ecuaciones (2.167) y (2.168) formamos x|B B|x = 0 . Usando (2.169) x|BB |x = 0 . Ahora la ecuaci on (2.171) puede ser rescrita como (B |x ) (B |x ) = 0 . Asi B |x = (A 1)|x = 0 . (2.173) (2.172) (2.171) (2.170) (2.169) (2.168)

74

CAP ITULO 2. DETERMINANTES Y MATRICES.

Vemos que para matrices normales, A tiene los mismos autovectores que A pero los autovalores son los complejos conjugados. II. Ahora, consideremos m as que uno autovector-autovalor, tenemos A|xi = i |xi , A|xj = j |xj . Multiplicando la ecuaci on (2.175) por la izquierda por xi | produce xi |A|xj = j xi |xj . Operando sobre el lado izquierdo de la ecuaci on (2.176), obtenemos xi |A = (A |xi ) . (2.177) (2.176) (2.174) (2.175)

A partir de la ecuaci on (2.173) sabemos que A tiene los mismos autovectores que A pero con los complejos conjugados de los autovalores
(A |xi ) = ( i |xi ) = i xi | .

(2.178)

Sustituyendo en la ecuaci on (2.176) tenemos i xi |xj = j xi |xj o (i j ) xi |xj = 0 . Esta es la misma que la ecuaci on (2.140). Para i = j xi |xj = 0 . Los autovectores correspondientes a diferentes autovalores de una matriz normal son ortogonales. Esto signica que una matriz normal puede ser diagonalizada por una transformaci on unitaria. La matriz unitaria requerida puede ser construida a partir de los vectores ortonormales como se mostr o en la secci on anterior. El converso tambi en es v alido. Si A puede ser diagonalizada por una transformaci on unitaria, entonces A es normal. Modos normales de vibraci on. Consideremos las vibraciones de un modelo cl asico de la molecula de CO2 Esta es una ilustraci on de la aplicaci on de las t ecnicas matriciales a un problema que no parte como un problema de matrices. Tambi en provee un ejemplo de autovalores y autovectores de una matriz real asim etrica. Ejemplo: Modos Normales. (2.180) (2.179)

2.6. MATRICES NORMALES.

75

k M m

k M

x1

x2

x3

Figura 2.6: Vector jo con coordenadas rotada.

Consideremos tres masas sobre el eje x unidas por resortes como muestra la gura 2.6. Las fuerzas de los resortes se suponen lineales (para peque nos desplazamientos, ley de Hooke) y las masas se restringen a mantenerse sobre el eje x. Usando una coordenada diferente para cada masa la segunda ley de Newton produce el conjunto de ecuaciones k (x1 x2 ) M k k (2.181) x 2 = (x2 x1 ) (x2 x3 ) M m k x 3 = (x3 x2 ) . M El sistema de masa est a vibrando. Buscamos las frecuencias comunes, tal que todas las masas vibren en esta misma frecuencia. Estos son los modos normales. Sea x 1 = xi = xi0 eit , i = 1, 2, 3.

Subtituyendo en la ecuacion (2.181), podemos escribir este conjunto como k x x1 k 1 0 M M 2k k k = 2 x 2 , x 2 m m m k k 0 x3 x3 M M

(2.182)

dividiendo por el factor com un eit . Tenemos una ecuaci on matricial de autovalores con la matriz asim etrica. La ecuaci on secular es k k 2 0 M M k 2k k =0. (2.183) 2 m m m k k 2 0 M M

76 Esto conduce a 2 Los autovalores son 2 = 0 ,

CAP ITULO 2. DETERMINANTES Y MATRICES.

k 2 M

2k k m M

=0

k , M

k 2k + , M m

todas reales. Los correspondientes autovectores son determinados sustituyendo los autovalores de regreso en la ecuaci on (2.182) un autovalor a la vez. Para 2 = 0, ecuaci on (2.182) produce x1 x2 = 0 x1 + 2x2 x3 = 0 x2 + x3 = 0 . Entonces, tenemos x1 = x2 = x3 . Esto describe una translaci on pura sin movimiento relativo de las masas y sin vibraci on. k , la ecuaci on (2.182) produce Para 2 = M x1 = x3 , x2 = 0 . (2.184)

Las masas exteriores se mueven en direcciones opuestas. El masa del centro est a estacionaria. k 2 k Para 2 = + , las componentes de los autovectores son M M x1 = x3 , x2 = 2M x1 . m

Las dos masas exteriores se est an moviendo juntas. La masa del centro se est a moviendo opuesta a las otras dos. El momentum neto es cero. Cualquier desplazamiento de estas tres masas a lo largo del eje x puede ser descrito como una combinaci on lineal de estos tres tipos de movimiento: translaci on m as dos formas de vibraci on. Sistemas con condiciones patol ogicas. Un sistema lineal de ecuaciones puede ser escrito como A|x = |y o A1 |y = |x , (2.185)

con A y |y conocido y |x desconocido. Podemos encontrar ejemplos en los cuales un peque no error en |y resulta en un gran error en |x . En este caso la matriz A es llamada de condici on

2.6. MATRICES NORMALES.

77

patol ogica. Si |x es el error en |x y |y es el error en |y , entonces los errores relativos pueden ser escritos como x|x x|x
1/2

K (A)

y |y y |y

1/2

(2.186)

Aqu K (A), una propiedad de la matriz A, es etiquetado la condici on de n umero. Para A herm tica una forma de la condici on de n umero es dada por K (A) = Una forma aproximada debido a Turing es
1 K (A) = n[Aij ]max [A ij ]max ,

| |max . | |min

(2.187)

(2.188)

en la cual n es el orden de la matriz y [Aij ]max es el m aximo elemento en A. Ejemplo: Una matriz patol ogica. Un ejemplo com un de una matriz con condici on patol ogica es la matriz de Hilbert, la 1 matriz de Hilbert de orden 4 es Hij = (i + j 1) , 1 1 1 1 2 3 4 1 1 1 1 H4 = 2 3 4 5 . (2.189) 1 1 1 1 3 4 5 6 1 1 1 1 4 5 6 7 Los elementos de la matriz inversa (orden n) son dados por
1 (H n )ij =

(1)i+j (n + i 1)!(n + j 1)! . i + j 1 [(i 1)!(j 1)!]2 (n i)!(n j )!

(2.190)

Para n = 4
1 H 4

16 120 240 140 120 1200 2700 1680 . = 240 2700 6480 4200 140 1680 4200 2800

(2.191)

A partir de la ecuaci on (2.188) la estimaci on de Turing de la condici on de n umero para H4 llega a ser KTuring = 4 1 6480 2.59 104 . Esto es una advertencia de que un error en la entrada puede ser multiplicado por 26000 en el c alculo del resultado de salida. Esto sentencia que H4 tiene condici on patol ogica. Si usted encuentra un sistema altamente patol ogico tiene un par de alternativas (adem as de abandonar el problema).

78

CAP ITULO 2. DETERMINANTES Y MATRICES.

a. Tratar un ataque matem atico diferente. b. Hacer arreglos para llevar m as cifras signicativas y a costa de fuerza bruta empujar de principio a n.

Cap tulo 3 Teor a de grupo.


versi on nal 1.2-0905021

Disciplined judgment about what is neat and simmetrical and elegant has time and time again proved an excellent guide to how nature work. Murray Gell-Mann

3.1

Introducci on.

En mec anica cl asica la simetr a de un sistema f sico conduce a una ley de conservaci on. La conservaci on del momentum angular es una consecuencia directa de la simetr a rotacional, lo cual signica invariancia bajo rotaciones espaciales. A principios del siglo pasado, Wigner y otros comprendieron que la invariancia era el concepto clave en el entendimiento de los nuevos fen omenos y en el desarrollo de teor as apropiadas. As , en mec anica cu antica los conceptos de momento angular y spin han llegado a ser a un m as centrales. Sus generalizaciones, el isospin en f sica nuclear y la simetr a de sabor en f sica de part culas, son herramientas indispensables en la construcci on te orica y en sus soluciones. Las generalizaciones del concepto de invariacia de gauge de la electrodin amica cl asica para la simetr a del isospin conduce a la teor a de gauge electrod ebil. En cada caso el conjunto de estas operaciones de simetr a forman un grupo. La teor a de grupo es la herramienta matem atica para tratar las invariancias y las simetr as. Ella trae consigo unicaci on y formalizaci on de principios tales como reexi on espacial, o paridad, momento angular, y geometr a que son ampliamente usados por los f sicos. En geometr a el rol fundamental de la teor a de grupo fue reconocido hace mucho tiempo por los matem aticos. En geometr a euclideana la distancia entre dos puntos, el producto escalar de dos vectores o m etrica, no cambia bajo rotaciones o translaciones. Estas simetr as son caracter sticas de esta geometr a. En relatividad especial la m etrica, o producto escalar de cuadrivectores, diere del de la geometr a euclideana en que ya no es m as positivo denido y es invariante ante transformaciones de Lorentz.
Este cap tulo est a basado en el cuarto cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
1

79

80

CAP ITULO 3. TEOR IA DE GRUPO.

Para un cristal el grupo de simetr a contiene s olo un n umero nito de rotaciones en valores discretos del angulo y reexiones. La teor a de tales grupos discretos o nitos, desarrollada inicialmente como una rama de las matem aticas pura, ahora es una u til herramienta para el desarrollo de la cristalograf a y la f sica de la materia condensada. Haremos una breve introducci on a ellos. Cuando las rotaciones dependen de un angulo continuo el grupo de rotaciones tiene un n umero innito de elementos. Estudiaremos tales grupos continuos o de Lie. Denici on de grupo. Un grupo G puede ser denido como un conjunto de objetos u operaciones, llamados los elementos de G, que pueden ser combinados o multiplicados para formar un producto bien denido en G el cual satisface las siguientes cuatro condiciones. 1. Si a y b son cualquier par de elementos de G, entonces el producto ab es tambi en elemento de G; o (a, b) ab mapea G G sobre G. 2. Esta multiplicaci on es asociativa, (ab)c = a(bc). 3. Hay un elemento unidad o neutro I en G tal que Ia = aI = a para cada elemento a de G.2 4. Debe haber un inverso o reciproco de cada elemento a de G, etiquetado a1 , tal que aa1 = a1 a = I . Un ejemplo para un grupo es el conjunto de rotaciones de coordenadas en el sentido del puntero del reloj, R() = cos sen sen cos (3.1)

en un angulo del sistema de coordenadas xy a una nueva orientaci on. El producto de dos rotaciones R(1 )R(2 ) es denida como una rotaci on primero en un angulo 2 y entonces en un angulo 1 . De acuerdo a la ecuaci on (2.29), esto corresponde al producto de las dos matrices ortogonales de 2 2 cos 1 sen 1 sen 1 cos 1 cos 2 sen 2 sen 2 cos 2 = cos(1 + 2 ) sen(1 + 2 ) sen(1 + 2 ) cos(1 + 2 ) , (3.2)

usando las f ormulas de adici on de funciones trigonom etricas. El producto es claramente una rotaci on representada por una matriz ortogonal con un angulo 1 + 2 . El producto es la multiplicaci on asociativa de matrices. Es conmutativo o abeliano porque el orden en el cual esta rotaciones son realizadas no importa. El inverso de la rotaci on con angulo es una con angulo . La unidad o neutro corresponde al angulo = 0. El nombre del grupo es SO(2), si el angulo var a continuamente desde 0 a 2 . Claramente, SO(2) tiene innitos elementos. La unidad con angulo = 0 y la rotaci on con = forman un subgrupo nito.
2

Tambi en etiquetan al elemento unidad como E .

3.1. INTRODUCCION.

81

Un subgrupo G de un grupo G consiste de elementos de G tal que el producto de cualquiera de sus elementos est a de nuevo en el subgrupo G , i.e., G es cerrado bajo la multiplicaci on de 1 G. Si gg g es un elemento de G para cualquier g de G y g de G , entonces G es llamado un subgrupo invariante de G. Las matrices ortogonales nn forman el grupo O(n), y tambi en SO(n) si sus determinantes i = O1 para i = 1 y 2, entonces el producto son +1 (S por eSpecial). Si O i 2O 1 = O1 O1 = (O1 O2 )1 O1 O2 = O 2 1 es tambi en una matriz ortogonal en SO(n). La inversa es la matriz (ortogonal) transpuesta. La unidad del grupo es 1n . Una matriz real ortogonal de n n tiene n(n 1)/2 par ametros independientes. Para n = 2 hay s olo un par ametro: un angulo en la ecuaci on (3.1). Para n = 3, hay tres par ametros independientes: los tres angulos de Euler de la secci on 2.3. De la misma manera, las matrices unitarias de n n forman el grupo U(n), y tambi en 1 SU(n) si sus determinantes son +1. Si Ui = Ui , entonces
1 1 1 (U1 U2 ) = U , 2 U1 = U2 U1 = (U1 U2 )

tal que el producto es unitario y un elemento de SU(n). Cada matriz unitaria tiene una inversa la cual es tambi en unitaria. Homomorsmo, isomorsmo. Puede haber una correspondencia entre los elementos de dos grupos (o entre dos representaciones), uno a uno, dos a uno, o muchos a uno. Si esta correspondencia preserva la multiplicaci on del grupo, diremos que los dos grupos son homom orcos. Una de las m as importantes correspondencias homom orcas entre el grupo de rotaciones SO(3) y el grupo de matrices unitarias SU(2) ser a desarrollado en la pr oxima secci on. Si la correspondencia es uno a uno, y a un preserva la multiplicaci on del grupo,3 entonces los grupos son isom orcos. Un ejemplo es las rotaciones de coordenadas a trav es de un angulo nito en el sentido horario respecto al eje z en el espacio tridimensional descrito por cos sen 0 (3.3) Rz () = sen cos 0 . 0 0 1 El grupo de rotaciones Rz es isom orco al grupo de rotaciones en la ecuaci on (3.1). Representaciones matriciales, reducibles e irreducibles. La representaci on de los elementos de un grupo por matrices es una t ecnica muy poderosa y ha sido casi universalmente adoptada por los f sicos. El uso de matrices no impone restricciones signicativas. Puede mostrarse que los elementos de cualquier grupo nito y de grupos
Supongamos que los elementos del primer grupo son etiquetados por gi y los elementos del segundo grupo por hi . Entonces gi hi en una correspondencia uno a uno para todos los valores de i. Si gi gj = gk y hi hj = hk , entonces gk y hk deben ser los elementos correspondientes del grupo.
3

82

CAP ITULO 3. TEOR IA DE GRUPO.

continuos pueden ser representados por matrices. Ejemplos son las rotaciones descritas en la ecuaci on (3.1) y (3.3). Para ilustrar como las representaciones matriciales surgen a partir de una simetr a, consideremos la ecuaci on estacionaria de Schr odinger (o alg un otra ecuaci on de autovalores tal como I vi = Ii vi para los momentos principales de inercia de un cuerpo r gido en mec anica cl asica) H = E . (3.4)

Supongamos que la ecuaci on (3.4) se mantiene invariante bajo la acci on de un grupo G de transformaciones R en G (rotaciones de coordenadas, por ejemplo, para un potencial central V (r) en el Hamiltoniano H ), i.e., HR = RH R1 = H . (3.5)

Ahora tomamos una soluci on de la ecuaci on (3.4) y la rotamos: R . Entonces R tiene la misma energ a E porque multiplicando la ecuaci on (3.4) por R y usando (3.5) produce RH = E (R ) = (RH R1 )R = H (R ) . (3.6)

En otras palabras, todas las soluciones rotadas R son degeneradas en energ a o forman lo que los f sicos llaman un multiplete. Supongamos que este espacio vectorial V de soluciones transformadas tiene una dimensi on nita n. Sean 1 , 2 , . . . , n una base. Ya que Rj es un miembro del multiplete, podemos expandirlo en t erminos de esta base Rj =
k

rjk k .

(3.7)

As , cada R en G puede ser asociado a una matriz (rjk ), y este mapeo R (rjk ) es llamada una representaci on de G. Si podemos tomar cualquier elemento de V y por rotaciones con todos los elementos de R de G transforman en todos los otros elementos de V entonces la representaci on es irreducible. Si todos los elementos de V no son alcanzados, entonces V se separa en una suma directa de dos o m as subespaci on vectoriales, V = V1 + V2 + . . . , los cuales son mapeados dentro de ellos mismos por rotaci on de sus elementos. En este caso la representaci on es llamada reducible. Entonces podemos encontrar una base en V (i.e., hay una matriz unitaria U) tal que r1 0 . . . U(rjk )U = 0 r2 . . . (3.8) . . .. . . . . . para todos los R de G y todas las matrices (rjk ). Aqui r1 , r2 , . . . , son matrices de menor dimensiones que (rjk ) que est an alineadas a lo largo de la diagonal y los 0 son matrices de ceros. podemos decir que R ha sido descompuestas en r1 + r2 + . . . en paralelo con V = V1 V2 . . . . Las representaciones irreducibles juegan un rol en teor a de grupo que es aproximadamente an alogo a los vectores unitarios en el an alisis vectorial. Ellas son las representaciones m as simples, toda otra puede ser construida desde ellas.

3.2. GENERADORES DE GRUPOS CONTINUOS.

83

3.2

Generadores de grupos continuos.

Un caracter stica de los grupos continuos conocidos como grupos de Lie es que los par ametros de un producto de elementos son funciones anal ticas de los par ametros de los factores. La naturaleza anal tica de las funciones nos permite desarrollar el concepto de generador y reduce el estudio del grupo completo a un estudio de los elementos del grupo en la vecindad del elemento identidad. La idea esencial de Lie fue el estudio de elementos R en un grupo G que esten innitesimalmente cercanos a la unidad de G. Consideremos el grupo SO(2) como un ejemplo simple. Las matrices de rotaci on de 2 2 en la ecuaci on (3.1) puede ser escrita en forma exponencial usando la identidad de Euler ecuaci on (2.161) como R() = cos sen sen cos = 12 cos + i2 sen = exp(i2 ) . (3.9)

A partir de la forma exponencial es obvio que la multiplicaci on de estas matrices es equivalente a la suma de los argumentos R(2 )R(1 ) = exp(i2 2 ) exp(i2 1 ) = exp(i2 (1 + 2 )) = R(1 + 2 ) . Por supuesto las rotaciones cercanas a 1 tienen un angulo peque no 0. Esto sugiere que busquemos una representaci on exponencial R = exp(iS) , 0, (3.10)

para elementos del grupos R G cercanos a la 1. Las transformaciones innitesimales S son llamadas los generadores de G. Ellos forman un espacio lineal cuya dimensi on es el orden de G porque la multiplicaci on de los elementos R del grupo se traduce en la suma de los generadores S. Si R no cambia el elemento de volumen, i.e., det(R) = 1, nosotros usamos la ecuaci on (2.164) para ver que det(R) = exp(tr(ln R)) = exp(itr(S)) = 1 implica que los generadores son de traza nula, tr(S) = 0 . (3.11)

Este es el caso para el grupo de rotaciones SO(n) y el grupo unitario SU(n), como veremos m as adelante. Si R de G en la ecuaci on (3.1) es unitario, entonces S = S es herm tica, lo cual tambi en es el caso para SO(n) y SU(n). Ya que hay un i extra en la ecuaci on (3.10). Expandamos los elementos del grupo 1 2 Ri = exp(ii Si ) = 1 + ii Si 2 S + ... , 2 i i 1 2 2 1 R i = exp(ii Si ) = 1 ii Si i Si + . . . , 2

(3.12)

84

CAP ITULO 3. TEOR IA DE GRUPO.

Rj

Ri Ri
1

Rj R ij
Figura 3.1: Ilustraci on de la ecuaci on (3.13).

a segundo orden en el peque no par ametro del grupo i porque los t erminos lineales y varios t erminos cuadr aticos se cancelan en el producto (gura 3.1)
1 1 R i Rj Ri Rj = 1 + i j [Sj , Si ] + . . . ,

= 1 + i j
k

ck ji Sk + . . . ,

(3.13)

cuando las ecuaciones (3.12) son sustituidas dentro de la ecuaci on (3.13). La u ltima l nea es debido a que el producto en la ecuaci on (3.13) es nuevamente un elemento, Rij cercano a la unidad en el grupo G. Por tanto su exponente debe ser una combinaci on lineal de los generadores Sk y sus par ametros innitesimales del grupo tienen que ser proporcionales al producto i j . Comparando ambas l neas (3.13) encontramos la relaci on de clausura de los generadores del grupo de Lie G, [Si , Sj ] =
k

ck ij Sk

(3.14)

Los coecientes ck ij son las constantes de estructura del grupo G. Ya que el conmutador en la ecuaci on (3.14) es antisim etrico en i y en j , tambi en lo son las constantes de estructura en los ndices inferiores,
k ck ij = cji .

(3.15)

Si el conmutador en la ecuaci on (3.14) es tomado como la regla de multiplicaci on de los generadores, vemos que el espacio vectorial de los generadores llega a ser un algebra, el algebra de Lie G del grupo G. Para SU(l + 1) el algebra de Lie es llamada Al , para SO(2l + 1) es Bl y para SO(2l) es Dl , donde l = 1, 2, . . . es un entero positivo, esto ser a llamado el rango de grupo de Lie G o de su algebra G. Finalmente, la identidad de Jacobi se satisface para los doblas conmutadores [[Si , Sj ], Sk ] + [[Sj , Sk ], Si ] + [[Sk , Si ], Sj ] = 0 , (3.16)

3.2. GENERADORES DE GRUPOS CONTINUOS.

85

lo cual es f acilmente vericable usando la denici on de conmutador. Cuando la ecuaci on (3.14) es substituida en (3.16) encontramos otra restricci on sobre las constantes de estructura,
m m cm ij [Sm , Sk ] + cjk [Sm , Si ] + cki [Sm , Sj ] = 0 . m

(3.17)

Usando de nuevo la ecuaci on (3.14) en la ecuaci on (3.17) implica que


n m n m n cm ij cmk Sn + cjk cmi Sn + cki cmj Sn = 0 , mn

(3.18)

donde el factor com un Sn (y la suma sobre n) pueden eliminarse por que los generadores son linealmente independientes. Por tanto
n m n m n cm ij cmk + cjk cmi + cki cmj = 0 . m

(3.19)

Las relaciones (3.14), (3.15) y (3.19) forman la base de las algebras de Lie desde la cual los elementos nitos del grupo de Lie cerca de su unidad puede ser reconstru do. 1 Volviendo a la ecuaci on (3.5), el inverso de R es exactamente R = exp(iS). expandimos HR de acuerdo a la f ormula de Baker-Haudor, ecuaci on (2.17), H = HR = exp(iS)H exp(iS) = H + i[S, H] 2 [S, [iS, H]] + . 2! (3.20)

Al simplicar H de la ecuaci on (3.20), dividiendo por y haciendo 0. Entonces la ecuaci on (3.20) implica que para cualquier rotaci on cercana a 1 en G el conmutador [S, H] = 0 . (3.21)

Si S y H son matrices herm ticas, la ecuaci on (3.21) dice que S y H pueden ser simultaneamente diagonalizados. Si S y H son operadores diferenciales como el Hamiltoniano y el momento angular orbital en mec anica cu antica, entoces la ecuaci on (3.21) dice que S y H tienen autofunciones en com un y que los autovalores degenerados de H pueden ser distinguidos por los autovalores de los generadores S. Esta es con mucho la m as importante aplicaci on de teor a de grupos a mec anica cu antica. A continuaci on, estudiaremos los grupos ortogonales y unitarios como ejemplos. Grupos de rotaciones SO(2) y SO(3). Para SO(2) denido por la ecuaci on (3.1) hay s olo un generador linealmente independiente, 2 y el orden de SO(2) es 1. Obtenemos 2 a partir de diferenciar la ecuaci on (3.9) y evaluarla en cero, i dR() d = i
=0

sen cos cos sen

= i
=0

0 1 1 0

= 2 .

(3.22)

86

CAP ITULO 3. TEOR IA DE GRUPO. por la ecuaci on (3.3), el generador es i 0 0 0 , 0 0

Para las rotaciones Rz () sobre el eje z descritas dado por 0 dR() = Sz = i i d =0 0

(3.23)

donde el factor extra i es insertado para hacer Sz herm tica. La rotaci on Rz () en un angulo innitesimal puede ser escrita como Rz () = 13 + iSz , (3.24)

Una expansi on de Maclaurin-Taylor de Rz cerca de la unidad = 0 con t erminos hasta 2 orden () y los superiores son despreciados. Una rotaci on nita puede ser compuesta por sucesivas rotaciones innitesimales Rz (1 + 2 ) = (13 + i1 Sz )(13 + i2 Sz ) . Sea = /N para N rotaciones, con N . Entonces, Rz () = lim 13 + i
N

(3.25)

Sz N

= exp(iSz ) .

(3.26)

Esta forma identica Sz como el generador del grupo Rz , un subgrupo abeliano de SO(3), el grupo de rotaciones en tres dimensiones con determinante +1. Cada matriz de 3 3 Rz () es ortogonal, por lo tanto unitaria, y la tr(Sz ) = 0 de acuerdo con la ecuaci on (3.11). Por diferenciaci on de las rotaciones de coordenadas 1 0 0 cos 0 sen cos sen , Ry () = 0 1 0 , Rx ( ) = 0 (3.27) 0 sen cos ) sen 0 cos obtenemos los generadores 0 0 0 Sx = 0 0 i , 0 i 0 0 0 i Sy = 0 0 0 , i 0 0 (3.28)

de Rx y Ry , los subgrupos de rotaciones en torno a los ejes x e y respectivamente. Rotaciones de funciones y momento angular orbital. En la discusi on precedente los elementos del grupos son matrices que rotan las coordenadas. Cualquier sistema f sico que esta siendo descrito se mantiene jo. Ahora mantengamos jas las coordenadas y rotemos una funci on (x, y, z ) relativa a nuestras coordenadas jas. Con R para rotar las coordenadas, x = Rx , (3.29)

3.2. GENERADORES DE GRUPOS CONTINUOS. denimos R por R (x, y, z ) = (x, y, z ) (x ) .

87

(3.30)

En palabras, la matriz R opera sobre la funci on , creando una nueva funci on que es num ericamente igual a (x ), donde x son las coordenadas rotadas por R. Si R rota las coordenadas en el sentido horario, el efecto de la matriz R es rotar el modelo de la funci on en el sentido horario. Volviendo a las ecuaciones (3.3) y (3.28), consideremos una rotaci on innitesimal, . Luego, usando Rz , ecuaci on (3.3), obtenemos Rz () (x, y, z ) = (x + y, y x, z ) . (3.31)

El lado derecho puede ser expandido como una serie de Taylor de primer orden en para dar Rz () (x, y, z ) = (x, y, z ) x y y x = (1 iLz ) (x, y, z ) , + O()2 (3.32)

la expresi on diferencial en el par entesis de llave es iLz . Ya que una rotaci on primero en y luego en alrededor del eje z est a dado por Rz ( + ) (x, y, z ) = Rz ()Rz () (x, y, z ) = (1 iLz )Rz () (x, y, z ) , tenemos (como una ecuaci on de operadores) Rz ( + ) Rz () = iLz Rz () . (3.34) (3.33)

El lado izquierdo es justo dRz ()/ (para 0). En esta forma la ecuaci on (3.34) se integra inmediatamente a Rz () = exp(iLz ) . (3.35)

Note cuidadosamente que Rz () rota funciones (en el sentido horario) relativa a las coordenadas jadas y que Lz es la componente z del momento angular orbital L. La constante de integraci on est a jada por la condici on de borde Rz (0) = 1. Si reconocemos que los elementos de matriz x (3.36) Lz = (x, y, z )Sz y , z claramente Lx , Ly , Lz satisface la misma relaci on de conmutaci on [Li , Lj ] = iijk Lk que Sx , Sy , Sz y tienen a la misma constantes de estructura iijk de SO(3). (3.37)

88 Homomorsmo SU(2)-SO(3).

CAP ITULO 3. TEOR IA DE GRUPO.

El grupo unitario especial SU(2) de matrices unitarias de 2 2 con determinante +1 tiene las tres matrices de Pauli i como generadores (mientras que las rotaciones del la ecuaci on (3.3) forman un subgrupo abeliano unidimensional). Por lo tanto SU(2) es de orden 3 y depende de tres par ametros continuos reales , y los cuales a menudo son llamados los par ametros de Caley-Klein. Sus elementos generales tienen la forma U2 (, , ) = ei cos ei sen ei sen ei cos = a b b a . (3.38)

Es f acil chequear que el determinante det(U2 ) = 1 y que U 2 U2 = 1 = U2 U2 se mantiene. Para obtener los generadores diferenciamos

U2

=
=0, =0

1 0 0 1 0 1 1 0

= 3 , = 1 , = 2 . (3.39)

i U2 sen i U2

=
=0

=
=0, =0

0 i i 0

Por supuesto, las matrices de Pauli son todas de traza nula y herm ticas. Con las matrices de Pauli como generadores de los elementos (U1 , U2 , U3 ) de SU(2) pueden ser generados por U1 = exp(ia1 1 /2) , U2 = exp(ia2 2 /2) , U3 = exp(ia3 3 /2) . (3.40)

Los tres par ametros ai son reales. El factor extra 1/2 est a presente en los exponentes ya que si = i /2 satisface las mismas relaciones de conmutaci on 4 [si , sj ] = iijk sk (3.41)

como el momento angular en la ecuaci on (3.37). La ecuaci on (3.3) da un operador de rotaci on para rotar las coordenadas cartesianas en el espacio tridimensional. Usando la matriz de momento angular s3 , tenemos el correspondiente operador de rotaci on en el espacio de dos dimensiones (complejo) Rz () = exp(i3 /2). Para rotar una funci on de onda vectorial de dos componentes (spinor) o una part cula de spin 1/2 relativa a coordenadas jas, el operador de rotaci on es Rz () = exp(i3 /2) de acuerdo a la ecuaci on (3.35). Usando la ecuaci on (3.40) la identidad de Euler, la ecuaci on (2.161), obtenemos Uj = cos
4

aj aj + ij sen 2 2

Las constantes de estructuras (iijk ) conducen a las representaciones de SU(2) de dimensi on 2J = 1 para generadores de dimensi on 2j + 1, con J = 0, 1/2, 1, . . . . Los casos con J entero tambi en conducen a las representaciones de SO(3).

3.2. GENERADORES DE GRUPOS CONTINUOS.

89

Aqu el par ametro aj aparece como un angulo, el coeciente de una matriz tipo momento angular en la ecuaci on (3.26). Con esta identicaci on de los exponenciales, la forma general de la matriz SU(2) (para rotar funciones m as que las coordenadas) podr a ser escrita como U(, , ) = exp(i3 /2) exp(i2 /2) exp(i1 /2) . Como vimos, los elementos de SU(2) describen rotaciones en un espacio complejo bidimensional que deja invariante a |z1 |2 + |z2 |2 . El determinante es +1. Hay tres par ametros independientes. Nuestro grupo ortogonal real SO(3) de determinante +1, claramente describe rotaciones comunes en el espacio tridimensional con la importante caracter stica de dejar 2 2 2 invariante a x + y + z . Tambi en hay tres par ametros independientes. Las interpretaciones de rotaci on y la igualdad de n umeros de par ametros sugiere la existencia de alguna clase de correspondencia entre los grupos SU(2) y SO(3). Aqu desarrollamos esta correspondencia.

U M

M U

Figura 3.2: Ilustraci on de M = UMU ecuaci on (3.42). La operaci on SU(2) sobre una matriz est a dada por una transformaci on unitaria, la ecuaci on (3.5), con R = U y la gura (3.2) M = UMU . (3.42)

Tomando M como una matriz de 2 2, notemos que cualquier matriz de 2 2 puede ser escrita como una combinaci on lineal de la matriz unidad y las tres matrices de Pauli. Sea M la matriz de traza cero, M = x1 + y2 + z3 = z x iy x + iy z , (3.43)

la matriz unidad no entra. Ya que la traza es invariante bajo transformaciones unitarias, M deber a tener la misma forma, M = x 1 + y 2 + z 3 = z x + iy x iy z . (3.44)

El determinante tambi en es invariante bajo una transformaci on unitaria. Por lo tanto (x2 + y 2 + z 2 ) = (x + y + z ) ,
2 2 2

(3.45)

90

CAP ITULO 3. TEOR IA DE GRUPO.

o (x2 + y 2 + z 2 ) es invariante bajo esta operaci on de SU(2), como con SO(3). SU(2) debe, por lo tanto, describir una rotaci on. Esto sugiere que SU(2) y SO(3) pueden ser isom orcos o homom orcos. Aproximemos el problema de qu e rotaci on describe SU(2) considerando casos especiales. i Retomando la ecuaci on (3.38) sea a = e y b = 0, o Uz = ei 0 0 ei . (3.46)

En anticipaci on de la ecuaci on (3.50), esta U le est a dado un sub ndice z . Realizando una transformaci on unitaria sobre cada una de las tres matrices de Pauli, tenemos Uz 1 U z = = ei 0 0 ei 0 e2i e2i 0 0 1 1 0 . ei 0 0 ei

(3.47)

Reexpresamos este resultado en t erminos de las matrices de Pauli para obtener Uz x1 U z = x cos 21 x sen 22 . Similarmente, Uz y2 U z = y sen 21 y cos 22 , Uz z3 U z = z3 . (3.49) (3.48)

A partir de esta expresi on de doble angulo vemos que podr amos comenzar con el angulo medio: = /2. Entonces, de las ecuaciones (3.42)(3.44), (3.48) y (3.49), x = x cos + y sen y = x sen + y cos z =z .

(3.50)

La transformaci on unitaria de 2 2 usando Uz (/2) es equivalente al operador de rotaci on R() de la ecuaci on (3.3). El establecimiento de la correspondencia de Uy (/2) = y Ry ( ) y de Ux (/2) = cos /2 i sen /2 i sen /2 cos /2 (3.52) cos /2 sen /2 sen /2 cos /2 (3.51)

y Rx () pueden calcularse como ejercicio. Podemos notar que Uk (/2) tiene la forma general Uk (/2) = 1 cos /2 + ik sen /2 , (3.53)

3.2. GENERADORES DE GRUPOS CONTINUOS. donde k = x, y, z . La correspondencia Uz = 2 e


i/2

91

0 e
i/2

cos sen 0 sin cos 0 = Rz () , 0 0 1

(3.54)

no es una simple correspondencia uno a uno. Espec camente, como en Rz recorre desde 0 a 2 , el par ametro Uz , /2, recorre desde 0 a . Encontramos que Rz ( + 2 ) = Rz () Uz (/2 + ) = ei/2 0 0 ei/2 = Uz (/2) . (3.55)

Por lo tanto ambos Uz (/2) y Uz (/2 + ) = Uz (/2) corresponde a Rz (). La correspondencia es de 2 a 1, o SU(2) y SO(3) son homom orcos. Este establecimiento de la correspondencia entre las representaciones de SU(2) y de aquella SO(3) signica que las representaciones conocidas de SU(2) autom aticamente nos proporciona de las representaciones de SO(3). Combinando las rotaciones, encontramos que una transformaci on unitaria usada U(, , ) = Uz (/2)Uy (/2)Uz (/2) , (3.56)

corresponde a la rotaci on general de Euler Rz ( )Ry ( )Rz (). Por multiplicaci on directa, U(, , ) = = ei/2 0 0 ei/2 cos /2 sen /2 sen /2 cos /2 ei/2 0 0 ei/2 .

ei( +)/2 cos /2 ei( )/2 sen /2 ei( )/2 sen /2 ei( +)/2 cos /2

(3.57)

Esta es nuestra forma general alternativa, la ecuaci on (3.38), con = ( + ) , 2 = , 2 = ( ) . 2 (3.58)

De la ecuaci on (3.57) podemos identicar los par ametros de la ecuaci on (3.38) como a = ei( +)/2 cos /2 b = ei( )/2 sen /2 SU(2) isospin y el octeto SU(3). En el tratamiento de las part culas con interacciones fuertes de F sica nuclear y de altas energ as que conducen al grupo de SU(2) de isospin y la simetr a de sabor SU(3), podr amos mirar el momento angular y el grupo de rotaci on SO(3) por una analog a. Supongamos que tenemos un electr on en un potencial atractivo esf ericamente sim etrico de alg un n ucleo at omico. La funci on de onda para el electr on puede ser caracterizada por tres n umeros (3.59)

92

CAP ITULO 3. TEOR IA DE GRUPO.

cu anticos n, l, m, que est an relacionados con los autovalores de los operadores conservados 2 5 H , L , Lz . La energ a, sin embargo, es 2l + 1 veces degenerada, dependiendo solamente de n y l. La raz on para esta degeneraci on puede ser expresado de dos maneras equivalentes: 1. El potencial es sim etricamente esf erico, independiente de , . 2. El hamiltoniano de Schrodinger ( 2 /2me )2 + V (r) es invariante bajo rotaciones espaciales ordinarias SO(3). Como una consecuencia de la simetr a esf erica del potencial V (r), el momento angular orbital L es conservado. En la secci on 3.2 las componentes cartesianas de L est an indenticadas como los generadores del grupo de rotaci on SO(3). En vez de representar Lx , Ly , Lz por operadores, usaremos matrices. Las matrices Li son matrices (2l + 1) (2l + 1) con la misma dimensi on del n umero de estados degenerados. La dimensi on 2l + 1 est a identicada con los estados degenerados 2l + 1. Esta degeneranci on es removida por un campo magn etico B , hecho conocido como el efecto Zeeman. Esta interacci on magn etica a nade un t ermino al Hamiltoniano que no es invariante bajo SO(3). Este es un t ermino quiebra la simetr a. En el caso de part culas con interacci on fuerte (protones, neutrones, etc.) no podemos seguir la analog a directamente, ya que todav a no entendemos completamente las interacciones nucleares. La fuerza fuerte est a descrita por la teor a gauge de Yang-Mills basada sobre la simetr a de color SU(3) llamada cromodin amica cu antica o abreviada QCD. Sin embargo, QCD es una teor a no lineal y por lo tanto complicada a grandes distancias y baja energ a que permanece no resuelta. Por lo tanto, no conocemos el Hamiltoniano, en vez de esto, volveremos a la analog a. En los a nos 1930, despu es del descubrimiento del neutr on, Heinsenberg propuso que las fuerzas nucleares eran cargas independientes. Los neutrones dieren en masa de los protones solamente en un 1.6%. Si esta peque na diferencia es ignorada, el neutr on y el prot on podr an ser consideradas como dos estados de cargas (o isospin) de un doblete, llamado nucle on. El isospin I tiene proyecci on en el eje z I3 = 1/2 para el prot on y I3 = 1/2 para el neutr on. El isospin no tiene nada que ver con el spin (el momento angular intr nseco de una part cula) pero las dos componentes del estado de isospin obedece las mismas relaciones matem aticas que el estado de spin 1/2. Para el nucle on, I = /2, son las matrices usuales de Pauli y los estados 1 0 . Similarmente, los de isospin (1/2) son autovectores de la matriz de Pauli 3 = 0 1 tres estados de carga del pi on + , 0 , forman un triplete. El pi on es la part cula m as liviana con interacci on fuerte y es la mediadora de la fuerza nuclear a distancia, como el fot on es part cula que media la fuerza electromagn etica. La interacci on fuerte trata igualmente a miembros de esa familia de part culas, o multipletes y conserva el isospin. La simetr a es el grupo isospin SU(2). El octuplete mostrado en la tabla 3.1 llama la atenci on 6 . Los n umeros cu anticos conser2 2 vados que son an alogos y generalizaciones de Lz y L de SO(3) son I3 e I para el isospin, e Y para hipercarga. Las part culas pueden ser agrupadas dentro de multipletes de carga o de
5 6

Para un potencial de Coulomb puro la energ a depende s olo de n. Todas las masas est an dadas en unidades de energ a.

3.2. GENERADORES DE GRUPOS CONTINUOS.

93

Masa [MeV] 0 N p 938.272 0 + n 1314.9 1197.43 1192.55 1189.37 1115.63 939.566 1321.32

I3 1 2
1 +2

-1

1 2

0 0 1

1 0
1 2

-1 0 +1 0
1 2

+1 2

Tabla 3.1: Bariones con spin

1 2

y paridad par

isospin. Entonces la hipercarga puede ser tomada como dos veces el promedio de carga del 1 multiplete. Para el nucle on, i.e., el doblete neutr onprot on, Y = 2 (0 + 1) = 1. Los valores 2 de la hipercarga y los del isospin son listados en la tabla 3.1 para bariones como el nucle on y sus compa neros (aproximadamente degenerados). Ellos forman un octeto como lo muestra la gura 3.3. En 1961 Gell-Mann, e independientemente Neeman, sugirieron que la interacci on fuerte debe ser (aproximadamente) invariante bajo un grupo espacial tridimensional unitario, SU(3), esto es, tienen simetr a de sabor SU(3). La elecci on de SU(3) estuvo basada primero sobre los dos n umeros cu anticos conservados e independientes H1 = I3 y H2 = Y (i.e., generados con [I3 , Y ] = 0), que llaman para un grupo de rango 2. Segundo, el grupo ha tenido una representaci on de ocho dimensiones para tener en cuenta los cercanamente degenerados bariones y cuatro octetos similares para los mesones. En un sentido SU(3) es la generalizaci on m as simple del isospin SU(2). Tres de sus generadores son matrices herm ticas de 3 3 de traza nula que contienen las matrices de Pauli de 2 2 para los isospin i en la esquina superior izquierda.

i 0 0 , i = 0 0 0

i = 1, 2, 3 .

(3.60)

De este modo, el grupo del isospin SU(2) es un subgrupo de SU(3) con I3 = 3 /2. Otros cuatro generadores tienen los no diagonales 1 de 1 e i, i de 2 en todas las otras posibles

94

CAP ITULO 3. TEOR IA DE GRUPO.

Y n
1

0
0 +

+
1

I3

Figura 3.3: Octeto bari onico diagrama de peso para SU(3).

ubicaciones para formar las matrices 0 0 4 = 0 0 1 0 0 0 6 = 0 0 0 1

herm ticas 3 3 de 1 0 0 , 5 = 0 0 i 0 0 1 , 7 = 0 0 0

traza nula. 0 i 0 0 , 0 0 0 0 0 i . i 0

(3.61)

El segundo generador diagonal tiene la matriz unidad bidimensional 12 en la esquina superior izquierda, la cual la hace claramente independiente del subgrupo SU(2) isospin ya que su traza no nula en el subespacio, y -2 en el lugar de la tercera diagonal la hace traza nula, 1 0 0 1 0 . 8 = 0 1 (3.62) 3 0 0 2 Generalmente hay 32 1 = 8 generadores para SU(3) el cual tiene orden 8. De los conmutadores de esos generadores pueden obtenerse f acilmente las constantes de estructura de SU(3). Volviendo a la simetr a de sabor SU(3) imaginemos que el Hamiltoniano para nuestro octeto de bariones est an compuesto de tres partes H = Hfuerte + Hmedio + Helectromagn etico . (3.63)

La primera parte, Hfuerte , tiene la simetr a SU(3) y conduce a la degeneranci on ocho. La introducci on del t ermino de quiebre de simetr a, Hmedio , remueve parte de la degeneraci on

3.2. GENERADORES DE GRUPOS CONTINUOS.

95

dando los cuatro multipletes del isospin ( , 0 ), ( , 0 , + ), , y N = (p, n) con diferentes masas. Estos a un son multipletes ya que Hmedio tiene la simetr a del isospin SU(2). Finalmente, la presencia de fuerzas dependientes de la carga separan los multipletes de isospin y remueve la u tima degeneraci on. Esta secuencia se muestra en la gura 3.4

masa

0 0 +

n p H fuerte + H medio+ H electromagntica

N H fuerte H fuerte + H medio

Figura 3.4: Separaci on de masa bari onica.

Aplicando teor a de perturbaci on de primer orden de Mec anica Cu antica, relaciones simples de masas de bari onicas pueden ser calculadas. Quiz as el suceso m as espectacular de este modelo SU(3) ha sido su predicci on de nuevas part culas. En 1961 cuatro mesones K y tres (todos pseudoescalares; spin 0, paridad impar) sugieren otro octeto, similar al del octeto bari onico. SU(3) predice un octavo mes on , de masa 563 MeV. El mes on con una masa determinada experimentalmente de 548 MeV fue encontrado poco despu es. Agrupamientos de nueve de los bariones m as pesados (todos con spin 3/2, con paridad par) sugiri o un multiplete de 10 miembros o un decaplete de SU(3). El d ecimo bari on faltante fue predicho con una masa cercana a 1680 MeV y una carga negativa. En 1964 cargada negativamente con masa (167512) MeV fue descubierta. La representaci on de octeto no es la m as simple para SU(3). La representaci on m as simple son triangulares como se muestra en la gura 3.5 a partir de las cuales todas las otras pueden ser generadas por acoplamiento del momento angular generalizado. La representaci on fundamental en la gura 3.5 (a) contiene los quark u (arriba) y d (abajo) y el s (extra neza), y gura 3.5 (b) los correspondientes antiquarks. Ya que los octetos de mesones pueden ser obtenidos a partir de la representaci on de quark como pares q q , 32 = 8 + 1, esto sugiere que los mesones contienen quarks (y antiquarks) como sus constituyentes. El modelo de quarks resultante dan una exitosa descripci on de la espectroscop a hadr onica. La soluci on de sus problemas con el principio de exclusi on de Pauli eventualmente conduce a la teor a de gauge de SU(3)-color de las interacciones fuertes llamada cromodin amica cu antica o QCD.

96

CAP ITULO 3. TEOR IA DE GRUPO.

(a) d

Y
1/3

(b) u
+

Y _ s

2/3

I3

I3 _ u
1 / 3

2 / 3

_ d

Figura 3.5: Separaci on de masa bari onica.

Para mantener la teor a de grupo en su real perspectiva, podr amos enfatizar que la teor a de grupo identica y formaliza las simetr as. Ella clasica part culas (y algunas veces predice). Pero a parte de decir que una parte del hamiltoniano tiene simetr a SU(2) y otra parte tiene simetr a SU(3), la teor a de grupo no dice nada a cerca de la interacci on de las part culas. Recuerde que la armaci on de que el potencial at omico es esf ericamente sim etrico no nos dice nada a cerca de la dependencia radial del portencial o de su funci on de onda. En contraste, en una teor a de gauge la interacci on es mediada por bosones vectoriales (como el fot on media en la electrodin amica cu antica) y determinado u nicamente por la derivada covariante de gauge.

3.3

Momento angular orbital.

El concepto cl asico de momento angular Lcl tulo de vectores asico = r p es mostrado en el cap para presentar el producto cruz. Siguiendo con la representaci on usual de Schr odinger de la Mec anica Cu antica, el momento lineal cl asico p es reemplazado por el operador i. El operador de momento angular en la mec anica cu antica se convierte en 7 LQM = ir . Las componentes del momento angular satisfacen las relaciones de conmutaci on [Li , Lj ] = iijk Lk . El ijk es el s mbolo de Levi-Civita. Una suma sobre el ndice k es sobreentendida. El operador diferencial correspondiente al cuadrado del momento angular
2 2 L 2 = L L = L2 x + Ly + L z ,
7

(3.64)

(3.65)

(3.66)

Por simplicidad,

= 1. Esto signica que el momento angular es medido en unidades de .

3.3. MOMENTO ANGULAR ORBITAL. puede ser determinado a partir de L L = (r p) (r p) ,

97

(3.67)

la cual puede vericarse como ejercicio. Ya que L 2 es un escalar rotacional, [L 2 , Li ] = 0, el cual tambi en puede ser vericado directamente. La ecuaci on (3.65) presenta las relaciones de conmutaci on b asicas de los componentes del momento angular en Mec anica Cu antica. Por cierto, dentro del marco de la Mec anica Cu antica y la teor a de grupo, estas relaciones de conmutaci on denen un operador de momento angular. Acercamiento a los operadores de subida y bajada. Comencemos con una aproximaci on m as general, donde el momento angular J lo consideramos que puede representar un momento angular orbital L, un spin /2, o un momento angular total L + /2, etc. Supongamos que 1. J es un operador herm tico cuyas componentes satisfacen las relaciones de conmutaci on [Ji , Jj ] = iijk Jk , [J 2 , Ji ] = 0 . (3.68)

2. |M es simultaneamente una autofunci on normalizada (o autovector) de Jz con auto2 valor M y una autofunci on de J , Jz |M = M |M , J 2 |M = |M . (3.69)

Mostraremos ahora que = J (J + 1). Este tratamiento ilustrar a la generalidad y potencia de las t ecnicas de operadores particularmente el uso de operadores de subida y bajada. Un operador de subida o bajada se dena como J+ = Jx + iJy , J = Jx iJy . (3.70)

En t erminos de ese operador J 2 puede ser reeescrito como 1 2 . J 2 = (J+ J + J J+ ) + Jz 2 A partir de las relaciones de conmutaci on, encontramos que [Jz , J+ ] = +J+ , [Jz , J ] = J , [J+ , J ] = 2Jz . (3.72) (3.71)

Ya que J+ conmuta con J 2 , hagalo como ejercicio J 2 (J+ |M ) = J+ (J 2 |M ) = (J+ |M ) . (3.73)

Por lo tanto, J+ |M todav a es una autofunci on de J 2 con autovalores , y similarmente para J |M . Pero de la ecuaci on (3.72) Jz J+ = J+ (Jz + 1) , (3.74)

98 o

CAP ITULO 3. TEOR IA DE GRUPO.

Jz (J+ |M ) = J+ (Jz + 1)|M = (M + 1)(J+ |M ) .

(3.75)

Por lo tanto, J+ |M todav a es una autofunci on de Jz con autovalores M + 1. J+ ha elevado el autovalor en 1 y por eso es llamado operador de subida. Similarmente, J baja los autovalores en 1 y a menudo es llamado operador de bajada. Tomando los valores esperados y usando Jx = Jx , Jy = Jy ,
2 2 2 M |J 2 Jz |M = M |Jx + Jy |M = | Jx |M |2 + | Jy |M |2 ,

vemos que M 2 0, tal que M es ligado. Sea J el m as grande valor de M . Luego J+ |J = 0, lo cual implica que J J+ |J = 0. Luego combinando las ecuaciones (3.71) y (3.72) obtenemos J 2 = J J+ + Jz (Jz + 1) , encontramos que a partir de la ecuaci on (3.76)
2 0 = J J+ |M = J = (J 2 Jz Jz )|M = J = ( J 2 J )|M = J .

(3.76)

Por lo tanto = J (J + 1) 0; (3.77)

con un J no negativo. Ahora reetiquetaremos los estados |M = |JM . Similarmente, sea J el m as peque no de los M . Entonces J |JJ = 0. A partir de J 2 = J+ J Jz (Jz + 1) , vemos que
2 0 = J+ J |JJ = (J 2 + Jz Jz )|JJ = ( + J J )|JJ 2

(3.78)

(3.79)

De manera que = J (J + 1) = J (J 1) = (J )(J 1) . As J = J , y M corre en pasos enteros desde J a +J , J M +J . (3.80)

Comenzando desde |JJ y aplicando J repetidas veces, alcanzaremos todos los otros estados |JM . De manera que |JM forma una representaci on irreductible; M var a y J est a jo. Entonces usando las ecuaciones (3.68), (3.76) y (3.78) obtenemos J J+ |JM = [J (J + 1) M (M + 1)]|JM = (J M )(J + M + 1)|JM , J+ J |JM = [J (J + 1) M (M 1)]|JM = (J + M )(J M + 1)|JM . (3.81)

3.3. MOMENTO ANGULAR ORBITAL. Como J+ y J son herm ticos conjugados,


J+ = J , J = J+ ,

99

(3.82)

los autovalores o valores esperados en la ecuaci on (3.81) deber an ser positivos o cero. Ya que J+ aumenta el autovalor de M a M + 1, reetiquetaremos la autofunci on resultante |JM + 1 . La normalizaci on est a dada por la ecuaci on (3.81) como J+ |JM = (J M )(J + M + 1)|JM + 1 , (3.83)

tomando la ra z cuadrada positiva y no introduciendo ning un factor de fase. Por los mismos argumentos J |JM = (J + M )(J M + 1)|JM 1 . (3.84)

Finalmente, ya que M va desde J a +J en pasos unitarios, 2J deber a ser un n umero entero. J es por lo tanto un entero o la mitad de un entero impar. Como hemos visto, el momento angular orbital est a descrito con J entero. A partir de los spin de algunas part culas fundamentales y de algunos n ucleos, tenemos que J = 1/2, 3/2, 5/2, . . . Nuestro momento angular est a cu antizado esencialmente como un resultado de relaciones de conmutaciones. En coordenadas polares esf ericas , las funciones , |lm = Ylm (, ) son arm onicos esf ericos. Resumen de grupos y algebras de Lie. Las relaciones de conmutaciones generales, ecuaci on (3.14) en la secci on 3.2, para un grupo de Lie cl asico [SO(n) y SU(n) en particular] pueden ser simplicadas para verse m as como la ecuaci on (3.72) para SO(3) y SU(2) en la secci on 3.3. Primero escogemos generadores Hi que sean linealmente independientes y que conmuten entre s , estos son generalizaciones de Jz de SO(3) y SU(2). Sea l el n umero m aximo de tales Hi con [Hi , Hk ] = 0 . (3.85)

Entonces l es llamado el rango del grupo Lie G o de su algebra. El rango y la dimensi on u orden de algunos grupos Lie son dados en la tabla 3.2. Todos los otros generadores E puede mostrarse que son operadores de subida y bajada con respecto a todos los Hi , tal que [Hi , E ] = i E . (3.86)

El conjunto de los (1 , 2 , . . . , l ) son llamados los vectores raices. Ya que los Hi conmutan entre s , ellos pueden ser diagonalizados simult aneamente. Ellos nos dan un conjunto de autovalores m1 , m2 , . . . , ml . Al conjunto (m1 , m2 , . . . ..ml ) se les llama vectores de peso de una representaci on irreductible. Hay l operadores invariantes Ci , llamados operadores de Casimir, los cuales conmutan con todos los generadores y son generalizaciones de J 2 , [Ci , Hj ] = 0 , [Ci , E ] = 0 . (3.87)

100

CAP ITULO 3. TEOR IA DE GRUPO. Algebra de Lie Al Bl Dl Grupo de Lie SU(l+1) SO(2l+1) SO(2l) rango l l l orden l(l+2) l(2l+1) l(2l-1) Tabla 3.2: Rango y orden de grupos rotacionales y unitarios.

El primero, C1 , es una funci on cuadr atica de los generadores, los otros son m as complicados. Ya que Ci conmuta con todos los Hj , ellos pueden ser diagonalizados simult aneamente con los Hj . Sus autovalores c1 , c2 , . . . , cl caracterizan las representaciones irreductibles y permenecen constantes mientras los vectores de peso var an sobre una representaci on irreductible particular. Por lo tanto, la autofunci on general puede ser escrita como |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml , generalizando |JM de SO(3) y SU(2). Sus ecuaciones de autovalores son Hi |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml = mi |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml , Ci |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml = ci |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml . (3.89a) (3.89b) (3.88)

Ahora podemos mostrar que E |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml tiene los vector peso (m1 + 1 , m2 + 2 , . . . , ml + l ) usando las relaciones de conmutaci on, la ecuaci on (3.86), en conjunto con las ecuaciones (3.89a) y (3.89b), Hi E |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml = (E Hi + [Hi , E ])|(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml = (mi + i )E |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml . (3.90) Por lo tanto E |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml |(c1 , c2 , . . . , cl )m1 + 1 , m2 + 2 , . . . , ml + l estas son las generalizaciones de las ecuaciones (3.83) y (3.84) a partir de SO(3). Esos cambios de autovalores por el operador E son llamados sus reglas de selecci on en mec anica cu antica.

3.4

Grupo homog eneo de Lorentz.

En relatividad especial requerimos que nuestras leyes f sicas sean covariantes8 bajo a. traslaciones en el tiempo y en el espacio, b. rotaciones en el espacio real tridimensional, y c. transformaciones de Lorentz.
Ser covariante signica que tienen la misma forma en diferentes sistemas de coordenadas tal que no hay un sistema de referencia privilegiado.
8

3.4. GRUPO HOMOGENEO DE LORENTZ.

101

El requerimiento para la covarianza bajo traslaciones est a basada en la homogeneidad del espacio y el tiempo. Covarianza bajo rotaciones es una armaci on de la isotrop a del espacio. El requerimiento de la covarianza de Lorentz viene de la relatividad especial. Todas estas tres transformaciones en conjunto forman el grupo inhomogeneo de Lorentz o el grupo de Poincar e. Aqu exclu mos las traslaciones. Las rotaciones espaciales y las transformaciones de Lorentz forman un grupo, el grupo homog eneo ed Lorentz. Primero generamos un subgrupo, las transformaciones de Lorentz en el cual la velocidad relativa v est a a lo largo del eje x = x1 . El generador puede ser determinad considerando un marco de referencia espacio-temporal moviendose con una velocidad relativa innitesimal v . Las relaciones son similares a aquellas para rotaciones en el espacio real, excepto que aqu el angulo de rotaci on es imaginario puro. Las transformaciones de Lorentz son lineales no s olo en el espacio de ccordenadas xi si no que tambi en en el tiempo t. Ellas se originan a partir de las ecuaciones de Maxwell de la electrodin amica las cuales son invariantes bajo la transformaciones de Lorentz, como veremos luego. Las transformaciones de Lorentz dejan invariante la forma cuadr atica siguiente 2 2 2 2 2 2 2 2 2 c t x1 x2 x3 = x0 x1 x2 x3 donde x0 = ct. Vemos esto si encendemos una fuente de luz en el origen del sistema de coordenadas. En tiempo t la luz ha viajado una distancia 2 2 2 2 2 ct = x2 i , tal que c t x1 x2 x3 = 0. La relatividad especial requiere esto en todos los sistemas (inercial) que se mueven con velocidad v c en cualquier direcci on relativa al sistema xi y que tengan el mismo origen a tiempo t = 0, se mantenga tambi en que 2 2 2 2 2 2 2 2 c t x1 x2 x3 = 0. El espacio cuadridimensional con la m etrica x0 x1 x2 x2 3 es llamado espacio de Minkowski con el producto escalar de dos cuadrivectores denido como a b = a0 b0 a b. Usando el tensor m etrico 1 0 0 0 0 1 0 0 (g ) = (g ) = (3.91) 0 0 1 0 , 0 0 0 1 podemos subir y bajar ndices de un cuadrivector tal como de las coordenadas x = (x0 , x) 2 es decir x = g x = (x0 , x) y x g x = x2 on de suma de Einstein se 0 x , la conveci dan por entendida. Para el gradiente = (/x0 , ) = /x y = (/x0 , ) tal que 2 2 2 = 2 /x2 etrica x2 0 es un escalar de Lorentz, al igual que la m 0x . Para v c, en el l mite no relativista, las transformaciones de Lorentz deben ser transformaciones de Galileo. Por lo tanto, para derivar la forma de una transformaci on de Lorentz a lo largo del eje x1 , partimos con una transformaci on Galileana para una velocidad relativa innitesimal v : x1 = x1 vt = x1 x0 . v Como es usual = . Por simetr a tambi en podemos escribir c x0 = x0 ax1 , (3.93) (3.92)

2 donde a es un par ametro a jar una vez que se imponga que x2 0 x1 deba ser invariante, 2 x0 x1 = x2 0 x1 . 2 2

(3.94)

102

CAP ITULO 3. TEOR IA DE GRUPO.

Recordemos que x = (x0 ; x1 , x2 , x3 ) es el prototipo de cuadrivector en el espacio de Minkowski. As la ecuaci on (3.94) es simplemente una armaci on de la invariancia del cuadrado de la magnitud del vector distancia bajo rotaciones en el espacio de Minkowski. Aqu es donde la relatividad especial compromete nuestra trasnformaci on. Elevando al cuadrado y restando las ecuaciones (3.92) y (3.93) y descartando t erminos del orden de 2 , encontramos a = 1. Las ecuaciones (3.92) y (3.93) pueden ser combinadas como una ecuaci on matricial x0 x1 = (1 1 ) x0 x1 , (3.95)

1 es la matriz de Pauli, y el par ametro representa un cambio innetesimal. Repetimos la transformaci on N veces para desarrollar una transformaci on nita con el par ametro velocidad = N . entonces x0 x1 En el l mite N
N

= 1

1 N

x0 x1

(3.96)

lim

1 N

= exp(1 ) .

(3.97)

Interpretamos la exponencial como una serie de Maclaurin exp(1 ) = 1 1 + Notando que 2 = 1, exp(1 ) = 1 cosh + 1 senh . Por lo tanto nuestra transformaci on de Lorentz nita es x0 x1 = cosh senh senh cosh x0 x1 . (3.100) (3.99) (1 )2 (1 )3 + . 2! 3! (3.98)

1 ha generado las representaciones de esta especial transformaci on de Lorentz. El cosh y el senh pueden ser identicados considerando el origen del sistema de coordenadas primas, x1 = 0, o x1 = vt. Sustituyendo en la ecuaci on (3.100), tenemos 0 = x1 cosh x0 senh . Con x1 = vt y x0 = ct. tanh = = Note que la rapidez = v . c (3.101)

v excepto en el l mite v 0. c Usando 1 tanh2 = (cosh2 )1 , cosh = (1 2 )1/2 , senh = . (3.102)

3.5. COVARIANZA DE LORENTZ DE LAS ECUACIONES DE MAXWELL.

103

El anterior caso especial en que la velocidad es paralela a uno de los ejes espaciales es simple, pero ilustra la velocidad innitesimal, la t ecnica de la exponenciaci on y el generador. Ahora esta t ecnica puede ser aplicada para derivar las transformaciones de Lorentz para una velocidad relativa v no paralela a ning un eje. Las matrices dadas por la ecuaci on (3.100) para el caso v = x vx forman un subgrupo. Las matrices en el caso general no lo hacen. El producto de dos matrices de transformaciones de Lorentz, L(v1 ) y L(v2 ), producen una tercera matriz de transformaci on L(v3 ), si las dos velocidades v1 y v2 son paralelas. La velocidad resultante v3 est a relacionada con v1 y con v2 mediante la regla de adici on de velociades de Einstein. Si v1 y v2 no son paralelas, no existe entonces una relaci on simple.

3.5

Covarianza de Lorentz de las Ecuaciones de Maxwell.

Si una ley f sica se mantiene para todas las orientaciones de nuestro (real) espacial sistema de coordenadas (i.e. es invariante ante rotaciones), los t erminos de la ecuaci on deben ser covariantes bajo rotaciones. Esto signica que escribimos las leyes f sicas en la forma matem atica escalar=escalar, vector=vector, tensor de segundo rango=tensor de segundo rango, y as sucesivamente. Similarmente, si una ley f sica se mantiene para todos los sistemas inerciales, los t erminos de la ecuaci on deben ser covariantes bajo transformaciones de Lorentz. Usando el espacio de Minkowski (x = x1 , y = x2 , z = x3 , ct = x0 ) tenemos un espacio cuadridimensional cartesiano con m etrica g . Las transformaciones de Lorentz son lineales en el espacio y en el tiempo en este espacio real de cuatro dimensiones. Consideremos las ecuaciones de Maxwell B , t D H = + v , t D = , E = B =0 , y las relaciones D = 0 E , B = 0 H . (3.104) (3.103a) (3.103b) (3.103c) (3.103d)

Todos los s mbolos tienen sus signicados usuales y hemos supuesto el vacio por simplicidad. Supongamos que las ecuaciones de Maxwell se mantienen en todos los sistemas inerciales; esto es , las ecuaciones de Maxwell son consistentes con la relatividad especial. (La covariancia de las ecuaciones de Maxwell bajo transformaciones de Lorentz fue realmente mostrada por Lorentz y Poincar e antes de que Einstein propusiera su teor a de la relatividad especial). Nuestro objetivo inmediato es reescribir las ecuaciones de Maxwell como ecuaciones tensoriales en el espacio de Minkowski. Esto har a la covariancia de Lorentz expl cita.

104

CAP ITULO 3. TEOR IA DE GRUPO.

En t erminos de los potenciales escalar y vectorial, podemos escribir B =A , E= A . t (3.105)

La ecuaci on anterior especica el rotor de A; la divergencia de A no est a denida. Podemos, y por futuras conveniencias lo hacemos, imponer la siguiente relaci on sobre el vector potencial A + 0 0 =0. t (3.106)

Este es conocido como el gauge de Lorentz. Servir a a nuestros prop ositos de desacoplar las ecuaciones diferenciales para A y para . Ahora reescribimos las ecuaciones de Maxwell en t erminos de los potenciales. A partir de la ecuaci on (3.103c) para D y (3.105) 2 + A = , t 0 (3.107)

considerando que la ecuaci on (3.103b) para H y (3.105) y la identidad vectorial para el rotor del rotor produce 2A 1 v + + + A 2 A = . 2 t t 0 0 0 (3.108)

Usando el gauge de Lorentz, la ecuaci on (3.106), y la relaci on 0 0 = 1/c2 , obtenemos 2 1 2 A = 0 v , c2 t2 1 2 2 2 2 = . c t 0

(3.109)

Ahora el operador diferencial 2 1 2 = 2 = , c2 t2

es un Laplaciano cuadridimensional. Usualmente este operador es llamado el dAlembertiano y denotado por 2 . Puede probarse que es un escalar. Por conveniencia denimos A1 Ax = c0 Ax , 0 c Ay A2 = c0 Ay , 0 c A3 Az = c0 Az , 0 c
0

(3.110)

A0 0 = A .

3.5. COVARIANZA DE LORENTZ DE LAS ECUACIONES DE MAXWELL. Si ponemos adem as vx vy vz i1 , i2 , i3 , i0 = i0 , c c c entonces la ecuaci on (3.109) puede ser escrita de la forma 2 A = i .

105

(3.111)

(3.112)

La ecuaci on anterior parece una ecuaci on tensorial, pero eso no basta. Para probar que es una ecuaci on tensorial, partimos investigando las propiedades de transformaci on de la corriente generalizada i . Ya que un elemento de carga de es una cantidad invariante, tenemos de = dx1 dx2 dx3 , invariante. (3.113)

Vimos que el elemento de volumen cuadridimensional es tambi en un invariante, dx1 dx2 dx3 dx0 , comparando estos resultados vemos que la densidad de carga debe transformar de la misma manera que x0 . Ponemos = i0 con i0 establecida como la componente cero de un cuadrivector. Las otras partes de la ecuaci on (3.111) pueden ser expandidas como vx dx1 = c c dt (3.114) 0 dx1 =i . dt Ya que justo mostramos que i0 transforma como dx0 , esto signica que i1 transforma como dx1 . Con resultados similares para i2 e i3 . tenemos que i transforma como dx , probando de esta manera que i es un vector, un vector del espacio cuadridimensional de Minkowski. La ecuaci on (3.112), la cual deriva directamente de las ecuaciones de Maxwell, suponemos que se mantiene en todos los sistemas cartesianos. Entonces, por la regla del cuociente A es tambi en un vector y (3.112) es una legitima ecuaci on tensorial. Ahora, devolviendonos, la ecuaci on (3.105) puede ser escrita i1 = Aj A0 + , j = 1, 2, 3, x0 xj 1 Ak Aj Bi = , (i, j, k ) = (1, 2, 3) , c xj xk 0 Ej = y permuitaciones c clicas. Denimos un nuevo tensor A A = A A F = F x x (, = 0, 1, 2, 3)

(3.115)

un tensor antisim etrico de segundo rango, ya que A es un vector. Escribamoslo axpl citamente 0 Ex Ey Ez 0 Ex Ey Ez Ex 0 cBz cBy 0 cBz cBy , F = 0 Ex . F = 0 Ey Ey cBz 0 cBx cBz 0 cBx Ez cBy cBx 0 Ez cBy cBx 0 (3.116)

106

CAP ITULO 3. TEOR IA DE GRUPO.

Notemos que en nuestro espacio de Minkowski E y B no son m as vectores sino que juntos forman un tensor de segundo rango. Con este tensor podemos escribir las dos ecuaciones de Maxwell nohomogeneas (3.103b) y (3.103c) y combinandolas como una ecuaci on tensorial F = i . x (3.117)

El lado izquierdo es una divergencia cuadridimensional de un tensor y por lo tanto un vector. F Esto es, por supuesto, equivalente a contraer un tensor de tercer rango . Las ecuaciones x de Maxwell (3.103a) para E y la ecuaci on (3.103d) para B pueden ser expresadas en forma tensorial F23 F31 F12 + + =0, x1 x2 x3 para (3.103d) y tres ecuaciones de la forma F30 F02 F23 =0, x2 x3 x0 (3.119) (3.118)

para (3.103a). Una segunda ecuaci on permutando 120 y una tercera permutando 130. Ya que F = F t , x

es un tensor de tercer rango, las ecuaciones (3.117) y (3.119) pueden ser expresadas por la ecuaci on tensorial t + t + t = 0 . En todos los casos anteriores los ndices , y se suponen diferentes. Transformaciones de Lorentz de E y B . La construcci on de las ecuaciones tensoriales (3.118) y (3.120) completan nuestro objetivo inicial de reescribir las ecuaciones de Maxwell en forma tensorial. Ahora explotamos las propiedades tensoriales de nuestros cuadrivectores y del tensor F . Para las transformaciones de Lorentz que correspoonden a movimientos a lo largo del eje z (x3 ) con velocidad v , los cosenos directores est an dados por x0 = (x0 x3 ) x3 = (x3 x1 ) , donde = v c (3.121) (3.120)

3.5. COVARIANZA DE LORENTZ DE LAS ECUACIONES DE MAXWELL. y = 1 2


1 /2

107

(3.122)

Usando las propiedades de transformaci on tensorial, podemos calcular los campos el ectrico y magn etico en el sistema en movimiento en t erminos de los valores en el marco de referencias original. A partir de las ecuaciones (1.59), (3.116) y (3.121) obtenemos Ex = Ey = 1 1 2 1 2 v By c2 v Ey + 2 Bx c Ex , , (3.123)

1 Ez = Ez , 1

y Bx = By = 1 2 1 2 v Ey c2 v By 2 Ex c Bx + , , (3.124)

1 Bz = Bz .

Este acoplamiento de E y B es esperado. Consideremos, por ejemplo, el caso de campo el ectrico nulo en el sistema sin prima Ex = Ey = Ez = 0 . Claramente, no habr a fuerza sobre una part cula carga estacionaria. Cuando la part cula est a en movimiento con una velocidad peque na v a lo largo del eje z un observador sobre la part cula ve campos (ejerciendo una fuerza sobre la part cula cargada) dados por Ex = vBy , Ey = vBx , donde B es un campo magn etico en el sistema sin primas. Estas ecuaciones pueden ser puestas en forma vectorial E =vB , o bien, F = qv B , (3.125)

la cual es usualmente tomada como la denici on operacional del campo magn etico B . Invariantes electromagn eticas. Finalmente, las propiedades tensoriales (o vectorioles) nos permiten construir una multitud de cantidades invariantes. Una de las importantes es el producto escalar de los cuadrivectores A y i . Tenemos vx vy vz A i = c0 Ax c0 Ay c0 Az + 0 c c c (3.126) = 0 ( A J ) , invariante,

108

CAP ITULO 3. TEOR IA DE GRUPO.

con A el usual potencial vector y J la densidad de corriente ordinaria. El primer t ermino es el ordinario acoplamiento electroest atico con dimensiones de energ a per unidad de volumen. En consecuencia nuestro recien constru do invariante escalar es un densidad de energ a. La interacci on din amica del campo y corriente es dado por el producto A J . Este invariante A i aparece en los Lagrangianos electromagn eticos.

Cap tulo 4 Series innitas.


versi on nal 1.3-1806021

4.1

Conceptos fundamentales

Las series innitas, literalmente sumas de un n umero innito de t erminos, ocurre frecuentemente tanto en matem aticas pura como aplicada. Ellas podr an ser usadas por los matem aticos puros para denir funciones como una aproximaci on fundamental a la teor a de funciones, tan bien como para calcular valores precisos de constantes y funciones trascendentales. En la matem atica en ciencias e ingenier a las series innitas son ubicuas, es por ello que aparecen en la evaluaci on de integrales, en la soluci on de ecuaciones diferenciales, en series de Fourier y compite con las representaciones integral para la descripci on de funciones especiales. M as adelante veremos la soluci on en series de Neumann para ecuaciones integrales dan un ejemplo m as de la ocurrencia y uso de las series innitas. Encaramos el problema que signica la suma de un n umero innito de t erminos. La aproximaci on usual es por sumas parciales. Si tenemos una sucesi on de t erminos innitos u1 , u2 , u3 , u4 , u5 , . . . , denimos la suma parcial i- esima como
i

si =
n=1

un ,

(4.1)

Esta es una suma nita y no ofrece dicultades. Si las sumas parciales si convergen a un l mite (nito) cuando i ,
i

lim si = S ,

(4.2)

La serie innita n=1 un se dice que es convergente y tiene el valor S . Note cuidadosamente que nosotros razonablemente y plausiblemente, pero a un arbitrariamente denimos que la serie innita es igual a S . Podemos notar que una condici on necesaria para esta convergencia a un l mite es que el limn un = 0. Esta condici on, sin embargo, no es suciente para garantizar la convergencia. La ecuaci on (4.2) usualmente est a escrita en notaci on matem atica formal:
Este cap tulo est a basado en el quinto cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
1

109

110

CAP ITULO 4. SERIES INFINITAS. La condici on para la existencia de un l mite S es que para cada > 0, haya un N jo tal que | S si | < , para todo i > N .

Esta condici on a menudo derivada del criterio de Cauchy aplicado a las sumas parciales si . El criterio de Cauchy es: Una condici on necesaria y suciente para que una sucesi on (si ) converja es que para cada > 0 exista un n umero jo N tal que |sj si | < para todos los i, j > N .

Esto signica que la sumas parciales individuales deben mantenerse cercanas cuando nos movemos lejos en la secuencia. El criterio de Cauchy puede f acilmente extenderse a sucesiones de funciones. La vemos en esta forma en la secci on 4.5 en la denici on de convergencia uniforme y m as adelante en el desarrollo del espacio de Hilbert. Nuestras sumas parciales si pueden no converger a un l mite simple sino que podr a oscilar, como en el caso

un = 1 1 + 1 1 + 1 + (1)n .
n=0

Claramente, si = 1 para i impar pero 0 para i par. No hay convergencia a un l mite, y series tal como una llamadas oscilantes. Para las series 1 + 2 + 3 + + n + tenemos sn = Cuando n ,
n

n(n + 1) 2

lim sn = .

Cada vez que las sumas parciales diverjan (tienden a ), la serie innita se dice que diverge. A menudo el t ermino divergente es extendido para incluir series oscilatorias. Ya que evaluamos las sumas parciales por aritm etica ordinaria, la serie convergente, denida en t erminos del l mite de las sumas parciales, asume una posici on de importancia suprema. Dos ejemplos pueden claricar la naturaleza de convergencia o divergencia de una serie y servir a como una base para una investigaci on m as detallada en la pr oxima secci on.

4.1. CONCEPTOS FUNDAMENTALES Ejemplo Series geom etricas.

111

La sucesi on geom etrica, comenzando con a y con una raz on r(r >= 0), est a dado por a + ar + ar2 + ar3 + + arn1 + . La suma parcial n- esima est a dada por sn = a Tomando el l mite cuando n ,
n

1 rn 1r

(4.3)

lim sn =

a , 1r

para r < 1.

(4.4)

De modo que, por denici on, la serie geom etrica innita converge para r < 1 y est a dada por

arn1 =
n=1

a . 1r

(4.5)

Por otra parte, si r 1, la condici on necesaria un 0 no se satisface y la serie innita diverge. Ejemplo Series arm onicas. Consideremos la serie arm onica

n 1 = 1 +
n=1

1 1 1 1 + + + + + . 2 3 4 n

(4.6)

Tenemos que el limn un = limn 1/n = 0, pero esto no es suciente para garantizar la convergencia. Si agrupamos los t erminos (no cambiando el orden) como 1+ 1 + 2 1 1 + 3 4 + 1 1 1 1 + + + 5 6 7 8 + 1 1 + + 9 16 + , (4.7)

se ver a que cada par de par entesis encierra p t erminos de la forma 1 1 1 p 1 + + + > = . p+1 p+2 p+p 2p 2 Formando sumas parciales sumando un grupos entre par entesis por vez, obtenemos s1 = 1 , 3 , 2 4 s3 > , 2 s2 = 5 , 2 6 s5 > , 2 n+1 sn > . 2 s4 > (4.8)

(4.9)

112

CAP ITULO 4. SERIES INFINITAS.

Las series arm onicas consideradas de esta manera ciertamente son divergentes. Una demostraci on independiente y alternativa de su divergencia aparece en la secci on 4.2. Usando el teorema del binomio, podr amos expandir la funci on (1 + x)1 : 1 = 1 x + x2 x3 + . . . + (x)n1 + . 1+x Si tomamos x 1, la serie se convierte 1 1 + 1 1 + 1 1 + ... , (4.11) (4.10)

una serie que etiquetamos como oscilatoria anteriormente. Aunque no converge en el sentido usual, signica que puede ser ligada a su serie. Euler, por ejemplo, asignado un valor de 1/2 a esta sucesi on oscilatoria sobre la base de la correspondencia entre esta serie y la bien denida funci on (1 + x)1 . Desafortunadamente, tal correspondencia entre la serie y la funci on no es u nica y esta aproximaci on deber a ser redenida. Otros m etodos de asignar un signicado a una serie oscilatoria o divergente, m etodos de denir una suma, han sido desarrollados. Otro ejemplo de generalizar la convergencia lo vemos en las serie asint otica o semiconvergente, consideradas m as adelante.

4.2

Pruebas de Convergencia

Aunque las series no convergentes pueden ser u tiles en ciertos casos especiales, usualmente insistimos, como una materia de conveniencia si no de necesidad, que nuestras series sean convergentes. Por lo tanto esto llega a ser una materia de extrema importancia para ser capaz de decir si una serie dada es o no convergente. Desarrollaremos un n umero de posibles pruebas, comenzando con una prueba simple pero poco sensible y posteriormente trabajar con una m as complicada pero muy sensible. Por ahora consideremos una serie de t erminos positivos, an > 0, posponiendo los t erminos negativos hasta la pr oxima secci on.

4.2.1

Pruebas de comparaci on.

Si t ermino a t ermino una serie de t erminos un an , en el cual los an forman una serie en es convergente. Simb olicamente, tenemos convergente, las series n un tambi an = a1 + a2 + a3 + ,
n

convergente,

un = u1 + u 2 + u3 + .
n

Si un an para todo n, luego n un n an y n un por lo tanto es convergente. Si t ermino a t ermino es una serrie de t erminos vn bn , en el cual bn forma una serie divergente, las series n vn tambi en es divergente. Note que las comparaciones de un con bn

4.2. PRUEBAS DE CONVERGENCIA o vn con an no dan informaci on. Aqu tenemos bn = b1 + b2 + b3 + ,


n

113

divergente,

vn = v1 + v2 + v3 + .
n

Si vn bn para todo n, luego n vn n bn y n vn por lo tanto es divergente. Para las series convergente an tenemos las series geom etricas, mientras las series arm onicas servir an como las series divergentes bn . En tanto otras series son identicadas como convergentes o divergentes, ellas pueden ser usadas como las series conocidas en estas pruebas de comparaci on. Todos las pruebas desarrolladas en esta secci on son esencialmente pruebas de comparaci on. La gura 4.1 muestra estas pruebas y sus relaciones.

Raz de Cauchy (Comparacin con las series geomtricas) an = 1

Kummer, an

Integral de Euler Maclaurin (Comparacin con la integral) an= n Raabe

Razn de DAlembert Cauchy (Tambin por comparacin con la series geomtricas)

an= n ln n

Gauss
Figura 4.1: Test de comparaci on.

Ejemplo Las series p. Probamos n np , p = 0.999, por convergencia. Ya que n0.999 > n1 , y bn = n1 forman la serie arm onica divergente, la prueba de comparaci on muestra que n n0.999 es divergente. Generalizando, n np se ve como divergente para todo p 1.

4.2.2

Prueba de la ra z de Cauchy.

Si (an )1/n r < 1 para todo n sucientemente grande, con r independiente de n, entonces 1/n 1 para todo n sucientemente grande, entonces n an es n an es convergente. Si (an ) divergente.

114

CAP ITULO 4. SERIES INFINITAS.

La primera parte de esta prueba se verica f acilmente elevando (an )1/n r a la n- esima potencia. Obtenemos an r n < 1 . Ya que rn es s olo el t ermino n- esimo en una serie geom etrica convergente, n an es convergente por la prueba de comparaci on. Conversamente, si (an )1/n 1, entonces an 1 y la serie deber a diverger. La pruebe de la ra z es particularmente u til en establecer las propiedades de la serie de potencias.

4.2.3

Prueba de la raz on de D Alembert o Cauchy.

Si an+1 /an r < 1 para todo n sucientemente grande, y r independiente de n, entonces n an es convergente. Si an+1 /an 1 para todo n sucientemente grande, entonces n an es divergente. La convergencia est a dada por la comparaci on directa con las series geom etricas (1 + r + 2 r + . . . ). En la segunda parte an+1 an y la divergencia debe ser razonablemente obvia. Aunque la prueba no es tan sensible como la prueba de la ra z de Cauchy, esta prueba de la raz on e D Alembert es una de las m as f aciles de aplicar y es ampliamente usada. Una aramci on alternativa de la prueba de la raz on est a en la forma de un l mite: Si an+1 < 1 , convergencia lim n an (4.12) > 1 , divergencia = 1 , indeterminado. A causa de la posibilidad de ser indeterminado, la prueba de la raz on es probable que falle en puntos cruciales, y se hace necesario una prueba m as delicada y sensible. Podr amos preguntarnos c omo podr a levantarse esta indeterminaci on. Realmente fue disimulado en el primera armaci on an+1 /an r < 1. Podriamos encontrar an+1 /an < 1 para todo n nito pero ser inapropiado escoger un r < 1 e independiente de n tal que an+1 /an r para todo n sucientemente grande. Un ejemplo est a dado por las series arm onicas an+1 n = <1, (4.13) an n+1 Ya que an+1 =1, n an lim no existe una raz on ja r < 1 y la prueba de la raz on falla. Ejemplo Prueba de la raz on de D Alembert. n Probar la convergencia de 2n n an+1 (n + 1)/2n+1 1n+1 = = . n an n/2 2 n (4.15) (4.14)

4.2. PRUEBAS DE CONVERGENCIA Ya que an+1 3 an 4 tenemos convergencia. Alternativamente, 1 an+1 = , n an 2 lim y de nuevo converge. para n 2,

115

(4.16)

(4.17)

4.2.4

Prueba integral de Cauchy o Maclaurin.

Esta es otra clase de prueba de comparaci on en la cual comparamos una serie con una integral. Geom etricamente, comparamos el area de una serie de un rect angulo de ancho unitario con el area bajo la curva. Sea f (x) una funci on continua, mon otonamente decreciente en la cual f (n) = an . Luego esima n an converge si 0 f (x) dx es nita y diverge si la integral es innita. Para la i- suma parcial
i i

si =
n=1

an =
n=1

f (n) .

(4.18)

Pero
i+1

si >
1

f (x) dx ,

(4.19)

por la gura 4.2a, f (x) es mon otonamente decreciente. Por otra parte, de la gura 4.2b,
i

s i a1 <
1

f (x) dx ,

(4.20)

en la cual la serie est a representada por los rect angulos inscritos. Tomando el l mite como i , tenemos

f (x) dx <
1 n=1

an <
1

f (x) dx + a1 .

(4.21)

De modo que la serie innita converge o diverge cuando la integral correpondiente converge o diverge respectivamente. La prueba de la integral es particularmente u til para acotar superior e inferiormente el resto de una serie, despu es de que algunos n umeros de t erminos iniciales hayan sido sumados. Esto es,
N

an =
n=1 n=1

an +
n=N +1

an ,

116

CAP ITULO 4. SERIES INFINITAS.

(a) f(x) f(1)=a1 f(2)=a2 x


1 2 3 4

(b) f(x) f(1)=a1

x
1 2 3 4 5

Figura 4.2: (a) Comparaci on de la integral y la suma de bloques sobresalientes. (b) Comparaci on de la integral y la suma de bloques envueltos.

donde

f (x) dx <
N +1 n=N +1

an <
N +1

f (x) dx + aN +1 .

Podemos liberar la prueba de la integral de los requerimientos muy restrictivos de que la funci on de interpolaci on f (x) sea positiva y mon otonamente decreciente, basta que la funci on f (x) tenga una derivada continua que satisfaga
Nf Nf Nf

f (n) =
n=Ni +1 Ni

f (x) dx +
Ni

(x [x])f (x) dx .

(4.22)

Aqu [x] denota el entero mayor por debajo de x, tal que x [x] var a como diente de sierra entre 0 y 1. Ejemplo Funci on Zeta de Riemann. La funci on zeta de Riemann est a denida por

(p) =
n=1

n p .

(4.23)

Podemos tomar f (x) = xp y entonces p+1 x , p=1 p x dx = p + 1 1 1 ln x , p=1 1

(4.24)

4.2. PRUEBAS DE CONVERGENCIA

117

La integral y por lo tanto la serie son divergentes para p 1 y convergente para p > 1. De modo que la ecuaci on (4.23) lleva la condici on de p > 1. Esto, incidentalmente, es una prueba independiente de que la serie arm onica (p = 1) diverge y lo hace en forma logar tmica. La suma del primer mill on de t erminos 1.000.000 n1 , es solamente 14.392726 . . . . Esta comparaci on con la integral tambi en puede ser usada para dar una cota superior a la constante Euler-Mascheroni denida por = lim Volviendo a las sumas parciales,
n n

1 ln n m m=1

(4.25)

sn =
m=1

m1 ln n <
1

dx ln n + 1 . x

(4.26)

Evaluando la integral del lado derecho, sn < 1 para todo n y por lo tanto < 1. Realmente la constante de Euler-Mascheroni es 0.57721566 . . . .

4.2.5

Prueba de Kummer.

Esta es la primera de tres pruebas que son algo m as dif ciles para aplicar que las anteriores. Su importancia radica en su poder y sensibilidad. Frecuentemente, al menos una de las tres funcionar a cuando las pruebas m as f aciles sean indeterminadas. Debe recordarse, sin embargo, que estas pruebas, como aquellas previamente discutidas, est an nalmente basadas en comparaciones. Esto signica que todas las pruebas de convergencia dadas aqu , incluyendo la de Kummer, puedan fallar algunas veces. Consideremos una serie de t erminos positivos ui y una sucesi on de constantes positivas nitas ai . Si an un an+1 C > 0 , un+1
i=1

(4.27)

para todo n N , alg un n umero jo, entonces an y


i=1

ui converge. Si (4.28)

un an+1 0 un+1

1 a diverge, luego i i=1 ui diverge. La prueba de este poderoso test es simple y queda como ejercicio. Si las constantes positivas an de la prueba de Kummer son elegidas como an = n, tenemos la prueba de Raabe.

4.2.6

Prueba de Raabe.
un 1 un+1

Si un > 0 y si n P >1, (4.29)

118

CAP ITULO 4. SERIES INFINITAS.


i

para todo n N , donde N es un entero positivo independiente de n, entonces Si un n 1 1 , un+1 entonces i ui diverge ( n1 diverge). La forma en l mite en el test de Raabe es un lim n 1 n un+1

ui converge. (4.30)

=P .

(4.31)

Tenemos convergencia para P > 1, y divergencia para P < 1, y no hay prueba para P = 1 exactamente como con el test de Kummer. Esta indeterminancia est a expresada en que podemos encontrar ejemplos de una serie convergente y una divergente en que ambas series tienden a P = 1 en la ecuaci on (4.31). 1 El test de Raabe es m as sensible que la prueba de la raz on de DAlembert ya que n=1 n diverge m as lentamente que n=1 1. Obtenemos una prueba a un m as sensible (y una relativamente f acil de aplicar) si escogemos an = n ln n. Esto es la prueba de Gauss.

4.2.7

Prueba de Gauss.
h B (n) un =1+ + 2 , un+1 n n

Si un > 0 para todo n nito y (4.32)

en el cual B (n) es una funci on acotada de n para n , luego i ui converge para h > 1 y diverge para h 1. La raz on un /un+1 de la ecuaci on (4.32) a menudo llega a ser como la raz on de dos formas cuadr aticas: un n 2 + a1 n + a0 = 2 . (4.33) un+1 n + b1 n + b0 Se puede mostrar que tenemos convergencia para a1 > b1 + 1 y divergencia para a1 b1 + 1. El test de Gauss es un test extremadamente sensible para la convergencia de series. Esto funcionar a para pr acticamente todas las series que encontraremos en F sica. Para h > 1 o h < 1 la prueba se deduce directamente del test de Raabe
n

lim n 1 +

h B (n) B (n) + 2 1 = lim h + =h. n n n n

(4.34)

Si h = 1, falla el test de Raabe. Sin embargo, si volvemos al test de Kummer y usamos an = n ln n, tenemos 1 B (n) + 2 (n + 1) ln(n + 1) n n n (n + 1) = lim n ln n (n + 1) ln(n + 1) n n 1 = lim (n + 1) ln n ln n ln 1 + . n n lim n ln n 1 +

(4.35)

4.2. PRUEBAS DE CONVERGENCIA

119

Pidiendo prestado un resultado de la secci on 4.6 (el cual no es dependiente de la prueba de Gauss) tenemos
n

lim (n + 1) ln 1 +

1 n

= lim (n + 1)
n

1 1 1 2 + 3 ... n 2n 3n

= 1 < 0 .

(4.36)

De modo que tenemos divergencia para h = 1. Esto es un ejemplo de una aplicaci on exitosa del test de Kummer en el cual el test de Raabe falla. Ejemplo Series de Legendre. La relaci on de recurrencia para la soluci on en serie de la ecuaci on de Legendre pueden ser colocadas en la forma a2j +2 2j (2j + 1) l(l + 1) = . a2 j (2j + 1)(2j + 2) Esto es equivalente a u2j +2 /u2j para x = +1. Para j l (4.38) (4.37)

a2 j (2j + 1)(2j + 2) 2j + 2 1 = =1+ . a2j +2 2j (2j + 1) 2j j

Por la ecuaci on (4.33) la serie es divergente. M as adelante exigiremos que las series de Legendre sean nitas (se corten) para x = 1. Eliminaremos la divergencia ajustando los par ametros n = 2j0 , un entero par. Esto truncar a la serie, convirtiendo la serie innita en un polinomio.

4.2.8

Mejoramiento de convergencia.

En esta secci on no nos preocupar a establecer la convergencia como una propiedad matem atica abstracta. En la pr actica, la raz on de convergencia puede ser de considerable importancia. Aqu presentamos un m etodo que mejora la raz on de la convergencia de una serie ya convergente. El principio b asico de este m etodo, debido a Kummer, es formar una combinaci on lineal de nuestra serie lentamente convergente y una o m as series cuya suma es conocida. Entre las series conocidas la colecci on

1 =
n=1

1 =1, n(n + 1) 1 1 = , n(n + 1)(n + 2) 4 1 1 = , n(n + 1)(n + 2)(n + 3) 18 . . . 1 1 = , n(n + 1)(n + 2) (n + p) p p!

2 =
n=1

3 =
n=1

. . .

p =
n=1

120

CAP ITULO 4. SERIES INFINITAS.

es particularmente u til. Las series est an combinadas t ermino a t ermino y los coecientes en combinaci on lineal son escogidos para cancelar los t erminos que convergen lentamente. Ejemplo Funci on zeta de Riemann, (3).
3 Sea la serie a ser sumada on 4.10 est a identicada como una funci on n=1 n . En la secci zeta de Riemann, (3). Formamos una combinaci on lineal

n3 + a2 2 =
n=1 n=1

n 3 +

a2 . 4

1 no est a incluida ya que converge m as lentamente que (3). Combinando t erminos, obtenemos sobre la mano izquierda

n=1

1 a2 + 3 n n(n + 1)(n + 2)

=
n=1

n2 (1 + a2 ) + 3n + 2 . n3 (n + 1)(n + 2)

Si escogemos a2 = 1, la ecuaci on precedente tiende a

(3) =
n=1

n 3 =

1 3n + 2 + . 4 n=1 n3 (n + 1)(n + 2)

(4.39)

La serie resultante no es muy bonita pero converge como n4 , apreciablemente m as r apido 3 que n . El m etodo puede ser extendido incluyendo a3 3 para obtener la convergencia como n5 , a4 4 para obtener la convergencia como n6 , etc. Eventualmente, usted tiene que alcanzar un compromiso entre cuanta algebra usted hace y cuanta aritm etica la computadora hace. Como las computadoras lo hacen m as r apido, el balance est a seguramente sustituyendo menos algebra hecha por usted por m as aritm etica realizada por el computador.

4.3

Series alternadas.

En la secci on 4.2 nos limitamos a series de t erminos positivos. Ahora, en contraste, consideraremos series innitas en las cuales los signos se alternan. La cancelaci on parcial debido a la alternancia de los signos hace la convergencia m as r apida y mucho m as f acil de identicar. Probaremos que el criterio de Leibniz es una condici on general para la convergencia de una serie alternada.

4.3.1

Criterio de Leibniz.

n+1 Consideremos la serie an con an > 0. Si an es mon otonamente decreciente (para n=1 (1) N sucientemente grande) y el limn an = 0, entonces la serie converge. Para probar esto, examinemos las sumas parciales pares

s2n = a1 a2 + a3 . . . a2n , s2n+2 = s2n + (a2n+1 a2n+2 ) .

(4.40)

4.3. SERIES ALTERNADAS. Ya que a2n+1 > a2n+2 , tenemos s2n+2 > s2n . Por otra parte, s2n+2 = a1 (a2 a3 ) (a4 a5 ) . . . a2n+2 . De modo que, con cada par de t erminos a2p a2p+1 > 0, s2n+2 < a1 .

121

(4.41)

(4.42)

(4.43)

Con las sumas parciales pares acotamos s2n < s2n+2 < a1 y los t erminos an decrecen mon otonamente aproxim andose a cero, esta serie alternada converge. Un resultado m as importante puede ser extra do de las sumas parciales. A partir de las diferencias entre el l mite de la serie S y las sumas parciales sn S sn = an+1 an+2 + an+3 an+4 + . . . = an+1 (an+2 an+3 ) (an+4 an+5 ) . . . o S sn < an+1 . (4.45) (4.44)

La ecuaci on (4.45) dice que el error en el corte de una serie alternada despu es de n t erminos es menor que an+1 , el primer t ermino exclu do. Un conocimiento del error obtenido de esta manera puede ser de gran importancia pr actica.

4.3.2

Convergencia absoluta.

Dada una serie en t erminos de un en la cual un puede variar en signo, si |un | converge, entonces un se dice que es absolutamente convergente. Si un converge pero |un | diverge, la convergencia recibe el nombre de condicional. La serie alternada arm onica es un ejemplo simple de esta convergencia condicionada. Tenemos

(1)n1 n1 = 1
n=1

1 1 1 1 + + + 2 3 4 n

(4.46)

convergente por el criterio de Leibniz, pero

n 1 = 1 +
n=1

1 1 1 1 + + + + + 2 3 4 n

se ha demostrado que es divergente en la secci on 4.1 y 4.2. Podemos notar que todas las pruebas desarrolladas en la secci on 4.2 supone una serie de t erminos positivos. Por lo tanto, todas las pruebas en esa secci on garantizan la convergencia absoluta.

122 Ejemplo Para 0 < x < la serie de Fourier

CAP ITULO 4. SERIES INFINITAS.

n=1

cos(nx) x = ln 2 sen n 2

(4.47)

converge teniendo coecientes que cambian de signo frecuentemente, pero no tanto para que el criterio de convergencia de Leibniz se aplique f acilmente. Apliquemos el test de la integral de la ecuaci on (4.22). Usando integraci on por partes vemos de inmediato que
1

sen(nx) cos(nx) dn = n nx

1 x

sen(nx) dn n2

converge para n , y la integral del lado derecho incluso converge absolutamente. El t ermino derivado en la ecuaci on (4.22) tiene la forma
1

x cos(nx) (n [n]) sen(nx) n n2

dn ,

donde el segundo t ermino converge absolutamente y no necesita ser considerado. Lo pr oN ximo es observar que g (N ) = 1 (n [n]) sen(nx) dn es acotado para N , tal como N sen(nx) dn es acotado debido a la naturaleza peri odica de sen(nx) y a su regular cambio de signo. Usando integraci on por partes nuevamente
1

g (n) g (n) dn = n n

+
1 1

g (n) dn , n2

vemos que el segundo t ermino es absolutamente convergente, y el primero va a cero en el l mite superior. Por lo tanto la serie en la ecuaci on (4.47) converge, lo cual es duro de ver usando otro test de convergencia.

4.4

Algebra de series.

Establecer la convergencia absoluta es importante porque puede probarse que las series absolutamente convergentes pueden ser manipuladas de acuerdo a las reglas familiares del algebra o aritm etica. 1. Si una serie innita es absolutamente convergente, la suma de la serie es independiente del orden en el cual los t erminos son a nadidos. 2. La serie puede ser multiplicada por otra serie absolutamente convergente. El l mite del producto ser a el producto de los l mites de las series individuales. El producto de las series, una doble serie, tambi en ser a absolutamente convergente. No hay tales garant as en series condicionalmente convergentes. Nuevamente consideremos la serie arm onica alternada. Si escribimos 1 1 1 1 + + = 1 2 3 4 1 1 2 3 1 1 4 5 , (4.48)

4.4. ALGEBRA DE SERIES. es claro que la suma

123

(1)n1 n1 < 1 .
n=1

(4.49)

Sin embargo, si rearreglamos los t erminos sutilmente, podemos hacer que la serie arm onica alternada converja a 3/2. Reagrupamos los t erminos de la ecuaci on (4.48), tomando 1+ 1 1 + 3 5 1 + 2 + 1 1 1 1 1 + + + + 7 9 11 13 15 1 1 1 + + + 17 25 6 1 4 1 + . 8

1 1 + + 27 35

(4.50)

Tratando los t erminos agrupados en par entesis como t erminos simples por conveniencia, obtenemos las sumas parciales s1 s3 s5 s7 s9 = 1.5333 = 1.5218 = 1.5143 = 1.5103 = 1.5078 s2 = 1.0333 s4 = 1.2718 s6 = 1.3476 s8 = 1.3853 s10 = 1.4078

A partir de esta tabulaci on de los sn y el gr aco de sn versus n en la gura 4.3 es clara la convergencia a 3/2. Hemos rearreglado los t erminos, tomando t erminos positivos hasta que la suma parcial sea igual o mayor que 3/2, luego sumando los t erminos negativos hasta que la suma parcial caiga bajo 3/2, etc. Como las series se extienden hasta innito, todos los t erminos originales eventualmente aparecer an, pero las sumas parciales de este reordenamiento de esta serie arm onica alternada converge a 3/2. Por un reordenamiento de t erminos una serie condicionalmente convergente podr a ser hecha para converger a alg un valor deseado o para que diverja. Esta armaci on es dada como el teorema de Riemann. Obviamente, series condicionalmente convergentes deber an ser tratadas con precauci on.

4.4.1
La serie

Mejoramiento de la convergencia, aproximaciones racionales.

ln(1 + x) =
n=1

(1)n1

xn , n

1 < x 1 ,

(4.51)

converge muy suavemente cuando x se aproxima a +1. La raz on de convergencia podr a ser mejorada sustancialmente multiplicando ambos lados de la ecuaci on (4.51) por un polinomio y ajustando los coecientes del polinomio para cancelar las porciones que convergen m as lentamente en la serie. Consideremos la posibilidad m as simple: Multiplicar ln(1 + x) por 1 + a1 x .

(1 + a1 x) ln(1 + x) =
n=1

(1)

n1 x

+ a1
n=1

(1)n1

xn+1 . n

124

CAP ITULO 4. SERIES INFINITAS.

1.5

1.4

1.3 2 4 6 8 10

Figura 4.3: Serie arm onica alternada, rearreglo de t erminos para dar convergencia a 1.5.

Combinando las dos series sobre la derecha t ermino a t ermino, obtenemos

(1 + a1 x) ln(1 + x) = x +
n=2

(1)n1 (1)n1
n=2

1 a1 n n1

xn

=x+

n(1 a1 ) 1 n x . n(n 1)

Claramente, si tomamos a1 = 1, el n en el numerador desaparece y nuestra serie combinada converge como n2 . Continuando este proceso, encontramos que (1 + 2x + x2 ) ln(1 + x) se anula como n3 , (1 + 3x + 3x2 + x3 ) ln(1 + x) se anula cuando n4 . En efecto estamos desplaz andonos desde una expansi on de serie simple de la ecuaci on (4.51) a una representaci on racional en la cual la funci on ln(1 + x) est a representada por la raz on de una serie y un polinomio: x+ ln(1 + x) = (1)n xn n(n 1) n=1 1+x

Tales aproximaciones racionales pueden ser amba compactas y precisas. Los programas computacionales hacen extensivo el uso de ellas.

4.4.2

Reordenamiento de series dobles.

Otro aspecto del reordenamiento de series aparece en el tratamiento de series dobles (gura 4.4):

an,m .
m=0 n=0

4.4. ALGEBRA DE SERIES.

125

m= 0 n= 0 a00 1 2 3 a10 a20 a30

1 a01 a11 a21 a31

2 a02 a12

3 a03 a13

a22 a23 a32 a33

Figura 4.4: Series dobles, la suma sobre n es indicada por l neas segmentadas verticales.

sustituyamos n=q0, m=pq 0 , (q p) . Esto resulta en la identidad


p

an,m =
m=0 n=0 p=0 q =0

aq,pq .

(4.52)

La suma sobre p y q de la ecuaci on (4.52) est a ilustrada en la gura 4.5. La sustituci on

p= 0 q= 0 a00 1 2 3

1 a01 a10

2 a02 a11

3 a03 a12

a20 a21 a30

Figura 4.5: Series dobles nuevamente, la primera suma es representada por l neas segmentadas verticales pero estas l neas verticales corresponden a las diagonales en la gura 4.4.

126

CAP ITULO 4. SERIES INFINITAS.

n=s0, tiende a

m = r 2s 0 ,

r 2

[r/2]

an,m =
m=0 n=0 r =0 s=0

as,r2s .

(4.53)

con [r/2] = r/2 para r par, (r 1)/2 para r impar. La suma sobre r y s de la ecuaci on (4.53) est a mostrada en la gura 4.6. Las ecuaciones (4.52) y (4.53) son claramente reordenamientos del arreglo de coecientes an,m , reordenamientos que son v alidos en tanto tengamos convergencia absoluta. La combinaci on de las ecuaciones (4.52) y (4.53),

r= 0 1 2 3 4 s= 0 a00 a01 a02 a03 a04 1 2 a10 a11 a12 a20

Figura 4.6: Series dobles. La suma sobre s corresponde a la suma a lo largo de la l neas segmentadas inclinadas, en la gura 4.4.

[r/2]

aq,pq =
p=0 q =0 r=0 s=0

as,r2s .

(4.54)

es usada en la determinaci on de la forma en serie de los polinomios de Legendre.

4.5

Series de funciones.

Extendemos nuestro concepto de series innitas para incluir la posibilidad que cada t ermino un pueda ser una funci on de alguna variable, un = un (x). Numerosas ilustraciones de tales series de funciones aparecer an m as adelante. Las sumas parciales llegan a ser funciones de la variable x sn (x) = u1 (x) + u2 (x) + + un (x) , (4.55)

4.5. SERIES DE FUNCIONES.

127

tal como lo hacemos para la suma de serie, denimos el l mite como el l mite de las sumas parciales

un (x) = S (x) = lim sn (x) .


n=1 n

(4.56)

Hasta ahora nos hemos ocupado del comportamiento de las sumas parciales como una funci on de n. Ahora consideremos c omo las cantidades anteriores dependen de x. Aqu el concepto clave es la convergencia uniforme.

4.5.1

Convergencia uniforme.

Si para cualquier > 0 peque no, existe un n umero N , independiente de x en el intervalo [a, b] con (a x b) tal que | S (x) sn (x) | < , n N , (4.57)

se dice que la serie converge uniformemente en el intervalo [a, b]. Esto dice que para que nuestra serie sea uniformemente convergente, debe ser posible encontrar un N nito tal que no para la cola de la serie innita, | i=N +1 ui (x)|, sea menor que un arbitrariamente peque todo x en el intervalo dado. Esta condici on, ecuaci on (4.57), la cual dene la convergencia uniforme, es ilustrada en la gura 4.7. El punto es que no importa cuan peque no sea podemos siempre tomar un n sucientemente grande tal que la magnitud absoluta de la diferencia entre S (x) y sn (x) sea menor que para todo x, a x b. Si esto no puede ser hecho, entonces un (x) no es uniformemente convergente en el intervalo [a, b].

S(x) + S(x) S(x) x x=a x=b


Figura 4.7: Convergencia uniforme.

sn (x)

128 Ejemplo

CAP ITULO 4. SERIES INFINITAS.

un (x) =
n=1 n=1

x . [(n 1)x + 1][nx + 1]

(4.58)

La suma parcial sn (x) = nx(nx + 1)1 puede ser vericada por inducci on matem atica. Por inspecci on esta expresi on para sn (x) es v alida para n = 1, 2. Suponemos que se mantiene para el t ermino n y probamos para n + 1. sn+1 = sn + x [nx + 1][(n + 1)x + 1] nx x = + [nx + 1] [nx + 1][(n + 1)x + 1] (n + 1)x = , (n + 1)x + 1

completando la prueba. Tomando n tenemos S (0) = lim sn (0) = 0 ,


n n

S (x = 0) = lim sn (x = 0) = 1 . Tenemos una discontinuidad en el l mite de la serie en x = 0. Sin embargo, sn (x) es una funci on continua de x, en el intervalo 0 x < 1, para todo n nito. La ecuaci on (4.57) con sucientemente peque no, ser a violado para todo n nito. Nuestra serie no converge uniformemente.

4.5.2

Prueba M de Weierstrass.

La prueba m as com unmente usada para la convergencia uniforme es la prueba M de Weierstrass. Si podemos construir una serie de n umeros 1 Mi , en la cual Mi |ui (x)| para todo x en el intervalo [a, b] y 1 Mi es convergente, nuestra serie a uniformemente 1 ui (x) ser convergente en [a, b]. La prueba de este test M de Weierstrass es directa y simple. Ya que i Mi converge, existen algunos n umeros N tal que n + 1 N ,

Mi < .
i=n+1

(4.59)

Esto a partir de nuestra denici on de convergencia. Entonces, con |ui (x)| Mi para todo x en el intervalo a x b,

|ui (x)| < .


i=n+1

(4.60)

4.5. SERIES DE FUNCIONES. De modo que

129

|S (x) sn (x)| =
i=n+1

ui (x) < ,

(4.61)

y por denici on 1 ui (x) es uniformemente convergente en [a, b]. Ya que tenemos especicados valores absolutos en el planteamiento de la prueba M de Weierstrass, la serie 1 ui (x) tambi en es vista como serie absolutamente convergente. Podemos notar que la convergencia uniforme y convergencia absoluta son propiedades independientes. Una no implica la otra. Para ejemplos espec cos,

n=1

(1)n , n + x2

< x <

(4.62)

(1)n1
n=1

xn = ln(1 + x) , n

0x1,

(4.63)

converge uniformemente en los intervalos indicados pero no converge absolutamente. Por otra parte,

(1 x)xn =
n=1

1, 0,

0x<1 , x=1

(4.64)

converge absolutamente pero no uniformemente en [0, 1]. A partir de la denici on de convergencia uniforme podr amos mostrar que cualquier serie

f (x) =
n=1

un (x) ,

(4.65)

no puede converger uniformemente en ning un intervalo que incluya una discontinuidad de f (x). Ya que la prueba M de Weierstrass establece tanto la convergencia uniforme como absoluta, necesariamente falla para series que son uniformes pero condicionalmente convergentes.

4.5.3

Prueba de Abel.
un (x) = an fn (x) , an = A , convergente,

Una prueba algo m as delicada para la convergencia uniforme ha sido dada por Abel. Si

y las funciones f (x) son mon otonas [fn+1 (x) fn (x)] y acotadas, 0 fn (x) M , para todo x en [a, b], entonces un (x) converge uniformemente en [a, b]. Las series uniformemente convergentes tienen tres propiedades particularmente u tiles.

130

CAP ITULO 4. SERIES INFINITAS.

1. Si los t erminos individuales un (x) son continuos, la suma de la serie

f (x) =
n=1

un (x) ,

(4.66)

es tambi en continua. 2. Si los t erminos individuales un (x) son continuos, las series pueden ser integradas t ermino a t ermino. La suma de las integrales es igual a la integral de la suma.
b b

f (x) dx =
a n=1 a

un (x)dx .

(4.67)

3. Las derivadas de la suma de la serie f (x) es igual a la suma de los t erminos individuales derivados, df (x) = dx

n=1

dun (x) , dx

(4.68)

siempre que las siguientes condiciones sean satisfechas: dun (x) un (x) y son continuas en [a, b]. dx dun (x) es uniformemente convergente en [a, b]. dx n=1 La integraci on t ermino a t ermino de una serie uniformemente convergente2 requiere s olo continuidad de los t erminos individuales. Esta condici on casi siempre es satisfecha en las aplicaciones f sicas. La diferenciaci on t ermino a t ermino de una serie a menudo no es v alida porque deben satisfacer condiciones m as restrictivas. Por cierto, encontraremos casos en series de Fourier, en la cual la diferenciaci on t ermino a t ermino de una serie uniformemente convergente tiende a una serie divergente.

4.6

Expansi on de Taylor.

Esta es una expansi on de una funci on en una serie innita o en una serie nita m as un t ermino remanente. Los coefeicientes de los t erminos sucesivos de la serie involucra las derivadas sucesivas de la funci on. Este tipo de expansiones de son ampliamente usadas. Ahora derivaremos la expansi on de Taylor. Supongamos que nuestra funci on f (x) tiene una derivada n- esima continua en el intervalo a x b. Entonces, integrando esta n- esima derivada n veces,
x x

f (n) (x) dx = f (n1) (x)


a x a a x a

= f (n1) (x) f (n1) (a)


x

f (n) (x) dx dx = =f
2

[f (n1) (x) f (n1) (a)]dx


a (n2)

(4.69)

(x) f (n2) (a) (x a)f (n1) (a) .

La integraci on t ermino a t ermino tambi en puede ser v alida en ausencia de convergencia uniforme.

DE TAYLOR. 4.6. EXPANSION Continuando, obtenemos


x

131

f
a

(n)

(x)(dx) = f

(n3)

(x) f

(n3)

(a) (x a)f

(n2)

(x a)2 (n1) f (a) . (a) 2 (4.70)

Finalmente, integrando por n- esima vez,


x

f (n) (x)(dx)n = f (x) f (a) (x a)f (a) + (x a)2 (x a)n1 (n1) f (a) f (a) . 2! (n 1)! (4.71)

Note que esta expresi on es exacta. No hay t erminos que hayan sido exclu dos, ni aproximaciones hechas. Ahora, resolviendo para f (x), tenemos f (x) = f (a) + (x a)f (a) + (x a)n1 (n1) (x a)2 f (a) + + f (a) + Rn . 2! (n 1)! (4.72)

El remanente, Rn , est a dado por la integral n-dimensional


x

f (n) (x)(dx)n .

(4.73)

Este remanente, ecuaci on (4.73), puede ser puesto en una forma m as inteligible usando la forma integral del teorema del valor medio
x

g (x) dx = (x a)g ( ) ,
a

(4.74)

con a x. Integrando n veces obtenemos la forma Lagrangiana del remanente: Rn = (x a)n (n) f ( ) . n! (4.75)

Con la expansi on de Taylor en esta forma no estamos interesados en cualquier pregunta de convergencia de series innitas. Esta serie es nita, la sola pregunta que nos importa es la magnitud del remanente. Cuando la funci on f (x) es tal que
n

lim Rn = 0 ,

(4.76)

la ecuaci on (4.72) se convierte en la serie de Taylor f (x) = f (a) + (x a)f (a) +

(x a)2 f (a) + 2!

=
n=0

(x a)n (n) f (a) . n!

(4.77)

132

CAP ITULO 4. SERIES INFINITAS.

Nuestra serie de Taylor especica el valor de una funci on en un punto, x, en t erminos del valor de la funci on y sus derivadas en un punto de referencia, a. Esta es una expansi on en potencias de un cambio en la variable, x = x a en este caso. La notaci on puede ser variada seg un la conveniencia del usuario. Con la sustituci on x x + h y a x tenemos una forma alterna

f (x + h) =
n=0

hn (n) f (x) . n!

Cuando usamos el operador D = d/dx la expansi on de Taylor se convierte en

f (x + h) =
n=0

hn Dn f (x) = ehD f (x) . n!

Un forma en operadores equivalente de la expansi on e Taylor. Una derivaci on de la expansi on de Taylor en el contexto de la teor a de variable compleja aparece en el pr oximo cap tulo.

4.6.1

Teorema de Maclaurin.

Si expandimos alrededor del origen (a = 0), la ecuaci on (4.77) es conocida como la serie de Maclaurin x2 f (x) = f (0) + xf (0) + f (0) + 2! xn (n) = f (0) . n ! n=0

(4.78)

Una aplicaci on inmediata de la serie de Maclaurin (o serie de Taylor) est a en la expansi on de varias funciones transcendentales en una serie innita. Ejemplo Sea f (x) = ex . Diferenciando, tenemos f (n) (0) = 1 , para todo n, n = 1, 2, 3 . . . . Entonces, para la ecuaci on (4.78), tenemos x2 x3 + + = e =1+x+ 2! 3!
x

(4.79)

n=0

xn . n!

(4.80)

Esta es la expansi on en serie de la funci on exponencial. Algunos autores usan esta serie para denir la funci on exponencial. Aunque esta serie es claramente convergente para todo x, podriamos chequear el t ermino remanente, Rn . Por la ecuaci on (4.75) tenemos Rn = xn (n) f ( ) n! xn = e , 0 || x . n! (4.81)

DE TAYLOR. 4.6. EXPANSION Por lo tanto xn x | Rn | e n! y


n

133

(4.82)

lim Rn = 0

(4.83)

para todo los valores nitos de x, el cual indica que esta expansi on de Maclaurin de ex es v alida sobre el intervalo < x < . Ejemplo Sea f (x) = ln(1 + x). Diferenciando, obtenemos f (x) = f
(n)

1 , (1 + x)
n1

(x) = (1)

1 . (n 1)! (1 + x)n

(4.84)

La expansi on de Maclaurin produce ln(1 + x) = x x2 x3 x4 + + + Rn 2 3 4 n xp = (1)p1 + Rn . p p=1

(4.85)

En este caso el remanente est a dado por Rn = xn (n) f ( ) , 0 x n! xn , 0x1. n (4.86)

Ahora el remanente se aproxima a cero cuando n crece indenidamente, dado 0 x 13 . Como una serie innita

ln(1 + x) =
n=1

(1)n1

xn , n

(4.87)

la cual converge para 1 < x 1. El intervalo 1 < x < 1 es f acilmente establecido por la prueba de la raz on de D Alembert. La convergencia en x = 1 se deduce a partir del criterio de Leibniz. En particular, en x = 1, tenemos ln 2 = 1 1 1 1 1 + + 2 3 4 5 1 = (1)n 1 , n n=1

(4.88)

la serie arm onica alterna condicionalmente convergente.


3

Este intervalo puede ser f acilmente extendido a 1 < x 1 pero no a x = 1.

134

CAP ITULO 4. SERIES INFINITAS.

4.6.2

Teorema Binomial.

Una segunda, aplicaci on extremadamente importante de las expansiones de Taylor y Maclaurin es la derivaci on del teorema binomial para potencias negativas y/o noenteras. Sea f (x) = (1 + x)m , en la cual m puede ser negativo y no est a limitado a valores integrables. La aplicaci on directa de la ecuaci on (4.78) da (1 + x)m = 1 + mx + Para esta funci on el remanente es Rn = xn (1 + )mn m(m 1) (m n + 1) n! (4.90) m(m 1) 2 x + + Rn . 2! (4.89)

y con 0 x. Ahora, para n > m, (1 + )mn es un m aximo para = 0. Por lo tanto Rn xn m(m 1) (m n + 1) . n! (4.91)

Note que los factores dependientes de m no dan un cero a menos que m sea entero no negativo; Rn tiende a cero cuando n si x est a restringido al intervalo 0 x 1. La expansi on binomial resulta (1 + x)m = 1 + mx + En otra, notaci on equivalente

m(m 1) 2 m(m 1)(m 2) 3 x + x + . 2! 3!

(4.92)

(1 + x) =
n=0

m! xn n!(m n)! m n x . n

(4.93)

=
n=0

La cantidad m , la cual igual a m!/(n!(m n)!) es llamado el coeciente binomial. Aunque n hemos mostrado solamente que el remanente se anula,
n

lim Rn = 0 ,

para 0 x < 1, la serie en la ecuaci on (4.92) realmente puede mostrarse que converge en el intervalo extendido 1 < x < 1. Para m un entero, (m n)! = si n > m y las series automaticamente terminan en n = m. Ejemplo Energ a relativista. La energ a total relativista de una part cula es E = mc
2

v2 1 2 c

1 /2

(4.94)

DE TAYLOR. 4.6. EXPANSION Comparemos esta ecuaci on con la energ a cin etica cl asica, Por la ecuaci on (4.92) con x = E = mc2 1 + o 1 3 v2 5 E = mc + mv 2 + mv 2 2 + mv 2 2 8 c 16
2

135 1 2 mv . 2

v2 1 y m = tenemos 2 c 2 v2 c2 +

1 2

(1/2)(3/2) 2! v2 c2
3

v2 c2

(1/2)(3/2)(5/2) 3!

v2 c2

+ .

(4.95)

El primer t ermino, mc2 , lo identicamos como la masa en reposo. Entonces 1 2 3 v2 5 mv 1 + + Ecin = etica 2 4 c2 8 v2 c2
2

(4.96)

Para la velocidad de la part cula v c, donde c es la velocidad de la luz, la expresi on en los par entesis cuadrados se reduce a la unidad y vemos que la porci on cin etica de la energ a relativista total concuerda con el resultado cl asico. Para polinomios podemos generalizar la expansi on binomial a (a1 + a2 + + am )m = n! m an1 an2 an m , n 1 !n 2 ! n m ! 1 2

donde la suma incluye todas las combinaciones diferentes de n1 , n2 , . . . , nm con m i=1 ni = n. Aqu ni y n son enteros. Esta generalizaci on encuentra considerables usos en Mec anica Estad stica. Las series de Maclaurin puede aparecer algunas veces indirectamente m as que el uso directo de la ecuaci on (4.78). Por ejemplo, la manera m as conveniente para obtener la expansi on en serie

sen

x=
n=0

(2n 1)!! x2n+1 x3 3x5 =x+ + + , (2n)!! 2n + 1 6 40

(4.97)

es hacer uso de la relaci on


x

sen1 x =
0

dt . (1 t2 )1/2

Expandimos (1 t2 )1/2 (teorema binomial) y luego integramos t emino a t ermino. Esta integraci on t ermino a t ermino es discutida en la secci on 4.7. El resultado es la ecuaci on (4.97). Finalmente, podemos tomar el l mite cuando x 1. La serie converge por la prueba de Gauss.

136

CAP ITULO 4. SERIES INFINITAS.

4.6.3

Expansi on de Taylor de m as de una variable.

La funci on f tiene m as de una variable independiente, es decir, f = f (x, y ), la expansi on de Taylor se convierte en f (x, y ) = f (a, b) + (x a) f f + (y b) + x x 1 2f 2f 2f + (x a)2 2 + 2(x a)(y b) + (y b)2 2 + 2! x xy y 3 3 1 f f + (x a)3 3 + 3(x a)2 (y b) 2 + 3! x x y 3 3f 3 f +3(x a)(y b)2 + ( y b ) + , xy 2 y 3

(4.98)

con todas las derivadas evaluadas en el punto (a, b). Usando j t = xj xj 0 , podemos escribir la expansi on de Taylor para m variables independientes en la forma simb olica

f (xj ) =
n=0

tn n!

i=1

i xi

f (xk )
xk = xk 0

(4.99)

Una forma vectorial conveniente es

(r + a) =
n=0

1 (a )n (r) . n!

(4.100)

4.7

Series de potencias.

Las series de potencias son un tipo especial y extremadamente u til de series innitas de la forma f (x) = a0 + a1 x + a2 x2 + a3 x3 + =
n=0

an xn ,

(4.101)

donde los coecientes ai son constantes e independientes de x.4

4.7.1

Convergencia.

La ecuaci on (4.101) puede testearse r apidamente para la convergencia ya sea por la prueba de la ra z de Cauchy o por la prueba de la raz on de D Alembert. Si an+1 = R 1 , n an lim
4

(4.102)

La ecuaci on (4.101) puede ser reescrita con z = x + iy , reemplazando a x. Luego todos los resultados de esta secci on se aplican a series complejas

4.8. CONVERGENCIA UNIFORME Y ABSOLUTA.

137

la serie converge para R < x < R. Este es el intervalo o radio de convergencia. Ya que las prueba de la ra z y la raz on falla cuando el l mite es la unidad, el punto nal del intervalo requiere atenci on especial. Por ejemplo, si an = n1 , entonces R = 1 y, la serie converge para x = 1 pero diverge para x = +1. Si an = n!, entonces R = 0 y la serie diverge para todo x = 0.

4.8

Convergencia uniforme y absoluta.

Supongamos que nuestra serie de potencia sea convergente para R < x < R; entonces ser a uniforme y absolutamente convergente en cualquier intervalo interior, S x S , donde 0 < S < R. Esto podr a ser probado directamente por la prueba M de Weierstrass usando i Mi = |ai |S .

4.8.1

Continuidad.

Ya que cada t ermino un (x) = an xn es una funci on continua de x y f (x) = an xn converge uniformemente para S x S , f (x) deber a ser una funci on continua en el intervalo de convergencia uniforme. Este comportamiento es contradictorio con el comportamiento impresionantemente diferente de las series de Fourier, en el cual las series de Fourier son usadas frecuentemente para representar funciones discontinuas tales como ondas cuadradas y ondas dientes de sierra.

4.8.2

Diferenciaci on e integraci on.

Con un (x) continua y an xn uniformemenete convergente, encontramos que la serie difeerenciada es una serie de potencia con funciones continuas y del mismo radio de convergencia que la serie original. Los nuevos factores introducidos por diferenciaci on (o integraci on) no afecta ni a la prueba de la raiz ni a la de la raz on. Por lo tanto nuestra serie podr a ser diferenciada o integrada tan a menudo como uno deseemos dentro del intervalo de convergencia uniforme. En vista de las restricciones algo severas puestas en la diferenciaci on, esto es un resultado valioso y notable.

4.8.3

Teorema de la singularidad.

En la seccion precedente, usando las series de Maclaurin, expandimos ex y ln(1 + x) en series innitas. En los cap tulos venideros las funciones son frecuentemente representadas e incluso denidas por series innitas. Ahora estableceremos que la representaci on de la serie de potencias es u nica.

138 Si

CAP ITULO 4. SERIES INFINITAS.

f (x) =
n=0

an x n , bn x n ,
n=0

Ra < x < Ra (4.103) Rb < x < Rb ,

con intervalos de convergencia sobrepuestos, incluyendo el origen, luego an = b n , (4.104)

para todo n; esto es, supongamos dos representaciones de serie de potencias (diferentes) y luego procedamos a demostrar que las dos son id enticas. De la ecuaci on (4.103)

an x n =
n=0 n=0

bn x n ,

R < x < R

(4.105)

donde R es el m as peque no entre Ra , Rb . Haciendo x = 0 para eliminar todo salvo el t ermino constante, obtenemos a0 = b 0 . (4.106)

Ahora, aprovechandose de la diferenciabilidad de nuestra serie de potencia, diferenciamos la ecuaci on (4.105), obteniendo

nan x
n=1

n1

=
n=1

nbn xn1 .

(4.107)

De nuevo ajustamos x = 0 para aislar el nuevo t ermino constante y encontramos a1 = b 1 . Repitiendo este proceso n veces, obtenemos an = b n , (4.109) (4.108)

lo cual muestra que las dos series coinciden. Por lo tanto nuestra representaci on en serie de potencia es u nica. Esto ser a un punto crucial cuando usamos una serie de potencia para desarrollar soluciones de ecuaciones diferenciales. Esta unicidad de las series de potencia aparece frecuentemente en f sica teorica. La teor a de perturbaciones en Mec anica Cu antica es un ejemplo de esto. La representaci on en serie de potencia de funciones es a menudo u til en formas de evaluaci on indeterminadas, particularmente cuando la regla de lHospital puede ser inconveniente de aplicar.

4.8. CONVERGENCIA UNIFORME Y ABSOLUTA. Ejemplo Evaluemos 1 cos x . x0 x2 lim Remplazando cos x por su expansi on en serie de Maclaurin, obtenemos 1 (1 x2 /2! + x4 /4! ) 1 cos x = x2 x2 2 4 x /2! x /4! + = x2 1 x2 = + . 2! 4! Tomando x 0, tenemos 1 1 cos x = . 2 x0 x 2 lim

139

(4.110)

(4.111)

La unicidad de las series de potencia signica que los coecientes an pueden ser identicadas con las derivadas en una serie de Maclaurin. A partir de

f (x) =
n0

an x n =
n=0

1 (n) f (0)xn n!

tenemos an = 1 (n) f (0) . n!

4.8.4

Inversi on de series de potencia.


y y0 = a1 (x x0 ) + a2 (x x0 )2 +

Supongamos que dada una serie

=
n=1

an (x x0 )n .

(4.112)

Esta dada (y y0 ) en t erminos de (x x0 ). Sin embargo, podr a ser deseable tener una expresi on expl cita para (x x0 ) en t erminos de (y y0 ). Podr amos resolver la ecuaci on (4.112) para (x x0 ) por inversi on de nuestra serie. Supongamos que

x x0 =
n=0

bn (y y0 )n ,

(4.113)

con bn determinado en t erminos de la supuestamente conocidos an . Una aproximaci on a fuerza bruta, la cual es perfectamente adecuada para los primeros pocos coecientes, es simplemente

140

CAP ITULO 4. SERIES INFINITAS.

sustituir la ecuaci on (4.112) en la ecuaci on (4.113). Igualando los coecientes de (x x0 )n en ambos lados de la ecuaci on (4.113), ya que la serie de potencia es u nica, obtenemos 1 , a1 a2 b2 = 3 , a1 1 b3 = 5 (2a2 2 a1 a3 ) , a1 1 3 b4 = 7 (5a1 a2 a3 a2 1 a4 5a2 ) , a1 b1 =

(4.114)

y as sucesivamente.

Los coecientes mayores son listados en tamblas generalmente. Una aproximaci on m as general y mucho m as elegante es desarrollada usando variables complejas.

4.9

Integrales el pticas.

Las integrales el pticas son incluidas aqu parcialmente como una ilustraci on del uso de las series de potencias y por su propio inter es intr nseco. Este inter es incluye la ocurrencia de las integrales el pticas en problemas f sicos y aplicaciones en problemas matem aticos. Ejemplo Per odo de un p endulo simple. Para peque nas oscilaciones de amplitud nuestro p endulo, gura 4.8 tiene un movimiento arm onico simple con un per odo T = 2 (l/g )1/2 . Para una amplitud grande m tal que sen m = m , la segunda ley de movimiento de Newton y las ecuaciones de Legrange conducen a una ecuaci on diferencial no lineal (sin es una funci on no lineal de ), as que tomemos un acercamiento diferente.

Figura 4.8: P endulo simple. La masa oscilante m tiene una energ a cin etica de 1/2ml2 (d/dt)2 y una energ a potencial de mgl cos ( = /2 como la elecci on del cero de la energ a potencial). Ya que d/dt = 0 en = m , el principio de la conservaci on de la energ a da 1 2 ml 2 d dt
2

mgl cos = mgl cos M .

(4.115)

4.9. INTEGRALES EL IPTICAS. Resolviendo para d/dt obtenemos d = dt 2g l


1/ 2

141

(cos cos M )1/2

(4.116)

con la cancelaci on de la masa m. Tomando t como cero cuando = 0 y d/dt > 0. Una integraci on desde = 0 a = m produce
M 0

(cos cos M )1/2 d =

2g l

1/2 0

dt =

2g l

1/2

t.

(4.117)

Esto es 1/4 del ciclo, y por lo tanto el tiempo t es 1/4 del per odo, T . Notemos que m , trataremos la sustituci on sen 2 = sen M 2 sen . (4.118)

Con esto, la ecuaci on (4.117) se convierte en T =4 l g


1 /2 0 /2

d 1 sen2 2 sen2

(4.119)

Aunque no hay un obvio mejoramiento en la ecuaci on (4.117), la integral ahora dene la integral el ptica completa del primer tipo, K (sen m /2). A partir de la expansi on de serie, el per odo de nuestro p endulo puede ser desarrollado como una serie de potencia en sen m /2: T = 2 l g
1 /2

1+

1 M 9 M sen2 + sen4 + 4 2 64 2

(4.120)

4.9.1

Deniciones.

Generalizando el ejemplo anterior para incluir el l mite superior como una variable, la integral el ptica del primere tipo est a denida como

F (\) =
0

d 1 sen2 sen2

(4.121)

o
x

F (x|m) =
0

dt (1 t2 )(1 mt2 )

0m<1.

(4.122)

Para = /2, x = 1, tenemos la integral el ptica completa de primer tipo,


/2

K (m) =
0 1

=
0

d 1 m sen2 dt

(4.123) ,

(1 t2 )(1 mt2 )

142

CAP ITULO 4. SERIES INFINITAS.

con m = sen2 , 0 m < 1. La integral el ptica de segundo tipo est a denida por

E (\) =
0

1 sen2 sen2 d

(4.124)

o
x

E (x|m) =
0

1 mt2 dt , 1 t2

0m<1

(4.125)

Nuevamente, para el caso = /2, x = 1,tenemos la integral el ptica completa de segundo tipo:
/2

E (m) =
0 1

1 m sen2 d (4.126) 0m<1.

=
0

1 mt2 dt , 1 t2

La gura 5.9 muestra el comportamiento de K (m) y E (m). Los valores de ambas funciones pueden encontrarse en tablas o evaluar en software como Mathematica.
3

K(m) /2

E(m)

0.2

0.4

0.6

0.8

Figura 4.9: Integrales el pticas completas, K (m), E (m).

4.9.2

Expansi on de series.

Para nuestro intervalo 0 m < 1, el denominador de K (m) puede ser expandido en serie binomial 1 3 (1 m sen2 )1/2 = 1 + m sen2 + m2 sen4 + 2 8 (2n 1)!! n m sen2n . = (2n)!! n=0

(4.127)

4.9. INTEGRALES EL IPTICAS.

143

Para cualquier intervalo cerrado [0, mmax ], mmax < 1 esta serie es uniformemente convergente y puede ser integrada t ermino a t ermino.
/2

sen2n d =
0

(2n 1)!! . (2n)!! 2


2

(4.128)

De modo que K (m) = Similarmente, E (m) = 1 2 1 2


2

1+ 2

1 2

m+

13 24

m2 +

135 246

m3 +

(4.129)

m 1

13 24

m2 3

135 246

m3 5

(4.130)

M as adelante estas series son identicadas como funciones hipergoem etricas, y tenemos K (m) = 2 F1 2 1 1 , , 1; m 2 2 (4.131)

E (m) =

1 1 2 F1 , , 1; m 2 2 2

(4.132)

4.9.3

Valores l mites.

De las series de las ecuaciones (4.129) y (4.130), o a partir de las integrales denidas, (4.133) lim K (m) = , m0 2 . (4.134) m0 2 Para m 1 las expansiones de series son de poco uso. Sin embargo, la integrales tienden lim E (m) =
m1

lim K (m) = ,

(4.135)

la integral diverge logar tmicamente, y


m1

lim E (m) = 1 .

(4.136)

Las integrales el pticas han sido usadas ampliamente en el pasado para evaluar integrales. Por ejemplo, integrales de la forma
x

I=
0

R(t,

a4 t4 + a3 t3 + a2 t2 + a1 t + a0 ) dt ,

donde R es una funci on rotacional de t y del radical, puede ser expresado en t erminos de integrales el pticas. Con los computadores de alta velocidad disponibles para la evaluaci on num erica directa, el inter es en estas t ecnicas de integrales el pticas ha declinado. Sin embargo, las integrales el pticas todav a mantienen el inter es a causa de su apariencia en problemas en F sicos.

144

CAP ITULO 4. SERIES INFINITAS.

4.10

N umeros de Bernoulli.

Los n umeros de Bernoulli fueron introducidos por Jacques Bernoulli. Hay muchas deniciones equivalentes, pero debe tenerse extremo cuidado, porque algunos autores introducen variaciones en la numeraci on o en signo. Un acercamiento relativamente simple para denir los n umeros de Bernoulli es por la serie5 x = x e 1

n=0

Bn xn , n!

(4.137)

la cual convege para |x| < 2 usando el test del cuociente. Diferenciando esta serie de potencia repetidamente y luego evaluando para x = 0, obtenemos Bn = Espec camente, B1 = d dx x x e 1 =
x=0

dn dxn

ex

x 1

.
x=0

(4.138)

x xex ex 1 (ex 1)2

=
x=0

1 , 2

(4.139)

como puede ser visto por la expansi on en series de los denominadores. Usando B0 = 1 y B1 = 1/2, es f acil vericar que la funci on x x 1+ = x e 1 2

n=0

Bn xn x = x(ex 1) 1 , n! 2

(4.140)

es par en x, tal que todos los B2n+1 = 0. Para derivar una relaci on de recurrencia para los n umeros de Bernoulli, multiplicamos ex 1 x =1= x ex 1 xm (m + 1)! m=0

x B2n x2n + 2 n=1 (2n)!

=1+
m=1

1 1 + xN (m + 1)! 2 m! N =2

1nN/2

B2n . [(2n)!(N 2n + 1)!] (4.141)

La ecuaci on (4.141) produce 1 (N + 1) 1 = 2 la cual es equivalente a 1 N = 2 N 1=


n=1 N

B2n
1nN/2

N +1 2n

1 = (N 1) , 2

(4.142)

B2n
n=1 N 1

2N + 1 2n 2N 2n .

, (4.143)

B2n

x 5 La funci on x puede ser considerada una funci on generatriz ya que genera los n umeros de Bernoulli. e 1

4.10. NUMEROS DE BERNOULLI.

145

n Bn Bn 0 1 1.0000 00000 1 1 -0.5000 00000 2 1 1 0.1666 66667 6 1 1 30 -0.0333 33333 1 1 0.0238 09524 42 1 1 30 -0.0333 33333 5 1 0.0757 57576 66 Tabla 4.1: N umeros de Bernoulli A partir de la ecuaci on (4.143) los n umeros de Bernoulli en la tabla 4.1 se obtienen r apidamente. Si la variable x en la ecuaci on (4.137) es remplazada por 2xi (y B1 elegido igual a -1/2), obtenemos una denici on alternativa (y equivalente) de B2n , la expresi on (2x)2n x cot x = (1) B2n , (2n)! n=0
n

< x < .

(4.144)

Usando el m etodo del residuo o trabajando a partir de la representaci on de producto innito de sen(x), encontramos que B2n = (1)n1 2(2n)! (2 )2n

p=1

1 , p 2n

n = 1, 2, 3 . . . .

(4.145)

Esta representaci on de los n umeros de Bernoulli fue descubierta por Euler. Es f acil ver a partir de la ecuaci on (4.145) que |B2n | aumenta sin l mite cuando n . Ilustrando el comportamiento divergente de los n umeros de Bernoulli, tenemos B20 = 5.291 102 B200 = 3.647 10215 . Algunos autores preferien denir los n umeros de Bernoulli con una versi on modicada de la ecuaci on (4.145) usando B2n = 2(2n)! (2 )2n

p=1

1 , p 2n

(4.146)

el sub ndice es justo la mitad de nuestro sub ndice original y todos los signos son positivos. Nuevamente, se debe chequear cuidadosamente la denici on que se est a usando de los n umeros de Bernoulli. Los n umeros de Bernoulli aparecen frencuentemente en teor a de n umeros. El teorema de von Standt-Clausen establece que B2n = An 1 1 1 1 , p1 p2 p3 pk (4.147)

146

CAP ITULO 4. SERIES INFINITAS.

en el cual An es un entero y p1 , p2 , . . . pk son n umeros primos tal que pi 1 es un divisor de 2n. Podemos f acilemnte vericar que esto se mantiene para B6 (A3 = 1, p = 2, 3, 7) , B8 (A4 = 1, p = 2, 3, 5) , B10 (A5 = 1, p = 2, 3, 11) , y otros casos especiales. Los n umeros de Bernoulli aparecen en la suma de potencias enteras de enteros,
N

(4.148)

jp ,
j =1

p entero.

y en numerosas expansiones de series de las funciones trascendentales, incluyendo tan x, cot x, sen1 x, ln | sen x|, ln | cos x|, ln | tan x|, tanh x, coth x y cosh1 x. Por ejemplo, tan(x) = x + 2 (1)n1 22n (22n 1)B2n 2n1 x3 + x5 + + x + . 3 15 (2n)! (4.149)

Los n umeros de Bernoulli probablemente vengan en tales expansiones en series a causa de las ecuaciones de denici on (4.137) y (4.143) y de su relaci on a la funci on zeta de Riemann

(2n) =
p=1

1 . p 2n

(4.150)

4.10.1

Funciones de Bernoulli.
xexs = ex 1

Si la ecuaci on (4.137) puede ser f acilmente generalizada, tenemos Bn (s)


n=0

xn . n!

(4.151)

deniendo las funciones de Bernoulli, Bn (s). Las primeras siete funciones de Bernoulli est an dadas en la tabla 4.2. De la funci on generadora, ecuaci on (4.151), Bn (0) = Bn , n = 1, 2, . . . . (4.152)

la funci on de Bernoulli evaluadas en cero igual a al correspondiente n umero de Bernoulli. Dos propiedades particularmente importantes de las funciones de Bernoulli se deducen a partir de la denici on: una relaci on de diferenciaci on Bn (s) = nBn1 (s) , y una relaci on e simetr a Bn (1) = (1)n Bn (0) , n = 1, 2, . . . . (4.154) n = 1, 2, . . . . (4.153)

Estas relaciones son usadas en el desarrollo de la f ormula de integraci on de Euler-Maclaurin.

4.10. NUMEROS DE BERNOULLI.

147

B0 B1 B2 B3 B4 B5 B6

= = = = = = =

1 x 1 2 2 x x+ 1 6 1 2 x3 3 x + x 2 2 1 4 3 2 x 2x + x 30 x5 5 x4 + 5 x2 1 x 2 3 6 1 2 x6 3x5 + 5 x4 2 x + 2

1 42

Tabla 4.2: Funciones de Bernoulli

4.10.2

F ormula de integraci on de Euler-Maclaurin.

Uno de los uso de las funciones de Bernoulli es la derivaci on de la f ormula de integraci on de Euler-Maclaurin. Esta f ormula es usada en el desarrollo de una expresi on asint otica para la funci on factorial- serie de Stirling. La t ecnica es integraci on por partes repetida usando la ecuaci on (4.153) para crear nuevas derivadas. Comenzamos con
1 1

f (x) dx =
0 0

f (x)B0 (x) dx .

(4.155)

A partir de la ecuaci on (4.153) B1 (x) = B0 (x) = 1 . Sustituyendo B1 (x) en la ecuaci on (4.155) e integranddo por partes, obtenemos
1 1

(4.156)

f (x) dx = f (1)B1 (1) f (0)B1 (0)


0 0

(x) dx f (xx)1 (4.157)

1 2

[f (1) f (0)]
0

(x) dx f (xx)1

Nuevamente, usando la ecuaci on (4.153), tenemos

148 y continuando este proceso, tenemos


1 0

CAP ITULO 4. SERIES INFINITAS.

1 f (x) dx = [f (1) f (0)] 2 + 1 (2p)!


1

p=1

1 B2p [f (2p1) (1) f (2p1) (0)] + (2p)!

(4.161)

f (2q) (x)B2q (x) dx .


0

Esta es la f ormula de integraci on de Euler-Maclaurin. Supone que la funci on f (x) tiene las derivadas requeridas. El intervalo de integraci on en la ecuaci on (4.161) puede ser trasladado de [0, 1] a [1, 2] reemplazando f (x) por f (x + 1). Sumando tales resultados hasta [n 1, n],
n 0

1 1 f (x) dx = f (0) + f (1) + f (2) + + f (n 1) + f (n) + 2 2


q

p=1

1 1 B2p [f (2p1) (n) f (2p1) (0)] + (2p)! (2p)!

n1

B2q (x)
0 =0

f (2q) (x + ) dx . (4.162)

Los t erminos 1 f (0) + f (1) + . . . + 1 f (n) aparecen exactamente como una integraci on tra2 2 pezoidal o cuadratura. La suma sobre p puede ser interpretada como una correcci on a la proximaci on trapezoidal. La ecuaci on (4.162) es la forma usada en la derivaci on de de la f ormula de Stirling. La f ormula de Euler-Maclaurin es a menudo u til para sumar series al convertirlas en integrales.

4.10.3

Funci on zeta de Riemann.

2n Estas series fueron usadas como series de comparaci on para probar la convergencia p=1 p y en la ecuaci on (4.144) como una denici on de los n umeros de Bernoulli, B2n . Tambi en sirve para denir la funci on zeta de Riemann por

(s)
n=1

1 , ns

s>1.

(4.163)

La tabla 4.3 muestra los valores de (s) para s entero, s = 2, 3, . . . , 10. La gura 4.10 es un gr aco de (s) 1. Una expresi on integral para esta funci on zeta de Riemann aparecer a como parte del desarrollo de la funci on gama. Otra interesante expresi on para la funci on zeta puede ser derivada como (s)(1 2s ) = 1 + 1 1 + + 2s 3s 1 1 1 + + + 2s 4s 6s (4.164)

eliminando todos los ns , donde n es un multiplo de 2. Entonces (s)(1 2s )(1 3s ) = 1 + 1 1 1 1 + s + s + s + s 3 5 7 9 1 1 1 + + + , 3s 9s 15s

(4.165)

4.10. NUMEROS DE BERNOULLI.

149

s 2 3 4 5 6 7 8 9 10

(s) 1.64493 40668 1.20205 69032 1.08232 32337 1.03692 77551 1.01734 30620 1.00834 92774 1.00407 73562 1.00200 83928 1.00099 45751

Tabla 4.3: Funci on zeta de Riemann.

10 1 0.1 s

(s)1
0.01 0.001 0.0001 0

10

12

14

s
Figura 4.10: Funci on zeta de Riemmann, (s) 1 versus s.

eliminando todos los t erminos remanentes en el cual n es un m ultiplo de 3. Continuando, s s s s tenemos (s)(1 2 )(1 3 )(1 5 ) . . . (1 P ), donde P es un n umero primo, y todos los s t erminos n , en el cual n es un m ultiplo entero por sobre P , son cancelados. Para P ,

(s)(1 2 )(1 3 ) (1 P Por lo tanto (s) =

) = (s)
P (primo)=2

(1 P s ) = 1 .

(4.166)

P (primo)=2

(1 P s )

(4.167)

150

CAP ITULO 4. SERIES INFINITAS.

dando (s) como un producto innito.6 Este procedimiento de cancelaci on tiene una clara aplicaci on en el c alculo num erico. La s ecuaci on (4.164) dar a (s)(1 2 ) con la misma precisi on como la ecuaci on (4.163) da (s), pero solamente con la mitad de t erminos. (En cuyo caso, podr a hacerse una correcci on para despreciar la cola de la serie por la t ecnica de Maclaurin reemplazando la serie por una integral). Conjuntamente con la funci on zeta de Riemann, habitualmente se denen otras tres funciones de sumas de potencia rec procas:

(s) =
n=1

(1)n1 = (1 21s ) (s) , ns 1 = (2n + 1)s 1 1 2s (s) ,

(s) =
n=0

(s) =
n=0

(1)n

1 . (2n + 1)s

A partir de los n umeros de Bernoulli o de las series de Fourier podemos determinar algunos valores especiales 1 1 + 22 32 1 1 (4) = 1 + 4 + 4 2 3 1 1 (2) = 1 2 + 2 2 3 1 1 (4) = 1 4 + 4 2 3 1 1 (2) = 1 + 2 + 2 3 5 1 1 (4) = 1 + 4 + 4 3 5 1 1 (1) = 1 + 3 5 1 1 (3) = 1 3 + 3 3 5 (2) = 1 + La constante de Catalan (2) = 1
6

+ = + = = = + = + = = =

2 6 4 90 2 12 7 4 720 2 8 4 96 4 3 32

1 1 + 2 = 0.9159 6559 . . . , 2 3 5

Este es el punto de partida para la vasta aplicaci on de la funci on zeta de Riemann a la teor a de n umeros.

4.11. SERIES ASINTOTICAS O SEMICONVERGENTES.

151

4.10.4

Mejoramiento de la convergencia.

Si requerimos sumar una serie convergente erminos son funciones racionales n=1 an cuyos t de n, la convergencia puede ser mejorada dram aticamente introduciendo la funci on zeta de Riemann. Ejemplo Mejorando la convergencia. El problema es evaluar la serie
n=1

1 1 1 . Expandiendo = 2 2 2 (1 + n ) (1 + n ) n

1 1 1+ 2 n

por

divisi on directa, tenemos 1 1 1 1 n 6 = 1 + 1 + n2 n2 n 2 n 4 1 + n 2 1 1 1 1 . = 2 4+ 6 8 n n n n + n6 Por lo tanto

n=1

1 1 = (2) (4) + (6) . 2 8 1+n n + n6 n=1

Las funciones son conocidas y el remanente de la series converge como n8 . Claramente, el proceso pueden ser continuado hasta cuando uno desee. Usted puede hacer una elecci on entre cuanta algebra har a y cuanta aritm etica har a el computador. Otros m etodos para mejorar la efectividad computacional est an dadas al nal de la secci on 4.2 y 4.4.

4.11

Series asint oticas o semiconvergentes.

Las series asint oticas frecuentemente ocurren en F sica. En c alculo num erico ellas son empleadas para la precisi on del c alculo de una variedad de funciones. Consideremos aqu dos tipos de integrales que conducen a series asint oticas: primero, una integral de la forma

I1 (x) =
x

eu f (u) du ,

donde la variable x aparece como el l mite inferior de una integral. Segundo, consideremos la forma

I2 (x) =
0

eu f

u x

du ,

con la funci on f expandible en serie de Taylor. Las series asint oticas a menudo ocurren como soluci on de ecuaciones diferenciales. Un ejemplo de este tipo de series aparece como una de las soluciones de la ecuaci on de Bessel.

152

CAP ITULO 4. SERIES INFINITAS.

4.11.1

Funci on gama incompleta.

La naturaleza de una serie asint otica es quiz as mejor ilustrada por un ejemplo espec co. Supongamos que tenemos una funci on integral exponencial7
x

Ei(x) =

eu du , u

(4.168)

Ei(x) =
x

eu du = E1 (x) , u

(4.169)

para ser evaluada para grandes valores de x. Mejor todav a, tomemos una generalizaci on de la funci on factorial incompleta (funci on gama incompleta),

I (x, p) =
x

eu up du = (1 p, x) ,

(4.170)

en la cual x y p son positivas. De nuevo, buscamos evaluarla para valores grandes de x. Integrando por partes, obtenemos I (x, p) = ex p xp
x

eu up1 du =

ex pex p+1 + p(p + 1) xp x

eu up2 du

(4.171)

Continuando para integrar por partes, desarrollamos la serie I (x, p) = ex 1 p p(p + 1) (p + n 2)! p+1 + (1)n1 p p +2 x x x (p 1)!xp+n1 (p + n 1)! u pn + (1)n e u du . (p 1)! x + (4.172)

Esta es una serie notable. Chequeando la convergencia por la prueba de D Alembert, encontramos |un+1 | (p + n)! 1 = lim n (p + n 1)! x n |un | (p + n) = lim n x = lim

(4.173)

para todos los valores nitos de x. Por lo tanto nuestras series son series innitas que divergen en todas partes!. Antes de descartar la ecuaci on (4.172) como in util, veamos cuan bien una suma parcial dada se aproxima a la funci on factorial incompleta, I (x, p). = (1)n+1
7

(p + n)! (p 1)!

eu upn1 du = Rn (x, p) .

(4.174)

Esta funci on ocurre con frecuencia en problemas astrof sicos que involucran gases con una distribuci on de energ a de Maxwell-Boltzmann.

4.11. SERIES ASINTOTICAS O SEMICONVERGENTES. En valor absoluto | I (x, p) sn (x, p) | (p + n)! (p 1)!
0 x

153

eu upn1 du .

Luego sustituimos u = v + x la integral se convierte en


x

eu upn1 du = ex = ex

ev (v + x)pn1 dv
0

xp+n+1

ev 1 +

v x

pn1

dv .

Para x grande la integral nal se aproxima a 1 y | I (x, p) sn (x, p) | (p + n)! ex . (p 1)! xp+n+1 (4.175)

Esto signica que si tomamos un x sucientemente grande, nuestra suma parcial sn es arbitrariamente una buena aproximaci on a la funci on deseada I (x, p). Nuestra serie divergente por lo tanto es perfectamente buena para c alculos de sumas parciales. Por esta raz on algunas veces es llamada serie semiconvergente. Notemos que la potencia de x en el denominador del remanente (p + n + 1) es m as alto que la potencia de x en u ltimo t ermino incluido en sn (x, p), (p + n). Ya que el remanente Rn (x, p) alterna en signo, las sucesivas sumas parciales dan alternadamente cotas superiores e inferiores para I (x, p). El comportamiento de la serie (con p = 1) como una funci on del n umero de t erminos incluidos es mostrado en la gura 4.11. Tenemos
0.21

0.19

sn (x=5)
0.17

0.1704

0.1741 0.1664

0.15

10

Figura 4.11: Sumas parciales de ex E1 (x)


x=5

eu du e E1 (x) = e u x 1 1! 2! 3! n! = sn (x) 2 + 3 4 + + (1)n n+1 , x x x x x


x x

(4.176)

154

CAP ITULO 4. SERIES INFINITAS.

la cual es evaluada en x = 5. Para un valor dado de x las sucesivas cotas superiores e inferiores dadas por las sumas parciales primero converge y luego diverge. La determinaci on optima de x e E1 (x) est a dado por la aproximaci on m as cercana de las cotas superiores e inferiores, esto es, entre s4 = s6 = 0.1664 y s5 = 0.1741 para x = 5. Por lo tanto 0.1664 ex E1 (x)
x=5

0.1741 .

(4.177)

Realmente, a partir de las tablas, ex E1 (x)


x=5

= 0.1704 ,

(4.178)

dentro de los l mites establecidos por nuestra expansi on asint otica. Note cuidadosamente que la inclusi on de t erminos adicionales en la serie de expansi on m as all a del punto optimo literalmente reduce la precisi on de la representaci on. Cuando aumentamos x, la diferencia entre la cota superior m as baja y la cota inferior m as alta disminuir a. Tomando x sucientemente grande, uno podr a calcular ex E1 (x) para cualquier grado de precisi on deseado.

4.11.2

Integrales coseno y seno.

Las series asint oticas tambi en pueden ser desarrolladas a partir de integrales denidas si el integrando tiene el comportamiento requerido. Como un ejemplo, las integrales seno y coseno est an denidas por

Ci(x) =
x

cos t dt , t sen t dt , t

(4.179)

si(x) =
x

(4.180)

Combinando estas con funciones trigonom etricas regulares, podemos denir

f (x) = Ci(x) sen(x) si(x) cos(x) =


0

g (x) = Ci(x) cos(x) si(x) sin(x) =


0

sen(x) y+x cos(x) y+x

(4.181)

con la nueva variable y = t x. Llevando a variable compleja, tenemos

g (x) + if (x) =
0

=
0

eiy dy y+x iexu du 1 + iu

(4.182)

4.11. SERIES ASINTOTICAS O SEMICONVERGENTES.

155

en el cual u = iy/x. Los l mites de integraci on, 0 a , a m as que de 0 a i, puede ser justicado por el teorema de Cauchy. Racionalizando el denominador e igualando las parte reales y las parte imaginarias, obtenemos

g (x) =
0

f (x) =
0

uexu du , 1 + u2 exu du . 1 + u2

(4.183)

La convergencia de las integrales requiere que Re(x) > 0.8 Ahora, desarrollamos la expansi on asint otica, sea v = xu y expandimos el factor [1 + 2 1 (v/x) ] por el teorema del binomio. Tenemos 1 f (x) x 1 g (x) 2 x
0 0

ev
0nN

(1)n (1)
0nN

v 2n 1 (2n)! dv = (1)n 2n 2 n x x 0nN x


2n+1

nv

x 2n

1 dv = 2 x

(1)
0nN

n (2n

+ 1)! . x 2n

(4.184)

De las ecuaciones (4.181) y (4.184) Ci(x) (2n)! cos(x) (2n + 1)! sen(x) (1)n 2n (1)n 2 x 0nN x x x 2n 0nN

cos(x) (2n)! sen(x) (2n + 1)! si(x) (1)n 2n (1)n , 2 2n x 0nN x x x 0nN

(4.185)

las expansiones asint oticas deseadas. La t ecnica de expandir el integrando de una integral denida e integrar t ermino a t ermino lo volveremos a aplicar para desarrollar una expansi on asint otica de la funci on de Bessel modicada Kv y tambi en para las expansiones de las dos funciones hipergeom etricas conuentes M (a, c; x) y U (a, c; x).

4.11.3

Denici on de series asint oticas.

El comportamiento de estas series (ecuaciones (4.172) y (4.185)) en consistencia con las propiedades denidas para una serie asint otica9 . Siguiendo a Poincar e, tomamos xn Rn (x) = xn [f (x) sn (x)] , donde sn (x) = a0 +
8 9

(4.186)

a1 a2 an + 2 + + n . x x x

(4.187)

La parte real. No es necesario que las series asint oticas sean series de potencia.

156

CAP ITULO 4. SERIES INFINITAS.

La expansi on asint otica de f (x) tiene las propiedades que lim xn Rn (x) = 0 , para n jo, (4.188)

y lim xn Rn (x) = , para x jo, (4.189)

Vemos la ecuaciones (4.172) y (4.173) como un ejemplo de estas propiedades. Para series de potencias, como las supuestas en la forma de sn (x), Rn (x) xn1 . Con condiciones ((4.188)) y ((4.189)) satisfechas, escribimos

f (x)
n=0

an

1 . xn

(4.190)

Notemos el uso de en lugar de =. La funci on f (x) es igual a la serie solamente en el l mite cuando x . Las expansiones asint oticas de dos funciones pueden ser multiplicadas entre si y el resultado ser a una expansi on asint otica de un producto de dos funciones. La expansi on asint otica de una funci on dada f (t) puede ser integrada t ermino a t ermino (justo como en una serie uniformemente convergente de una funci on continua) a partir de x t < y el resultado ser a una expansi on asint otica de x f (t)dt. Una diferenciaci on t ermino a t ermino, sin embargo, es v alida solamente bajo condiciones muy especiales. Algunas funciones no poseen una expansi on asint otica; ex es un ejemplo de tales funciones. Sin embargo, si una funci on tiene una expansi on asint otica, tiene solamente una. La correspondencia no es uno a uno; muchas funciones pueden tener la misma expansi on asint otica. Uno de los m etodos m as poderoso y u til de generar expansiones asint oticas, es el m etodo de steepest descents, ser a desarrollado m as adelante. Las aplicaciones incluyen la derivaci on de la f ormula de Stirling para la funci on factorial (completa) y las formas asint oticas de las varias funciones de Bessel. Las series asint oticas ocurren a menudo en f sica matem atica. Una de las aproximaciones m as primeras y a un importante de mec anica cu antica, la expansi on WKB, es una serie asint otica.

4.11.4

Aplicaciones a c alculo num erico.

Las series asint oticas son usadas frecuentemente en el c alculo de funciones por los computadores. Este es el caso de las funciones de Neumann N0 (x) y N1 (x), y las funciones modicadas de Bessel In (x) y Kn (x). Las series asint oticas para integrales del tipo exponencial, ecuaci on (4.176), para las integrales de Fresnel, y para la funci on de error de Gauss, son usadas para la evaluaci on de estas integrales para valores grandes del argumento. Cuan grande deber a ser el argumento depende de la precisi on requerida.

4.12. PRODUCTOS INFINITOS.

157

4.12

Productos innitos.

Consideremos una sucesi on de factores positivos f1 f2 f3 f4 fn (fi > 0). Usando may uscula para indicar el producto, tenemos
n

f1 f2 f3 f4 fn =
i=1

fi .

(4.191)

Denimos pn , como el producto parcial, en analog a con sn la suma parcial,


n

pn =
i=1

fi ,

(4.192)

y entonces investigamos el l mite


n

lim pn = P .

(4.193)

Si P es nito (pero no cero), decimos que el producto innito es convergente. Si P es innito o cero, el producto innito es etiquetado como divergente. Ya que el producto diverger a a innito si
n

lim fn > 1

(4.194)

o a cero para 0 < lim fn < 1 ,


n

(4.195)

es conveniente escribir nuestro producto como

(1 + an ) .
n=1

La condici on an 0 es entonces una condici on necesaria (pero no suciente) para la convergencia. El producto innito puede ser relacionado a una serie innita por el m etodo obvio de tomar el logaritmo

ln
n=1

(1 + an ) =
n=1

ln(1 + an ) .

(4.196)

Una relaci on m as u til es probada por el siguiente teorema.

4.12.1

Convergencia de un producto innito.


n=1 (1+ an )

Si 0 an < 1, el producto innito y diverge si n=1 an diverge.

n=1 (1 an )

converge si

n=1

an converge

158

CAP ITULO 4. SERIES INFINITAS.

Considerando el t ermino 1 + an , vemos que de la ecuaci on (4.80) 1 + an ean . Por lo tanto el producto parcial pn pn esn , y haciendo n ,

(4.197)

(4.198)

(1 + an ) exp
n=1 n=1

an .

(4.199)

estableciendo una cota superior para el producto innito. Para desarrollar una cota m as baja, notemos que
n n n

pn = 1 +
i=1

ai +
i=1 j =1

ai aj + > s n ,

(4.200)

ya que ai 0. De modo que


(1 + an )
n=1 n=1

an

(4.201)

Si la suma innita permanece nita, el producto innito tambi en lo har a. Si la suma innita diverge, tambi en lo har a el producto innito. El caso de (1 an ) es complicado por el signo negativo, pero una prueba de que depende de la prueba anterior puede ser desarrollada notando que para an < 1/2 (recuerde que an 0 para convergencia) (1 an ) y (1 an ) 1 . 1 + 2an (4.202) 1 1 + an

4.12.2

Funciones seno, coseno y gama.

El lector reconocer a que un polinomio de orden n Pn (x) con n raices reales puede ser escrito como un producto de n factores:
n

Pn (x) = (x x1 )(x x2 ) (x xn ) =
i=1

(x xi ) .

(4.203)

De la misma manera podemos esperar que una funci on con un n umero innito de raices pueda ser escrito como un producto innito, un factor para cada raiz. Esto es por cierto el

4.12. PRODUCTOS INFINITOS.

159

caso de las funciones trigonom etricas. Tenemos dos representaciones muy u tiles en productos innitos,

sen(x) = x
n=1

x2 n2 2

(4.204)

cos(x) =
n=1

4x2 1 (2n 1)2 2

(4.205)

La m as conveniente y quiz as la m as elegante derivaci on de estas dos expresiones es usando variable compleja. Por nuestro teorema de convergencia, las ecuaciones (4.204) y (4.205) son convergentes para todos los valores nitos de x. Espec camente, para el producto innito 2 2 2 para el sen(x), an = x /n , x2 an = 2 n=1

n=1

1 x2 = (2) n2 2 x2 = . 6

(4.206)

La serie correspondiente a la ecuaci on (4.205) se comporta en una manera similar. La ecuaci on (4.204) conduce a dos resultados interesantes. Primero, si jamos x = /2, obtenemos 1= 2

n=1

1 1 = 2 (2n) 2

n=1

(2n)2 1 (2n)2

(4.207)

Resolviendo para /2, obtenemos (2n)2 22 44 66 = = , 2 n=1 (2n 1)(2n + 1) 13 35 57

(4.208)

la cual es la famosa f ormula de Wallis para /2. El segundo resultado involucra la funci on factorial o funci on gama. Una denici on de la funci on gama es

(x) = xe

x r=1

x x 1+ er r

(4.209)

donde es la constante de Euler-Mascheroni, secci on 4.2. Si tomamos el producto de (x) y (x), la ecuaci on (4.209) tiende a

(x)(x) = xe = x2

x r =1

x x x x x 1+ e r xe er 1 r r r =1 1 x r2
2 1

(4.210)

r =1

160

CAP ITULO 4. SERIES INFINITAS.

Usando la ecuaci on (4.204) con x reemplazado por x, obtenemos (x)(x) = . x sen(x) (4.211)

Anticipando una relaci on de recurrencia desarrollada posteriormente, tenemos que usando x(x) = (1 x). La ecuaci on (4.211) puede ser escrita como (x)(1 x) = . sen(x) (4.212)

Esto ser au til cuando tratamos la funci on gama. Estrictamente hablando, podr amos chequear el intervalo en x para el cual la ecuaci on (4.209) es convergente. Claramente, para x = 0, 1, 2, . . . los factores individuales se anulan. La prueba que el producto innito converge para todos los otros valores (nitos) de x es dejado como ejercicio. Estos productos innitos tienen una variedad de usos en matem atica anal tica. Sin embargo, a causa de su lentitud de convergencia, ellas no son aptas para un trabajo num erico preciso.

Cap tulo 5 Funciones de una variable compleja I.


Propiedades anal ticas y Mapeo.
versi on nal 1.2-2606021

Veamos ahora el estudio de funciones de una variable compleja. En esta area desarrollamos alguna de las herramientas m as poderosas y u tiles de todo el an alisis matem atico. 1. Para muchos pares de funciones u y v , ambas satisfacen la ecuaci on de Laplace 2 = 2 (x, y ) 2 (x, y ) + =0. x2 y 2

De modo que u o v pueden ser usados para describir un potencial electroest atico bidimensional. La otra funci on que da una familia de curvas ortogonales a aquella de la primera funci on, puede ser usada para describir el campo el ectrico E . Una situaci on similar se mantiene para la hidrodin amica de un uido ideal en movimiento irrotacional. La funci on u podr a describir el potencial de velocidades, mientras que la funci on v podr a entonces ser la funci on de ujo. En muchos casos en que las funciones u y v son desconocidas, un mapeo conforme o transformaci on en el plano complejo nos permite crear un sistema de coordenadas hecho a la medida para el problema en particular. 2. Veremos que ecuaciones diferenciales de segundo orden de inter es en F sica pueden ser resueltas por series de potencia. Las mismas series de potencia pueden ser usadas en el plano complejo reemplazando x por la variable compleja z . La dependencia de la soluci on f (z ) de un z0 dado sobre el comportamiento de f (z ) en todas partes nos da un mayor discernimiento del comportamiento de nuestra soluci on y una herramienta poderosa (continuaci on an alitica) para extender la regi on en la cual la soluci on es v alida. 3. El cambio de un par ametro k de real a imaginario, k ik , transforma la ecuaci on de Helmholtz en la ecuaci on de difusi on. El mismo cambio transforma las soluciones de la ecuaci on de Helmholtz (funciones de Bessel y funciones esf ericas de Bessel) en las soluciones de la ecuaci on de difusi on (funciones de Bessel modicada y funciones esf ericas modicadas de Bessel). 4. Las integrales en el plano complejo tienen una amplia variedad de aplicaciones u tiles.
Este cap tulo est a basado en el sexto cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
1

161

162

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I. (a) Evaluaci on de integrales denidas. (b) Inversi on de series de potencia. (c) Formaci on de productos innitos. (d) Obtener soluciones de ecuaciones diferenciales para valores grandes de la variable (soluciones asint oticas). (e) Investigaci on de la estabilidad de sistemas potencialmente oscilatorios. (f) Inversi on de transformadas integrales.

5. Muchas cantidades f sicas que originalmente fueron reales se convierten en complejas cuando una teor a f sica simple se generaliza. Los ndices reales de difracci on de la luz se convierte en una cantidad compleja cuando la absorci on es incluida. La energ a real asociada con un nivel de energ a se convierte en compleja cuando la vida media nita del nivel es considerado.

5.1

Algebra compleja.

Un n umero complejo es nada m as que un par ordenado de dos n umeros reales, (a, b) o a + ib, en el cual i es 1. Similarmente, una variable compleja es un par ordenado de dos variables reales, z = (x, y ) = x + iy . (5.1)

Veremos que el orden es importante, que en general a + bi no es igual a b + ai y x + iy no es igual a y + xi.2 Frecuentemente es conveniente emplear una representaci on gr aca de la variable compleja. Gracando x la parte real de z como la abscisa e y la parte imaginaria de z como la ordenada, tenemos el plano complejo o plano Argand mostrado en la gura 5.1. Si asignamos valores espec cos a x e y , entonces z corresponde a un punto (x, y ) en el plano. En t erminos del ordenamiento mencionado antes, es obvio que el punto (x, y ) no coincide con el punto (y, x) excepto para el caso especial de x = y .

y y r x
Figura 5.1: Plano complejo, diagrama de Argand.
a b b a

(x,y)

El algebra de los n umeros complejos, a + ib es isom orca con la de las matrices de la forma

5.1. ALGEBRA COMPLEJA.

163

Todo nuestro an alisis de variable compleja puede ser desarrollado en t erminos de pares ordenados de n umeros (a, b), variables (x, y ), y funciones (u(x, y ), v (x, y )). La i no es necesaria pero es conveniente. Sirve para mantener el par en orden algo como un vector unitario. De modo que la suma y la multiplicaci on de n umeros complejos puede estar denida en t erminos de sus componentes cartesianas como z1 + z2 = (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) = x1 + x2 + i(y1 + y2 ) , z1 z2 = (x1 , y1 ) (x2 , y2 ) = (x1 x2 y1 y2 , x1 y2 + x2 y1 ) . De la gura 5.1 podemos escribir x = r cos() y = r sen() y z = r(cos() + i sen()) . (5.5) (5.4) (5.2)

(5.3)

Usando un resultado que fue sugerido (pero no rigurosamente probado) en la secci on 4.6, tenemos la muy u til representaci on polar z = rei . (5.6)

En esta representaci on r es llamado el m odulo o magnitud de z (r = |z | = (x2 + y 2 )1/2 ) y el 1 angulo (= tan (y/x)) se conoce como argumento arg(z ) o fase de z . La elecci on de la representaci on polar, ecuaci on (5.5), o representaci on cartesiana, la ecuaci on (5.1), es un asunto de conveniencia. La suma y la resta de variables complejas son m as f aciles en representaci on cartesiana, ecuaci on (5.2). La multiplicaci on, divisi on, potencias, y raices son m as f aciles en la forma polar, ecuaci on (5.6). Anal ticamente o gr acamente, usando la analog a vectorial, podemos mostrar que el m odulo de la suma de dos n umeros complejos no es mayor que la suma del m odulo y no es menor que la diferencia, ejercicio, |z1 | |z2 | |z1 + z2 | |z1 | + |z2 | . (5.7)

A causa de la analog a vectorial, estas son llamadas las desigualdades tri angulares. Usando la forma polar, ecuaci on (5.5), encontramos que la magnitud de un producto es el producto de las magnitudes, |z1 | |z2 | = |z1 z2 | . Tambi en, arg(z1 z2 ) = arg(z1 ) + arg(z2 ) . (5.9) (5.8)

164

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

A partir de nuestra variable compleja z las funciones complejas f (z ) o w(z ) pueden ser construidas. Estas funciones complejas pueden ser resueltas en su parte real y su parte imaginaria w(z ) = u(x, y ) + iv (x, y ) , (5.10)

en la cual las funciones separadas u(x, y ) y v (x, y ) son reales puras. Por ejemplo, si f (z ) = z 2 , tenemos f (z ) = (x + iy )2 = (x2 y 2 ) + i2xy . La parte real de la funci on f (z ) ser a etiquetida etiquetada [f (z )]. En la ecuaci on (5.10) [f (z )], mientras la parte imaginaria ser a

[w(z )] = u(x, y ) , [w(z )] = v (x, y ) . La relaci on entre la variable independiente z y la variable dependiente w es quiz as mejor representada como una operaci on de mapeo. Dado un z = x + iy , un punto en el plano z . El valor complejo w(z ) es entonces un punto en el plano w. Puntos en el plano z se mapean en puntos en el plano w y curvas en el plano z se mapean en curvas en el plano w como indica la gura 5.2.

plano z

plano w

2 1 1

Figura 5.2: La funci on w(z ) = u(x, y ) + iv (x, y ) mapea puntos en el plano xy en puntos en el plano uv .

5.1.1

Conjugaci on compleja.

En todos estos pasos, n umeros complejos, variables, y funciones, la operaci on de reemplazar i por i es llamada tomar el complejo conjugado. El complejo conjugado de z se denota por z , donde3 z = x iy .
3

(5.11)

El complejo conjugado es a menudo denotado por z

5.1. ALGEBRA COMPLEJA.

165

La variable compleja z y su complejo conjugado z es una imagen especular la una de la otra reejadas por el eje x, esto es, inversi on del eje y (compare la gura 5.3). El producto zz es zz = (x + iy )(x iy ) = x2 + y 2 = r2 . De modo que (zz )1/2 = |z |, la magnitud de z
y z z* (x,y)

(5.12)

(x,y)

Figura 5.3: Puntos de complejos conjugados.

5.1.2

Funciones de una variable compleja.

Todas las funciones elementales de variables reales pueden ser extendidas al plano complejo reemplazando la variable real x por la variable compleja z . Esto es un ejemplo de la continuaci on anal tica mencionada en la secci on 5.5. La relaci on extremadamente importante, ecuaciones (5.5) y (5.6), es una ilustraci on de esto. Moverse en el plano complejo abre nuevas oportunidades para an alisis. Ejemplo F ormula de Moivre. Si la ecuaci on (5.6) es elevada a la n- esima potencia, tenemos ein = (cos() + i sen())n . Expandiendo la exponencial ahora con argumento n, obtenemos cos(n) + i sen(n) = (cos() + i sen())n . (5.14) (5.13)

Esta es la f ormula de Moivre. Ahora si el lado derecho de la ecuaci on (5.14) es expandido usando el teorema del binomio, obtenemos cos(n) como una serie de potencias de cos() y sen(). Numerosos de otros ejemplos de relaciones entre funciones exponenciales, hiperb olicas y trigonom etricas en el plano complejo podemos encontrarlas como ejercicios. Ocasionalmente hay complicaciones. El logaritmo de una variable compleja puede ser expandida usando la representaci on polar ln(z ) = ln(rei ) = ln(r) + i . (5.15)

166

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Esto no est a completo. Al angulo fase , podemos a nadirle alg un m ultiplo entero de 2 sin cambiar z . Luego la ecuaci on (5.15) deber a leerse ln z = ln rei(+2n) = ln(r) + i( + 2n ) . (5.16)

El par ametro n puede ser cualquier entero. Esto signica que ln z es una funci on multivaluada teniendo un n umero innito de valores para una pareja de valores reales de r y . Para evitar esta ambig uedad, usualmente concordamos a tomar n = 0 y limitar la fase a un int ervalo de longitud 2 tal como (, )4 . La l nea en el plano z que no es cruzada, el eje real negativo en este caso, es conocida como l nea de corte o de ramicaci on. El valor de ln z con n = 0 es llamado valor principal de ln z . M as adelante discutiremos estas funciones, incluyendo el logar tmo, aparece en la secci on 5.6.

5.2

Condiciones de Cauchy-Riemann.

Habiendo establecido las funciones complejas de una variable compleja, ahora procederemos a derivarlas. La derivada de f (z ), como la de una funci on real, est a denida por f (z + z ) f (z ) f (z ) df = lim = z 0 z 0 z z + z z dz lim o f (z ) , (5.17)

a condici on que el l mite sea independiente de la forma de aproximaci on particular al punto z . Para variables reales requerimos que el l mite por la derecha (x x0 desde arriba) y el l mite por la izquierda (x x0 desde abajo) sea iguales para que la derivada df (x)/dx exista en x = x0 . Ahora, con z (o z0 ) alg un punto en el plano, nuestro requerimiento de que el l mite sea independiente de la direcci on de aproximaci on es muy restrictiva. Consideremos incrementos x y y de las variables x e y , respectivamente. Entonces z = x + iy . Tambi en, f = u + iv , tal que f u + iv = . z x + iy (5.20) (5.19) (5.18)

Tomemos el l mite indicado en la ecuaci on (5.17) por dos aproximaciones diferentes como muestra la gura (5.4). Primero, con y = 0, sea x 0. La ecuaci on (5.17) tiende f u v = lim +i z 0 z x0 x x u v +i , = x x lim
4

(5.21)

Hay elecciones inusuales de fase. La fase apropiada depende de cada problema.

5.2. CONDICIONES DE CAUCHY-RIEMANN.

167

x y=0

z0 x=0 y 0 x

Figura 5.4: Aproximaciones alternativas a z0 .

suponiendo que las derivadas parciales existen. Para una segunda aproximaci on, jamos x = 0 y entonces hacemos y 0. Esto tiende a f u v = lim i + z 0 z y 0 y y u v + . = i y y lim

(5.22)

Para tener una derivada df /dz , las ecuaciones (5.21) y (5.22) deben ser id enticas. Igualando parte real a parte real y parte imaginaria con imaginaria (como los componentes del vector), obtenemos u v = x y u v = . y x (5.23)

Estas son las famosas condiciones de Cauchy-Riemann. Ellas fueron descubiertas por Cauchy y usadas ampliamente por Riemannn en su teor a de funciones anal ticas. Estas condiciones son necesarias para la existencia de una derivada de f (z ), esto es, si df /dz existe, la condici on de Cauchy-Riemann debe satisfacerse. Inversamente, si las condiciones de Cauchy-Riemann se satisfacen y la derivada parcial de u(x, y ) y v (x, y ) son continuas, la derivada df /dz existe. Esto puede ser mostrado escribiendo f = u v +i x x x + u v +i y y y . (5.24)

La justicaci on para esta expresi on depende de la continuidad de la derivada parcial de u y v . Dividiendo por z , tenemos f (u/x + i(v/x))x + (u/y + i(v/y ))y = z x + iy (u/x + i(v/x)) + (u/y + i(v/y ))y/x = 1 + i(y/x)

(5.25)

Si f /z tiene un valor u nico, la dependencia de y/x deber a eliminarse. Aplicando las condiciones de Cauchy-Riemann a las derivadas de y obtenemos v v u u +i = +i . y y x x (5.26)

168

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Sustituyendo la ecuaci on (5.26) y (5.25), podemos cancelar la dependencia y/x y f u v = +i , z x x (5.27)

la cual muestra que el l mite f /z es independiente de la direcci on de aproximaci on en el plano complejo ya que las derivadas parciales son continuas. Es digno de atenci on notar que las condiciones de Cauchy-Riemann garantizan que las curvas u = c1 ser an ortogonales a las curvas v = c2 . Esto es fundamental en la aplicaci on de problemas de potencial en una variedad de areas de la F sica. Si u = c1 es una l nea de fuerza el ectrica, entonces v = c2 es una l nea equipotencial (supercie), y vice versa. Funciones anal ticas. Finalmente, se f (z ) es diferenciable en z = z0 y en algunas peque nas regiones alrededor 5 de z0 decimos que f (z ) es anal tica en z0 . Si f (z ) es anal tica en todo el plano complejo (nito), la llamaremos una funci on entera. Nuestra teor a de variables complejas aqu es escencialmenteuna de funciones anal ticas de variables complejas, la cual destaca la importancia crucial de las condiciones de Cauchy-Riemann. El concepto de analiticidad presente en teor as avanzadas de la f sica moderna, por ejemplo este concepto juega un rol crucial en la teor a de dispersi on (de part culas elementales). Si f (z ) no existe en z = z0 , entonces z0 es conocido como punto singular. Para ilustrar las condiciones de Cauchy-Riemann, consideremos dos ejemplos muy simples. Ejemplo Sea f (z ) = z 2 . Entonces la parte real u(x, y ) = x2 y 2 y la parte imaginaria v (x, y ) = 2xy . Siguiendo la ecuaci on (5.23) v u = 2x = , x y u v = 2y = . y x

es del plano comVemos que f (z ) = z 2 satisface las condiciones de Cauchy-Riemann a trav plejo. Ya que las derivadas parciales son claramente continuas, concluimos que f (z ) = z 2 es anal tica. Ejemplo Sea f (z ) = z . Ahora u = x y v = y . Aplicando las condiciones de Cauchy-Riemann, obtenemos u v =1= . x y Las condiciones de Cauchy-Riemann no son satisfechas y f (z ) = z no es una funci on anal tica de z . Es interesante notar que f (z ) = z es continua, aquello provee un ejemplo de una funci on que es continua en todo lugar pero en ninguno diferenciable. La derivada de una funci on real de una variable real es escencialmente una caracter stica local, que provee informaci on a cerca de la funci on solamente en un vecindario local por
5

Algunos autores usan el t ermino holom orca.

5.3. TEOREMA INTEGRAL DE CAUCHY.

169

ejemplo, como una expansi on de Taylor truncada. La existencia de una derivada de una funci on de una variable compleja tiene muchas m as implicancias de conocimiento lejano. Las partes reales e imaginarias de nuestra funci on anal tica debe satisfacer separadamente las ecuaciones de Laplace. M as a un, nuestra funci on anal tica est a garantizada para las derivadas de todo orden, secci on 4.4. En este sentido las derivadas no solamente gobiernan el comportamiento local de la funci on compleja, sino que controla el comportamiento distante tambi en.

5.3
5.3.1

Teorema integral de Cauchy.


Integrales de contorno.

Con la diferenciaci on bajo control, veamos la integraci on. La integral de una variable compleja sobre un contorno en el plano complejo puede ser denida en cercana analog a a la integral de (Riemann) de una funci on real integrada a lo largo del eje x real. Dividimos el contorno z0 z0 en n intervalos tomando n 1 puntos intermedios z1 , z2 , . . . , sobre el contorno (gura 5.5). Consideremos la suma
n

Sn =
j =1

f (j )(zj zj 1 ) ,

(5.28)

donde j es un punto sobre la curva entre zj y zj 1 . Ahora hagamos n con | zj zj 1 | 0 , para todo j . Si el limn Sn existe y es independiente de los detalles de elecci on de los puntos zj y j , entonces
n n z0

lim

f (j )(zj zj 1 ) =
j =1 z0

f (z ) dz .

(5.29)

El lado derecho de la ecuaci on es llamado integral de contorno de f (z ) (a lo largo del contorno espec co C desde z = z0 a z = z0 ). El procedimiento desarrollado para la integral de contorno es cercanamente an alogo a la integral de Riemann de una funci on real de una variable real. Como una alternativa, la integral de contorno puede ser denida por
z0 x2 ,y2

f (z ) dz =
z0 x1 ,y1 x2 ,y2

[u(x, y ) + iv (x, y )][dx + idy ]


x2 ,y2

=
x1 ,y1

[u(x, y )dx v (x, y )dy ] + i


x1 ,y1

[v (x, y )dx + u(x, y )dy ] ,

con el camino que une (x1 , y1 ) y (x2 , y2 ) espcicado. Esto reduce la integral compleja a la suma compleja de integrales reales. Esto es algo an alogo al reemplazo de una integral vectorial por la suma de vectores de integrales escalares.

170

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

y 1 z1 z2 z3

z0=zn

0 z0

x
Figura 5.5: Camino de integraci on.

Un ejemplo importante es la integral de contorno C z n dz , donde C es un c rculo de radio r > 0 alrededor del origen z = 0 en el sentido matem atico positivo (en el sentido contrario a los punteros del reloj). En coordenadas polares de la ecuaci on (5.6) parametrizamos z = rei y dz = irei d. Para n = 1 obtenemos 1 2i z n dz =
C

rn+1 2 exp[i(n + 1)] d 2 0 rn+1 2 = ei(n+1) 0 = 0 , 2i(n + 1)

(5.30)

ya que 2 es un per odo de ei(n+1) , mientras que para n = 1 1 2i dz 1 = z 2


2

d = 1,
0

(5.31)

nuevamente independiente de r. Estas integrales son ejemplos del teorema integral de Cauchy el cual consideraremos en la pr oxima secci on.

5.3.2

Prueba del teorema de Stoke.

El teorema de la integral de Cauchy es el primero de dos teoremas b asicos en la teor a del comportamiento de funciones de una variable compleja. Primero, una prueba bajo condiciones relativamente restrictivas, condiciones que ser an intolerables para matem aticos desarrollando una bella teor a abstracta, pero que son satisfechas usualmente en problemas f sicos. Si una funci on f (z ) es anal tica (por lo tanto simplemente valuada) y sus derivadas parciales son continuas a trav es de una regi on simplemente conexa R,6 para cada camino cerrado C (gura 5.6) en R la integral de f (z ) alrededor de C es cero o f (z ) dz =
C
6

f (z ) dz = 0 .
C

(5.32)

Una regi on o dominio simplemente conexo es aquel en el cual cada contorno cerrado en la regi on encierra s olo puntos contenidas en ella. Si la regi on no es simplemente conexa es multiplemente conexa. Como un ejemplo de una regi on multiplemente conexa, consideremos el plano z con el c rculo unitario interior exclu do.

5.3. TEOREMA INTEGRAL DE CAUCHY.

171

El s mbolo es usado para enfatizar que el camino es cerrado. Recordemos que en el cap tulo de vectores una funci on tal como f (z ), identicada como una fuerza fue etiquetada como conservativa.

Figura 5.6: Un contorno cerrado C dentro de una regi on R simplemente conexa.

En esta forma el teorema de la integral de Cauchy puede ser dado por aplicaci on directa del teorema de Stokes. Con f (z ) = u(x, y ) + iv (x, y ) y dz = dx + idy , f (z )dz =
C

(u + iv )(dx + idy ) (5.33) (udx vdy ) + i (vdx + udy ) .

Estas dos integrales de l nea pueden ser convertidas a integrales de supercie por el teorema de Stokes, un procedimiento que es justicado si las derivadas parciales son continuas dentro de C . Aplicando el teorema de Stokes podemos notar que las dos u ltimas integrales de la ecuaci on (5.33) son completamente reales. Usando V =x Vx + y Vy , tenemos (Vx dx + Vy dy ) =
C

Vy Vx x y

dxdy .

(5.34)

Para la primera integral en la u ltima parte de la ecuaci on (5.33) sea u = Vx y v = Vy .7


En la prueba del teorema de Stokes, Vx y Vy son cualquier par funciones (con derivadas parciales continuas).
7

172 Entonces

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

(udx vdy ) =
c C

(Vx dx + Vy dy ) Vy Vx dxdy x y v u dxdy . x y (5.35)

= =

Para la segunda integral del lado derecho de la ecuaci on (5.33) sea u = Vy y v = Vx . Usando nuevamente el teorema de Stokes, obtenemos (vdx + udy ) = u v x y dxdy . (5.36)

Aplicando las condiciones de Cauchy-Riemann que se deben satisfacer ya que f (z ) se supone anal tica, cada integrando se anula y f (z ) dz = =0. v u x y dxdy + i u v x y dxdy

(5.37)

5.3.3

Prueba de Cauchy-Goursat.

Esto completa la prueba del teorema integral de Cauchy. Sin embargo, la prueba est a estropeada desde el punto de vista te orico por la necesidad de continuidad de las primeras derivadas parciales. Realmente, como se muestra por Goursat, esta condici on no es esencial. Un perl de la prueba de Goursat es como sigue. Subdividimos la regi on dentro del contorno C en una red de peque nos cuadrados como est a indicado en la gura 5.7. Luego f (z ) dz =
C j Cj

f (z ) dz ,

(5.38) f (z )dz ,

todas las integrales a lo largo de las lineas interiores se cancelan. Para atacar la construimos la funci on j (z, zj ) = f (z ) f (zj ) df (z ) z zj dz ,
z = zj

Cj

(5.39)

con zj un punto interno de la j - esima subregi on. Note que [f (z ) f (zj )]/(z zj ) es una aproximaci on a la derivada en z = zj . Equivalentemente, podemos notar que si f (z ) ten a una expansi on de Taylor (la cual todav a no hemos dado), entonces j (z, zj ) ser a del orden de z zj , aproxim andose a cero cuando la red fuera hecha muy na. Podemos hacer | j (z, zj ) | < , donde es una cantidad arbitrariamente escogida peque na y positiva. (5.40)

5.3. TEOREMA INTEGRAL DE CAUCHY.

173

y Cj

x
Figura 5.7: Contorno de Cauchy-Goursat.

Resolviendo la ecuaci on (5.39) para f (z ) e integrando alrededor de Cj , obtenemos f (z ) dz =


Cj Cj

(z zj )j (z, zj ) dz ,

(5.41)

las integrales de los otros t erminos se anulan.8 Cuando las ecuaciones (5.40) y (5.41) est an combinadas, uno puede mostrar que f (z )dz < A ,
j Cj

(5.42)

donde A es un t ermino del orden del area de la regi on escogida. Ya que es arbitrario, tomemos 0 y conclu mos que si una funci on f (z ) es anal tica sobre y dentro de un camino cerrado C , f (z ) dz = 0 . (5.43)

Detalles de la prueba de esta forma signicativamente m as general y poderosa puede ser encontrada en la literatura de variable compleja (Churchill). Realmente podemos todav a comprobar el teorema para f (z ) anal tica dentro del interior de C y solamente continuas en C. La consecuencia del teorema integral de Cauchy es que para funciones anal ticas la integral de l nea es una funci on solamente de sus puntos extremos, independiente del camino de integraci on,
z2 z1

f (z ) dz = F (z2 ) F (z1 ) =
z1 z2

f (z ) dz ,

(5.44)

de nuevo exactamente como el caso de la fuerza conservativa.


8

dz y

zdz = 0 por la ecuaci on (5.30).

174

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

5.3.4

Regiones multiplemente conexas.

El enunciado original de nuestro teorema demanda una regi on simplemente conexa. Esta restricci on puede ser f acilmente relajada por la creaci on de una barrera, una l nea de contorno. Consideremos la regi on multiplemente conexa de la gura 5.8, en la cual f (z ) no est a denida para el interior de R . El teorema de la integral de Cauchy no es v alido para el contorno C , como lo demostramos, pero podemos construir un contorno C para el cual el teorema se mantenga. Dibujemos una l nea desde el interior de la regi on prohibida R a la regi on exterior prohibida a R y luego corre un nuevo contorno C , como se muestra en la gura 5.9.

x
Figura 5.8: Contorno cerrado C en una regi on multiplemente conexa.

C1

C2

G A E D

x
Figura 5.9: Conversi on de una regi on multiplemente conexa a una regi on simplemente conexa.

El nuevo contorno C a trav es de ABDEF GA nunca cruzar a la l nea de contorno que literalmente convierte a R en una regi on simplemente conexa. Por la ecuaci on (5.44)
A D

f (z ) dz =
G E

f (z ) dz ,

(5.45)

5.4. FORMULA INTEGRAL DE CAUCHY.

175

f (z ) sido continua a trav es de la l nea de contorno y los segmentos de l nea DE y GA est an arbitrariamente cerca. Entonces f (z ) dz =
c ABD

f (z ) dz +
EF G

f (z ) dz

(5.46)

=0 por el teorema integral de Cauchy, con la regi on R simplemente conexa. Aplicando la ecuaci on (5.44) una vez m as con ABD C1 y EF G C2 , obtenemos f (z ) dz =
C1 C2

f (z ) dz ,

(5.47)

en la cual C1 y C2 ambos son recorridos en la misma direcci on (de los punteros del reloj). Deber a enfatizarse que la l nea de contorno aqu es un asunto de conveniencia matem atica para permitir la aplicaci on del teorema integral de Cauchy. Ya que f (z ) es anal tica en la regi on anular, es necesariamente univaluada y continua a trav es de cualquier l nea de contorno. Cuando consideremos puntos de ramicaci on nuestras funciones no ser an univaluadas y una l nea de corte ser a requerida para hacerlas univaluadas.

5.4

F ormula integral de Cauchy.

Como en la secci on anterior, consideremos una funci on f (z ) que es anal tica sobre un contorno cerrado C y dentro de la regi on rodeada por C . Buscamos probar que f (z ) dz = 2if (z0 ) , z z0 (5.48)

en la cual z0 es alg un punto en la regi on interior encerrada por C . Este es el segundo de los dos teoremas b asicos mencionados anteriormente. Note que z est a sobre el contorno de C mientras z0 est a en el interior, luego z z0 = 0 y la integral de la ecuaci on (5.48) est a bien denida. Aunque f (z ) se supone anal tica, el integrando es f (z )/(z z0 ) y no es anal tico en z = z0 a menos que f (z0 ) = 0. Si el contorno est a deformado como se muestra en la gura 5.10 se aplica el teorema de la integral de Cauchy. Por la ecuaci on (5.47) f (z ) dz z z0 f (z ) dz = 0 , z z0 (5.49)

C2

donde C es el contorno externo original y C2 es el c rculo circundante del punto z0 recorrido en sentido contrario a los punteros del reloj. Sea z = z0 + rei , usando la representaci on de coordenadas polares a causa de la forma circular del camino en torno a z0 . Aqu r es peque no y eventualmente se aproximar a a cero. Tenemos f (z ) dz = z z0 f (z0 + rei ) i rie d . rei

C2

C2

176

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

y C z0 C2

Lnea de contorno

8 x
f (z ) dz = if (z0 ) d z z0 C2 = 2if (z0 ) ,

Figura 5.10: Exclusi on de un punto singular.

Tomando el l mite cuando r 0, obtemos (5.50)

C2

ya que f (z ) es anal tica y por lo tanto continua en z = z0 . Esto prueba la f ormula de la integral de Cauchy. Este es un resultado notable. El valor de una funci on anal tica f (z ) est a dado en un punto interior z = z0 una vez que los valores sobre el contorno C son especicados. Esto es ntimamente an alogo a una forma de la ley de Gauss bidimensional en la cual la magnitud de una carga lineal interna estar a dada en t erminos de la integral de supercie cil ndrica del campo el ectrico E . Una analog a adicional es la determinaci on de una funci on en el espacio real por una integral de la funci on y la correspondiente funci on de Green (y sus derivadas) sobre la supercie de contorno. La teor a de difracci on de Kircho es un ejemplo de esto. Ha sido enfatizado que z0 es un punto interior. Qu e ocurre si z0 es exterior a C ?. En este caso el integrando entero es anal tico sobre y dentro de C . El teorema de la integral de Cauchy, se aplica y la integral se anula. Tenemos 1 2i f (z ) dz = z z0 f (z0 ) , 0, z0 interior z0 exterior

5.4.1

Derivadas.

La f ormula integral de Cauchy puede ser usada para obtener una expresi on para la derivada de f (z ). A partir de la ecuaci on (5.48), con f (z ) anal tica, f (z0 + z0 ) f (z0 ) 1 = z0 2iz0 f (z ) dz z z0 z0 f (z0 ) dz z z0 .

5.4. FORMULA INTEGRAL DE CAUCHY. Entonces, por denici on de la derivada (ecuaci on (5.17)), f (z0 ) = lim 1 z0 f (z ) dz z0 0 2iz0 (z z0 z0 )(z z0 ) 1 f (z ) = dz . 2i (z z0 )2

177

(5.51)

Podemos ver que este resultado podr a haber sido obtenido por diferenciaci on de la ecuaci on (5.48) bajo el signo integral con respecto a z0 . Esta t ecnica para construir derivadas puede ser repetida. Escribamos f (z0 + z0 ) y f (z0 ), usando la ecuaci on (5.51). Sustrayendo, dividiendo por z0 , y nalmente tomando el l mite cuando z0 0, obtenemos f (2) (z0 ) = 2 2i f (z ) dz . (z z0 )3

Notemos que f 2 (z0 ) es independiente de la direcci on de z0 como debe ser. Continuando, obtenemos f (n) (z0 ) = n! 2i f (z ) dz . (z z0 )n+1 (5.52)

esto es, el requerimiento que f (z ) sea anal tica no s olo garantiza una primera derivada sino que las derivadas de todos los ordenes tambi en. Las derivadas de f (z ) son autom aticamente anal ticas.

5.4.2

Teorema de Morera.

Otra aplicaci on de la f ormula de la integral de Cauchy est a en la prueba del teorema de Morera, el cual es la inversi on del teorema de la integral de Cauchy. El teorema establece lo siguiente: Si una funci on f (z ) es continua en una regi on simplemente conexa R y c f (z )dz = 0 para cada contorno cerrado C dentro de R, entonces f (z ) es anal tica a trav es de R. Integremos f (z ) desde z1 a z2 . Ya que cada integral cerrada de camino de f (z ) se anula, la integral es independiente del camino y depende solamente de sus puntos extremos. Etiquetemos el resultado de la integraci on F (z ), con
z2

F (z2 ) F (z1 ) =
z1

f (z ) dz .

(5.53)

Como una identidad, F (z2 ) F (z1 ) f (z1 ) = z2 z1


z2 [f (t) z1 z2 [f (t) z1

f (z1 )] dt

z2 z1

(5.54)

usando t como otra variable compleja. Ahora tomemos el l mite cuando z2 z1 . lim f (z1 )] dt z2 z1 =0, (5.55)

z2 z1

178

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

ya que f (t) es continua9 . Por lo tanto lim F (z2 ) F (z1 ) = F (z ) z2 z1 = f (z1 )


z = z1

z2 z1

(5.56)

por denici on de derivada (ecuaci on (5.17)). Hemos probado que F (z ) en z = z1 existe y es igual a f (z1 ). Ya que z1 es cualquier punto en R, vemos que F (z ) es anal tica. Entonces por la f ormula de la integral de Cauchy (compare la ecuaci on (5.52)) F (z ) = f (z ) es tambi en anal tica, probando el teorema de Morera. Dibujando una vez m as en nuestro an alogo electroest atico, podr amos usar f (z ) para representar el campo electroest atico E . Si la carga neta dentro de cada regi on encerrada en R es cero (ley de Gauss), la densidad de carga es donde quiera igual a cero en R. Alternativamente, en t erminos del an alisis vectorial, si f (z ) representa una fuerza conservativa (por denici on de conservativa), y entonces encontramos que es siempre posible expresarla como la derivada de una funci on potencial F (z ). n Si f (z ) = an z es anal tica y acotada, |f (z )| M sobre un c rculo de radio r alrededor del origen, entonces | an | rn M (5.57)

da cotas superiores para los coecientes de su expansi on de Taylor. Para probar la ecuaci on (5.57) denamos M (r) = max|z|=r |f (z )| y usemos la integral de Cauchy para an | an | = 1 2 f (z ) 2r dz M (r) . n +1 z 2rn+1

| z |= r

Una consecuencia inmediata de la desigualdad (5.57) es el teorema de Liouville: Si f (z ) es anal tica y acotada en el plano complejo ella es constante. En efecto, si |f (z )| M para cualquier z , entonces la desigualdad de Cauchy (5.57) da |an | M rn 0 cuando r para todo n > 0. De modo que f (z ) = a0 . Inversamente, la desviaci on m as leve de una funci on anal tica a partir de un valor constante implica que debe haber al menos una singularidad en alguna parte del plano complejo innito. A parte de las funciones constantes triviales, entonces, las singularidades son un hecho de la vida, y debemos aprender a vivir con ellas. Pero haremos m as que esto. Expandiremos una funci on en una serie de Laurent en torno a una singularidad, y usaremos singularidades para desarrollar el poderoso y u til c alculo del residuo en el pr oximo cap tulo. v El teorema fundamental del algebra, el cual dice que cualquier polinomio P (z ) = n v =0 av z con n > 0 y an = 0 tiene n raices, tambi en se deduce del teorema de Liouville. Suponga que P (z ) no tiene cero. Entonces, 1/P (z ) es anal tica y acotada cuando |z | . De modo que f (z ) es una constante por el teorema de Liouville, q.e.a. Por lo tanto P (z ) tiene al menos una ra z por la cual puede ser dividida. Luego repetimos el proceso para el polinomio resultante de grado n 1. Esto tiende a la conclusi on que P (z ) tiene exactamente n raices.
9

Podemos usar aqu el teorema del valor medio.

DE LAURENT. 5.5. EXPANSION

179

5.5
5.5.1

Expansi on de Laurent.
Expansi on de Taylor.

La f ormula de la integral de Cauchy de la secci on precedente abre el camino para otra derivaci on de la serie de Taylor, pero esta vez para funciones de una variable compleja. Supongamos que tratamos de expandir f (z ) en torno a z = z0 y que tenemos z = z1 como el punto m as cercano sobre el plano complejo para el cual f (z ) no es anal tica. Construimos un c rculo C centrado en z = z0 con radio |z z0 | < |z1 z0 | (5.11). Ya que supusimos z1 como el punto m as cercano en el cual f (z ) no era anal tica, f (z ) es necesariamente anal tica sobre y dentro de C .

C |z1z0 | z0 |zz0 |

z1

Figura 5.11: Expansi on en torno a z0 con z1 el primer punto en que f (z ) no es anal tica.

A partir de la ecuaci on (5.48), la f ormula de la integral de Cauchy, f (z ) = 1 2i 1 = 2i 1 = 2i f (z )dz z z f (z )dz (z z0 ) (z z0 ) f (z )dz . (z z0 )[1 (z z0 )/(z z0 )]

(5.58)

Aqu z es un punto en el contorno de C y z es cualquier punto interior a C . No es rigurosamente legal expandir el denominador del integrando en la ecuaci on (5.58) por el teorema binomial, porque todav a no hemos probado el teorema binomial para variables complejas. En cambio, notemos la identidad 1 = 1 + t + t2 + t3 + = 1t

tn ,
n=0

(5.59)

la cual puede ser f acilmente vericada multiplicando ambos lados por 1 t. La serie innita, siguiendo el m etodo de la secci on 4.2, es convergente para |t| < 1.

180

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Ahora para el punto z interior a C , |z z0 | < |z z0 |, y usando la ecuaci on (5.59), la ecuaci on (5.58) se convierte en 1 f (z ) = 2i
C n=0

(z z0 )n f (z )dz (z z0 )n+1

(5.60)

Intercambiando el orden de la integraci on y de la suma (v alida ya que la ecuaci on (5.59) es uniformemente convergente para |t| < 1), obtenemos 1 f (z ) = 2i Usando la ecuaci on (5.52),obtenemos

(z z0 )n
n=0 C

f (z )dz (z z0 )n+1

(5.61)

f (z ) =
n=0

(z z0 )n

f (n) (z0 ) , n!

(5.62)

la cual es nuestra expansi on de Taylor deseada. Note que est a basada solamente en la suposici on de que f (z ) es anal tica para |z z0 | < |z1 z0 |. Al igual que para series de potencia de variable real, esta expansi on es u nica para un z0 dado.

5.5.2

Principio de Reexi on de Schwarz.

A partir de la expansi on binomial de g (z ) = (z x0 )n para n entero es f acil ver que el conjugado complejo de una funci on es la funci on del complejo conjugado, para x0 real g (z ) = ((z x0 )n ) = (z x0 )n = g (z ) . (5.63)

Esto conduce al principio de reexi on de Schwarz: Si una funci on f (z ) es (1) anal tica sobre alguna regi on incluyendo el eje real y (2) real cuando z es real, entonces f (z ) = f (z ) . Ver gura 5.12. Expandiendo f (z ) alrededor de alg un punto (no singular) x0 en el eje real,

(5.64)

f (z ) =
n=0

(z x0 )

nf

(n)

(x0 ) , n!

(5.65)

por la ecuaci on (5.61). Ya que f (z ) es anal tica en z = x0 , esta expansi on de Taylor existe. Ya que f (z ) es real cuando z es real, f (n) (x0 ) debe ser real para todo n. Luego cuando usemos la ecuaci on (5.63), la ecuaci on (5.64), el principio de reexi on de Schwarz, sigue inmediatamente.

DE LAURENT. 5.5. EXPANSION

181

u f(z)=u(x,y)+iv(x,y) =f*(z*)=u(x,y)iv(x,y) v f(z*)=u(x,y)+iv(x,y) =f*(z)=u(x,y)iv(x,y)

Figura 5.12: Principio de reexi on de Schwarz.

5.5.3

Continuaci on anal tica.

Es natural pensar los valores f (z ) de una funci on anal tica f como una entidad u nica que usualmente est a denida en alguna regi on restringida S1 del plano complejo, por ejemplo una serie de Taylor (ver gura 5.13). Entonces f es anal tica dentro del c rculo de convergencia C1 , cuyo radio est a dado por la distancia r1 desde el centro de C1 a la singularidad m as cercana de f en z1 (en gura 5.13). Si escogemos un punto dentro de C1 que este m as all a de r1 desde la singularidad de z1 y hacemos una expansi on de Taylor de f , luego el c rculo de convergencia C2 usualmente se extender a m as all a del primer c rculo C1 . En la regi on que se superponen ambos c rculos C1 , C2 la funci on f est a denida en forma u nica. En la regi on del c rculo C2 que se extiende m as all a de C1 , f (z ) est a denida en forma u nica por la serie de Taylor en torno al centro de C2 y es anal tica all , aunque la serie de Taylor en torno al centro de C1 no es m as convergente all . Despu es Weierstrass este proceso es llamado continuaci on anal tica. Esta dene la funci on anal tica f en t erminos de su denici on original (en C1 ) y todas sus continuaciones.

y S 2 z=z C2 2 x z=z1 S1 C1

Figura 5.13: Continuaci on anal tica.

182

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Un ejemplo espec co es la funci on merom orca 1 f (z ) = , (5.66) 1+z la cual tiene un polo simple en z = 1 y es anal tica donde sea. La expansi on de la serie geom etrica 1 = 1 z + z2 = 1+z

(z )n ,
n=0

(5.67)

converge para |z | < 1, i.e., dentro del c rculo C1 en la gura 5.13. Supongamos que expandimos f (z ) alrededor de z = i, tal que 1 1 1 = = 1+z 1 + i + (z i) (1 + i)(1 + (z i)/(1 + i)) (5.68) 2 z i (z i) 1 = 1 + ... , 1 + i (1 + i)2 1+i converge para |z i| < |1 + i| = 2. Nuestro c rculo de convergencia es C2 en la gura 5.13. Ahora f (z ) est a denida por la expansi on (5.68) en S2 la cual se superpone a S1 y se extiende m as all a en el plano complejo10 . Esta extensi on es una continuaci on anal tica, y cuando tenemos solamente puntos singulares aislados con quien enfrentarnos, la funci on puede ser extendida indenidamente. Las ecuaciones (5.66),(5.67) y (5.68) son tres representaciones diferentes de la misma funci on. Cada representaci on tiene su propio dominio de convergencia. La ecuaci on (5.67) es una serie de Maclaurin. La ecuaci on (5.68) es una expansi on de Taylor alrededor de z = i y desde el siguiente p arrafo la ecuaci on (5.66) se ve como una serie de Laurent de un t ermino. Una continuaci on anal tica puede ser tomada de muchas formas y la serie de expansi on ya consideradas no es necesariamente la t ecnica m as conveniente. Como una t ecnica alternativa usaremos una relaci on de recurrencia para extender la funci on factorial alrededor de los puntos singulares aislados, z = n, n = 1, 2, 3, . . . . f (z ) =

5.5.4

Permanencia de la forma algebraica.

Todas nuestras funciones elementales, ez , sen(z ), etc., pueden ser extendidas al plano complejo. Por ejemplo, ellas pueden ser denidas por expansiones de series de potencias tal como z2 z + = e =1+ + 1! 2!
z

n=0

zn , n!

(5.69)

para la exponencial. Tales deniciones concuerdan con las deniciones de variable real a lo largo del eje x y literalmente constituyen una continuaci on anal tica de las correspondientes funciones reales en el plano complejo. Este resultado a menudo es llamado permanencia de la forma algebraica
Uno de los m as poderosos y hermosos resultados de la m as abstracta teor a de funciones de variable compleja es que si dos funciones anal tica coinciden en una regi on, tal como la intersecci on de S1 y S2 , o coinciden sobre cualquier segmento de l nea, ellas son la misma funci on en el sentido que ellas coincidiran en cualquier parte siempre que ambas est en bien denidas.
10

DE LAURENT. 5.5. EXPANSION

183

5.5.5

Serie de Laurent.

Frecuentemente encontramos funciones que son anal ticas en una regi on anular, es decir, de radio interno r y radio externo R, como lo muestra la gura 5.14. Dibujando una l nea de

z(C1)

R C2 C1

z(C2)

z0 r

Lnea de contorno

Figura 5.14: |z z0 |C1 > |z z0 |; |z z0 |C2 < |z z0 |.

contorno auxiliar para convertir nuestra regi on en una regi on simplemente conexa, aplicamos la f ormula integral de Cauchy, y para los dos c rculos, C2 y C1 , centrados en z = z0 y con radios r2 y r1 , respectivamente, donde r < r2 < r1 < R, tenemos11 f (z ) = 1 2i f (z )dz 1 z z 2i f (z )dz . z z (5.70)

C1

C2

Note cuidadosamente que en la ecuaci on (5.70) un signo menos expl cito ha sido introducido as que el contorno C2 (como C1 ) sea recorridos en el sentido positivo (contra los punteros del reloj). El tratamiento de la ecuaci on (5.70) ahora procede exactamente como la ecuaci on (5.58) en el desarrollo de la serie de Taylor. Cada denominador escrito como (z z0 ) (z z0 ) y expandido por el teorema del binomio el cual ahora sigue a la serie de Taylor (ecuaci on (5.62)). Notando que para C1 , |z z0 | > |z z0 | mientras que para C2 , |z z0 | < |z z0 |, encontramos 1 f (z ) = 2i

(z z0 )
n=0

n C1

f (z )dz 1 + n +1 (z z0 ) 2i

(z z0 )n
n=1 C2

(z z0 )n1 f (z )dz . (5.71)

El signo menos de la ecuaci on (5.70) ha sido absorbido por la expansi on binomial. Etiquetando la primera serie S1 y la segunda S2 , S1 =
11

1 2i

(z z0 )n
n=0 C1

f (z )dz , (z z0 )n+1

(5.72)

Podemos tomar r2 arbitrariamente cerca de r y r1 arbitrariamente cerca de R, maximizando el area encerrada por C1 y C2 .

184

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

la cual es la expansi on de Taylor regular, convergente para |z z0 | < |z z0 | = r1 , esto es, para todo z interior del c rculo, C1 . Para la segunda serie de la ecuaci on tenemos S2 = 1 2i

(z z0 )n
n=1 C2

(z z0 )n1 f (z )dz

(5.73)

convergente para |z z0 | > |z z0 | = r2 , esto es, para todo z exterior al c rculo m as peque no C2 . Recuerde, C2 ahora va en contra del sentido de los punteros del reloj. Estas dos series pueden ser combinadas en una serie12 ( una serie de Laurent) por

f (z ) =
n=

an (z z0 )n ,

(5.74)

donde an = 1 2i f (z )dz (z z0 )n+1 (5.75)

Ya que, en la ecuaci on (5.75), la convergencia de la expansi on binomial ya no es un problema, C puede ser cualquier contorno dentro de una regi on anular r < |z z0 | < R encerrando a z0 una vez en sentido antihorario. Si suponemos que en una regi on anular la convergencia existe, la ecuaci on (5.74) es la serie de Laurent o la expansi on de Laurent de f (z ). El uso de una l nea de contorno (gura 5.14) es conveniente para convertir la regi on anular en una regi on simplemente conexa. Ya que nuestra funci on es anal tica en esa regi on anular (y por lo tanto univaluada), la l nea de contorno no es esencial y, por cierto, las funciones con puntos de ramicaci on deben tener l neas de corte. Los coecientes de las series de Laurent no necesitan venir de la evaluaci on de las integrales de contorno ( las cuales pueden ser muy dif ciles de trabajar). Otras t ecnicas tales como las expansiones de series ordinarias pueden dar los coecientes. Nos limitaremos a un ejemplo sencillo para ilustrar la aplicaci on de la ecuaci on (5.74). Ejemplo Sea f (z ) = [z (z 1)]1 . Si escogemos z0 = 0, entonces r = 0 y R = 1, f (z ) diverge en z = 1. A partir de las ecuaciones (5.75) y (5.74) an = 1 2i dz (z

)n+2 (z
m

1)n+1

1 = 2i

dz (z ) . (z )n+2 m=0

(5.76)

De nuevo, intercambiando el orden de la suma y la integraci on (series uniformemente convergentes), tenemos 1 an = 2i m=0
12

dz . (z )n+2m

(5.77)

Reemplazando n por n en S2 y sumando.

5.6. MAPEO. Si empleamos la forma polar, como en la ecuaci on (5.52) 1 an = 2i m=0


185

riei d rn+2m ei(n+2m) (5.78)

1 = 2i n+2m,1 . 2i m=0 En otras palabras, an = 1 0 para n 1, para n < 1.

(5.79)

La expansi on de Laurent (ecuaci on (5.74)) se convierte en 1 1 = 1 z z2 z3 z (z 1) z

(5.80)

=
n=1

z .

Para esta funci on simple la serie de Laurent puede, por su puesto, ser obtenida por una expansi on binomial directa. La serie de Laurent diere de la de Taylor por las caracter sticas obvias de las potencias negativas de (z z0 ). Por esta raz on la serie de Laurent siempre divergir a al menos en z = z0 y quiz as en cuanto a alguna distancia m as all a de r (gura 5.14).

5.6

Mapeo.

En las seccciones precedentes hemos denido las funciones anal ticas y hemos desarrollado alguna de sus principales caracter sticas. A partir de estos desarrollo las relaciones integrales del pr oximo cap tulo se derivan directamente. Aqu introducimos algunos de los aspectos m as geom etricos de las funciones de variables compleja, aspectos que ser an u tiles en la visualizaci on de las operaciones integrales en el pr oximo cap tulo y que ser an valiosas en s mismas para resolver la ecuaci on de Laplace en un sistema de dos dimensiones. En geometr a anal tica com un podemos tomar y = f (x) y gracar y versus x. Nuestro problema aqu es m as complicado, porque z es una funci on de dos variables x e y . Usamos la notaci on w = f (z ) = u(x, y ) + iv (x, y ) , (5.81)

Entonces para un punto en el plano z (valores espec cos de x e y ) all puede corresponder valores espec cos para u(x, y ) y v (x, y ) los cuales producen luego un punto en el plano w. As los puntos en el plano z transforman o son mapeados en puntos en el plano w, l neas o areas en el plano z ser an mapeados en l neas o a reas en el plano w. Nuestro prop osito inmediato es ver cuantas l neas o areas mapean desde el plano z al plano w para un n umero de funciones simples.

186

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

5.6.1

Traslaci on.
w = z + z0 . (5.82)

La funci on w es igual a la variable z m as una constante, z0 = x0 + iy0 . Por las ecuaciones (5.1) y (5.81) u = x + x0 , v = y + y0 , (5.83)

representando una traslaci on pura de los ejes de coordenadas como muestra la gura 5.15.

z (x1 ,y1 )

w (u1 ,v1 ) r (x0 ,y0 )

x
Figura 5.15: Translaci on.

5.6.2

Rotaci on.
w = zz0 . (5.84)

Aqu es conveniente volver a la representaci on de coordenadas polares, usando w = ei , entonces ei = rr0 ei(+0 ) o = rr0 = + 0 . (5.87) (5.86) z = rei y z0 = r0 ei0 , (5.85)

Dos cosas han ocurrido. Primero, el m odulo r ha sido modicado, ya sea expandido o contraido, por el factor r0 . Segundo, el argumento ha sido aumentado por la constante aditiva 0 (gura 5.16). Esto representa una rotaci on de la variable compleja en un angulo 0 . Para el caso especial de z0 = i, tenemos una rotaci on pura en /2 radianes.

5.6. MAPEO.

187

y (0,1) r r0 0 (1,0)

= r r0 w

=+ 0

Figura 5.16: Rotaci on.

5.6.3

Inversi on.
w= 1 . z (5.88)

Nuevamente, usando la forma polar, tenemos ei = la cual muestra que = 1 , r = . (5.90) 1 1 = ei , i re r (5.89)

La primera parte de la ecuaci on (5.90) muestra claramente una inversi on. El interior del c rculo unitario es mapeado en el exterior y vice versa (gura 5.17). En suma, la segunda parte de la ecuaci on (5.90) muestra que el angulo polar se le invierte el signo. La ecuaci on (5.88), por lo tanto, tambi en involucra una reexi on del eje y exactamente como la ecuaci on del complejo conjugado. Para ver como las l neas en el plano z se transforman en el plano w, simplemente volvamos a la forma cartesiana: u + iv = 1 . x + iy (5.91)

Racionalizando el lado derecho multiplicando el numerador y el denominador por z y luego igualando las partes reales e imaginarias, tenemos x u u= 2 , x= 2 , 2 x +y u + v2 (5.92) y v v= 2 , y = . x + y2 u2 + v 2 Un c rculo centrado en el origen en el plano z tiene la forma x2 + y 2 = r 2 , (5.93)

188

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

y (0,1) r

v (0,1) x

1 r

Figura 5.17: Inversi on.

y por la ecuaci on (5.92) se transforma en u2 v2 + = r2 . (u2 + v 2 )2 (u2 + v 2 )2 Simplicando la ecuaci on (5.94), obtenemos u2 + v 2 = 1 = 2 , 2 r (5.95) (5.94)

la cual describe un c rculo en el plano w tambi en centrado en el origen. La l nea horizontal y = c1 se transforma en (u2 o u2 + v 2 + v 1 1 + = c1 (2c1 )2 (2c1 )2 (5.97) v = c1 , + v 2 )2 (5.96)

la cual describe un c rculo en el plano w de radio (1/2)c1 y centrado en u = 0, v = 1/2c1 (gura 5.18). Podemos probar otras posibilidades, x = c1 , y = c1 , o rotar los ejes xy . En general, cualquier l nea recta o c rculo en el plano z transformar a en l nea recta o c rculo en el plano w.

5.6. MAPEO.

189

y z

y=c1

4 4

3 2

(0,

1 2

c )

Figura 5.18: Inversi on, l neac rculo.

5.6.4

Puntos de ramicaci on y funciones multivaluadas.

Las tres transformaciones ya discutidas todas han involucrado una correspondencia uno a uno de puntos en el plano z a puntos en el plano w. Ahora ilustraremos la variedad de transformaciones que son posibles y los problemas que ellas puedan presentar, introduciremos una correspondencia de dos a uno y luego una correspondencia de muchos a uno. Finalmente, tomaremos los inversos de esas dos transformaciones. Consideremos primero la transformaci on w = z2 , la cual conduce a = r2 , = 2 . (5.99) (5.98)

Claramente, nuestras transformaci on es no lineal, para el m odulo es cuadrado, pero la caracter stica signicante de la ecuaci on (5.99) es que el angulo fase o argumento est a doblado. Esto signica que: primer cuadrante de z , 0 < /2 semi plano superior de w, 0 < , semi plano superior de z , 0 < plano completo de w, 0 < 2 . El semi plano inferior de z mapea sobre el ya cubierto el plano completo de w, cubriendo el plano w por segunda vez. Esta es nuestra correspondencia dos a uno, dos puntos distintos 2 en el plano z , z0 y z0 ei = z0 , correspondiendo al punto u nico w = z0 . En representaci on cartesiana u + iv = (x + iy )2 = x2 y 2 + i2xy , (5.100)

190 produciendo

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

u = x2 y 2 , v = 2xy .

(5.101)

De modo que las l neas u = c1 , v = c2 en el plano w corresponden a x2 y 2 = c1 , 2xy = c2 , hip erbolas rectangular (y ortogonal) en el plano z (gura 5.19). Para cada punto sobre la

y z

2xy=c 2 x 2 y2 = c1

v u= c 1

v= c 2 x u

Figura 5.19: Mapeo en coordenadas hiperb olicas. hip erbola x2 y 2 = c1 en el semi plano derecho, x > 0, un punto sobre la l nea u = c1 tambi en 2 2 corresponde a un punto sobre la hip erbola x y = c1 y en el semi plano izquierdo, x < 0, como se explic o. En la pr oxima secci on mostraremos que si las l neas en el plano w son ortogonales las correspondientes l neas en el plano z tambi en son ortogonales, ya que la trnasformaci on es anal tica. Aunque u = c1 y v = c2 son construidas en forma perpendicular una a otra, las correspondientes hip erbolas en el plano z son ortogonales. Literalmente hemos construido un nuevo sistema ortogonal de l neas hiperb olicas (o supercies si a nadimos un eje perpendicular a x e y ). Podr a notarse que si las l neaas hiperb olicas son l neas de fuerza el ectrica o magn etica, entonces tenemos un lente cuadrupolar u til en enfocar haces de part culas de alta energ a. El inverso de la cuarta transformaci on (ecuaci on (5.98)) es w = z 1/2 . De la relaci on ei = r1/2 ei/2 , y 2 = , (5.104) (5.103) (5.102)

5.6. MAPEO.

191

ahora tenemos dos puntos en el plano w (argumentos y + ) corresponden a un punto en el plano z (excepto para el punto z = 0). O, poniendolo de otra manera, y + 2 corresponden a y a + , dos puntos distintos en el plano w. Esto es en variable compleja el an alogo de la ecuaci on en variable real simple y 2 = x, en la cual dos valores de y , m as y menos, corresponden a cada valor de x. El punto importante aqu es que podemos hacer la funci on w de la ecuaci on (5.102) una funci on univaluada en vez de una funci on bivaluada si acordamos en restringir a un rango tal como 0 < 2 . Esto puede ser hecho acordando nunca cruzar la l nea = 0 en el plano z (gura 5.20). Cada una de las l neas de demarcaci on es llamada una l nea de corte.

Lnea de corte

x
Figura 5.20: L nea de corte.

La l nea de corte acopla las dos singularidades de puntos ramicados en 0 y , donde la funci on es claramente no anal tica. Cualquier l nea desde z = 0 a innito servir a igualmente bien. El prop osito de la l nea de corte es restringir el argumento de z . Los puntos z y z exp(2i) coincide en el plano z pero produce diferentes puntos: w y w = w exp(i), en el plano w. De modo que en ausencia de una l nea de corte la funci on w = z 1/2 es ambigua. Alternativamente, aunque la funci on w = z 1/2 es bivaluada, tambi en podemos pegar dos hojas del plano complejo z junto a lo largo de la l nea de corte tal que arg(z ) aumente m as all a de 2 a lo largo de la l nea de corte bajar desde 4 sobre la segunda hoja hasta la partida sobre la primera hoja. Esta construcci on es llamada supercie de Riemann de w = z 1/2 . Encontraremos puntos ramicados y l neas de corte frecuentemente en el pr oximo cap tulo. La transformaci on w = ez , produce ei = ex+iy , o = ex , =y . (5.107) (5.106) (5.105)

192

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Si y pertenece a 0 y < 2 (o y < ), entonces cubre el mismo intervalo. Pero esto es el plano w completo. En otras palabras, una franja horizontal en el plano z de ancho 2 mapea en el plano w entero. M as amplio, cualquier punto (por la ecuaci on (5.107)), en el plano w. Tenemos una correspondencia de muchos a uno (innitamente muchos). Finalmente, el inverso de la quinta transformaci on (ecuaci on (5.105)), tenemos w = ln z . Expandiendola, tenemos u + iv = ln rei = ln r + i . (5.109) (5.108)

Para un punto z0 dado en el plano z el argumento es inespec co dentro de un multiplo entero de 2 . Esto signica que v = + 2n , (5.110)

y como en la transformaci on exponencial, tenemos una correspondencia de muchos a uno. La ecuaci on (5.108) una simp atica representaci on f sica. Si vamos alrededor del c rculo unitario en el plano z , r = 1 y por la ecuaci on (5.109), u = ln r = 0; pero v = , y est a aumentando establemente y contin ua aumentando cuando contin ua, pasado 2 . La l nea de corte acopla el punto ramicado en el origen con innito. Cuando aumenta pasado 2 pegamos una nueva hoja del plano complejo z a lo largo de la l nea de corte, etc. Haciendo un recorrido alrededor del c rculo unitario en el plano z es como avanza un desatornillador como si rotara o la subida de una persona ascendiendo una escalera de espiral (gura 5.21), la cual es la supercie de Riemann de w = ln z .

x
Figura 5.21: Esta es la supercie de Riemann para ln(z ), una funci on multivaluada.

Como en el ejemplo precedente, tambi en podemos hacer la correspondencia u nica (y ecuaci on (5.108) inambigua) restringendo a un intervalo tal como 0 < 2 tomando la l nea = 0 (eje real positivo) como una l nea de corte. Esto es equivalente a tomar una y solamente una vuelta completa de la escalera de espiral.

5.7. MAPEO CONFORME Esto a causa de la naturaleza multivaluada de ln z que la integral de contorno dz = 2i = 0 , z

193

integrando alrededor del origen. El concepto de mapeo es amplio y u til en matem aticas. Nuestro mapeo del plano complejo z a un plano complejo w es una generalizaci on simple de una denici on de funci on: un mapeo de x (a partir de un arreglo) en y en un segundo arreglo. Una forma m as sosticada de mapeo aparece cuando usamos la funci on delta de Dirac (x a) para mapear una funci on f (x) en su valor en el punto a.

5.7

Mapeo conforme

En la secci on 5.6 las hip erbolas fueron mapeadas en l neas rectas y l neas rectas mapeadas en c rculos. A un en todas esas transformaciones una caracter stica permaneci o constante. Esta constancia fue un resultado del hecho que todas las transformaciones de la secci on 5.6 eran anal ticas. Ya que w = f (z ) es una funci on anal tica, tenemos df dw w = = lim z 0 dz dz z (5.111)

Suponiendo que esta ecuaci on est a en una forma polar, podemos igualar el m odulo al m odulo y el argumento al argumento. Para el u ltimo (suponiedo que df /dz = 0) arg lim w w = lim arg z 0 z z 0 z = lim argw lim argz
z 0 z 0

(5.112)

= arg

df =, dz

donde , el argumento de la derivada, puede depender de z pero es una constante para un z jo, independiente de la direcci on de aproximaci on. Para ver el signicado de esto, consideremos dos curvas, Cz en el plano z y la correspondiente curva Cw en el plano w (gura 5.22). El incremento z est a mostrado en un angulo relativo al eje real (x) mientras el correspondiente incremento w forma un angulo de con el eje real (u). De la ecuaci on (5.112) =+ , (5.113)

o cualquier l nea en el plano z es rotado a trav es de un angulo en el plano w ya que w es una transformaci on anal tica y la derivada es distinta de cero13 . Entonces para el angulo entre estas dos l neas 2 1 = (2 + ) (1 + ) = 2 1 ,
13

(5.114)

Si df /dz = 0 las fases quedan indenidas y la transformaci on no necesariamente preservar a los angulos.

194

CAP ITULO 5. FUNCIONES DE UNA VARIABLE COMPLEJA I.

Cz z0 planoz z x

v w w 0 Cw =+

planow u

Figura 5.22: Mapeo conforme preservaci on de los angulos.

la cual muestra que el angulo incluido es preservado bajo una transformaci on anal tica. Tal transformaci on que preserva el angulo son llamadas conformes. El angulo de rotaci on , en general, depender a de z . Adicionalmente |f (z )| usualmente, ser a una funci on de z . Hist oricamente, estas transformaciones conformes han sido de gran importancia para los cient cos e ingenieros en resolver la ecuaci on de Laplace para problemas de electroest atica, hidrodin amica, ujo de calor y etc. Desafortunadamente, el acercamiento por transformaci on conformes, siempre elegante, est a limitada a problemas que pueden ser reducidos a dos dimensiones. El m etodo es a menudo bello si hay una alta simetr a presente pero a menudo imposible si la simetr a est a rota o ausente. A causa de estas limitaciones y principalmente a causa de la alta velocidad que los computadores que ofrecen una u til alternativa (soluciones iterativas de la ecuaciones diferenciales parcial), los detalles y aplicaciones del mapeo conforme son omitidas.

Cap tulo 6 Funciones de una variable compleja II.


C alculo del residuo.
versi on nal 1.4-1207021

6.1

Singularidades.

En este cap tulo volvemos a la l nea de an alisis que comenzamos con las condiciones de Cauchy-Riemann en el cap tulo anterior y nos condujo a la expansi on de Laurent. La expansi on de Laurent representa una generalizaci on de las series de Taylor en presencia de singularidades. Denimos el punto z0 como un punto singular aislado de la funci on f (z ) si f (z ) no es anal tica en z = z0 pero es anal tica en las cercan as del punto. Una funci on que es anal tica en el plano complejo entero nito excepto por polos aislados es llamada merom orca.

6.1.1

Polos.

En la expansi on de Laurent de f (z ) alrededor de z0

f (z ) =
n=

an (z z0 )n .

(6.1)

Si an = 0 para todo n < m < 0 y am = 0, decimos que z0 es un polo de orden m. Por ejemplo, si m = 1; esto es, si a1 /(z z0 ) es el primer t ermino no nulo en la serie de Laurent, tenemos un polo de orden uno, a menudo llamado un polo simple. Si, por otra parte, la suma continua en n = , entonces z0 es un polo de orden innito y es llamado una singularidad esencial. Estas singularidades esenciales tienen muchas caracter sticas patol ogicas. Por ejemplo, podemos mostrar que en cualquier peque na vecindad en torno a una singularidad esencial de f (z ) la funci on f (z ) llega a ser arbitrariamente cercana a cualquier cantidad compleja seleccionada w0 . Literalmente, el plano w complejo es mapeado en el entorno del punto z0 . Un punto de diferencia fundamental entre un polo de orden nito y una singularidad esencial es que un polo de orden m puede ser removido multiplicando f (z ) por (z z0 )m . Esto obviamente no puede ser hecho para una singularidad esencial.
Este cap tulo est a basado en el s eptimo cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
1

195

196

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

El comportamiento de f (z ) cuando z est a denido en t erminos de f (1/t) cuando t 0. Consideremos la funci on

sen(z ) =
n=0

(1)n z 2n+1 . (2n + 1)!

(6.2)

Cuando z , reemplazamos la z por 1/t para obtener sen 1 t

=
n=0

(1)n . (2n + 1)!t2n+1

(6.3)

Claramente, a partir de la denici on, sen(z ) tiene una singularidad esencial en innito. Este resultado podr a anticiparse ya que sen(z ) = sen iy , = i senh y , cuando x = 0

el cual tiende a innito en forma exponencial cuando y . Por lo tanto, aunque el valor absoluto de sen x para x real es igual a o menor que uno, el valor absoluto de sen z no est a acotado.

6.1.2

Puntos de ramicaci on.

Hay otra tipo de singularidad que ser a importante en las u ltimas secciones de este cap tulo. Consideremos f (z ) = z a , en el cual a no es un entero2 . Cuando z se mueve alrededor del c rculo unitario desde e0 a e2i , f (z ) e2i = e0i , para a no entero. Como en el cap tulo anterior, tenemos un punto ramicado en el origen y 0i otro en innito. Los puntos e y e2i en el plano z coinciden pero esos puntos coincidentes producen valores diferentes de f (z ); esto es, f (z ) es una funci on multivaluada. El problema es resuelto construyendo una l nea de corte uniendo ambos puntos de ramicaci on tal que f (z ) este u nicamente especicada para un punto dado en el plano z . Note cuidadosamente que una funci on con un punto de ramicaci on y una requerida l nea de corte no ser a continua a trav es de la l nea de corte. En general, ser a una fase diferente sobre el lado opuesto de esa l nea de corte. De modo que las integrales de l neas sobre los lados opuestos de estos puntos ramicados de la l nea de corte generalmente no se cancelar an unas con otras.
z = 0 es t ecnicamente un punto singular, para z a tiene un n umero nito de derivadas, mientras una funci on anal tica tiene garantizada un n umero innito de derivadas. El problema es que f (z ) no es una funci on monovaluada cuando tomamos un c rculo en torno al origen. La f ormula integral de Cauchy no puede ser aplicada.
2

6.1. SINGULARIDADES.

197

La l nea de contorno usada para convertir una regi on multiplemente conexa en una regi on simplemente conexa es completamente diferente. Nuestra funci on es continua a trav es de la l nea de contorno, y no existen fases diferentes. Ejemplo Considere la funci on f (z ) = (z 2 1)1/2 = (z + 1)1/2 (z 1)1/2 . (6.4)

El primer factor sobre el lado derecho, (z = 1)1/2 , tiene un punto de ramicaci on en z = 1. El segundo factor tiene un punto de ramicaci on z = +1. En innito f (z ) tiene un polo simple. La l nea de corte conecta ambos puntos ramicados. Consideremos la posibilidad de tomar el segmento de l nea que une z = +1 y z = 1 como una l nea de corte, sigamos las fases de estos dos factores cuando nos movemos a lo largo del contorno mostrado en la gura 6.1.

y
4 1 3 5 6

z
2 +1 1 7

Figura 6.1: Contorno que rodea a un par de puntos de ramicaci on.

Por conveniencia en los siguientes cambios de fase sea z +1 = rei y z 1 = ei . Entonces la fase de f (z ) es ( + )/2. Comenzamos en el punto 1 donde ambos z + 1 y z 1 tienen una fase de cero. Moviendose desde el punto 1 al punto 2, , la fase de z 1 = ei aumenta por . (z 1 llega a ser negativo). luego permanece constante hasta que el c rculo es completado, moviendose desde 6 a 7. , la fase de z + 1 = rei muestra un comportamiento similar aumentando por 2 cuando nos movemos desde 3 a 5. La fase de la funci on f (z ) es ( + )/2. Esto es tabulado en la columna nal de la tabla 6.1. Dos caracter sticas emergen; 1. La fase en los puntos 5 y 6 no es la misma que la de las fases de los puntos 2 y 3. Este comportamiento puede ser esperado en una l nea de corte de punto ramicado. 2. La fase en el punto 7 excede a la del punto 1 por 2 y la funci on f (z ) = (z 2 1)1/2 es por lo tanto univaluada para el contorno mostrado, circunscribiendo ambos puntos ramicados. Si tomamos el eje x 1 x 1 como una l nea de corte, f (z ) est a unicamente especicada. Alternativamente, el eje x positivo para x > 1 y el eje x negativo para x < 1 puede ser tomado como l nea de corte. Los puntos ramicados no pueden ser encerrados y la funci on permanece univaluada.

198

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II. Punto 1 0 2 0 3 0 4 5 2 6 2 7 2 0 2 ( + )/2 0 /2 /2 3/2 3/2 2

Tabla 6.1: Generalizando a partir de este ejemplo, tenemos que la fase de una funci on f (z ) = f1 (z ) f2 (z ) f3 (z ) . . . es la suma algebraica de la fase de sus factores individuales: arg[f (z )] = arg[f1 (z )] + arg[f2 (z )] + arg[f3 (z )] + . . . . La fase de un factor individual puede ser tomada como el arcotangente de la raz on de su parte imaginaria y su parte real, arg[fi (z )] = tan1 Para el caso de un factor de la forma fi (z ) = (z z0 ) la fase corresponde a la fase angular de un vector bidimensional desde +z0 a z , la fase aumenta en 2 cuando el punto +z0 es encerrado. Inversamente, la transversal de cualquier loop cerrado que no encierre a z0 no cambia la fase de z z0 . vi ui .

6.2
6.2.1

C alculo del residuo.


Teorema del residuo.

n Si la expansi on de Laurent de una funci on f (z ) = ermino n= an (z z0 ) es integrada t a t ermino usando un contorno cerrado que circunscribe un punto singular z0 aislado en un sentido antihorario, obtenemos

an

(z z0 )n dz = an =0

(z z0 )n+1 n+1

z2 z1

(6.5)

para todo n = 1 .

6.2. CALCULO DEL RESIDUO. Sin embargo, si n = 1, a 1 (z z0 )1 dz = a1 irei d = 2ia1 . rei

199

(6.6)

Resumiendo las ecuaciones (6.5) y (6.6), tenemos 1 2i f (z ) dz = a1 . (6.7)

La constante a1 , el coeciente de (z z0 )1 en la expansi on de Laurent, es llamada el residuo de f (z ) en z = z0 .

C2 C1 C0

Figura 6.2: Excluyendo singularidades aisladas.

Un conjunto de singularidades aisladas pueden ser manejada adecuadamente deformando nuestro contorno como es mostrado en la gura 6.2. El teorema integral de Cauchy conduce a f (z ) dz +
C C0

f (z ) dz +
C1

f (z ) dz +
C2

f (z ) dz + = 0 .

(6.8)

La integral cerrada en torno a cualquier punto singular es dada por la ecuaci on (6.7). f (z ) dz = 2ia1,zi
Ci

(6.9)

suponiendo una expansi on de Laurent en torno del punto singular, z = zi . El signo negativo viene de la integraci on en sentido horario como muestra la gura 6.2. Combinando las ecuaciones (6.8) y (6.9), tenemos f (z ) dz = 2i(a1,z0 + a1,z1 + a1,z2 + )
C

(6.10)

= 2i(la suma de los residuos encerrados) . Este es el teorema del residuo. El problema de evaluar una o m as integrales de contorno es reemplazado por el problema algebraico del c alculos de residuo en los puntos singulares encerrados.

200

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

El primer uso que le daremos al teorema del residuo es desarrollar el concepto del valor principal de Cauchy. Entonces en el remanente de esta secci on aplicaremos el teorema del residuo a una amplia variedad de integrales denidas de inter es matem atico y f sico. En la secci on 6.3 el concepto del valor principal de Cauchy es usado para obtener las importantes relaciones de dispersi on . El teorema del residuo tambi en ser a necesario m as adelante para una variedad de transformadas integrales, particularmente la transformada inversa de Laplace. Usando la transformaci on z = 1/w para w 0, podemos encontrar la naturaleza de la singularidad en z y el residuo de una funci on f (z ) con s olo singularidades aisladas y no en puntos ramicados. En tales casos conocemos que residuos en el plano nito z + residuo en z = 0 .

6.2.2

Valor principal de Cauchy.

Ocasionalmente un polo de primer orden aislado estar a directamente sobre el contorno de integraci on. En este caso podemos deformar el contorno para incluir o excluir el residuo deseado incluyendo un desv o semicircular de radio innitesimal. Esto es mostrado en la gura 6.3. La integraci on sobre el semic rculo luego da con z x0 = ei , dz = aei d,
2 dz =i d = i , z x0 0 dz =i d = i , z x0

i.e., ia1 i.e., ia1

sentido antihorario, sentido horario,

esta contribuci on, + o , aparece sobre el lado izquierdo de la ecuaci on (6.10). Si nuestro desv o es en sentido horario, el residuo no puede ser encerrado y all no estar a el correspondiente t ermino sobre el lado derecho de la ecuaci on (6.10). Sin embargo, si nuestro desv o es en sentido antihorario, este residuo podr a estar encerrado por el contorno C y un t ermino 2ia1 aparecer a sobre el lado derecho de la ecuaci on (6.10). El resultado neto del desv o ya sea para el horario o antihorario es que un polo simple sobre el contorno es contabilizado como un medio de lo que podr a ser si estuviera dentro del contorno. Esto corresponde a tomar el valor principal de Cauchy.

x0
Figura 6.3: Bypass de puntos singulares. Por ejemplo, supongamos que f (z ) con un polo simple en z = x0 es integrado sobre el eje entero real. El contorno est a encerrado con un semic rculo innito en la mitad del plano superior (6.4). Entonces
x0

f (z ) dz =

f (x) dx +
Cx0

f (z ) dz +
x0 +

f (x) dx +
C semic rculo innito

(6.11)

= 2i

residuos encerrado .

6.2. CALCULO DEL RESIDUO.

201

Si el semic rculo peque no Cx0 incluye x0 (moviendose a lo largo del eje x, en sentido antihorario), x0 est a encerrado, y su contribuci on aparece dos veces como ia1 en Cx y como 2ia1 0 en el t ermino 2i residuo encerrado para una contribuci on neta de ia1 . Si el semic rculo peque no superior es elegido, x0 es exclu do. La u nica contribuci on es de la integraci on sobre Cx0 en el sentido antihorario la cual tiende a ia1 . Moviendo esto al extremo derecho de la ecuaci on (6.11), tenemos +ia1 , como antes.

x0

Figura 6.4: Cerrando el contorno con un semic rculo de radio innito.

Las integrales a lo largo del eje x pueden ser combinadas y al radio del semic rculo lo hacemos tender a cero. Por lo tanto denimos
x0 0

lim

f (x) dx +
x0 +

f (x) dx

=P

f (x) dx .

(6.12)

La P indica el valor principal de Cauchy y representa el proceso l mite precedente. Note cuidadosamente que el valor principal de Cauchy es un proceso de cancelaci on o de balance. En la vecindad de nuestra singularidad en z = x0 , f (x) a 1 . x x0 (6.13)

Esto es impar, respecto a x0 . El intervalo sim etrico o par (respecto a x0 ) da la cancelaci on del area achurada, gura 6.5. La contribuci on de la singularidad est a en la integraci on alrededor del semic rculo. Algunas veces, esta misma t ecnica l mite es aplicada para los l mites de integraci on . Podemos denir
a

P f (x) dx = alim

f (x) dx .
a

(6.14)

Un tratamiento alternativo mueve el polo fuera del contorno y luego considera el comportamiento l mite cuando es tra do de vuelta.

202

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

a1 f(x) ~ xx 0 x0 x0 x + 0 x

Figura 6.5: Valor principal de Cauchy.

6.2.3

Expansi on en polos de funciones merom orcas.

Las funciones anal ticas f (z ) que tienen solamente polos bien separados como singularidades son llamadas merom orcas. Por simplicidad suponemos esos polos en z = an nito con 0 < |a1 | < |a2 | < son todos simples con residuos bn . Entonces una expansi on de f (z ) en t erminos de bn (z an )1 depende solamente de las propiedades intrinsecas de f (z ), en contraste a la expansi on de Taylor cerca de un punto anal tico arbitrario z0 de f (z ) o de la expansi on de Laurent cerca de alg un punto singular de f (z ). Consideremos una serie de c rculos concentricos Cn alrededor del origen tal que Cn incluya a1 , a2 , , an pero no otros polos, su radio Rn cuando n . Para garantizar la convergencia suponemos que |f (z )| < Rn para cualquier constante positiva peque na y todo z sobre Cn . Entonces la serie

f (z ) = f (0) +
n=1

bn

1 1 + z an an

(6.15)

converge a f (z ). Para probar este teorema (debido a Mittag-Leer) usamos el teorema del residuo para evaluar la integral de contorno para z dentro de Cn : In = 1 2i
n

Cn

f (w) dw w(w z )

bm f (z ) f (0) = + . a (a z ) z m=1 m m En Cn tenemos para n | In | 2Rn max | f (w) | Rn < . 2Rn (Rn |z |) Rn |z |

(6.16)

wsobreCn

Usando In 0 en la ecuaci on (6.16) probamos la ecuaci on (6.15).

6.2. CALCULO DEL RESIDUO.


p+1 Si |f (z )| < Rn , entonces evaluamos la integral de forma similar

203

In =

1 2i

wp+1 (w

f (w) dw 0 z)

cuando n ,

y obtenemos la expansi on en polo an aloga f (z ) = f (0) + zf (0) + +


+1 z p f (p) (0) bn z p+1 /aP n + . p! z a n n=1

(6.17)

6.2.4

Expansi on en producto de funciones enteras.

Una funci on f (z ) que es anal tica para todo z nito es llamada una funci on entera. La derivada logar tmica f /f es una funci on merom orca con una expansi on en polos. Si f (z ) tiene un cero simple en z = an , entonces f (z ) = (z an )g (z ) con g (z ) anal tica y g (an ) = 0. de modo que la derivada logar tmica f (z ) 1 g (z ) = + , f (z ) z an g (z ) (6.18)

tiene un polo simple en z = an con residuo 1, y g /g es anal tica all . Si f /f satisface las condiciones que conducen a la expansi on en polos de la ecuaci on (6.15), entonces f (0) 1 1 f (z ) = + + f (z ) f (0) n=1 an z an se mantiene. Integrando la ecuaci on anterior obtenemos
z 0

(6.19)

f (z ) dz = ln f (z ) ln f (0) f (z ) zf (0) z = + ln(z an ) ln(an ) + f (0) an n=1

y expandiendo obtenemos el expansi on en producto zf (0) z f (z ) = f (0) exp 1 f (0) n=1 an Ejemplos son las expansiones en productos

exp

z an

(6.20)

sen(z ) = z
n=

z z2 1 ez/n = z 1 2 2 n n n=1 .

, (6.21)

cos(z ) =
n=1

z2 1 (n 1/2)2 2

Otro ejemplo es la expansi on en producto de la funci on gamma la cual ser a discutida m as adelante.

204

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

Como una consecuencia de la ecuaci on (6.18) la integral de contorno de la derivada logar tmica puede ser usado para contar el n umero Nf de ceros (incluyendo sus multiplicidades) de la funci on f (z ) del contorno C : 1 2i Por otra parte, usando f (z ) dz = ln f (z ) = ln | f (z ) | + i arg[f (z )] , f (z ) (6.23) f (z ) dz = Nf . f (z ) (6.22)

vemos que la parte real en la ecuaci on (6.23) no cambia cuando z se mueve una vez al rededor del contorno, mientras el correspondiente cambio en arg[f ] debe ser C arg[f ] = 2Nf . (6.24)

Esto conduce al teorema de Rouch e: Si f (z ) y g (z ) son anal ticas dentro y sobre un contorno encerrado C , y |g (z )| < |f (z )| sobre C , entonces f (z ) y f (z ) + g (z ) tienen el mismo n umero de ceros dentro de C . Para mostrar esto usamos g 2Nf +g = C arg[f + g ] = c arg[f ] + c arg 1 + . f ya que |g | < |f | en C , el punto w = 1 + g (z )/f (z ) es siempre un punto interior del c rculo en el plano w con centro en 1 y radio 1. De modo que arg[1 + g/f ] deber a volver a su valor original cuando z se mueve al rededor de C ; no puede disminuir o aumentar por un m ultiplo de 2 tal que c arg[1 + g/f ] = 0. El teorema de Rouch e puede ser usado como una prueba alternativa del teorema funn m damental el algebra: Un polinomio con an = 0 tiene n ceros. Denamos m=0 am z n f (z ) = an z . Entonces f tiene un cero de orden n en el origen y no otros ceros. Sea 1 g (z ) = n am z m . Apliquemos el teorema de Rouch e a un c rculo C con centro en el origen 0 y radio R > 1. En C , |f (z )| = |an |Rn y
n1

| g (z ) | | a0 | + | a1 | R + + | an1 | R Por lo tanto |g (z )| < |f (z )| para z en C dado R C sucientemente grande, por lo tanto, f + g = acuerdo al teorema de Rouch e.

n1

m=0

| am | Rn1 .

1 > ( n |am |)/|an |. Para todo c rculo 0 n m tiene n ceros dentro de C de m=0 am z

6.2.5

Evaluaci on de integrales denidas.

Las integrales denidas aparecen repetidamente en problemas de f sica matem atica tanto como en matem atica pura. Tres t ecnicas moderadamente generales son u tiles para evaluar estas integrales denidas: (1) integrales de contorno, (2) conversi on a funciones beta o gamma y (3) cuadratura num erica. Otros acercamientos incluyen expansi on en serie con integraci on t ermino a t ermino y transformadas integrales. Como veremos, el m etodo de integraci on de contorno es quiz as el m as versatil de esos m etodos, ya que es aplicable a una amplia variedad de integrales.

6.2. CALCULO DEL RESIDUO.

205
2 0

6.2.6

Evaluaci on de integrales denidas:

f (sen , cos )d

El c alculo del residuo es u til evaluando una amplia variedad de integrales nitas tanto en problemas de la f sica como en matem atica pura. Consideremos, primero, integrales de la forma
2

I=
0

f (sen , cos ) d ,

(6.25)

donde f es nita para todos los valores de . Tambi en requerimos que f sea una funci on racional de sen y cos que ser a univaluada. Sea z = ei , De esto, dz z z 1 , sen() = , z 2i Nuestra integral se convierte en d = i I = i f cos() = z + z 1 . 2 (6.26) dz = iei d .

z z 1 z + z 1 , 2i 2

dz , z

(6.27)

con el camino de integraci on sobre un c rculo unitario. Por el teorema del residuo la ecuaci on (6.20), I = (i)2i residuo dentro del c rculo unitario. (6.28)

Note que estamos despu es del residuo de f (z )/z . Ejemplo Nuestro problema es evaluar la integral denida
2

I=
0

d , 1 + cos

|| < 1 .

Por la ecuaci on (6.27) esta se convierte en dz 1 c rculo unitario z [1 + (/2)(z + z )] 2 dz . = i 2 z + (2/)z + 1 El denominador tiene raices 1 1 1 1 z = 1 2 y z+ = + 1 2 z+ est a dentro del c rculo unitario; z est a afuera. Luego por la ecuaci on (6.28) I = i I = i Obtenemos
2 0

2 1 2i z + 1/ + (1/) 1 2 d 2 = , 1 + cos() 1 2

z =1/+(1/) 12

|| < 1 .

206

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

6.2.7

Evaluaciones de integrales denidas:

f (x)dx.

Supongamos que nuestra integral denida tiene la forma I=

f (x) dx ,

(6.29)

y satisface las dos condiciones: a. f (z ) es anal tica en el semiplano superior excepto para un n umero nito de polos. (Supunemos que aqu no hay polos en el eje real. Si se presentan polos en el eje real, ellos podr an ser inclu dos o exclu dos como se discuti o anteriormente). b. f (z ) se anula tan fuertemente3 como 1/z 2 para |z | , 0 arg[z ] .

x R R R
Figura 6.6: Contorno de integraci on.

Con estas condiciones, podemos tomar como un contorno de integraci on el eje real y un semic rculo en el plano medio superior como muestra la gura 6.6. Tomemos el radio R del semic rculo innitamente grande. Entonces
R

f (z ) dz = lim = 2i

f (x) dx + lim
R

8
f (Rei )iRei d
0

(6.30)

residuos (en el semiplano superior).

De la segunda condici on la segunda integral (sobre el semic rculo) se anula y

f (x) dx = 2i

residuos (en el semiplano superior).

(6.31)

Podr amos usar que f (z ) se anula m as r apido que 1/z , pero queremos tener f (z ) monovaluada.

6.2. CALCULO DEL RESIDUO. Ejemplo Eval ue

207

I=

dx . 1 + x2

(6.32)

A partir de la ecuaci on (6.31)


dx = 2i 1 + x2

residuos (en el semiplano superior).

Aqu y en cada problema similar tenemos una pregunta: d onde est an los polos? Reescribiendo el integrando como 1 1 1 = , 2 1+z z+i zi (6.33)

vemos que hay polos simples (orden 1) en z = i y z = i. Un polo simple en z = z0 indica (y est a indicado por) una expansi on de Laurent de la forma a1 + a0 + an (z z0 )n . f (z ) = z z0 n=1 El residuo a1 es f acilmente aislado como a1 = (z z0 )f (z )|z=z0 . (6.35)

(6.34)

Usando la ecuaci on (6.35), encontramos que el residuo en z = i es 1/(2i), mientras que en z = i es 1/(2i). Entonces

dx 1 = 2i = . 2 1+x 2i

(6.36)

Aqu hemos usado a1 = 1/(2i) para el residuo del u nico polo incluido en z = i. Es f acil probar que es posible usar el semic rculo inferior y que esta opci on conducir a al mismo resultado, I = .

6.2.8

Evaluaci on de integrales denidas:

iax f (x)e dx.

Consideremos la integral denida I=

f (x)eiax dx ,

(6.37)

con a real y positivo. Esto es una transformada de Fourier. Suponemos las dos condiciones: a. f (z ) es anal tica en el semiplano superior excepto para un n umero nito de polos.

208 b.

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

| z |

lim f (z ) = 0 ,

0 arg[z ] .

(6.38)

Note que esta es una condici on menos restrictiva que la segunda condici on impuesta sobre f (z ) para la integral previa f (x)dx. Empleamos el contorno mostrado en la gura 6.6. La aplicaci on del c alculo del residuo es la misma cuando s olo se considera uno, pero aqu tenemos que trabajar un poco m as duro para mostrar que la integral sobre el semic rculo (innito) va a cero. Esta integral se convierte en

IR =
0

f (Rei )eiaR cos aR sen iRei d .

(6.39)

Sea R tan grande que |f (z )| = |f (Rei )| < . Entonces

| IR | R
0

eaR sen d
/2

(6.40) e
aR sen

= 2R
0

d .

En el rango [0, /2] 2 sen . Por lo tanto (gura 6.7)


/2

| IR | 2R
0

eaR2/ d .

(6.41)

Ahora, integrando por inspecci on, obtenemos

y (a) 1

(b) 2

Figura 6.7: (a) y = (2/ ), (b) y = sen .

6.2. CALCULO DEL RESIDUO. | IR | 2R Finalmente,


| IR |

209 1 eaR . aR2/

lim

. a

(6.42)

De la ecuaci on (6.38), 0 cuando R y


R

lim | IR | = 0 .

(6.43)

Este u til resultado es a veces llamado lema de Jordan. Con esto, hemos preparado para atacar las integrales de Fourier de la forma mostrada en la ecuaci on (6.37). Usando el contorno mostrado en la gura 6.6, tenemos

f (x)eiax dx + lim IR = 2i
R

residuos (en el semiplano superior).

Ya que la intengral sobre el semic rculo superior IR se anula cuando R (lema de Jordan),

f (x)eiax dx = 2i

residuos (en el semiplano superior) (a > 0) .

(6.44)

Ejemplo Singularidad sobre el contorno de integraci on. El problema es evaluar

I=
0

sen(x) dx . x

(6.45)

esto puede ser tomado como la parte imaginaria de4 Iz = P eiz dz. z (6.46)

Ahora el u nico polo es un polo simple en z = 0 y el residuo dado por la ecuaci on (6.35) es a1 = 1. Escogemos el contorno dado por la gura 6.8 (1) para evitar el polo, (2) para incluir el eje real y (3) para procurar que tienda a cero el integrando para z = iy con y . Note que en este caso un semic rculo grande (innito) en el semiplano inferior ser a desastroso. Tenemos eiz dz = z
Uno puede usar dos exponenciales.
4

r R

eix

dx + x

C1

eiz dz + z

eix
r

dx + x

C2

eiz dz =0, z

(6.47)

[(eiz eiz )/2iz ]dz , pero entonces dos diferentes contornos ser an necesarios para las

210

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

C1

C2
r

Figura 6.8: Contorno de integraci on.

el cero nal viene del teorema del residuo (ecuaci on (6.20)). Por el lema de Jordan eiz dz =0, z
ix eiz dz e dx +P =0. z x

(6.48)

C2

y eiz dz = z (6.49)

C1

La integral sobre el peque no semic rculo produce ()i veces el residuo de 1, el signo menos es el resultado de ir en sentido horario. Tomando la parte imaginaria, tenemos

sen(x) dx = , x sen(x) dx = . x 2

(6.50)

o
0

(6.51)

El contorno de la gura 6.8, aunque conveniente, no es u nico. Encuentre alternativas de contorno para evaluar la ecuaci on (6.45) como ejercicio. Ejemplo Scattering en mec anica cu antica. El an alisis mec anico cu antico del scattering conduce a la funci on

I ( ) =

x sen(x) dx , x2 2

(6.52)

donde es real y positivo. A partir de las condiciones f sicas del problema hay un requei rimiento posterior: I ( ) est a para tener la forma e tal que representar a una onda saliente (outgoing scattered). Usando sen(z ) = 1 1 1 senh(iz ) = eiz eiz , i 2i 2i (6.53)

6.2. CALCULO DEL RESIDUO. escribimos la ecuaci on (6.52) en el plano complejo como I ( ) = I1 + I2 , con zeiz dz , 2 2 z 1 zeiz I2 = dz . 2i z 2 2 I1 = 1 2i

211

(6.54)

(6.55)

La integral I1 es similar al ejemplo anterior y, como en este caso, podr amos completar el contorno por un semic rculo innito en el semiplano superior como muestra la gura 6.9a. Para I2 la exponencial es negativa y completamos el contorno con un semic rculo innito en el semiplano inferior, como muestra la gura 6.9b. Como en el ejemplo anterior, el semic rculo no contribuye a la integral, lema de Jordan.

y I1 a a x

a a I2

Figura 6.9: Contorno de integraci on.

Todav a est a el problema de localizar los polos y evaluar los residuos. Encontramos polos en z = + y z = sobre el contorno de integraci on. Los residuos son z= ei 2 i e 2 z = ei 2 ei 2

I1 I2

Rodeando los polos, como se muestra en la gura 6.9 (esto se complica un poco si vamos de arriba a bajo), encontramos que el teorema del residuo conduce a P I1 i 1 2i ei + i 2 1 2i ei = 2i 2 1 2i ei , 2 (6.56)

212

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

por tener encerrada la singularidad en z = pero excluida en z = . En un aspecto similar, pero notando que el contorno para I2 es en sentido horario, P I2 i 1 2i ei + i 2 1 2i ei = 2i 2 1 2i ei , 2 (6.57)

Sumando las ecuaciones (6.56) y (6.57), tenemos P I ( ) = P I1 + P I2 = i e + ei = cosh i 2 = cos .

(6.58)

Esta es una buena evaluaci on de la ecuaci on (6.52), pero desafortunadamente la dependencia del coseno es apropiada para una onda estacionaria y no para una onda saliente como se especic o. Para obtener la forma deseada, tratamos una t ecnica diferente. En vez de rodear los puntos singulares, los movemos fuera del eje real. especicamente, sea + i , i , donde es positivo pero peque no y eventualmente tender a a cero, esto es, I+ ( ) = lim I ( + i ) .
0

(6.59)

Con esta sustituci on simple, la primera integral I1 se convertir a I1 ( + i ) = 2i 1 2i ei(+i ) , 2 (6.60)

por directa aplicaci on del teorema del residuo. Tambi en, I2 ( + i ) = 2i 1 2i ei(+i ) . 2 (6.61)

Sumando las ecuaciones (6.60) y (6.61) y haciendo luego 0, obtenemos I+ = lim [I1 ( + i ) + I2 ( + i )]
0 0

= lim ei(+i ) = ei . un resultado que ajustan las condiciones de borde de nuestro problema de scattering. Es interesante notar que la sustituci on i tendr a que conducir a I ( ) = ei ,

(6.62)

(6.63)

la cual representar a una onda entrante. Nuestros resultados anteriores (ecuaci on (6.58)) es visto como el promedio aritm etico de las ecuaciones (6.62) y (6.63). Este promedio es el valor principal de Cauchy de la integral. Note que tenemos esas posibilidades (ecuaciones (6.58), (6.62) y (6.63)) por que nuestra integral no es u nicamente denida hasta que especiquemos el proceso l mite particular (o promedio) a ser usado.

6.2. CALCULO DEL RESIDUO.

213

6.2.9

Evaluaci on de integrales denidas: formas exponenciales.

Con funciones exponenciales o hiperb olicas presentes en el integrando, la vida es m as complicada que antes. En vez de una prescripci on general completa, el contorno debe ser escogido para ajustar la integral espec ca. Estos casos son oportunidades para ilustrar la versatilidad y poder de la integraci on de contorno. Como un ejemplo, consideremos una integral que ser a muy u til en el desarrollo de una relaci on entre z ! y (z )!. Note c omo la periodicidad a lo largo del eje imaginario es aprovechada.

R+ 2 i R

R+ 2 i R x

Figura 6.10: Contorno de integraci on.

Ejemplo Funci on factorial. Deseamos evaluar

I=

eax dx , 1 + ex

0<a<1.

(6.64)

Los l mites sobre a son necesarios (y sucientes) para prevenir la divergencia de la integral cuando x . Esta integral (ecuaci on (6.64)) puede ser manejada reemplazando la variable real x por la variable compleja z e integrando alrededor del contorno mostrado en la gura 6.10. Si tomamos el l mite cuando R , el eje real, por supuesto, tiende a la integral que deseamos. El camino de vuelta a lo largo de y = 2 es escogido para dejar el denominador de la integral invariante, al mismo tiempo introducir un factor constante ei2a en el numerador. Tenemos, en el plano complejo, eaz dz = lim R 1 + ez = 1e
R R i2a

eax dx ei2a 1 + ex eax dx . x 1 + e

R R

eax dx 1 + ex

(6.65)

En suma hay dos secciones verticales (0 y 2 ), la cual se anula (exponencialmente) cuando R . Ahora d onde est an los polos y c uales son los residuos? Tenemos un polo cuando ez = ex eiy = 1 . (6.66)

214

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

La ecuaci on (6.66) es satisfecha cuando z = 0 + i . Por una expansi on de Laurent5 en potencias de (z i ) el polo es un polo simple con un residuo de eia . Luego, aplicando el teorema del residuo, 1 e+i2a Esto r apidamente se reduce a

eax dx = 2i(eia ) . 1 + ex

(6.67)

a eax dx = , x 1+e sen a

0<a<1.

(6.68)

Usando la funci on beta, podemos mostrar que la integral es igual al producto (a 1)!(a)!. Esto resulta en la interesante y u til relaci on de la funci on factorial a!(a)! = a . sen a (6.69)

Aunque la ecuaci on (6.68) se mantiene para a real, 0 < a < 1, la ecuaci on (6.69) puede ser extendida por una continuaci on anal tica de todos los valores de a, reales y complejos, excluyendo solamente los valores reales enteros. Como un ejemplo nal de integrales de contorno de funciones exponenciales, consideremos nuevamente los n umeros de Bernoulli Ejemplo N umeros de Bernoulli. En la secci on 5.9 los n umeros de Bernoulli fueron denidos por la expansi on x = x e 1

n=0

Bn n x . n!

(6.70)

Reemplazando x por z (continuaci on anal tica), tenemos una serie de Taylor (compare con la ecuaci on (5.52)) con Bn = n! 2i z dz , ez 1 z n+1 (6.71)

C0

donde el contorno C0 est a rodeando el origen en sentido antihorario con |z | < 2 para dar los polos en 2i. Para n = 0 tenemos un polo simple en z = 0 con un residuo de +1. De modo que por la ecuaci on (6.20) B0 = 0! 2i(1) = 1 . 2i (6.72)

Para n = 1 la singularidad en z = 0 llega a ser un polo de segundo orden. El residuo puede mostrarse que es 1/2 por la expansi on en serie de la exponencial, seguida por la expansi on binomial. Esto resulta en B1 = 1! 1 2i 2i 2 = 1 . 2 (6.73)

6.2. CALCULO DEL RESIDUO.

215

y
8i 6i 4i 2i

C R
x

2i 4i 6i 8i

Figura 6.11: Contorno de integraci on para los n umeros de Bernoulli.

Para n 2 este procedimiento llega a ser algo tedioso, y recurrimos a diferentes maneras de evaluar la ecuaci on (6.71). El contorno est a deformado, como lo muestra la gura 6.11. El nuevo contorno C todav a encierra el origen, como se requiri o, pero ahora tambi en encierra (en una direcci on negativa) series innitas de puntos singulares a lo largo del eje imaginario en z = p2i, con p = 1, 2, 3, . . . . La integraci on de ida y vuelta a lo largo del eje x se cancelan, y para R la integraci on sobre el c rculo innito tiende a cero. Recuerde que n 2. Por lo tanto z dz = 2i residuos z e 1 z n+1 p=1

(z = p2i) .

(6.74)

C0

En z = p2i tenemos un polo simple con un residuo (p2i)n . Cuando n es impar, el residuo en z = p2i se cancela exactamente con el de z = p2i y por lo tanto Bn = 0, con n = 3, 5, 7, etc. Para n par los residuos se suman, dando n! 1 Bn = (2i)2 n 2i p (2i)n p=1 (1)n/2 2n! = (2 )n =

p n
p=1

(6.75)

(1)n/2 2n! (n) (n par,) (2 )n

donde (n) es la funci on zeta de Riemann.


5

1 + ez = 1 + ezi e+i = 1 ezi = (z i ) 1 +

z i 2!

(z i )2 3!

+ .

216

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

6.2.10

Residuos de un polo de orden m.

Si f (z ) tiene un polo de orden m en z = z0 , donde m es un n umero entero positivo, entonces el residuo R de f (z ) en z = z0 es R= 1 dm1 lim m1 [(z z0 )m f (z )] , (m 1)! zz0 dz (6.76)

donde la derivada de orden cero de la funci on se entiende la funci on misma y 0! = 1.

6.3

Relaciones de dispersi on.

El concepto de relaci on de dispersi on lo introduce en f sica los trabajos de Kroing y Kramers en optica. El nombre de dispersi on viene de la dispersi on optica, un resultado de la dependencia del ndice de refracci on con la longitud de onda o frecuencia angular. El ndice de refracci on n puede tener una parte real determinada por la velocidad de fase y una (negativa) parte imaginaria determinada por la absorci on, ver ecuaci on (6.91). Kroing y Kramers mostraron en 1926-1927 que la parte real de (n2 1) podr a ser expresada como una integral de la parte imaginaria. Generalizando esto, aplicaremos la etiqueta de relaciones de dispersi on a cualquier par de ecuaciones que dan la parte real de una funci on como una integral de su parte imaginaria y la parte imaginaria como una integral de su parte real ecuaciones (6.82) y (6.83). La existencia de tales relaciones integrales puede entenderse como un an alogo integral a las relaciones diferenciales de Cauchy-Riemann, secci on 5.2. Las aplicaciones en f sica moderna son extensas. Por ejemplo, la parte real de la funci on podr a describir el scattering hacia adelante de un rayo gamma en un campo nuclear de Coulomb. Luego la parte imaginaria describir a la producci on del par electr on-positr on en este mismo campo de Coulomb. Como ser a visto m as adelante, las relaciones de dispersi on pueden ser tomados como una consecuencia de la causalidad y por lo tanto son independientes de los detalles de la interacci on particular. Consideremos una funci on compleja f (z ) que es anal tica en el semiplano superior y sobre el eje real. Tambi en requerimos que
| z |

lim | f (z ) | = 0 ,

0 arg z ,

(6.77)

para que la integral sobre un semic rculo innito se anule. El punto de esta condici on es que podemos expresar f (z ) por la f ormula integral de Cauchy, ecuaci on (5.48), f (z0 ) = 1 2i 1 2i f (z ) dz . z z0 f (x) dx . x z0 (6.78)

La integral sobre el semic rculo superior6 se anula y tenemos f (z0 ) = (6.79)

La integral sobre el contorno mostrado en la gura 6.12 se ha convertido en una integral a lo largo del eje x.
El uso de un semic rculo para cerrar el contorno de integraci on es conveniente, pero no obligatorio. Otros caminos son posibles.
6

6.3. RELACIONES DE DISPERSION.

217

x R R 8 8

Figura 6.12: Contorno de integraci on.

La ecuaci on (6.79) supone que z0 est a en el semiplano superior interior al contorno cerrado. Si z0 estuviera en el semiplano inferior, la integral producir a cero por el teorema integral de Cauchy. Ahora, ya sea dejando que z0 se aproxime al eje real desde arriba (z0 x0 ), o coloc andolo sobre el eje real y tomando un promedio de la ecuaci on (6.79) y cero, encontramos que la ecuaci on (6.79) se convierte en f (x0 ) = 1 f (x) P dx , i x x0 (6.80)

donde P indica el valor principal de Cauchy. Separando la ecuaci on (6.80) en partes real e imaginaria7 produce f (x0 ) = u(x0 ) + iv (x0 ) 1 v (x) i u(x) dx P dx . = P x x0 x x0 Finalmente, igualando las partes reales y las partes imaginarias obtenemos 1 v (x) u(x0 ) = P dx , x x0 1 u(x) dx . v (x0 ) = P x x0 (6.82) (6.81)

(6.83)

Estas son las relaciones de dispersi on. La parte real de nuestra funci on compleja es expresada como una integral sobre la parte imaginaria. La parte imaginaria est a expresada como una integral sobre la parte real. Las partes reales e imaginarias son transformaciones de Hilbert una de la otra. Note que estas relaciones son signicativas solamente cuando f (x) es una funci on compleja de la variable real x. Desde un punto de vista f sico u(x) y/o v (x) representan alguna medida f sica. Luego f (z ) = u(z ) + iv (z ) es una continuaci on anal tica sobre el semiplano superior, con el valor en el eje real sirviendo como una condici on de borde.
7

El segundo argumento, y = 0 es omitido. u(x0 , 0) u(x0 ).

218

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

6.3.1

Relaciones de Simetr a.

En ocasiones f (x) satisfacer a una relaci on de simetr a y la integral desde a + puede ser reemplazada por una integral solamente sobre valores positivos. Esto es de importancia f sica considerable ya que la variable x podr a representar una frecuencia y solamente frecuencias 0 son posibles en f sicas. Supongamos8 f (x) = f (x) . Entonces u(x) + iv (x) = u(x) iv (x) . (6.85) (6.84)

La parte real de f (x) es par y la parte imaginaria es impar. En problemas de scattering en mec anica cu antica estas relaciones (ecuaci on (6.85)) son llamadas condiciones de cruzamiento. Para sacar utilidad de estas condiciones, reescribimos la ecuaci on (6.82) como u(x0 ) = 1 v (x) 1 0 v (x) P dx + P dx . x x0 0 x x0 (6.86)

Haciendo x x en la primera integral al lado derecho de la ecuaci on (6.86) y sustituyendo v (x) = v (x) de la ecuaci on (6.85), obtenemos u(x0 ) = 1 1 1 P v (x) + 0 x + x0 x x0 2 xv (x) = P dx . 0 x2 x2 0 dx (6.87)

Similarmente, 2 x0 u(x) dx . v (x0 ) = P 0 x2 x2 0 Las originales relaciones de dispersi on optica de Kroing-Kramers eran de esta forma. (6.88)

6.3.2

Dispersi on o ptica.

La funci on exp[i(kx t)] describe una onda movi endose a lo largo del eje x en la direcci on positiva con velocidad v = /k , es la frecuencia angular, k el n umero de onda o vector de propagaci on, y n = ck/ el ndice de refracci on. A partir de las ecuaciones de Maxwell, la permitividad el ectrica , y la ley de Ohm con conductividad el vector de propagaci on k para un diel ectrico llega a ser k2 =
8

2 c2

1+i

(6.89)

Esto no es una feliz coincidencia. Esto asegura que la transformada de Fourier de f (x) ser a real.

6.3. RELACIONES DE DISPERSION.

219

(con , la permeabilidad magn etica tomada como uno). La presencia de la conductividad (la cual signica absorci on) da un aumento en la parte imaginaria. El vector de propagaci on k (y por lo tanto el ndice de refracci on n) se ha convertido en complejo. Inversamente, la parte imaginaria (positiva) implica absorci on. Para conductividades pobres (4/ 1) una expansi on binomial produce k= y ei(kxt) = ei(x
/ct) 2x/c

2 +i c c

una onda atenuada. Volviendo a la expresi on general para k 2 , encontramos que la ecuaci on (6.79) el ndiuce de refracci on se convierte en n2 = c2 k 2 4 =+i . 2 (6.90)

Tomamos n2 como una funci on de la variable compleja (con y dependiendo de ). Sin embargo, n2 no se anula cuando sino realmente se aproxima a la unidad. Tal de satisfacer la condici on, ecuaci on (6.77), uno trabaja con f ( ) = n2 ( ) 1. Las relaciones originales de dispersi on optica de Kroing-Kramers estaban en la forma de 2 [n2 ( ) 1] [n (0 ) 1] = P d 2 0 2 0 2 0 [n2 ( ) 1] d . [n2 (0 ) 1] = P 2 0 2 0
2

(6.91)

El conocimiento de los coecientes de absorci on en todas las frecuencias especica la parte real del ndice de refracci on y vice versa.

6.3.3

La relaci on de Parseval.

Cuando las funciones u(x) y v (x) son transformadas de Hilbert una de la otra y cada una es cuadrado integrable9 , las dos funciones est an relacionadas por

| u(x) |2 dx =

| v (x) |2 dx .

(6.92)

Esta es la relaci on de Parseval. Para derivar la ecuaci on (6.92), comenzamos con



9

| u(x) |2 dx =
| u(x) | dx y
2

1
2

v (s) ds 1 sx

v (t) dt dx tx

Esto signica que

| v (x) | dx son nitas.

220

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

usando la ecuaci on (6.82) dos veces. Integrando primero con respecto a x, tenemos

| u(x) |2 dx =

1 2

dx v (s) ds v (t) dt . (s x)(t x)

(6.93)

Parte de la integraci on en x produce una funci on delta: 1 2 Tenemos


dx = (s t) . (s x)(t x)

| u(x) |2 dx =

v (s) (s t) ds v (t) dt .

(6.94)

Luego la integraci on en s es llevada a cabo por inspecci on, usando la propiedad que dene la funci on delta.

v (s) (s t) ds = v (t) .

(6.95)

Sustituyendo la ecuaci on (6.95) en la (6.94), tenemos la ecuaci on (6.92), la relaci on de Parseval.

6.3.4

Causalidad.

El signicado real de las relaciones de dispersi on en f sica es que ellas son una consecuencia directa de suponer que un sistema f sico en particular obedece causalidad. Causalidad es dif cil para denir precisamente pero el signicado general es que el efecto no puede preceder la causa. Una onda scattered no puede ser emitida por el centro scattering antes de que la onda incidente haya llegado. Para sistemas lineales la relaci on m as general entre una funci on de entrada G (la causa) y la funci on de salida H (el efecto) puede ser escrita como

H (t) =

F (t t )G(t ) dt .

(6.96)

La causalidad es impuesta requiriendo que F (t t ) = 0 para t t < 0 .

La ecuaci on (6.96) da la dependencia temporal. La dependencia en la frecuencia es obtenida tomando las transformadas de Fourier. Por el teorema de convoluci on de Fourier, h( ) = f ( )g ( ) , donde f ( ) es la transformada de Fourier F (t), etc. Inversamente, F (t) es la transformada de Fourier de f ( ). La conecci on con las relaciones de dispersi on est an dadas por el teorema de Tichmarsh. Este establece que si f ( ) es cuadrado integrable sobre el eje real , entonces cualquiera de las tres armaciones implica las otras dos.

6.4. EL METODO DE STEEPEST DESCENTS. 1. La transformada de Fourier para f ( ) es cero para t < 0 ecuaci on (6.96).

221

2. Remplazando por z , la funci on f (z ) es anal tica en el plano complejo z para y > 0 y se aproxima a f (x) casi en cualquier lugar cuando y 0. Adem as,

| f (x + iy ) |2 dx < K

para y > 0 ,

esto es, la integral est a acotada. 3. Las partes reales e imaginarias de f (z ) son transformaciones de Hilbert la una de la otra: ecuaciones (6.82) y (6.83). La suposici on de esta relaci on entre la entrada y la salida de nuestro sistema lineal es casual (ecuaci on (6.96)) signica que la primera armaci on es satisfecha. Si f ( ) es cuadrado integrable, entonces el teroema de Tichmarsh tiene la tercera armaci on como una consecuencia y tenemos relaciones de dispersi on.

6.4

El m etodo de steepest descents.

Analizado problemas en f sica matem atica, a menudo uno encuentra deseable conocer el comportamiento de una funci on para valores grandes de la variable, esto es, el comportamiento asint otico de la funci on. Ejemplos espec cos son proporcionados por la funci on gamma y los varios tipos de funciones de Bessel. El m etodo de steepest descents es un m etodo para determinar tales comportamientos asint oticos cuando la funci on puede ser expresada como la integral de la forma general I (s) =
C

g (z )esf (z) dz .

(6.97)

Para el momento, tomemos s real. El contorno C de integraci on es entonces escogido tal que la parte real de f (z ) tienda a menos innito en ambos l mites y que el integrando se anular a en ambos l mites, o es escogido como un contorno cerrado. M as a un, supongamos que el factor g (z ) en el integrando es dominado por la exponencial en la regi on de inter es. Si el par ametro s es grande y positivo, el valor del integrando llegar a a ser grande cuando la parte real de f (z ) es grande y peque no cuando la parte real de f (z ) es peque na y negativa. En particular, cuando s se le permite aumentar indenidamente (dejando la dependencia asint otica), la contribuci on completa del integrando a la integral vendr a de la regi on en la cual la parte real de f (z ) tome un valor m aximo positivo. Fuera de este valor m aximo positivo el integrando llegar a a ser en comparaci on despreciablemente peque no. Esto se ve expresando f (z ) como f (z ) = u(x, y ) + iv (x, y ) . Entonces la integral puede ser reescrita como I (s) =
C

g (z )esu(x,y) eisv(x,y) dz .

(6.98)

222

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

Si ahora, adicionalmente, imponemos la condici on que la parte imaginaria del exponente, iv (x, y ), sea constante en la regi on en la cual la parte real toma su valor m aximo, esto es, v (x, y ) = v (x0 , y0 ) = v0 , podemos aproximar la integral por I (s) eisv0
C

g (z )esu(x,y) dz

(6.99)

Fuera del m aximo de la parte real, la parte imaginaria se le puede permitir oscilar como desee, por el integrando despreciablemente peque no y el factor de fase variante es por lo tanto irrelevante. La parte real de sf (z ) es un m aximo para un s dado cuando la parte real de f (z ), u(x, y ) es un m aximo. Esto implica que u u = =0, x y y por lo tanto, por el uso de las condiciones de Cauchy-Riemann df (z ) =0, dz (6.100)

procedemos a buscar tales ceros de la derivada. Es esencial notar que el valor m aximo de u(x, y ) es el m aximo s olo en un contorno dado. En el plano nito ni la parte real ni la parte imaginaria de nuestra funci on anal tica posee un m aximo absoluto. Esto puede ser visto recordando que ambas u y v satisfacen la ecuaci on de Laplace 2u 2u + =0. x2 y 2 (6.101)

A partir de esto, si la segunda derivada con respecto a x es positiva, la segunda derivada con respecto a y debe ser negativa, y por lo tanto ni u ni v pueden poseer un m aximo o m nimo absoluto. Ya que la funci on f (z ) fue tomada como anal tica, los puntos singulares claramente est an exclu dos. La anulaci on de la derivada, ecuaci on (6.100), implica que tenemos un punto de ensilladura, un valor estacionario, el cual puede ser un m aximo de u(x, y ) para un contorno y un m nimo para otro (gura 6.13). Nuestro problema, entonces, es escoger el contorno de integraci on para satisfacer dos condiciones. (1) El contorno debe ser escogido tal que u(x, y ) tenga un m aximo en el punto de ensilladura. (2) El contorno debe pasar a trav es del punto de ensilladura de tal manera que la parte imaginaria, v (x, y ) sea una constante. Esta segunda condici on conduce al camino de descenso m as abrupto steepest descent y da al m etodo su nombre. Del cap tulo anterior sabemos que las curvas correspondientes a u = constante y a v = constante forman un sistema ortogonal. Esto signica que una curva v = ci , constante, es tangencial en cualquier parte a la gradiente de u, u. Por lo tanto, la curva v = constante es la curva que da la l nea de 10 steepest descent desde el punto de ensilladura.
La l nea de steepest ascent est a tambi en caracterizada por v constante. El punto de ensilladura debe ser inspeccionado cuidadosamente para distinguir la l nea de steepest descent respecto a la linea de steepest ascent.
10

6.4. EL METODO DE STEEPEST DESCENTS.

223

Figura 6.13: Punto de ensilladura.

En el punto de ensilladura la funci on f (z ) puede ser expandida en serie de Taylor para dar 1 f (z ) = f (z0 ) + (z z0 )2 f (z0 ) + . 2 (6.102)

La primera derivada est a ausente, ya que obviamente la ecuaci on (6.100) es satisfecha. El 2 primer t ermino de correcci on, (z z0 ) f (z0 )/2, es real y negativo. Es real, porque hemos especicado que la parte imaginaria es constante a lo largo de nuestro contorno y negativo porque nos estamos moviendo hacia abajo del punto de ensilladura. Entonces, suponiendo que f (z0 ) = 0, tenemos 1 1 f (z ) f (z0 ) (z z0 )2 f (z0 ) = t2 , 2 2s la cual sirve para denir una nueva variable t. Si (z z0 ) es escrito en forma polar (z z0 ) = ei , (con la fase mantenida constante), tenemos t2 = sf (z0 ) 2 e2i . Ya que t es real11 , la ecuaci on puede ser escrita como t = | sf (z0 ) |
1/2

(6.103)

(6.104)

(6.105)

(6.106)

Sustituyendo la ecuaci on (6.103) en (6.97), obtenemos I (s) g (z0 )e


11

sf (z0 )

et

2 /2

dz dt . dt

(6.107)
[f (z ) f (z0 )] = 0,

La fase del contorno (especicada por ) en el punto de ensilladura es elegida tal que 1 (z z0 )2 f (z0 ) debe ser real. lo que implica que 2

224 Tenemos dz = dt

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

dt dz

dt d d dz

= | sf (z0 ) |

1/2 i

(6.108)

a partir de las ecuaciones (6.104) y (6.106). La ecuaci on (6.107) se transforma en I (s) g (z0 )esf (z0 ) ei | sf (z0 ) |
1/2

et

2 /2

dt .

(6.109)

Se notar a que los l mites han sido ajustados como menos innito a m as innito. Esto es permitido, porque el integrando es esencialmente cero cuando t se desv a apreciablemente del origen. Note que la integral remanente es una integral de error de Gauss igual a 2 , nalmente obtenemos 2g (z0 )esf (z0 ) ei I (s) . (6.110) | sf (z0 ) |1/2 La fase fue introducida en la ecuaci on (6.104) como la fase del contorno cuando pas o a trav es del punto de ensilladura. Esta es escogida tal que las dos condiciones dadas [=constante; [f (z )]=m aximo] son satisfechas. Ocurre algunas veces que el contorno pasa a trav es de dos o m as puntos de ensilladura en sucesi on. Si este es el caso, necesitamos solamente a nadir la contribuci on hecha por la ecuaci on (6.110) para cada uno de los puntos de ensilladura para obtener una aproximaci on a la integral total. Una nota de advertencia: Supusimos que la u nica contribuci on signicativa a la integral viene de la vencindad inmediata del o de los puntos de ensilladura z = z0 , esto es, [f (z )] = u(x, y ) u(x0 , y0 ) ,

sobre el contorno entero a partir de z0 = x0 + iy0 . Esta condici on debe ser chequeada para cada uno de los nuevos problemas.

C1
Lnea de corte

z=i x

C2

z=i

Figura 6.14: Contornos para las funciones de Hankel.

Ejemplo Forma asint otica de la funci on de Hankel, Hv (s)

(1)

6.4. EL METODO DE STEEPEST DESCENTS.

225

Las funciones de Hankel satisfacen las ecuaciones de Bessel y pueden ser denidas por
(1) Hv (s) =

1 i 1 i

0 C1

e(s/2)(z1/z)

dz , z +1 dz . z +1

(6.111)

(2) Hv (s) =

C2

e(s/2)(z1/z)

(6.112)

El contorno C1 es la curva en el semiplano superior de la gura 6.14. El contorno C2 est a en el semiplano inferior. Aplicamos el m etodo de steepest descent a la primera funci on de (1) Hankel, Hv (s), con f (z ) dado por f (z ) = Diferenciando, obtenemos f (z ) = 1 1 + 2 . 2 2z (6.114) 1 2 z 1 z . (6.113)

Fijando f (z ) = 0 de acuerdo con la ecuaci on (6.90), obtenemos z = i , i . (6.115)


(1)

De modo que hay puntos de ensilladura en z = +i y z = i. La integral para Hv (s) es escogida tal que comience en el origen, se mueva tangencialmente al eje real positivo, y luego se mueva a trav es del punto de ensilladura en z = +i y hacia afuera a menos innito, asint otica con el eje real negativo. Debemos escoger el contorno a trav es del punto z = +i en tal manera que la parte real de (z 1/z ) sea un m aximo y al fase sea constante en la vecindad del punto soporte. Tenemos z 1 z =0 para z = i.

Requerimos que (z 1/z ) < 0 para el resto de C1 (z = 1). En la vecindad del punto de ensilladura en z0 = +i tenemos z i = ei , donde es un n umero peque no. Entonces 2f (z ) = z 1 1 = ei + i i z e + i = cos + i( sen + 1) 1 cos + i( sen + 1) cos i( sen + 1) = cos + i( sen + 1) . 1 + 2 sen + 2 (6.117) (6.116)

226

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

Por lo tanto nuestra parte real llega a ser z 1 z = cos cos (1 + 2 sen + 2 )1 . (6.118)

Recordando que es peque no, expandimos por el teorema del binimio y despreciando ordenes en 3 y mayores. z 1 z = 2 2 cos sen + O( 3 ) 2 sen 2 . (6.119)

Vemos que la parte real de (z 1/z ) tomar a un valor extremo si sen 2 es un extremo, esto es, si 2 es /2 o 3/2. De modo que la fase del contorno debe escogerse como /4 o 3/4. Una elecci on representar a el camino de steepest descent que deseamos. La otra alternativa representar a el camino de steepest ascent que debemos evitar. Distinguimos las dos posibilidades sustituyendo los valores espac f cos de . Para = /4 z Para la elecci on z = i es un m nimo. Para = 3/4 z 1 z = 2 , (6.121) 1 z = 2 . (6.120)

y z = i es un m aximo. Esta es la fase que deseamos. La sustituci on directa en la ecuaci on (6.110) con = 3/4 ahora produce 1 2i 1 e(s/2)(i1/i) ei(3/4) (1) H (s) = i | (s/2)(2/i3 ) |1/2 = 2 (i/2)( 2) is i(3/4) e e e . s

(6.122)

Combinando t erminos, nalmente obtenemos


(1) H (s) =

2 i(s (/2)/4) e s
(1)

(6.123)

que conducen a la expansi on asint otica de la funci on de Hankel Hv (s). Los t erminos adicionales, si se desean, pueden ser obtenidos suponiendo una serie de potencias descendentes y sustituyendo de regreso en la ecuaci on de Bessel. Ejemplo Forma asint otica de la funci on factorial, s!. En muchos problemas f sicos, particularmente en el campo de la mec anica estad stica, es deseable tener una aproximaci on precisa de la funci on gamma o funci on factorial de n umeros muy grandes. Como desarrollaremos m as adelante, la funci on factorial puede ser denida por la integral

s! =
0

d = s

s+1

0C

es(ln zz) dz .

(6.124)

6.4. EL METODO DE STEEPEST DESCENTS.

227

Aqu hemos hecho una sustituci on = zs para que la integral este en la forma requerida por la ecuaci on (6.97). Como antes, suponemos que s es real y positiva, de la cual sigue que el integrando se anula en los l mites 0 y . Diferenciando con respecto a z el exponente, obtenemos df (z ) d 1 = (ln z z ) = 1 , dz dz z la cual muestra que el punto z = 1 es un punto de ensilladura. Sea z 1 = ei , (6.126) (6.125)

con peque no para describir el contorno en la vecindad del punto de ensilladura. Sustituyendo en f (z ) = ln z z , desarrollamos una expansi on en serie f (z ) = ln(1 + ei ) (1 + ei ) 1 = ei 2 e2i + 1 ei 2 1 2 2i = 1 e + . 2

(6.127)

De esto vemos que el integrando toma un valor m aximo (es ) en el punto de ensilladura si escogemos nuestro contorno C siguiendo el eje real, una conclusi on que se puede llegar m as o menos intuitivamente. Una sustituci on directa en la ecuaci on (6.110) con = 0 ahora da 2ss+1 es s! . (6.128) | s(1)2 |1/2 Por lo tanto el primer t ermino en la expansi on asint otica de la funci on factorial es s! 2sss es .

(6.129)

Este resultado es el primer t ermino en la expansi on de Stirling de la funci on factorial. El m etodo de steepest descent es probablemente la m as f acil manera de obtener este primer t ermino. Si se desean m as t erminos en la expansi on, entonces es preferible otro m etodo, el cual veremos en el pr oximo curso. En los ejemplos precedentes el c alculo fue llevado a cabo suponiendo s como real. Esta suposici on no es necesaria. Se puede mostrar que la ecuaci on (6.129) tambi en se mantiene cuando s es reemplazada por la variable compleja w, probando solamente que la parte real de w se requiere grande y positiva.

228

CAP ITULO 6. FUNCIONES DE VARIABLE COMPLEJA II.

Cap tulo 7 Ecuaciones diferenciales.


versi on nal 1.2-1707021

7.1

Ecuaciones diferenciales parciales, caracter sticas y condiciones de borde.

En F sica el conocimiento de la fuerza en una ecuaci on de movimiento usualmente conduce a una ecuaci on diferencial. Por lo tanto, casi todas las partes elementales y numerosas partes avanzadas de la F sica te orica est an formuladas en t erminos de ecuaciones diferenciales. Algunas veces son ecuaciones diferenciales ordinarias en una variable (ODE). M as a menudo las ecuaciones son ecuaciones diferenciales parciales (PDE) en dos o m as variables. Recordemos del c alculo la operaci on de tomar una derivada ordinaria o parcial es una operaci on lineal 2 (L) d d d(a(x) + b (x)) =a +b , dx dx dx para ODE que involucran derivadas en una variable x solamente y no cuadr aticas, (d/dx)2 , o potencias mayores. Similarmente, para derivadas parciales, (a(x, y ) + b (x, y )) (x, y ) (x, y ) =a +b , x x x En general L(a + b ) = aL() + bL( ) . As , las ODE y las PDE aparecen como ecuaciones de operadores lineales L( ) = F ,
Este cap tulo est a basado en el octavo cap tulo del libro: Mathematical Methods for Physicists, fourth edition de George B. Arfken & Hans J. Weber, editorial Academic Press. 2 Estamos especialmente interesados en operadores lineales porque en mec anica cu antica las cantidades f sicas est an representadas por operadores lineales operando en un espacio complejo de Hilbert de dimensi on innita.
1

(7.1)

229

230

CAP ITULO 7. ECUACIONES DIFERENCIALES.

donde F es una funci on conocida de una (para ODE) o m as variables (para PDE), L es una combinaci on lineal de derivadas, es una funci on o soluci on desconocida. Cualquier combinaci on lineal de soluciones es de nuevo una soluci on; esto es el principio de superposici on. Ya que la din amica de muchos sistemas f sicos involucran s olo dos derivadas, e.g., la aceleraci on en mec anica cl asica y el operador de energ a cin etica, 2 , en mec anica cu antica, las ecuaciones diferenciales de segundo orden ocurren m as frecuentemente en F sica. [Las ecuaciones de Maxwell y de Dirac son de primer orden pero involucran dos funciones desconocidas. Eliminando una inc ognita conducen a una ecuaci on diferencial de segundo orden por la otra.]

7.1.1

Ejemplos de PDE.

Entre las PDE m as frecuentemente encontradas tenemos: 1. La ecuaci on de Laplace, 2 = 0. Esta ecuaci on muy com un y muy importante aparece en el estudio de a. Fen omenos electromagn eticos incluyendo electroest aticos, diel ectricos, corrientes estacionarias y magnetoest atica. b. Hidrodin amica (ujo irrotacional de l quidos perfectos y supercies de ondas). c. Flujo de calor. d. Gravitaci on. 2. La ecuaci on de Poisson, 2 = 4 En contraste a la ecuaci on homogenea de Laplace, la ecuaci on de Poisson es no homogenea con un t ermino de fuente 4. 3. Las ecuaciones de onda (Helmholtz) y las ecuaciones de difusi on tiempo independiente, 2 2 k = 0. Estas ecuaciones aparecen en fen omenos tan diversos como a. Ondas el asticas en s olidos incluyendo cuerdas vibrantes, barras y membranas. b. En sonido o ac ustica. c. En ondas electromagn eticas. d. En reactores nucleares. 4. La ecuaci on de difusi on tiempo dependiente 2 = 1 , a2 t

y su correspondiente forma cuadridimensional que involucra el DAlembertiano, un an alogo cuadridimensional del Laplaciano en el espacio Minkowski, = 2 = 1 2 2 . 2 2 c t

5. Las ecuaciones de onda tiempo dependiente, 2 = 0.

7.1. ECUACIONES DIFERENCIALES PARCIALES

231

6. La ecuaci on del potencial escalar, 2 = 4. Como la ecuaci on de Poisson esta ecuaci on es no homog enea con un t ermino de fuente 4. 7. La ecuaci on de Klein-Gordon, 2 = 2 , y las correspondientes ecuaciones vectoriales en la cual la funci on escalar es reemplazada por una funci on vectorial. Otras formas complicadas son comunes. 8. La ecuaci on de onda de Schr odinger,
2

2m

2 + V = i

2m

2 + V = E ,

para el caso tiempo independiente. 9. Las ecuaciones para ondas el asticas y l quidos viscosos y la ecuaci on telegr aca. 10. Ecuaciones diferenciales parciales acopladas de Maxwell para los campos el ectricos y magn eticos son aquellas de Dirac para funciones de ondas relativista del electr on. Algunas t ecnicas generales para resolver PDE de segundo orden son discutidas en esta secci on: 1. Separaci on de variables, donde el PDE es separada en ODE que est an relacionadas por constantes comunes las cuales aparecen como autovalores de operadores lineales, L = l , usualmente en una variable. La ecuaci on de Helmholtz dada como ejemplo 3 anteriormente tiene esta forma, donde el autovalor k 2 puede surgir por la separaci on del tiempo t respecto de las variables espaciales. Como en el ejemplo 8, la energ a E es el autovalor que surge en la separaci on de t respecto de r en la ecuaci on de Schr odinger. 2. Conversi on de una PDE en una ecuaci on integral usando funciones de Green que se aplica a PDE no homogeneas tales como los ejemplos 2 y 6 dados m as arriba. 3. Otros m etodos anal ticos tales como el uso de transformadas integrales que ser an desarrolladas en el pr oximo curso. 4. C alculo num erico. El desarrollo de los computadores ha abierto una abundancia de posibilidades basadas en el c alculo de diferencias nitas. Aqu tambi en tenemos los m etodos de relajaci on. M etodos como Runge-Kutta y predictor-corrector son aplicados a ODEs. Ocasionalmente, encontramos ecuaciones de orden mayor. En ambos la teor a del movimiento suave de un l quido viscoso y la teor a de un cuerpo el astico encontramos la ecuaci on (2 )2 = 0 .

232

CAP ITULO 7. ECUACIONES DIFERENCIALES.

Afortunadamente, estas ecuaciones diferenciales de orden m as altos son relativamente raras y no son discutidas en una etapa introductoria como esta. Aunque no son tan frecuentemente encontrados y quiz as no son tan importantes como las ecuaciones diferenciales de segundo orden, las ecuaciones diferenciales de primer orden aparecen en F sica te orica y algunas veces son pasos intermedios para ecuaciones diferenciales de segundo orden. Las soluciones de algunos de los tipos m as importantes de ODE de primer orden son desarrollados en la secci on 7.2. Las PDEs de primer orden siempre pueden ser reducidas a ODEs. Este es un proceso directo pero lento e involucra una busqueda para las caracter sticas que son presentadas brevemente m as adelante.

7.1.2

Clases de PDE y caracter stica.

Las PDEs de segundo orden forman tres clases: (i) Las PDEs el pticas que involucran 2 o c2 2 /t2 + 2 ; (ii) Las PDEs parab olica, a/t 2 ; (iii) Las PDEs hiperb olica, c2 2 /t2 2 . Estos operadores can onicos aparecen por un cambio de variables = (x, y ), = (x, y ) en un operador lineal (para dos variables s olo por simplicidad) L=a 2 2 2 + 2 b + c +d +e +f , 2 2 x xy y x y (7.2)

la cual puede ser reducida a las formas can onicas (i), (ii), (iii) de acuerdo a si el discriminante D = ac b2 > 0, = 0 o < 0. Si (x, y ) es determinada a partir de la ecuaci on de primer orden, pero no lineal, PDE a x
2

+ 2b

+c

=0,

(7.3)

donde los t erminos de m as bajo orden en L son ignorados, entonces los coecientes de 2 / 2 en L es cero (i.e., ecuaci on (7.3)). Si es una soluci on independiente de la misma ecuaci on (7.3), entonces el coeciente de 2 / 2 tambi en es cero. El operador remanente 2 / en L es caracter stico del caso hiperb olico (iii) con D < 0, donde la forma cuadr atica a2 + 2b + c es factorizable y, por lo tanto, la ecuaci on (7.3) tiene dos soluciones independientes (x, y ), (x, y ). En el caso el ptico (i) con D > 0 las dos soluciones , son complejos conjugados los cuales, cuando se sustituyeron en la ecuaci on (7.2), remueven la derivada de segundo orden mezclada en vez de los otros t erminos de segundo orden produciendo la forma can onica (i). En el caso parab olico (ii) con D = 0, solamente 2 / 2 permanece en L, mientras que los coecientes de las otras dos derivadas de segundo orden se anulan. Si los coecientes a ,b, c en L son funciones de las coordenadas, entonces esta clasicaci on es solamente local, i.e., su tipo podr a cambiar cuando las coordenadas var an. Ilustremos la f sica impl cita en el caso hiperb olico mirando la ecuaci on de onda (en 1 + 1 dimensiones por simplicidad) 1 2 2 c2 t2 x2 Ya que la ecuaci on (7.3) se convierte en t
2 2

=0.

(7.4)

c t x

+c t x

=0,

(7.5)

7.1. ECUACIONES DIFERENCIALES PARCIALES

233

y es factorizable, determinamos la soluci on de /t c/x = 0. Esta es una funci on arbitraria = F (x + ct), y = G(x ct) resuelve /t + c/x = 0, la cual se verica r apidamente. Por superposici on lineal una soluci on general de la ecuaci on (7.4) es = F (x + ct) + G(x ct). Para funciones peri odicas F , G reconocemos los argumentos x + ct y x ct como la fase de la onda plana o frente de ondas, donde las soluciones de la ecuaci on de onda (7.4) cambia abruptamente (de cero a sus valores actuales) y no est an u nicamente determinadas. Normal al frente de onda est an los rayos de la optica geom etrica. De este modo, las soluciones de la ecuaci on (7.5) o (7.3) m as generalmente, son llamadas caracter sticas o algunas veces bicaracter sticas (para PDE de segundo orden) en la literatura matem atica corresponde a los frente de ondas de la soluci on de la optica geom etrica de la ecuaci on de onda completa. Para el caso el ptico consideremos la ecuaci on de Laplace 2 2 + 2 =0, x2 y para un potencial de dos variables. Aqu la ecuaci on caracter stica es x
2

(7.6)

+i x y

i x y

=0

(7.7)

tiene soluciones complejas conjugada: = F (x + iy ) para /x + i/y = 0 y = G(x iy ) para /x i/y = 0. Una soluci on general de la ecuaci on de potencial (7.6) es por lo tanto = F (x + iy ) + G(x iy ), tanto la parte real como la imaginaria de , las cuales son llamadas funciones arm onicas, mientras que las soluciones polinomiales son llamadas polinomios arm onicos. En mec anica cu antica la forma de Wentzel-Kramers-Brillouin (WKB) de = exp(iS/ ) para la soluci on de la ecuaci on de Schr oedinger
2

2m

2 + V

=i

, t

(7.8)

conduce a la ecuaci on Hamilton-Jacobi de la mec anica cl asica, 1 S (S )2 + V = , 2m t (7.9)

en el l mite 0. La acci on cl asica de S entonces llega a ser la caracter stica de la ecuaci on de Schr oedinger. Sustituyendo = i S/ , /t = iS/t/ en la ecuaci on (7.8), dejando la totalidad de los factores de no nulos, y aproximando 2 = i 2 S/ (S )2 / 2 (S )2 , i.e., despreciando i2 / , realmente obtenemos la ecuaci on (7.9). Encontrando las soluciones de PDE por resolver las caracter sticas es uno de varias t ecnicas generales. Para m as ejemplos y tratamientos detallados de las caracter sticas, las cuales no perseguimos aqu , nos referimos a H. Bateman, Partial Dierential Equations of Mathematical Physics. New York: Dover (1994); K.E. Gustafson, Partial Dierential Equations and Hilbert Space Methods, 2nd ed. New York: Wiley (1987).

234

CAP ITULO 7. ECUACIONES DIFERENCIALES.

7.1.3

Las PDE no lineales.

Las ODEs y PDEs no lineales son un campo importante y de r apido crecimiento. Encontramos m as arriba la ecuaci on de onda lineal m as simple +c =0, t x como la PDE de primer orden a partir de la caracter stica de la ecuaci on de onda. La ecuaci on de onda no lineal m as simple + c( ) =0, t x (7.10)

resulta si la velocidad local de propagaci on, c, no es constante sino que depende de la onda . Cuando una ecuaci on no lineal tiene una soluci on de la forma (x, t) = A cos(kx t) donde (k ) var a con k tal que (k ) = 0, entonces ella es llamada dispersiva. Quiz as la ecuaci on dispersiva no lineal m as conocida de segundo orden es la ecuaci on de Korteweg-de Vries 3 + + =0, t x x3 (7.11)

la cual modela la propagaci on sin p erdidas de las ondas de agua superciales y otros fen omenos. Esta es ampliamente conocida por sus soluciones solit on. Un solit on es una onda viajera con la propiedad de persistir a trav es de una interacci on con otro solit on: Despu es de que ellos pasan uno a trav es del otro, ellos emergen en la misma forma y con la misma velocidad y no adquieren m as que un cambio de fase. Sea ( = x ct) tal onda viajera. Cuando es sustituida en la ecuaci on (7.11) esta produce la ODE no lineal ( c) la cual puede ser integrada dando d2 2 = c . d 2 2 (7.13) d d3 + 3 =0, d d (7.12)

No hay constantes de integraci on aditivas en la ecuaci on (7.13) para asegurar que d2 /d 2 0 con 0 para grande, tal que est a localizado en la caracter stica = 0, o x = ct. Multiplicando la ecuaci on (7.13) por d/d e integrando nuevamente tenemos d d
2

= c 2

3 , 3

(7.14)

donde d/d 0 para grande. Tomando la ra z de la ecuaci on (7.14) e integrando una vez m as encontramos la soluci on solit onica (x ct) = cosh
2

3c x ct c 2

(7.15)

7.2. ECUACIONES DIFERENCIALES DE PRIMER ORDEN.

235

7.1.4

Condiciones de borde.

Usualmente, cuando conocemos un sistema f sico en alg un momento y la ley que rigen ese proceso f sico, entonces somos capaces de predecir el desarrollo subsecuente. Tales valores iniciales son las m as comunes condiciones de borde asociadas con ODEs y PDEs. Encontrando soluciones que calcen con los puntos, curvas, o supercies dados correspondientes al problema de valores de contorno. Las autofunciones usualmente requieren que satisfagan ciertas condiciones de borde impuestas (e.g., asint oticas). Estas condiciones pueden ser tomadas de tres formas: 1. Condiciones de borde de Cauchy. El valor de una funci on y su derivada normal especicada en el borde. En electroest atica estas signicar an , el potencial, y En la componente normal del campo el ectrico. 2. Condiciones de borde de Dirichlet. El valor espec co en el borde. 3. Condiciones de borde de Neumann. La derivada normal (gradiente normal) de una funci on espec ca en el borde. En el caso electrest atico este ser a En y por lo tanto , la densidad de carga supercial. Un resumen de las relaciones de estos tres tipos de condiciones de borde con los tres tipos de ecuaciones diferenciales parciales bidimensionales est an dadas en la tabla 7.1. Para discusiones m as extensas de estas ecuaciones diferenciales parciales puede consultar Sommerfeld, cap tulo 2, o Morse y Feshbach, cap tulo 6. Partes de la tabla 7.1 son simplemente un asunto de mantener la consistencia interna, o sentido com un. Por ejemplo, para la ecuaci on de Poisson con una supercie cerrada, las condiciones de Dirichlet conducen a una soluci on u nica y estable. Las condiciones de Neumann, independiente de las condiciones de Dirichlet, del mismo modo conducen a una soluci on u nica y estable independiente de la soluci on de Dirichlet. Por lo tanto las condiciones de borde de Cauchy (lo que signica la de Dirichlet m as la de Neumann) conducen a una inconsistencia. El t ermino de condiciones de borde incluye como un caso especial el concepto de condiciones iniciales. Por ejemplo, especicando la posici on inicial x0 y la velocidad inicial v0 en algunos problemas de din amica corresponder a a condiciones de borde de Cauchy. La u nica diferencia en el presente uso de las condiciones de borde en estos problemas unidimensionales es que estamos aplicando las condiciones en ambos extremos del intervalo permitido de la variable.

7.2

Ecuaciones diferenciales de primer orden.

La f sica involucra algunas ecuaciones diferenciales de primer orden, ellas fueron estudiadas en el primer curso. Por completitud parece ser deseable revisarlas brevemente. Consideremos aqu ecuaciones diferenciales de la forma general P (x, y ) dy = f (x, y ) = . dx Q(x, y ) (7.16)

236 Condiciones de borde

CAP ITULO 7. ECUACIONES DIFERENCIALES. Tipo de ecuaci on diferencial parcial El pticas Laplace, Poisson en (x, y ) Hiperb olicas Parab olicas

Ecuaci on de Ondas Ecuaci on de difusi on en (x, t) en (x, t) Demasiado restrictivo Demasiado restrictivo Soluci on u nica y estable en 1 dim Demasiado restrictivo Soluci on u nica y estable en 1 dim Demasiado restrictivo

Cauchy Supercie Abierta

Resultados no f sicos Soluci on u nica (inestabilidades) y estable Demasiado restrictivo Insuciente Soluci on no u nica Insuciente Soluci on no u nica Tabla 7.1:

Supercie Cerrada Demasiado restrictivo Dirichlet Supercie Abierta Insuciente Supercie Cerrada Soluci on u nica y estable Neumann Supercie Abierta Insuciente Supercie Cerrada Soluci on u nica y estable

La ecuaci on (7.16) es claramente una ecuaci on de primer orden ordinaria. Es de primer orden ya que contiene la primera derivada y no mayores. Es Ordinaria ya que la derivada dy/dx es una derivada ordinaria o total. La ecuaci on (7.16) puede o no puede ser lineal, aunque trataremos el caso lineal explicitamente m as adelante.

7.2.1

Variables separables.

Frecuentemente la ecuaci on (7.16) tendr a la forma especial dy P (x) = f (x, y ) = . dx Q(y ) Entonces la podemos reescribir como P (x)dx + Q(y )dy = 0 . Integrando de (x0 , y0 ) a (x, y ) tiende a
x y

(7.17)

P (x )dx +
x0 y0

Q(y )dy = 0 .

(7.18)

7.2. ECUACIONES DIFERENCIALES DE PRIMER ORDEN.

237

Ya que los l mites inferiores x0 e y0 contribuyen en unas constantes, podr amos ignorar los l mites inferiores de integraci on y simplemente a nadir una constante de integraci on al nal. Note que esta t ecnica de separaci on de variables no requiere que la ecuaci on diferencial sea lineal. Ejemplo Ley de Boyle. Una forma diferencial de la ley de los gases de Boyle es V dV = , dP P para el volumen V de una cantidad ja de gas a presi on P (y temperatura constante). Separando variables, tenemos dV dP = V P o ln V = ln P + C . Con dos logar tmos presentes, es m as conveniente reescribir la constante de integraci on C como ln k . Entonces ln V + ln P = ln P V = ln k y PV = k .

7.2.2

Ecuaciones diferenciales exactas.

Reescribimos la ecuaci on (7.16) como P (x, y )dx + Q(x, y )dy = 0 . (7.19)

Esta ecuaci on se dice que es exacta si podemos calzar el lado izquierdo de ella a un diferencial d, d = dx + dy . x y (7.20)

Ya que la ecuaci on (7.19) tiene un cero a la derecha, buscamos una funci on desconocida (x, y ) =constante tal que d = 0. Tenemos (si tal funci on (x, y ) existe) P (x, y )dx + Q(x, y )dy = dx + dy x y (7.21)

238 y

CAP ITULO 7. ECUACIONES DIFERENCIALES.

= P (x, y ) , x

= Q(x, y ) . y

(7.22)

La condici on necesaria y suciente para que la ecuaci on sea exacta es que la segunda derivada parcial mezclada de (x, y ) (supuesta continua) es independiente del orden de diferenciaci on: 2 P (x, y ) Q(x, y ) 2 = = = . yx y x xy (7.23)

Si la ecuaci on (7.19) corresponde a un rotor (igual cero), entonces un potencial, (x, y ), debiera existir. Si (x, y ) existe entonces a partir de las ecuaciones (7.19) y (7.21) nuestra soluci on es (x, y ) = C . (7.24)

Podemos construir (x, y ) a partir de sus derivadas parciales de la misma manera que construimos un potencial magn etico vectorial en el cap tulo de vectores a partir de su rotor. Podemos volver a la ecuaci on (7.19) y ver que pasa si no es exacta, la ecuaci on (7.23) no es satisfecha. Sin embargo, siempre existe al menos una o quiz as una innidad de factores de integraci on, (x, y ), tales que (x, y )P (x, y )dx + (x, y )Q(x, y )dy = 0 es exacta. Desafortunadamente, un factor de integraci on no siempre es obvio o f acil de encontrar. Diferente es el caso de la ecuaci on diferencial de primer orden lineal considerada a continuaci on, no hay una manera sistem atica de desarrollar un factor de integraci on para la ecuaci on (7.19). Una ecuaci on diferencial en la cual las variables han sido separadas es autom aticamente exacta. Una ecuaci on diferencial exacta no es necesariamente separable.

7.2.3

Ecuaciones diferenciales ordinarias de primer orden lineales.

Si f (x, y ) en la ecuaci on (7.16) tiene la forma p(x)y + q (x), entonces la ecuaci on (7.16) se convierte en dy + p(x)y = q (x) . dx (7.25)

La ecuaci on (7.25) es la ODE de primer orden lineal m as general. Si q (x) = 0, la ecuaci on (7.25) es homog enea (en y ). Un q (x) distinto de cero puede representar una fuente o un t ermino de forzamiento. La ecuaci on (7.25) es lineal ; cada t ermino es lineal en y o dy/dx. 2 No hay potencias mayores; esto es, no hay y , ni productos, y (dy/dx). Note que la linealidad se reere a el y y a la dy/dx; p(x) y q (x) no es necesario que sean lineales en x. La ecuaci on (7.25), es la m as importante de estas ecuaciones diferenciales de primer orden para los f sicos y puede ser resuelta exactamente.

7.2. ECUACIONES DIFERENCIALES DE PRIMER ORDEN. Busquemos un factor de integraci on (x) tal que (x) puede ser reescrito como d [(x)y ] = (x)q (x) . dx dy + (x)p(x)y = (x)q (x) , dx

239

(7.26)

(7.27)

El prop osito de esto es hacer el lado izquierdo de la ecuaci on (7.25) una derivada total que pueda ser integrada por inspecci on. Esto tambi en, incidentalmente, hace la ecuaci on (7.25) exacta. Expandiendo la ecuaci on (7.27), obtenemos (x) dy d + y = (x)q (x) . dx dx

La comparaci on con la ecuaci on (7.26) muestra que debemos requerir que d(x) = (x)p(x) . dx (7.28)

Aqu hay una ecuaci on diferencial para (x), con las variables y x separables. Separamos variables, integramos, y obtenemos
x

(x) = exp

p(x ) dx

(7.29)

como nuestro factor de integraci on. Con (x) conocida procedemos a integrar la ecuaci on (7.27). Esto, por supuesto, fue el objetivo de introducir en primer lugar. Tenemos
x

d [(x )y ] dx = dx

(x )q (x ) dx .

Ahora integrando por inspecci on, tenemos


x

(x)y =

(x )q (x ) dx + C .

Las constantes a partir del l mite inferior de integraci on constante son reunidas en la constante C. Dividiendo por (x), obtenemos y (x) = 1 (x)
x

(x )q (x ) dx + C

Finalmente, sustituyendo en la ecuaci on (7.29) por conduce


x x s

y (x) = exp

p(t) dt

exp

p(t) dt q (s) ds + C

(7.30)

240

CAP ITULO 7. ECUACIONES DIFERENCIALES.

Aqu las variables mudas de integraci on han sido reescritas para hacerlas inambiguas. La ecuaci on (7.30) es la soluci on general completa de la ecuaci on diferencial lineal, de primer orden, la ecuaci on (7.25). La porci on
x

y1 (x) = C exp

p(t) dt

(7.31)

corresponde al caso q (x) = 0 y es soluci on general de la ecuaci on diferencial homog enea. El otro t ermino en la ecuaci on (7.30),
x x s

y (x) = exp

p(t) dt

exp

p(t) dt q (s) ds ,

(7.32)

es una soluci on particular que corresponde al t ermino espec co de fuente q (x). Podemos notar que si nuestra ecuaci on diferencial de primer orden es homog enea (q = 0), entonces ella es separable. De lo contrario, salvo casos especiales tal como p =constante, q =constante, o q (x) = ap(x), la ecuaci on (7.25) no es separable. Ejemplo Circuito RL. Para un circuito resistencia-inductancia las leyes de Kirchho producen a L dI (t) + RI (t) = V (t) , dt

para la corriente I (t), donde L es la inductancia y R es la resistencia, ambas constantes. V (t) es el voltaje aplicado tiempo dependiente. De la ecuaci on (7.29) nuestro factor de integraci on (t) es
t

(t) = exp = eRt/L . Entonces por la ecuaci on (7.30)


t

R dt L

I (t) = e

Rt/L

eRt/L

V (t) dt + C L

con la constante C es determinada por una condici on inicial (una condici on de borde). Para el caso especial V (t) = V0 , una constante, I (t) = eRt/L = V0 L Rt/L e +C LR

V0 + CeRt/L . R

Si la condici on inicial es I (0) = 0, entonces C = V0 /R y I (t) = V0 1 eRt/L . R

DE VARIABLES. 7.3. SEPARACION

241

7.2.4

Conversi on a una ecuaci on integral.

Nuestra ecuaci on diferencial de primer orden, ecuaci on (7.16), puede ser convertida a una ecuaci on integral por integraci on directa:
x

y (x) y (x0 ) =
x0

f [x, y (x)] dx .

(7.33)

Como una ecuaci on integral hay una posibilidad de una soluci on en serie de Neumann (se ver a en el pr oximo curso) con la aproximaci on inicial y (x) y (x0 ). En la literatura de ecuaciones diferenciales esto es llamado el m etodo de Picard de aproximaciones sucesivas. Ecuaciones diferenciales de primer orden las encontraremos de nuevo en conexi on con las transformadas de Laplace y de Fourier.

7.3

Separaci on de variables.

Las ecuaciones de la f sica matem atica listada en la secci on 7.1 son todas ecuaciones diferenciales parciales. Nuestra primera t ecnica para su soluci on es dividir la ecuaci on diferencial parcial en n ecuaciones diferenciales ordinarias de n variables. Cada separaci on introduce una constante de separaci on arbitraria. Si tenemos n variables, tenemos que introducir n 1 constantes, determinadas por las condiciones impuestas al resolver el problema.

7.3.1

Coordenadas cartesianas.
2 2 2 + 2 + 2 + k2 = 0 , x2 y z

En coordenadas cartesianas las euaciones de Helmholtz llegan a ser (7.34)

usando la forma cartesiana para el Laplaciano. Por el momento k 2 ser a una constante. Quiz as la manera m as simple de tratar una ecuaci on diferencial parcial tal como la ecuaci on (7.34) es dividirla en un conjunto de ecuaciones diferenciales ordinarias. Esto puede ser hecho como sigue. Sea (x, y, z ) = X (x)Y (y )Z (z ) , (7.35)

y sustituir de vuelta en la ecuaci on (7.34). C omo sabemos que la ecuaci on (7.35) es v alida?. La respuesta es muy simple. No sabemos si es v alida!. Mejor dicho, estamos procediendo en este esp ritu y tratando a ver si trabaja. Si nuestro intento es exitoso, entonces la ecuaci on (7.35) ser a justicada. Si no es exitoso, lo descubriremos pronto y luego trataremos otro ataque tal como las funciones de Green, transformadas integral, o an alisis num erico a la fuerza bruta. Con supuestamente dada por la ecuaci on (7.35), la ecuaci on (7.34) llega a ser YZ d2 Y d2 Z d2 X + XZ + XY + k 2 XY Z = 0 . 2 2 2 dx dy dz (7.36)

242

CAP ITULO 7. ECUACIONES DIFERENCIALES.

Dividiendo por = XY Z y rearreglando los t erminos, obtenemos 1 d2 Y 1 d2 Z 1 d2 X 2 = k . X dx2 Y dy 2 Z dz 2 (7.37)

La ecuaci on (7.37) exhibe una separaci on de variables. El lado izquierdo es s olo funci on de x, mientras que el lado derecho depende solamente de y y z . As la ecuaci on (7.37) es una clase de paradoja. Una funci on de x es igualada a una funci on de y y z , pero x, y y z son todas coordenadas independientes. Esta independencia signica que el comportamiento de x como una variable independiente no est a determinada ni por y ni por z . La paradoja est a resuelta jando cada lado igual a una constante, una constante de separaci on. Escogemos3 1 d2 X = l2 , X dx2 k 2 1 d2 Y 1 d2 Z = l2 . Y dy 2 Z dz 2 (7.38)

(7.39)

Ahora, volviendo nuestra atenci on a la ecuaci on (7.39), obtenemos 1 d2 Y 1 d2 Z 2 2 = k + l , Y dy 2 Z dz 2 (7.40)

y una segunda separaci on ha sido realizada. Aqu tenemos una funci on de y igualada a una funci on de z y aparece la misma paradoja. La resolvemos como antes igualando cada lado a otra constante de separaci on, m2 , 1 d2 Y = m2 , Y dy 2 1 d2 Z = k 2 + l2 + m2 = n2 , Z dz 2 (7.41)

(7.42)

introduciendo una constante n2 por k 2 = l2 + m2 + n2 para producir un conjunto sim etrico de ecuaciones. Ahora tenemos tres ecuaciones diferenciales ordinarias ((7.38), (7.41), y (7.42)) para reemplazar en la ecuaci on (7.34). Nuestra suposici on (ecuaci on (7.35)) ha sido exitosa y es por lo tanto justicada. Nuestra soluci on ser a etiquetada de acuerdo a la elecci on de nuestras constantes l, m, n, esto es, lmn (x, y, z ) = Xl (x)Ym (y )Zn (z ) . (7.43)

Sujeto a las condiciones del problema que se resuelve y a la condici on k 2 = l2 + m2 + n2 , podemos escoger l, m, n como queramos, y la ecuaci on (7.43) ser a todav a una soluci on de la ecuaci on (7.34), dado que Xl (x) es una soluci on de la ecuaci on (7.38) y as seguimos.
La elecci on de signo es completamente arbitraria, ser a jada en un problema espec co por la necesidad de satisfacer las condiciones de borde.
3

DE VARIABLES. 7.3. SEPARACION

243

Podemos desarrollar la soluci on m as general de la ecuaci on (7.34) tomando una combinaci on lineal de soluciones lmn , =
l,m,n

almn lmn .

(7.44)

Los coecientes constantes almn nalmente son escogidos para permitir que satisfaga las condiciones de borde del problema.

7.3.2

Coordenadas cil ndricas circulares.

Si consideramos que nuestra funci on desconocida depende de , , z la ecuaci on de Helmholtz se convierte en 2 (, , z ) + k 2 (, , z ) = 0 , o 1 + 1 2 2 + 2 + k2 = 0 . 2 2 z (7.46) (7.45)

Como antes, suponemos una forma factorizada para , (, , z ) = P ()()Z (z ) . Sustituyendo en la ecuaci on (7.46), tenemos Z d d dP d + P Z d2 d2 Z + P + k 2 P Z = 0 . 2 d2 dz 2 (7.48) (7.47)

Todas las derivadas parciales han llegado a ser derivadas ordinarias. Dividiendo por P Z y moviendo la derivada z al lado derecho conduce a 1 d P d dP d + 1 d2 1 d2 Z 2 + k = . 2 d2 Z dz 2 (7.49)

De nuevo, tenemos la paradoja. Una funci on de z en la derecha aparece dependiendo de una funci on de y en el lado izquierdo. Resolvemos la paradoja haciendo cada lado de la ecuaci on (7.49) igual a una constante, la misma constante. Escojamos4 l2 . Entonces d2 Z = l2 Z , 2 dz y 1 d P d
4

(7.50)

dP d

1 d2 + k 2 = l2 . 2 d2

(7.51)

La elecci on del signo de la constante de separaci on es arbitraria. Sin embargo, elegimos un signo menos para la coordenada axial z en espera de una posible dependencia exponencial en z . Un signo positivo es elegido para la coordenada azimutal en espera de una dependencia peri odica en .

244

CAP ITULO 7. ECUACIONES DIFERENCIALES.

Ajustando k 2 + l2 = n2 , multiplicando por 2 , y reordenando t erminos, obtenemos d P d dP d + n 2 2 = 1 d2 . d2 (7.52)

Podemos ajustar el lado derecho a m2 y d2 = m2 d2 Finalmente, para la dependencia en tenemos d d dP d + (n2 2 m2 )P = 0 . (7.54) (7.53)

Esta es la ecuaci on diferencial de Bessel. La soluci on y sus propiedades ser an presentradas en el pr oximo curso. La separaci on de variables de la ecuaci on de Laplace en coordenadas parab olicas tambi en conduce a ecuaciones de Bessel. Puede notarse que la ecuaci on de Bessel es notable por la variedad de formas que puede asumir. La ecuaci on original de Helmholtz, una ecuaci on diferencial parcial tridimensional, ha sido reemplazada por tres ecuaciones diferenciales ordinarias, las ecuaciones (7.50), (7.53) y (7.54). Una soluci on de la ecuaci on de Helmholtz es (, , z ) = P ()()Z (z ) . (7.55)

Identicando las soluciones espec cas P , , Z por sub ndices, vemos que la soluci on m as general de la ecuaci on de Helmholtz es una combinaci on lineal del producto de soluciones: (, , z ) =
m,n

amn Pmn ()m ()Zn (z ) .

(7.56)

7.3.3

Coordenadas polares esf ericas.

Tratemos de separar la ecuaci on de Helmholtz, de nuevo con k 2 constante, en coordenadas polares esf ericas. Usando la expresi on del Laplaciano en estas coordenadas obtenemos 1 sen 2 r sen r r
2

sen

1 2 + = k 2 . 2 sen

(7.57)

Ahora, en analog a con la ecuaci on (7.35) tratamos (r, , ) = R(r)()() . Sustituyendo de vuelta en la ecuaci on (7.57) y dividiendo por R, tenemos 1 d Rr 2 dr r
2 dR

(7.58)

dr

1 d + r2 sen d

d sen d

1 d2 + 2 = k2 . 2 2 r sen d

(7.59)

DE VARIABLES. 7.3. SEPARACION

245

Note que todas las derivadas son ahora derivadas ordinarias m as que parciales. Multiplicando 2 2 2 2 5 por r sen , podemos aislar (1/)(d /d ) para obtener 1 d2 1 d = r2 sen2 k 2 2 2 d r R dr r2 dR dr r2 1 d sen d sen d d . (7.60)

La ecuaci on (7.60) relaciona una funci on u nicamente de con una funci on de r y . Ya que r, , y son variables independientes, igualamos cada lado de la ecuaci on (7.60) a una constante. Aqu una peque na consideraci on puede simplicar el an alisis posterior. En casi todos los problemas f sicos aparecer a como un angulo azimutal. Esto sugiere una soluci on 2 peri odica m as que una exponencial. Con esto en mente, usemos m como la constante de separaci on. Cualquier constante lo har a, pero esta har a la vida un poquito m as f acil. Entonces 1 d2 = m2 d2 y 1 d 2 r R dr r2 dR dr + 1 d 2 r sen d sen d d m2 = k 2 . r2 sen2 (7.62) (7.61)

Multiplicando la ecuaci on (7.62) por r2 y reordenando t erminos, tenemos 1 d R dr r2 dR dr + r2 k2 = 1 d sen d sen d d + m2 . sen2 (7.63)

Nuevamente, las variables son separadas. Igualamos cada lado a una conmstante Q y nalmente obtenemos 1 d sen d 1 d r2 dr sen d d m2 + Q = 0 , sen2 QR =0. r2 (7.64)

r2

dR dr

+ k2R

(7.65)

Una vez m as hemos reemplazado una ecuaci on diferencial parcial de tres variables por tres ecuaciones diferenciales ordinarias. Las soluciones de estas tres ecuaciones diferenciales ordinarias son discutidas en el pr oximo curso. Por ejemplo, la ecuaci on (7.64) es identicada como la ecuaci on de asociada de Legendre en la cual la constante Q llega a ser l(l + 1); con l 2 entero. Si k es una constante (positiva), la ecuaci on (7.65) llega a ser la ecuaci on de Bessel esf erica. Nuevamente, nuestra soluci on m as general puede ser escrita Qm (r, , ) =
q,m
5

RQ (r)Qm ()m () .

(7.66)

El orden en el cual las variables son separadas aqu no es u nico. Muchos textos de mec anica cu antica separan la dependencia en r primero.

246

CAP ITULO 7. ECUACIONES DIFERENCIALES.

La restricci on que k 2 sea una constante es innecesariamente severa. El proceso de separaci on 2 ser a todav a posible para k tan general como k 2 = f (r) + 1 1 2 g () + 2 h() + k . 2 2 r r sen (7.67)

En el problema del atomo de hidr ogeno, uno de los ejemplos m as importantes de la ecuaci on de onda de Schr odinger con una forma cerrada de soluci on es k 2 = f (r). La ecuaci on (7.65) para el atomo de hidr ogeno llega a ser la ecuaci on asociada de Laguerre. La gran importancia de esta separaci on de variables en coordenadas polares esf ericas 2 2 deriva del hecho que el caso k = k (r) cubre una tremenda cantidad de f sica: las teor as de 2 2 gravitaci on, electroest atica, f sica at omica y f sica nuclear. Y, con k = k (r), la dependencia angular es aislada en las ecuaciones (7.61) y (7.64), la cual puede ser resuelta exactamente. Finalmente, una ilustraci on de c omo la constante m en la ecuaci on (7.61) es restringida, notamos que en coordenadas polares esf ericas y cil ndricas es un angulo azimutal. Si esto es un problema cl asico, ciertamente requeriremos que la soluci on azimutal () sea univaluada, esto es, ( + 2 ) = () . (7.68)

Esto es equivalente a requerir que la soluci on azimutal tenga un per odo de 2 o alg un m ultiplo entero de el. Por lo tanto m debe ser un entero. Cu al entero, depende de los detalles del problema. Cada vez que una coordenada corresponda a un eje de translaci on o a un angulo azimutal la ecuaci on separada siempre tendr a la forma d2 () = m2 () 2 d para , el angulo azimutal, y d2 Z = a2 Z (z ) dz 2 (7.69)

para z , un eje de traslaci on en un sistema de coordenadas cil ndrico. Las soluciones, por supuesto, son sen az y cos az para a2 y la correspondiente funci on hiperb olica (o exponencial) 2 senh az y cosh az para +a . Otras ecuaciones diferenciales ordinarias encontradas ocasionalmente incluyen las ecuaciones de Laguerre y la asociada de Laguerre del importante problema del atomo de hidr ogeno en mec anica cu antica: d2 y dy x 2 + (1 x) + y = 0 , dx dx x d2 y dy + (1 + k x) + y = 0 . 2 dx dx (7.70)

(7.71)

De la teor a de la mec anica cu antica del oscilador arm onico lineal tenemos la ecuaci on de Hermite, d2 y dy 2x + 2y = 0 . 2 dx dx (7.72)

DE VARIABLES. 7.3. SEPARACION Finalmente, de vez en vez encontramos la ecuaci on diferencial de Chebyshev (1 x2 ) d2 y dy x + n2 y = 0 . 2 dx dx

247

(7.73)

Para una referencia conveniente, las formas de la soluci on de la ecuaci on de Laplace, la ecuaci on de Helmholtz y la ecuaci on de difusi on en coordenadas polares esf ericas son resumidas en la tabla 7.2. Las soluciones de la ecuaci on de Laplace en coordenadas circulares cil ndricas son representadas en la tabla 7.3. =
l,m

alm lm rl r l 1 jl (kr) nl (kr) Plm (cos ) Qm l (cos ) Plm (cos ) Qm l (cos ) Plm (cos ) Qm l (cos )

1.

2 = 0 2 + k 2 = 0 2 k 2 = 0

lm =

cos m sen m cos m sen m cos m sen m

2.

lm =

3.

lm =

il (kr) kl (kr)

Tabla 7.2: Soluciones en coordenadas polares esf ericas 2 = 0 cos m sen m cos m sin m cos m sen m ez ez cos z sen z

=
m,

am m ,

a.

m =

Jm () Nm ()

b. = 0 (no hay dependencia en z )

m =

Im () Km () m m

c.

m =

Tabla 7.3: Soluciones en coordenadas cil ndricas circulares Para las ecuaciones de Helmholtz y de difusi on la constante k 2 se agrega a la constante 2 de separaci on para denir un nuevo par ametro 2 o 2 . Para la elecci on de + 2 (con 2 > 0) obtenemos Jm () y Nm (). Para la elecci on 2 (con 2 > 0) obtenemos Im () y Km () como previamente. Estas ecuaciones diferenciales ordinarias y sus generalizaciones ser an examinadas y sistematizadas en el pr oximo curso

You might also like