Professional Documents
Culture Documents
DIPLOMATURA DE ESTADÍSTICA 1
a) E ⊂ E
b) F ⊂ E y E ⊂ F ⇒ E = F .
c) F ⊂ E y E ⊂ G ⇒ F ⊂ G.
Definición. 1.1 Dado un conjunto E, se llama conjunto de partes de E al conjunto cuyos elementos son todos los
subconjuntos de E y se denota por P(E).
a) Conmutativa: E ∪ F = F ∪ E.
b) Asociativa: (E ∪ F ) ∪ G = E ∪ (F ∪ G).
c) F ⊂ E ⇔ F ∪ E = E.
Definición. 2.3 Sean E y F dos conjuntos. Se llama intersección de E y F y se denota por E ∩ F al conjunto cuyos
elementos pertenecen a E y a F .
a) Conmutativa: E ∩ F = F ∩ E.
b) Asociativa: (E ∩ F ) ∩ G = E ∩ (F ∩ G).
c) F ⊂ E ⇔ F ∩ E = F .
Definición. 2.5 Sean E y F dos conjuntos. Se llama diferencia de E y F y se denota por E − F al conjunto de los
elementos de E que no pertenecen a F .
a) E − E = ∅.
b) E − ∅ = E.
c) ∅ − E = ∅.
d) E − F = F − E ⇒ E = F .
e) (E − F ) − G ⊂ E − (F − G).
TEORÍA DE ÁLGEBRA. DIPLOMATURA DE ESTADÍSTICA 2
Definición. 2.7 Sean E y F dos conjuntos, tales que F ⊂ E. Se llama complemento de F con respecto a E y se
denota por {E F (o bien por {F , si no hay lugar a confusión, o bien por F , oF 0 ) a la diferencia E − F .
a) F ∪ F = E.
b) F ∩ F = ∅.
c) ∅ = E
d) E = ∅
e) F = F
a) E ∩ (F ∪ G) = (E ∩ F ) ∪ (E ∩ G).
b) E ∪ (F ∩ G) = (E ∪ F ) ∩ (E ∪ G).
a) F ∪ G = F ∩ G.
b) F ∩ G = F ∪ G.
Definición. 3.2 Un conjunto G es una gráfica si sus elementos son pares ordenados. Si G es una gráfica y (x, y) ∈ G,
se dice que y es correspondiente de x por G.
Definición. 3.3 Si G es una gráfica, se llama primera (respectivamente segunda) proyección de G, al conjunto de
las primeras (respectivamente segundas) coordenadas de elementos de G.
A la primera proyección de G se le suele llamar también conjunto de definición de G y a la segunda conjunto de
valores de G y se denotan por pr1 G y pr2 G.
Definición. 3.4 Se llama correspondencia o relación entre un conjunto A y un conjunto B a una terna ordenada
Γ = (G, A, B), donde G es una gráfica tal que pr1 G ⊂ A y pr2 G ⊂ B. Se dice que G es la gráfica de Γ, A el conjunto
de partida y B el conjunto de llegada.
Si (x, y) ∈ G, se dice también que y es correspondiente de x por la correspondencia Γ o que Γ hace corresponder
al elemento x el elemento y. Para todo x ∈ pr1 G se dice que la correspondencia Γ está definida para el elemento x,
y pr1 G se llama el conjunto de definición de Γ o dominio de Γ; para todo y perteneciente a pr2 G se dice que y es un
valor tomado por Γ y pr2 G se llama el conjunto de valores de Γ.
Definición. 3.5 Sea G una gráfica. Se llama gráfica inversa de G y se designa por G−1 , a la gráfica cuyos elementos
son los pares ordenados (x, y), tales que (y, x) ∈ G.
Definición. 3.6 Sea Γ = (G, A, B) una correspondencia entre A y B. Se llama correspondencia inversa de Γ y se
denota por Γ−1 a la correspondencia (G−1 , B, A).
Definición. 3.7 Se dice que una correspondencia f = (F, A, B) es una función o un aplicación si:
1. A = pr1 F .
2. Para cada x ∈ A existe un único elemento correspondiente a x por F .
TEORÍA DE ÁLGEBRA. DIPLOMATURA DE ESTADÍSTICA 3
Función o aplicación: Se dice que f = (F, A, B) es una función o aplicación de A en B o que está definida en A y
toma sus valores en B, y se suele escribir: f : A → B. Al único elemento y ∈ B, correspondiente a x se denota por
f (x) y se llama la imagen de x por f , es decir son equivalentes y = f (x) y (x, y) ∈ F . A A se le llama dominio de la
función y al conjunto de llegada B también se le llama codominio o contradominio de f .
a) f (X ∪ Y ) = f (X) ∪ f (Y ).
b) f (X ∩ Y ) ⊂ f (X) ∩ f (Y ).
c) f −1 (U ∩ V ) = f −1 (U ) ∩ f −1 (V ).
1) f es inyectiva si cualesquiera dos elementos de X distintos entre si tienen imágenes distintas. En otras
palabras,
∀a1 , a2 ∈ X, f (a1 ) = f (a2 ) ⇒ a1 = a2 .
2) f es sobreyectiva si todo elemento de Y es la imagen de algún elemento de X, es decir,
∀b ∈ Y, ∃a ∈ X, f (a) = b.
∀b ∈ Y, ∃!a ∈ X, f (a) = b.
Proposición. 3.13 Sea f una función de A en B. Para que la correspondencia f −1 sea una función es necesario y
suficiente que f sea biyectiva.
Definición. 3.14 Sea f una función biyectiva. Se llama función inversa de f a la correspondencia f −1 .
a) Reflexiva: Si ∀a ∈ A, a R a.
b) Simétrica: Si a R b ⇒ b R a.
c) Antisimétrica: Si a R b y b R a ⇒ a = b.
d) Transitiva: Si a R b y b R c ⇒ a R c.
TEORÍA DE ÁLGEBRA. DIPLOMATURA DE ESTADÍSTICA 4
Definición. 4.3 Sea A un conjunto y sea R una relación en A. Se dice que R es es de equivalencia si es reflexiva,
simétrica y transitiva.
Definición. 4.4 Clases de equivalencia Sea E un conjunto y sea R una relación de equivalencia en E. Para todo
x ∈ E se llama clase de equivalencia de x a la imagen por R de {x}, o sea R(x) = {y ∈ E : x R y}.
Definición. 4.6 Sea E un conjunto y sea R una relación de equivalencia en E. Se llama conjunto cociente de E por
R al conjunto de las clases de equivalencia de los elementos de E.
Definición. 4.7 Sea A un conjunto y sea R una relación en A. Se dice que R es es una relación de orden en A si es
reflexiva, antisimétrica y transitiva. Para una relación de orden en A se suele utilizar en lugar de a R b la notación
a ≤ b.
Definición. 4.8 Se dice que una relación de orden ≤ en un conjunto A es de orden total, o que (A, ≤) está totalmente
ordenado por la relación ≤ si para todo par de elementos a, b ∈ A se verifica: a ≤ b ó b ≤ a.
Definición. 4.9 Sea (A, ≤) un conjunto ordenado. Un elemento a ∈ A se llama elemento maximal de (A, ≤) si para
todo x ∈ A tal que a ≤ x se tiene a = x. Un elemento a ∈ A se llama elemento minimal de (A, ≤) si para todo x ∈ A
tal que x ≤ a se tiene a = x
Definición. 4.10 Sea (A, ≤) un conjunto ordenado y X ⊂ A. Un elemento k ∈ A se llama cota superior de X si
∀x ∈ X, x ≤ k. Un elemento k ∈ A se llama cota inferior de X si ∀x ∈ X, k ≤ x.
Un subconjunto X de A se dice acotado superiormente si tiene alguna cota superior y se dice acotado inferiormente
si tiene alguna cota inferior, y se dice simplemente acotado si está acotado superiormente e inferiormente.
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 1
Tema 2: Matrices
1 Definiciones generales
Definición. 1.1 Dados m, n ∈ N, una matriz de orden m × n con coeficientes reales es una orde-
nación rectangular de m × n números reales dispuestos en m filas y n columnas.
Dada una matriz, A, de orden m × n con coeficientes reales, para cada par de números naturales,
i, j, 1 ≤ i ≤ m y 1 ≤ j ≤ n, representaremos el elemento de A situado en la fila i y la columna j,
por aij . De este modo, la notación habitual para representar matrices será disponer sus elementos
por filas y columnas en un rectángulo, de forma que el elemento aij se encuentre en la fila i y en la
columna j. Ası́ tendremos:
a11 · · · a1j · · · a1n
.. .. ..
. . .
A = ai1 · · · aij · · · ain
. .. ..
.. . .
am1 · · · amj · · · amn
El conjunto formado por todas las matrices de orden m × n con coeficientes reales, lo denotaremos
por Mm×n .
Definición. 1.2 Diremos que dos matrices A = (aij ) y B = (bij ) son iguales si son del mismo orden
y además
∀i, j : 1 ≤ i ≤ m, 1 ≤ j ≤ n, aij = bij .
1) Llamaremos diagonal de la matriz A a la sucesión formada por los elementos de A cuyos ı́ndices
coinciden, es decir:
a11 , a22 , . . . , app , siendo p = min(m, n).
2) Una submatriz de A es una matriz que puede obtenerse a partir de A suprimiendo ciertas filas
y columnas.
3) Una caja, o bloque, de la matriz A es una submatriz de A en la cual los ı́ndices de sus filas y
columnas son consecutivos.
1) Una matriz A ∈ Mm×n , se denomina cuadrada si tiene igual número de filas que de columnas,
es decir, m = n. El conjunto de todas las matrices cuadradas de orden n (es decir, n × n) se
denotará por Mn .
2) Una matriz A = (aij ), se llama triangular superior si todos los elementos situados por debajo
de la diagonal principal son nulos, esto es:
∀i, j : i 6= j, dij = 0.
En otras palabras, si todos los elementos que se encuentran fuera de la diagonal principal son
nulos.
4) Una matriz escalar es una matriz diagonal con todos los elementos de la diagonal iguales.
5) Una matriz A = (aij ) ∈ Mn se llama simétrica si
De este modo, dadas dos matrices A y B, del mismo orden, podemos calcular de manera natural
su suma, que será, de nuevo, una matriz del mismo orden que A y B.
∀M ∈ Mm×n , M + Θ = Θ + M = M.
4) Elemento opuesto: Para cualquier matriz A = (aij ) ∈ Mm×n , existe una única matriz
−A = (−aij ) ∈ Mm×n , que llamaremos opuesta de A, tal que
A + (−A) = (−A) + A = Θ.
1) λ(A + B) = λA + λB.
2) (λ + µ)A = λA + µA.
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 3
3) (λµ)A = λ(µA).
4) 1A = A y 0A = Θ.
Nota. 2.6
a) Dadas dos matrices A y B, para que podamos obtener el producto AB es necesario que el
número de columnas de A coincida con el número de filas de B.
b) Si F = (fij ) ∈ M1×p y C = (cij ) ∈ Mp×1 , el producto F C es una matriz de orden 1 × 1, que
puede ser considerada como un escalar:
c11
c21
F C = [f11 f12 · · · f1p ] . = f11 c11 + f12 c21 + · · · + f1p cp1 .
..
cp1
Teniendo en cuenta esto, dadas A ∈ Mm×p y B ∈ Mp×n , si C = AB, el elemento cij , que
ocupa el lugar (i, j) en C, es el resultado de multiplicar la fila i de A por la columna j de B.
3) Elemento unidad: Existe una matriz In ∈ Mn tal que AIn = A, Im A = A para toda matriz
A m × n.
4) (λA)B = A(λB) = λ(AB), λ ∈ R.
Nota. 2.8
En algunos casos, las operaciones entre matrices conservan el tipo de matriz. En concreto se tiene:
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 4
Proposición. 2.9
Definición. 2.10 Una matriz A ∈ Mn se llama regular, si existe otra matriz cuadrada de orden n,
que denotamos por A−1 , tal que
AA−1 = A−1 A = In .
La matriz A−1 se denomina inversa de A.
Proposición. 2.13 Si A y B son dos matrices regulares del mismo orden, entonces AB también es
regular y (AB)−1 = B −1 A−1 .
Definición. 2.14 Dada A = (aij ) ∈ Mm×n , llamamos matriz traspuesta de A, y la denotamos por
At , a la matriz que se obtiene intercambiando las filas y las columnas de A, es decir,
At = (bij ) ∈ Mn×m ⇐⇒ ∀i, j, bij = aji .
a) (At )t = A.
b) (A + B)t = At + B t y (αA)t = αAt .
c) (AB)t = B t At .
d) Si A es regular, entonces At también y (At )−1 = (A−1 )t .
e) A ∈ Mn es simétrica si y sólo si At = A.
e) A ∈ Mn es antisimétrica si y sólo si At = −A.
Proposición. 3.1 Sean A, B ∈ Mn y A11 , B11 ∈ Mr , A12 , B12 ∈ Mr×(n−r) , A21 , B21 ∈ M(n−r)×r ,
A22 , B22 ∈ M(n−r) , de tal forma que
A11 A12 B11 B12
A= y B=
A21 A22 B21 B22
Se verifica:
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 5
αA11 αA12
1) αA =
αA21 αA22
(A11 )t (A21 )t
t
2) A =
(A12 )t (A22 )t
A11 + B11 A12 + B12
3) A + B =
A21 + B21 A22 + B22
A11 B11 + A12 B21 A11 B12 + A12 B22
4) AB =
A21 B11 + A22 B21 A21 B12 + A22 B22
Nota. 3.3 Si una matriz A ∈ Mn tiene una columna de ceros, entonces no es regular, ya que dada
otra matriz B ∈ Mn , el producto BA también tendrá una columna de ceros y, por tanto, BA 6= In .
4 Transformaciones elementales
Las transformaciones elementales son operaciones simples que nos permiten obtener, a partir de una
matriz dada, otras matrices operando sobre las filas o sobre las columnas de la matriz inicial. Serán
de gran utilidad en los próximos temas para obtener matrices de formas convenientes o facilitar los
cálculos.
Las transformaciones elementales por filas son:
Pij : es la matriz que se obtiene a partir de la identidad intercambiando las filas i y j. Al multiplicar
por la izquierda una matriz A por Pij , se intercambian las filas i y j de la matriz A.
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 6
Fi (α): es la matriz que se obtiene a partir de la identidad multiplicando la fila i por α. Al multiplicar
por la izquierda una matriz A por Fi (α), se multiplica la fila i de la matriz A por α.
Fij (α): es la matriz que se obtiene a partir de la identidad sumando a la fila i la fila j multiplicada
por α. Si una matriz A, se multiplica por la izquierda por Fij (α) se obtiene efecto siguiente:
a la fila i de A se le suma la fila j de A multiplicada por α.
De manera análoga, podemos definir matrices elementales cuyo efecto sobre una matriz A, al mul-
tiplicarla por la derecha por una de estas matrices, es el mismo que aplicar a la matriz A una
transformación elemental por columnas, es decir:
Para cada i, j : 1 ≤ i ≤ n, 1 ≤ j ≤ n y α ∈ R, α 6= 0, definimos:
Lema. 4.1 Las matrices elementales son regulares y sus inversas son:
(Pij )−1 = Pji (Fi (α))−1 = Fi (1/α) (Fij (α))−1 = Fij (−α)
(Qij )−1 = Qji (Ci (α))−1 = Ci (1/α) (Cij (α))−1 = Cij (−α)
Una matriz A se denomina matriz escalonada por filas, o se dice que está en forma escalonada
por filas, si se cumplen las dos condiciones siguientes:
• Todas las filas nulas, si las hay, están en la parte inferior de la matriz.
• Cada entrada principal (primera entrada no nula en una fila de una matriz) no nula está a la
derecha de la entrada principal no nula de la fila de la fila precedente.
Se dice que una matriz escalonada por filas A se ha puesto en forma canónica por filas si tiene
las dos propiedades adicionales siguientes:
1. Encontrar la primera columna con una entrada no nula. Supongamos que es la columna j1 .
2. Intercambiar las filas de forma que aparezca una entrada no nula en la primera fila de la
columna j1 , esto es, conseguir que a1j1 6= 0.
El siguiente algoritmo reduce por filas una matriz escalonada a su forma canónica por filas. Aquı́
A está en forma escalonada, digamos con entrada principales no nulas: a1j1 , a2j2 , . . . , arjr .
TEORÍA DE ÁLGEBRA I. DIPLOMATURA DE ESTADÍSTICA 7
1
1. Multiplicar la última fila no nula por arjr de forma que la entrada principal no nula sea 1.
Los anteriores algoritmos muestran que cualquier matriz es equivalente por filas a al menos una
matriz en forma canónica por filas. Admitiremos, sin demostración, que dicha matriz es única. Lo
que podemos enunciar en el siguiente teorema:
Teorema. 4.2 Cualquier matriz A es equivalente por filas a una única matriz en forma canónica
por filas (llamada la forma canónica por filas de A).
Si una matriz A está en forma escalonada, sus entradas principales no nulas se denominan
entradas pivote.
Lo dicho para filas se extiende de manera obvia a transformaciones elementales por columnas.
Teorema. 4.3 Sea A una matriz cuadrada. Entonces son equivalentes las aserciones siguientes:
Los dos últimos teoremas nos permiten calcular la inversa de una matriz A mediante transfor-
maciones elementales por filas: Si A es equivalente por filas a I, sea Es · · · E2 E1 A = I, entonces
A−1 = Es · · · E2 E1 , luego si mediante transformaciones elementales de filas llevamos A a la matriz
unidad, realizando las mismas transformaciones en la matriz I obtenemos la matriz inversa A−1 .
El siguiente teorema es válido para matrices rectangulares m × n.
Teorema. 4.5 B es equivalente por filas a A si y solo si existe una matriz no singular P , tal que
B = PA
Las transformaciones elementales nos servirán, también, para poder transformar una matriz A
en otra lo más parecida posible a la identidad. Este proceso es de gran utilidad en el cálculo de la
matriz inversa de una matriz regular y en el cálculo del rango de una matriz y de un conjunto de
vectores, ası́ como en el cálculo de determinantes.
Se dice que una matriz B es equivalente a otra A si B puede obtenerse de A mediante una
sucesión de transformaciones elementales entre filas y columnas.
Teorema. 4.6 Dada A ∈ Mm×n , existen dos matrices regulares, P ∈ Mm y Q ∈ Mn tales que,
para cierto r ∈ N:
Ir Θ
P AQ =
Θ Θ
siendo P y Q producto de matrices elementales por filas y por columnas, respectivamente.
TEORÍA DE ÁLGEBRA I: Tema 3: Determinantes. DIPLOMATURA DE ESTADÍSTICA 1
Tema 3: Determinantes
1 Definición de determinante: Propiedades
Históricamente la teorı́a de los determinantes precedió a la teorı́a de matrices, y muchos resultados
familiares de la teorı́a de matrices fueron originalmente formulados en términos de determinantes.
Hoy dı́a, la teorı́a de determinantes no juega un papel central en el álgebra lineal, pero hay ciertos
aspectos en los que los determinantes ofrecen una interpretación más natural, o una prueba más
sencilla de algunos resultados. Por ello, el interés de los determinantes, sobre todo para matrices de
orden elevado, es, fundamentalmente, teórico.
Notación : 1.1 A lo largo de todo este tema sólo consideraremos matrices cuadradas y, como ya
se hizo en el tema anterior, dada una matriz A ∈ Mn escribiremos:
A = a1 a2 · · · an
det : Mn → R
que a cada matriz cuadrada de orden n le asocia un escalar, que denotamos por det(A) (y en algunos
textos por |A|), de tal modo que se verifican las siguientes propiedades:
1) Multilinealidad:
a) Dados A = [a1 |a2 | · · · |an ] ∈ Mn y α ∈ R si tenemos, para algún i (1 ≤ i ≤ n),
B = a1 a2 · · · αai · · · an ∈ Mn
entonces,
det(B) = αdet(A).
b) Si A = [a1 |a2 | · · · |ai | · · · |an ] ∈ Mn , siendo ai = b + c, para cierto i (1 ≤ i ≤ n), se tiene:
i)
z}|{
det(A) = det([a1 |a2 | · · · | b | · · · |an ])+
+det([a1 |a2 | · · · | |{z}
c | · · · |an ])
i)
2) Antisimetrı́a:
Si una matriz B, se obtiene a partir de otra matriz A, intercambiando entre si dos columnas
distintas, entonces
det(B) = −det(A).
3) Normalidad:
Si In es la matriz identidad de orden n, entonces:
det(In ) = 1.
Puede demostrarse que, para cada n, sólo existe una función que satisface las propiedades de
la definición. De este modo, dada A ∈ Mn , el valor det(A) está definido de manera única y lo
llamaremos el determinante de A. De hecho, a partir de las tres propiedades básicas del determinante
podemos calcular los determinantes de las matrices elementales y probar nuevas propiedades.
TEORÍA DE ÁLGEBRA I: Tema 3: Determinantes. DIPLOMATURA DE ESTADÍSTICA 2
Las propiedades a), b), c) de esta última proposición pueden generalizarse de la siguiente manera:
Proposición. 1.5 Dada A ∈ Mn , si una columna de A es combinación lineal de las demás, entonces
det(A) = 0.
1) det(Qij ) = −1.
2) det(Ci (α)) = α, para todo α ∈ R.
3) det(Cij (α)) = 1, para todo α ∈ R.
Utilizando este resultado podemos probar que el determinante de cualquier matriz es igual al de
su traspuesta. Para ello necesitamos algunos resultados previos:
Nota. 1.9 Dado que se tiene Pij = Qtij , Fi (α) = Ci (α)t y Fij (α) = Cij (α)t , el anterior lema nos
permite concluir:
det(Pij ) = det(Pijt ) = −1
det(Fi (α)) = α = det(Fi (α)t ) ya que Fi (α) = Ci (α)
det(Fij (α)) = det(Fij (α)t ) = 1 ya que Fij (α) = Cij (α)t
Nota. 1.11 Gracias a este último teorema todas las propiedades anteriores son válidas cam-
biando en su enunciado columnas por filas.
TEORÍA DE ÁLGEBRA I: Tema 3: Determinantes. DIPLOMATURA DE ESTADÍSTICA 3
2) Si A = (aij ) ∈ M3 , entonces
det(A) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32
−(a12 a21 a33 + a13 a22 a31 + a11 a23 a32 )
Es posible obtener expresiones similares a éstas para matrices de orden arbitrario, sin embargo,
para n ≥ 4 las expresiones obtenidas son demasiado complicadas para ser utilizadas en la práctica.
Por consiguiente, será necesario un método más práctico para calcular el determinante de una matriz
de orden elevado.
n
X
1) ∀i = 1, . . . , n, det(A) = aik Aik = ai1 Ai1 + ai2 Ai2 + · · · + ain Ain .
k=1
n
X
2) ∀j = 1, . . . , n, det(A) = akj Akj = a1j A1j + a2j A2j + · · · + anj Anj .
k=1
En el caso 1) decimos que det(A) ha sido calculado desarrollándolo por los adjuntos de la fila i-ésima
y, en el caso 2), det(A) ha sido calculado desarrollándolo por los adjuntos de la j-ésima columna.
TEORÍA DE ÁLGEBRA I: Tema 3: Determinantes. DIPLOMATURA DE ESTADÍSTICA 4
es decir, los adjuntos de la fila k por los elementos correspondientes de otra fila (la i-ésima en este
caso), lo que obtenemos es el determinante de la matriz B que resulta de sustituir la fila k por la
fila i. De este modo B tiene dos filas iguales y su determinante es cero. Y lo mismo sucede por
columnas.
En resumen, la situación es la siguiente:
n
X det(A) si i = k
aij Akj = (1 ≤ i, k ≤ n)
0 si i 6= k
j=1
n
X det(A) si j = k
aij Aik = (1 ≤ j, k ≤ n)
0 6 k
si j =
i=1
El último teorema, junto con las propiedades enunciadas en la sección anterior, nos facilitan el
cálculo efectivo de un determinante cuando el orden de la matriz es elevado. Gracias a él tenemos:
Corolario. 2.5 El determinante de una matriz triangular superior (o inferior) es igual al producto
de los elementos de su diagonal. En particular, el determinante de una matriz diagonal D =
diag(d1 , . . . , dn ) es
det(D) = d1 d2 . . . dn .
Nota. 2.6 Dado que calcular el determinante de una matriz triangular es extraordinariamente sim-
ple, un método muy empleado en la práctica, a la hora de calcular el determinante de una matriz
cualquiera, es aplicar a dicha matriz transformaciones elementales que no cambien el valor de su
determinante, salvo quizá en el signo, hasta llevarla a una forma triangular superior para la cual
resulta fácil calcularlo.
3 Matrices regulares
Una de las principales aplicaciones de los determinantes es la de proporcionar un criterio, formal-
mente muy simple, para determinar si un matriz cuadrada es regular o no. Además, proporciona
una expresión bastante sencilla de la inversa de una matriz regular.
Teorema. 3.1 Una matriz cuadrada A es regular si y sólo si det(A) 6= 0. En concreto, se verifica:
Para terminar añadimos un resultado que nos será util en los temas siguientes:
Teorema. 3.2 Una matriz cuadrada, triangular inferior (superior) con diagonal unidad, es regular
y su matriz inversa es una matriz del mismo tipo.
TEORÍA DE ÁLGEBRA: Tema 5. DIPLOMATURA DE ESTADÍSTICA 1
a1 x1 + · · · + an xn = b
La matriz A = (aij ) ∈ Mm×n se denomina matriz de coeficientes del sistema (S). La matriz
a11 . . . a1n b1
(A|b) = ... .. .. ∈ M
... . . m×(n+1)
am1 . . . amn bm
(S) : Ax = b.
1. L0 6= ∅.
2. L0 es una variedad lineal de Rn
3. Si a ∈ L, L = a + L0
∀ a ∈ Rn , Aa = b ⇐⇒ A0 a = b0 .
Definición. 1.5 Un sistema (S) : Ax = b se dice triangular superior (resp. inferior) si su matriz
de coeficientes, A, es triangular superior (resp. inferior).
TEORÍA DE ÁLGEBRA: Tema 5. DIPLOMATURA DE ESTADÍSTICA 2
• Intercambiamos 2 ecuaciones.
• Multiplicamos una ecuación por un número α 6= 0.
• Sumamos a una ecuación otra multiplicada por α.
Este último corolario es la base del método de Gauss para resolver sistemas de ecuaciones lineales,
que describiremos un poco más adelante.
det(A) 6= 0.
Este teorema proporciona un método, la llamada regla de Cramer, para resolver un sistema de
ecuaciones cuadrado compatible. Sin embargo, este método no resulta conveniente en la práctica,
debido al excesivo número de operaciones que requiere. Debido a ello, suele utilizarse el Método de
Gauss que consiste en lo siguiente:
Dada A ∈ Mn regular y b∈ Rn , podemos encontar una matriz P ∈ Mn regular, producto de
transformaciones elementales por filas, tal que
T = PA
Número de operaciones
Utilizaremos las conocidas fórmulas (que pueden demostrarse por inducción):
n n
X n(n + 1) X n(n + 1)(2n + 1)
i= , i2 =
i=1
2 i=1
6
• Método de Gauss
1. Triangularizar:
Si suponemos que hemos triangularizado hasta la fila i, podemos suponer que aii 6= 0,
pues si no intercambiamos dos filas que no supone ninguna operación. Para anular ai+1i
tenemos que realizar fi+1 − aai+1i
ii
fi , llamando fi a la fila i-ésima, lo que supone 1 división
y n − i + 1 multiplicaciones (quedan n − (i − 1) elementos en la fila i de la matriz del
sistema, pero hay que descontar el de ai+1i que sabemos que sale 0 y sumar el del término
independiente, o sea en total n − i + 1) y n − i + 1 restas; y eso hay que hacerlo en n − i
filas, luego quedan en total 2(n − i + 1)(n − i) + (n − i) operaciones (el primer sumando
corresponde a las multiplicaciones y restas y el segundo a las divisiones). Por tanto,
sumando las correspondientes a las n filas:
n
X n
X n
X n
X
[2(n − i + 1)(n − i) + (n − i)] = (n − i) [2(n − i) + 3] = 2 (n − i)2 + (n − i) =
i=1 i=1 i=1 i=1
Luego para resolver el sistema por el método de Gauss el número de operaciones a realizar es:
4n3 + 3n2 − 7n 4n3 + 9n2 − 7n
+ n2 =
6 6
• Regla de Cramer
Tenemos que calcular n + 1 determinantes.
1. Calculando los determinantes por σ (−1)σ a1σ(1) . . . anσ(n) tenemos que realizar n − 1
P
multiplicaciones y eso n! veces y sumar los n! sumandos, luego para el cálculo de cada
determinante necesitamos n!(n − 1) + (n! − 1) operaciones y eso para n + 1 determinantes,
y luego realizar las n divisiones, por tanto tenemos:
= (n + 1)!(n − 1 + 1) − 1 = (n + 1)!n − 1
2. Usando eliminación gaussiana para calcular cada determinante, es decir, triangularizando
cada determinante:
Suponiendo que se ha triangularizado hasta la fila i, tenemos que calcular fi+1 − aai+1i
ii
fi ,
luego tenemos que hacer 1 división, n − i multiplicaciones y n − i restas y eso en n − i
filas, luego nos queda:
n
X 4n3 − 3n2 − n
2(n − i)2 + (n − i) =
i=1
6
TEORÍA DE ÁLGEBRA: Tema 5. DIPLOMATURA DE ESTADÍSTICA 4
Nota. 2.3 Por tanto: En términos del número de operaciones que cada método requiere para re-
solver un sistema cuadrado de orden n, el método de Gauss resulta ser mucho más eficiente que
la regla de Cramer. De manera aproximada, el método de Gauss requiere, aproximadamente, 32 n3
operaciones mientras que la regla de Cramer exige, también de manera aproximada y suponiendo
que los determinantes se calculan mediante eliminación gaussiana, 32 n4 .
• El espacio fila de A, F (A), es la variedad lineal de Rn generada por las filas de A. F (A) =
{xt A : x ∈ Rm } o bien escritos por columnas como F (A) = {At x : x ∈ Rm }.
• El espacio columna de A es la v. l. de Rm , generada por las columnas de A. C(A) = {Ax :
x ∈ Rn }.
• El espacio nulo de A se define como N (A) = {u ∈ Rn : Au = 0}.
Proposición. 2.6 Dada A ∈ Mm×n , F (A), C(A) y N (A) son variedades lineales.
Proposición. 2.7 1. Si A y B son equivalentes por filas, entonces F (A) = F (B) y N (A) =
N (B).
2. Si A y B son equivalentes por columnas C(A) = C(B)
Nota. 2.10 Como consecuencia del teorema de Rouché-Frobenius, dado el sistema (S) : Ax = b,
con A ∈ Mm×n y b ∈ Rm , podemos asegurar que:
ai = (a1i , . . . , ani ),
entonces,
x1 a11 a1r λ1 a11 + ··· λr a1r
x2 a21 a2r λ1 a21 + ··· λr a2r
= λ1 + · · · + λr = .
.. .. .. .. ..
. . . . .
xn an1 anr λ1 an1 + · · · λr anr
2) Ecuaciones implı́citas:
Continuemos con la variedad W y su base B consideradas anteriormente. Las ecs. paramétricas
de W dadas por (1), pueden ser escritas como un S. E. L.
(E) : Aλ = x,
Sea P ∈ Mn regular tal que P A es triangular superior. Puesto que r(A) = r, tenemos
Tr
PA =
Θ
siendo Tr ∈ Mr regular. Si descomponemos P en dos bloques,
Pr Pr x
Px = x= .
Pn−r Pn−r x
Por tanto, multiplicando por bloques:
Tr Pr x
P · (A|x) = (P A|P x) =
Θ Pn−r x
En consecuencia,
r((A|x)) = r(A) = r ⇐⇒ Pn−r x = 0.
Lo que nos da como ecuaciones implı́citas de W el S. E. L.:
Pn−r x = 0.
Nota. 3.2 Al igual que antes las ecuaciones implı́citas de W NO son únicas. Además, si
dim(W ) = r entonces W ⊆ Rn tiene n − r ecs. implı́citas linealmente independientes.
Proposición. 4.5 Dada L ⊆ Rn , una variedad lineal, existe una variedad L0 ⊆ Rn tal que:
Rn = L ⊕ L0 .
Dicha variedad L0 se denomina v. l. complementaria de L.
entonces
k)
1 ... 0 0 ... 0
.. . . .. .. .. ..
. . . . . .
0 ... 1 0 ... 0
F (k)
=
0 ... 0 1 ... 0
(k)
0 ... 0 mk+1 ... 0
.. . . .. .. .. ..
. . . . . .
(k)
0 ... 0 mn ... 1
TEORÍA DE ÁLGEBRA: Tema 6. DIPLOMATURA DE ESTADÍSTICA 2
Teorema. 1.2 Sea A una matriz cuadrada regular. Si existe la descomposición LR de A entonces
es única.
Nota. 1.3 Dado un sistema de ecuaciones lineales (S) : Ax = b, si la matriz A posee factorización
LR entonces podemos resolverlo del siguiente modo:
1) Calculamos la factorización LR de A.
2) Resolvemos el sistema Ly = b.
3) Una vez obtenida la solución y, resolvemos el sistema Rx = y.
1) Existe la descomposición LR de A.
2) det(Ak ) 6= 0, ∀k = 1, . . . , n.
Definición. 1.6 Una matriz A ∈ Mn simétrica se denomina definida positiva (resp. semidefinida
positiva) si:
∀x ∈ Rn , x 6= 0, xt Ax > 0 (resp. xt Ax ≥ 0).
1) A es definida positiva.
2) det(Ak ) > 0, ∀k = 1, . . . , n.
Nota. 1.8 De paso hemos demostrado que A simétrica es definida positiva si y solo si todos los
pivotes (sin intercambio de filas) son mayores que 0.
r1k = a1k , ∀k = 1, . . . , n.
TEORÍA DE ÁLGEBRA: Tema 6. DIPLOMATURA DE ESTADÍSTICA 4
2 Factorización de Cholesky
Definición. 2.1 Diremos que una matriz A ∈ Mn , simétrica, posee factorización de Cholesky si
existe una matriz B ∈ Mn , triangular inferior con elementos positivos en la diagonal, tal que
A = BB t .
1) Sólo pueden representarse una cantidad finita de números reales (de hecho, sólo podemos
representar números racionales).
2) Hay números que no pueden ser representados de manera exacta, con los consiguientes prob-
lemas a la hora de realizar cálculos de manera efectiva.
Para evitar este tipo de problemas suele aumentarse, si es posible, el tamaño de la mantisa, o
emplear el redondeo a una cantidad fija de dı́gitos en la mantisa, a la hora de almacenar números
en la memoria. Una forma de redondear a t dı́gitos es la siguiente:
Dado un número real N con más de t dı́gitos, si el dı́gito t + 1 de N es 5, 6, 7, 8 ó 9, se aumenta
el dı́gito t en una unidad y se desprecian los restantes, a partir de t. Si el dı́gito t + 1 es 0, 1, 2, 3 ó
4 despreciamos todos los dı́gitos a partir de t.
Este modo de proceder provoca algunos resultados indeseados cuando se realiza una gran cantidad
de operaciones, ya que los errores de redondeo se acumulan alejando mucho el resultado final del
que se habrı́a obtenido si los cáculos hubiesen sido exactos. Como ejemplo consideremos el sistema:
x1 − x2 = 0
(S) :
0.01x1 + x2 = 1
x1 = x2 = 1
la cual es una solución relativamente aceptable. Sin embargo, intercambiando las ecuaciones de (S),
obtendrı́amos el sistema:
0.01x1 + x2 = 1
x1 − x2 = 0
y, al resolverlo utilizando de nuevo el método de Gauss, halları́amos como solución
x1 = 0 x2 = 1
que está bastante lejos de la solución exacta. La clave de esta fuerte diferencia se encuentra en que
al resolver el segundo sistema hemos utilizado un pivote, 0.01, muy pequeño.
TEORÍA DE ÁLGEBRA: Tema 6. DIPLOMATURA DE ESTADÍSTICA 6
a) Pivote parcial: Se trata de aplicar el método de Gauss eligiendo como pivote, en cada etapa,
el elemento que posee mayor valor absoluto de entre los que se encuentran bajo la diagonal en
la correspondiente colummna. Esto obliga en general a realizar intercambios de filas.
b) Pivote total: Se trata de elegir como pivote, en cada etapa k, el elemento de mayor valor
absoluto de entre los que se encuentran en la submatriz determinada por la intersección de las
k últimas filas y las k últimas columnas. En consecuencia, debemos realizar intercambios de
filas y de columnas.
Los siguientes resultados nos proporcionan la base teórica necesaria para estos métodos:
LRx = P b.
Nota. 4.4 Dado el sistema (S) : Ax = b, si P AQ = LR podemos resolverlo del siguiente modo:
1) Resolvemos LRy = P b.
2) Una vez obtenida y calcular x = Qy.
Ax = b ⇐⇒ P Ax = P b ⇐⇒ P AQy = P b.
TEORÍA DE ÁLGEBRA I: Tema 4. DIPLOMATURA DE ESTADÍSTICA 1
Rn = { (a1 , . . . , an ) : ai ∈ R, i = 1, . . . , n}.
Notaremos los elementos de Rn por a, b, c, etc. y los denominaremos vectores. Además dado
a = (a1 , . . . , an ), para cada i = 1, . . . , n, el número ai se denominará componente i-ésima de a.
a=b ⇐⇒ ai = bi ∀ i = 1, . . . , n.
En particular, identificaremos cada vector a ∈ Rn , con una matriz columna (de orden n × 1).
a) Propiedad asociativa:
a + (b + c) = (a + b) + c.
b) Prop. conmutativa:
a + b = b + a.
0 + a = a + 0 = a.
(−a) + a = a + (−a) = 0.
αa = (αa1 , . . . , αan ).
1. (α + β)a = αa + βa
2. α(a + b) = αa + αb
3. α(βa) = (αβ)a
4. 1a = a
TEORÍA DE ÁLGEBRA I: Tema 4. DIPLOMATURA DE ESTADÍSTICA 2
1. 0a = 0 y α0 = 0
2. (−1)a = −a
3. αa = 0 ⇒ (α = 0 ó a = 0)
4. αa = βa y a 6= 0 ⇒ α = β
5. αa = αb y α 6= 0 =⇒ a=b
6. α(−a) = −(αa) = (−α)a
2 Dependencia lineal
Definición. 2.1 Dados a1 , . . . , ar ∈ Rn una combinación lineal de a1 , . . . , ar es un vector del tipo:
α1 a1 + · · · + αr ar
para ciertos α1 , . . . , αr ∈ R.
λ1 a1 + · · · + λr ar = 0 =⇒ λ1 = 0, . . . , λr = 0.
H es l. d. (o l. i.) ⇐⇒ H 0 es l. d. (o l. i.).
TEORÍA DE ÁLGEBRA I: Tema 4. DIPLOMATURA DE ESTADÍSTICA 3
b) Fijados i, j = 1, . . . , r, i 6= j si
entonces
H es l. d. (o l. i.) ⇐⇒ H 00 es l. d. (o l. i.).
Definición. 2.6 Diremos que H = {a1 , . . . , ar } es escalonado si la matriz cuyas filas son a1 , . . . , ar
es escalonada por filas.
Proposición. 2.7 Si H = {a1 , . . . , ar } es escalonado y todos los vectores son distintos de 0, en-
tonces los vectores a1 , . . . , ar son linealmente independientes.
1) ∀ x, y ∈ L, x − y ∈ L.
2) ∀ α ∈ R, ∀x ∈ Rn , αx ∈ L.
1) 0 ∈ L.
2) ∀ x ∈ L, −x ∈ L.
3) ∀ x, y ∈ L, x + y ∈ L.
4) ∀ α, β ∈ R, ∀ x, y ∈ L, αx + βy ∈ L.
L(H) = { α1 a1 + · · · + αr ar : α1 , . . . , αr ∈ R, a1 , . . . , ar ∈ H, r ∈ N},
es decir, L(H) es el conjunto formado por todas las posibles combinaciones lineales de elementos de
H. Por definición, si H = ∅ entonces L(H) = {0}.
1) H ⊆ L(H).
2) Si H ⊆ F entonces L(H) ⊆ L(F ).
3) L(L(H)) = L(H).
Definición. 3.7 Sea W ⊆ Rn una variedad lineal y H ⊆ W tal que L(H) = W . Diremos entonces
que H genera W , o que H es un conjunto de generadores de W .
1) B es linealmente independiente.
2) L(B) = W .
(i (i
1) bi ∈ L({b1 , . . . , x, . . . , br }), y por tanto L({b1 , . . . , x, . . . , br }) = L({b1 , . . . , br }).
(i
2) {b1 , . . . , x, . . . , br } es linealmente independiente.
Corolario. 3.14 Sea V ⊆ Rn una variedad lineal y B = {u1 , . . . , um } una base de V . Se verifica:
Teorema. 3.16 Toda variedad lineal de Rn , no trivial, es decir, distinta de {0}, posee una base
con m ≤ n elementos.
Dado que todas las bases de una variedad lineal tienen el mismo número de elementos podemos
dar la siguiente
Lema. 3.18 Sea W ⊆ Rn una variedad lineal y B = {u1 , . . . , um } una base de W . Entonces, dado
v ∈ W , existen unos únicos α1 , . . . , αm ∈ Rm tales que
m
X
v= αi ui .
i=1
Definición. 3.19 Sea W ⊆ Rn una variedad lineal y B = {u1 , . . . , um } una base de W . Dado
v ∈ W llamaremos coordenadas de v respecto de B al único elemento vB = (α1 , . . . , αm ) ∈ Rm tal
que
Xm
v= αi ui .
i=1
1) 0B = (0, . . . , 0) ∈ Rm .
2) ∀ v ∈ W, ∀ α ∈ R, (αv)B = αvB .
3) ∀ v, w ∈ W, (v + w)B = vB + wB .
4 Cambio de base
Sea L ⊆ Rn una v. l. y B1 = {u1 , . . . , um }, B2 = {v1 , . . . , vm } dos bases de L. Entonces, dado
x ∈ L existen (α1 , . . . , αm ), (β1 , . . . , βm ) ∈ Rm tales que:
Sin embargo, ¿qué relación existe entre xB1 y xB2 ? Para resolver esta cuestión, expresamos los
vectores de una de las bases, por ejemplo B2 , como combinación lineal de los vectores de la otra
base, B1 , de este modo, para cada j = 1, . . . , m,
m
X
vj = pij ui , es decir, (vj )B1 = (p1j , . . . , pmj ).
i=1
Sea P = (pij ) ∈ Mm la matriz que se obtiene colocando por columnas las coordenadas de los
vectores de B2 respecto de B1 , esto es,
Puesto que las coordenadas de un vector respecto de una base son únicas resulta
m
X
∀i = 1, . . . , m, αi = pij βj .
j=1
Matricialmente,
∀x ∈ L, xB1 = P xB2 .
5 Rango
Definición. 5.1 Dado H = {a1 , . . . , ar } ⊆ Rn , llamamos rango de H, rang(H), al número máximo
de vectores linealmente independientes contenidos en H.
• El espacio fila de A, F (A), es la variedad lineal de Rn generada por las filas de A. F (A) =
{xt A : x ∈ Rm } o bien escritos por columnas como F (A) = {At x : x ∈ Rm }.
a) Definimos el rango por filas de A como el rango del subconjunto de Rn formado por las filas
de A, consideradas como vectores de Rn , es decir rf (A) = dim(F (A)).
b) Definimos el rango por columnas de A como el rango del subconjunto de Rm formado por las
columnas de A, consideradas como vectores de Rm , es decir rc (A) = dim(C(A)).
Definición. 5.6 Llamaremos menor de una matriz A al determinante de cualquiera de sus subma-
trices cuadradas.
Definición. 5.7 Definimos el rango por menores de una matriz como el mayor de los órdenes de
sus menores no nulos y lo denotaremos por rm (A).
Proposición. 5.9 1. Si B es equivalente por filas a A, entonces F (B) = F (A) y por tanto
rf (B) = rf (A). Si B es escalonada por filas, rf (B) = número de filas no nulas de B.
2. Si B es equivalente por columnas a A, entonces C(B) = C(A) y por tanto rc (B) = rc (A). Si
B es escalonada por columnas, rc (B) = número de columnas no nulas de B.
Proposición. 5.10 Si se hace una transformación elemental (por filas o columnas) en A obteniendo
B, entonces rm (B) = rm (A).
Proposición. 5.11 Si A es escalonada por filas (columnas), entonces rm (A) =número de filas
(columnas) no nulas de A.
Definición. 5.15 Se define el rango de una matriz A, como su rango por filas, o su rango por
columnas o su rango por menores. Dicho número se denotará por r(A).
a) Si A ∈ Mn , entonces
A es regular ⇐⇒ r(A) = n.
Proposición. 5.18 Si en una matriz A un menor de orden r es distinto de cero y los orlados con la
fila p y restantes columnas son cero, entonces la fila p es combinación lineal de las filas que entran
en el menor.
TEORÍA DE ÁLGEBRA II: Tema 1. DIPLOMATURA DE ESTADÍSTICA 1
∀x ∈ Rn , id(x) = x.
∀x ∈ Rn , θ(x) = 0.
Sin embargo, los ejemplos mas caracterı́sticos se obtienen a partir del siguiente
∀x ∈ Rn , f (x) = Ax,
es lineal.
1) ∀x ∈ Rn , f (−x) = −f (x).
2) ∀x, y ∈ Rn , f (x − y) = f (x) − f (y).
3) f (0) = 0.
4) Dados x1 , . . . , xr ∈ Rn y α1 , . . . , αr ∈ R se verifica:
Xr r
X
f( αi xi ) = αi f (xi ).
i=1 i=1
Por tanto,
Xn n
X
f (x) = f ( αi ai ) = αi f (ai ).
i=1 i=1
Es decir, el valor de f sobre un vector cualquiera, x ∈ Rn , queda determinado una vez que los valores
de f sobre una base de Rn son conocidos. De hecho tenemos,
∀i = 1, . . . , n, f (ai ) = yi .
f (L1 ) = {f (x) ∈ Rm : x ∈ L1 }
f −1 (L2 ) = {x ∈ Rn : f (x) ∈ L2 }
1) Si {x1 , . . . , xp } es l. d. entonces
{f (x1 ), . . . , f (xp )} es l. d.
{x1 , . . . , xp } es l.i.
TEORÍA DE ÁLGEBRA II: Tema 1. DIPLOMATURA DE ESTADÍSTICA 3
{f (x1 ), . . . , f (xp )}
{f (x1 ), . . . , f (xp )}
f es inyectiva ⇐⇒ N (f ) = {0}
f es sobreyectiva ⇐⇒ Im(f ) = Rm
{f (x1 ), . . . , f (xp )}
generan Rm .
{f (x1 ), . . . , f (xp )}
son l.i.
2) Si {x1 , . . . , xp } ⊆ Rn es una base de L entonces,
{f (x1 ), . . . , f (xp )}
{f (x1 ), . . . , f (xn )}
es base de Im(f ).
En particular, n = m.
dim(N (f )) + dim(Im(f )) = n.
i) f es inyectiva ⇐⇒ rang(f ) = n.
ii) f es sobreyectiva ⇐⇒ rang(f ) = m.
1) f es biyectiva.
2) f es sobreyectiva.
3) f es inyectiva.
4) rang(f ) = n.
Entonces,
Xn
f (x) = f( αj aj )
j=1
n
X
= αj f (aj )
j=1
Xnm
X
= αj aij bi
j=1 i=1
Xm Xn
= αj aij bi .
i=1 j=1
Entonces,
(f (x))Bm = AxBn .
Podemos establecer, de este modo, el siguiente resultado:
TEORÍA DE ÁLGEBRA II: Tema 1. DIPLOMATURA DE ESTADÍSTICA 5
Teorema. 3.1 Sea f : Rn → Rm lineal, Bn una base de Rn y Bm una base de Rm . Entonces, existe
una única matriz A ∈ Mm×n tal que
∀x ∈ Rn , (f (x))Bm = AxBn .
1. [f + g, Bn , Bm ] = [f, Bn , Bm ] + [g, Bn , Bm ].
2. [αf, Bn , Bm ] = α[f, Bn , Bm ]
3. [h ◦ f, Bn , Bp ] = [h, Bm , Bp ][f, Bn , Bm ]
∀x ∈ Rn , f (x) = Ax.
[f, Cn , Cm ] = A.
Proposición. 3.5 Sea A ∈ Mn y f : Rn → Rn la aplicación lineal dada por f (x) = Ax. Son
equivalentes:
i) A es regular.
ii) f es un isomorfismo.
iii) r(A) = n.
4 Matrices semejantes
Dada f : Rn → Rn lineal (un endomorfismo) y dos bases de Rn ,
B = {b1 , . . . , bn } y C = {c1 , . . . , cn },
∀x ∈ Rn , xC = P xB .
y, por otra,
(f (x))C = P (f (x))B ,
luego, igualando, obtenemos
∀x ∈ Rn , P (f (x))B = A0 P xB ,
y de aquı́,
∀x ∈ Rn , (f (x))B = P −1 A0 P xB .
Hemos probado, ası́, que
[f, B] = A = P −1 A0 P = P −1 [f, C]P.
a) A es semejante a B.
b) Existe un endomorfismo f : Rn → Rn y dos bases, B y C, de Rn , tales que:
a) A + B es idempotente si y sólo si AB + BA = θ.
b) Si AB = BA entonces AB es idempotente.
(El recı́proco no es cierto, en general).
c) I − A es idempotente.
At A = AAt = I.
Proposición. 5.6 Una matriz A ∈ Mn es ortogonal si y sólo si sus filas (o columnas) forman una
base ortonormal de Rn .
TEORÍA DE ÁLGEBRA II: Tema 1. DIPLOMATURA DE ESTADÍSTICA 7
6 Aplicaciones ortogonales
Definición. 6.1 Dada f : Rn → Rm , diremos que f es ortogonal si:
∀x ∈ Rn , f (x) = Ax,
es ortogonal.
1) ∀x ∈ Rn , kf (x)k = kxk.
2) Si x, y ∈ Rn son ortogonales, entonces f (x) y f (y) son ortogonales.
3) Si {u1 , . . . , uk } ⊆ Rn es un sistema ortogonal (resp. ortonormal) entonces
{f (u1 ), . . . , f (uk )} ⊆ Rm ,
1) f es ortogonal.
2) ∀x ∈ Rn , kf (x)k = kxk.
3) Existe una base, B = {u1 , . . . , un }, de Rn , ortonormal, tal que
{f (u1 ), . . . , f (un )} ⊆ Rm
es un sistema ortonormal.
{f (u1 ), . . . , f (un )} ⊆ Rm
es un sistema ortonormal.
∀i = 1, . . . , n, f (ui ) = vi .
Naturalmente, puesto que toda aplicación ortogonal, de Rn en Rm , es lineal, dada una base
de Rn y otra de Rm , podemos asociar a dicha aplicación su matriz respecto de estas bases. Sin
embargo, cuando se trata de un endomorfismo, si la base fijada es ortonormal, podemos obtener
algunas propiedades más.
Sea f : Rn → Rn una aplicación ortogonal y B una B.O.N. de Rn . Sea A = [f, B] ∈ Mn , es
decir,
∀x ∈ Rn , (f (x))B = AxB .
Entonces, dados ∀x, y ∈ Rn ,
Además,
f (x) · f (y) = x · y = (xB )t · yB .
Por tanto, igualando, obtenemos:
Rn = L1 ⊕ L2 .
Entonces,
∀ v ∈ Rn , ∃!v1 ∈ L1 , ∃!v2 ∈ L2 , v = v1 + v2 .
Definimos la proyección sobre L1 , paralela a L2 , como el endomorfismo, f , de Rn , definido, para
cada v ∈ Rn , por
f (v) = v1 .
1) f es lineal.
2) f 2 = f ◦ f = f .
3) Im(f ) = L1 y N (f ) = L2 .
TEORÍA DE ÁLGEBRA II: Tema 1. DIPLOMATURA DE ESTADÍSTICA 9
Definición. 7.4 Sea A ∈ Mn . Diremos que A es una matriz de proyección si y sólo si existe una
base B de Rn y una proyección f tal que A = [f, B].
Definición. 7.7 Diremos que una aplicación lineal f : Rn → Rn es una proyección ortogonal, si
existe una v.l. L ⊆ Rn tal que f es la proyección sobre L paralela a L⊥ .
Proposición. 7.9 Sea f : Rn → Rn lineal, B una B.O.N. de Rn y sea A = [f, B]. Son equivalentes:
1) u · u ≥ 0
2) u · u = 0 ⇐⇒ u=0
3) u · v = v · u
4) u · (v + w) = u · v + u · w
5) u · (αv) = α(u · v)
1) kuk ≥ 0
2) kuk = 0 ⇐⇒ u=0
3) kαuk = |α|kuk
1
4) u es un vector unitario, es decir, de norma 1.
kuk
2 Ortogonalidad
Definición. 2.1 Dados u 6= 0, v 6= 0 ∈ Rn , definimos el ángulo entre u y v como el número
\
α = (u, v) dado por:
u·v
cos α =
kukkvk
\ π
u⊥v ⇐⇒ (u, v) = .
2
∀i, j = 1, . . . r, i 6= j, ai · aj = 0.
En otras palabras, el conjunto dado es ortonormal si es ortogonal y todos sus elementos tienen norma
1.
Nota. 3.4 La proposición es válida también para sistemas ortogonales, con tal de ser todos los
vectores distintos de 0.
Definición. 3.5 Sea W ⊆ Rn una v.l. y B = {u1 , . . . , ur } una base de W . Diremos que B es una
base ortogonal de W , abreviadamente B.O.G., si B es un sistema ortogonal. Análogamente, diremos
que B una base ortonormal de W , abreviado B.O.N., si es un sistema ortonormal.
Proposición. 3.6 Sea W ⊆ Rn una v.l. y B = {u1 , . . . , ur } una base de W . Sea A = (aij ) ∈ Mr
la matriz simétrica definida por
∀i, j = 1, . . . r, aij = ui · uj .
A continuación veremos un método para obtener una base ortonormal a partir de una base
cualquiera.
Método de ortonormalización de Gram-Schmidt:
Sea W ⊆ Rn una v.l. y B = {a1 , . . . , ar } una base de W . El método de Gram-Schmidt construye
una B.O.N. de W , B 0 = {u1 , . . . , ur }, tal que
L({a1 }) = L({u1 })
L({a1 , a2 }) = L({u1 , u2 })
..
.
L({a1 , . . . , ar }) = L({u1 , . . . , ur }).
Proposición. 3.7 Dada W ⊆ Rn una variedad lineal y una base {a1 , . . . , ar }, construimos una
base ortogonal {z1 , . . . , zr }, tal que L(a1 ) = L(z1 ), . . . , L(a1 , . . . , ai ) = L(z1 , . . . , zi )
At A = AAt = I.
{a1 , . . . , an }
Proposición. 4.3 Si A ∈ Mn es una matriz ortogonal sus filas forman una base ortonormal de Rn .
xB = AxB0 .
Entonces, A es ortogonal.
∀x ∈ W, ∀y ∈ W 0 , x · y = 0.
TEORÍA DE ÁLGEBRA: Tema 7. DIPLOMATURA DE ESTADÍSTICA 4
1) Si x ∈ Rn y W = L({a1 , . . . , am }) ⊆ Rn entonces,
{x} ⊥ W ⇐⇒ ∀i = 1, . . . , m, x · ai = 0.
2) Si H, H 0 ⊆ Rn , H ⊥ H0 ⇐⇒ L(H) ⊥ L(H 0 ).
3) Si L y W son v.l. de Rn ,
L⊥W =⇒ L ∩ W = {0}.
H ⊥ = {x ∈ Rn : ∀y ∈ H, x · y = 0}.
1) H ⊥ es una v.l. de Rn .
2) H ⊥ H ⊥ y H ⊆ (H ⊥ )⊥ .
3) H ⊥ es el mayor subespacio de Rn ortogonal a H.
4) H ⊆ G =⇒ G⊥ ⊆ H ⊥ .
Rn = L ⊕ L⊥ .
Proposición. 5.6 Dada una v.l. L ⊆ Rn , L⊥ es la única variedad lineal de Rn tal que:
Rn = L ⊕ L⊥ y L ⊥ L⊥ .
6 Proyección ortogonal
Definición. 6.1 Dada L ⊆ Rn v.l. y x ∈ Rn , puesto que Rn = L ⊕ L⊥ , existen unos únicos x1 ∈ L
y x2 ∈ L⊥ , tales que
x = x1 + x2 .
x1 se denomina proyección ortogonal de x sobre L.
2) ∀y ∈ L, x · y = x1 · y.
3) ∀y ∈ L, kx − yk ≥ kx − x1 k.
La igualdad se da si sólo si y = x1 .
TEORÍA DE ÁLGEBRA: Tema 7. DIPLOMATURA DE ESTADÍSTICA 5
Nota. 6.3 Dados x ∈ Rn y una v.l. L ⊆ Rn , sea x1 la proyección ortogonal de x sobre L, entonces,
para todo y ∈ L tenemos
dist(x, y) = kx − yk ≥ kx − x1 k = dist(x, x1 ),
Nota. 6.5 Acabamos de probar que la proyección ortogonal es el vector (es único) que da la dis-
tancia mı́nima.
7 Pseudosoluciones
Definición. 7.1 Dado un S. E. L. (S) : Ax = b, con A ∈ Mm×n , diremos que x0 ∈ Rn es una
pseudosolución de (S) si:
∀u ∈ Rn , kAu − bk ≥ kAx0 − bk.
Definición. 7.3 Dado (S) : Ax = b, llamaremos sistema normal asociado a (S), al sistema:
(S 0 ) : At Ax = At b.
u0 es pseudosolución ⇐⇒ At Au0 = At b.
Puesto que las pseudosoluciones de un sistema son la soluciones del sistema normal asociado
(que siempre es compatible) en general, pueden existir más de una pseudosolución. Los siguientes
resultados aclaran cuando es ası́.
• Si r(A) = n entonces (S 0 ) es compatible determinado y, por tanto, (S) posee una única
pseudosolución
x0 = (At A)−1 At b.
• Si r(A) < n entonces (S 0 ) es compatible indeterminado y, por tanto, existen infinitas pseu-
dosoluciones.
De este modo, en ciertas ocasiones existen infinitas pseudosoluciones para un S.E.L. dado, por
lo que podemos preguntarnos cual de ellas es, en cierto sentido, la mejor. A continuación veremos
un criterio para elegir dicha pseudosolución.
Definición. 7.7 Dado (S) : Ax = b con A ∈ Mm×n llamaremos pseudosolución óptima de (S) a
la pseudosolución, x0 , de norma mı́nima, es decir,
kx0 k = mı́nimo({kxk : At Ax = At b}).
Teorema. 7.9 La pseudosolución óptima (es decir, de norma mı́nima) del sistema (S) : Ax = b, es
la única psedosolución x0 de (S) tal que
x0 ∈ F (A).
Más aún, x0 es la proyección ortogonal sobre F (A) de una pseudosolución cualquiera de (S).
ati + b
sea lo mas parecido posible (en algún sentido) al valor yi . Una forma de proceder es la siguiente:
Consideremos el S.E.L.
y1 = t1 a + b
y2
= t2 a + b
(S) : ..
.
ym = tm a + b
Matricialmente,
t1 1 y1
t2 1
a
y2
(S) : =
.. .. ..
b
. . .
tm 1 ym
donde a y b son incognitas.
Normalmente (S) será incompatible y, por tanto, deberemos conformarnos con sus pseudosolu-
ciones, esto es, las soluciones del sistema normal asociado
Xm m
X Xm
t2i ti ti y i
a
0 i=1 i=1 i=1
(S ) : X = X
m m
b
ti m yi
i=1 i=1
es mı́nimo.
Geométricamente, y = a0 t+b0 nos da la recta que mejor se ajusta a los puntos (t1 , y1 ), . . . , (tm , ym ).
TEORÍA DE ÁLGEBRA: Tema 7. DIPLOMATURA DE ESTADÍSTICA 8
Nota. 9.1 El ajuste de datos por el método de mı́nimos cuadrados no se restringe sólo a rectas,
puesto que, en general, podemos ajustar datos por mı́nimos cuadrados utilizando para ello parábolas,
polinomios de grado fijo u otro tipo de funciones. Por ejemplo, si pretendemos ajustar los datos