You are on page 1of 41

ANLISIS NUMRICO

Prof: Pablo Caviezel

PRINCIPIOS DE AJUSTAMIENTO

AUTOR : PABLO CAVIEZEL

Resumen: Se trata el tema de Ajustamiento de datos a una funcin, con una variable
explicativa, detallando, entre otros, el mtodo mecnico de Whittaker, el mtodo
analtico de los mnimos cuadrados, y el mtodo de Programacin Lineal. Para ello, se
realiza una introduccin a las formas cuadrticas, y al clculo de diferencias finitas. Este
tema pertenece a la asignatura Anlisis Numrico, segn el esquema curricular de esta
facultad, pero distintas secciones de este trabajo pueden servir para las asignaturas:
Matemtica para Economistas, Econometra, y Biometra Actuarial.

Facultad de Ciencias Econmicas


Universidad de Buenos Aires

1. INTRODUCCIN
1.1 MATRICES SIMTRICAS
Si en la matriz
a11 a12
a
21 a 22
A = a31 a 32

.
.
a n1 a n 2

... a1n
... a 2 n
... a3n

.
.
... a nn

a13
a 23
a33
.
a n3

se verifica que aij = a ji para todo i y j , entonces A es una matriz simtrica. Si, en
particular, aij (i j) entonces se dice que A es una matriz simtrica y real.
Enunciaremos algunas propiedades de las matrices simtricas, que sern utilizadas en
este trabajo

PROPIEDADES
El producto entre una matriz y su traspuesta, da como resultado una matriz simtrica

Demostracin:
H) A m x n
T) ( A AT ) T = ( A AT )
D) Partimos de
= ( A AT ) T
aplicamos propiedad de transposicin:
= ( AT ) T AT la traspuesta de una matriz traspuesta es la matriz inicial
= A AT

La suma de dos matrices simtricas da como resultado una matriz simtrica:


Demostracin:
H) A = AT
B = BT
T) A + B = ( A + B ) T
D) Partimos de ( A + B) T . Por propiedad de transposicin de una suma, resulta:
( A + B) T = AT + B T .Por hiptesis, podemos ver que:
( A + B) T = AT + B T = A + B con lo que queda demostrado.

Las matrices simtricas reales son siempre diagonalizables

1.2 FORMAS CUADRTICAS

Se llama forma a toda expresin polinomial en la que todos los trminos tienen el
mismo grado. Un caso particular, lo constituyen los polinomios homogneos de grado 2,
o formas cuadrticas.
Matricialmente, podemos expresar una forma cuadrtica de la siguiente manera:
a11
a
12
F = [x1 x 2 x3 . . . . . x n ] a13

.
a1n

a12

a13

a 22

a 23

a 23
.

a33
.

a2n

a3n

... a1n x1
... a 2 n x 2
... a3n x3 =

.
. ...
... a nn x n

a
i =1 j =1

ij

xi x j

aij = a ji

y, utilizando una notacin abreviada,


F = XT Q X
Donde:
X = Vector de incgnitas, dimensin n x 1
XT= Vector de incgnitas traspuesto. Dimensin: 1 x n
Q = Matriz asociada a la forma cuadrtica. Dimensin: n x n. Q es simtrica y real, de
forma tal que QT=Q
Los trminos de la forma aij xi x j donde i = j se denominan trminos cuadrados,
mientras que todos los trminos restantes reciben el nombre de trminos rectangulares
o productos en cruz.

1.2.1 FORMAS CUADRTICAS ESPECIALES

Si una forma cuadrtica tiene como matriz asociada una matriz diagonal, sta recibe el
nombre de forma cuadrtica diagonal. En este caso, la expresin polinmica carece de
trminos rectangulares.
F = XT W X

W = Matriz Diagonal

w1
0

F = [x1 x 2 x3 . . . . . x n ] 0

.
0

0
w2
0
.
0

0
0
w3
.
0

... 0 x1
... 0 x 2
... 0 x3 =

.
. ...
... wn x n

w x
i =1

Donde resulta ser F = w1 x12 + w2 x 22 + w3 x32 + ..... + wn x n2

2
i

Un caso particular resulta ser la forma cuadrtica que contiene como matriz asociada
una matriz diagonal. En este caso se obtiene una suma de cuadrados cuyo coeficiente
principal es el escalar que aparece en la matriz asociada, llammoslo:
F = XT E X
0 0 ...
0 0 ...

F = [x1 x 2 x3 . . . . . x n ] 0 0 ...

. . . .
0 0 0 ...

0 x1
0 x 2
n
0 x3 = xi2

i =1
. ...
x n

Podemos entonces escribir F = ( x12 + x 22 + x32 + ..... + x n2 )

Dentro de las formas cuadrticas cuya matriz asociada es diagonal, estn las formas
cuadrticas cuya matriz asociada es la identidad. stas, resultan ser una suma de
cuadrados mnicos. Veamos:
F = XT I X

, que generalmente se expresa como F= XT X

1
0

F = [x1 x 2 x3 . . . . . x n ]0

.
0

0
1
0
.
0

0
0
1
.
0

...
...
...
.
...

0 x1
x1

0 x 2
2
0 x3 = [x1 x 2 x3 . . . . . x n ] x3 =


. ...
...
x n
1 x n

x
i =1

2
i

Esta es la forma cuadrtica ms sencilla y que mayores bondades ofrece. En los anlisis
de regresin y, ms generalmente, los trabajos de ajustamiento, se hace necesario
trabajar con formas cuadrticas. Su tratamiento, en forma matricial, facilita muchos
clculos y permite mucha rapidez en la descripcin de los procesos. Como convencin,
hemos elegido representar los vectores en forma de columna, por lo que sus traspuestos
resultan ser vectores fila.

1.2.2 DERIVADAS
DIAGONAL.

PARCIALES

DE

UNA

FORMA

CUADRTICA

Veremos cmo expresar matricialmente las derivadas parciales de primer orden de una
forma cuadrtica. Para ello, partiremos de la forma cuadrtica ms sencilla, cuya matriz
asociada es la matriz identidad.
F = x12 + x 22 + x32 + ..... + x n2 = X T I X

Fcilmente se deduce que:


F
= 2x1
x1
F
= 2x 2
x 2
F
= 2x3
x3
F
= 2 xi
xi
derivadas parciales ser:

En general:

donde i = 1, 2, 3, ...... , n . El vector que representa esas

F
x
1 2 x1
x1
F

x
x 2 2 x 2
2
F = 2 x3 = 2 x3


x3 ...
...
... 2 x
x n
F n
x
n

Si llamamos al vector de derivadas parciales de primer orden DX, resulta ser


DX = 2X.

Si la matriz asociada es una matriz escalar, tambin se puede expresar en forma sencilla
el vector de derivadas parciales.
F = ( x12 + x 22 + x32 + ..... + x n2 ) = XT E X = X T X
F
= 2xi
xi
derivadas parciales ser:

En general:

donde i = 1, 2, 3, ...... , n . El vector que representa esas

F
x
1 2x1
x1
F

x
x 2 2x 2
2
F = 2x3 = 2 x3


x3 ...
...
... 2x
x n
n
F
x
n

En este caso, DX = 2 X = 2 E X

El caso ms general se presenta en la forma cuadrtica diagonal de la forma F = XT W


X
n

F = wi xi2 = w1 x12 + w2 x 22 + w3 x32 + ..... + wn x n2


i =1

En este caso, la derivada de F con respecto a cada variable independiente se puede


expresar como:
F
= 2 wi xi
xi
Matricialmente:
F
x
1 2 w1 x1
w1
F

0
x 2 2 w2 x 2

F = 2 w3 x3 = 2 0

x3 ...
.
... 2 w x
0
F n n
x
n

0
w2
0
.
0

0
0
w3
.
0

0 x1
... 0 x 2
... 0 x3 = 2 W X

.
. ...
... wn x n
...

Como conclusin podemos afirmar que:


n

Dada la forma cuadrtica diagonal F = wi xi2 = w1 x12 + w2 x 22 + w3 x32 + ..... + wn x n2 ,


i =1

cuya expresin matricial es F = XT W X, el vector de derivadas parciales DX se puede


escribir como: DX = 2 W X .

A continuacin veremos un ejemplo:

Ejemplo:
Considere:
v1
v
2
V= v3

.
v n

u1
u
2
U = u 3

.
u n

(Vector de dimensin n x 1)

w1
0

W= 0

.
0

0
w2

0
.

0
w3
.

(Vector de dimensin n x 1)

0
... 0
... 0

.
.
... wn
...

a) Escribir en forma desarrollada la forma (V U ) T W (V U )


b) Deducir el vector de derivadas parciales con respecto a vx
a) (V U ) T W (V U ) se puede escribir como:
n

w (v
x =1

u x ) 2 = w1 (v1 u1 ) 2 + w2 (v 2 u 2 ) 2 + w3 (v3 u 3 ) 2 + .... + wn (v n u n ) 2

b) DV = 2 W (V-U)

1.2.3 SIGNO DE UNA FORMA CUADRTICA

El signo de una forma cuadrtica se puede estudiar de distintas formas, entre ellas, se
puede completar cuadrados o se puede aplicar el mtodo de los menores principales. El
mtodo que se utilizar en este trabajo es el mtodo de los autovalores (races
caractersticas).
El estudio del signo de una forma cuadrtica equivale a estudiar el signo de la matriz
asociada. Esto se puede hacer a travs de sus autovalores.
Se llama autovalor, valor propio o raz caracterstica de una matriz cuadrada a todos
los escalares tales que: Av = v
Ejemplo: Hallar los autovalores de la matriz A
4 4
A=

1 4
Formamos la matriz caracterstica A - I

1 0 4
4 4
A - I =

=

0 1 1
1 4

4
4

Calculamos su determinante, llamado polinomio caracterstico:


A I =

4
1

4
= (4 ) 2 4
4

Construimos la ecuacin caracterstica, que es el polinomio caracterstico igualado a


cero.
(4 ) 2 4 = 0
Los resultados de esta ecuacin son los autovalores de la matriz A

1 = 2
2 = 6
El nmero de autovalores distintos de una matriz coincide con el rango
Las matrices simtricas con elementos reales tienen autovalores reales.
En toda matriz no singular, los inversos multiplicativos de una matriz son
autovalores de su inversa.
El producto de los autovalores de una matriz da como resultado el determinante de
la matriz.

Una matriz es:


DEFINIDA POSITIVA: S y slo s todos sus autovalores son positivos.
DEFINIDA NEGATIVA: S y slo s todos sus autovalores son negativos.

TEOREMA:
Si una matriz es definida positiva (negativa), entonces su inversa existe y es una matriz
definida positiva(negativa).
Corolario:
Si la forma F = XTQX es definida positiva (negativa), entonces la forma F = XT Q-1X
existe y es definida positiva (negativa).

1.3 EXPRESIN MATRICIAL DE LAS DIFERENCIAS FINITAS

Recordemos, antes de seguir adelante, al operador lineal diferencia finita ()


Definimos f ( x) = f ( x + h) f ( x)

Las diferencias sucesivas se definen como sigue:


2 f ( x) = [f ( x)]

3 f ( x) = 2 f ( x) = 2 [f ( x)]
...

n f ( x) = n 1 f ( x) = n 1 [f ( x)]

Propiedades:
1) [ f ( x) + g ( x)] = f ( x) + g ( x)
Demostracin:
[ f ( x ) + g ( x ) ] = [ f ( x + h ) + g ( x + h ) ] [ f ( x ) + g ( x ) ]
f ( x + h) + g ( x + h) f ( x ) g ( x )
f ( x + h) f ( x ) + g ( x + h) g ( x )
[ f ( x + h) f ( x)] + [g ( x + h) g ( x)]
f ( x) + g ( x)

2) [ f ( x)] = f ( x)

Demostracin:
[ f ( x)] = f ( x + h) f ( x)
[ f ( x + h) f ( x ) ]
f ( x)

Las propiedades 1) y 2) ponen de manifiesto que el operador diferencia finita es un


operador lineal. De manera que existe una transformacin lineal tal que a cada funcin
del espacio vectorial de salida le hace corresponder una funcin en el espacio de
llegada. El ncleo de esta transformacin lineal lo constituye el subespacio de funciones
de la forma f ( x) = k ( k ), ya que la diferencia de toda constante es igual a cero.
Analizando el ncleo de este operador, se ve fcilmente que la transformacin lineal no
constituye un isomorfismo, por no ser un monomorfismo.
Asociado al operador encontramos el operador desplazamiento (E), que se define
como:

E f ( x ) = f ( x + h)
E2 f ( x) = E [Ef ( x)] = f ( x + 2h)
E3 f ( x) = E E 2 f ( x) = E 2 [Ef ( x)] = f ( x + 3h)
...
En f ( x) = E E n i f ( x) = E n i [Ef ( x)] = f ( x + nh)

[
[

Propiedades del operador E


3) E [ f ( x) + g ( x)] = Ef ( x) + Eg ( x)
4) E [ f ( x)] = Ef ( x)

Ambas propiedades garantizan que E se trata, tambin, de un operador lineal; es decir,


existe una transformacin lineal que vincula cada funcin en un punto x, con su
desplazamiento. En este caso, el ncleo est solamente constituido por la funcin nula,
ya que E k = k .
Los operadores E y son conmutativos.

En virtud de que
f ( x) = f ( x + h) f ( x)

Ef ( x) = f ( x + h)

Si reemplazamos la segunda ecuacin en la primera, obtenemos:


f ( x) = Ef ( x) f ( x)
desaplicando operadores:
f ( x) = ( E 1) f ( x)
y, utilizando el mtodo de separacin de smbolos, deducimos que: E 1
Lo que implica que n ( E 1) n (1 + E ) n
Aplicando el desarrollo del Binomio de Newton obtenemos que:
n
n
n (1) n s E s
s =0 s

Si aplicamos ambos operadores a una funcin V(x) = Vx podemos calcular en forma


sencilla su diferencia de orden z. Elegimos h = 1.
z z

zV x = (1) z s E s V x =
s =0 s

z
z
v x + z 2 zv x + z 1 + v x + z
= (1) z v x + z (1) z 1 v x +1 + (1) z 2 v x + 2 + ......... +
2
z 2

Veamos como funciona el mtodo para z = 2


2 v x = (1) 2 v x + 2(1)1 v x +1 + (1) 0 v x + 2 = v x 2v x +1 + v x + 2

10

Si quisiramos expresar todas las diferencias segundas posibles con 6 argumentos:


v1 , v 2 , v3 ....v6 solamente podramos obtener, en virtud de la frmula, hasta, ya que de lo
contrario necesitaramos ms argumentos. Entonces:
2 v1 = v1 2v 2 + v3
2 v 2 = v 2 2v3 + v 4
2 v3 = v3 2v 4 + v5
2 v 4 = v 4 2v5 + v6

Matricialmente, podemos expresar esta idea de la siguiente forma:


2 V = k2 V
donde :

k2 es una matriz de dimensin 4 x 6, asociada a la diferencia segunda


V = Vector de dimensin 6 x 1

0
0
v1 1 2 1
2
0
v 2 = 0 1 2 1
2
v 3 0 0
1 2 1
2
0
1 2
v 4 0 0
2

0
0
0

v1
v
2
v3

v 4
v5

v6

En general, para n argumentos: v1 ; v 2 ; v3 ;....v n


z V = k z V

donde
z v1
z
v2
z
V = z v 3

...
z v
n z

vector de dimensin (n-z) x 1

11


z
(1)

0
kz =
0

.
.

z (1) z 1

z
(1) z 2
2

(1) z

z (1) z 1

(1) z

z
(1) z 2
2
z (1) z 1

(1) z

...

.
.
.
0

.
.
.
0

.
.
.
0

...
...
...
...

...

...

...

....

...

z
....
z

...
z 2
.
.
.
.
.
.
....
...

0
0

Dimensin: (n-z) x n
v1
v
2
V = v3

.
v n

dimensin: n x 1

Es propiedad de la matriz asociada k z que la suma de sus filas de cero, por propiedad de
nmeros combinatorios complementarios.
z

s =o

s (1)

z s

=0

2. INTERPOLACIN. AJUSTAMIENTO. CONCEPTOS.


2.1 INTERPOLACIN

Dado un conjunto finito de n +1 argumentos, con sus respectivas imgenes, definimos


interpolacin al proceso por el cual tratamos de encontrar una funcin que pase
exactamente por esos n +1 puntos. Generalmente se usan polinomios como funciones de
interpolacin, por varios motivos:
a) Su manejo algebraico es sencillo
b) Son continuos y derivables en todo su dominio. Sus derivadas son polinomios.
c) Su uso se justifica por el teorema de Weierstrass, que afirma que en un entorno de
una funcin, existe al menos un polinomio. Es decir: P(x) /
f ( x) P( x) f ( x) +
0
El polinomio de interpolacin es para un nmero finito de argumentos, es nico. La
demostracin es sencilla:
12

Dados n + 1 puntos distintos de la forma ( xi ; y i ) con i = 0, 1, 2, 3, ..... n , para encontrar


un polinomio que pase por esos puntos, basta con resolver un sistema n+1 de ecuaciones
con n+1 incgnitas. Se obtendr un polinomio con n + 1 coeficientes; es decir, de grado
n. A travs del estudio del determinante, se demuestra que este sistema es siempre
compatible determinado.
y = P ( x) = a n x n + a n 1 x n 1 + a n 2 x n 2 + ... + a 2 x 2 + a1 x + a 0
a n x0n + a n 1 x 0n 1 + a n 2 x 0n 2 + ... + a 2 x02 + a1 x0 + a 0 = y 0

2
n
n 1
n 2
a n x1 + a n 1 x1 + a n 2 x1 + ... + a 2 x1 + a1 x1 + a 0 = y1
2
n
n 1
n2
a n x 2 + a n 1 x 2 + a n 2 x 2 + ... + a 2 x 2 + a1 x 2 + a 0 = y 2

...

a n x nn1 + a n 1 x nn11 + a n 2 x nn12 + ... + a 2 x n2 2 + a1 x n 1 + a 0 = y n 1

a n x nn + a n 1 x nn 1 + a n 2 x nn 2 + ... + a 2 x n2 + a1 x n + a 0 = y n

Dado que las n +1 incgnitas del sistema son a n ; a n 1 ; a n 2 ;....a 2 ; a1 ; a 0 el determinante


x0n

x 0n 1

x0n 2

n
1
n
2

n 1
1
n 1
2

n2
1
n2
2

es x

.
x nn

.
x

n 1
n

.
x

n2
n

...
...
...
.
...

x 02
x

x0 1
x1 1

x 2 1 , y se trata de un determinante de Vandermonde,

.
x n2

. .
xn 1

2
1
2
2

Que resulta ser siempre distinto de cero para todo xi x j , condicin que aqu se
cumple, ya que de lo contrario no tendramos n + 1 argumentos distintos.
Existen varios mtodos de interpolacin polinmica que, aunque difieren en la forma en
que se construye el polinomio y en la forma en que se presenta, conducen al mismo
polinomio de interpolacin. Entre estas frmulas de interpolacin, se encuentran las
frmulas de Newton Gregory, Newton Gauss, Lagrange, Stirling, Bessel, Aitken,
Neville, Tchebby-Cheff, y otros.
La interpolacin a travs de polinomios no es la nica que existe. Tambin se presentan
interpolaciones exponenciales, hiperblicas, trigonomtricas, racionales e irracionales.
Notar que, para dos argumentos:
Una interpolacin lineal conduce al clculo de una media aritmtica.
Una interpolacin exponencial conduce al clculo de una media geomtrica.
Una interpolacin hiperblica conduce al clculo de una media armnica.
La interpolacin, se utiliza al aproximar funciones que se desconocen o cuya expresin
y manejo son complicados. As, se tiene:
f ( x) = I ( x) + T ( x)

13

donde,
f (x) = representa la funcin a ser interpolada
I (x) = representa la funcin de interpolacin, o funcin interpolatriz.
T (x) = representa el error cometido en la aproximacin.
2.2 AJUSTAMIENTO

El concepto de ajustamiento, difiere del concepto de interpolacin. En las tcnicas de


ajustamiento, se busca encontrar una funcin que no necesariamente pase por esos n+1
puntos del plano, sino que los represente fielmente. Notar, que aqu implcitamente se
considera que los puntos del plano estn plagados de errores. En el caso de
interpolacin, subyace la idea de que los valores (xi;yi) son exactos.
Segn los actuarios Andrews y Nesbitt, el ajustamiento es el esfuerzo por representar
un fenmeno determinado a travs de una revisin sistemtica de algunas
observaciones de dicho fenmeno 1
Es por esta razn que el ajustamiento es una tcnica fundamental en disciplinas que
trabajan con observaciones, y en la construccin de funciones que representen tablas,
como por ejemplo, en demografa.
El Teorema de Descomposicin de Wold, afirma que todo fenmeno puede
descomponerse en una parte determinstica y una parte aleatoria. Es decir:
y t = y t + t
Donde:
y t = ocurrencia del fenmeno en el momento t
y t = parte determinstica
t = shock aleatorio en el momento t.
En este caso, t actuara como T(x) en la interpolacin, con la diferencia que T(x) no es
aleatorio.
Existe abundante bibliografa acerca del tratamiento de este trmino t llamado tambin
trmino de perturbacin estocstica, y que no corresponde su tratamiento en este
trabajo.
Para el caso en que se ajusta minimizando la suma de cuadrados residuales, se debe
tener algunas consideraciones o supuestos iniciales, conocidos con el nombre de
supuestos de Gauss-Markov.
Los mtodos que en este trabajo se presentan no son la totalidad de los mtodos
existentes. Existen otros como el mtodo de Bayes, el de los promedios mviles, y otros
que no se tratan es en este trabajo
A diferencia de la interpolacin, aqu existen varias funciones que ajustan un mismo
conjunto de puntos. Deberemos seleccionar aquella funcin que mejor ajuste los datos.
Para ello, se cuenta con una serie de medidas de la bondad del ajuste.
1

Extrado del libro Graduation: The revision of estimates Dick London. Ed. ACTEX. 1985

14

2.2.1 MEDIDAS DE LA BONDAD DEL AJUSTE

Existen varias medidas para evaluar si una funcin sirve para ajustar los puntos, es
decir, si se puede considerar que los representa eficientemente. Enunciaremos los ms
importantes. Podramos decir que son propiedades deseables, cuanto ms cumpla, ms
idnea resulta la funcin.

Fidelidad (F): Los valores ajustados deben estar cerca de los valores observados,
tiene que haber poca diferencia, sino existira un sesgo. Matemticamente, por
cuestiones de signo, se pide que la suma de los cuadrados de las diferencias entre los
valores ajustados y los valores observados tienda a cero. Si llamamos v x a los
valores ajustados y u x a los valores observados, entonces podemos escribir que:
n

F = w x (v x u x ) 2

tal que F 0

x =1

w x acta como un ponderador. Se trata de un valor positivo que da mayor peso a los
valores observados que provienen de una muestra ms representativa. Existen
distintas formas de calcularlo, y es a criterio del investigador. Se puede utilizar la
frmula:
n
wx = x donde n z representa el tamao de la muestra a partir del cual se obtuvo vx
n
y n representa la media aritmtica de los tamaos de muestra.
Como ejemplo, podemos pensar en una muestra de tres elementos: Los valores
observados son v1; v2 y v3. Nos informan que v1 se obtuvo de una muestra de 10
elementos, v 2 proviene de una muestra de 3 elementos y v3 proviene de una muestra
de 5 elementos.
Intuitivamente, la fidelidad para v 2 debera ser menos importante que para los
restantes porque es un valor que provino de una muestra ms pequea.
Calculamos n
10 + 3 + 5
n=
=6
3
Los ponderadores son, entonces:

)
10
= 1,6
6
3
w2 = = 0,5
6
)
5
w3 = = 0,83
6

w1 =

Regularidad (R): La curva de ajustamiento debe ser lo ms suave posible,


presentando la menor cantidad de picos posibles. Podemos pensar en que una curva
es suave cuando sus diferencias finitas de cierto orden son pequeas en valor
absoluto. Matemticamente, pedimos que la suma de los cuadrados de las
diferencias finitas de un cierto orden sea pequea. Si el orden de la diferencia es 4,
se estara tomando como estndar un polinomio de grado 3, ya que las diferencias de

15

orden superior al grado de un polinomio determinado son nulas. En general, el orden


de la diferencia (z) es a criterio del investigador. La idea la expresamos como:
m

R = z v x

tal que R 0

x =1

El valor de m, segn se vio en la pgina 12 es igual a (n-z), donde n es el nmero de


argumentos.

Compensacin : Definiendo los desvos como d x = v x u x , se busca que los


desvos positivos se compensen con los negativos; es decir,
n

x =1

x =1

d x = (v x u x ) = 0

Alternancia de signos: Es condicin necesaria para que exista compensacin, que


los desvos cambien de signo y, si lo hacen con mucha frecuencia, mejor es. Se debe
tratar de prevenir el aglutinamiento de desvos de un mismo signo.

2.3 MTODOS DE AJUSTAMIENTO

Existen varios mtodos de ajustamiento, pero se pueden clasificar en tres grandes


grupos:

Mtodos Grficos: Sobre el diagrama de dispersin (o nebulosa), se traza, a mano


alzada, una curva que cumpla con la mayor cantidad de medidas de la bondad del
ajuste como sea posible. Este mtodo tiene la ventaja de contar con la intuicin del
investigador. No obstante ello, la desventaja principal es que no se tiene la forma
funcional ni se pueden obtener valores ajustados con precisin. Los mtodos
grficos de ajustamiento han cado en desuso en la actualidad.

Mtodos Mecnicos: En estos mtodos, se obtiene un conjunto de valores ajustados


sin necesidad de conocer la forma funcional de la curva de ajustamiento. Para
obtener dicho conjunto de valores, se realizan hiptesis acerca del fenmeno en
estudio. El clculo se basa en el estudio de las diferencias finitas. Ejemplos son el
mtodo de los promedios mviles (moving averages) y el mtodo de Whittaker, que
es tratado en este trabajo.

Mtodos Analticos: A priori, se establece la forma funcional que el investigador


cree tiene la curva de ajustamiento, y se procede a estimar los parmetros, de forma
tal que se cumpla con la mayor cantidad de medidas de la bondad del ajuste como
sea posible. Ejemplo: se puede pensar en que un fenmeno est representado por la
frmula y = e x + y se procede a estimar los parmetros , y . Cuanto
mayor sea la cantidad de parmetros que estimemos, mejor ser el ajuste, pero ms
complicada la tarea. Un ejemplo de estos mtodos es el mtodo de los mnimos
cuadrados.

16

MTODO DE WHITTAKER

Se trata de un mtodo mecnico de ajustamiento, que surge de combinar las medidas de


fidelidad y regularidad de la bondad del ajuste.
Los valores ajustados v x ( x = 1,2,3,4......, n ) sern aquellos que minimicen M. M es una
combinacin lineal de las medidas de fidelidad y regularidad enunciadas en la pgina
15.
M = F + hR

Donde:
F = Fidelidad
R = Regularidad
h = Coeficiente positivo que determina el nfasis relativo que se le da a la regularidad
con respecto a la fidelidad.
As, si h 0 , la importancia recae sobre la fidelidad.
h , la importancia recae sobre la regularidad.
El peso relativo de cada medida se obtiene con la siguiente frmula:
1
h +1
h
Peso relativo de la regularidad =
h +1

Peso relativo de la fidelidad =

Si uno quisiera saber el peso porcentual, se debe multiplicar por cien cada peso relativo.
La suma de ambos pesos relativos debe dar 1.

Como ejemplo, imaginemos que h = 7. Entonces M = 1 F + 7 R . Vemos que la


1
7
del peso recaiga
combinacin lineal determina que del peso recaiga en fidelidad y
8
8
en regularidad.
Los valores que resulten de la minimizacin de M sern los valores ajustados.
El problema queda entonces planteado como :
Minimizar
M( v1 ; v 2 ; v3 ;....v n ) = F + hR
Se trata de un problema de extremos libres de una funcin de varias variables
independientes. El planteo se har en trminos matriciales, ya que facilita los clculos y
notaciones.

17

Dado que:
n

F = w x (v x u x ) 2
x =1

( v )
n z

R=

x =1

El problema es:
Minimizar :
n

M( v1 ; v 2 ; v3 ;....v n ) = wx (v x u x ) 2 + h
x =1

( v )
n z

x =1

Vamos a escribir ahora el planteo en forma matricial. Ambas sumas describen una
forma cuadrtica. La primera es la misma utilizada en la pgina 6. La segunda es una
forma cuadrtica cuya matriz asociada es la identidad.
Consideramos:
V = Vector de valores ajustados (dimensin n x 1)
(ver pgina 7)
U = Vector de valores observados (dimensin n x 1) (ver pgina 7)
W = Matriz diagonal cuyos elementos de la diagonal principal son los ponderadores,
todos positivos por definicin. (dimensin: n x n)
0 ... 0
w1 0
0 w
0 ... 0
2

W =0
0 w3 ... 0

.
.
.
.
.
0
0
0 0 wn
k z = Matriz asociada a la transformacin lineal que permite expresar las diferencias
finitas de orden z de una funcin. Se la defini en la pgina 12. (Dimensin: (n-z) x n )

De modo que M se puede escribir como combinacin lineal de dos formas cuadrticas:
M = (V U ) T W (V U ) + h(k zV ) T I (k Z V )

(1)

donde la T implica traspuesto

Condicin necesaria de primer orden

Para minimizar M., debemos plantear la condicin necesaria de existencia de extremos,


es decir, debemos plantear que todas las derivadas parciales de M con respecto a cada v
valgan cero. Eso nos conduce al siguiente sistema de n ecuaciones y n incgnitas:
M
=0

v x

x = 1, 2, 3, ....... n

18

Para derivar matricialmente, como se explic en la pgina 4, necesitamos que la


variable con respecto a la cual derivamos quede aislada. Ac vemos en el segundo
trmino, que queda multiplicada por k z . Para evitar esto, reescribiremos y
modificaremos (1)
(1) M = (V U ) T W (V U ) + h(k zV ) T I (k Z V )
Aplicando propiedad de transposicin de matrices: ( AB) T = B T AT , resulta:
M = (V U ) T W (V U ) + h(V T k z ) I (k Z V )
T

En el segundo trmino, se puede aplicar propiedad asociativa del producto de matrices:


M = (V U ) T W (V U ) + hV T (k z Ik Z )V
T

Al ser la matriz identidad el neutro para el producto de matrices, resulta:


M = (V U ) T W (V U ) + hV T (k z k Z )V
T

(2)

Donde (2) presenta dos formas cuadrticas con respecto a V. En el segundo trmino,
T
(k z k z ) es la matriz asociada a la forma. Derivamos vectorialmente para obtener el
sistema que define la condicin necesaria:
DM = 2W (V U ) + h2(k z k z )V
T

El sistema resulta ser DM = 0 (el vector DM tiene n filas, es decir, n ecuaciones)


2W (V U ) + h2(k z k z )V = 0
T

(condicin necesaria para la existencia de extremos)

Dividiendo miembro a miembro por 2:


W (V U ) + h(k z k z )V = 0
T

Nuestro objetivo es hallar los valores de v que minimizan la expresin (o sea, que
anulan la ltima expresin). Entonces despejamos el vector V que contiene los valores
v.
Aplicando propiedad distributiva de matrices
WV WU + h(k Z k Z )V = 0
T

WV + h(k Z k Z )V = WU
T

[W + h(k

T
z

k z ) V = WU

19

Dado que W es una matriz de n x n y (k z k z ) es una matriz de n x n, al multiplicar por


el escalar h y sumar, el corchete resulta ser una matriz de n x n
Definimos C , matriz de n x n tal que:
C = W + h( k z k z )
T

De modo que:
CV=WU
El vector solucin, que contiene los valores ajustados ser:
V = C-1WU

Factibilidad de la solucin

El sistema tiene solucin s y slo s la matriz C es no singular, es decir, si admite


matriz inversa por tener determinante distinto de cero.
Demostraremos que C es siempre inversible:
C = W + h( k z k z )
T

Vemos que:
W es una matriz simtrica y real. (por definicin, pgina 18)
T
(k z k z ) es una matriz simtrica. Es el producto entre una matriz y su traspuesta (ver
pgina 1).
T
Al ser h un escalar, resulta que h (k z k z ) es tambin una matriz simtrica. Adems
presenta elementos reales
La suma de dos matrices simtricas da como resultado otra matriz simtrica. (Ver
pgina 2)
Por ende, concluimos que C = W + h(k z k z ) es una matriz simtrica real por ser suma
de matrices simtricas reales.
T

Sobre C, entonces, podemos edificar una forma cuadrtica. (ver pgina 3), definiendo
un vector Y con variables yi .
As,
F = Y T CY donde:
y1
y
2
Y = y3

.
y n

20

Desarrollamos un poco la forma cuadrtica:


F = Y T CY
T
Y T (W + hk z k z )Y
Y T WY + Y T (hk z k z )Y
T

Vemos la suma de dos formas cuadrticas. Siendo


h un escalar, podemos escribir:
Aplicando propiedad asociativa:

Y T WY + hY T k z k z Y
T

Y T WY + h(Y T k z )(k z Y )
Y T WY + h(k z Y ) T k z Y
T

Aplicando propiedad de transposicin:

Vemos dos formas cuadrticas. En el primer trmino, la matriz asociada es W, que es


una matriz diagonal. En el segundo trmino, la matriz asociada es la identidad. Adems
vemos que el vector que participa es el vector de diferencias de orden z de Y (ver
pgina 10). De modo que se trata de dos formas cuadrticas diagonales o sumas de
cuadrados. Expresndolo en forma desarrollada:
F = Y T WY + h(k z Y ) T k z Y =

w
x =1

n z

2
z
x y x + h ( y x )
2

x =1

Analicemos la forma cuadrtica F

w
x =1

yx

resulta positivo, pues w x es positivo por definicin (ver pgina 18) y


2

adems y x es siempre positivo.


h toma valores positivos por definicin (ver pgina 17)
n z

( y
z

x =1

) 2 es siempre positivo, pues est elevado al cuadrado

Ambos trminos estn separados por un signo +

Conclusin: F es una forma cuadrtica definida positiva.


De aqu se desprende que:
Si F es definida positiva, entonces su matriz asociada es positiva (ver pgina 8). Se
concluye que C es una matriz definida positiva.
Utilizando el teorema enunciado en la pgina 8, se concluye que C es una matriz
inversible.

Condicin suficiente de segundo orden

Vimos que los valores que surgen de V = C 1WU cumplen con la condicin de primer
orden. Debemos ver si se trata de un mnimo o un mximo.
Demostraremos que M es un mnimo cuando CV = WU

21

Partimos de la expresin algebraica de M (pgina 18)


n

M( v1 ; v 2 ; v3 ;....v n ) = wx (v x u x ) 2 + h
x =1

( v )
n z

x =1

Se ve claramente que M es una forma cuadrtica definida positiva pues se trata de


sumas de cuadrados. Adems, los wx son positivos y h tambin.
Pasamos a su expresin matricial: (frmula (2) pgina 19)
M = (V U ) T W (V U ) + hV T (k z k Z )V
T

Aplicamos propiedades de transposicin:


M = (V T U T )W (V U ) + h V T k z k Z V
T

Aplicamos propiedad distributiva en el primer trmino:


M = (V T W U T W )(V U ) + h V T k z k Z V
T

M = V T WV U T WV V T WU + U T WU + h V T k z k Z V
T

Ordenamos convenientemente:
M = V T WV + hV T k z k zV U T WV V T WU + U T WU
T

Sacamos factores comunes en los dos primeros trminos:


M = V T (W + hk z k z )V U T WV V T WU + U T WU
T

De modo que, recordando que C = W + hk z k z (Pgina 20)


T

M = V T CV U T WV V T WU + U T WU
Ahora:
Multiplicamos el primer y segundo trmino por la matriz identidad, expresada como
C 1C
Multiplicamos el tercer trmino por trmino por la matriz identidad, expresada como
CC 1
Sumamos y restamos U T WC 1WU
Recordando que la matriz identidad es permutable siempre:
M = V T CC 1CV U T WC 1CV V T CC 1WU + U T WU + U T WC 1WU U T WC 1WU
Ordenando convenientemente:

22

M = V T CC 1CV U T WC 1CV V T CC 1WU + U T WC 1WU + U T WU U T WC 1WU


Extraemos ahora factor comn por grupos:
De los primeros dos trminos: C 1CV
Del tercer y cuarto trmino: C 1WU

Entonces:
M = V T CC 1CV U T WC 1CV V T CC 1WU + U T WC 1WU + U T WU U T WC 1WU
se transforma en:
M = (V T C U T W )C 1CV (V T C + U T W )C 1WU + U T WU U T WC 1WU
Aplicando propiedades de transposicin de matrices:
M = (CV WU ) T C 1CV (CV + WU ) T C 1WU + U T WU U T WC 1WU
Extrayendo (CV WU ) T C 1 como factor comn, resulta que:
M = (CV WU ) T C 1 (CV WU ) + U T WU U T WC 1WU
En donde se ve claramente que los dos ltimos trminos no dependen de V. Por lo tanto,
si en el primer trmino se impone como condicin que CV = WU , ste se anular y
tomar un valor mnimo, ya que M es definida positiva. (pgina 21)

23

MTODO GENERAL DE WHITTAKER (DIFERENCIAS MIXTAS)

Se trata de un mtodo que Whittaker generaliz, donde la forma de M es ms general.


Se define como:
n

n 1

n2

n z

x =1

x =1

x =1

x =1

M = wx (v x u x ) 2 + h1 (v x ) 2 + h2 (2 v x ) 2 + .... + hz (z v x ) 2

Donde:
h1 0

i = 1,2,3...z

pero no todas nulas. Es decir,

h
i =1

Claramente, si todas las hi salvo una valen cero, entonces se obtiene el mtodo de
ajustamiento de Whittaker previamente explicado. El lector puede fcilmente obtener
los valores ajustados de vx, definiendo distintas matrices asociadas a diferencias finitas.

MTODO DE REGULARIDAD EXPONENCIAL

Se trata de un mtodo mecnico de ajustamiento donde se busca la medida de


regularidad a travs de una funcin exponencial. Este mtodo se usa cuando la funcin
v x que permite obtener los valores ajustados se pretende sea exponencial. Al ser un
mtodo mecnico, no estimaremos sus parmetros, pero se har necesario recurrir a la
forma funcional para deducir algunas caractersticas sobre sus diferencias finitas.
Consideremos la funcin:
v x = A + BC x
Calculamos la diferencia de primer orden:
v x = v x +1 v x
= A + BC x +1 ( A + BC x )
= BC x C BC x
= B (C 1)C x
De modo que v x = B(C 1)C x
Si llamamos r = C-1
Obtenemos:
v x = BrC x

24

Tomando diferencia segunda:


2 v x = (v x ) = ( BrC x ) = BrC x = Br (rC x ) = Br 2 C x
De modo que: 2 v x = Br 2 C x
Se puede comprobar entonces que 2 v x = rv x , por lo que:
2 v x rv x = 0
Es sensato entonces pensar en la regularidad expresada en forma exponencial como:
n2

R = (2 v x rv x ) 2
x =1

En forma alternativa:
Dado que:
v x = BrC x si aplicamos operador desplazamiento sobre x miembro a miembro:
E (v x ) = E ( BrC x ) por conmutatividad de operadores E y :
( Ev x ) = BrE (C x )
v x +1 = BrCC x dividiendo miembro a miembro por v x = BrC x :
v x +1 BrCC x
es decir:
=
v x
BrC x
v x +1
=C =1+r
v x
Por lo que:
v x +1 = (1 + r )v x
o bien: v x +1 (1 + r )v x = 0
Entonces una segunda forma de representar la regularidad podra ser:
n2

R = [v x +1 (1 + r )v x ]

x =1

Un caso ms general lo constituye una funcin v x que sea suma de un polinomio de


grado z 2 y una funcin exponencial. En este caso, la expresin que se hace cero es:
z v x rz 1v x
o su equivalente:

25

z 1v x +1 (1 + r )z 1v x .
Esto se puede demostrar por el principio de induccin completa, sobre el conjunto de
valores de z.
En ese caso, tenemos que:
n z

R = z 1v x +1 (1 + r )z 1v x

x =1

De modo que el planteo del modelo en su forma completa involucrara el siguiente


problema:
n

Minimizar M =

w x (v x u x ) 2 + h
x =1

[
n z

z 1

x =1

v x +1 (1 + r )z 1v x

Se debe ensayar un valor de r. Lgicamente, el clculo se hace ms complejo en cuanto


a la condicin de primer orden.

Variacin de Lowrie

Lowrie plante un esquema de regularidad polinmica y exponencial, pero,


involucrando ms trminos. As:
m

i =1

x =1

x =1

n z

z =1

x =1

M = (1 hi ) wx (v x u x ) 2 + h1 wx (v x s x ) 2 + [hz +1 (z v x rz 1v x ) 2
S

Donde sx representa un valor obtenido de una tabla ajustada ya hecha con anterioridad y
la cual se supone est correctamente ajustada.

Variacin de Schuette

Schuette considera que el esquema tradicional de minimizar los cuadrados es apropiado


slo si los datos provienen de una distribucin normal, o si se puede considerar, bajo la
evidencia muestral, que as es.
En el caso en que la variable en estudio presente varios outliers, no se puede seguir
suponiendo normalidad. Si un procedimiento de estimacin est poco influenciado por

26

valores extremadamente altos o bajos (outliers), entonces se dice que el estimador en


cuestin es robusto.
Schuette propone entonces, una modificacin al mtodo de Whittaker:
n

n z

x =1

x =1

M = w x v x u x + h z v x
Ac, el clculo es bastante ms difcil porque desaparecen las formas cuadrticas. Una
opcin es recurrir a la programacin matemtica. No obstante, presenta las siguientes
ventajas:

El mtodo produce v x = u x para al menos z valores de x

Si v x = u x para exactamente z valores de x, entonces v x es un polinomio de grado


z-1 para todo x. Mediante un procedimiento de interpolacin polinmica, se puede
obtener sus parmetros.
Se puede obtener para un rango de valores de h los mismos valores ajustados. Esto
es debido al uso de la programacin matemtica.

27

MTODO DE LOS MNIMOS CUADRADOS

Se trata de un mtodo analtico de ajustamiento que se basa en el cumplimiento de la


medida de fidelidad (ver pgina 15).
Se trata de minimizar la expresin:
n

S = wx (u x v x ) 2
x =0

Teniendo en cuenta que:


wx = representa un ponderador.
u x = representa un valor observado.
v x = representa un valor ajustado.
Dado que ste es un mtodo analtico, los valores v x se estiman a travs de una funcin
de la cual se conoce la familia de funciones a la cual pertenece, pero no sus parmetros.
Consideraremos distintas formas funcionales para v x .
CASO 1: v x = ax + b

Partimos de:
n

S = wx (u x v x ) 2
x =1

Dado que v x = ax + b
n

S = wx (u x ax + b) 2
x =1

o bien
n

S = wx (u x ax b) 2
x =1

Debemos encontrar los valores de los parmetros a y b que minimizan S. Entonces se


plantea la condicin necesaria.
Condicin necesaria de primer orden:

Es condicin necesaria que las derivadas de primer orden de S con respecto a los
parmetros a y b se anulen en el punto crtico.

28

Planteamos entonces:
S
a = 0
S
=0
b
n

Recordando que S = wx (u x ax b) 2 se desprende que:


x =1

n
S
= 2wx (u x ax b)( x)
a x =1
n
S
= 2wx (u x ax b)(1)
b x =1

La condicin necesaria entonces es:


n
2 wx (u x ax b)( x) = 0
x =1
n
2wx (u x ax b)(1) = 0
x =1

Tomamos la primera ecuacin del sistema:


n

2w (u
x

x =1

ax b)( x) = 0

Dividimos miembro a miembro por 2:


n

w (u
x

x =1

ax b)( x) = 0

Aplicamos propiedad distributiva:


n

w u
x

x =1

x + wx ax 2 + wx bx = 0

Distribuyendo el operador suma:


n

x =1

x =1

x =1

w x u x x + a wx x 2 + b wx x = 0

y, ordenando:

29

x =1

x =1

x =1

a x 2 wx + b xwx = xu x wx

(1)

Ahora tomamos la segunda ecuacin: (pgina 29)


n

2w (u
x

x =1

ax b)(1) = 0

Dividimos miembro a miembro por 2


n

w (u
x

x =1

ax b)(1) = 0

Aplicamos propiedad distributiva:


n

w u
x

x =1

+ w x ax + wx b = 0

Distribuimos el operador suma:


n

x =1

x =1

x =1

wx u x + a wx x + b wx = 0
y, ordenando:
n

x =1

x =1

x =1

a xwx + b wx = u x wx

(2)

Es decir, el sistema de ecuaciones:


n
2 wx (u x ax b)( x) = 0
x =1
n
2wx (u x ax b)(1) = 0
x =1

es equivalente al sistema de ecuaciones:


n
n
n 2
+
=
a
x
w
b
xw
xu x wx

x
x

x =1
x =1
x =1

n
n
n
a xwx + b wx = u x wx
x =1
x =1
x =1

Dado que el sistema de ecuaciones es lineal, obtenemos los valores de a y b aplicando la


regla de Cramer.

30

La solucin del sistema de ecuaciones lineales:


n
n
n 2
+
=
a
x
w
b
xw
xu x wx

x
x

x =1
x =1
x =1

n
n
n
a xwx + b wx = u x wx
x =1
x =1
x =1

es:

xw

u x wx

wx

x =1
n

a=

x =1
n

x =1
n

wx

xw
x =1

xw
x =1
n

w
x =1

wx

xw
x =1

x =1
n

x =1

x =1

x wx wx xwx

x =1
x =1
x =1

w
x =1

x 2 wx u x wx xu x wx xwx

wx

xw
x =1
n

x
n

x =1

x =1

x =1

xw

x =1

xu w

x =1
n

xu x wx wx xwx u x wx

x =1

x 2 wx

x =1
n

x =1
n

b=

xu x wx

x =1

x =1

x =1

x =1

x =1
2

wx wx xwx
x =1
x =1

El mtodo se puede generalizar para m variables explicativas. Se utiliza notacin


matricial en la mayora de los casos por cuestiones de simplicidad. Abundan los textos
sobre mnimos cuadrados clsicos.
CASO 2: v x = ax b

(a > 0)

En el caso en que v x es un monomio de grado b, con coeficiente igual a a y variable


independiente x que asume valores positivos, se puede optar por tomar logaritmo
natural a ambos miembros:
ln v x = ln ax b
que equivale a:

31

ln v x = b ln x + b ln a
Efectuando el siguiente cambio de variables:
z = ln v x
x' = b ln x
c = b ln a
la ecuacin se transforma en z = x'+c . Se resuelve como el Caso 1, y se vuelve a las
variables originales.
CASO 3: v x = ae bx

(a > 0)

Para este caso, tambin se recurre a la aplicacin de logaritmo natural miembro a


miembro. Se tiene entonces:
ln v x = ln ae bx
que es equivalente a:
ln v x = bx + ln a
Nuevamente lo hemos llevado al Caso 1. Debemos tener cuidado porque las
estimaciones obtenidas de a y b pueden no ser muy precisas.
CASO 4: v x = A + BC x

Este tipo de funciones es muy usada en demografa matemtica y en el campo actuarial,


ya que es la forma funcional que asume la tasa instantnea de mortalidad segn la
primera ley de Makeham. (1860).
En este caso, se aproxima la funcin mediante el polinomio de Taylor de primer orden:
vx vx

v x
A

( A A0 ) +

v
v x
( B B0 ) 0 + x (C C 0 ) 0
B
C

Vemos que:
v x
=1
A
v x
= Cx
B
v x
= BxC x 1
C
Reemplazando y, expresando los incrementos de variable independiente como
diferenciales, resulta:
vx vx

+ dA + C x 0 dB + BxC x 1 0 dC

32

Se trata entonces, de minimizar


n

S = wx (u x v x
x =1

dA + C x 0 dB BxC x 1 0 dC ) 2

Se debe derivar respecto de dA, dB y dC para as obtener el sistema de ecuaciones que


permite hallar el punto crtico.
Se obtendra el siguiente sistema:

n
n
n
n
x
x 1

dA w x + dB w x c0 + dC B0 w x xC 0 = w x (u x v x 0 )

x =1
x =1
x =1
x =1
n
n
n
n

B0
2x
x
x
x 2
dA w x C 0 + dB w x (C 0 ) + dC
wx xC 0 = w x C 0 (u x v x 0 )

x =1
x =1
x =1 C 0
x =1

2
n
n
n
n
B
B
x
2x
x
x 1
dA B0 w x xC 0 + dB 0 wx xC 0 + 0 wx (C 0 ) 2 = B0 wx xC 0 (u x v x 0 )
x =1
x =1 C 0
x =1 C 0
x =1
Dado que el sistema proporciona los valores de los diferenciales, este mtodo requerir
estimaciones iniciales de A0, B0 y C0, las cuales dependern del investigador. Esto
puede ser determinado utilizando algn mtodo grfico de ajustamiento o utilizando la
experiencia y el sentido comn. Por ejemplo, se conoce que los parmetros de la citada
ley de Makeham tienen el siguiente rango de variacin:
0,001 A 0,003
10 6 B 10 3
1,08 C 1,12

Una vez realizadas las hiptesis de valores iniciales, se obtendrn valores A1 , B1 y C1 . Se


puede efectuar un proceso iterativo resolviendo el sistema varias veces hasta obtener las
estimaciones de An ; Bn y C n , donde n se puede determinar fijando un error mximo
tolerable.

33

AJUSTE FRAGMENTARIO

A veces, el diagrama de dispersin (nebulosa), presenta un conjunto de puntos que


difcilmente pueda ser ajustado en forma confiable por una funcin. En estos casos,
conviene segmentar el dominio, de manera tal de considerar subconjuntos en el
dominio, cuyas imgenes puedan ser bien ajustadas por una curva sencilla.
Consideremos un esquema de argumentos en el intervalo [a; b] , donde se encuentra
definido el diagrama de dispersin. Adems, existe al menos un valor k [a; b ] en donde
la nebulosa cambia de patrn.

k =1

La funcin de valores ajustados v x podra ser pensada por partes:


f ( x)
vx = 0
f1 ( x)

axk
kxb

Notar que en el diagrama de dispersin, puede no existir valor observado para k. En


cualquier caso, se puede definir:
h = mximo valor de x entre a y k
h + 1 = mnimo valor observado de x entre k y b
La funcin a minimizar ser, si utilizamos el mtodo de los mnimos cuadrados:
h

S = wx [u x f 0 ( x)] +
x=a

w [u

x = h +1

f1 ( x)]

El inconveniente que surge es que ambas funciones sern discontinuas en k, o


presentaran un pico en ese punto, no cumpliendo con la condicin de fidelidad.
Esto se puede arreglar, exigiendo orden de contacto 1 entre f 0 ( x) y f1 ( x) .
Se dice que dos funciones f ( x) y g ( x) tiene orden de contacto n en el punto x0 s y
slo s:
f ( x0 ) = g ( x0 )
f ' ( x0 ) = g ' ( x0 )
f ( x0 ) = g ( x0 )
f ( x0 ) = g ( x0 )
.....
n 1
f ( x0 ) = g n 1 ( x0 )
f n ( x0 ) = g n ( x0 )

34

k=n

El mtodo se generaliza fcilmente para varios puntos de cambio de patrn. Definido el


intervalo [a; b] en el que se encuentra definida la nebulosa, y n puntos de cambios de
patrn ( k1 ; k 2 ; k 3 ...k n ) v x se puede definir como:
a x k1
f 0 ( x)
f ( x)
k1 < x k 2
1
.....

vx =
k i < x k i +1
f i ( x)
......

f ( x)
kn < x b
n
Donde se establece a priori orden de contacto igual a 2 para todas las curvas prximas,
es decir, se pide que:
f i 1 (k i ) = f i (k i )

f i 1 (k i ) = f i (k i )

f i 1 (k i ) = f i (k i )

Para que el sistema de ecuaciones resultante de la condicin de orden de contacto


resulte sencillo, se recomienda el uso de polinomios para las f (x)
Para el caso de orden de contacto dos, se plantea:
Pi ( x) = P0 ( x) + C 5 ( x k1 ) 3 + C 6 ( x k 2 ) 3 + ... + C i + 4 ( x k i ) 3
y se determinan las constantes Ci .
De esta forma, la funcin S a minimizar ser de la forma:
2

h2
4
4

S = wx u x C i x i 1 + wx u x C i x i 1 C 5 ( x k1 ) 3 + .........
x=a
i =1
x = h1 +1
i =1

h1

4
n+ 4

.... + wx u x C i x i 1 ( x k i 4 ) 3
x = hn +1
i =1
i =5

35

AJUSTE POR PROGRAMACIN LINEAL

Se trata de un mtodo analtico de ajustamiento que busca encontrar una funcin de


ajuste lineal y de ordenada al origen igual a cero, que cumpla con el requisito de
fidelidad. La bsqueda de esta medida de la bondad del ajuste se puede realizar:
minimizando la suma de desviaciones absolutas.
minimizando la mxima desviacin absoluta.
Para cualquiera de ambos mtodos, se puede utilizar el mtodo Simplex. Este mtodo
requiere que las variables sean no negativas.
Minimizacin de la suma de Desvos Absolutos
Se desea determinar el peso a proporcionado por la solucin del programa lineal.
Contamos con una tabla de valores de la forma:
xs
x1
x2
x3
...
xn

ux
u1
u2
u3
...
un

El planteo es entonces:
n

Minimizar D = ( s x + t x )
x =1

s.a
s1 t1 + ax1 = u1
s t + ax = u
2
2
2 2
...

s n t n + ax n = u n
sx 0 tx 0

a
Donde :
s x = variables de holgura (slack)
t x = variables artificiales del mtodo simplex
Pero, dado que a , se debe reformular el planteo de manera que a se exprese como
resta de dos variables no negativas, por ejemplo, a = p q , con p 0 y q 0 .
Una vez obtenido el parmetro a , la ecuacin se puede expresar como:
v x = ax
Este mtodo es de fcil generalizacin para ms de una variable explicativa. Sean

36

x1 ; x 2 ; x3 ....x m

las variables explicativas, y sus respectivos valores para cada

observacin: x (j1) ; x (j2) ......x (jm ) donde el suprandice responde a la variable explicativa
(independiente) en cuestin y el subndice representa el nmero de argumento. Vemos
que hay n observaciones del fenmeno (asociadas al contador j) y m variables
explicativas (asociadas al contador i). Es decir, n ecuaciones con m incgnitas.

Minimizar: D = ( s j + t j )
j =1

s.a
s1 t1 + a1 x1(1) + a 2 x1( 2) + .... + a m x1( m ) = u1

(1)
( 2)
(m)
s 2 t 2 + a1 x 2 + a 2 x 2 + .... + a m x 2 = u 2
...

(1)
( 2)
(m)
s n t n + a1 x n + a 2 x n + .... + a m x n = u n

j = 1,2,3,...n
sj 0
tj 0

ai i = 1,2,3,...m

Nuevamente, para poder aplicar el mtodo Simplex, expresaremos las variables ai


como diferencia de variables no negativas. As, ai = pi qi donde pi 0 y qi 0 .

Minimizacin de la mxima desviacin absoluta


En este caso, la desviacin que se intenta minimizar es absoluta. Manteniendo la misma
nomenclatura, y considerando un esquema de m variables explicativas (el lector
sencillamente lo puede adaptar a un esquema de una variable explicativa), el problema a
formular es el siguiente:
Llamando u a la desviacin:
Minimizar: u
s.a
u + a1 x1(1) + a 2 x1( 2 ) + .... + a m x1( m ) u1

(1)
( 2)
(m)
u (a1 x1 + a 2 x1 + .... + a m x1 ) u1
u + a x (1) + a x ( 2 ) + .... + a x ( m ) u
m 2
1 2
2 2
2

(1)
( 2)
(m)
u (a1 x 2 + a 2 x 2 + .... + a m x 2 ) u 2

...
u + a x (1) + a x ( 2 ) + .... + a x ( m ) u
m n
n
1 n
2 n

(1)
( 2)
(m)
u (a1 x n + a 2 x n + ... + a m x n ) u n
s 0
j = 1,2,3,...n
tj 0
j

a i i = 1,2,3,...m

37

La misma consideracin que antes: para poder aplicar el mtodo Simplex, expresaremos
las variables ai como diferencia de variables no negativas. As, ai = pi qi donde
pi 0 y qi 0 .

Ejemplo de Aplicacin 2
Se ha encargado a un laboratorio mdico que determine si existe una relacin
significativa en una marca de tabaco entre el porcentaje de nicotina (V) y los
porcentajes de nitrgeno (X1), benzopireno(X2), alcaloides(X3), cido mlico(X4), cido
ctrico(X5) y alquitrn (X6). Se han tomado diez muestras de tabaco y se han medido los
niveles porcentuales de las medidas aludidas. La tabla recoge tales medidas
porcentuales.

Muestra

X1

X2

X3

X4

X5

X6

1.68

3.02

3.16

1.29

0.12

3.73

2.07

2.85

2.08

3.14

2.60

0.50

2.32

1.80

2.10

1.89

2.82

2.04

0.23

3.56

3.02

7.06

1.94

3.54

3.11

0.26

3.76

3.07

1.42

2.15

2.28

1.06

0.68

2.18

1.31

2.66

3.53

1.74

2.64

0.50

3.48

2.23

1.39

2.11

2.33

3.05

0.39

3.19

1.31

2.64

1.62

2.78

1.72

0.50

1.17

1.25

2.82

2.20

1.16

2.06

0.42

3.79

2.15

10

3.30

1.97

3.58

3.07

0.54

2.70

1.29

a) Ajustar un modelo de regresin lineal mltiple a los datos anteriores, utilizando


programacin lineal, y considerando como funcin objetivo la minimizacin de la
suma de desviaciones absolutas.
b) Realizar lo mismo que en el apartado anterior, pero considerando como objetivo la
minimizacin de la mxima desviacin absoluta.
2

Tomado del libro Programacin Lineal y Aplicaciones (Sixto Ros Insu y otros) Ed. RA-MA,
Madrid, Ao 1997. Pginas 97 a 99.

38

Solucin:
a) Deseamos determinar los pesos ai con i = 1,2,3...6 proporcionados por la solucin
del programa lineal:

10

Minimizar D = ( s j + t j )
j =1

s.a
s1 t1 + 3.02a1 + 3.16a 2 + 1.29a3 + 0.12a 4 + 3.73a5 + 2.07a 6 = 1.68
s t + 2.08a + 3.14a + 2.60a + 0.50a + 2.32a + 1.80a = 2.85
1
2
3
4
5
6
2 2
...

s10 t10 + 1.97a1 + 3.28a 2 + 3.07a3 + 0.54a 4 + 2.70a5 + 1.29a 6 = 3.30

sj 0 tj 0
j = 1,2,3....10

ai
i = 1,2,3....6

Para poder aplicar el mtodo Simplex, expresaremos las variables ai como diferencia
de variables no negativas. As, ai = pi qi donde pi 0 y qi 0 .
En 13 iteraciones, se alcanza la optimalidad, siendo los pesos ptimos:

a1 0.772
a 0.191
2

a3 0.864
=

a 4 0.367
a5 0.306

a 6 1.639

Por lo tanto, la ecuacin de regresin es:


Y = 0.772 X 1 + 0.191X 2 + 0.864 X 3 + 0.367 X 4 0.306 X 5 + 1.639 X 6

b) En este caso, el objetivo es la minimizacin de la mxima desviacin absoluta. Por


tanto, formulamos el programa lineal:

39

Minimizar u
s.a
u + 3.02a1 + 3.16a 2 + 1.29a 3 + 0.12a 4 + 3.73a 5 + 2.07a 6 1.68
u (3.02a + 3.16a + 1.29a + 0.12a + 3.73a + 2.07a ) 1.68
1
2
3
4
5
6

u + 2.08a1 + 3.14a 2 + 2.60a3 + 0.50a 4 + 2.32a5 + 1.80a 6 2.85


u (2.08a + 3.14a + 2.60a + 0.50a + 2.32a + 1.80a ) 2.85
1
2
3
4
5
6

...

u + 1.97a1 + 3.28a 2 + 3.07a 3 + 0.54a 4 + 2.70a5 + 1.29a 6 3.30

u (1.97a1 + 3.28a 2 + 3.07a3 + 0.54a 4 + 2.70a5 + 1.29a 6 ) 3.30


sj 0 tj 0
j = 1,2,3....10

ai
i = 1,2,3....6

Para poder aplicar el mtodo Simplex, expresaremos las variables ai como diferencia
de variables no negativas. As, ai = pi qi donde pi 0 y qi 0 .
En 23 iteraciones se alcanza la optimalidad, siendo los pesos ptimos:
a1 0.408
a 0.137
2

a3 2.255
=

a 4 1.937
a5 2.048

a 6 2.1

Por lo tanto, la ecuacin de regresin es:


Y = 0.408 X 1 0.137 X 2 + 2.255 X 3 1.937 X 4 2.048 X 5 + 2.1X 6

Para comparar ambos mtodos, conviene efectuar un anlisis de los residuos, ya que
estos dan idea del error que se comete en el ajuste; es decir, la precisin obtenida. Estos
mtodos de programacin lineal son ms eficaces cuando los datos de la serie no
provienen de una distribucin normal, o no existe suficiente evidencia emprica para
afirmarlo.
Tambin, son modelos apropiados para obtener modelos ms robustos y resistentes
frente a observaciones atpicas.

40

3. TESTS PARA LA BONDAD DEL AJUSTE

Una vez realizado el ajuste a una serie de datos, es importante tratar de ver si el ajuste es
aceptable y confiable. Existe numerosa bibliografa al respecto, que el lector est
invitado a conocer. Los principales tests de hiptesis, con una somera descripcin de
cada uno de ellos son:

TEST DE LA CHI CUADRADO: Test que utiliza como estadstico:


n

X =
x =1

(v x u x ) 2

. Donde X n2

. Si bien tiene la ventaja de ser generalmente

preciso, presenta serias limitaciones:


a) Puede existir un gran nmero de desvos grandes balanceados contra un nmero
grande de desvos pequeos
b) No detecta un gran nmero de desvos acumulados de cualquier signo en un sector
especfico del dominio.
c) Puede existir una acumulacin de desvos acumulados del mismo signo en un sector
especfico del dominio (caso particular de b)

Para complementar este test, consideramos los siguientes Tests de Hiptesis accesorios:

Test de los desvos standard individuales


Test de los desvos absolutos
Test de los desvos acumulados
Test del signo
Test para grupos de signos (o Test de Stevens)
Test binomial de cambios de signos

Tambin existen otros tests que slo contemplan la bondad del ajuste en un solo sector
de la tabla (en un sector del dominio). Estos son :

Test de Heterogeneidad de Redington-Michaelson


Test de las diferencias sucesivas de Kendall y Stuart (1968) se apoya en la medida
de regularidad, ya que prueba si las diferencias finitas de un cierto orden pueden
considerarse nulas)
Test para la uniformidad

41

You might also like