You are on page 1of 52

4 Contraste de hiptesis en el modelo de regresin mltiple

Ezequiel Uriel
Universidad de Valencia
Versin: 09-2013
4.1 El contraste de hiptesis: una panormica
4.1.1 Formulacin de la hiptesis nula y de la hiptesis alternativa
4.1.2 Estadstico de contraste
4.1.3 Regla de decisin
4.2 Contraste de hiptesis utilizando el estadstico t
4.2.1 Contraste de un solo parmetro
4.2.2 Los intervalos de confianza
4.2.3 Contraste de hiptesis sobre una combinacin lineal de parmetros
4.2.4 Importancia econmica versus significacin estadstica
4.3 Contraste de restricciones lineales mltiples utilizando el estadstico F
4.3.1 Restricciones de exclusin
4.3.2 Significacin global del modelo
4.3.3 Estimando otras restricciones lineales
4.3.4 Relacin entre los estadsticos F y t
4.4 Contrastes sin normalidad
4.5 Prediccin
4.5.1 Prediccin puntual
4.5.2 Prediccin por intervalos
4.5.3 Prediccin de y en un modelo logartmico
4.5.4 Evaluacin de las predicciones y prediccin dinmica
Ejercicios

1
1
2
3
5
5
16
17
22
22
22
27
28
29
30
31
31
31
35
36
38

4.1 El contraste de hiptesis: una panormica


Antes de contrastar las hiptesis en el modelo de regresin mltiple, vamos a
ofrecer una panormica sobre el contraste de hiptesis.
El contraste de hiptesis permite realizar inferencias acerca de parmetros
poblacionales utilizando datos provenientes de una muestra. Para realizar el contraste de
hiptesis estadstico, en general, hay que realizar los siguientes pasos:
1) Establecer una hiptesis nula y una hiptesis alternativa relativas a los
parmetros de la poblacin.
2) Construir un estadstico para contrastar las hiptesis formuladas.
3) Definir una regla de decisin para determinar si la hiptesis nula debe ser, o
no, rechazada en funcin del valor que tome el estadstico construido.
Vamos a examinar a continuacin cada uno de estos pasos.
4.1.1 Formulacin de la hiptesis nula y de la hiptesis alternativa
Antes de referirnos al modo de formular la hiptesis nula y alternativa,
distinguiremos entre hiptesis simples e hiptesis compuestas. Las hiptesis que se
formulan mediante una o ms igualdades se denominan hiptesis simples. Cuando para
formular una hiptesis se utilizan los operadores "desigualdad", "mayor que" y "menor
que", entonces a dicha hiptesis se le denomina compuesta.
Es importante sealar que el contraste de hiptesis se refiere siempre a los
parmetros poblacionales. El contraste de hiptesis implica tomar la decisin, sobre la
base de los datos muestrales, de rechazar o no que ciertas restricciones sean satisfechas
por el modelo bsico asumido. Las restricciones que se desean contrastar se conocen

como la hiptesis nula, a la que designa H0. As pues, una hiptesis nula es una
declaracin sobre los parmetros poblacionales.
Aunque es posible formular hiptesis nulas compuestas en el contexto del
modelo de regresin, siempre consideraremos que la hiptesis nula es una hiptesis
simple. Es decir, para formular una hiptesis nula, utilizaremos siempre el operador
igualdad. Veamos a continuacin algunos ejemplos de hiptesis nulas referidas al
modelo de regresin:
a)

H0 : 1=0

b)

H0 : 1+ 2 =0

c)

H0 : 1=2 =0

d)

H0 : 2+3 =1

Tambin vamos a definir una hiptesis alternativa, designada por H1, que
representa nuestra conclusin en el caso de que el contraste concluya que H0 es falsa.
Aunque las hiptesis alternativas pueden ser tambin simples o compuestas, en
el modelo de regresin, tomaremos siempre, como hiptesis alternativa, una hiptesis
compuesta. La hiptesis alternativa, a la que se designa H1, se formula mediante el
operador "desigualdad" en la mayor parte de los casos. As, por ejemplo, dada la H0:

H0 : j 1

(4-1)

H1 : j 1

(4-2)

podemos formular la siguiente H1 :

que es una hiptesis "alternativa de dos colas".


Las siguientes hiptesis se llaman alternativas de una cola:

H1 : j 1

(4-3)

H1 : j 1

(4-4)

4.1.2 Estadstico de contraste


Un estadstico de contraste es una funcin de una muestra aleatoria, por lo que
tambin es una variable aleatoria. Cuando se calcula el estadstico de contraste para una
muestra dada, se obtiene un resultado, es decir, un nmero. Al realiza un contraste
estadstico sera conveniente conocer la distribucin del estadstico de contraste bajo la
hiptesis nula. Esta distribucin depende en gran medida de las hiptesis formuladas en
el modelo. Si en la especificacin del modelo se asume el supuesto de normalidad,
entonces la distribucin estadstica apropiada ser la distribucin normal o alguna de las
distribuciones asociadas a la misma, como son la Chi-cuadrado, la t de Student, o la F
de Snedecor.
En el cuadro 4.1 se muestran algunas distribuciones, que son apropiadas en
diferentes situaciones, bajo el supuesto de normalidad de las perturbaciones del modelo.

CUADRO 4.1. Algunas distribuciones utilizadas en el contraste de hiptesis.

2 conocida
2 desconocida

1 restriccin

1 o ms
restricciones

Chi-square

t de Student

F de Snedecor

El estadstico utilizado para el contraste se construye teniendo en cuenta la H0 y


los datos muestrales. En la prctica, como 2 es siempre desconocida, se utilizarn
siempre las distribuciones t y F.
4.1.3 Regla de decisin
Para el contraste de hiptesis vamos a considerar dos enfoques: el enfoque
clsico y un enfoque alternativo basado en los valores-p. Pero antes de ver la manera de
aplicar la regla de decisin, examinaremos los tipos de error que se pueden cometer en
el contraste de hiptesis.
Tipos de errores en el contraste de hiptesis
En el contraste de hiptesis, podemos cometer dos tipos de errores: error de tipo
I y error de tipo II.
Error de tipo I
Nosotros podemos rechazar la H0 cuando en realidad es cierta. A este error se le
denomina error de tipo I. Generalmente, se define el nivel de significacin () de un
contraste como la probabilidad de cometer un error de tipo I. Simblicamente,

Pr(rechazar H0 | H0 )

(4-5)

Dicho de otro modo, el nivel de significacin es la probabilidad de rechazar la


H0 cuando la H0 es cierta. Las reglas para el contraste de hiptesis se construyen
haciendo que la probabilidad de un error de tipo I sea suficientemente pequea. Los
niveles de significacin usuales para son 0.10, 0.05 y 0.01. Algunas veces tambin se
utiliza 0.001.
Despus de haber tomado la decisin de rechazar o no la H0, la decisin puede
haber sido la correcta o puede que se haya cometido un error. Nunca sabremos con
certeza si se cometi un error. Sin embargo, podemos calcular la probabilidad de haber
cometido un error de tipo I o un error de tipo II.
Error de tipo II
Podemos fracasar en rechazar la H0 cuando en realidad es falsa. Si esto sucede
se ha cometido un error de tipo II.

Pr( No rechazar H0 | H1 )

(4-6)

En otras palabras, es la probabilidad de no rechazar H0 cuando H1 es cierta.


Es importante sealar que no es posible minimizar ambos tipos de error de
forma simultnea. En la prctica lo que hacemos es seleccionar un nivel de significacin
bajo.
3

Enfoque clsico: Aplicacin de la regla de decisin


El mtodo clsico implica los siguientes pasos:
a) Eleccin de . El contraste de hiptesis clsico requiere que inicialmente se
especifique un nivel de significacin. Cuando se especifica un valor para ,
esencialmente lo que estamos cuantificando es nuestra tolerancia para un error de tipo I.
Si =0.05, entonces el investigador est dispuesto a rechazar H0 falsamente en un 5%
de los casos.
b) Obtencin de c, valor crtico, utilizando tablas estadsticas. El valor c se
determina por el valor de .
El valor crtico en un contraste de hiptesis es un umbral con el cual se compara
el estadstico de contraste para determinar si la hiptesis nula se rechaza o no.
c) Comparando el resultado del estadstico de contraste, s, con c, la H0 se
rechaza o no para un valor dado de .
La regin de rechazo (RR), delimitada por el valor crtico (c), es un conjunto de
valores del estadstico de contraste para los cuales se rechaza la hiptesis nula. (Vase
figura 4.1). Es decir, el espacio muestral del estadstico de contraste se divide en dos
regiones: una regin (la regin de rechazo) nos lleva a rechazar la hiptesis nula H0,
mientras que la otra no nos deja rechazar la hiptesis nula. Por lo tanto, si el valor
observado del estadstico de contraste s se encuentra en la regin crtica, rechazamos la
H0; en el caso de que no se encuentre en la regin de rechazo llegamos a la conclusin,
de no rechazar la H0 o de fracasar en rechazar la H0.
Simblicamente,
Si

sc

se rechaza

Si

sc

no se rechaza H 0

H0

(4-7)

Si la hiptesis nula se rechaza con la evidencia de la muestra, sta es una


conclusin fuerte. Sin embargo, la aceptacin de la hiptesis nula es una conclusin
dbil porque no conocemos cul es la probabilidad de no rechazar la hiptesis nula
cuando debe ser rechazada. Es decir, no conocemos la probabilidad de cometer un error
de tipo II. Por lo tanto, en lugar de utilizar la expresin de la aceptacin de la hiptesis
nula, es ms correcto decir fracasar en rechazar la hiptesis nula, o no rechazar, ya que
lo que realmente sucede es que no tenemos suficiente evidencia emprica para rechazar
la hiptesis nula.
En el proceso de contrastacin, la parte ms subjetiva es la determinacin a
priori del nivel de significacin. Qu criterios se pueden utilizar para determinar ? En
general, se trata de una decisin arbitraria, aunque como ya hemos dicho, los niveles de
1%, 5% y 10% para son los ms utilizados en la prctica. A veces se efecta el
contraste condicionado a distintos niveles de significacin.

Regin
de
rechazo
RR

Regin
de no
rechazo
RNR

FIGURA 4.1. Contraste de hiptesis: enfoque clsico.

Un enfoque alternativo: el valor-p


Con la utilizacin de ordenadores, el contraste de hiptesis puede contemplarse
desde otra perspectiva mucho ms racional. As, los programas de ordenador suelen
ofrecer, junto al estadstico de contraste una probabilidad. Esta probabilidad, a la cual se
le denomina valor-p (p-value) -es decir, valor de probabilidad-, tambin es conocida
como nivel de significacin crtico o exacto, o probabilidad exacta de cometer un error
de tipo I. Ms tcnicamente, el valor-p se define como el ms bajo nivel de
significacin al que puede ser rechazada una hiptesis nula.
Una vez que el valor-p ha sido determinado, sabemos que la hiptesis nula se
rechaza para cualquier nivel de significacin valor-p; por el contrario, la hiptesis
nula no se rechaza cuando <valor-p. Por lo tanto, el valor-p es un indicador del nivel
de admisibilidad de la hiptesis nula: cuanto mayor sea el valor-p, ms confianza
podemos tener en la hiptesis nula. El uso de valor-p cambia por completo el enfoque
en el contraste de hiptesis. As, en lugar de fijar a priori el nivel de significacin, se
calcula el valor-p, que nos permite determinar los niveles de significacin para los que
se rechaza la hiptesis nula.
En las secciones siguientes vamos a ver en la prctica el uso de valor-p en el
contraste de hiptesis.

4.2 Contraste de hiptesis utilizando el estadstico t


4.2.1 Contraste de un solo parmetro
El estadstico t
Bajo los supuestos del MCL del 1 al 9,

j ~ N j , var( j )

j 1, 2,3, , k

(4-8)

Si tipificamos

j j
var( j )

j j
sd ( j )

~ N 0,1

j 1, 2,3,, k

(4-9)

El supuesto de normalidad se apoya en el Teorema del Lmite Central (TCL),


pero este teorema es restrictivo en algunos casos. Es decir, la normalidad no siempre se
5

puede asumir. En cualquier aplicacin, asumir o no el supuesto de normalidad de u es


realmente una cuestin emprica. A menudo, mediante una transformacin, por ejemplo,
tomando logaritmos, se obtiene una distribucin que est ms cercana a la normalidad y
que es ms fcil de manejar desde un punto de vista matemtico. Las muestras grandes
nos permiten prescindir del supuesto de normalidad sin afectar demasiado a los
resultados.
Bajo los supuestos de MLC del 1 al 9, se obtiene una distribucin t de Student
b j - b j
t n- k
ee(b )

(4-10)

donde k es el nmero de parmetros desconocidos en el modelo poblacional (k-1


parmetros de pendiente y el trmino independiente, 1). La expresin (4-10) es
importante porque nos permite contrastar la hiptesis sobre j.
Si comparamos (4-10) con (4-9), vemos que la distribucin de t de Student
deriva del hecho de que el parmetro de ee( j ) ha sido reemplazado por su
estimador , que es una variable aleatoria. As pues, los grados de libertad de la t son
n-k, correspondientes a los grados de libertad utilizados en la estimacin de 2 .
Cuando una distribucin t tiene muchos grados de libertad (gl) se aproxima a
una distribucin normal estndar. En la figura 4.2 se ha representado la funcin de
densidad normal y la funcin de densidad de la t para diferentes grados de libertad.
Como puede verse, las funciones de densidad de la t son ms aplanadas (platicrticas) y
con las colas ms anchas que la funcin de densidad normal, pero a medida que
aumentan los gl, la funcin de densidad de la t est ms prxima de la funcin de
densidad normal. De hecho, lo que pasa es que la distribucin t tiene en cuenta que 2
se ha estimado por ser desconocida. Dada esta incertidumbre, la distribucin de la t se
extiende ms que la de la normal. Sin embargo, cuando los gl crecen, la distribucin t
est ms cerca de la distribucin normal porque la incertidumbre de no conocer 2
disminuye.
Por lo tanto, debera tenerse en mente la siguiente convergencia en distribucin:

tn
N (0,1)
n

(4-11)

As pues, cuando el nmero de grados de libertad de una t de Student tiende


hacia infinito converge hacia una distribucin N(0,1). En el contexto del contraste de
hiptesis, si crece el tamao de la muestra, tambin lo harn los grados de libertad. Esto
implica que para tamaos grandes se puede utilizar, de forma prcticamente
equivalente, la distribucin normal para contrastar hiptesis con una sola restriccin,
aun cuando no se conozca la varianza poblacional. Como regla prctica, cuando los gl
son mayores que 120, pueden tomarse valores crticos de la distribucin normal.

FIGURA 4.2.
4 Funcionees de densidad
d: normal y t para diferen
ntes grados dde libertad

Considerre la hiptesis nula,

H0 : j 0
Puesto que
q j midee el efecto parcial de xj sobre y, despus dde controlarr para
todass las otras variables
v
in
ndependienttes, H 0 : j 0 signifiica que, unaa vez que x2, x3,
,xj 1, xj+1,, xk han siido tenidos en cuentaa, x no tien
ne efecto soobre y. Estta H0
correesponde al denominado contrastee de significcatividad. El
E estadsticco que se utiliza
u
para contrastar H 0 : j 0 , contra cuaalquier otra alternativa, se denomiina el estad
dstico
t, o laa ratio t, dee y se ex
xpresa comoo
j

t
j

j
ee( j )

Cuando vamos a contrastar H 0 : j 0 , es natural tener preseente a j nu


uestro
estim
mador insesggado de j. En una muuestra dada j nunca ser
s cero exxactamente,, pero
un valor pequeo indicar una hipteesis nula verdadera, miientras que un valor grande
u punto jj est alejada de
indiccar una hipptesis nulaa falsa. La ppregunta ess: hasta qu
cero??
Debemoos recordar que
q hay unn error de muestreo
m
en la estimaciin de j , por
p lo
que eel tamao de
d j debe comparase con su erro
or de muestrreo. Esto ess precisamen
nte lo
que hhacemos cuuando usamos t , ya qque este estadstico mid
de cuantos errores estndar,
j

est j alejada de cero. A fin de detterminar una regla paraa rechazar H 0, tenemo
os que
deciddir sobre la
l hiptesis alternativva relevantte. Hay trees posibiliddades: hip
tesis
alternnativas unillaterales (co
ola derecha e izquierda)) e hiptesiss alternativaa de dos collas.
Hiptesis altern
nativa de un
na cola: derrecha
En primeer lugar, vam
mos a consiiderar la hip
ptesis nula

H0 : j 0
contrra la hiptessis alternativ
va

H1 : j 0
Este es un
u contrastte de signifficacin possitiva. La regla de deccisin es en
n este
caso la siguientee:
R
Regla de deccisin
Si

t t n k

se reechaza

Si

t t n k

no se rechaza H 0

H0

(4-12)
(

Por lo taanto, rechazzamos H 0 : j 0 en favor de H1 : j 0 ccuando t tn k


j

comoo puede veerse en la figura 4.3 . Est muy


y claro quee para rechhazar H0 contra
c
H1 : j 0 el valor
v
de t debe ser ppositivo. Un
n resultado negativo
n
dee t , no im
mporta
j

lo grrande que sea,


s
no prop
porciona ninnguna evid
dencia a fav
vor de H1 : j 0 . Porr otra
partee, para obtenner tn k en la tabla estaadstica de la t, slo neecesitamos conocer el nivel
de siignificacinn y los grrados de libbertad. En todo caso, es importan
ante destacaar que

cuanndo disminnuye, tn k aumenta.


a
Hasta cieerto punto, el enfoque clsico es, en algn seentido arbitrrario, puesto que
se tieene que eleggir un de antemano, yy, dependieendo de esa eleccin, laa H0 se rech
haza o
no.
En la figgura 4.4 see representaa el enfoqu
ue alternativ
vo. Como sse desprend
de del
exam
men de la figgura, la deteerminacin del valor-p
p es la operaacin inverssa de enconttrar el
valorr en las tabllas estadstiicas para unn determinaado nivel dee significaciin. Una vez que
el vaalor-p ha sido determin
nado, sabem
mos que se rechaza la H0 para cuualquier niv
vel de
signiificacin enn que >vallor-p, por ell contrario, la hiptesiss nula no see rechaza cu
uando
<vaalor-p.

FIG
GURA 4.3. Reg
gin de rechazzo utilizandoo la t:
h
hiptesis alterrnativa de colla a la derech
ha.

URA 4.4. El va
alor-p utilizanndo la t: hip
tesis
FIGU
alternativ
va de cola a laa derecha.

EJEM
MPLO 4.1 Es la
l propensin
n marginal a cconsumir men
nor que la pro
opensin medi
dia al consumo
o?
Como se ve
v en el ejemp
plo 1.1, contraastar la proposicin 3 de la funcin de coonsumo keyneesiana,
en unn modelo lineaal, es equivaleente a contrasstar si el trmiino independiente es signifficativamente mayor
que 0. Es decir, en el modelo

ccons 1 2inc u

Tenem
mos que contrrastar si

1 0
Con una muestra
m
aleatoria de 42 obseervaciones, see han obtenido
o los siguientess resultados

cons = 0.41 + 0.8


843 inc
i

(0.350)

(0.0
062)

Los nmeeros entre parntesis, debajjo de los coeficientes, son los errores eestndar (ee) de los
estimaadores.
La pregunnta que nos plaanteamos es laa siguiente: ees la tercera prroposicin de la teora keyn
nesiana
admissible? A continnuacin, respo
ondemos a estta pregunta.
1) En este caso, las hip
tesis nula y aalternativa son
n las siguientes:

H 0 : 1 0
H1 : 1 0
2) El contrraste estadsticco es:
t

1 10 1 0 0.41
0

1.171

0
ee( 1 ) ee( 1 ) 0.35

3) Regla de
d decisin
Es conveeniente utilizaar varios nivveles de sig
gnificacin. Comencemos
C
con un niv
vel de
signifficacin de 0.10 porque el valor de t ess relativamentte pequeo (m
menor que 1.55). En este caso, los
gradoos de libertad son 40 (42 ob
bservaciones menos 2 parmetros estim
mados). Si noss fijamos en laa tabla
estadstica de la t (fila 40 y columna
c
de 00.10 o 0.20, en las tablas de una colla, o de dos colas,
0.10
respecctivamente), encontramos
e
que
q t40
1.3003 .
Como t<1.303, no se reechaza la H0. Si no rechazaamos la H0 paara =0.10, taampoco se recchazar
0.05
0.01
para =0.05 ( t40
=
( t40
gura la
1.684 ) o =0.01
22.423 ), como puede verse en la figura 44.5. En esta fig
reginn de rechazo corresponde a =0.10. Porr lo tanto, no se puede rech
hazar la H0 enn favor de la H1. En
otras ppalabras, los datos
d
muestrales no son connsistentes con
n la proposicin 3 de Keynees.
En el enfooque alternativo, como pueede verse en la figura 4.6, el valor-p coorrespondientee a t

=1.1771 para una t con 40 gl ess igual a 0.1224. Para <0..124 - por ejeemplo, 0.10, 00.05 y 0.01-, no se
rechazza la H0.

FIGURA 4.6. Ejemplo 4.1: El vaalor-p utilizan


ndo la
FIG
GURA 4.5. Eje
emplo 4.1: Reegin de rech
hazo
n hiptesis altternativa de ccola a la dereecha.
utilizzando la t con
n hiptesis altternativa de ccola a t con
la derecha.

Hiptesis altern
nativa de un
na cola: izq uierda
Considerremos ahoraa la hiptesiis nula

H0 : j 0
contrra la hiptessis alternativ
va

H1 : j 0

Este es un contraste de significacin negativa.


La regla de decisin es en este caso es la siguiente:
Regla de decisin
Si

t tn k

se rechaza

Si

t tn k

no se rechaza H 0

H0

(4-13)

Por lo tanto, rechazamos H 0 : j 0 en favor de H1 : j 0 para un dado


cuando t tn , como puede verse en la figura 4.7. Est muy claro que para rechazar
j

H0 en contra de H1 : j 0 , el valor de t debe ser negativo. Un valor positivo de t ,


j

no importa lo grande que sea, no proporciona ninguna evidencia a favor de H1 : j 0 .


En la figura 4.8 se representa el enfoque alternativo. Una vez que el valor-p ha
sido determinado, se sabe que se rechaza H0 para cualquier nivel de significacin tal que
>valor-p; por el contrario, la hiptesis nula no se rechaza cuando <valor-p.
Regin
de
rechazo
RR

Regin
de no
rechazo
RNR

No se
rechaza
para
>p-value

tn k

Se rechaza
para
<p-value

tn k

p-value

0
tnk
FIGURA 4.7. Regin de rechazo utilizando la t:
hiptesis alternativa de cola a la izquierda.

FIGURA 4.8. El valor-p utilizando la t: hiptesis


alternativa de cola a la izquierda.

EJEMPLO 4.2 Tiene la renta una influencia negativa sobre la mortalidad infantil?
El siguiente modelo ha sido planteado para explicar las muertes de nios menores de 5 aos por
1000 nacidos vivos (deathun5).
deathun5 1 2 gnipc 3ilitrate u

donde gnipc es la renta nacional bruta per cpita e ilitrate es la tasa de analfabetismo de adultos (15 aos
o ms) en porcentaje.
Con una muestra de 130 pases (fichero hdr2010) se ha realizado la siguiente estimacin:

deathun
5 = 27.91 - 0.000826 gnipc + 2.043 ilitrate
i

(5.93)

(0.00028)

(0.183)

Los nmeros entre parntesis, debajo de los coeficientes, son los errores estndar (ee) de los
estimadores.
Una de las preguntas formuladas por los investigadores es si la renta tiene una influencia
negativa sobre la mortalidad infantil. Para responder a esta pregunta se lleva a cabo un contraste en el que
las hiptesis nula y alternativa y el estadstico de contraste son los siguientes:
H 0 : 2 0
2
0.000826
t

2.966

H1 : 2 0
0.00028
ee( 2 )
Dado que el valor de t es relativamente alto, vamos a empezar a contrastar con un nivel del 1%.
0.01
0.01
Para =0.01, t130
2 t60 2.390 . Teniendo en cuenta que t<-2.390, como se muestra en la figura 4.9, se
rechaza la H0 a favor de la H1. Por lo tanto, la renta nacional bruta per cpita tiene una influencia que es
significativamente negativa en la mortalidad de nios menores de 5 aos; es decir, cuanto mayor sea la

10

renta nacional brutta per cpita ms


m bajo ser el porcentajje de mortalid
dad de nios m
menores de 5 aos.
Comoo la H0 se ha reechazado paraa =0.01, tamb
mbin ser rech
hazada por loss niveles de 5%
% y 10%.
En el enfooque alternativ
vo, como pueede verse en la
l figura 4.10, el valor-p coorrespondientte a un
t =-22.966 para t con menos de 61 gl es iguall a 0.0000. Paara todos los >0.0000 com
mo 0.01, 0.05 y 0.10,
1

se recchaza la H0.

FIG
GURA 4.9. Eje
emplo 4.2: Reegin de rech
hazo
utiliizando la t coon una hipteesis alternativva de
colla a la izquierrda.

FIGU
URA 4.10. Ejemplo 4.2: El valor-p utiliz
zando
la t con una hiptesis alternaativa de cola a la
izquierda.

Hiptesis altern
nativa con dos
d colas
Considerremos ahoraa la hiptesiis nula

H0 : j 0
contrra la hiptessis alternativ
va

H1 : j 0
Esta es la
l alternativ
va relevantee cuando ell signo de j no est bbien determinado
por la teora o el sentido
o comn. C
Cuando la alternativa es de doss colas, esttamos
intereesados en el
e valor abso
oluto del esttadstico t. Este
E es un contraste
c
dee significaciin.
La regla de decisin
n en este casso es la sigu
uiente:
R
Regla de deccisin
Si

t tn/k2

Si

/2

t tn k
j

se reechaza

H0

(4-14)
(

no se
s rechaza H 0

Por lo taanto, rechazzamos H 0 : j 0 en favor de H1 : j 0 para un dado


cuanndo

ura 4.11. En
n este caso, para rechazar la
t tn/2k , como puede vers e en la figu
j

H0 a favor de H1 : j 0 , t j debe sser lo suficiientemente grande, bieen sea posittivo o


negaativo.
Es impoortante haccer notar qque cuando
o decrecce, tn/k2 auumenta en valor
absolluto.
E
En el enfoquue alternativ
vo, una vezz que el vallor-p ha sid
do determina
nado, se sabe que
se reechaza H0 para
p
cualqu
uier nivel dee significaccin si >vvalor-p; porr el contrarrio, la

11

hipttesis nula no
n se rechazza cuando <valor-p. En
E este caso
o valor-p see distribuye entre
las ddos colas de forma simtrica, comoo se muestraa en la figurra 4.12.

FIGURA 4.11. Regin


R
de recchazo usandoo t:
hiptesis alternativa
a
dee dos colas.

FIGUR
RA 4.12. valor
r-p usando t: Regin de reechazo
usando t: hiptesis alternatiiva de dos collas.

Cuando no se especfica una hhiptesis allternativa, por


p lo generral, se conssidera
que eel contrastee de hiptessis es de doos colas. Si se rechaza la H0 a favvor de la H1 para
un dado, se sueele decir qu
ue "xj es estaadsticamen
nte significa
ativa para ell nivel ".
EJEM
MPLO 4.3 La ta
asa de delincu
uencia, juegaa un papel en el precio de la
l vivienda dee un rea?
Para expliicar el precio de la viviendda en una ciud
dad estadounid
dense se ha esstimado el sig
guiente
modello:
priice 1 2 roooms 3lowsstat 4 crimee u
de la casa, lo
dondee rooms es ell nmero de habitaciones
h
owstat es el porcentaje
p
de personas de "clase
margiinal" en la zonna y crime son
n los delitos coometidos per capita
c
en la zo
ona.
Los resulltados del mo
odelo ajustaddo realizado con E-viewss, utilizando el fichero hprice2
h
(primeras 55 obserrvaciones), ap
parece en el ccuadro 4.2. Ell significado de
d las tres priimeras colum
mnas es
claro: "Estadstico t" es el dato requerido
r
paraa hacer un con
ntraste de sign
nificacin, es decir, es la reelacin
entre el "Coeficientte" y el "Errorr estndar", y "Prob" es el valor-p
v
para un
n contraste dee dos colas.
En relacin con este modelo
m
la prregunta que se
s hacen los investigadorees es si la taasa de
criminnalidad juegaa un papel im
mportante en el precio de las casas de la zona. Parra responder a esta
preguunta, se ha llevvado a cabo el siguiente proocedimiento.
En este caaso, la hiptesiis nula y alternnativa, y el esstadstico de contraste, son llos siguientes:
H 0 : 4 0
4
3854
t

4.016

H1 : 4 0
960
ee( 4 )

CUADRO
O 4.2. Salida estndar
e
en u
una regresin
n para explica
ar el precio dde una casa. n=55.
n
Variable
Coeficieente Error esstndar Esta
adstico t
Prob.
C
-156993.61
80
021.989
-1.956324
0.0559
rooms
67888.401
12
210.720
5.606910
0.0000
lowstat
-268. 1636
80
0.70678
-3.322690
0.0017
crime
-38533.564
95
59.5618
-4.015962
0.0002
Dado que el valor de t es
e relativamennte alto, vamo
os a empezar a contrastar paara un nivel del
d 1%.
Para =0.01, t510.01/ 2 t500.01/ 2 2.6
es para la disstribucin t, no
n hay
69 . (En las ttablas estadstticas habituale
inform
macin para caada gl, uno a uno,
u ms all de 20). Tenieendo en cuentaa que t 2.669, rechazamos la H0
a favoor de la H1. Poor lo tanto, la delincuencia tiene una inflluencia signifiicativa en el pprecio de la vivienda
con unn nivel de signnificacin del 1% y, por tannto, de un 5% y 10%.
En el enfooque alternativ
vo podemos rrealizar el con
ntraste con mayor precisinn. En el cuadro 4.2,
vemos que el valorr de valor-p paara el coeficieente crime es de
d 0.0002. Eso
o significa quue la probabilidad de
que el estadstico t sea mayor de
d 4.016 es 0.00001 y la pro
obabilidad de que t sea men
enor de -4.016
6 es de
0.0001. Es decir, el
e valor de valor-p, como sse muestra en
n la figura 4.13 se distribuyye en los dos lados.
Comoo puede versee en esta figu
ura, se rechazza H0 para to
odos los nivelles de signific
icacin superiiores a
0.0002, tales como 0.01, 0.05 y 0.10.
0
Si se traatara de un con
ntraste de una cola, en el ennfoque alternaativo el
valor--p sera igual a 0.0002/1=0..0001.

12

FIGURA 4.13. Ejemplo 4.3: valor-pp utilizando t:: hiptesis altternativa de ddos colas.

Hasta ahhora hemos visto el conntraste sign


nificativo dee una cola y de dos collas en
el quue un parm
metro toma el
e valor 0 enn la H0. Aho
ora vamos a ver un casoo ms generral en
que eel parmetroo en la H0 to
oma un valoor especfico cualquiera:

H 0 : j 0j
En este caso,
c
el estaadstico t addecuado es
j 0j
t
j
ee( j )
Al iguall que antess, t j midee la cantidad de desv
viaciones esstndar estt j
distaanciada de 0j , valor qu
ue toma el pparmetro en
n la hiptesis nula.
EJEM
MPLO 4.4 Es la
l elasticidad del gasto en ffrutas/renta ig
gual a 1? Ess la fruta un bbien de lujo?
Para respoonder a estas dos
d preguntass vamos a utillizar el siguien
nte modelo paara explicar el gasto
en fruuta (fruit):
ln( fruit ) 1 2 ln(iinc ) 3 houseehsize 4 pun
nders u
dondee inc es la rennta disponiblee de los hogaares, househsiize es el nmeero de miembbros de la fam
milia y
pundeer5 es la propoorcin de nio
os menores dee cinco aos en
n el hogar.
Dado que las variables fruit
f
e inc apaarecen expresadas en logaritmos naturalees, entonces 2 es la
elasticcidad del gastto/renta. Utilizzando una muuestra de 40 hogares
h
(ficheero demand), se han obteniido los
resultados del cuaddro 4.3.

CUADRO
O 4.3. Salida estndar
e
de u
una regresin
n que explica los gastos en fruta. n=40.
Variable
Coeficieente Error esstndar Estadstico t
P
Prob.
C
-9.7677654
3.7
701469
-2
2.638859
0.0122
ln(inc)
2.0044539
0.5
512370
3.912286
3
0.0004
househssize
-1.2055348
0.1
178646
-6.747147
0.0000
punder55
-0.0177946
0.0
013022
-1.378128
0.1767
Es laa elasticidad del
d gasto en frrutas/ renta iggual a 1?
Para respoonder a esta prregunta, se haa llevado a cab
bo el siguiente procedimiennto. En este caaso las
hipteesis nula y alteernativa, y el estadstico dee contraste, son
n los siguientees:
H 0 : 2 1
20 2 1 2.0
005 1
t 2

1.9611

H1 : 2 1
0
.512
ee( 2 ) ee( 2 )
Para =0..10, nos enco
ontramos con que t360.10/ 2 t350.10/ 2 1.69 . Como | t | >11.69 se rechaaza H0.
Para =0.05, t360.05/ 2 t350.05/ 2 2.0
p =0.05, nni para =0.0
01. Por
03 . Como | t | <2.03 no recchazamos H0 para
lo tannto, rechazam
mos que la ellasticidad dell gasto en fru
uta/renta sea igual a 1 paara=0.10, peero no
rechazzamos para =0.05,
=
ni paraa=0.01.

13

Es la fruta un bien de lujo?


Segn la teora econmica, una mercanca es un bien de lujo cuando la elasticidad del gasto con
respecto a la renta es mayor que 1. Por lo tanto, para responder a esta segunda cuestin, y teniendo en
cuenta que el estadstico t es el mismo, se ha llevado a cabo el siguiente procedimiento:
H 0 : 2 1

Para =0.10, nos encontramos con que t

H1 : 2 1 .
0.10
36

t350.10 1.31 .Cuando t>1.31, rechazamos H0 en

favor de H1. Para =0.05, t360.05 t350.05 1.69 .Como t>1.69, rechazamos la H0 en favor de la H1. Para

=0.01, t360.01 t350.01 2.44 . Como t<2.44, no rechazamos H0. Por lo tanto, la fruta es un bien de lujo para
=0.10 y =0.05, pero no se puede rechazar la H0 en favor de la H1 para =0.01.
EJEMPLO 4.5 Es la Bolsa de Madrid un mercado eficiente?
Antes de responder a la cuestin planteada, vamos a examinar algunos conceptos previos. La
tasa de rendimiento de un activo en un perodo de tiempo se define como la variacin porcentual que
experimenta el valor invertido en ese activo durante dicho perodo de tiempo. Vamos a considerar ahora
como activo especfico, a una accin de una compaa industrial adquirida en una Bolsa espaola al final
de un ao y que se mantiene hasta el final del ao siguiente. A esos dos momentos de tiempo los designaremos t-1 y t respectivamente. La tasa de rendimiento de esa accin al cabo de ese ao puede
expresarse mediante la siguiente relacin:

RAt

DPt + Dt + At
Pt-1

(4-15)

donde
Pt : es la cotizacin de la accin al final del perodo t
Dt : son los dividendos percibidos por la accin durante el perodo t
At : es el valor de los derechos que eventualmente han podido corresponder a la accin
durante el perodo t
As pues, en el numerador de (4-15) se recogen los tres tipos de ganancias de capital que se han
podido percibir por el mantenimiento de una accin durante el ao t : incremento - o prdida en su caso
en la cotizacin, dividendos y derechos de ampliacin. Al dividir por Pt-1 se obtiene la tasa de ganancia
sobre el valor de la accin a finales del perodo anterior. De los tres componentes el ms importante es el
incremento en la cotizacin. Teniendo en cuenta solamente a esa componente, la tasa de rendimiento de la
accin puede expresarse por

RA1t

DPt
Pt-1

(4-16)

o, alternativamente si utilizamos una tasa de variacin natural, por

RA2t D ln Pt

(4-17)

De la misma forma que RAt, en cualquiera de las dos expresiones, representa la tasa de
rendimiento de una accin concreta, se puede estimar tambin la tasa de rendimiento del conjunto de
acciones cotizadas en Bolsa. A esta ltima tasa de rendimiento, a la que designaremos por RMt, se le
denomina tasa de rendimiento de mercado.
Hasta ahora hemos considerado la tasa de rendimiento en un ao, pero igualmente se puede
aplicar expresiones del tipo (4-16), o (4-17), para obtener tasas de rendimiento diario. Analizando el
comportamiento de estas tasas cabe preguntarse si las tasas de rendimiento en el pasado son de utilidad
para predecir las tasas de rendimiento en el futuro. Esta pregunta est relacionada con el concepto de eficiencia de un mercado. Un mercado es eficiente si los precios incorporan toda la informacin disponible,
de modo que hay posibilidad de obtener ganancias extraordinarias al utilizar esta informacin.
Para contrastar la eficiencia de un mercado vamos a definir el siguiente modelo, utilizando tasas
de rendimiento diarias definidas segn (4-16):
rmad 92t 1 2 rmad 92t 1 ut

14

(4-18)

Si un mercado es eficiente, entonces el parmetro 2 del anterior modelo debe ser 0. Vamos a
contrastar ahora si la Bolsa de Madrid, en lo que respecta a la renta variable, es o no eficiente en su
conjunto.
El modelo de (4-18) se ha estimado con datos diarios de la Bolsa de Madrid para el ao 1992,
utilizando el fichero bolmadef. Los resultados obtenidos han sido los siguientes:

rmad
92 0.0004+ 0.1267 rmad 92
t

(0.0007)

(0.0629)

t -1

R2=0.0163 n=247
Los resultados obtenidos pueden resultar paradjicos. Por una parte, el valor del coeficiente de
determinacin es muy bajo (0.0163), lo que significa que solamente el 1.63% de la varianza total de la
tasa de rendimiento se explica por la tasa de rendimiento del da anterior. Por otra parte, sin embargo, el
coeficiente correspondiente a la tasa de significacin del da anterior es estadsticamente significativo
para un nivel del 5% pero no para un nivel de 1%, porque el estadstico t es igual a 0.1267/0.0629=2.02
0.01

0.01

que es ligeramente mayor en valor absoluto que t245 t60 =2.00. El motivo de esta aparente paradoja
se debe a que el tamao de la muestra es muy elevado. As, aunque la incidencia de la variable explicativa
sobre la variable endgena es relativamente reducida (como indica el coeficiente de determinacin), sin
embargo, esta incidencia es significativa (como lo confirma el estadstico t) debido a que se ha dispuesto
de una muestra de datos suficientemente grande.
Contestando a la pregunta de si la Bolsa de Madrid es o no un mercado eficiente, en un primer
anlisis la respuesta es que no es totalmente eficiente. Sin embargo, esta respuesta debe matizarse. En
economa financiera es conocida la existencia de una relacin de dependencia entre la tasa de rendimiento
de un da y la del da precedente. Esta relacin no es muy fuerte, aunque s es estadsticamente
significativa en muchas bolsas mundiales, y se debe a las fricciones del mercado. En cualquier caso, este
fenmeno no se puede explotar de forma lucrativa por los agentes del mercado, por lo que no se puede
calificar a estos mercados de ineficientes, de acuerdo con la definicin dada anteriormente sobre el
concepto de eficiencia.
EJEMPLO 4.6 La rentabilidad de la Bolsa de Madrid, se ve afectada por la rentabilidad de la Bolsa de
Tokio?
El estudio de la relacin entre distintos mercados de acciones (Bolsa de Nueva York, Bolsa de
Tokio, Bolsa de Madrid, Bolsa de Londres, etc.) ha recibido una gran atencin en los ltimos aos,
debido a una mayor libertad en la circulacin de capitales y a la conveniencia de utilizar mercados
extranjeros para reducir el riesgo en la gestin de carteras, ya que la ausencia de una perfecta integracin
de los mercados permite la diversificacin del riesgo. De todas formas, cada vez se camina hacia una
mayor integracin mundial de los mercados financieros, en general, y de los mercados de acciones, en
particular.
Si los mercados son eficientes, y hemos visto en el ejemplo 4.5 que se puede admitir que lo sean,
las noticias que se van produciendo, a las que se denominan innovaciones, durante un perodo de 24 horas
se irn viendo reflejadas en los distintos mercados.
Conviene distinguir entre dos tipos de innovaciones: a) innovaciones globales, que son noticias
que se generan alrededor del mundo y que se captan en los precios de las acciones en todos los mercados;
b) innovaciones especficas, que es la informacin generada durante un perodo de 24 horas que solo
afecta a los precios de un mercado particular. As, la informacin sobre evolucin de los precios del
petrleo se puede considerar como una innovacin global, mientras que una nueva regulacin del sector
financiero en un pas sera considerada posiblemente como una innovacin especfica.
De acuerdo con la exposicin anterior, en una sesin de Bolsa de un determinado mercado, los
precios de las acciones que en l se cotizan vendrn afectados por las innovaciones globales recogidas en
otro mercado que haya cerrado antes. As, las innovaciones globales recogidas en el mercado de Tokio
influirn en las cotizaciones del mercado de Madrid de ese mismo da. El siguiente modelo recoge la
transmisin de efectos entre la Bolsa de Tokio y la Bolsa de Madrid:
rmad92t =1+2rtok92t +ut
(4-19)
donde rmad92t es la tasa de rentabilidad de la Bolsa Madrid en el perodo t, y rtok92t es la tasa de
rentabilidad de la Bolsa de Tokio en el perodo t. Las rentabilidades de los mercados se han calculado de
acuerdo con (4-16).

15

En el fichero madtok se pueden encontrar los ndices generales de la Bolsa de Madrid y la Bolsa
de Valores de Tokio durante los das en que ambas bolsas estaban abiertas de forma simultnea. Es decir,
se han eliminado las observaciones de los das en los que cualquiera de las bolsas estuviese cerrada. En
total, el nmero de observaciones es de 234, en comparacin con los 247 y 246 das en que las Bolsa de
Madrid y de Tokio estuvieron abiertas respectivamente.
La estimacin del modelo (4-19) es como sigue:

rmad
92 0.0005+ 0.1244 rtok 92
t

(0.0007)

(0.0375)

R2=0.0452 n=235
Obsrvese que el coeficiente de determinacin es relativamente bajo. Sin embargo, para
contrastar H0:2=0, se obtiene que el estadstico t = (0.1244/0.0375) = 3.32 lo que implica que se rechaza
la hiptesis nula de que la tasa de rendimiento de la Bolsa de Valores de Tokio no tenga ningn efecto
sobre la tasa de rentabilidad de la Bolsa de Madrid, para un nivel de significacin de 0.01.
Una vez ms nos encontramos con la misma paradoja aparente que apareci cuando se analiz la
eficiencia de la Bolsa de Madrid en el ejemplo 4.5 a excepcin de una diferencia. En este ltimo caso, la
tasa de rendimiento del da anterior apareca como significativa, debido a problemas derivados de la
elaboracin del ndice general de la Bolsa de Madrid.
En consecuencia, el hecho de que la hiptesis nula sea rechazada implica que hay evidencia
emprica que apoya la teora de que las innovaciones globales de la Bolsa de Tokyo se transmiten a las
cotizaciones de la Bolsa de Madrid ese mismo da.

4.2.2 Los intervalos de confianza


Bajo los supuestos del MLC, es fcil construir un intervalo de confianza (IC)
para el parmetro de la poblacin, j. A los IC tambin se les denomina estimaciones
por intervalo, ya que proporcionan un rango de valores verosmiles para j, y no
solamente una estimacin puntual.
El IC est construido de tal manera que el parmetro desconocido est contenido
dentro del recorrido del IC con una probabilidad previamente especificada.
Utilizando el hecho de que
b j - b j
t n- k
ee(b )
j

j /2
tn k 1
Pr tn/2k j
ee( j )

que

Operando para situar al parmetro j solo en el centro del intervalo, obtenemos


Pr j ee( j ) tn/2k j j ee( j ) tn/2k 1

Por lo tanto, los lmites inferior y superior, respectivamente, de un IC de


probabilidad (1-) estn dados por

j j ee( j ) tn/2k
j j ee( j ) tn/2k
Si las muestras se obtuvieron al azar de forma repetida calculando j y j cada
vez, el parmetro poblacional (desconocido) caera en el intervalo ( j , j ) en un (1

)% de las muestras. Desafortunadamente, para la muestra individual que se utiliza en


16

la construccin del IC, no sabemos si j est o no realmente contenida dentro del


intervalo.
Una vez que el IC se ha construido, es fcil llevar a cabo contrastes de hiptesis
de dos colas. Si la hiptesis nula es H 0 : j a j , entonces la H 0 se rechaza contra la

H1 : j a j para el nivel de significacin del 5%, si y slo si, aj no est en el IC del


95%.
Para ilustrar todo lo anterior, en la figura 4.14 se han construidos intervalos de
confianza del 90%, 95% y 99%, para la propensin marginal al consumo -2correspondiente al ejemplo 4.1.
0,99
0,95
0,90
1.011

0.968

0.947

0.843

0.739
0.718

0.675

FIGURA 4.14. Intervalos de confianza para la propensin marginal al consumo en el ejemplo 4.1.

4.2.3 Contraste de hiptesis sobre una combinacin lineal de parmetros


En muchas aplicaciones, estamos interesados en contrastar hiptesis en las que
estn implicados ms de un parmetro poblacional. El estadstico t tambin se puede
utilizar para contrastar una combinacin de parmetros, en la que dos o ms parmetros
estn implicados.
El contraste sobre una combinacin lineal de parmetros se puede hacer por dos
procedimientos diferentes. En el primer procedimiento, el error estndar de la
combinacin lineal de los parmetros correspondientes a la hiptesis nula se calcula
utilizando informacin sobre la matriz de covarianza de los estimadores. En el segundo
procedimiento, el modelo se reparametriza mediante la introduccin de un nuevo
parmetro deducido de la hiptesis nula, despus se estima el modelo reparametrizado y
el contraste del nuevo parmetro nos indica s se rechaza, o no, la hiptesis nula. El
siguiente ejemplo ilustra ambos procedimientos.
EJEMPLO 4.7 Hay rendimientos constantes a escala en la industria qumica?
Para examinar si hay rendimientos constantes a escala en el sector qumico se va a utilizar la
funcin de produccin Cobb-Douglas, dada por
ln(output ) 1 2 ln(labor ) 3 ln(capital ) u

(4-20)

En el anterior modelo los parmetros2 y3 son elasticidades (produccin/trabajo y


produccin/capital).
Antes de hacer inferencias hemos de recordar que los rendimientos a escala se refieren a una
caracterstica tcnica de la funcin de produccin que analiza los cambios en la produccin debidas a un
cambio en la misma proporcin de todos los inputs, que en este caso son el trabajo y el capital. Si la
produccin cambia en la misma proporcin que los inputs entonces se dice que hay rendimientos
constantes a escala. Los rendimientos constantes a escala implican que si los factores trabajo y capital
aumentan a una cierta tasa (digamos el 10%), la produccin aumentar en la misma proporcin (esto es en
un 10%). Si la produccin aumenta en una mayor proporcin, entonces hay rendimientos crecientes a
escala. Si aumenta la produccin en una menor proporcin, existen rendimientos decrecientes a escala.
En el modelo anterior, sucede que:

17

- si 2+3=1, hay rendimientos constantes a escala.


- si 2+3>1, hay rendimientos crecientes a escala.
- si 2+3<1, hay rendimientos decrecientes a escala
Los datos utilizados en este ejemplo son una muestra de 27 empresas del sector de metales
primario (fichero prodmet), donde la produccin es el valor aadido bruto, el trabajo es una medida de la
mano de obra y el capital es el valor bruto de la planta y equipo. Detalles adicionales sobre la
construccin de estos datos se ofrecen en Aigne et al. (1977) y en Hildebrand y Liu (1957). Los
resultados obtenidos en la estimacin del modelo (4-20) aparecen en el cuadro 4.4.
CUADRO 4.4. Salida estndar de la estimacin de la funcin de produccin: modelo (4-20).
Variable
Coeficiente Error estndar Estadstico t
Prob.
constant
1.170644
0.326782
3.582339
0.0015
ln(labor)
0.602999
0.125954
4.787457
0.0001
ln(capital)
0.375710
0.085346
4.402204
0.0002
Para responder a la pregunta planteada en este ejemplo, tenemos que contrastar:
H 0 : 2 3 1

contra la hiptesis alternativa siguiente:


H1 : 2 3 1

De acuerdo con la H0, se deduce que 2 3 1 0 . Por lo tanto, el estadstico t se basa ahora
en si la suma estimada 2 3 1 es lo suficientemente diferente de 0 como para rechazar la H0 a favor
de la H1.
Para contrastar esta hiptesis se van a utilizar dos procedimientos. En el primer procedimiento se
utiliza la matriz de covarianzas de los estimadores. En el segundo, el modelo se reparametriza
introduciendo un nuevo parmetro.
Procedimiento que utiliza la matriz de covarianzas de los estimadores
De acuerdo con H0, se estima que 2 3 1 0 . Por lo tanto, el estadstico t est basado ahora
en si la suma estimada 2 3 1 es lo suficientemente diferente de 0 para rechazar la H0 a favor de la
H1. Para tener en cuenta el error de muestreo en nuestros estimadores, se estandariza esta suma dividiendo
por su error estndar:
3 1
t 2
2
3
ee( 2 3 )
As que, si t

2 3

es lo suficientemente grande, vamos a concluir, en un contraste de dos colas,

que no hay rendimientos constantes a escala. Por otro lado, si t

2 3

es positivo y lo suficientemente

grande, vamos a rechazar, en un contraste alternativo de una cola (la derecha), a H0 en favor de
H1 : 2 3 1 , concluyendo que s hay rendimientos crecientes a escala.
Por otro parte, tenemos que

ee( 2 3 ) var( 2 3 )
donde

var( 2 3 ) var( 2 ) var( 3 ) 2 covar( 2 , 3 )


Por lo tanto, para estimar ee( 2 3 ) se necesita informacin sobre la covarianza estimada de
los estimadores. Muchos paquetes de software economtrico, como el E-Views, tiene una opcin para
mostrar las estimaciones de la matriz de covarianzas del vector de los estimadores. En este caso, la matriz
de covarianzas obtenida aparece en el cuadro 4.5. Con esta informacin se tiene que
ee( ) 0.015864 0.007284 2 0.009616 0.0626
2

2 3 1 0.02129

0.3402
0.0626
ee( 2 3 )

18

CUADRO 4.5. Matriz de covarianza de la funcin de produccin.


constante
ln(labor)
ln(capital)
constant
0.106786
-0.019835
0.001189
ln(labor))
-0.019835
0.015864
-0.009616
ln(capital)
0.001189
-0.009616
0.007284
Teniendo en cuenta que t=0.3402, es evidente que no podemos rechazar la existencia de
rendimientos constantes de escala, para los niveles de significacin habituales. Dado que el estadstico t
toma un valor negativo, no tiene sentido contrastar si existen rendimientos crecientes a escala.
Procedimiento en el que se reparametriza el modelo mediante la introduccin de un nuevo parmetro
La aplicacin de este segundo procedimiento es una forma ms fcil de realizar este contraste.
En este procedimiento se estima un modelo diferente que proporciona directamente el error estndar en
que estamos interesados. As, en el ejemplo anterior vamos a definir:

2 3 1
por lo que la hiptesis nula de que hay rendimientos constantes a escala es equivalente a postular que
H0 : 0 .
De la definicin de se tiene que 2 3 1 . Sustituyendo 2 en la ecuacin original:
ln(output ) 1 ( 3 1) ln(labor ) 3 ln(capital ) u

Por lo tanto,
ln(output / labor ) 1 ln(labor ) 3 ln(capital / labor ) u

As pues, contrastar si existen rendimientos constantes a escala es equivalente a realizar un


contraste de significacin del coeficiente ln(labor) en el modelo anterior. La estrategia de reescribir el
modelo, de modo que contenga el parmetro de inters, funciona en todos los casos y normalmente es
fcil de implementar. Si aplicamos esta transformacin en este ejemplo, se obtienen los resultados del
cuadro 4.6.
Como puede verse se obtiene el mismo resultado:
t

0.3402
ee()

CUADRO 4.6. Salida de la estimacin de la funcin de produccin: modelo reparametrizado.


Variable
Coeficiente Error estndar Estadstico t
Prob.
constant
1.170644
0.326782
3.582339
0.0015
ln(labor)
-0.021290
0.062577
-0.340227
0.7366
ln(capital/labor)
0.375710
0.085346
4.402204
0.0002
EJEMPLO 4.8 Publicidad o incentivos?
La Compaa Bush se dedica a la venta y distribucin de regalos importados de Oriente
Prximo. El artculo ms popular en el catlogo es la pulsera de Guantnamo. Tiene algunas propiedades
relajantes. Los agentes de ventas reciben una comisin del 30% del importe total de las ventas. Con el fin
de aumentar las ventas sin necesidad de expandir la red comercial, la compaa estableci incentivos
especiales para aquellos agentes que rebasen el objetivo de ventas durante el ltimo ao.
Por otra parte, se emiten anuncios publicitarios en radio en diferentes regiones para fortalecer la
promocin de las ventas. En esos lugares se hizo especial hincapi en destacar el bienestar de llevar un
brazalete de Guantnamo.
El gerente de la Empresa Bush se pregunta si un dlar gastado en incentivos especiales tiene, o
no, una mayor incidencia en las ventas que un dlar gastado en publicidad. Para responder a esa pregunta
el econmetra de la compaa sugiere el siguiente modelo para explicar las ventas (sales):
sales 1 2 advert 3incent u

donde incent son los incentivos a los vendedores y advert son los gastos en publicidad. Las variables
sales, incent y advert estn expresadas en miles de dlares.

19

Utilizando una muestra de 18 reas de venta (fichero advincen), se han obtenido los resultados
de la regresin y la matriz de covarianzas de los coeficientes que aparecen en los cuadros 4.7 y 4.8,
respectivamente.
CUADRO 4.7. Salida estndar de la regresin para el ejemplo 4.8.
Variable
Coeficiente Error estndar Estadstico t
Prob.
constant
396.5945
3548.111
0.111776
0.9125
advert
18.63673
8.924339
2.088304
0.0542
incent
30.69686
3.604420
8.516448
0.0000
CUADRO 4.8. Matriz de covarianza para el ejemplo 4.8.
C
advert
constant
12589095
-26674
advert
-26674
79.644
incent
-7101
2.941

incent
-7101
2.941
12.992

En este modelo, el coeficiente 2 indica el aumento de las ventas producidas por un dlar de
incremento en el gasto en publicidad, mientras 3 indica el aumento que se produce en las ventas por un
dlar de incremento en los incentivos especiales, manteniendo fijo en ambos casos el otro regresor.
Para responder a la pregunta planteada en este ejemplo, la hiptesis nula y la hiptesis
alternativa son las siguientes:

H 0 : 3 2 0
H1 : 3 2 0
El estadstico t se construye utilizando la informacin sobre la matriz de covarianzas de los
estimadores:
3 2
t
3
2
ee( 3 2 )

ee( 3 2 ) 79.644 12.992 2 2.941 9.3142


t
3

3 2
30.697 18.637

1.295

9.3142
ee( 3 2 )

Para =0.10, nos encontramos con que t150.10 1.341 . Como t<1.341, no rechazamos H0 para
=0.10, ni para =0.05 o =0.01. Por lo tanto, no hay evidencia emprica de que un dlar gastado en
incentivos especiales tenga una mayor incidencia en las ventas que un dlar gastado en publicidad.
EJEMPLO 4.9 Contraste de la hiptesis de homogeneidad en la demanda de pescado
En el caso de estudio del captulo 2 fueron estimados diversos modelos, utilizando datos de corte
transversal, para explicar la demanda de productos lcteos en los que la renta disponible era la nica
variable explicativa. Sin embargo, el precio del producto estudiado y, en mayor o menor medida, los
precios de otros productos son determinantes en la demanda. El anlisis de la demanda sobre la base de
datos de corte transversal, tiene precisamente la limitacin de que no es posible examinar el efecto de los
precios en la demanda porque los precios se mantienen constantes, ya que los datos se refieren todos al
mismo punto en el tiempo. Para analizar el efecto de los precios es necesario el uso de datos de series
temporales o, alternativamente, de datos de panel. A continuacin vamos a examinar, brevemente,
algunos aspectos de la teora de la demanda de un bien para luego pasar a la estimacin de una funcin de
demanda con datos de series temporales. Como colofn a este caso, vamos a contrastar una de las
hiptesis que, en determinadas circunstancias, debe satisfacer un modelo terico.
La demanda de un bien -como el bien j- se puede expresar, de acuerdo con un proceso de
optimizacin llevado a cabo por el consumidor, en trminos de renta disponible, del precio de la
mercanca y de los precios del resto de bienes. Analticamente:
q j f j ( p1 , p2 , , p j , , pm , R )

donde
- R es la renta disponible de los consumidores.

20

(4-21)

- p1 , p2 , , p j , pm son los precios de los bienes que se tienen en cuenta por los
consumidores cuando adquieren el bien j.
En los estudios de demanda, los modelos logartmicos son atractivos, ya que los coeficientes son
directamente elasticidades. El modelo logartmico se expresa de la siguiente forma:
ln( q j 1 2 ln( p1 ) 3 ln( p2 ) j ln( p j ) m 1 ln( pm ) m 2 ln( R ) u

(4-22)

Como puede verse de forma inmediata, todos los coeficientes , excluyendo el trmino
constante, son elasticidades de diferentes tipos y, por lo tanto, son independientes de las unidades de
medida de las variables. Cuando no hay ilusin monetaria, si todos los precios y la renta crecen a la
misma tasa, la demanda de un bien no se ve afectada por estos cambios. Por lo tanto, suponiendo que los
precios y la renta se multiplican por si el consumidor no tiene ilusin monetaria, se debe satisfacer que
(4-23)
f j (l p1 , l p2 , , l p j , , l pm , l R ) f j ( p1 , p2 , , p j , pm , R )
Desde un punto de vista matemtico, la condicin anterior implica que la funcin de demanda
debe ser homognea de grado 0. Esta condicin se llama la restriccin de homogeneidad. Aplicando el
teorema de Euler, la restriccin de homogeneidad, a su vez implica que la suma de la elasticidad de
demanda/renta y de todas las elasticidades de demanda/precio es cero, es decir:
m

h 1

q j ph

qj R 0

(4-24)

Esta restriccin aplicada al modelo logartmico (4-22) implica que

2 3 j m 1 m 2 0

(4-25)

En la prctica, cuando se estima una funcin de demanda, los precios de muchos bienes no estn
incluidos, sino slo aquellos que estn estrechamente relacionados, ya sea por ser complementarios o por
ser sustitutivos del bien estudiado. Tambin es bien sabido que la asignacin presupuestaria del gasto se
suele realizar en varias etapas.
A continuacin, estudiaremos la demanda de pescado en Espaa, utilizando un modelo similar a
(4-22). Tengamos en cuenta que en una primera asignacin, el consumidor distribuye su renta entre el
consumo total y el ahorro. En una segunda etapa, el gasto de consumo por funcin se lleva a cabo
teniendo en cuenta el consumo total y los precios relevantes en cada funcin. En concreto, en la demanda
de pescado se ha supuesto que slo es relevante el precio del pescado y el precio de la carne que es el
sustitutivo ms importante.
Teniendo en cuenta las consideraciones anteriores, se ha formulado el siguiente modelo:
ln( fish 1 2 ln( fishpr ) 3 ln(meatpr ) 4 ln(cons ) u

(4-26)

donde fish es el gasto de pescado a precios constantes, fishpr es el precio del pescado, meatpr es el precio
de la carne y cons es el consumo total a precios constantes.
El fichero fishdem contiene informacin acerca de esta serie para el perodo 1964-1991. Los
precios son nmeros ndices con base 1986, y fish y cons son magnitudes a precios constantes tambin
con base en 1986. Los resultados de la estimacin de modelo (4-26) son los siguientes:

ln(
fish 7.788- 0.460 ln( fishpr ) + 0.554 ln(meatpr ) + 0.322 ln(cons )
i

(2.30)

(0.133)

(0.112)

(0.137)

Como se puede observar, los signos de las elasticidades son correctos: la elasticidad de la
demanda es negativo con respecto al precio del propio bien, mientras que las elasticidades con respecto al
precio del bien sustitutivo y con respecto al consumo total son positivos.
En el modelo de (4-26) la restriccin de homogeneidad implica la siguiente hiptesis nula:

2 3 4

(4-27)

Para realizar este contraste vamos a utilizar un procedimiento similar al del ejemplo 4.6. Ahora,
el parmetro se define de la siguiente forma

2 3 4

(4-28)

Haciendo 2 3 4 , se ha estimado el siguiente modelo:


ln( fish 1 ln( fishpr ) 3 ln(meatpr fishpr ) 4 ln(cons fishpr ) u

Los resultados obtenidos han sido los siguientes:

21

(4-29)


ln(
fishi 7.788- 0.4596 ln( fishpri ) + 0.554 ln(meatpri ) + 0.322 ln(consi )
(2.30)

(0.1334)

(0.112)

(0.137)

Usando (4-28), contrastar la hiptesis nula (4-27) es equivalente a contrastar que el coeficiente
de ln(fishpr) en (4-29) es igual a 0. Dado que el estadstico t para dicho coeficiente es igual a -3.44 y
0.01/ 2
=2.8, rechazamos la hiptesis de homogeneidad de la demanda de pescado.
t24

4.2.4 Importancia econmica versus significacin estadstica


Hasta ahora hemos hecho hincapi en la significacin estadstica. Sin embargo,
es importante recordar que debemos prestar atencin a la magnitud y el signo de los
coeficientes estimados, adems de a los estadsticos t.
La significacin estadstica de la variable xj se determina completamente por el
tamao de t , mientras que la importancia econmica de una variable se relaciona con
j

el tamao (y signos) de j . Si se pone demasiado nfasis en la significacin estadstica


puede conducirnos a la falsa conclusin de que una variable es "importante" para
explicar y, aunque su efecto estimado sea modesto.
As que, incluso si una variable es estadsticamente significativa, es necesario
analizar la magnitud del coeficiente estimado para tener una idea de su importancia
prctica o econmica.

4.3 Contraste de restricciones lineales mltiples utilizando el estadstico F.


Hasta ahora, slo hemos considerado hiptesis que implican una sola restriccin.
Pero con frecuencia, deseamos contrastar hiptesis mltiples sobre los parmetros
1, 2 , 3 ,, k .
En las restricciones lineales mltiples distinguiremos tres tipos: las restricciones
de exclusin, la significatividad del modelo y otras restricciones lineales.
4.3.1 Restricciones de exclusin
Hiptesis nula y alternativa; modelos no restringido y restringido
Comenzamos contrastando si un conjunto de variables independientes tiene o no
un efecto parcial sobre la variable dependiente, y. A este contrate se le denomina de
restricciones de exclusin. As, considerando el modelo

y 1 2 x2 3 x3 4 x4 5 x5 u

(4-30)

la hiptesis nula en un tpico ejemplo de restricciones de exclusin podra ser la


siguiente:

H0 : 4 5 0
Este es un ejemplo de restricciones mltiples, ya que se ha impuesto ms de una
restriccin en los parmetros del modelo. Un contraste de restricciones mltiples es
denominado tambin contraste conjunto de hiptesis.
La hiptesis alternativa se puede expresar de la siguiente manera
H1: H0 no es cierta
Es importante destacar que se estima H0 conjuntamente y no individualmente.
Ahora, vamos a distinguir entre el modelo no restringido (NR) y el restringido (R). El
22

modelo no restringido es el modelo de referencia o modelo inicial. En este ejemplo el


modelo no restringido es el modelo que figura en (4-30). El modelo restringido se
obtiene mediante la imposicin de H0 en el modelo original. En el anterior ejemplo el
modelo restringido es

y 1 2 x2 3 x3 u
Por definicin, el modelo restringido siempre tiene un menor nmero de
parmetros que el modelo no restringido. Adems, siempre se verifica que
SCRR SCRNR
donde SCRR es la SCR del modelo restringido, y SCRNR es la SCR del modelo no
restringido. Recuerde que, debido a que las estimaciones de los coeficientes por MCO
se eligen de forma que minimicen la suma de los cuadrados de los residuos, la SCR no
disminuye (y en general aumenta) cuando algunas restricciones (como la eliminacin de
variables) se introducen en el modelo.
El aumento en la SCR cuando se imponen restricciones puede indicarnos algo
sobre si es verosmil la H0. Si el incremento es grande, esto es una evidencia en contra
de H0, y esta hiptesis ser rechazada. Si el incremento es pequeo, esto no ser una
evidencia en contra de H0, y esta hiptesis no ser rechazada. La pregunta es entonces si
el aumento observado en la SCR cuando se imponen las restricciones, es
suficientemente grande, en relacin con la SCR en el modelo no restringido, para
justificar el rechazo de H0.
La respuesta depende claro est de pero no podemos llevar a cabo el
contraste sobre el seleccionado hasta que tengamos un estadstico cuya distribucin
sea conocida y est tabulado bajo la H0. Por lo tanto, necesitamos una manera de
combinar la informacin de la SCRR y de la SCRNR para obtener un estadstico de
contraste con una distribucin conocida bajo H0.
Ahora, veamos el caso general, donde el modelo no restringido es el siguiente:

y 1 2 x2 3 x3 k xk +u

(4-31)

Supongamos que hay q restricciones de exclusin a contrastar. Entonces, H0


postula que q variables tienen coeficientes cero. Si se asume que son las ltimas q
variables, la H0 se expresa como

H 0 : k q 1 k q 2 k 0

(4-32)

El modelo restringido se obtiene mediante la imposicin de q restricciones de la


H0 en el modelo no restringido:

y 1 2 x2 3 x3 k q xk q +u

(4-33)

La H1 se expresa como
H1: H0 no es cierta

(4-34)

Estadstico de contraste: la ratio F


El estadstico F, o la ratio F, est definido por

( SCRR SCRSR ) / q
SCRSR / (n k )
23

(4-35)

donde SCRR es el SCR del modelo restringido, SCRNR es el SCR del modelo no
restringido y q es el nmero de restricciones, es decir, el nmero de igualdades en la
hiptesis nula.
Para poder utilizar el estadstico F para el contraste de hiptesis, debemos
conocer su distribucin muestral bajo H0 con el fin de elegir el valor de c para un
dado, y determinar la regla de rechazo. Se puede demostrar que, bajo la H0, y
asumiendo que los supuestos del MLC se mantienen, el estadstico F se distribuye como
una variable aleatoria F de Snedecor con q y n-k grados de libertad. Escribimos este
resultado de la siguiente manera

F | H 0 Fq,n-k

(4-36)

Una F de Snedecor con q grados de libertad en el numerador y n-k grados de


libertad en el denominador es igual a
Fq ,n k

2
q

x nk n k

(4-37)

donde xq2 y xn2 k son distribuciones Chi-cuadrado independientes la una de la otra.


En (4-35) se observa que los grados de libertad que corresponden a la SRCNR
(glNR) son n-k. Recuerde que
2
NR

SCRNR
nk

(4-38)

Por otro lado, los grados de libertad que corresponden a la SRCR (glR) son nk+q, porque en el modelo restringido se estiman k-q parmetros. Los grados de libertad
que corresponde a SCRR-SCRSR son
(n-k+q)-(n-k)=q = nmero de grados de libertad=glR-glNR
As, en el numerador de la F, la diferencia entre las SCR se divide por q, que es
el nmero de restricciones impuestas al pasar del modelo no restringido al restringido.
En el denominador de la F, SCRNR se divide por glNR. De hecho, el denominador de la F
es justamente el estimador de 2 en el modelo no restringido.
La ratio F debe ser mayor que o igual a 0, puesto que SCRR SCRNR 0 .
A menudo es conveniente tener una forma del estadstico F tal que pueda ser
calculada a partir del R2 de los modelos restringido y no restringido.
2
),
Utilizando el hecho de que SCRR SCT (1 RR2 ) y SCRNR SCT (1 RNR
podemos expresar (4-35) del siguiente modo
2
( RSR
RR2 ) / q
F
2
(1 RSR
) / (n k )

(4-39)

ya que el trmino SCT se cancela.


Esto expresin se denomina la forma R-cuadrado del estadstico F.
Considerando que aunque la forma R-cuadrado del estadstico F es muy
conveniente para contrastar restricciones de exclusin, no puede aplicarse para
contrastar todo tipo de restricciones lineales. Por ejemplo, la ratio F (4-39) no puede
24

utilizarse cuando el modelo no tiene trmino independiente ni cuando la forma


funcional de la variable endgena en el modelo restringido no es la misma que en el
modelo no restringido.
Regla de decisin
La distribucin Fq,n-k est tabulada y disponible en tablas estadsticas, donde se
busca el valor crtico ( Fq,nk ), que depende de (nivel de significacin), q (gl del
numerador), y n-k, (gl del denominador). Teniendo en cuenta lo anterior, la regla de
decisin es muy simple.
Regla de decisin
Si

F Fq,n k

se rechaza

Si

F Fq,n k

no se rechaza H 0

H0

(4-40)

Por lo tanto, rechazamos la H0 en favor de la H1 en cuando F Fq,n k , como


puede verse en la figura 4.15. Es importante destacar que cuando disminuye, aumenta
Fq,nk . Si se rechaza la H0, entonces decimos que xk q 1 , xk q 2 ,, xk son
estadsticamente significativos conjuntamente, o, ms
conjuntamente, para el nivel de significacin seleccionado.

breve,

significativos

Este contraste por s solo no nos permite decir cules de las variables tienen un
efecto parcial sobre y, ya que todas ellas pueden afectar a y, o tal vez slo una afecta a y.
Si no se rechaza H0, entonces decimos que no son estadsticamente significativas
conjuntamente, o simplemente que no son significativas conjuntamente, lo que a
menudo justifica su eliminacin del modelo. El estadstico F es a menudo til para
contrastar la exclusin de un grupo de variables cuando las variables del grupo estn
altamente correlacionadas entre s.
Regin
de no
rechazo
RNR

Regin de
Rechazo
RR

Rechazado
para
p-value

Fq ,nk

No
rechazado
para
<p-value

Fq ,nk

p-value

Fq,nk

FIGURA 4.15. Regin de rechazo y regin de no


FIGURA 4.16. Valor-p utilizando la distribucin F.
rechazo utilizando la distribucin F.

En el contexto del estadstico F, el valor-p se define como

valor - p Pr(F F ' | H0 )


donde F es el valor real del estadstico de contraste y F ' designa una variable aleatoria
F de Snedecor con q y n-k grados de libertad.
25

El valor-p tiene la misma interpretacin que en el estadstico t. Un valor-p


pequeo es una evidencia en contra de la H0. Por el contrario, un valor-p elevado no
constituye una evidencia en contra de la H0. Una vez que valor-p ha sido calculado, el
contraste F puede llevarse a cabo para cualquier nivel de significacin. En la figura 4.16
se representa este enfoque alternativo. Como se desprende de la observacin de la
figura, la determinacin del valor-p es la operacin inversa a la de encontrar el valor en
las tablas estadsticas para un determinado nivel de significacin. Una vez que el valorp ha sido determinado, se sabe que se rechaza H0 para cualquier nivel de significacin
tal que >valor-p; por el contrario, la hiptesis nula no se rechaza cuando <valor-p.
EJEMPLO 4.10 Salarios, experiencia, antigedad y edad
El siguiente modelo ha sido formulado para analizar los factores determinantes de los salarios:
ln( wage) 1 2 educ 3 exper 4 tenure 5 age u

donde wage son los salarios mensuales, educ son los aos de educacin, exper son los aos de experiencia
laboral, tenure son los aos trabajando con la empresa actual, y age es la edad en aos.
El investigador tiene la intencin de excluir tenure del modelo, ya que en muchos casos es igual
a la experiencia, y tambin la edad, ya que est altamente correlacionada con la experiencia. Es
aceptable la exclusin de ambas variables?
Las hiptesis nula y alternativa son las siguientes:

H 0 : 4 5 0
H1 : H 0 no es cierta
El modelo restringido correspondiente a esta H0 es
ln( wage) 1 2 educ 3 exper u

Utilizando una muestra de 53 observaciones del fichero wage2, se han obtenido las siguientes
estimaciones para los modelos no restringido y restringido:

ln(
wagei ) = 6.476 + 0.0658educi + 0.0267experi - 0.0094tenurei - 0.0209agei SCR = 5.954

ln(
wagei ) = 6.157 + 0.0457 educi + 0.0121experi

SCR = 6.250

La ratio F obtenida es la siguiente:

SCRR SCRNR / q
SCRNR / (n k )

(6.250 5.954) / 2
1.193
5.954 / 48

Teniendo en cuenta que el estadstico F es bajo, vamos a ver qu sucede con un nivel de
significacin del 0.10. En este caso, los grados de libertad para el denominador son 48 (53 observaciones
menos 5 parmetros estimados). Si buscamos en las tablas el estadstico F para 2 grados de libertad en el
0.10
0.10
F2,45
= 2.42. Como F<2.42
numerador y 45 grados de libertad en el denominador, encontramos F2,48
no se rechaza H0. Si no se rechaza la H0 para 0.10, no se rechazar tampoco para 0.05 o 0.01, como se
puede en la figura 4.17. Por lo tanto, no podemos rechazar H0 en favor de H1. En otras palabras, la
antigedad en la empresa y la edad no son conjuntamente significativas.

26

0.10
Regin de
rechazo
RR
0.05

0.01

3.23

5.18

Regin
de no
rechazo
RNR

F2.48

2.42

1.193

FIGURA 4.17. Ejemplo 4.10: Regin de rechazo en la distribucin F (los valores son para F2.40).

4.3.2 Significacin global del modelo


Contrastar la significacin del modelo, o significacin global del modelo, es un
caso particular de los contrastes de restricciones de exclusin. Se podra pensar que este
contraste la H0 debera ser la siguiente:

H0 : 1 2 3 k 0

(4-41)

Sin embargo, esto no es la H0 adecuada para contrastar la significatividad global


del modelo. Si 2 3 k 0 , entonces el modelo restringido sera el siguiente:
y 1 +u

(4-42)

Si tomamos esperanzas en (4-42), tenemos que

E( y) 1

(4-43)

As, la H0 en (4-41) implica que no slo que las variables explicativas no tienen
ninguna influencia sobre la variable endgena, sino tambin que la media de la variable
endgena -por ejemplo, el consumo medio- es igual a 0.
Por lo tanto, si queremos conocer si el modelo es globalmente significativo, la
H0 debe ser la siguiente:

H0 : 2 3 k 0

(4-44)

El correspondiente modelo restringido dado en (4-42) no explica nada y, por lo


tanto, RR2 es igual a 0. Entonces, contrastar la H 0 dada en (4-44) es muy fcil utilizando
la forma R-cuadrado del estadstico F:
R2 / k
F
(1 R 2 ) / (n k )

(4-45)

2
donde R 2 = RNR
, ya que slo es necesario estimar el modelo no restringido, debido a

que el R 2 del modelo (4-42) -modelo restringido- es igual a 0.


EJEMPLO 4.11 Salarios de los directores ejecutivos
Considere la siguiente ecuacin para explicar los salarios (salary) de los directores ejecutivos en
funcin de las ventas anuales de la firma (sales), la rentabilidad sobre recursos propios (roe) (en forma de
porcentaje), y el rendimiento de las acciones de la empresa (ros) (en forma de porcentaje):
ln(salary) =1+2ln(sales)+3roe+4ros+ u.

27

La pregunta que se plantea es si el rendimiento de la empresa medido por las variables sales, roe
y ros es crucial para establecer los salarios de los directores ejecutivos. Para responder a esta pregunta
vamos a hacer un contraste de significacin global. Las hiptesis nula y alternativa son las siguientes:
H 0 : 2 3 4 0

H1: H0 no es cierta
El cuadro 4.9 muestra una salida de E-views completa de mnimos cuadrados (ls), utilizando el
fichero ceosal1. En la parte inferior puede verse el "estadstico F" para el contraste de significacin
global, as como "Prob.", que es el valor-p correspondiente a este estadstico. En este caso valor-p es
igual a 0, es decir, se rechaza H0 para todos los niveles de significacin (Vase la figura 4.18). Por lo
tanto, podemos rechazar que el rendimiento de la empresa no tenga ninguna influencia sobre los salarios
de los directores ejecutivos.
p-value
0,0000
0,10

0,05

0,01

2,12

2,67

3,92

F3,205

26,93

FIGURA 4.18. Ejemplo 4.11: Valor-p utilizando la distribucin F (los valores para una F3,140).
CUADRO 4.9. Salida completa de E-views en el ejemplo 4.11.
Dependent Variable:
LOG(SALARY)
Method: Least Squares
Date: 04/12/12 Time: 19:39
Sample: 1 209
Included observations: 209
Variable
C
LOG(SALES)
ROE
ROS
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

Coefficient

Std. Error

4.311712
0.280315
0.017417
0.000242
0.282685
0.272188
0.483185
47.86082
-142.5213
2.033496

0.315433
0.03532
0.004092
0.000542

t-Statistic
13.66919
7.936426
4.255977
0.446022

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

Prob.
0.0000
0.0000
0.0000
0.6561
6.950386
0.566374
1.402118
1.466086
26.9293
0.0000

4.3.3 Estimando otras restricciones lineales


Hasta el momento, hemos contrastado hiptesis con restricciones de exclusin
mediante la utilizacin estadstico F. Pero tambin podemos contrastar hiptesis con
restricciones lineales de cualquier tipo. Por lo tanto, podemos combinar varios tipos de
restricciones: restricciones de exclusin, restricciones que imponen determinados

28

valores a los parmetros y restricciones relativas a una combinacin lineal de los


parmetros.
As, consideremos el siguiente modelo

y 1 2 x2 3 x3 4 x4 5 x5 u
con la hiptesis nula:
2 3 1

4 3
H0 :

5 0

El modelo restringido correspondiente a esta hiptesis nula es

( y x2 3x4 ) 1 3 ( x3 x2 ) u
En el ejemplo 4.12, que se ver a continuacin, la hiptesis nula consiste en dos
restricciones: una combinacin lineal de parmetros y una restriccin de exclusin.
EJEMPLO 4.12 Una restriccin adicional en la funcin de produccin. (Continuacin del ejemplo
4.7)
En la funcin de produccin de Cobb-Douglas, vamos a contrastar la siguiente H0, que tiene 2
restricciones:
3 1
H0 : 2
1 0

H1 : H 0 no es cierta

En la primera restriccin se impone que hay rendimientos constantes a escala. En la segunda


restriccin que 1, el parmetro relacionado con la productividad total de los factores, es igual a 0.
Sustituyendo la restriccin de H0 en el modelo original (modelo sin restricciones), tenemos
ln(output ) (1 3 ) ln(labor ) 3 ln(capital ) u

Operando, se obtiene el modelo restringido:


ln(output / labor ) 3 ln(capital / labor ) u

En la estimacin de los modelos no restringido y restringido, obtenemos que SCRR=3.1101 y


SCRNR=0.8516. Por lo tanto, la ratio F es igual a

SCRR SCRNR / q
SCRNR / (n k )

(3.1101 0.8516) / 2
13.551
0.8516 / (27 3)

Hay dos razones para no utilizar R2 en este caso. En primer lugar, el modelo restringido no tiene
trmino independiente. En segundo lugar, el regresando del modelo restringido es diferente del
regresando del modelo no restringido.
Dado que el valor de F es relativamente alto, vamos a empezar el contrastar con un nivel de
0.01
5.61 . Teniendo en cuenta que F>5.61, rechazamos H0 en favor
significacin del 1%. Para =0.01, F2,24
de H1. Por lo tanto, se rechaza la hiptesis conjunta de que hay rendimientos constantes a escala y de que
el parmetro 1 es igual a 0. Si se rechaza H0 para =0.01, tambin ser rechazada para los niveles de 5%
y 10%.

4.3.4 Relacin entre los estadsticos F y t


Hasta ahora, hemos visto cmo se utiliza el estadstico F para contrastar varias
restricciones en el modelo, pero tambin puede utilizarse para contrastar una sola
restriccin. En este caso, podemos elegir entre el estadstico F o el estadstico t para
hacer un contraste de dos colas. En cualquier caso, las conclusiones sern exactamente
las mismas.
29

Ahora bien,
b
cul es la relac in entre una
u F con un grado dde libertad en el
numeerador (paraa contrastar una sola reestriccin) y una t? Se puede
p
demoostrar que

tn2k F1,nk

(4-46)
(

Este heccho se ilustra en la ffigura 4,19.. Se observ


va que la ccola de la F ha
desdooblado en laas dos colass de la t. Porr lo tanto, lo
os dos enfoques conduucen exactam
mente
al miismo resultaado, siemprre que la hipptesis alteernativa sea de dos colaas. Sin emb
bargo,
el esttadstico t es
e ms flexiible para coontrastar una hiptesis con una solla restricci
n, ya
que ppuede utilizzarse para ell contrastar la H0 contra una alternativa de soola cola.

FIGURA 4.19. Relacin enttre F1,n-k y t n-k.

Adems,, dado que los estadstticos t son tambin


t
ms fciles dee obtener qu
ue los
estaddsticos F, en realidad
d no hay un
una buena razn
r
para usar un esstadstico F para
contrrastar una hiptesis
h
con
n una sola reestriccin.

4.4 C
Contrastess sin norm
malidad
La norm
malidad de los estimadoores de MC
CO dependee crucialmen
ente del sup
puesto
de noormalidad de
d las pertu
urbaciones. Qu sucede si las peerturbacionees no tienen
n una
distriibucin norrmal? Hemo
os visto quee las perturrbaciones baajo los supuuestos de GaussG
Markkov, y en coonsecuenciaa, los estim
madores de MCO
M
tienen
n una distribbucin asin
nttica
norm
mal, es decirr, tienen aprroximadameente una disstribucin normal.
Si las peerturbacionees no son noormales, el estadstico t no tiene uuna distribuccin t
exacta, sino sloo aproxima
ada. Como ppuede versee en la tablaa de la t de Student, paara un
tamaao muestraal de 60 obsservacioness los puntoss crticos so
on prcticam
mente igual a los
de laa distribucin normal esstndar.
Del mism
mo modo, si las perturbbaciones no
o son normales, el estaddstico F no tiene
una distribucinn F exacta, sino sloo aproximad
da, cuando el tamaoo muestral es lo
suficcientemente grande y los supueestos de Gauss-Marko
G
ov se cum
mplen. Ento
onces,
podeemos utilizaar el estadsstico F paraa contrastarr las restriccciones lineeales en mo
odelos
lineaales como unn contraste aproximadoo.
Hay otroos contrastees asintticoos (la razn
n de verosim
militud, el m
multiplicad
dor de
Lagrrange y el coontraste de Wald) basaados en las funciones de
d verosimillitud que pu
ueden
utilizzarse en conntrastar restrricciones linneales cuan
ndo las pertu
urbaciones nno se distrib
buyen
norm
malmente. Estos tres estadsticoos tambin
n pueden aplicarse cuando a) las
restriicciones son no lineales, y b) el modelo es no lineal en
e los parmetros. Parra las
30

restricciones no lineales, en los modelos lineales y no lineales, el contraste ms utilizado


es el contraste de Wald.
Para contrastar los supuestos del modelo (por ejemplo, los de homoscedasticidad
y no autocorrelacin) se aplica generalmente el multiplicador de Lagrange (ML). En la
aplicacin del contraste de ML se estima a menudo una regresin auxiliar. El nombre
de regresin auxiliar significa que los coeficientes no son de inters directo: de esta
regresin auxiliar slo se conserva el R2. En una regresin auxiliar el regresando es, por
lo general, los residuos o funciones de los residuos, obtenidos en la estimacin por
MCO del modelo original, mientras que las variables independientes son, a menudo, los
regresores (y/o funciones de los mismos) del modelo original.

4.5 Prediccin
En este epgrafe se examinarn dos tipos de prediccin: prediccin puntual y
prediccin por intervalos.
4.5.1 Prediccin puntual
La obtencin de una prediccin puntual no plantea ningn problema especial,
puesto que es una operacin simple de extrapolacin en el contexto de mtodos
descriptivos.
0

Designemos por x2 , x3 , , xk los valores especficos de cada uno de los k


regresores en la prediccin; estos valores pueden o no corresponder a un punto real de
datos en nuestra muestra. Si sustituimos estos valores en el modelo de regresin
mltiple, tenemos

y0 1 2 x20 3 x30 ... k xk0 u0 0 u0

(4-47)

Por tanto, la esperanza, o media, del valor de y viene dada por

E( y0 ) 1 2 x20 3 x30 ... k xk0 0

(4-48)

La prediccin puntual se obtiene de forma inmediata mediante la sustitucin de


los parmetros de (4-48) por los estimadores de MCO correspondientes:

0 1 2 x20 3 x30 k xk0

(4-49)

Para obtener (4-49) no se necesita postular ningn supuesto estadstico. Pero, si


adoptamos los supuestos 1 a 6 del MLC, es fcil concluir que 0 es un predictor
insesgado de 0
E 0 E 1 2 x20 3 x30 k xk0 1 2 x20 3 x30 ... k xk0 0 (4-50)
Por otra parte, adoptando los supuestos de Gauss Markov (1 a 8), se puede
demostrar que este predictor puntual es el estimador lineal insesgado ptimo (ELIO).
Tenemos ahora una prediccin puntual para 0, pero, cul es la prediccin
puntual para y0? Para responder a esta pregunta tenemos que predecir u0. Como el error
no es observable, el mejor predictor de u0 es su valor esperado, que es 0. Por lo tanto,

y 0 0

31

(4-51)

4.5.2 Prediccin por intervalos


Las predicciones puntuales hechas con un modelo economtrico no coincidirn,
en general, con los valores observados, debido a la incertidumbre que rodea a los
fenmenos econmicos.
La primera fuente de incertidumbre es que no podemos utilizar la funcin de
regresin poblacional, ya que no conocemos los parmetros . En su lugar tenemos que
utilizar la funcin de regresin muestral. El intervalo de confianza para el valor
esperado -es decir, para 0 -, que examinaremos a continuacin, incluye slo este tipo
de incertidumbre.
La segunda fuente de incertidumbre es que en un modelo economtrico, adems
de la parte sistemtica, hay una perturbacin que no es observable. La prediccin por
intervalo para un valor individual -es decir para y0-, que se discutir ms adelante
incluye tanto la incertidumbre derivada de la estimacin, como del trmino de
perturbacin.
Una tercera fuente de incertidumbre puede provenir del hecho de no saber
exactamente los valores que las variables explicativas tomarn en el momento de
prediccin. Esta tercera fuente de incertidumbre, que no se aborda aqu, complica los
clculos para la construccin de intervalos.
Intervalo de confianza para el valor esperado
Si queremos predecir el valor esperado de y, esto es 0 , entonces, el error de
prediccin e10 ser e10 0 0 . De acuerdo con (4-50), el error de prediccin esperado
es cero. Bajo los supuestos del MLC,
e10
0 0

tn k
ee(0 ) ee(0 )

Por lo tanto, podemos escribir que

0 0 / 2
Pr tn/k2
tn k 1
ee( 0 )

Operando, podemos construir un intervalo de confianza (IC) del (1-% para 0


con la siguiente estructura:
Pr 0 ee(0 ) tn/2k 0 0 ee(0 ) tn/2k 1

(4-52)

Para obtener un IC para 0 , necesitamos conocer el error estndar ( ee(0 ) ) para

0 . En cualquier caso, hay una manera fcil de estimarlo. As, resolviendo (4-48) para
1 vemos que 1 0 2 x20 3 x30 ... k xk0 . Poniendo este resultado en la ecuacin
(4-47), obtenemos

y 0 2 ( x2 x20 ) 3 ( x3 x30 ) k ( xk xk0 ) u

(4-53)

Aplicando MCO a (4-53), adems de la prediccin puntual, se obtiene ee(0 ) ,


que es el error estndar correspondiente al trmino independiente de esa regresin. El
mtodo anterior nos permite obtener un IC de E(y), de la estimacin por MCO, para
distintos valores de los regresores.
32

Prediccin por intervalos para un valor individual


Ahora vamos a construir un intervalo para y0, al que se denomina prediccin por
intervalos para un valor individual, o de un modo ms breve, prediccin por intervalos.
De acuerdo con (4-47), y0 tiene dos componentes:

y0 0 u0

(4-54)

El intervalo para el valor esperado construido previamente es un intervalo de


confianza alrededor de 0 , que es una combinacin de los parmetros. En contraste, el
intervalo para y0 es aleatorio, porque uno de sus componentes, u0, es aleatorio. Por lo
tanto, el intervalo para y0 es un intervalo probabilstico y no un intervalo de confianza.
El mecanismo para su obtencin es el mismo, pero teniendo en cuenta que ahora vamos
a considerar que el conjunto x20 , x30 ,, xk0 se encuentra fuera de la muestra utilizada para
estimar la regresin.
0
El error de prediccin de y al predecir y0 es

e20 y0 y 0 0 u0 y 0

(4-55)

Teniendo en cuenta (4-51) y (4-50), y que E(u0)=0, entonces el error de


prediccin esperado es cero. En la bsqueda de la varianza de e20 , debe tenerse en
0
cuenta que u0 no est correlacionado con y , porque x20 , x30 ,, xk0 no pertenecen a la
muestra.

Por lo tanto, la varianza del error de prediccin (condicionada a x) es la suma de


las varianzas:

Var (e20 ) Var ( y 0 ) Var (u0 ) Var ( y 0 ) 2

(4-56)

As pues, hay dos fuentes de variacin en e20 :


0

1. El error de muestreo de y surge porque se han estimado las j.


2. La ignorancia de los factores no observados que afectan a y, los cuales se
reflejan en 2.
Bajo los supuestos del MLC, e20 tambin se distribuye normalmente. Utilizando
el estimador insesgado de 2 y teniendo en cuenta que var ( y 0 ) var (0 ) , podemos
definir el error estndar (ee) de e20 como

ee(e ) ee(0 ) 2
0
2

1
2

(4-57)

Por lo general, 2 es mayor que ee( 0 ) . Bajo los supuestos del MLC,
e20
tn k
ee(e20 )

(4-58)

Por lo tanto, podemos escribir que

e20
Pr tn/2k
tn/2k 1
0
ee(e2 )

33

(4-59)

Al sustituir e2 y y en (4-59) y reordenando se obtiene un intervalo de


prediccin del (1-% para y0:
0

Pr y 0 ee(e20 ) tn/2k y 0 y 0 ee(e20 ) tn/2k 1

(4-60)

EJEMPLO 4. 13 Cul es la puntuacin esperada en el examen final si se han obtenido 7 puntos en la


primera evaluacin?
Se ha estimado el siguiente modelo para comparar las puntuaciones en el examen final (finalmrk)
y en la primera evaluacin (primeval) de Econometra:

finalmrk = 4.155 + 0.491 primeval


i

(0.715)

=1.649

(0.123)

R2=0.533

n=16

Para estimar la nota final esperada para un estudiante con primeval0= 7 en la primera evaluacin,
se estim el siguiente modelo, de acuerdo con (4-53):

finalmrk = 7.593 + 0.491( primeval - 7)


i

(0.497)

(0.123)

=1.649 R2=0.533

n=16

La prediccin puntual de partida para primeval = 7 es 0 = 7.593 y los lmites inferior y superior
de un IC del 95%, respectivamente, vienen dados por
0 0 ee(0 ) t 0.05/ 2 7.593 0.497 2.14 6.5
0

14

0 ee(0 ) t140.05/ 2 7.593 0.497 2.14 8.7


0

Por lo tanto, el estudiante tendr una confianza del 95% de obtener, en promedio, una
calificacin final situada entre 6.5 y 8.7.
La prediccin puntual puede obtenerse tambin a partir de la primera ecuacin estimada:

finalmrk = 4.155 + 0.4917 = 7.593


Ahora, vamos a estimar un intervalo de probabilidad del 95% para el valor individual. El error
estndar de e20 es igual a

ee(e20 ) ee( y 0 ) 2

1
2

0.497 2 1.6492 1.722

donde 1.649 es el error estndar de la regresin (E.E.), se ha obtenido de la salida de E-views


directamente.
Los lmites inferior y superior de un intervalo de probabilidad del 95%, respectivamente, vienen
dados por

y0 y 0 ee(e20 ) t140.025 7.593 1.722 2.14 3.7


y 0 y 0 ee(e20 ) t140.025 7.593 1.722 2.14 11.3

Hay que tener en cuenta que este intervalo de probabilidad es bastante grande debido a que el
tamao de la muestra es muy pequeo.
EJEMPLO 4.14 Prediciendo el salario de los directores ejecutivos
Utilizando los datos de las empresas ms importantes de EE.UU. tomadas de Forbes (fichero
ceoforbes), se ha estimado la siguiente ecuacin para explicar los salarios (incluyendo bonificaciones)
anuales obtenidos (en miles de dlares) en 1999 por los directores ejecutivos de esas empresas:
= 1381 + 0.008377 assets + 32.508 tenure + 0.2352 profits
salary
i

(104)

(0.0013)

(8.671)

=1506 R2=0.2404

(0.0538)

n=447

donde assets son los activos totales de la firma en millones de dlares, tenure es el nmero de aos como
director ejecutivo de la compaa, y profits son los beneficios en millones de dlares.
En el cuadro 4.10 aparecen las medidas descriptivas de las variables explicativas del modelo de
los salarios de los directores generales.

34

CUADRO 4.10. Medidas descriptivas de las variables del modelo sobre el


salario de los ejecutivos.
assets
tenure
profits
Media
27054
7.8
700
Mediana
7811
5.0
333
Mximo
668641
60.0
22071
Mnimo
718
0.0
-2669
N. observaciones
447
447
447
Los salarios predichos y los correspondiente ee( 0 ) para valores seleccionados (mximo, media,
mediana y mnimo), utilizando un modelo como el (4-53), se presentan en el cuadro 4.11.
CUADRO 4.11. Predicciones para los valores seleccionados.
Prediccin 0
E. estndar ee( 0 )
Valor medio
2026
71
Valor de la mediana
1688
78
Valor del mximo
14124
1110
Valor del mnimo
760
195

4.5.3 Prediccin de y en un modelo logartmico


Considere el modelo en logaritmos:

ln( y) 1 2 x2 3 x3 k xk +u

(4-61)

Una vez obtenidas las estimaciones por MCO, podemos predecir ln(y) de la
siguiente forma

y ) 1 2 x2 k xk
ln(

(4-62)

Tomando antilogaritmos en (4-62), obtenemos el valor de prediccin para y:

y exp(ln(
y )) exp( 1 2 x2 k xk )

(4-63)

Sin embargo, esta prediccin es sesgada e inconsistente, ya que


sistemticamente subestima el valor esperado de y. Veamos el por qu. Si aplicamos
antilogaritmos a (4-61), tenemos que

y exp( 1 2 x2 3 x3 k xk ) exp(u )

(4-64)

Antes de tomar las esperanzas en (4-64), hay que tener en cuenta que si
2
u~N(0,2), entonces E (exp(u )) exp . Por lo tanto, bajo los supuestos 1 al 9 del
2
MLC tenemos que

E( y) exp(1 2 x2 3 x3 k xk ) exp( 2 / 2)

(4-65)

Tomando como referencia (4-65) el predictor adecuado de y es

y = exp(b1 + b2 x2 ++ bk xk )exp(s 2 / 2) = y exp(s 2 / 2)

(4-66)

donde 2 es el estimador insesgado de 2.


Es importante destacar que y es un predictor sesgado pero consistente, mientras
que y es sesgado e inconsistente.

35

EJEMPLO 4.15 Prediciendo el salario de los directores ejecutivos con un modelo logartmico
(continuacin de 4.14)
Utilizando los mismos datos que en el ejemplo 4.14, se estim el siguiente modelo:

ln(
salary ) = 5.5168 + 0.1885ln(assets ) + 0.0125 tenure + 0.00007 profits
i

(0.210)

(0.0232)

(0.0032)

=0.5499 R2=0.2608

(0.0000195)

n=447

En el salario, salary, y en los activos, assets, se han tomado logaritmos naturales, pero las
ganancias, profits, estn en niveles es decir, sin ninguna transformacin, debido a que algunas
observaciones son negativas, por lo que no es posible tomar logaritmos.
En primer lugar, vamos a estimar la prediccin de acuerdo con (4-63) para un director ejecutivo
que trabaja en una empresa con activos assets =10000, tenure=10 aos y profits=1000:

= exp(ln(
salary
salary ))
i

= exp(5.5168 + 0.1885ln(10000) + 0.012510 + 0.00007 1000) = 1716

Ahora, utilizando (4-66), se obtiene la siguiente prediccin que es consistente:

= exp(0.54992 / 2)1716 = 1996


salary

4.5.4 Evaluacin de las predicciones y prediccin dinmica


En esta seccin vamos a comparar las predicciones realizadas con un modelo
economtrico y los valores realmente observados a fin de evaluar la capacidad
predictiva del modelo. Tambin examinaremos la prediccin dinmica en modelos en
los que hay variables endgenas retardadas incluidas como regresores.
Estadsticos para evaluacin de predicciones
Supongamos que se realizan predicciones para i=n+1, n+2,, n+h, y que se
designa el valor real y el previsto en el perodo i como yi e y i , respectivamente. Ahora,
vamos a presentar algunos de los estadsticos ms usuales utilizados para la evaluacin
de las predicciones.
Error absoluto medio (EAM)
El MEA se define como la media de los valores absolutos de los errores:
n+h

EAM

i n+1

yi - yi

(4-67)

Al tomar valores absolutos de los errores se evita que los errores positivos se
compensen con los negativos.
Error absoluto medio en porcentaje (EAMP),
n+ h

EAMP i n+1

yi - yi
yi
h

100

(4-68)

Raz del error cuadrtico medio (RECM)


Este estadstico se define como la raz cuadrada del error cuadrtico medio:

36

n+h

( yi - yi )

i n+1

RECM

(4-69)

Como se toman los cuadrados de los errores, se evita la compensacin entre


errores positivos y negativos. Es importante remarcar que la RECM impone una
penalizacin mayor a los errores de prediccin que el EAM.
Coeficiente de desigualdad de Theil (U)
Este coeficiente se define como sigue:
n+ h

( yi - yi )

i n+1

h
n+h

i n+1

n +h

yi2
+

i n+1

(4-70)
yi2

Cuanto ms pequeo es U ms precisas son las predicciones. La escala de U es


tal que siempre est entre 0 y 1. Si U=0, yi= y i para todas las predicciones; si U=1, la
prediccin es tan mala como pueda ser. El estadstico U de Theil puede ser reescalado y
descomponerse en 3 proporciones: el sesgo, la varianza y la covarianza. Por supuesto, la
suma de estas tres proporciones es 1. La interpretacin de estas tres proporciones es la
siguiente:
1) El sesgo refleja errores sistemticos. Cualquiera que sea el valor de U,
esperaramos que el sesgo est cercano a 0. Un sesgo grande sugiere que las
predicciones estn sistemticamente por encima, o por debajo, de los valores
reales.
2) La varianza refleja tambin errores sistemticos. El tamao de esta
proporcin es una indicacin de la incapacidad de las predicciones para
replicar la variabilidad de la variable a predecir.
3) La covarianza mide errores de carcter no sistemtico. Idealmente, sta
debera ser la mayor proporcin de la desigualdad de Theil.
Adems del coeficiente definido en (4-70), Theil propuso otros coeficientes para
la evaluacin de predicciones.
Prediccin dinmica

Sea el siguiente modelo:


yt 1 2 xt 3 yt 1 ut

(4-71)

Supongamos que se desean realizar predicciones para los periodos


i=n+1,,i=n+h, y que se designa el valor real y previsto en el periodo i como yi y y i
respectivamente. La prediccin para el periodo n+1 es

y n 1 1 2 xn 1 3 yn

(4-72)

Como se puede observar, para la prediccin se utiliza el valor observado de y


(yn) porque est dentro de la muestra utilizada en la estimacin. Para la prediccin del
37

resto de los perodos utilizamos de forma recursiva la prediccin del valor retardado de
la variable dependiente (prediccin dinmica), es decir,

y n i 1 2 xn i 3 y n 1i

i 2,3,, h

(4-73)

As, desde el periodo n+2 al n+h la prediccin realizada para un periodo se


utiliza para pronosticar la variable endgena en el periodo siguiente.

Ejercicios
Ejercicio 4.1 Para explicar el precio de la vivienda en una ciudad americana se formula
el siguiente modelo:

price 1 2rooms 3lowstat 4crime u


donde rooms es el nmero de habitaciones de la casa, lowstat es el porcentaje de
personas de "clase marginal" en la zona y crime es el nmero de delitos per cpita en la
zona. Los precios de las casas estn medidos en dlares.
Utilizando los datos del fichero hprice2, se ha estimado el modelo anterior:

price = -15694+ 6788 rooms -268 lowstat - 3854 crime


(8022)

(1211)

(81)

(960)

R =0.771 n=55
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete el significado de los coeficientes , y .
2

b) Tiene el porcentaje de personas de "clase marginal" una influencia


negativa sobre el precio de las casas en esa rea?
c) Tiene el nmero de habitaciones una influencia positiva sobre el precio
de la vivienda?
Ejercicio 4.2 Considere el siguiente modelo:

ln( fruit ) 1 2 ln(inc) 3hhsize 4 punder5 u


donde fruit es el gasto en frutas, inc es la renta disponible del hogar, hhsize es el nmero
de miembros del hogar y punder5 es la proporcin de nios menores de cinco aos en el
hogar.
Usando los datos del fichero demand, se ha estimado el modelo anterior:

ln(
fruit ) = -9.768+ 2.005ln(inc) -1.205 hhsize -1.795 punder 5
(3.701)

(0.512)

(0.179)

(1.302)

R =0.728 n=40
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete el significado de los coeficientes , y .
2

b) Tiene el nmero de miembros del hogar un efecto estadsticamente


significativo sobre el gasto en fruta?
c) Es la proporcin de nios menores de cinco aos en el hogar un factor
que tiene influencia negativa en el gasto fruta?
d) Es la fruta un bien de lujo?
Ejercicio 4.3 (Continuacin del ejercicio 2.5). Teniendo en cuenta el modelo

yi 1 2 xi ui

i 1,2,, n

se han obtenido los siguientes resultados con un tamao muestral de 11 observaciones:


38

xi 0
i 1

yi 0
i 1

yi2 E

i 1

(Recuerde que 1

xi2 B

x y

i 1

i 1

y x y x
i 1
n

i i

x
i 1

2
i

i 1
n

x xi

i 1

a) Construya un estadstico para contrastar H0 : 2 0 contra

H1 : 2 0

b) Contraste las hiptesis de la cuestin a) cuando EB 2 F 2 .


c) Contraste las hiptesis de la cuestin a) cuando EB F 2 .
Ejercicio 4.4 Se ha formulado el siguiente modelo para explicar el gasto de alimentos
(alim):
alim 1 2 renta 3 pralim u

donde renta es la renta disponible y pralim es el ndice de precios relativos de los


alimentos con respecto a los dems productos de consumo.
Tomando una muestra de observaciones correspondientes a 20 aos sucesivos se
obtienen los siguientes resultados:
= 1.40+ 0.126 renta - 0.036 pralim
alim
i

(4.92)

(0.01)

R2=0.996;

(0.07)

2
t

0.196

(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la hiptesis nula de que el coeficiente de pralim es menor que
0.
b) Obtenga un intervalo de confianza del 95% para la propensin marginal
al consumo de alimentos respecto a la renta.
c) Contraste la significatividad conjunta del modelo.
Ejercicio 4.5 Se han utilizado mnimos cuadrados ordinarios para estimar la siguiente
funcin de demanda de alquiler de viviendas:
ln(galqi)=1+2ln(palqi)+ 3ln(rentai)+i
donde galq es el gasto en alquiler de viviendas, palq es el precio de alquiler, y renta es
la renta disponible.
Utilizando una muestra de 403 observaciones, se obtienen los siguientes
resultados:

ln( galqi ) 10 0.7ln palqi 0.9ln rentai


con R2= 0.39 y la matriz estimada de covarianzas
0
0
1.0

cov( ) 0
0.09 0.085
0 0.085 0.09
a) Interprete los coeficientes de ln(galq) y ln(palq).
b) Utilizando un nivel de significacin del 0.01, contraste la hiptesis nula
de que 2=3=0.
c) Contraste la hiptesis nula de que 2=0, frente a la alternativa de que
2<0.

39

d) Contraste la hiptesis nula de que 3=1 frente a la alternativa de que


3 1.
e) Contraste la hiptesis nula de que un aumento en el precio de la vivienda
y un aumento en la renta, en la misma proporcin, no tienen ningn
efecto sobre la demanda de viviendas.
Ejercicio 4.6 Utilizando una muestra de 30 empresas se han estimado los siguientes
modelos correspondientes a las funciones del coste medio (cm):
172.46 35.72 cant
cm
i

(11.97)

(3.70)

R 2 0.838

(1)

SCR 8090

310.07 85.39 cant 26.73 cant 2 1.40 cant 3


cm
i
i
i
i
(29.44)

(33.81)

(11.61)

(1.22)

R 0.978 SCR 1097


donde cm es el coste medio y cant es la cantidad producida.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)

(2)

a) Contraste si los trminos cuadrtico y cbico de la cantidad producida


son significativos en la determinacin el coste medio.
b) Contraste la significacin global del modelo 2.
Ejercicio 4.7 Utilizando una muestra de 35 observaciones, se han estimado los
siguientes modelos para explicar el gasto en caf

ln(
coffee) = 21.32 + 0.11ln(inc) - 1.33 ln(cprice) + 1.35ln(tprice)
(0.01)

(0.23)

R2 = 0.905

(1)

SCR = 254

ln(
coffee) = 19.9 + 0.14 ln(inc) - 1.42 ln(cprice)
(0.02)

(0.21)

(2)

SCR = 529
donde inc es la renta disponible, cprice es el precio del caf y tprice es el precio del t.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad global del modelo (1)
b) El error estndar de ln(tprice) no aparece en el modelo (1), lo puede
calcular?
c) Contraste si el precio del t es estadsticamente significativo.
d) Cmo se contrastara la hiptesis de que la elasticidad del precio del
caf es igual pero con signo opuesto al de la elasticidad del precio del t?
Detalle el procedimiento.
Ejercicio 4.8 Ha sido formulado el siguiente modelo para analizar los determinantes de
la calidad del aire (airqual) en 30 reas SMSA (Standard Metropolitan Statistical Areas)
de California:

airqual 1 2 popln 3medincm 4 poverty 5 fueoil 6valadd u


donde airqual es el peso en g/m3 de partculas en suspensin, popln es la poblacin en
miles, medincm es la renta media per cpita en dlares, poverty es el porcentaje de
familias con una renta inferior al nivel de pobreza, fueloil son miles de barriles de

40

petrleo consumido en industrias manufactureras, y valadd es el valor aadido de las


industrias manufactureras en el ao 1972 en miles de dlares.
Utilizando los datos del fichero airqualy, se ha estimado el modelo anterior:
97.35 0.0956 popln 0.0170 medincm 0.0254 poverty
airqual
i

(10.19)

(0.0311)

(0.0055)

(0.0089)

0.0031 fueoili 0.0011 valaddi


(0.0017)

(0.0025)

R2=0.415 n=30
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete los coeficientes de medincm, poverty y valadd
b) Son los coeficientes de pendiente significativos al 10% de forma
individual?
c) Contraste de significacin conjunta de fueloil y valadd, sabiendo que
97.67 0.0566 popln 0.0102 medincm 0.0174 poverty
airqual
i
i
i
i
(10.41)

(0.020)

(0.0039)

(0.0078)

R 0.339 n 30
d) Si se omite en el primer modelo la variable de la pobreza se obtienen los
siguientes resultados:
82.98 0.0523 popln 0.0097 medincm
airqual
i
i
i
i
2

(0.031)

(10.02)

(0.0055)

0.00063 fueoili 0.00037 valaddi


(0.0017)

(0.0028)

R 0.218 n 30
Son los coeficientes de pendiente significativos al 10% de forma
individual en el nuevo modelo? Considera que estos resultados son
razonables en comparacin con los obtenidos en el apartado b)?
Comparando R2 en los dos modelos estimados, cul es el papel
desempeado por la pobreza en la determinacin de la calidad del aire?
e) Si se hace una regresin para explicar airqual usando como regresores
nicamente el trmino independiente y poverty, se obtiene que R2=0.037.
Considera razonable este valor teniendo en cuenta los resultados
obtenidos en el apartado d)?
2

Ejercicio 4.9 Se han estimado por el mtodo de MCO con una muestra de 39
observaciones las siguientes funciones de produccin:
2
= a labor 1.30capital 0.32 exp(0.0055trend )
output
R = 0.9945
t
t
t
t
2

= blabor1.41capital 0.47
output
t
t
t

R = 0.9937

= g exp(0.0055trend )
output
i
t

R = 0.9549

donde trend es una variable de tendencia.


a) Contraste la significatividad conjunta de labor y capital.
b) Contraste la significatividad del coeficiente de la variable trend.
c) Indique los supuestos estadsticos bajo las cuales los contrastes realizados
en los dos apartados anteriores son correctos. Una cuestin adicional:
Escriba el modelo poblacional correspondiente a la primera de las tres
especificaciones anteriores.

41

Ejercicio 4.10 En una investigacin se ha formulado el siguiente modelo:


y 1 2 x2 3 x3 u

Con una muestra de 43 observaciones se han obtenido los siguientes resultados:

yi -0.06 1.44 x2i 0.48 x3i


( XX)

0.1011 0.0007 0.0005


0.0231 0.0162

0.0122

yi2 444 yi2 424.92

a) Contraste que el trmino independiente es menor que 0.


b) Contraste que 2=2.
c) Contraste de la hiptesis nula 2+33=0.
Ejercicio 4.11 Dada la funcin de produccin

q ak l exp(u )
se ha procedido a su estimacin con datos de la economa espaola de los ltimos 20
aos, obtenindose los siguientes resultados:

ln(
q ) = 0.15 + 0.73ln(k ) + 0.47 ln(l )
i

XX

4129 95 266
3
5
95
266 5
19

SCR 0.017

a) Contraste la significatividad individual de los coeficientes de k y l.


b) Contraste si el parmetro es significativamente distinto de 1.
c) Contraste si existen rendimientos crecientes a escala.
Ejercicio 4.12 Sea el siguiente modelo de regresin mltiple:

y 0 1 x1 2 x2 u
Con una muestra de 33 observaciones se ha estimado este modelo por MCO,
obtenindose los siguientes resultados:

yi 12.7 14.2x1i 2.1x2i


XX
2

0.95 0.266
4.1

3.8
0.5
0.95
0.266 0.5
1.9

a) Contraste la hiptesis nula 0=1.


b) Contraste si 1 2 7
c) Son significativos individualmente loscoeficientes 0, 1, y 2?

42

Ejercicio 4.13 Con una muestra de 30 empresas se han estimado las siguientes
funciones de coste:
= 172.46+ 35.72 x
a) cost
R 2 = 0.838 R 2 = 0.829 SCR = 8090
i
i
(11.97)

(3.70)

= 310.07- 85.39 x + 26.73 x 2 - 1.40 x3 R 2 = 0.978 R 2 = 0.974 SCR = 1097


b) cost
i
i
i
i
(29.44)

(33.81)

(11.61)

(1.22)

donde cost es el coste medio y x es la cantidad producida.


(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de los dos modelos elegira? En base a qu criterio?
b) Contraste si los trminos cuadrtico y cbico de la cantidad producida
influyen significativamente en la determinacin del coste medio.
c) Contraste la significatividad del modelo b).
Ejercicio 4.14 Un investigador formula el siguiente modelo:

y 1 2 x2 3 x3 +u
Utilizando una muestra de 13 observaciones obtiene los siguientes resultados:
yi 1.00 1.82 x2i 0.36 x3i
(1)
R 2 0.50 n 13
0.25 0.01 0.04
var( ) 0.01 0.16 0.15
0.04 0.15 0.81

Utilizando la informacin disponible:


a) Contraste la hiptesis nula de que 2 0 frente a la hiptesis alternativa
de que 2 0 .
b) Contraste la hiptesis nula de que 2 3 1 frente a la hiptesis
alternativa de que 2 3 1 , con un nivel de significacin del 5%.
c) El modelo en su conjunto es significativo?
d) Suponiendo que las variables en (1) estn medidas en logaritmos
naturales, cul es la interpretacin del coeficiente correspondiente a x3?
Ejercicio 4.15 Con una muestra de 50 empresas del sector del automvil se han
estimado las siguientes funciones de produccin, utilizando como variable endgena el
valor aadido bruto de la produccin de automviles (vab) y como variables
explicativas el factor trabajo (labor) y el factor capital (capital).

ln(
vabi ) = 3.87 + 0.80ln(labori ) + 1.24 ln(capitali )
(0.11)
(0.24)
1)
,
2
2
SCR = 254 R = 0.75 R = 0.72

ln(
vabi ) = 19.9 + 1.04 ln(capitali )
2)
SCR = 529 R 2 = 0.84, R 2 = 0.81

3) ln(vab labori ) = 15.2 + 0.87 ln(capitali labori )


SCR = 380
(Entre parntesis aparecen los errores estndar de los estimadores).

43

a) Contraste la significatividad conjunta de los dos factores de la funcin de


produccin.
b) Contraste si el factor trabajo tiene una influencia significativamente
positiva sobre el valor aadido de la produccin de automviles.
c) Contraste la hiptesis de rendimientos constantes a escala. Razone la
respuesta.
Ejercicio 4.16 Con una muestra de 35 observaciones anuales se han estimado dos
funciones de demanda de vino de Rioja, utilizando como variable endgena el gasto en
vino de reserva (vino) y como variables explicativas la renta disponible (renta), el
precio medio de una botella de vino de Rioja de reserva (pvinrioj) y el precio medio de
una botella de vino de Ribera de Duero de reserva (pvinduer). Los resultados son los
siguientes:

ln(
vino ) = 21.32 + 0.11 ln(renta ) - 1.33 ln( pvinrioj ) + 1.35 ln( pvinduer )
i

(0.01)

(0.23)

(0.233)

R 2 = 0.905 SCR = 254

ln(
vinoi ) = 19.9 + 0.14 ln(rentai ) - 1.42 ln( pvinrioji )
(0.02)

(0.21)

SCR = 529
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad global del primer modelo.
b) Contraste si el precio del vino de Ribera de Duero tiene una influencia
significativa, aplicando dos estadsticos que no utilicen la misma
informacin. Muestre que ambos procedimientos son equivalentes
c) Cmo contrastara la hiptesis de que la elasticidad precio del vino de
Rioja es igual pero con signo contrario a la elasticidad precio del vino de
Ribera de Duero? Detalle el procedimiento que seguira.
Ejercicio 4.17 Para analizar la demanda de t de Ceyln (teceil) se ha formulado el
siguiente modelo economtrico:
ln(teceil ) 1 2 ln( renta) 3 ln( pteceil ) 4 ln( pteind ) 5 ln( pcobras) u

donde renta es la renta disponible, pteceil el precio del t de Ceiln, pteind es el precio
del t de la India y pcobras es el precio del caf de Brasil.
Con una muestra de 22 observaciones se han realizado las siguientes estimaciones:

ln(
teceil ) = 2.83 + 0.25 ln(renta ) - 1.48 ln( pteceil )
i

(0.17)

(0.98)

+ 1.18 ln( pteindi ) + 0.20 ln( pcofbrasi )


(0.69)

(0.15)

SCR=0.4277

ln(
teceili pteceil ) = 0.74 + 0.26 ln(rentai ) + 0.20 ln( pcofbrasi )
(0.16)

(0.15)

SCR=0.6788
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad de la renta disponible.
b) Contraste la hiptesis de que 3 1 y 4 0 , explicando el
procedimiento aplicado.

44

c) Si en lugar de disponer de informacin sobre la SCR, solo conociera el R2


de cada modelo, cmo procedera para realizar el contraste de la parte
b)?
Ejercicio 4.18 Con una muestra de 64 pases se han obtenido las siguientes
estimaciones para explicar las defunciones de menores de 5 aos por 1000 habitantes
nacidos vivos (defmen5)

5i = 263.64 - 0.0056 renpci + 2.23 tanalmuji ;


R 2 = 0.7077
1) defmen
(0.0019)

(0.21)

5i = 168.31 - 0.0055 renpci + 1.76 tanalmuji +12.87tfeci ,


2) defmen
(0.0018)

(0.25)

R 2 = 0.7474

donde renpc es la renta per cpita, tanalmuj es la tasa de analfabetismo de las mujeres y
tfec es la tasa de fecundidad (tfi).
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad conjunta de renta, tasa de analfabetismo y
tasa de fecundidad.
b) Contraste la significatividad de la tasa de fecundidad.
c) Cul de los dos modelos elegira? Razone la respuesta.
Ejercicio 4.19 Se ha estimado la siguiente funcin de ventas de automviles de una
determinada marca utilizando una muestra de 32 observaciones anuales:
vi 104.8 6.64 pi 2.98 gi
( 6.48)

(0.16)

(3.19)

ui2 1805.2;

(vi v )2 13581.4

donde v son ventas, p es el precio de los automviles y g son gastos en publicidad.


(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Son significativos conjuntamente el precio y los gastos en publicidad?
Razone la respuesta.
b) Es admisible la hiptesis de que los precios tengan una influencia
negativa sobre las ventas? Razone la respuesta.
c) Describa detalladamente como contrastara la hiptesis de que el impacto
de los gastos en publicidad sobre las ventas es mayor que menos 0.4
veces el impacto del precio.
Ejercicio 4.20 En un estudio sobre los costes de produccin (cpi) de 62 minas de carbn
se elabora el siguiente modelo:
= 2.20- 0.104 gm + 3.48 dg + 0.104 pa
cp
i

(3.4)

(0.005)

(2.2)

(0.15)

donde gmi es el grado de mecanizacin, dgi es una medida de dificultades geolgicas y


pai es el porcentaje de absentismo.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
Se dispone adems de la siguiente informacin:

cp cp
i

109.6

2
i

18.48

a) Contraste la significatividad de cada uno de los coeficientes del modelo.


b) Contraste la significatividad global del modelo.

45

Ejercicio 4.21 Con quince observaciones se ha obtenido la siguiente estimacin:


yi 8.04 2.46 xi 2 0.23 xi 3
(1.00)

(0.60)

R 0.30
donde los valores entre parntesis son los errores estndar de los estimadores y el
coeficiente de determinacin es el corregido.
a) Es significativo el coeficiente de la variable x3?
b) Se rechaza la hiptesis de que un aumento en x2 de dos unidades
ocasiona una disminucin en y de ocho unidades?
c) Analice la significatividad conjunta del modelo.
2

Ejercicio 4.22 Considrese la siguiente especificacin economtrica:

y 1 2 x2 3 x3 4 x4 u
Con una muestra de 26 observaciones se han obtenido las dos siguientes
estimaciones:
yi 2 3.5 x1i 0.7 x2i 2 x3i ui
1)
R2=0.982
(1.9)

2)

(2.2)

(1.5)

yi 1.5 3 ( x1i x2i ) 0.6 x3i ui


(2.7)

(2.4)

R2= 0.876

(Entre parntesis figuran los estadsticos t)


a) Demostrar que las siguientes expresiones del estadstico F son
equivalentes:
2
2
RNR
RR / q

SCRR SCRNR / r

F
F
2
(1 RNR
) / (n k )
SCRNR / (n k )
b) Contraste la hiptesis nula 2= 3.
Ejercicio 4.23 En la estimacin del modelo de Brown, realizada en el ejercicio 3.19
utilizando el fichero consumsp, se obtuvo el siguiente resultado:
7.156 0.3965 incpc 0.5771conspc
conspc
t

(84.88)

(0.0857)

(0.0903)

t 1

R2=0.997;
SCR=1891320;
n=56
Tambin se realiza la estimacin de los siguientes modelos:

conspc
t conspct 1 98.13 0.2757(incpct conspct 1 )
(84.43)

(0.0803)

R =0.1792; SCR=2199474;
n=56

conspc
t incpct 1 7.156 0.0264 incpc 0.5771( conspct 1 incpct )
(84.88)

(0.0090)

(0.0903)

R =0.6570; SCR=1891320;
n=56
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad de cada uno de los coeficientes del primer
modelo.
b) Contraste que el coeficiente de incpc en el primer modelo es menor que
0.5.
c) Contraste la significatividad global del primer modelo.
d) Es admisible la hiptesis de que 2 3 1?
e) Demuestre que operando en el tercer modelo puede llegar a los mismos
coeficientes que en el primer modelo.
46

Ejercicio 4.24 El siguiente modelo fue formulado para analizar los determinantes del
salario medio en dlares que se obtiene al graduarse en la clase del 2010 en las mejores
escuelas de negocios de EE.UU. (salMBAgr):

salMBAgr 1 2tuition 3salMBApr u


donde tuition son los derechos de matrcula, incluyendo adems todos los dems
honorarios para el programa completo, pero con exclusin de los gastos de
manutencin, y salMBApr es el salario medio anual en dlares obtenido previamente
por la clase de 2010.
Utilizando los datos del fichero MBAtui10, se ha estimado el modelo anterior:
42489 0.1881tuition 0.5992 salMBApr
salMBAgr
i

(5415)

(0.0628)

(0.1015)

R2=0.703 n=39
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cules de los regresores incluidos en el modelo anterior son
individualmente significativos al 1% y el 5%?
b) Contraste la significacin global del modelo.
c) Cul es el valor predicho de salMBAgr para un estudiante de posgrado
que pag 100000 dlares de derechos de matrcula en un mster MBA de
dos aos y que anteriormente tuvo un salario de 70000 dlares anuales?
Cuntos aos de trabajo necesita el estudiante para compensar los gastos
de matrcula? Para responder a esta pregunta suponga que la tasa de
descuento es igual a la tasa esperada de aumento salarial y que el
estudiante no recibi ningn ingreso salarial durante los 2 cursos de
duracin del mster.
d) Si aadimos el regresor rank2010 (el rango de cada escuela de negocios
en 2010), se obtienen los siguientes resultados:
61320 0.1229 tuition 0.4662 salMBApr
salMBAgr
i
i
i
(8520)

(0.0626)

(0.1055)

232.06 rank 2010i


(85.13)

R2=0.755 n=39
Cul de los regresores incluidos en este modelo son individualmente
significativos al 5%?
Cul es la interpretacin del coeficiente de rank2010?
e) La variable rank2010 se ha construido a partir de tres componentes:
gradpoll es una clasificacin basada en encuestas a los graduados en
MBA y contribuye con un 45 por ciento a la clasificacin final; corppoll
es una clasificacin basada en encuestas realizadas a reclutadores de los
MBA y contribuye con el 45 por ciento a la clasificacin final; e intellec
es una clasificacin basada en la revisin de la investigacin universitaria
publicada durante en un periodo de cinco aos en las 20 principales
revistas acadmicas, y en los libros universitarios revisados por The New
York Times, The Wall Street Journal y Bloomberg Businessweek en el
mismo perodo; esta ltima clasificacin aporta el 10 por ciento a
clasificacin final. En el siguiente modelo estimado rank2010 ha sido
sustituido por sus tres componentes:

47

79904 0.0305 tuition 0.3751 salMBApr


salMBAgr
i
i
i
(10700)

(0.0696)

(0.107)

303.82 gradpolli 33.829 corppolli 113.36 intelleci


(94.54)

(61.26)

(64.09)

R2=0.797 n=39
Cul es el peso en porcentaje de cada uno de estas tres componentes en
la determinacin de salMBAgr? Compare los resultados con la
contribucin de cada una en la definicin de rank2010.
f) Son gradpoll, corppoll e intellec conjuntamente significativos al 5%?
Son individualmente significativos al 5%?
Ejercicio 4.25 (Continuacin del ejercicio 3.12). El modelo poblacional que
corresponde a este ejercicio es el siguiente:

ln(wage) 1 2educ 3tenure 4age u


Utilizando el fichero wage06s, se ha estimado el modelo anterior:

ln(
wage) 1.565 0.0448 educ 0.0177 tenure 0.0065 age
i

(0.073)

(0.0035)

(0.0019)

(0.0016)

R2=0.337 n=800
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad global del modelo.
b) Es tenure estadsticamente significativa al 10%? Es age positivamente
significativa al 10%?
c) Es admisible que el coeficiente de educ sea igual al de tenure? Es
admisible que el coeficiente de educ sea el triple del de tenure? Para
responder a estas preguntas dispone de la siguiente informacin
adicional:

ln(
wage)i 1.565 0.0271educi 0.0177(educ tenure)i 0.0065 agei
(0.073)

(0.0019)

(0.0042)

(0.0016)

ln(
wage)i 1.565 0.0082 educi 0.0177(3 educ tenure)i 0.0065 agei
(0.073)

(0.0071)

(0.0019)

(0.0016)

Se puede calcular el R en las dos ecuaciones del apartado c)? Por favor,
si la respuesta es positiva, hgalo.
Ejercicio 4.26 (Continuacin del ejercicio 3.13). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. En el modelo estimado, con el fichero
housecan, los errores estndar de los coeficientes aparecen entre parntesis:

price 2418 5827 bedrooms 19750 bathrms 5.411lotsize


i

(3379)

(1207)

(1785)

(0.388)

R2=0.486 n=546
a) Contraste la significatividad global del modelo.
b) Contraste la hiptesis nula de que un bao adicional tiene la misma
influencia sobre el precio de la vivienda que 4 dormitorios adicionales.
Por otra parte, contraste si un cuarto de bao adicional tiene ms
influencia sobre el precio de la vivienda que 4 dormitorios adicionales.
(Informacin adicional: var( 2 ) =1455813, var(3 ) =3186523 y
var( , ) =-764846).
2

c) Si aadimos al modelo el regresor stories (nmero de plantas, excluido el


stano), se obtienen los siguientes resultados:
48


pricei 4010 2825 bedroomsi 17105 bathrmsi
(3603)

(1215)

(1734)

5.429 lotsizei 7635 storiesi


(0.369)

(1008)

R2=0.536 n=546
Cul es su opinin acerca del signo y magnitud del coeficiente de
stories? Es un resultado sorprendente? Cul es la interpretacin de este
coeficiente? Estime si el nmero de stories tiene una influencia
significativa sobre el precio de la vivienda.
d) Repita los contrastes del apartado b) con el modelo estimado en el
apartado c). (Informacin adicional: var( 2 ) =1475758, var(3 )
=3008262 y var( , ) =-554381).
2

Ejercicio 4.27 (Continuacin del ejercicio 3.14). Tomemos el modelo poblacional de


este ejercicio como modelo de referencia. Usando el fichero ceoforbes, el modelo
estimado es el siguiente:

ln(
salary) 4.641 0.0054 roa 0.2893ln(sales ) 0.0000564 profits 0.0122 tenure
i

(0.377)

(0.0033)

(0.0425)

(0.0000220)

(0.0032)

R2=0.232 n=447
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Tiene roa un efecto significativo sobre el salario? Tiene roa un efecto
positivamente significativo sobre el salario? Realice ambos contrastes
para el 10% y el 5% de nivel de significacin.
b) En el caso de que roa se incrementara en 20 puntos, en qu porcentaje
se incrementara el salario?
c) Contraste la hiptesis nula de que la elasticidad salario/ventas es igual a
0.4.
d) Si a este modelo aadimos el regresor age, se obtienen los siguientes
resultados:

ln(
salary )i 4.159 0.0055 roai 0.2903ln( salesi ) 0.0000539 profits
(0.442)

(0.0033)

(0.0423)

(0.0000220)

0.00924 tenurei 0.00880 agei


(0.0035)

(0.0043)

R =0.240 n=447
Son los coeficientes estimados muy diferentes de los obtenidos en la
estimacin del modelo de referencia? Qu ocurre con el coeficiente de
tenure? Explquelo.
e) Tiene la edad (age) del director ejecutivo un efecto significativo sobre el
salario?
f) Es admisible que el coeficiente de age sea igual al coeficiente de
tenure? (Informacin adicional: var(5 ) =1.24E-05; var( 6 ) =1.82E-05 y
var( , ) =-6.09E-06).
5

Ejercicio 4.28 (Continuacin del ejercicio 3.15). Tomemos el modelo poblacional de


este ejercicio como modelo de referencia. Utilizando el fichero rdspain, el modelo
estimado fue el siguiente:
1.8168 0.1482ln(sales ) 0.0110 exponsal
rdintens
i

(0.428)

(0.0278)

R2=0.048

n=1983
49

(0.0021)

(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Es la variable de ventas (sales) individualmente significativa al 1%?
b) Contraste la hiptesis nula de que el coeficiente de las ventas es igual a
0.2?
c) Contraste la significatividad global del modelo de referencia.
d) Si aadimos el regresor ln(workers), - donde workers es el nmero de
trabajadores-, se obtienen los siguientes resultados:
0.480 0.08585ln(sales) 0.01049 exponsal 0.3422ln(workers)
rdintens
(0.750)

(0.0687)

(0.0021)

(0.09198)

R2=0.055 n=1983
Es la variable ventas individualmente significativa al 1% en el nuevo
modelo estimado?
e) Contraste la hiptesis nula de que el coeficiente de ln(workers) es mayor
que 0.5
Ejercicio 4.29 (Continuacin del ejercicio 3.16). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero hedcarsp, el modelo
estimado fue el siguiente:

ln(
price) 14.42 0.000581cid 0.003823 hpweight 0.07854 fueleff
i

(0.154)

(0.0000438)

(0.0079)

(0.0122)

R2=0.830 n=214
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 1%?
b) Aada la variable volume (volumen) al modelo de referencia. Tiene
volume un efecto estadsticamente significativo sobre ln(price)? Tiene el
volumen tiene un efecto positivo estadsticamente significativo sobre el
ln(price)?
c) Es admisible que el coeficiente estimado de volume en el apartado b)
sea igual pero con signo opuesto que el coeficiente de fueloff?
d) Aada las variables length, width y height (longitud, anchura y altura) al
modelo estimado en el apartado b). Teniendo en cuenta que
volume=lengthwidthheight, hay multicolinealidad perfecta en el
nuevo modelo? Por qu? Por qu no? Estime el nuevo modelo si es
posible.
e) Aada la variable ln(volume) al modelo de referencia. Contraste la
hiptesis nula de que la elasticidad de precio/volumen es igual a 1?
f) Qu sucedera si aade al modelo estimado en el apartado e) los
regresores ln(length), ln(width) y ln(height)?
Ejercicio 4.30 (Continuacin del ejercicio 3.17). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero timuse03, el
correspondiente modelo ajustado fue el siguiente:
141.9 3.850 educ 0.00917 hhinc 1.767 age 0.2289 paidwork
houswork
i

(23.27)

(1.621)

(0.00539)

(0.311)

(0.0229)

R2=0.1440 n=1000
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 5% y al 1%?
50

b) Estime un modelo en el que se pueda contrastar directamente si un ao


ms de educacin tiene el mismo efecto sobre el tiempo dedicado al
trabajo domstico que 2 aos de edad adicionales. Cul es su
conclusin?
c) Contraste la significacin conjunta de educ y hhnc.
d) Estime una regresin en la que se aade la variable childup3 (nmero de
nios de hasta 3 aos) al modelo de referencia. En el nuevo modelo,
cuales de los regresores son individualmente significativos al 5% y al
1%?
e) En el modelo formulado en el apartado d), cul es la variable ms
influyente? Por qu?
Ejercicio 4.31 (Continuacin del ejercicio 3.18). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero hdr2010, el
correspondiente modelo ajustado fue el siguiente:
0.375 0.0000207 gnipc 0.0858 lifexpec
stsfglo
i

(0.584)

(0.00000617)

(0.009)

R2=0.642 n=144
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 1%?
b) Estime un modelo en el que se han aadido las variables popnosan
(porcentaje de poblacin sin acceso a servicios de saneamiento mejorado)
y gnirank (rango de la renta nacional bruta) al modelo de referencia.
Cul de los regresores incluidos en el nuevo modelo son
individualmente significativos al 1%? Interprete los coeficientes de
popnosan y gnirank.
c) Son popnosan y gnirank conjuntamente significativos?
d) Contraste la significatividad global del modelo formulado en el apartado
b).
Ejercicio 4.32 Con una muestra de 42 observaciones se ha estimado el siguiente modelo

yt 670.591 1.008xt
Para la observacin 43 se sabe que el valor de x es 1571.9.
a) Calcule el predictor puntual para la observacin 43.
b) Sabiendo que la varianza de del error de prediccin e243 y 43 y 43 es
igual a (24.9048)2, calcule un intervalo de probabilidad del 90% del valor
individual.
Ejercicio 4.33 Sobre la funcin de consumo Brown, adems de la estimacin
presentada en el ejercicio 4.23, se dispone de la siguiente estimacin:
12729 0.3965(incpc 13500) 0.5771(conspc 12793.6)
conspc
t

(64.35)

(0.0857)

(0.0903)

t 1

R2=0.997;
SCR=1891320;
n=56
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Obtenga el predictor puntual del consumo per cpita en 2011, sabiendo
que conspc2010=12793.6 y incpc2011=13500.
b) Obtenga un intervalo de confianza del 95% para el valor esperado del
consumo per cpita en 2011.
51

c) Obtenga un intervalo de prediccin del 95% para el valor individual del


consumo per cpita en 2011.
Ejercicio 4.34 (Continuacin del ejercicio 4.30) Conteste a las siguientes preguntas:
a) Utilizando la primera estimacin del ejercicio 4.30, obtener una
prediccin para houswork (minutos dedicados a las tareas domsticas por
da), cuando en la ecuacin se hace educ=10 (aos), hhinc =1200 (euros
al mes), age=50 (aos) y paidwork=400 (minutos por da).
b) Realice una regresin, utilizando el fichero timuse03, que le permita
calcular un IC del 95% con las caractersticas tenidas en cuenta en el
apartado a).
c) Obtenga un intervalo de prediccin del 95% para el valor individual de
houswork con las caractersticas tenidas en cuenta en el apartado a).
Ejercicio 4.35 (Continuacin del ejercicio 4.29) Conteste a las siguientes preguntas:
a) En la primera ecuacin del ejercicio 4.29 considere que cid=2000
(pulgadas cbicas de desplazamiento), hpweight=10 (relacin
potencia/peso en kg, expresados en porcentaje) y fueleff=6 (minutos por
da) Obtenga el predictor puntual del consumo per cpita en 2011,
sabiendo que incpc2011=12793.6 y conspc2010=13500.
b) Obtenga una estimacin consistente de price para las caractersticas
utilizadas en el apartado a).
c) Realice una regresin que le permita calcular un IC del 95% para las
caractersticas utilizadas en el apartado a).
d) Obtenga un intervalo de prediccin del 95% para el valor individual del
precio.

52