Professional Documents
Culture Documents
con
R y RCommander
2a Edicin Revisada
(Versin Marzo 2013)
Autores:
A. J. Arriaza Gmez
F. Fernndez Palacn
M. A. Lpez Snchez
M. Muoz Mrquez
S. Prez Plaza
A. Snchez Navas
c
Copyright
2008, 2013 Universidad de Cdiz. Se concede permiso para copiar, distribuir
y/o modificar este documento bajo los trminos de la Licencia de Documentacin Libre
de GNU, Versin 1.3 o cualquier otra versin posterior publicada por la Free Software
Foundation. Una traduccin de la licencia est incluida en la seccin titulada Licencia de
Documentacin Libre de GNU".
c
Copyright
2008, 2013 Universidad de Cdiz. Permission is granted to copy, distribute
and/or modify this document under the terms of the GNU Free Documentation License,
Version 1.3 or any later version published by the Free Software Foundation. A copy of the
license is included in the section entitled GNU Free Documentation License".
http://www.uca.es/publicaciones
ISBN:
Depsito legal:
Estadstica Bsica con R y R-commander
(Versin Marzo 2013)
Autores: A. J. Arriaza Gmez, F. Fernndez Palacn,
M. A. Lpez Snchez, M. Muoz Mrquez, S. Prez Plaza,
A. Snchez Navas
c
2008, 2013 Servicio de Publicaciones de la Universidad de Cdiz
http://knuth.uca.es/ebrcmdr
Captulo 7
1. Pruebas de aleatoriedad
Ejemplo 7.1
Para analizar si existe autocorrelacin entre los elementos de una mues-
tra, se consideran los datos del PIB en billones de euros durante los
ltimos diez aos: 13, 14, 18, 21, 22, 19, 20, 23, 27 y 30. Parece que de-
bera existir influencia del PIB de aos precedentes sobre los posteriores.
Para comprobarlo se aplicar el test de autocorrelacin de Ljung-Box,
contemplando autocorrelaciones de primer y segundo orden. Para la de
primer orden, se fija la opcin lag=1.
> x<- c(13, 14, 18, 21, 22, 19, 20, 23, 27, 30)
> Box.test(x, lag = 1, type =Ljung-Box)
Box-Ljung test
data: x
X-squared = 4.2281, df = 1, p-value = 0.03976
Ejemplo 7.2
Para analizar la independencia de los mismos datos del PIB del ejemplo
anterior se aplicar ahora el test de rachas. Previamente habr que cargar
el paquete tseries de series temporales, bien desde el men o con la
instruccin library("tseries"). En este caso se realizar un contraste
bilateral, rechazndose la hiptesis nula tanto si existen muchas rachas
como si hay muy pocas, aunque las opciones de la funcin de R admitiran
que se especificaran contrastes de carcter unilateral.
> runs.test(as.factor(x>median(x)))
Runs Test
data: as.factor(x > median(x))
Standard Normal = -1.3416, p-value = 0.1797
alternative hypothesis: two.sided
Ejemplo 7.3
0 5 10 15 20 25
a una variable ambiental.
Ejemplo 7.4
El archivo de datos que se utilizar en este ejemplo es caracoles.dat que
incluye las mediciones de dos variables, dimetro de las conchas (mm) y
separacin entre las espirales (m), para un conjunto de 20 individuos
adultos de una especie de caracoles. Dado el tamao de la muestra, se
contrastar la hiptesis de normalidad mediante el test de Shapiro-Wilk.
Utilizando en este caso Rcmdr y marcando las opciones Estadsticos
ResmenesTest de normalidad de Shapiro-Wilk... se obtiene el
cuadro de dilogo, donde se selecciona la variable dimetro (Diam).
En la ventana de resulta-
dos de Rcmdr se tiene tanto la
instruccin de R como la salida
del procedimiento. En este caso el
p-valor= 0, 6869 viene a indicar
que los datos se pueden conside-
rar normales.
>shapiro.test(Datos$Diam)
Shapiro-Wilk normality test
data: Datos$Diam
W = 0.9668, p-value = 0.6869
Ejemplo 7.5
Se estudiar la normalidad de la variable PESO del fichero
peso_altura.dat. Dado que el nmero de individuos es grande, n = 100,
se utilizar el test de Kolmogorov-Smirnov. En primer lugar, con Rcmdr
se calcula la media y la desviacin tpica del conjunto de datos, resultan-
do x = 77, 37 y sx = 12, 69. A continuacin se computarn las diferencias
130 Captulo 7. Inferencia no paramtrica. Diagnosis del modelo
Ejemplo 7.6
Se generan mediante instrucciones de R dos muestras aleatorias de 100
y 150 elementos procedentes de distribuciones exponenciales de parme-
tros 1 y 1, 5, respectivamente, mediante las instrucciones:
x<-rexp(100,1); y<-rexp(150,1.5)
Ejemplo 7.7
Para contrastar si un dado no est trucado se lanza 60 veces, obtenin-
dose los siguientes resultados:
xi 1 2 3 4 5 6
ni 7 12 10 11 8 12
Ejemplo 7.8
Se desea analizar la relacin entre el nivel de estudios del padre y la
orientacin del alumno hacia las ciencias en un determinado instituto de
bachillerato.
Se cuenta para ello con la informacin obtenida en el centro.
132 Captulo 7. Inferencia no paramtrica. Diagnosis del modelo
Estudios padre
Orientacin Ninguno Bsico Medio Superior
Orientado 23 12 34 32
No orientado 18 42 16 27
Ejemplo 7.9
En el conservatorio de msica de una ciudad se pretende estudiar la rela-
cin existente entre el sexo del alumnado y su aficin por los instrumentos
de viento. Para ello, observados los 482 estudiantes se tiene:
Hombre Mujer
Aficionado 150 97
No aficionado 123 112
7.2 Pruebas de bondad de ajuste 133
Ejemplo 7.10
Durante la Segunda Guerra Mundial los alemanes bombardearon en
diversas ocasiones Londres. Al objeto de analizar si los bombardeos
eran indiscriminados o se hacan con intencin, se procedi a dividir la
ciudad en cuadrculas y a contar el nmero de impactos en cada una de
ellas. Los resultados se recogen en la siguiente tabla
Impactos 0 1 2 3 4 5
Nmero cuadrculas 229 211 93 35 7 1
Las hiptesis podran ser expresadas, en trminos probabilsticos,
de la siguiente manera (
H0 : X P ()
H1 : X 6 P ()
[1] 0.002682857
>p< c(0.3949,0.3669,0.1704,0.0528,0.0150)
>x< c(229,211,93,35,8)
>chisq.test(x,p=p,rescale.p=TRUE)
Chi-squared test for given probabilities
data: x
X-squared = 1.0205, df = 4, p-value = 0.9067
En todo caso, las situaciones a analizar son las mismas del captulo
anterior: una muestra, dos muestras independientes y dos muestras apa-
readas, a las que se intentar dar respuesta con los ejemplos que siguen.
Ejemplo 7.11
Se estudiar mediante el test de Wilcoxon para muestras indepen-
dientes si las dos ubicaciones del parque elico, cuya informacin
se encuentra en el archivo eolico_apilado.dat, tienen la misma
potencialidad elica. Para ello, en el men de Rcmdr se seleccio-
nan las opciones de men, EstadsticosTest no paramtricos
136 Captulo 7. Inferencia no paramtrica. Diagnosis del modelo
Ejemplo 7.12
Se desea contrastar la hiptesis nula, con = 0, 05, de que la separacin
mediana entre las espirales (variable Separ) de los caracoles del fichero
caracoles.dat es menor o igual a 110 m. Se supondr que los datos son
aleatorios pero no normales y se utilizar por tanto el test de Wilcoxon
para una muestra. Trabajando directamente con R se tiene:
7.3 Contrastes de localizacin y escala 137
> wilcox.test(Datos$Separ,alternative="greater",mu=110)
Wilcoxon signed rank test with continuity correction
data: Datos$Separ
V = 157, p-value = 0.006617
alternative hypothesis: true location is greater than 110
Ejemplo 7.13
Para documentar el caso de muestras pareadas se considera el mis-
mo ejemplo que se us en el captulo anterior, la eficacia del trata-
miento con fenofibrato, suponiendo ahora que la distribucin de la di-
ferencia de medias no es normal. En este caso se quiere probar la
afirmacin del fabricante de que el tratamiento durante un ao con
fenofibrato reduce el fibringeno en al menos 50 puntos. Se aplica-
r pues el test de Wilcoxon para muestras pareadas. Para acceder
al test, se selecciona EstadsticosTest no paramtricosTest de
Wilcoxon para muestras pareadas...
Aunque las opciones de la ventana no admiten que se especifiquen
diferencias, bastar con retocar mnimamente la instruccin aadiendo
al final de la lnea la opcin mu=50.
> wilcox.test(Datos$FIB_A, Datos$FIB_D, alternative=greater,
paired=TRUE, mu=50)
Wilcoxon signed rank test with continuity correction
data: Datos$FIB_A and Datos$FIB_D
V = 354, p-value = 0.01934
alternative hypothesis: true location shift is greater than 50
4. Ejercicios
Cabello
Ojos Moreno Rubio Castao
Negros 20 8 4
Marrones 16 2 11
Azules 5 8 8
Verdes 10 5 3
(Li1 , Li ] ni
(0, 1] 1
(1, 2] 3
(2, 3] 7
(3, 4] 12
(4, 5] 6
(5, 6] 2
(6, 7] 1
Tratamiento 1 12 15 21 17 38 42 10 23 35 28
Tratamiento 2 21 18 42 25 14 52 65 40 43 35 18
56 29 32 44 15 68 41 37 43 58 42
Utilice el test de Wilcoxon para evaluar si existen diferencias entre los
dos tratamientos.