You are on page 1of 19

Tarea Unidad 2 Análisis y diseño de experimentos

Marı́a de Jesús Jiménez Ángeles


Junio 2018

1 LECTURA DE DATOS DE LA VARIABLE


DENSIDAD

Densidad=read.csv(file="Cavendish.csv",head=TRUE,sep="")
Densidad

## Densidad
## 1 4.07
## 2 4.88
## 3 5.10
## 4 5.26
## 5 5.27
## 6 5.29
## 7 5.29
## 8 5.30
## 9 5.34
## 10 5.34
## 11 5.36
## 12 5.39
## 13 5.42
## 14 5.44
## 15 5.46
## 16 5.47
## 17 5.50
## 18 5.53
## 19 5.55
## 20 5.57
## 21 5.58
## 22 5.61
## 23 5.62
## 24 5.63
## 25 5.65
## 26 5.75

1
## 27 5.79
## 28 5.85
## 29 5.86

Densidad<-c(4.07,4.88,5.1,5.26,5.27,5.29,5.29,5.3,5.34,5.34,5.36,5.39,5.42,5.44,5.46,5.47,5.
Densidad

## [1] 4.07 4.88 5.10 5.26 5.27 5.29 5.29 5.30 5.34 5.34 5.36 5.39 5.42 5.44
## [15] 5.46 5.47 5.50 5.53 5.55 5.57 5.58 5.61 5.62 5.63 5.65 5.75 5.79 5.85
## [29] 5.86

2 PROMEDIO, DESVIACION ESTANDAR, VAR-


IANZA, HISTOGRAMA,BOXPLOT

length(Densidad)

## [1] 29

mean(Densidad)

## [1] 5.419655

median(Densidad)

## [1] 5.46

range(Densidad)

## [1] 4.07 5.86

var(Densidad)

## [1] 0.1148392

sd(Densidad)

## [1] 0.3388793

La varianza muestral es;

2
promD<-sum(Densidad)/length(Densidad)
promD

## [1] 5.419655

varD<-sum(Densidad-promD)^2/(length(Densidad)-1)
varD

## [1] 2.208811e-29

La varianza poblacional es;

var(Densidad)*(length(Densidad)-1)/(length(Densidad))

## [1] 0.1108792

Histograma;

histDensidad<-hist(Densidad,labels = T, main="Histograma Densidad",nclass=6,col="violet")

3
Histograma Densidad

15
15

12
10
Frequency

1 1
0

4.0 4.5 5.0 5.5 6.0

Densidad

histDensidad

## $breaks
## [1] 4.0 4.5 5.0 5.5 6.0
##
## $counts
## [1] 1 1 15 12
##
## $density
## [1] 0.06896552 0.06896552 1.03448276 0.82758621
##
## $mids
## [1] 4.25 4.75 5.25 5.75
##
## $xname
## [1] "Densidad"

4
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"

Diagrama de cajas;

boxplot(Densidad,col="blue")
5.5
5.0
4.5


4.0

Podemos visulizar que no hay ningun datos de densidad que varie mucho del
resto.

5
3 SE CONSIDERAN ESTOS DATOS COMO
SI FUERA UNA POBLACION Y SE TOMAN
MUESTRAS DE TAMAÑO 10, 50, 100 y 500
CON REEMPLAZO.
MUESTRAS DE TAMAÑO 10;

#numero de muestras nm =10


#tama~
no de la muestra tm = 10
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,10,5)

6
10
muestras de tamaño
5

5
4
3
Density

2
1
0

5.2 5.3 5.4 5.5 5.6 5.7

promedios muestrales

## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.


## 1 5.4552 0.01225618 10

MUESTRAS DE TAMAÑO 50;

#numero de muestras nm =10


#tama~
no de la muestra tm = 50
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)

7
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,10,5)

10
muestras de tamaño
5
5
4
3
Density

2
1
0

4.9 5.0 5.1 5.2 5.3 5.4 5.5 5.6

promedios muestrales

## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.


## 1 5.4024 0.03578116 10

MUESTRAS DE TAMAÑO 100;

#numero de muestras nm =10


#tama~
no de la muestra tm = 100
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)

8
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,10,5)

10
muestras de tamaño
5
3.0
2.5
2.0
Density

1.5
1.0
0.5
0.0

5.1 5.2 5.3 5.4 5.5 5.6 5.7

promedios muestrales

## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.


## 1 5.4422 0.02825018 10

MUESTRAS DE TAMAÑO 500;

9
#numero de muestras nm =10
#tama~
no de la muestra tm = 500
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,10,5)

10
muestras de tamaño
5
5
4
3
Density

2
1
0

5.1 5.2 5.3 5.4 5.5 5.6 5.7

promedios muestrales

10
## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.
## 1 5.3972 0.02581529 10

Al tomar tamaños de muestras mas grandes, el promedio de esta se acerca


más al promedio de nuestra poblacion.

4 TOMAR UNA MUESTRA DE 100 VALORES


Y REALIZAR LA PRUEBA DE NORMALI-
DAD(EN FORMA GRAFICA Y MEDIANTE
LAS PRUEBAS DE SHAPIRO Y ANDER-
SON DARLING).

#numero de muestras nm =10


#tama~
no de la muestra tm = 100
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,100,5)

11
100
muestras de tamaño
5

3.0
2.5
2.0
Density

1.5
1.0
0.5
0.0

5.0 5.2 5.4 5.6 5.8

promedios muestrales

## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.


## 1 5.40494 0.02559907 100

pnorm(5.41434,5.41434,0.01882861)

## [1] 0.5

pnorm(5.4326261,5.41434,0.01882861)-pnorm(5.3960539,5.41434,0.01882861)

## [1] 0.6685448

qqnorm(Densidad,main= "comparacion de cuantiles QQ normal", xlab = "cuantiles teoricos", yla


qqline(Densidad, col=2)

12
comparacion de cuantiles QQ normal

● ●



● ●
●●


5.5


●●




●●
● ● ●
● ●


Cuantiles

5.0


4.5


4.0

−2 −1 0 1 2

cuantiles teoricos

Observamos de forma grafica que la distribucion es normal. Ahora proced-


eremos a comprar si esto es real mediante Shapiro y Anderson Darling.

shapiro.test(Densidad)

##
## Shapiro-Wilk normality test
##
## data: Densidad
## W = 0.79909, p-value = 8.046e-05

Mediante Shapiro vemos que p es inferior a 0.05 por lo tanto si es normal

install.packages("nortest")

## Installing package into ’/usr/local/lib/R/site-library’


## (as ’lib’ is unspecified)

13
## Warning in install.packages("nortest"): ’lib = "/usr/local/lib/R/site-library"’
is not writable
## Error in install.packages("nortest"): unable to install packages
library(nortest)
## Error in library(nortest): there is no package called ’nortest’

ad.test(Densidad)
## Error in ad.test(Densidad): could not find function "ad.test"

Se agrega lo siguiente para comprobar que si se realizo en RStudio la correcta


instalacion de la libreria, pero al compilar en ShareLatex no me dejo y no pude
cargar el paquete necesario. Anderson-Darling normality test
data: Densidad A = 1.355, p-value = 0.001324 Con el valor de =0.001324
se comprueba nuevamente que tienen una distribucion Normal nuestros datos.

5 TOMAR UNA MUESTRA DE 100 VALORES


Y OBTENER EL INTERVALO DE CONFI-
ANZA PARA EL PROMEDIO SUPONIENDO
QUE LA DISTRIBUCION ES NORMAL .
el intervalo de confianza de obtiene:

qt(0.005,99)

## [1] -2.626405

qt(0.995,99)

## [1] 2.626405

c(5.41956+qt(0.005,99)*0.15863499/sqrt(100),5.41956+qt(0.995,99)*0.15863499/sqrt(100))

## [1] 5.377896 5.461224

Para un 99 porciento de confianza el intervalo es; 5.38¡ µ < 5.46

6 TOMAR UNA MUESTRA DE 20 VALORES


Y OBTENER EL INTERVALO DE CONFI-
ANZA.
Para una muestra de 20 valores;

14
#numero de muestras nm =10
#tama~
no de la muestra tm = 20
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,20,5)

20
muestras de tamaño
5
3.0
2.5
2.0
Density

1.5
1.0
0.5
0.0

5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8

promedios muestrales

15
## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.
## 1 5.3882 0.02698648 20

qt(0.005,99)

## [1] -2.626405

qt(0.995,99)

## [1] 2.626405

c(5.4257+qt(0.005,99)*0.11807451/sqrt(20),5.4257+qt(0.995,99)*0.11807451/sqrt(20))

## [1] 5.356357 5.495043

Para un 99 porciento de confianza el intervalo es; 5.356¡ µ < 5.495

7 TOMAR UNA MUESTRA DE 100 VALORES


Y OBTENER EL INTERVALO DE CONFI-
ANZA PARA LA VARIANZA.

#numero de muestras nm =10


#tama~
no de la muestra tm = 100
tomarnmdettm<-function(x,nm,tm)
{promediosnmmtm<-c(rep(0,nm))#se reservan nm lugares para las muestras
for(i in 1:nm)
{ mtamtm<-sample(x,tm,replace=TRUE) #se toman las nm muestras de tama~
no tm
promediosnmmtm[i]<-mean(mtamtm) # se obtiene el promedio de valores de cada muestra
}
hist(promediosnmmtm, main="", xlab="promedios muestrales", prob = T, nclass=5)
title(main = list(c(nm, "muestras de tama~
no",tm), cex = 0.7, col = "Blue", font = 2))
x1 = seq(4,9,.005)
lines(x1,dnorm(x1,mean=5.419655,sd=sqrt(0.1108792/5)),col='red',lwd=2)
data.frame(mean(promediosnmmtm),var(promediosnmmtm),length(promediosnmmtm))
}
par(mfrow=c(1,1))
tomarnmdettm(Densidad,100,5)

16
100
muestras de tamaño
5

2.5
2.0
1.5
Density

1.0
0.5
0.0

4.8 5.0 5.2 5.4 5.6 5.8

promedios muestrales

## mean.promediosnmmtm. var.promediosnmmtm. length.promediosnmmtm.


## 1 5.41692 0.02384472 100

Una vez tomado mis muestras, obtengo mi Chi2 ;

chi2a<-qchisq(0.975,99,lower.tail=FALSE)
chi2a

## [1] 73.36108

chi2b<-qchisq(0.025,99,lower.tail=FALSE)
chi2b

## [1] 128.422

Ahora para calcular los limites;

17
liminf<-99*0.02016165/chi2b
limsup<-99*0.02016165/chi2a
c(liminf,limsup)

## [1] 0.01554254 0.02720793

Para un 97.5 porciento de confianza el intervalo es; 0.016¡ σ 2 < 0.027

8 Ejercicios adicionales
Ejercicio 28 inciso b. tde 0.005,15

qt(0.005,15, lower.tail = FALSE)

## [1] 2.946713

Ejercicio 28 inciso d. tde 0.005,40

qt(0.005,40, lower.tail = FALSE)

## [1] 2.704459

Ejercicio 29 inciso b. Valor critico de t en Area central=0.95,gl=20

qt(0.95,20)

## [1] 1.724718

Ejercicio 29 inciso c. Valor critico de t en Area central=0.99,gl=20

qt(0.99,20)

## [1] 2.527977

Ejercicio 29 inciso f. Valor critico de t en Area cola inferior=0.025,gl=5

qt(0.025,5, lower.tail = FALSE)

## [1] 2.570582

Ejercicio 30 inciso c. Valor critico de t de un intervalo de confianza bilateral


en Nivel de confianza=99 porciento,gl=15

qt(0.005,15, lower.tail = FALSE)

## [1] 2.946713

18
Ejercicio 30 inciso c. Valor critico de t de un intervalo de confianza bilateral
en Nivel de confianza=99 porciento,n=5

qt(0.005,5, lower.tail = FALSE)

## [1] 4.032143

Chi2 Ejercicio42incisob.V alorde; X 2 = 0.1, 25

qchisq(0.1,25, lower.tail = FALSE)

## [1] 34.38159

Ejercicio 42 inciso e. Valor de; X2 = 0.99, 25

qchisq(0.99,25, lower.tail = FALSE)

## [1] 11.52398

Ejercicio 43 inciso a. El 95 percentil de la distribucion ji cuadrada con v=10.

qchisq(0.95,10, lower.tail = FALSE)

## [1] 3.940299

Ejercicio 43 inciso b. El 5 percentil de la distribucion jicuadrada con v=10.

qchisq(0.05,10, lower.tail = FALSE)

## [1] 18.30704

19

You might also like