Professional Documents
Culture Documents
Dados da questo:
Resultado obtido:
Comentrio(s):
Letra b) Comandos do R:
> q1.m <- c(mean(q1), sd(q1), 100 * sd(q1)/mean(q1))
> q2.m <- c(mean(q2), sd(q2), 100 * sd(q2)/mean(q2))
> q3.m <- c(mean(q3), sd(q3), 100 * sd(q3)/mean(q3))
> names(q1.m) <- names(q2.m) <- names(q3.m) <- c("Mdia", "Desvio padro", "CV")
Resultados obtidos:
> q1.m
Mdia
114.72500
Desvio padro
18.22751
CV
15.88800
Mdia
155.72000
Desvio padro
25.89379
CV
16.62843
Mdia
168.80000
Desvio padro
24.91726
CV
14.76141
> q2.m
> q3.m
Comentrio(s):
A mdia de vendas do 1 Quadrimestre a menor entre os 3, assim como seu
desvio padro. O 2 Quadrimestre o que possui maiores desvio padro e coeficiente
de variao. E o 3 Quadrimestre o que apresenta maior mdia e menor coeficiente de
variao.
Questo 03
Letra a) Dados para a questo:
Matriz fornecida:
1
3
5
7
2
4
6
8
10
20
30
40
> dadosmat<-matrix(scan("matriz_exemplo.txt"),nrow=4,ncol=3,byrow=T)
Read 12 items
> dadosmat
[,1]
[,2]
[,3]
[1,]
1
2
10
[2,]
3
4
20
[3,]
5
6
30
[4,]
7
8
40
Esses comandos lem e imprimem a matriz exemplo, contendo 3 colunas e 4
linhas.
> apply(dadosmat,1,mean)
[1]
4.333333
9.000000
13.666667
18.333333
14.153916
18.770544
Comentrio(s):
>choose(60,6)
[1] 50063860
>choose(6,6)*1.75
[1] 1.75
>choose(7,6)*1.75
[1] 12.25
>choose(8,6)*1.75
[1] 49
>choose(9,6)*1.75
[1] 147
>choose(10,6)*1.75
[1] 367.5
>choose(11,6)*1.75
[1] 808.5
>choose(12,6)*1.75
[1] 1617
>choose(13,6)*1.75
[1] 3003
>choose(14,6)*1.75
[1] 5255.25
>choose(15,6)*1.75
[1] 8758.75
Questo 04
Civil
1
2
2
1
1
2
1
1
2
1
2
1
1
2
2
1
2
2
1
1
2
1
1
2
2
2
1
2
2
2
1
2
2
1
2
2
Instrucao
1
1
1
2
1
1
1
1
2
2
2
1
2
1
2
2
2
1
3
2
2
2
1
3
2
2
1
2
2
2
3
2
3
3
2
3
Filhos
NA
1
2
NA
NA
0
NA
NA
1
NA
2
NA
NA
3
0
NA
1
2
NA
NA
1
NA
NA
0
2
2
NA
0
5
2
NA
1
3
NA
2
3
Salrio
4.00
4.56
5.25
5.73
6.26
6.66
6.86
7.39
7.59
7.44
8.12
8.46
8.74
8.95
9.13
9.35
9.77
9.80
10.53
10.76
11.06
11.59
12.00
12.79
13.23
13.60
13.85
14.69
14.71
15.99
16.22
16.61
17.26
18.75
19.40
23.30
Ano
26
32
36
20
40
28
41
43
34
23
33
27
37
44
30
38
31
39
25
37
30
34
41
26
32
35
46
29
40
35
31
36
43
33
48
42
Mes
3
10
5
10
7
0
0
4
10
6
6
11
5
2
5
8
7
7
8
4
9
2
0
1
5
0
7
8
6
10
5
4
7
7
11
2
Regiao
1
2
2
3
3
1
1
2
2
3
1
2
3
3
1
3
2
3
1
1
3
2
3
3
1
3
3
1
1
2
3
1
2
2
2
1
comando acima retornam ao arquivo milsa e atribui significados aos cdigos utilizados
no armazenamento dos dados e os imprime. Em Civil trocou-se 1 e 2 por Solteiro
e Casado, respectivamente; da mesma forma em Instruo 1,2 e 3 foram
substitudos por 1oGrau, 2oGrau e Superior; por fim em Regiao, Interior,
Capital e Outro substituram, respectivamente, 1,2 e 3.
> tabela1=table(milsa$civil)
> tabela1
Solteiro
16
Casado
20
1oGrau
7
5
2oGrau
6
12
Superior
3
3
1oGrau
19.444444
13.888889
2oGrau
16.666667
33.333333
Superior
8.333333
8.333333
1oGrau
43.75
25.00
2oGrau
37.50
60.00
Superior
18.75
15.00
> nl=nrow(tabela2)
> nc=ncol(tabela2)
> somcol=apply(tabela2, 2, sum)
> auxtab2=matrix(somcol, nrow=nl, ncol=nc, byrow=T)
> tabela4=tabela2/auxtab2*100
> tabela4
Solteiro
Casado
1oGrau
58.33333
41.66667
2oGrau
33.33333
66.66667
Superior
50.00000
50.00000
2oGrau
11.528333
Superior
16.475000
2oGrau
3.715144
Superior
4.502438
2oGrau
32.22620
Superior
27.32891
> res3=cbind(res2,denpop=res2[,4]/res2[,3])
> res4=aggregate(res3$denpop, by=list(RegiaoPlanejamento=dados$nomeregiao),
FUN="mean")
> res5=aggregate(res3$idh2000, by=list(RegiaoPlanejamento=dados$nomeregiao),
FUN="mean")
> nomes=as.character(res4[,1])
> res6=cbind(res4[,1],DENPOP=res4[,2],IDHM=res5[,2])
> res6
[1,]
[2,]
[3,]
[4,]
[5,]
[6,]
[7,]
[8,]
[9,]
[10,]
1
2
3
4
5
6
7
8
9
10
DENPOP
15.233441
169.229456
33.308768
17.102590
44.364799
5.269267
13.353231
50.655959
48.471937
18.141374
IDHM
0.8349677
0.8256646
0.8202857
0.7019242
0.7915986
0.8195263
0.7291348
0.7529608
0.8198258
0.8372571
REPLAN
Alto Parnaiba
Central
Centro Oeste de Minas
Jequitinhonha/Mucuri
Mata
Noroeste de Minas
Norte de Minas
Rio Doce
Sul de Minas
Tringulo
DENPOP
15.233441
169.229456
33.308768
17.102590
44.364799
5.269267
13.353231
50.655959
48.471937
18.141374
IDHM
0.8349677
0.8256646
0.8202857
0.7019242
0.7915986
0.8195263
0.7291348
0.7529608
0.8198258
0.8372571
>barplot(VADeaths,plot=T,beside=T,ylim=c(0,100),col=c("#4
C4C4C","#888888","#AEAEAE","#CCCCCC","#E6E6E6")
)text(posrow,c(VADeaths[,1]+0.05*50,VADeaths[,2]+0.05*50,V
ADeaths[,3]+0.05*50,VADeaths[,4]+0.05*50),labels=round(VA
Deaths,digits=0),cex=0.8)
legend("topright",bty="n",rownames(VADeaths),fill=c("#4C
4C4C","#888888","#AEAEAE","#CCCCCC","#E6E6E6"))
abline(h=0)
Cria o mesmo grfico anterior.
> dados<-read.table(file="altura_peso.txt",header=T)
> dados
Altura
Peso
1
1.60
60.5
2
1.69
55.0
3
1.85
72.8
4
1.85
80.9
5
1.58
55.0
6
1.76
60.0
7
1.60
58.0
8
1.64
47.0
9
1.62
57.8
10
1.64
58.0
11
1.72
70.0
12
1.66
54.0
13
1.70
58.0
14
1.78
68.5
15
1.65
63.5
16
1.63
47.4
17
1.82
66.0
18
1.80
85.2
19
1.60
54.5
20
1.68
52.5
21
1.70
60.0
22
1.65
58.5
23
1.57
49.2
24
1.55
48.0
25
1.69
51.6
26
27
28
29
30
1.54
1.62
1.62
1.57
1.65
57.0
63.0
52.0
49.0
59.0
> plot(dados$Altura,dados$Peso)
> plot(dados$Altura,dados$Peso,pch=22,col="blue")
Questo 06
Abaixo de 35 anos
Feminino Masculino
1-7
8-30
Mais de 30
36
48
30
48
42
43
Acima de 35 anos
Feminino Masculino
44
38
42
43
49
36
Comandos e resultado:
> freqs=c(36, 48, 48, 42, 30, 43, 44, 43, 38, 49, 42, 36)
> data=array(freqs, dim = c(2, 3, 2))
> dimnames(data)=list(c("F", "M"), c("1-7", "8-30", ">30"), c("<35", ">35"))
> data
, , <35
F
M
1-7
36
48
8-30
48
42
>30
30
43
, , >35
F
M
1-7
44
43
8-30
38
49
>30
42
36
> data[, , 1]
F
M
1-7
36
48
8-30
48
42
>30
30
43
<35
36
48
>35
44
43
<35
36
48
30
>35
44
38
42
M
48
8-30
48
>30
30
>35
44
Perguntas:
a)- Qual a diferena entre os comandos data[, , 1], data[, 1 ,] e data[1, , ]?
b)- Qual a diferena entre os comandos data[, 1, 1], data[1, ,1] e data[1,1,]?
>35
249
M
34.2
[1]
0.2681452
Questo 07
Baixo
Normal
Alto
Masculino
136
92
248
Feminino
102
195
62
Sexo
Homens
Mulheres
Alto
248
62
Peso
Baixo Normal
136 92
102 195
Questo 08
Questo 09
Comandos e resultados:
[1]
49.84
Explique
qual
a
diferena
repetio(iter=100,amo=100).
entre
usar
becel(vezes=100)
> becel(vezes=100)
[1]
55
> repeticao(iter=100, amo=100)
[1]
50.46
Letra b)- Estude os comandos abaixo e comente a finalidade de cada uma deles,
mostrando o que faz cada bloco.
# O comando par usado para inserir parmetros grficos. Estes parmetros
podem ser especificados atribuindo valores um a um, ou associando uma srie de
valores a uma srie de valores tabelados.
> par(mfrow=c(3,2))
> ?par
> x=0:40
> fx=dbinom(x, 40, 0.35)
> plot(x, fx, type='h')
Os comandos acima plotam um grfico com curva preta possuindo mdia 100 e
desvio padro 8.
> plot(function(x) dnorm(x, 90, 8), 60, 140, add=T, col=2)
Questo 10
Ilustrao 1:
> sim<-matrix(rpois(100*20,lambda=8),nc=20)
> T<-apply(sim,1,function(x)max(x)-min(x))
> mean(T)
[1]
10.65
> sd(T)
[1]
1.887626
> sd(T)/mean(T)*100
[1]
17.72419
> sim2<-matrix(rpois(1000*5,lambda=8),nc=5)
> T2<-apply(sim2,1,function(x)max(x)-min(x))
> mean(T2)
[1]
6.49
> sd(T2)
[1]
2.483156
> sd(T2)/mean(T2)*100
[1]
38.26127
Aps mudarmos o tamanho da amostra observou-se que o coeficiente de
variao aumentou, visto que amostras pequenas em relao populao aumentam as
chances de errar.
Ilustrao 2:
> dados<-rnorm(100000,mean=0,sd=1)
> dp<-sd(dados)
> media<-mean(dados)
> media
[1]
-0.0004719812
> dp
[1]
0.9988525
> abline(v=(media+dp),col="blue",lty=3)
> abline(v=(media-2*dp),col="red",lty=1)
> abline(v=(media+2*dp),col="red",lty=1)
linha
vermelha
nos
pontos
> abline(v=(media-3*dp),col="darkgreen",lty=4)
> abline(v=(media+3*dp),col="darkgreen",lty=4)
Comandos e resultados:
> tamamo(N=8000,Var=500^2,B=85,Alfa=0.06)
[1]
0.1245811
Letra b)- E se a mdia amostral estivesse a no mximo R$90,00 da verdadeira
renda mdia deste universo com probabilidade de 94%, qual seria o tamanho da
amostra?
Comandos e resultados:
> tamamo(N=8000,Var=500^2,B=90,Alfa=0.06)
[1]
0.1111235
Letra c)- Repita o item A supondo um erro tipo I de 3%.
Comandos e resultados:
> tamamo(N=8000,Var=500^2,B=85,Alfa=0.03)
[1]
0.03114564
Letra d- Repita o item B supondo um erro do tipo I de 3%.
Comandos e resultados:
> tamamo(N=8000,Var=500^2,B=90,Alfa=0.03)
[1]
0.02778115
Questo 12
Quad. 1
114,7
144,7
119,1
113,7
108,9
96,7
87,6
132,4
Quad. 3
153,1
192,5
145,5
168,8
141,5
141,2
189,6
178,4
Comandos, resultados:
> q1<-c(114.7,144.7,119.1,113.7,108.9,96.7,87.6,132.4)
> q3<-c(153.1,192.5,145.5,168.8,141.5,142.2,189.6,178.4,208.6)
Letra a)> var.test(q1,q3,conf=0.9)
208,6
Questo 13
> bdsim=matrix(rbinom(2500000,1,.7),1000,2500)
> par(mfrow=c(3,2))
> for(i in c(5,10,50,100,500,1000))
+{
+ medias=apply(bdsim[,1:i],1,mean)
+ aa=round(mean(medias),digits=4)
+ bb=round(sd(medias),digits=4)
+ hist(medias,main=paste("n=",i),xlab='medias',ylab='freq',xlim=c(0,1),ylim=c(0,500))
+ text(0.1, 400, expression(hat(mu[bar(x)])))
+ text(0.3, 400, paste("= ", aa))
+ text(0.1, 280, expression(hat(sigma[bar(x)])))
+ text(0.3, 280, paste("= ", bb))
+}
Comandos e resultados:
> m=50;n=20;p=.5
> phat=rbinom(m,n,p)/n
> SE=sqrt(phat*(1-phat)/n)
> alpha=0.1
> zalp=qnorm(1-alpha/2)
> inco=rbind(phat - zalp*SE, phat + zalp*SE)
> tofora = ifelse((inco[1,] > p) | (inco[2,]<p),"red", "black")
> matplot(inco, rbind(1:m,1:m),type="l",lty=1,col=tofora, xlim=c(0,1))
Cria um grfico
> abline(v=p,col='blue',lwd=3)
> m=50;n=20;p=.5
> phat=rbinom(m,n,p)/n
> SE=sqrt(phat*(1-phat)/n)
> alpha=0.05
> zalp=qnorm(1-alpha/2)
> inco=rbind(phat - zalp*SE, phat + zalp*SE)
> tofora = ifelse((inco[1,] > p) | (inco[2,]<p),"red", "black")
> matplot(inco, rbind(1:m,1:m),type="l",lty=1,col=tofora, xlim=c(0,1))
> abline(v=p,col='blue',lwd=3)
> prop.table(table(tofora))
tofora
black red
0.94 0.06
Comentrio(s): aps mudarmos o alpha para 0.05, foi possvel observar que os
intervalos que no contem p=0,5, tem proporo 0,8.
Questo 15
> massa<-c(25,50,75,100,125,150,175,200,225,250)
> colheita<-c(84,80,90,154,148,169,206,244,212,248)
1Q
-11.07
Median
-5.00
3Q
Max
12.00 29.79
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 51.93333 12.97904 4.001 0.00394 **
massa
0.81139 0.08367 9.697 1.07e-05 ***
---
> abline(modfert)
> coefs=coefficients(modfert)
> coefs
(Intercept)
massa
51.933333
0.811394
> ic.coefs=confint(modfert,level=0.95)
> ic.coefs
2.5 %
97.5 %
(Intercept)
22.0036246 81.863042
massa
0.6184496
1.004338
> abline(coefs,col="green")
> abline(ic.coefs[,1],col="red",lty=2)
> abline(ic.coefs[,2],col="red",lty=2)
Uma previso hipottica: para um fertilizante com 115 de massa, o valor mdio
esperado para a colheita(em gramas de:
> colest=coefs[1]+coefs[2]*115
> colest
(Intercept)
145.2436
o O intervalo de confiana para esta estimativa :
> ic.colest.inf=ic.coefs[1,1]+ic.coefs[2,1]*115
> ic.colest.sup=ic.coefs[1,2]+ic.coefs[2,2]*115
> ic.colest.inf
[1]
93.12532
> ic.colest.sup
[1]
197.3619