Professional Documents
Culture Documents
Oficina II
Teste de avaliação periódica – 27/05/2008
_____________________________________________________________________________
O teste deverá ser efectuado recorrendo ao software estatístico R. Na folha de teste deve
apresentar os resultados obtidos. No ficheiro Word deve guardar os resultados obtidos e os
comandos utilizados.
_____________________________________________________________________________
1. Base de dados “Orange” disponível no software estatístico R. Relativamente a esta base de
dados responda às seguintes questões:
(a) Calcule: média, mediana, desvio padrão, variância para a variável age.
(b) Indique qual os percentís 22, 57 e 95 para a variável age.
(c) Efectue as seguintes representações gráficas:
(c1) histograma para a variável circumference;
(c2) Gráfico de barras para a variável Tree;
(c3) Caixa de bigodes (boxplot) para a variável age;
(c4) Caixa de bigodes para a variável circumference em função dos níveis da variável Tree;
(c5) Gráfico circular para a variável Tree.
2. A base de dados “Voter” diz respeito a intenções de voto para as presidenciais americanas
em 1992. Os candidatos são representados pela variável pres92 (1‐Bush; 2‐Perot; 3‐Clinton); as
idades dos inquiridos (age) e a variável idade categorizada (1‐ (0,35]; 2 – (35,44]; 3 – (44,64]; 4
‐ [65,‐)); o número de anos de escolaridade (educ); o grau de escolaridade (degree) onde
valores superiores correspondem a um grau mais elevado; e sexo (sex: 1‐ masculino; 2‐
feminino).
Importe esta base de dados para o software estatístico R e respondas às seguintes questões:
(a) Calcule, para a variável educ: média, mediana, desvio padrão e variância.
(b) Indique qual o percentil 79 para a variável educ.
(c) Calcule o número de observações para cada nível da variável agecat.
(d) Calcule o número médio de anos de escolaridade dos inquiridos para cada um dos 4 níveis
da variável agecat.
(e) Efectue uma representação gráfica (adequada) para cada uma das variáveis da base de
dados.
3. As idades dos 20 trabalhadores numa determinada empresa de Guimarães são
21 36 45 23 61 45 38 48 32 25
19 28 34 41 45 28 37 44 40 23
Introduza estes dados no software estatístico R e calcule:
(a) média e variância.
(b) Amplitude inter‐quartil (recorrendo à função IQR).
4. As funções pbinom e pnorm permitem ao utilizador calcular probabilidades no âmbito das
distribuições binomial e normal, respectivamente. Consulte a ajuda das referidas funções e
responda às seguintes questões:
4.1 Uma variável aleatória X segue uma distribuição binomial de parâmetros n=20 e p=0.6.
Calcule as seguintes probabilidades:
(a) P(X=12)
(b) P(X>14)
(c) P(X≤8)
4.2 Uma variável aleatória Y segue uma distribuição normal de parâmetros µ=10 (média) e σ=2
(desvio padrão). Calcule as seguintes probabilidades:
(a) P(Y<18)
(b) P(Y>12)