You are on page 1of 11

ActivALEA

active e actualize a sua literacia

N. 19 - DIIAAG
GR
RA
AM
MA
AD
DE
E CA
AU
UL
LE
E-E
E-F
FO
OL
LH
HA
AS
S

Por: Maria Eugnia Graa Martins


Departamento de Estatstica e Investigao Operacional da FCUL
memartins@fc.ul.pt
Emlia Oliveira
Escola Secundria de Tomaz Pelayo
ecmo.estp@gmail.com

De entre a grande variedade de representaes que se podem utilizar para representar


dados, temos o grfico ou diagrama caule-e-folhas. um tipo de representao que se
pode considerar entre a tabela e o grfico, uma vez que, de um modo geral, so
apresentados os verdadeiros valores dos dados, mas numa representao sugestiva, que
faz lembrar um histograma.
Quando comparada com o histograma, uma representao mais
simples de construir quando se trabalha com papel e lpis e tem uma
vantagem imediata, que a de facilitar a ordenao dos dados, quando
no se dispe de um computador. Por outro lado, como na maior parte
das vezes preserva os dgitos dos dados, ao contrrio do histograma
que os agrupa, permite a reconstituio da amostra.

Nesta ActivALEA so apresentados alguns exemplos de representaes dos dados num grfico
caule-e-folhas e dadas algumas orientaes a ter em conta na construo de uma
representao deste tipo.
Para representar um conjunto de dados num diagrama de caule-e-folhas pode ser utilizada a
aplicao interactiva1 que acompanha esta ActivALEA.

Aplicao interactiva desenvolvida por Manuel Ramos, Escola Secundria de Tomaz Pelayo.
www.alea.pt

1/11

O
OSS CCAAUULLEESS EE AASS FFOOLLHHAASS
A base da construo de uma representao em caule-e-folhas est na separao de cada
dado em duas partes: o caule e a folha. Tendo em considerao a ordem de grandeza dos
dados a representar, escolhe-se o(s) dgito(s) dominante(s) que se coloca(m) ao longo de um
eixo vertical, do lado esquerdo. Estes dgitos constituem os caules. Para cada dado toma-se o
digito que se segue imediatamente ao(s) digito(s) dominante(s) e coloca-se do lado direito do
eixo, em frente ao respectivo caule. Estes dgitos so as folhas. As folhas so registadas
medida que vamos percorrendo o conjunto dos dados. No entanto, na representao final,
ordenam-se por ordem crescente as folhas penduradas em cada caule.
Vamos exemplificar a construo do caule-e-folhas com o seguinte conjunto de dados.
Exemplo 1 Os dados seguintes representam as pontuaes obtidas por 48 estudantes, num
determinado teste. Apresente-os num grfico de caule-e-folhas.
75

98

42

75

84

87

65

59

63

86

78

37

99

66

90

79

80

89

68

57

95

55

79

88

76

60

77

49

92

83

71

78

53

81

77

58

93

85

70

62

80

74

69

90

62

84

64

73

Como o menor e o maior dos dados anteriores so, respectivamente, 37 e 99, vamos
considerar para caules o dgito das dezenas:
3
4
5
6
7
8
9

Depois de traar uma linha vertical do lado direito dos caules, comea-se a colocar as folhas.
Aps representarmos os primeiros 4 dados, o diagrama apresenta o seguinte aspecto:
Caule

Folha

3
4

5
6
7

8
9

www.alea.pt

2/11

e quando todos os dados estiverem representados, teremos:


Caule

Folha

2 9

9 7 5 3 8

5 3 6 8 0 2 9 2 4

5 5 8 9 9 6 7 1 8 7 0 4 3

4 7 6 0 9 8 3 1 5 0 4

8 9 0 5 2 3 0

Na apresentao final do grfico caule-e-folhas, ordenamos as folhas por ordem crescente e


para no haver ambiguidade na leitura dos nmeros que representam os nossos dados,
indicamos a forma de os ler:
3

2 9

3 5 7 8 9

0 2 2 3 4 5 6 8 9

0 1 2 4 5 5 6 7 7 8 8 9 9

0 0 1 3 4 4 5 6 7 8 9

0 0 2 3 5 8 9

3|7 significa 37 pontos

Esta indicao na forma de ler os dados bastante importante, pois podemos ter a mesma
representao, para dados de outro tipo como indicamos a seguir:
Admitamos que as alturas, em cm, de um conjunto de plantas, duas semanas depois de se ter
lanado a semente terra, eram:
7,5

9,8

4,2

7,5

8,4

8,7

6,5

5,9

6,3

8,6

7,8

3,7

9,9

6,6

9,0

7,9

8,0

8,9

6,8

5,7

9,5

5,5

7,9

8,8

7,6

6,0

7,7

4,9

9,2

8,3

7,1

7,8

5,3

8,1

7,7

5,8

9,3

8,5

7,0

6,2

8,0

7,4

6,9

9,0

6,2

8,4

6,4

7,3

Nota: estes dados so fictcios e obtiveram-se dos dados do exemplo 1, dividindo por 10 cada uma das
pontuaes.

A representao destes dados num grfico de caule e folhas precisamente igual dos dados
das pontuaes, mas com a indicao de como se deve fazer a leitura no haver
ambiguidade:
3
4
5
6
7
8
9

7
2
3
0
0
0
0

9
5
2
1
0
0

www.alea.pt

7
2
2
1
2

8
3
4
3
3

9
4
5
4
5

5
5
4
8

6 8 9
6 7 7 8 8 9 9
5 6 7 8 9
9

3|7 significa 3,7 cm

3/11

Como aumentar o nmero de caules?


Na representao anterior considermos 7 caules e o intervalo entre caules sucessivos de 10
unidades. como se tivssemos considerado as classes [30, 40[, [40, 50[, [50, 60[, [60, 70[,
[70, 80[, [80, 90[ e 90, 100, para agrupar os dados.
Suponhamos que em vez de considerar estas classes, de amplitude 10, estvamos
interessados em considerar classes de amplitude 5, a saber 30, 35, 35, 40, 40, 45, 45, 50,
50, 55, 55, 60, 60, 65, 65, 70, 70, 75, 75, 80, 80, 85, 85, 90, 90, 95 e 95, 100.
Ento a representao anterior teria o seguinte aspecto:
3
4
4
5
5
6
6
7
7
8
8
9
9

7
2
9
3
5
0
5
0
5
0
5
0
5

7
2
6
1
5
0
6
0
8

8
2
8
2
6
1
7
2
9

9
3
9
4
7
3
8
3

7 8 8 9 9
4 4
9

Qualquer que seja a representao considerada, qualquer caule tem sempre a possibilidade de
ter penduradas o mesmo nmero de folhas. No exemplo anterior, cada caule foi desdobrado em
dois subcaules. No primeiro subcaule aparecem penduradas as folhas 0, 1, 2, 3 e 4, enquanto
que no segundo subcaule aparecem penduradas as folhas 5, 6, 7, 8 e 9. Para distinguir os dois
subcaules, costume colocar no primeiro subcaule um asterisco e no segundo um ponto:
3.
4*
4.
5*
5.
6*
6.
7*
7.
8*
8.
9*
9.

7
2
9
3
5
0
5
0
5
0
5
0
5

7
2
6
1
5
0
6
0
8

8
2
8
2
6
1
7
2
9

9
3
9
4
7
3
8
3

7 8 8 9 9
4 4
9

No caso de a representao ainda apresentar muitas folhas em cada caule, existe a


possibilidade de considerar classes de amplitude 2, fazendo cada caule dividido em 5 subcaules
e cabendo a cada subcaule 2 folhas. Numa representao com os caules 0 e 1, estes seriam
indicados da seguinte forma:

www.alea.pt

4/11

0*
t
f
s
0.
1*
t
f
s
1.

folhas 0 e 1
folhas two e three
folhas four e five
folhas six e seven
folhas 8 e 9

Repare-se na analogia com a construo do histograma, em que tambm nos preocupamos em


ter classes de igual amplitude. A esta amplitude de classe usual chamar, na representao
em caule-e-folhas, comprimento de linha.
Das consideraes anteriores conclumos que, ao contrrio do histograma em que no existem
restries para a amplitude de classe, no caso do caule-e-folhas o comprimento de linha tem
que ser 10, 5 ou 2 vezes uma potncia de 10. Por exemplo, vrios valores possveis para o
comprimento de linha so:
2x100 ou seja 2;
100 ou seja 1;
5x10-1 ou seja 0,5;
2x101 ou seja 20;
Etc.

Exemplo 2 - No quadro seguinte apresenta-se o nmero de concelhos de cada um dos distritos


de Portugal Continental e das Regies Autnomas de Aores e Madeira (INE, 2009).
Represente os dados num diagrama de caule-e-folhas2.

Regio
Aveiro
Beja
Bragana
Braga
Cast.Branco
Coimbra
vora
Faro
Guarda
Leiria

N concelhos
19
14
12
14
11
17
14
16
14
16

Regio
Lisboa
Portalegre
Porto
Santarm
Setbal
Viana Cast.
Vila Real
Viseu
Aores
Madeira

N concelhos
16
15
18
21
13
10
14
24
19
11

No Excel, embora no exista uma representao imediata para a construo de um caule-e-folhas,


possvel elaborar este tipo de grfico. No Dossier XIII do ALEA - Estatstica Descritiva com Excel
Complementos, disponvel em http://www.alea.pt/html/statofic/html/dossier/html/meio_dossier13.html,
apresentado um processo desenvolvido por Neville Hunt (Hunt, 2001) para a construo de um caule-efolhas no Excel.
www.alea.pt

5/11

Se considerarmos para caules os algarismos das dezenas, s temos 2 caules diferentes.


Utilizando unicamente esses caules, a representao ficaria muito pesada, com muitas folhas
em cada caule e muito pouco elucidativa quanto estrutura dos dados. Assim, vamos
considerar para comprimento de linha o 2 e obtemos a seguinte representao:
1*
t
f
s
1.
2*
t
f

0
2
4
6
8
1

1
3
4
6
9

1
4 4 4 5
6 7
9

1|0 significa 10 concelhos

Na construo de um grfico de caule-e-folhas, nem sempre imediata a escolha dos dgitos


dominantes. Vejamos, por exemplo, a situao seguinte.
Exemplo 3 Uma empresa imobiliria pretendendo estudar os preos dos apartamentos na
regio de Lisboa, recolheu essa informao sobre 40 apartamentos, tendo obtido os seguintes
preos (em milhares de euros):
190
210
160
149

138
281
147
185

179
121
299
204

162
189
182
208

157
255
188

357
170
149

209
290
147

138
126
208

151
290
183

255
186
185

135
183
154

235
122
236

Organize os dados num grfico caule-e-folhas.


Os preos das casas variam entre 121 mil euros e 357 mil euros. Se tomarmos como dgito
dominante o das centenas, ficamos s com 3 caules. Se tomarmos os dgitos das centenas e
das dezenas ficamos com 24 caules, o que demasiado. Ento optamos por considerar para
caules os algarismos das centenas, divididos em dois subcaules, formando classes de
comprimento 50:
1*
1.
2*
2.
3*
3.

3
9
0
5

3
7
3
8

3
6
1
5

2
5
0
9

2
5
3
9

2 4 4 4 4
8 7 8 8 6 8 8 8 8 5
0 0
9

A apresentao final, com as folhas ordenadas, tem o seguinte aspecto:


1*
1.
2*
2.
3*
3.

2
5
0
5

2
5
0
5

www.alea.pt

2
5
0
8

3
6
0
9

3
6
1
9

3 4 4 4 4
7 7 8 8 8 8 8 8 8 89
3 3
9
1|2 significa 120 mil euros

6/11

Nesta representao considermos como folhas unicamente o algarismo das dezenas e


desprezmos o algarismo das unidades. Esta uma das situaes em que no conseguimos
recuperar exactamente os dados iniciais, mas apenas uma aproximao. Por exemplo,
podemos concluir que o valor mnimo e mximo registados para os preos dos apartamentos,
andam volta de 120 mil euros e 350 mil euros, respectivamente.
H autores que consideram como folhas os dois algarismos. No pensamos que seja uma boa
opo, sobretudo se tivermos muitos dados, j que o que se ganha com a possibilidade de
recuperar os dados iniciais, pode perder-se na visualizao da estrutura subjacente aos dados,
que , afinal, o nosso objectivo:
1*
1.
2*
2.
3*
3.

21
51
04
55

22
54
08
55

22
57
08
81

35
60
09
90

38
62
10
90

38 47 47 49 49
70 79 82 83 83 85 85 86 88 89 90
35 36
99

1|21 significa 121 mil euros

57

Os cauleefolhas paralelos
A representao em caule-e-folhas muito sugestiva para comparar duas amostras, como se
apresenta no exemplo seguinte:
Exemplo 4 A seguir apresentam-se os tempos de sono (em horas), de dois jovens, medidos
durante 30 noites seguidas. Compare-os.
8,7
9,4
6,6
6,0
6,9
9,9
6,3
8,9
10,1
9,6

Pedro
9,3
5,3
7,3
6,7
5,8
4,7
5,6
5,9
9,4
7,6

8,7
7,4
6,3
5,9
10,0
6,5
8,6
7,7
9,0
7,9

7,1
8,3
7,1
7,9
7,5
6,2
8,2
8,7
8,5
7,6

David
9,5
7,1
7,5
7,9
6,4
6,2
7,5
7,7
7,6
8,8

7,1
7,4
7,4
7,8
6,2
8,6
8,4
6,6
8,1
7,1

Para representar os caule-e-folhas paralelos, determinamos os caules (comuns) a partir da


amostra de maior amplitude, ou seja, neste caso, dos dados correspondentes ao Pedro.
Pedro

www.alea.pt

David

9 9 8
3 3
9 7 6
4
9 7

7
3
6
0
5
3
6

9 7 7
4 4 3
9
1

6
0
6
0

4.
5*
5.
6*
6.
7*
7.
8*
8.
9*
9.
10*

2
6
1
5
1
5

2 2 4
1
5
2
6

1
5
3
7

1 1 4 4
6 6 7 8 9 9
4
8

5
6|2 significa 6,2 horas
7/11

Os dados relativamente ao Pedro encontram-se para o lado esquerdo, enquanto que os


referentes ao David esto para o lado direito. A representao anterior permite realar a maior
disperso do sono do Pedro, enquanto que o David mais regular, com uma durao de sono
de um modo geral entre as 7 e as 8 horas.
Como diminuir o nmero de caules?
Nos exemplos anteriores os caules foram divididos em subcaules, para aumentar o nmero de
caules ou linhas na representao do caule-e-folhas. Uma situao menos evidente aquela
em que o nmero de caules demasiado para o nmero de dados a representar, como no
exemplo seguinte:
Exemplo 5 Registaram-se os tempos, em segundos, que 28 alunos conseguiam estar sem
respirar:
112
80
45

41
48
123

26
92
57

35
106
29

98
105

56
115

87
79

38
83

125
131

64
87

78
94

82
111

Considerando como caules os algarismos das dezenas e das centenas, temos


2
3
4
5
6
7
8
9
10
11
12
13

6
5
1
6
4
8
0
2
5
1
3
1

9
8
5 8
7
9
2 3 7 7
4 8
6
2 5
5
2|6

significa 26 segundos

Os dados esto um pouco dispersos, pelo que seria conveniente considerarmos menos caules.
Uma forma de resolver este problema juntar os caules dois a dois. Em vez de termos as
classes [20, 30[,[30, 40[,[40, 50[,[50, 60[, ..., teremos [20, 40[,[40, 60[, .... Para distinguir as
folhas que originalmente estavam penduradas nos caules 3, 5, ..., das que estavam penduradas
nos caules 2, 4,..., sublinhamos as primeiras. Esta precauo tem como nico objectivo a
posterior reconstituio do conjunto dos dados.
2
4
6
8
10
12

6
1
4
0
5
3

9
5
8
2
6
5

www.alea.pt

5
8
9
3
1
1

8
6 7
7 7 2 4 8
2 5
2|6 significa 26 segundos

8/11

Qual o nmero de caules ou linhas adequado para a construo dum caule-e-folhas?3


A escolha do nmero de caules ou linhas, tal como acontece com o nmero de classes do
histograma, depende em grande parte da experincia e da habilidade do estatstico. Os
problemas que se levantam so anlogos aos da construo do histograma. No entanto, dado o
facto de se utilizar a notao decimal, necessrio considerar uma outra metodologia para o
comprimento do intervalo correspondente a cada linha. Assim, utiliza-se normalmente o
seguinte procedimento:
Considera-se para nmero de linhas L um valor que no exceda
L = Parte inteira de (10 log 10 n )
onde n o nmero de observaes.
Esta regra costuma fornecer valores de L convenientes para as dimenses das amostras usuais
num tratamento estatstico. evidente que, se n for muito grande, esta representao torna-se
muito pesada e pouco malevel e tal como para o histograma, aconselha-se a no utilizar mais
do que 15 classes.
Usando L como limite para o nmero de linhas, levanta-se o problema da determinao dos
comprimentos dos intervalos correspondentes a cada linha. O processo mais simples usar
uma potncia de 10 como comprimento do intervalo. Assim, dividimos R, a amplitude da
amostra, por L e arredondamos por excesso (se necessrio) o quociente obtido, at potncia
de 10 mais prxima.
Pode acontecer que a tcnica descrita anteriormente para a construo da representao de
caule-e-folhas apresente demasiadas folhas por linha. Ento, o processo de resolver este
problema considerar duas linhas por caule, repetindo os seus valores no caule. Neste caso o
comprimento do intervalo ser 5 vezes uma potncia de 10.
Pode ainda acontecer que, mesmo considerando 2 linhas por caule, a representao ainda
continue muito pesada, mas que se arredondssemos para a potncia de 10 imediatamente
abaixo do valor obtido para R/L, tambm ficasse muito esparsa. Ento, resolve-se o problema
considerando 5 linhas por caule e neste caso o comprimento do intervalo 2 vezes uma
potncia de 10.
Vejamos a aplicao desta metodologia para a obteno do nmero de caules convenientes
para a representao dos dados do exemplo 2. Uma vez que temos 20 dados
L = parte inteira (10xlog1020)
L = parte inteira (10x1,301)
L = 13
Considerando 13 o limite para o nmero de linhas, vejamos qual o comprimento de linha:

Introduz-se este tpico a ttulo de curiosidade, pois no se aconselha ao nvel do ensino bsico e
secundrio, a preocupao com este tipo de regras.
www.alea.pt

9/11

R 14

1,08
L
13

R = 24-10= 14

O comprimento de linha sugerido 2.


A utilizao do caule-e-folhas para obter a mediana e os quartis
No caule-e-folhas os dados esto representados de uma forma ordenada, pelo que possvel
utiliz-lo para calcular a mediana e os quartis.
Representando por n o nmero de dados, comea por se calcular

n1
para obter a posio da
2

mediana. Se n mpar, ento a mediana o elemento que se encontra na posio dada pelo
quociente anterior. Se n par, ento a mediana ser a semi-soma dos elementos que se
encontram nas posies dos dois inteiros que rodeiam o valor

n1
.
2

O clculo dos quartis resume-se a calcular a mediana de cada uma das partes em que fica
dividido o conjunto dos dados pela mediana. No caso de a mediana ser um dos elementos do
conjunto dos dados, situao que se verifica sempre que o nmero de dados mpar, ento
consideramos que a mediana pertence s duas partes. Por exemplo, se o nmero de dados for
igual a 21, a mediana o elemento que est na posio 11, pelo que consideramos que o
elemento nesta posio pertence s duas partes em que fica dividido o conjunto dos dados.
Assim, o 1. quartil ser o elemento na posio 6 a contar da parte de inicial do caule-e-folhas
enquanto que o 3. quartil ser o elemento na posio 6 a contar da parte final do caule-efolhas.
Exemplo 6 - Num determinado teste realizado a 51 estudantes, obtiveram-se as seguintes
pontuaes:
75 98 42 75 84 87 65 59 63 86 78 37 99 66 90 79 80 89 68 57 95 55
79 88 76 60 77 49 92 83 71 78 53 81 77 58 93 85 70 62 80 74 69 90
62 84 64 73 48 72 38
Faa uma representao em caule-e-folhas dos dados e determine a mediana e os quartis.
Considerando o algarismo das dezenas para caule, facilmente se obtm a seguinte
representao:
3
4
5
6
7
8
9

7
2
9
5
5
4
8

8
9
7
3
5
7
9

8
5
6
8
6
0

3
8
9
0
5

8
0
9
9
2

2
6
8
3

9 2 4
7 1 8 7 0 4 3 2
3 1 5 0 4
0

que depois de ordenada vem:


www.alea.pt

10/11

3
4
5
6
7
8
9

7
2
3
0
0
0
0

8
8
5
2
1
0
0

9
7
2
2
1
2

8
3
3
3
3

9
4
4
4
5

5
5
4
8

6 8 9
5 6 7 7 8 8 9 9
5 6 7 8 9
9
3|7 significa 37 pontos

A mediana encontra-se na posio 26 (=

51 1
) pelo que ficamos com dois conjuntos de dados
2

com 26 elementos cada um (como foi dito anteriormente, tommos a opo de considerar a
mediana do total dos dados nos dois conjuntos de dados, para a seguir calcular a mediana de
cada um destes conjuntos). A mediana de cada um destes conjuntos encontra-se na posio
13,5 (=

26 1
), pelo que ser a semi-soma dos elementos das posies 13 e 14:
2

Mediana = 75 pontos
1. quartil = 62,5 pontos
3. quartil = 84 pontos
Do que ficou dito anteriormente sobre o grfico caule-e-folhas, podemos resumir algumas das
vantagens, relativamente a outras construes grficas4:

, em geral muito simples de fazer, tornando-se acessvel a alunos de qualquer grau


(desde que ajudados na escolha dos dgitos dominantes que servem de caules);

D uma informao visual sobre a forma como os dados esto distribudos;

Permite ordenar rapidamente a amostra;

Facilita o clculo da mediana e dos quartis.

Graa Martins, M. E.; Loura, Lusa Canto e Castro; Mendes, Maria de Ftima, 2007 Anlise de Dados,
Texto de Apoio para os Professores do 1 ciclo Ministrio da Educao, Direco-Geral da Inovao e
do Desenvolvimento Curricular.
www.alea.pt

11/11

You might also like