You are on page 1of 51

INICIACIN A LA ESTADSTICA

EXPLORATORIA

Preparado por: Jos Cajas

Sabemos que...

Estadstica descriptiva :
Conjunto de herramientas que permiten
resumir y representar la informacin de
una tabla estadstica.
(simplificacin y esquematizacin)

Estadstica descriptiva
multidimensional...

Pero, qu es la estadstica exploratoria?

La estadstica exploratoria es una estadstica


descriptiva
La
estadstica exploratoria es algo ms
y adems descriptiva
es...
que una estadstica
una gama de instrumentos de anlisis, de

en efecto...

descubrimiento, de verificacin o de prueba de


hiptesis de trabajo...
a partir de una tabla estadstica.

es un instrumento de descripcin?

cules
son las
caractersticas
de los
Razonemos
a partir
de un ejemplo
:
el microscopio
instrumentos
de exploracin?
o es un instrumento de exploracin ...?

Supongamos que hay razones para


qu
debemos
hacer
para
que
esperar que la lamina que analizamos
elpresente
microscopio
nos
muestre
la
bacilos de Koch...
presencia de bacilos de Koch?

qu veramos en el microscopio?

El microscopio no es solo una


El proceso de anlisis del bilogo tiene
herramienta de descripcin,
dos componentes esenciales:
es un instrumento de exploracin

- una metodologa de exploracin pertinente

de la materia biolgica.

- un instrumento de exploracin adecuado

de la misma manera :
La Estadstica Exploratoria se compone de
un doble conjunto de :
- reglas metodolgicas de observacin
y de tratamiento de los datos
* manera de organizar la observacin
de los problemas a resolver.

- herramientas estadsticas adecuadas

* manera de elegir los tratamientos estapara


el tratamiento
depara
las informaciones
dsticos
pertinentes
resolver esos
contenidas en una tabla estadstica.
problemas a partir de los datos.

La observacin es un proceso que


se cumple
en tres etapas:
Por
ello, debemos...
1.
El observador
objeto
- definir
lo quepercibe
es unaelobservacin,
2.
El observador
e interpreta
el
- esclarecer
el compara
lugar que
ocupan los
mtodosde
estadsticos
en la
resultado
la comparacin

observacin-exploracin de un
3. El observador describe lo que percibe
fenmeno...
apoyndose en proposiciones que
transforma en datos.

Definicin del proceso de observacin


Observar es un proceso que...
1. Incluye
atencin selectiva
e inteligente,
Nos la
interesamos
por
los

Se selecciona informacin en el
2. est
orientado
hacia
un objetivo
terminal
conjunto
de
informaciones
posibles
procesos
de
observacin
u organizador,

que
estn
ligados
a
la
La
observacin
sin
objetivo
es
imposible.
3. se orienta hacia un objeto para recoger
informaciones, de conocimientos
produccin
La informacin bruta es traducida en
4. Que sern transmitidas...
cdigos
para
conservarla,
elaborarla
La observacin supone la comunicacin
odetransmitirla.
resultados.

Esquema del proceso de observacin


Percepcin
Reconocimiento
Investigacin
descriptiva

Objetivo

Hechos
conceptos

Evaluacin
(diagnostico)

Decisiones
(soluciones)

accin

Investigacin
heurstica

Hiptesis

Experimentacin

Conclusiones

modelos

Reducciones del proceso de observacin


Privilegiando las tcnicas de observacin
en detrimento del proceso de observacin

Considerando la experimentacin como


la nica forma de observacin cientfica

Subordinando la observacin a
la modelizacin

El investigador realiza un espiral


inductivo-hipottico-deductivo,
lo que lo lleva a explorar
tanto como a experimentar

Anlisis de la informacin
contenida en una Tabla Estadstica
de tipo individuos x var. cuantitativas

recordar conceptos conocidos...

Crear un
lenguaje
comn

Verificar que comprendemos


esos conceptos

I. Tabla de Datos

La Tabla de Datos resume la observacin


Seleccin:

de atributos observables
de un conjunto de unidades de observacin
Operaciones de campo:

medicin de esas caractersticas


para esas unidades de observacin

Resumen

Conservacin de las observaciones


en una tabla rectangular de datos

Tabla de Datos : disposicin rectangular


de las observaciones

V1 V2 ...Vj... Vp
1
i
n

xi j

Segn el tipo de atributos y su escala de medida...


T. de D. : individuos x caract. cuantitativas
T. de D. : individuos x caract. cualitativas

Para qu construimos las Tablas de Datos?

Para evaluar la semejanza entre los individuos


comparados por los atributos observados.

Para evaluar la asociacin entre las caractersticas observadas sobre un conjunto de unidades
de observacin

Matriz de Datos
Se asocia a la T. de D. una matriz de orden (n x p)

1
i
n

V1 V2

Vj ... Vp

...

xij

x11

...

x1j

...

x1p

x i1

...

xij

...

xip

xn1 ... xnj

...

xnp

Informacin de una T. de D.

Informacin = mensaje destinado a comunicar


el resultado
de
una
comparacin
Resultados
Analizar

Observar

Informacin elemental = dato...


Producir

Interpretar
un
el
resulta de la comparacin
de una realidad
Comparar
mensaje
mensaje
con una escala o una lista de atributos

Comparar un Dar
un sentido
a las
grupo
de individuos
observados
comparaciones
hechas
implica producir
un mensaje

Componentes y modalidades del mensaje


Modo digital
Modalidades
Modo analgico
Informacin estadstica:
- resumen de las comparaciones
hechas con los datos.
Mensaje
Comparar

Interpretar
el mensaje
- estudio de la relaciones que se presentan entre
diversas informaciones (constituyen un hecho)
Contenido
Componentes
Sentido

Informacin pertinente
Es una informacin que se ajusta en precisin
y sentido al uso que se har de ella.

Informacin fiable
Es una informacin que comporta una
precisin y un sentido estables.

La informacin de las tablas

individuos x var. cuantitativas

Observar, conservar las observ. y resumir...

Observacin
Tabla
Ind. x Var. Cuantitativas
de las
Repaso
de conceptos conocidos...
V1 V2 V j
Vp
caractersticas
1

resumen
medicin de cada
escala para cada
individuo

xij

Informacin disponible en una


Tabla Individuos x Var. Cuantitativa
Esa informacin resulta de...

Comparacin de los individuos para


evaluar las semejanzas...

Evaluacin del nivel de relacin


entre las variables...

Resumir

perder informacin

cmo comparar
Observar
i y m, en la
...
caracterstica Vj ?
x ij : valor de i
Tabla de Datos
Ind. x Var. Cuantitativas xmj : valor de m
i

V 1 V2

Vj

Conservar

xij

xmj

Vp

a) x ij
b) x ij
c) x ij
x ij

x mj

x mj

xx mj = k
/ mj = k

"individuo" promedio

Resumir

dispersin

distribucin de la
caracterstica V j

Esa manera de resumir la


informacin de la Tabla de Datos...

Hace que se pierda la informacin


sobre los individuos...

No permite estudiar la
informacin
relativa a las variables

Estudio de la informacin
de una Tabla de Datos con
una sola variable cuantitativa
Recordemos las principales tcnicas
de anlisis
de las distribuciones univariadas...

Ejemplo : Longitud del cuerpo de 22 animales


Tabla de Datos
Animal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

Longitud
del cuerpo
168
169
150
148
154
145
165
163
148
161
151
176
159
159
151
155
169
158
157
161
146
150

Media de la distribucin
1
x
n

i 1

1
xi
22

22

x
i 1

157,4 cm

Representacin grfica de la distribucin


9 22 15
6 21 4 3 11

14 20
516 1918 13 10 8

17
12

12 Longitud
del cuerpo

151 cm
176 cm

Representacin fsica de la media de una distribucin


0

0
0

62 9 2
1 4
215
9
3212
6 21
94 23211155 5
11 16
6 21 4 9 2215
191 111
414 20
17
3 11 551
6
1991
811883 44220200
1
6
1
172
13101
6 21 4 3 11 516 191813
108 8 7
10
08 8
7
1 127
77
1
17
12 2

157,4 cm

x
(Centro de masas)

12

Longitud

del cuerpo
Longitu
d
12 de
Lonl cuerpo
12
gitu
d
Lodel c
ng uerp
itu
del
d o
cue
rpo
12

Sobre el eje de representacin de la nube de


puntos...

El punto de abscisa x es el baricentro de la nube.


Centro de gravedad de la distribucin:
n

i xi

i 1

1
Si pi
n

1
i 1, , n x
n

x
i 1

157 , 4 cm

Varianza de la distribucin

Evala la dispersin de los valores observados


en torno al valor medio

Definicin:

varianza x : s 2x

pi x i x

i 1

xi x

si pi 1 i 1, , n s 2x 1
n

i 1

varianza de la longitud del cuerpo: s 2x 72,25 cm 2


Desvo estndar de la distribucin:

desvio estandarx varianza x


s x s 2x 8,5 cm

Representacin fsica de la varianza de una


distribucin

Eje de giro

x
9 2215
6 21 4 311

14 20
5 16 191813 10

( x 11 - x )
( x 15 - x )

Momento de inercia : s 2x

17
1 2

12 Longitud
del cuerpo

( x12 - x )

Varianza e inercia
La varianza de una distribucin corresponde a la
inercia de una nube de puntos con respecto a su
Centro de Gravedad.

Contribucin a la inercia, con respecto al baricentro


del individuo i

Contrib. a la inercia del punto i x pi x i x

Inercia, con respecto al baricentro, de la nube de puntos


n

I s x pi x i x
N
x

i 1

La mediana de una distribucin


Animal
6
21
4
9
3
22
11
15
5
16
19
18
13
14
10
20
8
7
1
2
17
12

Longitud
del cuerpo
145
146
148
148
150
150
151
151
154
155
157
158
159
159
161
161
163
165
168
169
169
176

150 = primer cuartil

157,5 = mediana

163 = tercer cuartil

Boxplot de la distribucin
LONGITUD DEL CUERPO DEL ANIMAL
180

170

160

mediana

150

140

N =22

Histograma de la distribucin
LONGITUD DEL CUERPO DEL ANIMAL
7
6
5
4
3
2
1
0

145,0

150,0 155,0

160,0 165,0 170,0 175,0

Media = 157,4 Desvo Estndar = 8,50N = 22

Variable centrada
X c: var. centrada correspond. a X
x ic x i x
Ejemplo:

x c4 148 cm 157 ,4 cm 9,4 cm

Animal

Longitud
del cuerpo

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

10,6
11,6
-7,4
-9,4
-3,4
-12,4
7,6
5,6
-9,4
3,6
-6,4
18,6
1,6
1,6
-6,4
-2,4
11,6
0,6
-0,4
3,6
-11,4
-7,4

Representacin grfica de la variable centrada


0

9 2215
6 21 4 3 11

x c 14

20
516 191813 10 8

17
1 2

12 Longitud

del cuerpo
-9,4 cm

157,4 cm
0

xc 0

La media de una variable centrada es nula

Variable reducida
x : media de la variable X
s x : desvo estndar de la distribucin
X R : var. centrada y reducida correspondiente a X

xi x
R
zi x i
i 1, , n
sx
La reduccin neutraliza la influencia

de la unidad de medida.
La varianza de una variable reducida es igual a 1.
La transformacin geomtrica

X X R es una

homotecia de centro en G y de razn

sx

Estudio de la informacin
de una Tabla de Datos con
dos variables cuantitativas
Recordemos las principales
tcnicas de anlisis
de las distribuciones bivariadas

Tabla de Datos: ejemplo


Animal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
G

Longitud
del cuerpo
168
169
150
148
154
145
165
163
148
161
151
176
159
159
151
155
169
158
157
161
146
150
157,4

Permetro
de pecho
71
68
65
67
67
66
69
69
68
69
70
74
70
73
69
71
74
70
71
73
71
65
69,5

G : baricentro de la nube de
puntos-individuos.
Todos los animales tienen la
misma importancia en las
comparaciones...

1
pi i 1, ,22
n

Representacin de la nube de puntos individuos


Animal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
G

Longitud Permetro
del cuerpo de pecho
168
71
169
68
150
65
148
67
154
67
145
66
165
69
163
69
148
68
161
69
151
70
176
74
159
70
159
73
151
69
155
71
17 169
17
7417
158
70
157
71
161
73
146
71
150
65
157,4
69,5

Permetro
del pecho
76

17

74

17
72

17

70

17
17

68

17
1766

17
17

Longitud
del cuerpo

64

140

150

160

170

180

Transformacin de las variables...


variables centradas
Longitud
Permetro
N

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

del cuerpo del pecho

10.6
11.6
- 7.4
-9.4
-3.4
-12.4
7.6
5.6
-9.4
3.6
-6.4
18.6
1.6
1.6
-6.4
-2.4
11.6
0.6
-0.4
3.6
-11.4
-7.4

1.5
-1.5
- 4.5
-2.5
-2.5
-3.5
-0.5
-0.5
-1.5
-0.5
0.5
4.5
0.5
3.5
-0.5
1.5
4.5
0.5
1.5
3.5
1.5
-4.5

Coordenadas del punto i :

x ic x i x i 1, ,22
yic yi y i 1, ,22

Ejemplos :

x 1c 168 157,4 10,6 cm


y1c 71 69,5 1,5 cm

x c3 150 157,4 -7,4 cm


y c3 65 69,5 -4,5 cm

del origen de los


Transformacin geomtrica : translacin
ejes de representacin.
Permetro
del pecho

Perim. pecho
(centrada)

76

74

72

1.5

-7.4

70

1
10.6

G0

Long. cuerpo
(centrada)

68

66

-4.5

Longitud
del cuerpo

64

0
140

150

160

170

180

Transformacin de las variables...


variables centradas y reducidas
Longitud

Permetro

N del cuerpo del pecho


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

1.2
1.4
-0.9
-1.1
-0.4
-1.5
0.9
0.7
-1.1
0.4
-0.8
2.2
0.2
0.2
-0.8
-0.3
1.4
0.1
0.0
0.4
-1.3
-0.9

0.6
-0.6
-1.7
-1.0
-1.0
-1.3
-0.2
-0.2
-0.6
-0.2
0.2
1.7
0.2
1.3
-0.2
0.6
1.7
0.2
0.6
1.3
0.6
-1.7

Coordenadas del punto i :

zx
i

x ri

xi x

zy

yri

yi y

sx

sy

Ejemplo :

x r10
yr10

161 157,4

0,4

8,5

69 69,5

-0,2
2,5

Transformacin geomtrica : estandarizacin de escala en

funcin de la variabilidad observada.

Permetro del pecho


(var. centrada y reducida)
2.0
1.5
1.0
1
0.5
-1.5

-1.0

-0.5

0
-0.5
-1.0
-1.5

-2.0

0.5

1.0

1.5

2.0

2.5

Longitud del cuerpo


(var. centrada y reducida)

Evaluacin de la relacin entre las dos variables...


covarianza y correlacin

Dos distribuciones bivariadas pueden presentar el mismo


baricentro y las mismas inercias marginales...
Distrib. A
X
A

Y
A

Y
B

xA 5
s 2x

Distrib. B

yA 6

4 ,67 s 2y 4 ,67
A

xB 5

yB 6

s 2x 4 ,67 s 2y 4 ,67
B

Cmo describir entonces las distribuciones bivariadas?

Definicin de la covarianza
n

covarianza (x,y) : s xy

p x
i

x yi y

x yi y

i 1

1
1
si pi i s xy
n
n

x
i 1

Interpretacin geomtrica de la covarianza


Permetro
del pecho

Permetro del pecho


(variable centrada)

76
74

72

70

Longitud del cuerpo


(variable centrada)

68
+

66
64
0

Longitud
140

150

160

170

180

del cuerpo

Modelos de dependencia y de independencia


y

+
x

relacin lineal
positiva entre
las var. x e y

independencia
entre las
var. x e y

+
+

relacin lineal
negativa entre
las var. x e y

Pero...
el valor de la covarianza depende de las unidades de medida
de las variables que componen la distribucin bivariada

Estudio de la informacin
de una Tabla de Datos con ms
de dos variables cuantitativas
El estudio de las distribuciones p-variadas
debe iniciarse con el caso en que p = 3

You might also like