Professional Documents
Culture Documents
EXPLORATORIA
Sabemos que...
Estadstica descriptiva :
Conjunto de herramientas que permiten
resumir y representar la informacin de
una tabla estadstica.
(simplificacin y esquematizacin)
Estadstica descriptiva
multidimensional...
en efecto...
es un instrumento de descripcin?
cules
son las
caractersticas
de los
Razonemos
a partir
de un ejemplo
:
el microscopio
instrumentos
de exploracin?
o es un instrumento de exploracin ...?
qu veramos en el microscopio?
de la materia biolgica.
de la misma manera :
La Estadstica Exploratoria se compone de
un doble conjunto de :
- reglas metodolgicas de observacin
y de tratamiento de los datos
* manera de organizar la observacin
de los problemas a resolver.
observacin-exploracin de un
3. El observador describe lo que percibe
fenmeno...
apoyndose en proposiciones que
transforma en datos.
Se selecciona informacin en el
2. est
orientado
hacia
un objetivo
terminal
conjunto
de
informaciones
posibles
procesos
de
observacin
u organizador,
que
estn
ligados
a
la
La
observacin
sin
objetivo
es
imposible.
3. se orienta hacia un objeto para recoger
informaciones, de conocimientos
produccin
La informacin bruta es traducida en
4. Que sern transmitidas...
cdigos
para
conservarla,
elaborarla
La observacin supone la comunicacin
odetransmitirla.
resultados.
Objetivo
Hechos
conceptos
Evaluacin
(diagnostico)
Decisiones
(soluciones)
accin
Investigacin
heurstica
Hiptesis
Experimentacin
Conclusiones
modelos
Subordinando la observacin a
la modelizacin
Anlisis de la informacin
contenida en una Tabla Estadstica
de tipo individuos x var. cuantitativas
Crear un
lenguaje
comn
I. Tabla de Datos
de atributos observables
de un conjunto de unidades de observacin
Operaciones de campo:
Resumen
V1 V2 ...Vj... Vp
1
i
n
xi j
Para evaluar la asociacin entre las caractersticas observadas sobre un conjunto de unidades
de observacin
Matriz de Datos
Se asocia a la T. de D. una matriz de orden (n x p)
1
i
n
V1 V2
Vj ... Vp
...
xij
x11
...
x1j
...
x1p
x i1
...
xij
...
xip
...
xnp
Informacin de una T. de D.
Observar
Interpretar
un
el
resulta de la comparacin
de una realidad
Comparar
mensaje
mensaje
con una escala o una lista de atributos
Comparar un Dar
un sentido
a las
grupo
de individuos
observados
comparaciones
hechas
implica producir
un mensaje
Interpretar
el mensaje
- estudio de la relaciones que se presentan entre
diversas informaciones (constituyen un hecho)
Contenido
Componentes
Sentido
Informacin pertinente
Es una informacin que se ajusta en precisin
y sentido al uso que se har de ella.
Informacin fiable
Es una informacin que comporta una
precisin y un sentido estables.
Observacin
Tabla
Ind. x Var. Cuantitativas
de las
Repaso
de conceptos conocidos...
V1 V2 V j
Vp
caractersticas
1
resumen
medicin de cada
escala para cada
individuo
xij
Resumir
perder informacin
cmo comparar
Observar
i y m, en la
...
caracterstica Vj ?
x ij : valor de i
Tabla de Datos
Ind. x Var. Cuantitativas xmj : valor de m
i
V 1 V2
Vj
Conservar
xij
xmj
Vp
a) x ij
b) x ij
c) x ij
x ij
x mj
x mj
xx mj = k
/ mj = k
"individuo" promedio
Resumir
dispersin
distribucin de la
caracterstica V j
No permite estudiar la
informacin
relativa a las variables
Estudio de la informacin
de una Tabla de Datos con
una sola variable cuantitativa
Recordemos las principales tcnicas
de anlisis
de las distribuciones univariadas...
Longitud
del cuerpo
168
169
150
148
154
145
165
163
148
161
151
176
159
159
151
155
169
158
157
161
146
150
Media de la distribucin
1
x
n
i 1
1
xi
22
22
x
i 1
157,4 cm
14 20
516 1918 13 10 8
17
12
12 Longitud
del cuerpo
151 cm
176 cm
0
0
62 9 2
1 4
215
9
3212
6 21
94 23211155 5
11 16
6 21 4 9 2215
191 111
414 20
17
3 11 551
6
1991
811883 44220200
1
6
1
172
13101
6 21 4 3 11 516 191813
108 8 7
10
08 8
7
1 127
77
1
17
12 2
157,4 cm
x
(Centro de masas)
12
Longitud
del cuerpo
Longitu
d
12 de
Lonl cuerpo
12
gitu
d
Lodel c
ng uerp
itu
del
d o
cue
rpo
12
i xi
i 1
1
Si pi
n
1
i 1, , n x
n
x
i 1
157 , 4 cm
Varianza de la distribucin
Definicin:
varianza x : s 2x
pi x i x
i 1
xi x
si pi 1 i 1, , n s 2x 1
n
i 1
Eje de giro
x
9 2215
6 21 4 311
14 20
5 16 191813 10
( x 11 - x )
( x 15 - x )
Momento de inercia : s 2x
17
1 2
12 Longitud
del cuerpo
( x12 - x )
Varianza e inercia
La varianza de una distribucin corresponde a la
inercia de una nube de puntos con respecto a su
Centro de Gravedad.
I s x pi x i x
N
x
i 1
Longitud
del cuerpo
145
146
148
148
150
150
151
151
154
155
157
158
159
159
161
161
163
165
168
169
169
176
157,5 = mediana
Boxplot de la distribucin
LONGITUD DEL CUERPO DEL ANIMAL
180
170
160
mediana
150
140
N =22
Histograma de la distribucin
LONGITUD DEL CUERPO DEL ANIMAL
7
6
5
4
3
2
1
0
145,0
150,0 155,0
Variable centrada
X c: var. centrada correspond. a X
x ic x i x
Ejemplo:
Animal
Longitud
del cuerpo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
10,6
11,6
-7,4
-9,4
-3,4
-12,4
7,6
5,6
-9,4
3,6
-6,4
18,6
1,6
1,6
-6,4
-2,4
11,6
0,6
-0,4
3,6
-11,4
-7,4
9 2215
6 21 4 3 11
x c 14
20
516 191813 10 8
17
1 2
12 Longitud
del cuerpo
-9,4 cm
157,4 cm
0
xc 0
Variable reducida
x : media de la variable X
s x : desvo estndar de la distribucin
X R : var. centrada y reducida correspondiente a X
xi x
R
zi x i
i 1, , n
sx
La reduccin neutraliza la influencia
de la unidad de medida.
La varianza de una variable reducida es igual a 1.
La transformacin geomtrica
X X R es una
sx
Estudio de la informacin
de una Tabla de Datos con
dos variables cuantitativas
Recordemos las principales
tcnicas de anlisis
de las distribuciones bivariadas
Longitud
del cuerpo
168
169
150
148
154
145
165
163
148
161
151
176
159
159
151
155
169
158
157
161
146
150
157,4
Permetro
de pecho
71
68
65
67
67
66
69
69
68
69
70
74
70
73
69
71
74
70
71
73
71
65
69,5
G : baricentro de la nube de
puntos-individuos.
Todos los animales tienen la
misma importancia en las
comparaciones...
1
pi i 1, ,22
n
Longitud Permetro
del cuerpo de pecho
168
71
169
68
150
65
148
67
154
67
145
66
165
69
163
69
148
68
161
69
151
70
176
74
159
70
159
73
151
69
155
71
17 169
17
7417
158
70
157
71
161
73
146
71
150
65
157,4
69,5
Permetro
del pecho
76
17
74
17
72
17
70
17
17
68
17
1766
17
17
Longitud
del cuerpo
64
140
150
160
170
180
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
10.6
11.6
- 7.4
-9.4
-3.4
-12.4
7.6
5.6
-9.4
3.6
-6.4
18.6
1.6
1.6
-6.4
-2.4
11.6
0.6
-0.4
3.6
-11.4
-7.4
1.5
-1.5
- 4.5
-2.5
-2.5
-3.5
-0.5
-0.5
-1.5
-0.5
0.5
4.5
0.5
3.5
-0.5
1.5
4.5
0.5
1.5
3.5
1.5
-4.5
x ic x i x i 1, ,22
yic yi y i 1, ,22
Ejemplos :
Perim. pecho
(centrada)
76
74
72
1.5
-7.4
70
1
10.6
G0
Long. cuerpo
(centrada)
68
66
-4.5
Longitud
del cuerpo
64
0
140
150
160
170
180
Permetro
1.2
1.4
-0.9
-1.1
-0.4
-1.5
0.9
0.7
-1.1
0.4
-0.8
2.2
0.2
0.2
-0.8
-0.3
1.4
0.1
0.0
0.4
-1.3
-0.9
0.6
-0.6
-1.7
-1.0
-1.0
-1.3
-0.2
-0.2
-0.6
-0.2
0.2
1.7
0.2
1.3
-0.2
0.6
1.7
0.2
0.6
1.3
0.6
-1.7
zx
i
x ri
xi x
zy
yri
yi y
sx
sy
Ejemplo :
x r10
yr10
161 157,4
0,4
8,5
69 69,5
-0,2
2,5
-1.0
-0.5
0
-0.5
-1.0
-1.5
-2.0
0.5
1.0
1.5
2.0
2.5
Y
A
Y
B
xA 5
s 2x
Distrib. B
yA 6
4 ,67 s 2y 4 ,67
A
xB 5
yB 6
s 2x 4 ,67 s 2y 4 ,67
B
Definicin de la covarianza
n
covarianza (x,y) : s xy
p x
i
x yi y
x yi y
i 1
1
1
si pi i s xy
n
n
x
i 1
76
74
72
70
68
+
66
64
0
Longitud
140
150
160
170
180
del cuerpo
+
x
relacin lineal
positiva entre
las var. x e y
independencia
entre las
var. x e y
+
+
relacin lineal
negativa entre
las var. x e y
Pero...
el valor de la covarianza depende de las unidades de medida
de las variables que componen la distribucin bivariada
Estudio de la informacin
de una Tabla de Datos con ms
de dos variables cuantitativas
El estudio de las distribuciones p-variadas
debe iniciarse con el caso en que p = 3