You are on page 1of 3

[5].

ESTADSTICA DESCRIPTIVA
(c) 2011, Juanmiguel Len-Rojas. Puedes copiar, distribuir y comunicar pblicamente esta obra, y hacer obras derivadas, esto es, puedes alterarla, transformarla o crear nuevas obras a partir de ella. Sin restriccin alguna.
Licencia Gratuidad Cristiana <http://gratuidadcristiana.blogspot.com/>(metalicencia de Creative Commons CC Zero y CC BY).
23. VARIABLES ESTADSTICAS UNIDIMENSIONALES
(v. alpha 1.2.1)
Caracteres: Cuantitativos (medibles) discretos o continuos,
cualitativos (no medibles) dicotmicos o politmicos y ordina-
les (ordenables)
23.1. Ordenacin de datos
Variable estadstica: X
Tamao de la muestra: n nmero de observaciones
Valores no agrupados: {x
1
, x
2
, ..., x
n
}
Valores en orden creciente: {x
(1)
, x
(2)
, ..., x
(n)
}, es decir,
p, q I, p < q x
(p)
x
(q)
Valores agrupados: {x
1
, x
2
, ..., x
k
} (k grupos)
Conjunto de ndices: I = {1, 2, ..., k}
Convenio:

i


1ik

iI

i=1
Intervalos de clase: {[a
0
, a
1
), ..., [a
k1
, a
k
)}
(de amplitud constante o variable)
Marca de clase: x
i
= (a
i1
+ a
i
)/2
Frecuencia absoluta de x
i
: n
i
nmero de veces que X toma el
valor x
i
nmero de elementos en
el grupo con valor o marca de clase
x
i
(k = n n
i
= 1)
Frec. abs. acumulada en x
i
: N
i
=

i
j=1
f
j
, ocurriendo que
p, q I, p < q f
p
f
q
Frecuencia relativa de x
i
: f
i
= n
i
/n (k = n f
i
= 1/n)
Frec. rel. acumulada en x
i
: F
i
= N
i
/n
Propiedades:
(1) i I, n
i
[0, n] f
i
[0, 1]; (2)

i
n
i
= n; (3) i I \ {1},
N
i1
+ n
i
= N
i
; (4) N
k
= n; (5)

i
j=1
f
j
= F
i
; (6)

i
f
i
= 1;
(7) F
k
= 1
23.2. Medidas de posicin o localizacin
Cuantiles: C

= x
(h)
tal que h = [n] + 1, con (0, 1)
Cuantiles: C
r/100
= a
i1
+
rn
100
N
i1
n
i
(a
i
a
i1
), siendo
r R y [a
i1
, a
i
] tal que N
i

rn
100
Cuartiles: Q
1
= C
0,25
, Q
2
= C
0,5
, Q
3
= C
0,75
Quintiles: K
r
= C
r/5
(r = 1, ..., 4)
Deciles: D
r
= C
r/10
(r = 1, ..., 9)
(Per)centiles: P
r
= C
r/100
(r = 1, ..., 99), por ejemplo: P
25
=
Q
1
, P
50
= Q
2
, P
75
= Q
3
23.3. Medidas de tendencia central
Media aritmtica: x =

i
n
i
x
i
/

i
n
i
=
1
n

i
n
i
x
i
Media geomtrica: x
G
=
_
x
n
1
1
x
n
2
2
...x
n
k
k
= log
1
_
1
n

i
n
i
log (x
i
)
_
Media cuadrtica: x
Q
=
_
1
n

i
n
i
x
2
i
Media armnica: x
A
=
n

i
n
i/x
i
Propiedad: x
A
x
G
x x
Q
Mediana: x
med
= Q
2
Moda: x
mod
valor o valores x
i
con mayor n
i
23.4. Medidas de dispersin o concentracin
Varianza: s
2
=

k
i=1
n
i
(x
i
x)
2

k
i=1
n
i
=
_
1
n
k

i=1
n
i
x
2
i
_
x
2
Cuasi-varianza: s
2
=
n
n1
s
2
=
1
n1
_
k

i=1
n
i
x
2
i
n x
2
_
Desviacin tpica: s =

s
2

Desviacin media: D
M
p
=
1
n

k
i=1
n
i
|x
i
p|
(respecto a un promedio p)
respecto a la media: D
M
x
=
1
n

k
i=1
n
i
|x
i
x|
respecto a la mediana: D
M
x
med
=
1
n

k
i=1
n
i
|x
i
x
med
|
Coeciente de variacin de Pearson: CV = s/| x|
Coeciente de variacin media: CV M
p
= D
mp
/| x|
(respecto a un promedio p)
respecto a la media: CV M
x
= D
M
x
/| x|
respecto a la mediana: CV M
x
med
= D
M
x
med
/|x
med
|
Recorrido: x
(n)
x
(1)
max{x
1
, ..., x
k
}mn{x
1
, ..., x
k
}
Recorrido intercuartlico: R
I
= Q
3
Q
1
(contiene el
50 % aprox. de la distribucin)
Recorrido semiintercuartlico: R
SI
= R
I
/2
23.5. Tipicacin y teorema de Tchebychev
Z =
X x
s
(1, +], fr(|x x| s) 1
1

2
. En otras palabras, para
1, al menos el 100
_
1
1

2
_
por ciento de los datos est en el
intervalo ( x s, x + s). (Ojo!, no nos dice qu porcentaje hay
exactamente, slo proporciona una estimacin inferior para l).
23.6. Momentos
Momentos: M
r
(c) =
1
n

k
i=1
n
i
(x
i
c)
r
respecto al origen: a
r
= M
r
(0) =
1
n

k
i=1
n
i
x
r
i
a
0
= 1; a
1
= x; a
2
=
1
n

k
i=1
n
i
x
2
i
respecto a la media: m
r
= M
r
( x) =
1
n

k
i=1
n
i
(x
i
x)
r
m
0
= 1; m
1
= 0; m
2
= s
2
23.7. Medidas de forma
Asimetra a la izqda.: x x
med
x
mod
Simetra: x = x
med
= x
mod
Asimetra a la dcha.: x x
med
x
mod
23.7.1. Coecientes de asimetra (C.a.)
Momento central m
3
: m
3
= 0 Simetra; m
3
< 0 (resp. >0)
Asimetra a la izqda. (resp., dcha.)
C.a. de Pearson: A
P
= ( x x
mod
)/s
A
P
= 0 Simetra; A
P
< 0 (resp. >0)
Asimetra a la izqda. (resp., dcha.)
C.a. de Fisher: A
F
= m
3
/s
3
A
F
= 0 Simetra; A
F
< 0 (resp. >0)
Asimetra a la izqda. (resp., dcha.)
ndice de Yule-Bowley: A
Y
=
(Q
3
Q
2
) (Q
2
Q
1
)
Q
3
Q
1
ndice ( x x
med
)/s: A
s
= 3( x x
med
)/s
23.7.2. Coecientes de apuntamiento o curtosis (C.c.
C.c. de Fisher: g
2
= m
4
/s
4
g
2
= 3 Mesocrtica (igual de apuntada que la
normal); g
2
< 3 (resp. >3) Platicrtica (resp.,
leptocrtica, esto es, ms apuntada que la normal)
24. VARIABLES ESTADSTICAS BIDIMENSIONALES
(v. alpha 1.2.1)
24.1. Ordenacin de datos
Variable estadstica: (X, Y )
Tamao de la muestra: n nmero de pares observados
Valores agrupados: {x
1
, x
2
, ..., x
k
}, {y
1
, y
2
, ..., y
l
} (k gru-
pos en X y l en Y )
Cjtos. de ndices: I = {1, 2, ..., k}, J = {1, 2, ..., l}
Convenio:

i,j


(i,j)


1ik
1jl


iI
jJ

iI

jJ

i=1
l

j=1
Frec. abs. de (x
i
, y
j
): n
ij
nmero de veces que (X, Y ) toma
el valor (x
i
, y
j
) (i I, j J)
Frec. rel. de (x
i
, y
j
): f
ij
= n
ij
/n
Propiedades:
1
2 CAPTULO 24. VARIABLES ESTADSTICAS BIDIMENSIONALES
(1) (i, j) I J, n
ij
[0, n] f
ij
[0, 1]; (2)

i,j
n
ij
= n;
(3)

i,j
f
ij
= 1
24.2. Distribuciones marginales
Frec. abs. marginal de x
i
: n
x
i
=

l
j=1
n
ij
Frec. abs. marginal de y
j
: n
y
j
=

k
i=1
n
ij
Frec. rel. marginales: f
x
i
= n
x
i
/n; f
y
j
= n
y
j
/n
Propiedades:
(1) (i, j) I J, (n
x
i
, n
y
j
) [0, n]
2
(f
x
i
, f
y
j
) [0, 1]
2
;
(2)

i
n
x
i
= n; (3)

j
n
y
j
= n; (4)

i
f
x
i
= 1; (5)

i
f
y
j
= 1;
(6)

i
n
ij
= n
y
j
; (7)

j
n
ij
= n
x
i
; (8)

i,j
n
ij
x
i
=

i
n
x
i
x
i
;
(9)

i,j
n
ij
y
j
=

j
n
y
j
y
j
Medias marginales: x =
1
n

k
i=1
n
x
i
x
i
; y =
1
n

l
j=1
n
y
j
y
j
Varianzas marginales: s
2
x
=
1
n

k
i=1
n
x
i
(x
i
x)
2
s
2
y
=
1
n

l
j=1
n
y
j
(y
j
y)
2
24.3. Momentos
Moms. de rdenes r, s: M
r,s
(c, ) =
1
n

i,j
n
ij
(x
i
c)
r
(y
i
)
s
respecto al origen: a
r,s
=
1
n

i,j
n
ij
x
r
i
y
s
i
a
r,s
= M
r,s
(0, 0) a
0,0
= 1; a
1,0
= x; a
0,1
= y
a
2,0
=
1
n

i
n
x
i
x
2
i
; a
0,2
=
1
n

j
n
y
j
y
2
j
a
1,1
=
1
n

i,j
n
ij
x
i
y
i
respecto a la media
(momentos centrales):
m
r,s
=
1
n

i,j
n
ij
(x
i
x)
r
(y
i
y)
s
m
r,s
= M
r,s
( x, y) m
0,0
= 1; m
1,0
= 0; m
2
= s
2
m
2,0
= s
2
x
= a
2,0
x
2
m
0,2
= s
2
y
= a
0,2
y
2
m
1,1
= a
1,1
x y
Centro de gravedad: ( x, y)
El momento m
1,1
se denomina covarianza, momento producto o mo-
mento mixto, y suele notarse s
xy
o Cov(x, y). Si si s
xy
< 0, exis-
te dependencia inversa (negativa) (a mayores valores de x corres-
ponden menores valores de y); si s
xy
= 0, no hay relacin lineal
(incorreladas) ; si s
xy
> 0, existe dependencia directa (positiva) (a
mayores valores de x corresponden mayores valores de y).
Teorema 24.1 (Propiedades de s
xy
).- (1) Sean k, h R, x

= x +
k, y

= y + h; entonces: s
x

y
= s
xy
(2) Sean k, h R, x

= kx, y

= hy; entonces: s
x

y
= khs
xy
(3) Sean a, b, c, d R, x

= ax + b, y

= cy + d; entonces:
s
x

y
= acs
xy
24.4. Distribuciones condicionadas
Frecs. abs.
condicionadas:
n
x
i
|Y =y
j
= n
ij
(j dado)
n
y
j
|X=x
i
= n
ij
(i dado)
Frecs. rel.
condicionadas:
f
x
i
|Y =y
j
=
n
x
i
|Y =y
j/n
y
j
(j dado)
f
y
j
|X=x
i
=
n
y
j
|X=x
i/n
x
i
(i dado)
24.5. Regresin
24.5.1. Regresin lineal mnimo cuadrtica
Considerando Y (resp. X) como variable independiente (explicativa
o exgena) y a X (resp. Y ) como variable dependiente (explicada o
endgena), y minimizando errores de la Y (resp. X), se tiene la recta
de regresin de Y sobre X, r
yx
(resp. de X sobre Y , r
xy
):
Rectas de regresin:
de Y sobre X: r
yx
y y =
yx
(x x)
de X sobre Y: r
xy
x x =
xy
(y y)
Coecientes de
regresin:

yx
=
m
11
s
2
x
y
xy
=
m
11
s
2
y
(
yx
(resp.,
xy
) 0 r
yx
(resp., r
xy
)
es creciente, horizontal (resp., vertical) o
decreciente.
Teorema 24.2 (Propiedades).- (1)
yx

xy
=
(2) r
yx
y r
xy
pasan por ( x, y).
24.5.2. Regresin parablica
Parbola de regresin: y = ax
2
+ bx + c, siendo a, b y c las
soluciones de las ecuaciones normales:
a

i,j
x
2
i
n
ij
+ b

i,j
x
i
n
ij
+ c

i,j
n
ij
=

i,j
y
j
n
ij
a

i,j
x
3
i
n
ij
+ b

i,j
x
2
i
n
ij
+ c

i,j
x
i
n
ij
=

i,j
x
i
y
j
n
ij
a

i,j
x
4
i
n
ij
+ b

i,j
x
3
i
n
ij
+ c

i,j
x
2
i
n
ij
=

i,j
x
2
i
y
j
n
ij
24.5.3. Regresin exponencial
Exponencial de
regresin:
y = ka
x
, siendo a > 0,
k = log
1
a
_
y
m
11
s
2
x
x
_
y =
m
11
s
2
x
24.6. Correlacin
24.6.1. Coecientes para variables cuantitativas
De corr. lineal ( de Pearson): =
_

yx

xy
=
s
xy
s
x
s
y
Varianzas residuales: s
2
r(yx)
= s
2
y
(1
2
); s
2
r(xy)
= s
2
x
(1
2
)
Propiedades: (1) [1, 1]; (2)
yx
=
s
y
s
x
; (3)
xy
=
s
x
s
y
Corr. directa: > 0
yx
,
xy
> 0 (r
yx
, r
xy
crecientes)
Corr. inversa: < 0
yx
,
xy
< 0 (r
yx
, r
xy
decrecientes)
Interpretacin del coef. de corr. lineal:
(1) = 1 s
r(yx
= s
r(xy)
todos los puntos de la nube per-
tenecen a la recta de regresin r
yx
= r
xy
(se dice que X e Y son
dependientes funcionalmente) y adems
yx
,
xy
< 0 por lo que
r
yx
es decreciente (2) (1, 0) X e Y ms correladas cuanto
ms prximo a 1 (se dice que X e Y son dependientes aleatoria-
mente) y adems
yx
,
xy
< 0 por lo que r
yx
y r
xy
son decrecientes
(3) = 0
yx
=
xy
= 0 s
2
r(yx)
= s
2
y
s
2
r(xy)
= s
2
x

X e Y son incorreladas y r
yx
r
xy
(4) (0, 1) X e Y ms
correladas cuanto ms prximo a 1 (se dice que X e Y son depen-
dientes aleatoriamente) y adems
yx
,
xy
> 0 por lo que r
yx
y r
xy
son crecientes (5) = 1 s
r(yx
= s
r(xy)
todos los puntos de la
nube pertenecen a la recta de regresin r
yx
= r
xy
(se dice que X e
Y son dependientes funcionalmente) y adems
yx
,
xy
> 0 por
lo que r
yx
es creciente
24.6.2. Coecientes para variables ordinales

s
de Spearman:
s
= 1
6

d
2
i
n(n
2
1)
d
i
= x
i
y
i
(diferencia de rangos)
de Goodman y
Kruskal:
=
P Q
P + Q
; P (resp., Q) nmero de pares
concordantes (resp., discordantes)
24.6.3. Coecientes para variables cualitativas:
Q de Yule: Q =
n
12
n
21
n
11
n
22
n
12
n
21
+ n
11
n
22
De contingencia de Pearson: C =


2
n +
2
corregido: C
c
=
C
C
m ax
, siendo C
m ax
=
_
K 1
K
, K el n-
mero de categoras (igual para X e Y ) y
2
=

i,j
(n
ij
n

ij
)
2
n

ij
, siendo n

ij
=
n
x
i
n
y
j
n
V de Cramer: V =


2
n(K 1)
(K es el nmero de categoras
de la variable con menor nmero de ellas)
24.7. Ejercicios

24.1 .- ..........
Resolucin:
..........

24.2 .- ..........
Resolucin:
..........
24.8. NOMBRES PROPIOS 3
24.8. Nombres propios
.......... .
Ms nombres propios y biografas, en:
http://www-groups.dcs.st-andrews.ac.uk/~history/
http://plato.stanford.edu/
24.9. Para saber ms
..........
24.10. Apndice: Lo bsico en GNU Octave
..........

You might also like