You are on page 1of 29

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES

MARIANA ENRIQUEZ AHUATZIN


MATRICULA ES1410903065
ESTADISTICA BASICA

Las medidas nos permiten informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos.
Medicin, Se ha definido como la asignacin de nmeros a los elementos u objetos para
representar o cuantificar una propiedad. El problema bsico est dado por la asignacin
un numeral que represente la magnitud de la caracterstica que queremos medir y que
dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas.
Niveles o Escalas de mediciones, al respecto cabe sealar algunas definiciones:
Nominal, consiste en la asignacin, puramente arbitraria de nmeros a cada una de las
diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que
puedan establecerse relaciones entre dichas categoras, a no ser el de que cada
elemento pueda pertenecer a una y solo una de estas categoras; Ordinal, En caso de
que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la
medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de
orden de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado
de atributo que B; Intervalos, est caracterizada por una unidad de medida comn y
constante que asigna un nmero igual al nmero de unidades equivalentes a la de la
magnitud que posea el elemento observado; y Coeficientes, entonces, a iguales
diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de
atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario,
sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud
de la propiedad presente en B.
MEDIDAS DE POSICIN
Medidas de posicin central, informan sobre los valores medios de la serie de datos.
Medidas de posicin no centrales, informan de como se distribuye el resto de los
valores de la serie. Las principales medidas de posicin central son:
Valor Medio, Promedio o Valor Central, es el valor medio ponderado de la serie de
datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas:
Media Aritmtica, se calcula sumando los valores y dividiendo en el nmero de ellos, o
sumando los valores de multiplicar cada valor por el nmero de veces que se repite. La
suma de todos estos productos se divide por el total de datos de la muestra
x x x xn 1 n
x * n x * n x n * n n
X 1 2 3
xi
X 1 1 2 2
n
n 1
n
1

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

La media aritmtica de una variable estadstica es la suma de todos sus posibles


valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de
una variable X es
X
x1

xk

ni
n1

nk

fi
f1

fk

la media es el valor que podemos escribir de las siguientes formas equivalentes:


1
1 k
x x 1f 1 x k f k ( x 1 n 1 x k n k ) x i n i
n
n i 1
Media Geomtrica, se eleva cada valor al nmero de veces que se ha repetido. Se
multiplican todo estos resultados y al producto final se le calcula la raz n (siendo n el
total de datos de la muestra),
n

x g n x1 1 * x 2 2 * x n

nn

n 1n x n

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la
media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos
de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto
multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la
medida de posicin central ms utilizada.
Ahora bien, Logx g

Logx 1 Logx n
, luego x g n x 1 x 2 x n
n

Si los datos estn agrupados en una tabla, entonces se tiene: x n x 1n x n2 x nk


1

Media Armnica, x a , se define como el recproco de la media aritmtica de los


recprocos, es decir,
1 (1 / x 1 ) (1 / x n )
n

xa
xa
n
(1 / x 1 ) (1 / x n )
Media Cuadrtica. x c , es la raz cuadrada de la media aritmtica de los cuadrados:
xc

x 12 x 2n
n

Media Ponderada, se calcula sumando los valores multiplicados por sus frecuencias o
significancias, y dividiendo en la suma de las significancias,
2

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA
n

Xp

* si

Mediana, es el valor de la serie de datos que se sita justamente en el centro de la


muestra una vez se ha ordenado sta, corresponde a un 50% de valores son inferiores y
otro 50% son superiores.

Mediana L c( j / f )

L es el lmite inferior de la clase, f la frecuencia de esa clase y c la longitud de la clase, j


el nmero de observaciones en esta clase
Consideramos una variable discreta X cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor. Llamaremos mediana, Med al primer valor de la
variable que deja por debajo de s al 50% de las observaciones. Por tanto, si n es el
nmero de observaciones, la mediana corresponder a la observacin [n/2]+1, donde
representamos por la parte entera de un nmero.

En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la
frmula de la mediana se complica un poco ms (pero no demasiado): Sea (li-1,li] el
intervalo donde hemos encontrado que por debajo estn el 50% de las observaciones.
Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas,
mediante interpolacin lineal:
n
(n/2) N 1
(n/2) N i 1
CC BB

i
Med l i 1
ai
AC AB
ai
Med l i 1
ni

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

La relacin corresponde a definir para cada posible observacin, x l j1 l j , su


frecuencia relativa acumulada, F(x), por interpolacin lineal entre los valores F(lj-1) = Fj-1 y
F(lj) = Fj de forma que
F( x ) F(l j1 )

F(l j ) F(l j1 )
aj

( x l j1 )

De este modo, Med es el punto donde F(Med) 1 / 2 . Esto equivale a decir que la mediana
divide al histograma en dos partes de reas iguales a 1/2. Entre las propiedades de la
mediana, se destacan principalmente,
-

Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de
las mismas. Por ello es adecuado su uso en distribuciones asimtricas.
Es de clculo rpido y de interpretacin sencilla.
A diferencia de la media, la mediana de una variable discreta es siempre un valor de
la variable que estudiamos (por ejemplo, la mediana de una variable nmero de hijos
toma siempre valores enteros).
Si una poblacin est formada por 2 subpoblaciones de medianas Med1 y Med2, slo se
puede afirmar que la mediana, Med, de la poblacin est comprendida entre Med1 y
Med2: Med 1 Med Med 2
El mayor defecto de la mediana es que tiene unas propiedades matemticas
complicadas, lo que hace que sea muy difcil de utilizar en inferencia estadstica.
Es funcin de los intervalos escogidos.
Puede ser calculada aunque el intervalo inferior o el superior no tenga lmites.
La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su
mediana es menor o igual que cualquier otro valor. Este es el equivalente al teorema
de Knig con respecto a la media, pero donde se considera como medida de
dispersin a:
n

x
i 1

Med

Moda, es el valor que ms se repite en la muestra. Corresponde al valor que tiene


mayor frecuencia relativa. La moda a cualquier mximo relativo de la distribucin de
frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que
su anterior y su posterior.

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

En el caso de variables continuas es ms correcto hablar de intervalos modales. Una vez


que este intervalo, l j1 , l j , se ha obtenido, se utiliza la siguiente frmula para calcular
la moda, de acuerdo con la figura anterior,
Moda l i 1
ai
HC H C HC H C

AB A B AB A B
n i n i 1
(n i n i 1 ) (n i n i 1 )
de donde se despeja Moda
Relacin entre media, mediana y moda. En el caso de distribuciones unimodales, la
mediana est con frecuencia comprendida entre la media y la moda (incluso ms cerca
de la media). En distribuciones que presentan cierta inclinacin, es ms aconsejable el
uso de la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y
de inferencia suele ser ms apta la media.
Ejemplo, Consideremos una tabla estadstica relativa a una variable continua, de la que
nos dan los intervalos, las marcas de clase ci, y las frecuencias absolutas ni.
Intervalo
00-02
02-04
04-06
06-08
08-10

ci
1
3
5
7
9
12

ni
2
1
4
3
2

Ni
2
3
7
10
12
64

nici
2
3
20
21
18

Para calcular la media podemos aadir una columna con las cantidades n ici. La suma de
los trminos de esa columna dividida por n=12 es la media x 64 / 12 5.3 . La mediana
es el valor de la variable que deja por debajo de s a la mitad de las n observaciones, es
decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, N i y vemos que
eso ocurre en la modalidad tercera, es decir, i=3, entonces, (l i-1,li]= (4,6], que
corresponde el intervalo en donde se encuentra la mediana, entonces tenemos
5

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Med l i 1

(n / 2) N i 1
(12 / 2) 3
ai 4
5.5 l i 1 , l i
ni
4

Para el clculo de la Moda, lo primero es encontrar los intervalos modales, buscando los
mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos
modas, correspondientes a las modalidades j=1, j=3. En el primer intervalo modal,
(l0,l1]=(0,2], la moda se calcula como
n i n i 1
20
Moda l i 1
ai 0
2 1.3
(n i n i 1 ) (n i n i 1 )
(2 0) (2 1)

El segundo intervalo modal es (l2,l3]=(4,6], siendo la moda el punto perteneciente al


mismo que se obtiene como:
n i n i 1
4 1
Moda l i 1
ai 4
2 5.5
( n i n i 1 ) (n i n i 1 )
( 4 1) (4 3)
En este caso, como se ve, la moda no toma un valor nico, sino el conjunto, Moda =
(1.3,5.5)
Ejemplo, Dado el registro de estaturas de estudiantes, hallar los principales parmetros
estadsticos analizados
Frecuencia
Variabl Absoluta
e
Simpl Acumula
e
da
1,20
1
1
1,21
4
5
1,22
4
9
1,23
2
11
1,24
1
12

Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

1,25
1,26
1,27
1,28
1,29
1,30

2
3
3
4
3
3

14
17
20
24
27
30

6,6 %
10,0 %
10,0 %
13,3 %
10,0 %
10,0 %

Media aritmtica: X m
Media geomtrica:

30

46,6 %
56,6 %
66,6 %
80,0 %
90,0 %
100,0 %

1.20 4 1.21 4 1.22 4 1.30 3


1.253
30

1.20 4 1.214 1.30 3 1.253

Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.

Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Ejemplo, Dado el registro de estaturas de estudiantes, hallar los principales parmetros
estadsticos analizados
Frecuencia
Variabl Absoluta
e
Simpl Acumula
e
da
1,20
1
1
1,21
4
5
1,22
4
9
1,23
2
11
1,24
1
12
1,25
2
14
1,26
3
17
1,27
3
20

Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6,6 %
46,6 %
10,0 % 56,6 %
10,0 % 66,6 %
7

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

1,28
1,29
1,30

4
3
3

24
27
30

13,3 % 80,0 %
10,0 % 90,0 %
10,0 % 100,0 %

Media aritmtica: X m
Media geomtrica:

30

1.20 4 1.21 4 1.22 4 1.30 3


1.253
30

1.20 4 1.214 1.30 3 1.253

Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.

Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Medidas no Centrales. Las medidas no centrales permiten conocer otros puntos
caractersticos de la distribucin que no son los valores centrales, tales como
Curtiles, son 3 valores que distribuyen la serie de datos, ordenada de forma creciente
o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25%
de los resultados.
Dciles, son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de
los resultados.
Percntiles, son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados.
Estadsticos de posicin. Para una variable discreta, se define el percentil de orden
k, como la observacin, Pk, que deja por debajo de si el k% de la poblacin. Esta
definicin nos recuerda a la mediana, pues como consecuencia de la definicin es
evidente que Med= P50
8

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Para una variable continua, el intervalo donde se encuentra P k (li-1,li], se calcula


buscando el que deja debajo de si al k% de las observaciones. Dentro de l, P k se obtiene
segn la relacin:
n ( k / 100) N i 1
Pk l i 1
ai
ni
Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la
distribucin, por lo que no puede considerrsele como una medida de tendencia central.
Los cuartiles, Qi, son un caso particular de los percentiles. Hay 3, y se definen como,
Q1=P25, Q2=P50=Mediana, Q3=P75
De forma anloga se definen los dciles como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao. Ms precisamente, definimos
D1,D2,...,D9 como, Di=P10i siendo i=1,2,,10
Ejemplo, Dada la siguiente distribucin en el nmero de hijos de cien familias, calcular
sus cuartiles.
xi
0
1
2
3
4
5

ni
14
10
15
26
20
15
n=10
0

Ni
14
24
39
65
85
100

Solucin:
Primer cuartil:
n/4=25, ni>n/4=39, luego Q1=2
Segundo cuartil: 2n/4=50, Primera Ni>2n/4=65, luego Q2=3
Tercer cuartil:
3n/4=75, Primera Ni>3n/4=85, luego Q3=4
LAS MEDIDAS. Estudia la distribucin de los valores de la serie analizando si stos se
encuentran ms o menos concentrados, o ms o menos dispersos. Existen diversas
medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes:
Rango, mide la amplitud de los valores de la muestra y se calcula por diferencia entre el
valor ms elevado y el valor ms bajo.
Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de
puntuaciones. Los de variabilidad o dispersin nos indican si esas puntuaciones o valores
estn prximas entre s o si por el contrario estn o muy dispersas. Una medida
9

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

razonable de la variabilidad podra ser la amplitud o rango, que se obtiene restando el


valor ms bajo de un conjunto de observaciones del valor ms alto. Es fcil de calcular y
sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:
- No utiliza todas las observaciones (slo dos de ellas);
- Se puede ver muy afectada por alguna observacin extrema;
- El rango aumenta con el nmero de observaciones, o bien se queda igual. En
cualquier caso nunca disminuye.
En el transcurso de esta seccin, veremos medidas de dispersin mejores que la
anterior. Estas se determinan en funcin de la distancia entre las observaciones y algn
estadstico de tendencia central.
Desviacin media, Dm Se define la desviacin media como la media de las
diferencias en valor absoluto de los valores de la variable a la media, es decir, si
tenemos un conjunto de n observaciones, x1, ..., xn, entonces
1 n
1 k
Dm xi x
Dm xi x ni
n i 1
n i 1
Si los datos estn agrupados en una tabla estadstica es ms sencillo usar la relacin de
la derecha
Como se observa, la desviacin media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero
esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la distancia
que induce la desviacin media en el espacio de observaciones no es la natural. Esto
hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la
poblacin
Varianza, Mide la distancia existente entre los valores de la serie y la media. Se calcula
como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas
por el nmero de veces que se ha repetido cada valor.

x X
n

s2

s 2 xi X
n

ni
n

La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms


concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
Desviacin Tpica o Estndar, se calcula como raz cuadrada de la varianza.
Coeficiente de Variacin, se calcula como cociente entre la desviacin tpica y la
media.
10

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

= s2

CV =

El inters del coeficiente de variacin es que al ser un porcentaje permite comparar el


nivel de dispersin de dos muestras. Esto no ocurre con la desviacin tpica, ya que
viene expresada en las mismas unidas que los datos de la serie.
Error. La suma de las diferencias de la variable con respecto al valor medio es nula,
n

(x
i 1

x) 0

Si los errores se consideran con signo positivo, en este caso no pueden compensarse.
Esto ocurre si tomamos como medida de error alguna de las siguientes:
n

x
i 1

x 0 error absoluto

(x
i 1

x) 2 0 error cuadrtico

Knig. Para cualquier posible valor k que consideremos como candidato a medida
central, lo mejora en el sentido de los mnimos cuadrados, es decir
2

(x x) (x k)
i 1

i 1

siendo k x

Grados de libertad. Los grados de libertad de un estadstico calculado sobre n datos se


refieren al nmero de cantidades independientes que se necesitan en su clculo, menos
el nmero de restricciones que ligan a las observaciones y el estadstico. Es decir,
normalmente n-1. Por ejemplo, Consideramos una serie de valores de una variable,
xi=2,5,7,9,12 que han sido tomados independiente uno de otro.
Su valor medio es 7 y se ha calculado a partir de las n=5observaciones independientes
xi, que estn ligadas a la media por la relacin, x

1
xi
n

Luego el nmero de grados de libertad de la media es n-1=4. Si calculamos a


( xi x ) 2
continuacin la varianza, se han de sumar n cantidades x
n
Sin embargo esas cantidades no son totalmente independientes, pues estn ligadas por
una restriccin:

11

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA
n

x i

i 1

x
i 1

n 0

El nmero de grados de libertad del estadstico es el nmero de observaciones de la


variable menos el nmero de restricciones que verifican, as que en este caso, los grados
de libertad de la varianza sobre los n=5 datos son tambin n-1 =4.
Un principio general de la teora matemtica nos dice que si pretendemos calcular de
modo aproximado la varianza de una poblacin a partir de la varianza de una muestra
suya, se tiene que el error cometido es generalmente ms pequeo, si en vez de
considerar como estimacin de la varianza de la poblacin, a la varianza muestral
1 n
s 2 (x i x) 2
n i 1
consideramos lo que se denomina cuasivarianza muestral, s 2 que se calcula como la
anterior, pero cambiando el denominador por el nmero de grados de libertad, n-1,
1 n
ns 2
2
s 2
(
x

x
)

i
n 1 i 1
n 1
Medidas de forma o Concentracin. Las medidas de forma permiten conocer que
forma tiene la curva que representa la serie de datos de la muestra. En concreto,
podemos estudiar las siguientes caractersticas de la curva,
Concentracin, mide si los valores de la variable estn ms o menos uniformemente
repartidos a lo largo de la muestra. Para medir el nivel de concentracin de una
distribucin de frecuencia se pueden utilizar distintos indicadores, entre ellos el ndice de
Gini, para medir el nivel de concentracin de una distribucin de frecuencia se pueden
utilizar distintos indicadores, entre ellos el ndice de Gini, el cual se calcula
n1

Ig

P Q
i1

n1

P
i1

El ndice Gini (Ig) puede tomar valores entre 0 y 1, es 0, cuando la concentracin es


mnima, o la muestra est uniformemente repartida a lo largo de todo su rango; es 1
cuando la concentracin es mxima, y en este caso un slo valor de la muestra acumula
el 100% de los resultados
Asimetra y apuntamiento. Sabemos cmo calcular valores alrededor de los cuales se
distribuyen las observaciones de una variable sobre una muestra y sabemos cmo
calcular la dispersin que ofrecen los mismos con respecto al valor de central. Nos
proponemos dar un paso ms all en el anlisis de la variable. En primer lugar, nos
12

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

vamos a plantear el saber si los datos se distribuyen de forma simtrica con respecto a
un valor central, o si bien la grfica que representa la distribucin de frecuencias es de
una forma diferente del lado derecho que del lado izquierdo.
Si la simetra ha sido determinada, podemos preguntarnos si la curva es ms o menos
apuntada (larga y estrecha). Este apuntamiento habr que medirlo comparado a cierta
distribucin de frecuencias que consideramos normal (no por casualidad es ste el
nombre que recibe la distribucin de referencia).
Estadsticos de asimetra. Para saber si una distribucin de frecuencias es simtrica, hay
que precisar con respecto a qu. Un buen candidato es la mediana, ya que para
variables continuas, divide al histograma de frecuencias en dos partes de igual rea.
Podemos basarnos en ella para, de forma natural, decir que una distribucin de
frecuencias es simtrica si el lado derecho de la grfica (a partir de la mediana) es la
imagen por un espejo del lado izquierdo,

Cuando la variable es discreta, decimos que es simtrica, si lo es con respecto a la


media.
- Se podra pensar que definir la simetra con usando la mediana para variables
continuas y usando la media para variables discretas es una eleccin arbitraria. En
realidad esto no es as, pues si una variable es continua, coinciden los ambos criterios
de simetra (con respecto a la media y a la mediana). Es ms, se tiene que media y
mediana coinciden para distribuciones continuas simtricas. Por otro lado,
- en el caso de variables discretas, la distribucin es simtrica si el lado derecho del
diagrama se obtiene por imagen especular desde la media. En este caso coincide la
media con la mediana si el nmero de observaciones es impar.
- Si la variable es continua simtrica y unimodal, coinciden la media, la mediana y la
moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos clases fundamentales:
Asimetra positiva: Si las frecuencias ms altas se encuentran en el lado izquierdo de
la media, mientras que en derecho hay frecuencias ms pequeas (cola); y Asimetra
negativa: Cuando la cola est en el lado izquierdo.
13

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Cuando realizamos un estudio descriptivo es altamente improbable que la distribucin


de frecuencias sea totalmente simtrica. En la prctica diremos que la distribucin de
frecuencias es simtrica si lo es de un modo aproximado. Por otro lado, an observando
cuidadosamente la grfica, podemos no ver claro de qu lado estn las frecuencias ms
altas. Conviene definir entonces unos estadsticos que ayuden a interpretar la asimetra,
a los que llamaremos ndices de asimetra, y que denotaremos mediante . Vamos a
definir a continuacin algunos de los ndices de asimetra ms usuales como son el
ndice basado en los tres cuartiles, el momento de tercer orden y la distancia entre la
moda y la media o la media y la mediana
La asimetra mide si la curva tiene una forma simtrica, es decir, si respecto al centro de
la misma (centro de simetra) los segmentos de curva que quedan a derecha e izquierda
son similares. Hemos comentado que el concepto de asimetra se refiere a si la curva
que forman los valores de la serie presenta la misma forma a izquierda y derecha de un
valor central (media aritmtica). Para medir el nivel de asimetra se utiliza el llamado
Coeficiente de Asimetra de Fisher,
1 n
x i X3 * n i

1 n
n
x i X 2 * n i
1
siendo
A

3/ 2
n 1
A
Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central
(media aritmtica)
Los resultados pueden ser los siguientes:
- =0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y
a la izquierda de la media).
- >0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la
derecha de la media que a su izquierda)
- <0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la
izquierda de la media que a su derecha).
14

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Curtosis, mide si los valores de la distribucin estn ms o menos concentrados


alrededor de los valores medios de la muestra. El Coeficiente de Curtosis analiza el
grado de concentracin que presentan los valores alrededor de la zona central de la
distribucin.
1 n
x i X 4 * ni

n
1 n
1
siendo
A

x i X 2 * ni
3/2
n
A
1
-

Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de


los valores centrales de la variable (el mismo que presenta una distribucin normal):
=0
- Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor
de los valores centrales de la variable: >0
- Distribucin platicrtica: presenta un reducido grado de concentracin alrededor
de los valores centrales de la variable: <0
Ejemplo, Dado el registro de estaturas de estudiantes, hallar los principales parmetros
estadsticos analizados
Frecuencia
Variabl Absoluta
e
Simpl Acumula
e
da
1,20
1
1
1,21
4
5
1,22
4
9
1,23
2
11
1,24
1
12
1,25
2
14
1,26
3
17
1,27
3
20
1,28
4
24
1,29
3
27
1,30
3
30
Media aritmtica: X m
Media geomtrica:

30

Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6,6 %
46,6 %
10,0 % 56,6 %
10,0 % 66,6 %
13,3 % 80,0 %
10,0 % 90,0 %
10,0 % 100,0 %

1.20 4 1.21 4 1.22 4 1.30 3


1.253
30

1.20 4 1.214 1.30 3 1.253

Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.
15

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Cuarteles, Deciles y Percentiles
1 cuartil: es el valor 1,22
2 cuartil: es el valor 1,26
3 cuartil: es el valor 1,28
Rango: 130 1.20 =0.10
Vamos a calcular los valores de las distintas posiciones centrales:
Varianza:
(1.20 1.253) 2 4 (1.21 1.253) 2 * 4 (130 1.253)2 * 3
S 2x
30

Por lo tanto, la varianza es 0,0010


Desviacin tpica:

0.010 0.032

Coeficiente de variacin: CV

0.032
0.0255
1.253

Coeficiente de Asimetra: =0.1586

Coeficiente de Curtosis: k=-1.39

Teora de los ndices. Para medir el nivel de concentracin de una distribucin de


frecuencia se pueden utilizar distintos indicadores, entre ellos el ndice de Gini, el cual
se calcula
n1

Ig

P Q
i1

n1

P
i1

16

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Los ndices reflejan los porcentajes de cambios en algn evento en un periodo de tiempo
dado respecto a un tiempo de referencia. Con miras de dar una demostracin y
aplicacin de los ndices en la estadstica y desarrollo de las investigaciones se presenta
el siguiente problema
Ejemplo, Sea el cuadro que representa el costo del kg de pescado en los diferentes aos

a. ndices Porcentuales. Tomando al ao 1960 como ao base y a partir de l calculamos


el crecimiento de precios con base en este ao, as por ejemplo, para el ao 1970:

Pi( t )
ndice = 15.3*100/12.2 = 125.4%: En este caso I i ( t ) ( 0 ) * 100
Pi

b. ndices agregados simples. Se calculan como una media aritmtica simple de precios
relativos, por ejemplo,
n

I as ( t )

P
i 1
n

(t)
i

P
i 1

(0)
i

El ndice se calcula como, en el ao


1960:
46.3*100/46.3 = 100.0
1965:
46.2*100/46.3 = 99.8
1970:
80.3*100/46.3 = 173.4

17

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

1975: 132.5*100/46.3 = 286.3


c. Precios relativos en la media aritmtica simple.
n

I sm ( t )

(t)
i

i 1

Pi( 0 )

*100
n
En cuyo caso resulta,

d. Laspeyres. Tiene por objeto utilizar los pesos Q del ao base, de modo que ,
n

I L (t)

Q i( 0)

(0)
i

i 1
n

i 1

(t)
i

(0)
i

*100
Q

e. Paashe. Similar a Laspeyres, pero con una formulacin distinta que pretende obtener
una mejor ponderacin del evento, se calcula utilizando los pesos de cada periodo
analizado y no los del ao base
n

I P (t )

Q i( t )

(t)
i

i 1
n

i 1

(t )
i

(0)
i

* 100
Q

Los resultados son para Laspeyres y Paashe, respectivamente,

18

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

REPRESENTACIONES GRFICAS
DIAGRAMA DE CAJAS Y BIGOTES
Presentacin visual que describe al mismo tiempo varias caractersticas importantes de
un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y
la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan
de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los
valores mnimos y mximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento. Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formar la caja, que tiene
la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben
tambin los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es
decir, corresponde al rango intecuartlico H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. As,
las Cercas Internas Inferior (CIi) y Superior (CIs) estarn dadas por:
CIi = Q1 Paso
CIs = Q3 + Paso
19

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Si la cerca interna inferior da menor que el valor mnimo de la muestra, sta se hace
igual al valor mnimo; igualmente, si la cerca interna superior da mayor que el valor
mximo, sta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. As, las Cercas Externas
Inferior (CEi) y Superior (CEs) estarn dadas por:
CEi = CIi Paso
CEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes
de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atencin,
ya que pueden ser valores atpicos, que, en algunos casos, no pertenecen realmente a la
distribucin general de donde provienen los datos.
"Valores lejanos" o, ubicados por fuera de las cercas externas, correspondientes a
valores extremos, que requieren un mayor anlisis que los valores atpicos.

Considere los siguientes datos, correspondientes a

De este conjunto de datos tenemos que:


Me = 90.45
Q1 = 88.25
Q3 = 92.2
Rango intercuartlico = 92.2-88.25 = 3.95 Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40
Cerca externa superior = 98.125 + 5.925 = 104.05

20

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Como se observa hay dos valores que merecen especial atencin: 98.8 y 100.3 que
estn entre las cercas interna y externa superior.
Las medidas siguientes se han tomado de libros de biologa y medicina, pero son
parmetros muy aplicable y gran importancia para el estudiante de estadstica, y por
tanto los reproducimos, tal como se mostrar en la bibliografa.
Proporciones. Son los cocientes entre dos mediciones, por ejemplo si en una poblacin
de 2500 habitantes se diagnostican 150 casos de gripe aviar, entonces, la proporcin de
enfermos es de 150/2500 = 0.06 (6%). El valor de una proporcin puede variar as de 0 a
1, y suele expresarse como un porcentaje.
Razones. Al igual que en el caso anterior es una divisin, pero aqu el numerador no
forma parte del denominador como en le caso anterior, por ejemplo, la razn entre la
poblacin con gripe aviar y la sana es 150/2350 = 3/47 =0,064. Cuando, como en el
caso del ejemplo, la razn se calcula entre la probabilidad de que ocurra un evento y la
probabilidad de que ste no ocurra, la razn recibe tambin el nombre de odds. El valor
de una odds vara entre cero y el infinito. El valor 0 corresponde al caso en que la
enfermedad nunca ocurra, mientras que el valor infinito correspondera tericamente a
una enfermedad que est siempre presente.
Proporcion

Odds
Odds 1

Odds

Proporcion
1 Proporcion

Tasas. El concepto de tasa es similar al de una proporcin, con la diferencia de que las
tasas llevan incorporado el concepto de tiempo. El numerador lo constituye la frecuencia
absoluta de casos del problema a estudiar. A su vez, el denominador est constituido por
la suma de los perodos individuales de riesgo a los que han estado expuestos los sujetos
susceptibles de la poblacin a estudio. De su clculo se desprende la velocidad con que
se produce el cambio de una situacin frente a otra. Se han considerado dos tipos de
tasas:
Prevalenca P. Esta tasa cuantifica la proporcin de elementos de una poblacin que
presentan una determinada caracterstica en un momento

21

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Numero elementos con la caracteristica en un momento dado


P
Total de la poblacion en ese momento
La Incidencia I. La incidencia se define como el nmero de caractersticas nuevas que
se desarrollan en una poblacin durante un perodo de tiempo determinado. Hay dos
tipos de medidas de incidencia: la incidencia acumulada y la tasa de incidencia, tambin
denominada densidad de incidencia. La incidencia acumulada es la proporcin de los
elementos sin la caracterstica que desarrollan la caracterstica a lo largo de un perodo
de tiempo concreto.

Numero elementos nuevos con la caracteristica en un momento dado


P
Total de la poblacion en ese momento
La incidencia acumulada proporciona una estimacin de la probabilidad o el riesgo de
que un elemento a desarrollar la caracterstica durante un perodo especificado de
tiempo. Como cualquier proporcin, suele venir dada en trminos de porcentaje.
Adems, al no ser una tasa, es imprescindible que se acompae del periodo de
observacin para poder ser interpretada.
Sensibilidad. Es la probabilidad de clasificar correctamente a un elemento muestreado
con la caracterstica, es decir, la probabilidad de que para un elemento muestreado se
22

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

clasifique sin la caracterstica. La sensibilidad es, por lo tanto, la capacidad del test o
criterio para detectar la caracterstica. Cuando los datos obtenidos a partir de una
muestra se clasifican en una tabla, es fcil estimar a partir de ella la sensibilidad como la
proporcin de elementos con la caracterstica
Sensibilidad

Nmero de elementos con la caracterstica


Numero de elementos totales con y sin la caracteristica

Especificidad. Es la probabilidad de clasificar correctamente a un elemento sin la


caracterstica, es decir, es el caso complementario a la sensibilidad
Especificidad

Nmero de elementos sin la caracterstica


Numero de elementos totales con y sin la caracteristica

Riesgo. Es la incertidumbre frente a decidir por el desconocimiento del comportamiento


de una variable o elemento muestreado. Su valor es obtenido mediante Prediccin: La
presencia de un factor de riesgo significa un riesgo aumentado de presentar en un futuro
una evaluacin o futuro la caracterstica muestreada, en comparacin el resto de
elementos de la poblacin.
Causalidad. La presencia de un factor de riesgo no es necesariamente causal. El
aumento de incidencias de una caracterstica en un poblacin en relacin a otro grupo,
se asume como factor de riesgo, sin embargo esta asociacin puede ser debida a una
tercera variable.
REPRESENTACIONES GRFICAS
Las representaciones grficas prcticamente estn orientadas de acuerdo con las
necesidades del investigador o estadstico, de todas formas se tienen algunas normas de
trabajo y representacin, que tienen por objeto facilitar la lectura de los datos e
informacin que se maneja estadsticamente. Las principales representaciones son:
Diagramas de barras: Representamos comparaciones entre varias poblaciones o
muestras

23

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Diagramas de sectores o Torta. Se divide un crculo en tantas porciones como clases


existan, de modo que a cada clase le corresponde un arco de crculo proporcional a su
frecuencia absoluta o relativa

Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. La escala de los dibujos debe ser tal que el rea de cada uno
de ellos sea proporcional a la frecuencia de la modalidad que representa.

Diagramas diferenciales e Integrales: Los primeros son los que se representan


frecuencias absolutas o relativas y en ellos se representa el nmero o porcentaje de
elementos que presenta una modalidad dada Los segundos los que se representan el
nmero de elementos que presentan una modalidad inferior o igual a una dada. Se
realizan a partir de las frecuencias acumuladas, lo que da lugar a grficos crecientes, y
es obvio que este tipo de grficos no tiene sentido para variables cualitativas.

24

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Otros. Cuando las variables son continuas, utilizamos como diagramas diferenciales los
histogramas y los polgonos de frecuencias. Un histograma se construye a partir de la
tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este
segmento como base. El criterio para calcular la altura de cada rectngulo es el de
mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada
intervalo y el rea de los mismos. El polgono se construye fcilmente si tenemos
representado previamente el histograma, ya que consiste en unir mediante lneas rectas
los puntos del histograma que corresponden a las marcas de clase. Para representar el
polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a
ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una
lnea recta los puntos del histograma que corresponden a sus marcas de clase.

Pirmides, Conos, Telaraas, etc. Estos grficos se utilizan para mostrar, los
primeros elementos comparaciones entre elementos resaltando el peso de cada uno, tal
como lo hace el histograma o el grfico de barras

25

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Las telaraas tienen una importancia enorme, ya que permiten comparar ciclos y
tendencias

Una vez distribuidos todos los valores en los intervalos de clase, y obtenida la frecuencia
absoluta de cada intervalo, se realizan algunos clculos para mejorar la presentacin de
los resultados. Por lo general, se calcula para cada intervalo la frecuencia relativa y la
frecuencia relativa acumulada, las cuales estn dadas por:
F
i
Fa i k 1 Frk
Frecuencias relativas y relativas acumuladas del intervalo i Fri i
n
donde Fi es la frecuencia absoluta del intervalo i, es decir, corresponde al nmero de
valores observados que quedaron en dicho intervalo.
Informacin grfica. El Histograma. Generalmente la distribucin de frecuencia se
complementa con el Histograma, que es simplemente un grfico de barras. En la abscisa
se colocan los lmites de los intervalos de clase b 0, b1, b2,.., bM, y en la ordenada se
grafica, bien sea la frecuencia absoluta, o la frecuencia relativa. Para cada intervalo se
levanta una barra cuya longitud es proporcional a la frecuencia (absoluta, o relativa). La
forma que toma el grfico es la misma, bien sea que se trabaje con frecuencia absoluta o
relativa, ya que la diferencia entre las dos es simplemente un cambio de escala. A veces
se grafica una ordenada izquierda con la frecuencia absoluta, y una ordenada derecha
con la frecuencia relativa. Los histogramas tambin pueden construirse con la frecuencia
(absoluta o relativa) acumulada.
26

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Informacin grfica. La Ojiva. La ojiva se construye a partir del histograma de


frecuencia (absoluta o relativa) uniendo las marcas de clase de los intervalos mediante
una lnea recta, y uniendo la marca de clase del primer intervalo con el punto medio de
un intervalo ficticio inmediatamente anterior, y la marca de clase del ltimo intervalo
con el punto medio de un intervalo ficticio inmediatamente siguiente.
La marca de clase de un intervalo es simplemente el punto medio del respectivo
intervalo. Este valor tambin recibe a veces el nombre de "Mediatriz".
A continuacin se hace el desarrollo completo de la distribucin de frecuencia y de los
histogramas.
Grficos para variables cualitativas. Los grficos ms usuales para representar
variables de tipo nominal son los siguientes:
Diagramas de barras: Siguiendo la figura, representamos en el eje de ordenadas las
modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si,
mediante el grfico, se intenta comparar varias poblaciones entre s, existen otras
modalidades, como las mostradas en la figura. Cuando los tamaos de las dos
poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en
otro caso podran resultar engaosas.

Diagramas de sectores. Se divide un crculo en tantas porciones como clases existan,


de modo que a cada clase le corresponde un arco de crculo proporcional a su frecuencia
absoluta o relativa.

27

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

Como en la situacin anterior, puede interesar comparar dos poblaciones. En este caso
tambin es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre
grficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para
cada una de ellas un diagrama semicircular. Sean n 1 n 2 los tamaos respectivos de las
2 poblaciones. La poblacin ms pequea se representa con un semicrculo de radio r1 y
la mayor con otro de radio r2. La relacin existente entre los radios, es la que se obtiene
de suponer que la relacin entre las reas de las circunferencias es igual a la de los
tamaos de las poblaciones respectivas, es decir:
r22 n 2
n

r2 r1 2
2
n1
r1 n 1

Pictogramas, Expresan con dibujos alusivo al tema de estudio las frecuencias de las
modalidades de la variable. Estos grficos se hacen representado a diferentes escalas un
mismo dibujo.
El escalamiento de los dibujos debe ser tal que el rea de cada uno de ellos sea
proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos suele
usarse en los medios de comunicacin, para que sean comprendidos por el pblico no
especializado, sin que sea necesaria una explicacin compleja.
Grficos para variables cuantitativas. Para las variables cuantitativas,
consideraremos dos tipos de grficos, en funcin de que para realizarlos se usen las
frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas diferenciales: Son aquellos en los que se representan frecuencias
absolutas o relativas. En ellos se representa el nmero o porcentaje de elementos que
presenta una modalidad dada.
Diagramas integrales: Son aquellos en los que se representan el nmero de
elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir
de las frecuencias acumuladas, lo que da lugar a grficos crecientes, y es obvio que este
tipo de grficos no tiene sentido para variables cualitativas.
Grficos para variables discretas. Cuando representamos una variable discreta,
usamos el diagrama de barras cuando pretendemos hacer una grfica diferencial. Las
28

EVIDENCIA DE APRENDIZAJE: CONCLUSIONES


MARIANA ENRIQUEZ AHUATZIN
MATRICULA ES1410903065
ESTADISTICA BASICA

barras deben ser estrechas para representar el que los valores que toma la variable son
discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma
de escalera.
Ejemplo, Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de
caras, X, obtenindose los siguientes resultados, x = 2,1, 0, 1, 3, 2, 1, 2. Representar
grficamente el resultado.
En primer lugar observamos que la variable X es cuantitativa discreta, presentando las
modalidades, x est incluido en 0, 1, 2, 3, Ordenamos a continuacin los datos en una
tabla estadstica
Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsrvese
que el diagrama integral (creciente) contabiliza el nmero de observaciones de la
variable inferiores o iguales a cada punto del eje de abscisas.

Conteo de datos. Se toman los valores de la muestra, y se analiza en que intervalo


cae. Para ello se toma cada valor y se compara sucesivamente con el lmite superior del
primer intervalo, luego con el del segundo, y as sucesivamente hasta que caiga en
alguno. Si el valor x queda en el intervalo i, entonces se aumenta en uno la frecuencia
del respectivo intervalo.

29

You might also like