Professional Documents
Culture Documents
DE
ESTADÌSTICA
A MODO DE INTRODUCCIÒN
1
La mayoría de las veces, al hablar de Estadística llegan a nuestra mente
imágenes de números agrupados en tablas, volúmenes de cifras relativas a nacimientos,
muertes, impuestos, poblaciones, ingresos, deudas, entres otros aspectos. Pero la
Estadística es mucho más que números apilados y gráficas bien hechas.
Es una ciencia tan antigua como la escritura y representa un auxilio para todas
las ciencias. Las grandes empresas, la medicina, los gobiernos, la ingeniería, todo en
general amerita el uso de la estadística para poderse desarrollar. La ausencia de la
Estadística generaría un caos generalizado dejándonos sin una información vital a la
hora de tomar decisiones en tiempos de incertidumbre.
2
Es muy frecuente enfrentarnos con fenómenos en los cuales es muy difícil
predecir el resultado; por eso no podemos dar una lista con las personas que van a morir
con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado
tiempo de embarazo, entre otros. Por lo tanto, el objetivo de la estadística es hallar las
regularidades que se encuentran en los fenómenos de masa.
ESTADÌSTICA
3
La estadística es una ciencia que estudia la recolección, análisis e
interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno y/o estudio aplicado, de
ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en
otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica.
Distribución Normal.
4
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas SI/NO (Prueba de Hipótesis),
estimaciones de características numéricas (Estimación), pronósticos de futuras
observaciones, descripciones de asociación (Correlación) o modelamiento de
relaciones entre variables (Análisis de Regresión). Otras técnicas de
modelamiento incluyen Anova, Series de Tiempo y Minería de Datos.
Origen de la Estadística:
5
El término alemán Statistik, fue introducido por Gottfried Achenwall (1.749),
y designaba originalmente el análisis de datos del Estado, es decir, la Ciencia del
Estado, también llamada Aritmética Política, de su traducción directa del inglés. No fue
hasta el siglo XIX cuando el término Estadística adquirió el significado de recolectar y
clasificar datos. Este concepto fue introducido por el militar británico Sir John Sinclair
(1.754 - 1.835).
En su origen, por lo tanto, la Estadística estuvo asociada a los Estados, para ser
utilizados por el gobierno y cuerpos administrativos, generalmente centralizados. La
colección de datos acerca de estados y localidades continúa ampliamente a través de los
servicios de estadísticas tanto nacionales como internacionales. En particular, los censos
suministran información regular acerca de la población.
Historia de la Estadística:
6
Los orígenes del estudio de la Estadística dan inicio en el siglo XVIII, con el
interés por el estudio de los juegos de azar; sin embargo, es solo en las últimas siete
décadas que su desarrollo se ha acrecentado con las múltiples aplicaciones de los
llamados Métodos Estadísticos en la gran mayoría de los campos de las ciencias
sociales.
En el antiguo Egipto, los faraones lograron recopilar, hacia el año 3.050 antes
de Cristo, datos relativos a la población y la riqueza del país. De acuerdo al historiador
griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de
preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo
de las tierras con el objeto de verificar un nuevo reparto.
Durante los mil años siguientes a la caída del imperio Romano se realizaron
pocas operaciones estadísticas, con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno
en el 762 D.C. Durante el siglo IX se realizaron en Francia algunos censos parciales de
siervos.
7
En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro
del Gran Catastro para el año 1.086, un documento de la propiedad, extensión y valor de
las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de
revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados
durante la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci,
Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René
Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando
se crearon los Estados Nacionales y surgió como fuerza el comercio internacional ya
existía un método capaz de aplicarse a los datos económicos.
8
Los eruditos del siglo XVII demostraron especial interés por la Estadística
Demográfica como resultado de la especulación sobre si la población aumentaba,
decrecía o permanecía estática. En los tiempos modernos tales métodos fueron
resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el
potencial humano de sus respectivos países.
El primer empleo de los datos estadísticos para fines ajenos a la política tuvo
lugar en 1.691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en
Breslau. Este investigador se propuso destruir la antigua creencia popular que en los
años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad.
9
Quételect fue el primero en realizar la aplicación práctica de todo el método
Estadístico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el
período del 1.800 al 1.820 se desarrollaron dos conceptos matemáticos fundamentales
para la teoría Estadística: la Teoría de los Errores de Observación, aportada por Laplace
y Gauss; y la Teoría de los Mínimos Cuadrados, desarrollada por Laplace, Gauss y
Legendre.
A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las
variables. De allí parte el desarrollo del Coeficiente de Correlación creado por Karl
Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H.
Hooker y G. Udny Yule, quienes efectuaron amplios estudios sobre la medida de las
relaciones.
Orígenes en Probabilidad:
Pierre-Simon Laplace (1.774), hace el primer intento de deducir una regla para
la combinación de observaciones desde los principios de la teoría de probabilidades.
Laplace representó la Ley de Probabilidades de Errores mediante una curva y dedujo
una fórmula para la media de tres observaciones. También, en 1.871, obtiene la fórmula
para la Ley de Facilidad del Error (término introducido por Lagrange, 1.744) pero con
ecuaciones inmanejables. Daniel Bernoulli (1.778) introduce el principio del máximo
producto de las probabilidades de un sistema de errores concurrentes.
El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1.816), Littrow
(1.833), Richard Dedekind (1.860), Helmert (1.872), Hermann Laurent (1.873), Liagre,
Didion y Karl Pearson. Del mismo modo, Augustus De Morgan y George Boole
mejoraron la presentación de la teoría. Adolphe Quetelet (1.796 - 1.874), fue otro
importante fundador de la estadística que introdujo la noción del Hombre Promedio
(l’homme moyen) como un medio de entender los fenómenos sociales complejos tales
como Tasas de criminalidad, de matrimonio, de suicido, entre otros.
11
Etapas de Desarrollo de la Estadística:
12
1.- Primera Fase: Los Censos. Desde el momento en que se constituye una autoridad
política, la idea de inventariar de una forma más o menos regular la población y las
riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los
primeros esfuerzos administrativos.
Estado actual:
13
económicos como sociales (Tasa de desempleo, econometría, entre otros.) necesitó
avances sustanciales en las prácticas estadísticas.
14
Por razones prácticas, en lugar de compilar datos de una población entera,
usualmente se estudia un subconjunto seleccionado de la población, llamado Muestra.
Los datos acerca de la muestra son recogidos de manera observacional y/o
experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos
propósitos: Descripción e Inferencia.
15
Incluso cuando la estadística es correctamente aplicada, los resultados pueden
ser difícilmente interpretados por un inexperto. Por ejemplo, el significado estadístico
de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada
por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido
intuitivo. El conjunto de habilidades estadísticas básicas y el escepticismo que una
persona necesita para manejar información en el día a día se conoce como Cultura
Estadística.
16
Una Población es el conjunto de todos los elementos a los que es sometido un
estudio estadístico. Es obvio que todo estudio estadístico ha de estar referido a un
conjunto y/o colección de personas o cosas. Este conjunto de personas o cosas es lo que
denominaremos Población.
17
Una Muestra es un conjunto representativo de la población de referencia, el
número de individuos de una muestra es menor que el de la población.
Definición de Variable:
18
Una Variable Estadística es cada una de las características o cualidades que
poseen los individuos de una población.
19
Cuantitativas Discretas. Aquellas a las que se les puede asociar un número
entero, es decir, las que por su naturaleza no admiten un fraccionamiento de la
unidad, por ejemplo: número de hermanos, páginas de un libro, entre otras.
Cuantitativas Continuas: Aquellas que no se pueden expresar mediante un
número entero, es decir, las que por su naturaleza admiten que entre dos valores
cualesquiera y la variable pueda tomar cualquier valor intermedio, por ejemplo:
peso, tiempo, entre otras.
Niveles de Medición:
20
Las medidas de intervalo tienen distancias interpretables entre mediciones,
pero un valor cero sin significado, como las mediciones de Coeficiente Intelectual o
temperatura en grados Celsius.
21
Algunos tests y procedimientos para investigación de observaciones conocidos
son:
a) Prueba T de Student.
b) Prueba de X².
d) U de Mann-Whitney.
e) Análisis de Regresión.
f) Correlación.
g) Iconografía de la Correlaciones.
h) Frecuencia Estadística.
22
Disciplinas especializadas:
1) Ciencias actuariales.
2) Física estadística.
3) Estadística industrial.
4) Estadística Espacial.
5) Matemática Estadística.
6) Estadística en Medicina.
8) Estadística en Nutrición.
9) Estadística en Agronomía.
23
12) Estadística en Restauración de Obras.
18) Geoestadística.
19) Bioestadística.
27) Cienciometría.
24
33) Geografía y Sistemas de información geográfica, más específicamente en
Análisis espacial.
34) Demografía.
Computación Estadística:
25
El rápido y sostenido incremento en el poder de cálculo de la computación
desde la segunda mitad del siglo XX ha tenido un sustancial impacto en la práctica de la
ciencia estadística. Viejos modelos estadísticos fueron casi siempre de la clase de los
modelos lineales. Ahora, complejos computadores junto con apropiados algoritmos
numéricos, han causado un renacer del interés en modelos no lineales, especialmente
redes neuronales y árboles de decisión, y la creación de nuevos tipos tales como
modelos lineales generalizados y modelos multinivel.
26
Distribución de Frecuencias:
Tipos de Frecuencias:
27
Frecuencia Acumulada: Es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado. Se representa por Fi.
Ejemplo:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.
28
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
34 I 1 31 0.032 1
31 1
29
La distribución de frecuencias agrupadas o tabla con datos agrupados se
emplea si las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia correspondiente.
Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el
límite superior de la clase.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
30
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece a intervalo, se cuenta en el
siguiente intervalo. Por ejemplo:
ci fi Fi ni Ni
40 1
Diagrama de Barras:
Ejemplo: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar
su grupo sanguíneo ha dado el siguiente resultado:
Grupo
fi
sanguíneo:
A 6
B 4
AB 1
0 9
20
Polígonos de Frecuencia:
32
Se forma uniendo los extremos de las barras por medio de segmentos. También
se puede realizar trazando los puntos que representan las frecuencias y uniéndolos
mediante segmentos.
Ejemplo:
Hora: Temperatura:
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
33
Diagrama de Sectores: Se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de
modo que el ángulo de cada sector es proporcional a la frecuencia absoluta
correspondiente.
34
Alumnos: Ángulo:
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Total 30 360°
35
En el eje abscisas se construyen rectángulos que tienen por base la amplitud
del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de
cada barra es proporcional a la frecuencia de los valores representados.
Polígono de Frecuencia: Para construirlo se toma la marca de clase que coincide con
el punto medio de cada rectángulo. Es una representación de segmentos de
línea que conectan los puntos formados por la intersección del punto medio de
clase y la frecuencia de clase absoluta, relativa o porcentual.
36
Ejemplo:
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
37
[90, 100) 95 10 58
65
38
Histogramas con Intervalos de Amplitud Diferente: Para construir un histograma
con intervalo de amplitud diferente tenemos que calcular las alturas de los
rectángulos del histograma.
Donde:
fi hi
[0, 5) 15 3
39
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Gráficos Estadísticos:
40
Diagrama Circular: Es de especial utilidad para mostrar proporciones (porcentajes)
relativas de una variable. Se crea marcando una porción del círculo correspondiente a
cada categoría de la variable.
Diagrama de Barras: Es una forma gráfica de representar datos cualitativos que se han
resumido en una distribución de frecuencias, de relativas o de porcentuales. Hay varios
tipos de gráficos de barras, como son:
41
Gráfica Simple de Barras Horizontales: Se utiliza principalmente para facilitar la
comparación entre las diferentes clases que componen los datos categóricos. El trazo de
la gráfica es muy similar a la gráfica de barras verticales, solo que éstas van en forma
horizontal y se ordenan de la mayor a la menor frecuencia absolutas, de frecuencia
relativas o de porcentajes. De esta manera se logra una mejor visualización en las
preferencias.
42
Gráfica de Barras Componentes: Este tipo de gráfica se usa cuando las diferentes
categorías de datos se componen de otras clases, de tal forma que cada barra se pueda
subdividir y representar cada una de estas clases .Así mismo, entre las categorías y sus
componentes se comparan valores.
43
Diagrama de Pareto: Es un tipo especial de diagrama de barras verticales, donde las
respuestas categóricas se grafican en orden descendente de frecuencias y se combinan
con un polígono acumulado en la misma escala. Se usa ampliamente en el control
estadístico de procesos y en el control estadístico de la calidad del producto.
44
Ojiva: Es un polígono acumulado de frecuencia absoluta, relativa o porcentual y por lo
tanto representa segmentos de línea que se originan al conectar los puntos formados por
la intersección entre el límite inferior de cada clase con la frecuencia acumulada. Es
conocida como Polígono de Frecuencia Acumulada Menor Que, por cuanto muestra el
número o porcentaje de observaciones menores a cierto valor.
3. Dentro de la caja trazamos una línea recta vertical que representa la mediana.
46
Parámetros Estadísticos
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
47
a) Cuartiles: Dividen la serie de datos en cuatro partes iguales.
Tablas Estadísticas:
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
1 16
2 20
3 9
4 5
Total 50
49
450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100
5 180 200 675 500 375 1500 205 985 185 125 315 425 560 1100
[ Li-1, Li ): Frecuencia:
[ 0,500) 16
[ 500, 1000) 6
[ 1000,1500) 3
[ 1500, 2000) 2
[ 2000, 2500) 1
50
[ 2500, 3000) 1
[ 3000, 3500) 0
[ 3500, 4000) 0
[ 4000, 4500) 0
[ 4500, 5000) 0
[ 5000,5500) 1
Tipos de Frecuencia: Uno de los primeros pasos que se realizan en cualquier estudio
estadístico es la tabulación de resultados, es decir, recoger la información de la muestra
resumida en una tabla en la que a cada valor de la variable se le asocian determinados
números que representan el número de veces que ha aparecido, su proporción con
respecto a otros valores de la variable, entre otros. Estos números se denominan
Frecuencias. Los tipos de frecuencia son:
3) Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy día es
bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes,
por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La
denotaremos por pi.
51
4) Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias
hay que tener en cuenta que la variable estadística ha de ser cuantitativa o
cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta
frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el
número de veces que ha aparecido en la muestra un valor menor o igual que el
de la variable y lo representaremos por Ni.
52
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50
53
Una Observación Continua; como su nombre lo indica es aquella que se lleva a
cabo de un modo permanente.
55
Supóngase que un profesor calcula la calificación promedio de un grupo de
alumnos en Historia Universal. Como la estadística describe el desempeño del grupo
pero no hace ninguna generalización acerca de los diferentes grupos, podemos decir que
el profesor está utilizando Estadística Descriptiva. Gráficas, tablas y diagramas que
muestran los datos de manera que sea más fácil su entendimiento son ejemplos de
Estadística Descriptiva.
Medidas Estadísticas:
Tipo de Medidas:
1. Medidas de Centralización:
o Sirven para determinar los valores centrales o medios de la distribución
frecuencial.
2. Medidas de Dispersión:
3. Medidas de Localización:
4. Medidas de la Simetría:
56
o Permiten determinar si la distribución tiene el mismo comportamiento
por encima y por debajo de los valores centrales.
Medidas de Centralización:
Media Aritmética:
57
Clases: xi: fi: xi . fi:
(10, 20) 15 1 15
(30,40) 35 10 350
(60,70) 65 4 260
42 1 820
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
58
5. La media aritmética de los cuadrados de las desviaciones de los valores de la
variable con respecto a un número cualquiera se hace mínima cuando dicho
número coincide con la media aritmética.
6. Si a todos los valores de la variable se les suma un mismo número, la media
aritmética queda aumentada en dicho número.
59
Media Armónica: La media armónica de N observaciones es la inversa de la media
de las inversas de las observaciones y la denotaremos por H.
Mediana:
Cálculo de la mediana:
2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
60
3) Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
61
ai es la amplitud de la clase.
62
La mediana es independiente de las amplitudes de los intervalos.
Ejemplo:
(60, 63) 5 5
(63, 66) 18 23
(66, 69) 42 65
(69, 72) 27 92
100
100 / 2 = 50
Moda:
Es el valor que tiene mayor frecuencia absoluta, es decir, el que más veces se
repite en una serie de datos. Se representa por Mo. Se puede hallar la moda para
variables cualitativas y cuantitativas.
63
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo = 1, 5, 9
2, 2, 3, 3, 6, 6, 9, 9
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
ai es la amplitud de la clase.
64
Ejemplo:
Clases. fi:
(60, 63) 5
(63, 66) 18
(66, 69) 42
(69, 72) 27
(72, 75) 8
100
En primer lugar tenemos que hallar las alturas. La clase modal es la que tiene
mayor altura.
Medidas de Dispersión
65
Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por o
también por .
66
Cuasivarianza: Es una medida de dispersión, cuya única diferencia con la varianza es
De manera tal que se precisa una medida Escalar, es decir, que no lleve
asociado ninguna unidad de medida.
Ejemplo:
67
Veamos un ejemplo de cómo se calculan todas estas medidas.
Dm=
C.V.=
68
Medidas de Localización:
Cuartiles: Medida de localización que divide la población y/o muestra en cuatro partes
iguales representadas así:
Caso II: Variable cuantitativa continua: En este caso el cálculo es más simple, sea la
distribución que sigue:
69
Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:
2, 5, 3, 6, 7, 4, 9
2, 5, 3, 4, 6, 7, 1, 9
70
Cálculo de los Cuartiles para datos agrupados:
Donde:
ai es la amplitud de la clase.
Ejercicio de Cuartiles:
71
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
72
Cálculo del tercer Cuartil:
k = 1 .. 9
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
73
D5 coincide con la mediana.
Donde:
ai es la amplitud de la clase.
Ejercicio de Deciles:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
74
75
76
Cálculo del noveno Decil:
77
K = 1 = 99
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
Donde:
ai es la amplitud de la clase.
78
Ejercicio de Percentiles:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
79
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 35:
Percentil 60:
Ejemplo:
80
81
Desviación Media:
Di = |x - x|
Ejemplo:
9, 3, 8, 8, 9, 8, 9, 18
82
Desviación media para datos agrupados:
Ejemplo:
xi fi xi · f i |x - x| |x - x| · fi
83
[15, 20) 17.5 5 87.5 4.286 21.43
10.17
[30, 35) 32.5 2 65 21.428
4
2
457.5 98.57
1
Una vez estudiadas las medidas de localización surgen dos nuevas medidas de
dispersión, que son:
Recorrido intercuartílico:
Semirecorrido intercuartílico:
84
Recorrido interdecílico:
Recorrido intercentilico:
Esta medida es muy fácil de calcular, pero menos precisa que el Coeficiente de
Asimetría de Pearson.
85
tampoco servirían, por lo tanto precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por
lo tanto relativa, dividimos por el cubo de su desviación típica. Con lo que resulta la
siguiente expresión:
86
Como podemos observar, el coeficiente de Curtosis nos mide el grado de a53-
1-u-puntamiento de la distribución. Este coeficiente lo vamos a denotar por K y se
calcula según la siguiente expresión:
45 55 6 6 50 300 - - 849881,098
19,4 43808,30
4
55 65 10 16 60 600 -9,4 -8305,84 78074,896
65 75 19 35 70 1330 0,6 4,104 2,4624
75 85 11 46 80 880 10,6 13101,17 138872,466
6
85 95 4 50 90 360 20,6 34967,26 720325,638
4
N= 50 3470 -4041,6 1787156,56
87
=
Mo= 70.24
As=
Coeficiente de Asimetría de
Pearson As=
K=
Asimetría: Se refiere a si la curva que forman los valores de la serie presenta la misma
forma a izquierda y derecha de un valor central (media aritmética).
88
Los resultados pueden ser los siguientes:
Ejemplo:
Luego:
(1/30) * 0,000110
g1 ------------------------------------------------- =
= -0,1586
(1/30) * (0,030467)^(3/2)
90
3) Distribución Platicúrtica: Presenta un reducido grado de concentración alrededor
de los valores centrales de la variable.
g 2 = 0 (Distribución Mesocúrtica).
Ejemplo:
91
(1/30) * 0,00004967
g2 ------------------------------------------- - = -1,39
= 3
((1/30) * (0,03046667))^2
Otras Definiciones:
Planteamiento del problema: Suele iniciarse con una fijación de objetivos o algunas
preguntas como ¿cuál será la media de esta población respecto a tal característica?, ¿se
parecen estas dos poblaciones?, ¿hay alguna relación entre ellas?, entre otras.
92
Tratamiento de los datos: En esta fase se eliminan posibles errores, se depura la
muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos
posteriores, como la Media Muestral y la Varianza Muestral.
94
Instrumentos para la recolección de datos:
Como es natural, estas partes, así como las preguntas, varían de acuerdo a la
finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los datos
personales es eliminada por no tener ningún tipo de interés para el estudio.
El cuestionario debe ser conciso; tratar en lo posible que con el menor número
de preguntas, se obtenga la mejor información.
95
Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma más sencilla.
Discreción: Un cuestionario hecho a conciencia, no debe tener preguntas
indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.
Facilidad de contestación: Se deben evitar en lo posible, las preguntas de
respuestas libres o abiertas y también la formulación de preguntas que requieran
cálculos numéricos por parte del entrevistado.
Orden de las preguntas: Deben tener una secuencia y un orden lógico, agruparlas
procurando que se relacionen unas con otras.
1. Ejemplo:
Ejemplo:
Ejemplo:
2.1) Series de frecuencia: Cuando realizamos un estudio de cada uno de los elementos
que componen la población o muestra bajo análisis, observamos que en general, hay un
número de veces en que aparece repetido un mismo valor de una variable, o bien
97
repeticiones de la misma modalidad de un atributo. Este número de repeticiones de un
resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para así determinar el
número de veces que cada dato se repite, recibe el nombre de tabulación.
Ejemplo:
56543
63454
34653
43646
Ejemplo:
Ejemplo:
99
19 12
20 2
25 8
28 6
32 4
42 3
Total = 35
2.2) Series especiales o geográficas: Es aquella que está formada por los valores que
toman una variable en función del espacio geográfico.
A MANERA DE CONCLUSIÒN
100
La Estadística es una ciencia matemática utilizada para describir, analizar e
interpretar ciertas características de un conjunto de individuos llamado Población. Al
referirnos a Muestra y Población hablamos de conceptos relativos que están
estrechamente ligados. Una Población es un todo y una Muestra es una parte o
segmento de ese todo.
Se puede decir que desde los comienzos de la civilización han existido formas
sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos
para contar el número de personas, animales o ciertas cosas.
101
explicación, descripción y comparación de los fenómenos. La estadística tiene una suma
de importancia que cabe señalar por cuanto se utiliza términos como lo son:
e) Polígono de frecuencias: Es la recta que une los extremos de las variables de una
distribución.
La estadística ha estado presente desde hace siglos atrás con las antiguas
civilizaciones, su uso ha sido necesario en primeras instancias para resolver casos de la
vida diaria, luego sería empleada con fines a mayor escala como trabajos investigativos
o estudios, y ha adquirido relevancia, debido a que por medio de ella se puede procesar
una extensa información, lo cual se puede llevar a cabo de forma más sencilla sin pasar
a ser algo tedioso.
103
Tanto así es su importancia que ha dejado de ser solo una parte de las
matemáticas y se ha convertido en una ciencia empleada en diferentes campos, pues han
tomado sus métodos para aplicarlos a sus áreas independientemente de la que sea, como
por ejemplo: la psicología, la medicina, la contaduría, administración, entre otras.
Es por ello, que la presente obra plantease los diversos conceptos básicos de la
estadística, los tipos de estadística haciendo énfasis en la primera con sus diferentes
medidas, así como los medios que utiliza para representar e interpretar datos, por
último, al análisis de correlación y regresión lineal simple, y su aplicación para
cualquier trabajo investigativo o de estudio.
104
desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de
la estadística.
105