Professional Documents
Culture Documents
APUNTES DE
ESTADSTICA DESCRIPTIVA
MC Ral Adalberto Morelos
Centro de Estudios Superiores del Estado de Sonora
Unidad Acadmica de San Luis Ro Colorado, Sonora Mxico.
Septiembre 2010
1
Estadstica Descriptiva
ndice
Tema
Unidad 1
Conceptos Bsicos Qu es la estadstica? ------------------------Datos estadsticos ----------------------------------------------------------Importancia Actual de la estadstica -----------------------------------Clases de estadstica ------------------------------------------------------Estadstica Descriptiva -----------------------------------------------------Estadstica Inferencial ------------------------------------------------------Definicin del concepto de estadstica ---------------------------------Ejercicio 1.1 -------------------------------------------------------------------Ejercicio 1.2 -------------------------------------------------------------------Unidad 2
Mtodos estadsticos ------------------------------------------------------Recopilacin de datos -----------------------------------------------------Organizacin de datos ----------------------------------------------------Organizacin de datos usando arreglos ------------------------------Organizacin de datos usando una distribucin de
frecuencias -------------------------------------------------------------------Nmero de clases o intervalos ------------------------------------------Amplitud de clases ---------------------------------------------------------Tabla de frecuencias -------------------------------------------------------Datos fundamentales de una tabla de frecuencia ------------------Otros mtodos de presentacin de datos ----------------------------Partes principales de una tabla -----------------------------------------Grficas estadsticas -------------- ---------------------------------------Representacin grfica de una tabla de frecuencia ---------------Ejercicio 2.1 ------------------------------------------------------------------Medidas de tendencia central para datos NO agrupados --------Medidas de tendencia central para datos agrupados -------------Medidas de dispersin para datos No agrupados -----------------Medidas de dispersin para datos agrupados ----------------------Bibliografa ---------------------------------------------------------------------
Pgina
3
4
4
5
6
6
7
9
9
10
11
12
15
15
16
17
18
18
19
20
21
22
24
26
27
28
29
29
Estadstica Descriptiva
ESTADSTICA GENERAL.
CONCEPTOS BSICOS
QUE ES LA ESTADSTICA?
Con el fin de estudiar inteligentemente el tema de la estadstica debemos, en primer lugar, comprender
lo que l termino significa en la actualidad as como conocer algo de su origen.
Como en la mayora de los vocablos, la palabra estadstica tiene diversos significados para diferentes
personas. Cuando la mayora de la gente escucha el trmino lo relaciona con cuadros o tablas llenas de
cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automviles, etc., que ofrecen,
por ejemplo, en los almanaques anuales, y que indudablemente usan el trmino con toda correccin. A
decir verdad, el trmino en cuestin fue inicialmente usado para tabular las funciones del Estado en lo
que respecta a los datos necesarios para una planeacin idnea, reglamentaciones y recaudacin de
impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de anlisis eran llamados
estadsticos por su dedicacin a compaginar datos e informes requeridos por el Estado.
En la actualidad, desde luego, la palabra estadstica se aplica en este primer sentido para casi todo
relacionado con los informes basados en hechos y consignados en base a nmeros, lo que
comnmente se denomina: Hechos y cifras. Los anunciadores de radio y televisin nos informan que
en unos cuantos minutos darn la estadstica del juego ...y los peridicos con frecuencia publican
artculos a cerca de concursos de belleza en los cuales brindan las estadsticas de las concursantes.
Sin embargo, el trmino tiene otros significados y la gente que no esta familiarizada con la materia los
desconoce. La estadstica es una rama del conocimiento el campo de las matemticas aplicadas, que
utiliza sus propios smbolos, trminos, contenido, teoremas y tcnicas. Cuando se estudia la
estadstica normalmente se pretende dominar algunas de estas tcnicas.
Para todos aquellos ya iniciados en los misterios de campo de las estadsticas, el vocablo tiene una
segunda aceptacin; las estadsticas son cantidades que han sido calculadas con datos de muestreo:
una sola cantidad as calculada se denomina estadstica. Por ejemplo, la media de la muestra es una
estadstica, as como tambin lo son la mediana de la muestra y el modo. La varianza de la muestra es
una estadstica, como tambin lo es la gama de la muestra. El coeficiente de correlacin de la muestra
es asimismo una estadstica.
La estadstica est desarrollada para tratar con datos numricos o informacin cuantitativa. La palabra
"estadstica", por lo tanto ha sido ampliamente referida ya sea a la informacin cuantitativa misma como
a los mtodos que tratan con la informacin. Los estadsticos prefieren llamar a la informacin
cuantitativa Datos Estadsticos y a los mtodos que tratan con la informacin los Mtodos
Estadsticos.
Por ESTADSTICA debemos entender que son los mtodos por medio de los cuales podemos
recolectar, organizar, presentar y analizar datos numricos de un conjunto de individuos permitindonos
extraer conclusiones vlidas y efectuar decisiones lgicas basadas en dicho anlisis.
Los DATOS son agrupaciones de cualquier nmero de observaciones relacionadas. Para que los datos
sean tiles, las observaciones deben estar organizadas en tal forma que se puedan identificar
tendencias y llegar a conclusiones lgicas.
Estadstica Descriptiva
DATOS ESTADSTICOS
La informacin cuantitativa apropiada para el anlisis estadstico debe ser un conjunto (o conjuntos) de
nmeros que muestren relaciones significativas. En otras palabras, los datos Estadsticos son nmeros
que pueden ser comparados, analizados e interpretados.
Un nmero aislado que no se compara o que no muestra relacin significativa con otro nmero no es
dato estadstico. Por ejemplo: Las edades de 1000 estudiantes son datos estadsticos, puesto que las
edades pueden ser comparadas y analizadas, y los resultados de los anlisis pueden ser interpretados.
El rea de la cual los datos estadsticos son recopilados, se le conoce como poblacin o universo.
Si deseamos tener las edades de 25 estudiantes en la clase de Biometra, podemos simplemente
preguntar a cada estudiante su edad: as tenemos un conjunto completo de datos. Sin embargo
recopilar tales datos de una poblacin finita pero grande es algunas veces imposible o imprctico. A fin
de evitar la tarea imposible o imprctica, usualmente se extrae una muestra de elementos
representativos de la poblacin. La muestra entonces, utilizada para el estudio estadstico y los
resultados de la muestra son usados como las bases para describir, estimar o predecir las
caractersticas de la poblacin.
Podemos resumir los significados del trmino Estadstica como sigue:
1. La acepcin publica de cifras y hechos, grficas y mapas. El trmino en este sentido se usa en
plural.
2. La materia propiamente dicha, con su terminologa, metodologa y conocimientos particulares.
Bajo este concepto el trmino se usa en singular.
3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el trmino se usa en plural.
Estadstica Descriptiva
del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los
mtodos estadsticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar,
desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teora de las probabilidades y
la estadstica (especialmente un nuevo campo llamado teora estadstica de la toma de decisiones) se
usan como ayuda para tomar decisiones sumamente importantes en los altos niveles.
En cuanto a la industria privada, el empleo de las estadsticas es casi tan importante en sus efectos
como en el sector gubernamental. Se usa las tcnicas estadsticas para el control de calidad de los
productos en proceso y para evaluar la aceptacin de los nuevos productos que se van a lanzar al
mercado. La estadstica se emplea en el mercado, en las decisiones para la ampliacin de los negocios,
en el anlisis de la eficacia de la publicidad, etc. Las compaas de seguros se basan en las
estadsticas para fijar sus tarifas a un nivel realista. La lista sera interminable. La estadstica se emplea
en la geologa, biologa, psicologa, sociologa; en todo sector en el que las decisiones deben de
hacerse a base de los datos o informes incompletos. Se usan tambin en pruebas educacionales, para
medidas de seguridad en la ingeniera. La meteorologa, la ciencia de la prediccin del tiempo, tambin
esta usando la estadstica actualmente.
An hay sectores aparentemente heterogneos que las emplean. Quin habra supuesto que las
estadsticas ayudaran a un erudito o a un investigador histrico a determinar quien es el autor de obras
en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las
estadsticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios
en los Federalist Papers.
En planos menores, se han hecho estudios estadsticos sobre el efecto que la luna llena tiene la pesca
de las truchas; sobre cual sera el tipo ms adecuado del vaso para el agua de los restaurantes; as
como la estrategia ptima para juegos de destreza y azar, tales como el bridge, los solitarios, el
veintiuno, el bisbol, etc.
No cabe la menor duda de la importancia de los efectos de las tcnicas estadsticas en todo y en cada
uno de nosotros. Los resultados de los estudios estadsticos se pueden ver, aunque quizs no se
comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de
las primas de seguros, en nuestra satisfaccin al consumir diversos productos y en nuestra propia
salud.
CLASES DE ESTADSTICA
La estadstica normalmente se divide en dos grandes categoras: La estadstica DESCRIPTIVA y la
estadstica INFERENCIAL.
Como complemento a las breves consideraciones de los elementos bsicos de la probabilidad, hay dos
clases de estadsticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de
estadstica es el de estadstica descriptiva. La clasificacin de datos; el trazo de los histogramas que
corresponden a las distribuciones a una poblacin; la representacin de los datos por medio de otras
clases de grficas, tales como las lineales, las grficas en barras, los pictogramas; l cmputo de
medidas muestrales, medianas y modos; l cmputo de varianzas, las medidas de las desviaciones
absolutas y de la gama; todas estas operaciones se refieren a la estadstica descriptiva. La labor
estadstica ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadstica
descriptiva.
Estadstica Descriptiva
ESTADSTICA DESCRIPTIVA
Significado de Estadstica
La palabra Estadstica ha sido frecuentemente referida a la informacin cuantitativa o numrica.
Tambin ha sido referida ampliamente a los mtodos que se tratan con la informacin. Sin embargo
esto debera aclararse y llamar a la informacin, datos estadsticos y a los mtodos, mtodos
estadsticos.
La estadstica descriptiva es la parte de la estadstica que agrupa las tcnicas apropiadas para la
organizacin, representacin y descripcin de un conjunto de datos con el propsito de resaltar sus
rasgos ms importantes y extraer la informacin esencial que contiene. En nuestros trminos, diremos
que la estadstica descriptiva permite tener una visin a vuelo de pjaro de la variable que miden los
datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la
toma de alguna decisin.
En pocas palabras, la Estadstica Descriptiva permite tener una visin a vuelo de pjaro, de la variable
que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio ms fino de la
misma, para la toma de alguna decisin.
Ejemplo 1.1 : Supngase que un profesor que calcula un promedio para una clase de Historia. Como l
est usando estadstica para describir el comportamiento de esa clase y no para hacer
una generalizacin acerca de varias clases, se puede decir que l est usando
estadstica descriptiva. Los grficos, las tablas y mapas que muestren datos en tal forma
que sean ms fciles de entender son ejemplos de estadstica descriptiva.
ESTADSTICA INFERENCIAL
Y su significado
La segunda parte importante de la estadstica se refiere a la Estadstica Inferencial. Antes definimos a
la estadstica como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la
mejor resolucin sobre bases de una informacin incompleta. Con el fin de llegar a una decisin sobre
una poblacin, se toma una muestra (generalmente de unos cuantos de los miembros) de esa
poblacin. Dicha seleccin se hace, generalmente, al azar, a pesar de que existen varios medios de
muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho trmino
implica, se puede apreciar que se trata de un mtodo de muestreo en los que los elementos que lo
integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen
varias definiciones de matemticas del muestreo del azar, pero nosotros lo aceptaremos como un
muestreo en el que cada elemento escogido de la poblacin tiene la misma oportunidad de ser
seleccionado, y en el que la seleccin de cualquier elemento no afecta que se pueda seleccionar
cualquier otro.
Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la poblacin. La inferencia que
hacemos acerca de la poblacin sobre bases de este tipo de muestreo se conoce como inferencia
estadstica. En otras palabras, la inferencia estadstica es el empleo de la tcnica de muestreo para
llegar a determinadas conclusiones acerca de la poblacin de la cual se han obtenido las muestras.
De manera general, la Estadstica Inferencial es: la Estadstica mediante la cual se obtienen
generalizaciones o se toman decisiones en base a una informacin parcial o incompleta obtenida
mediante tcnicas descriptivas. Los datos se analizan de una manera ms detallada, se interpretan y se
infieren.
Estadstica Descriptiva
Si una muestra es representativa de una poblacin, se puede deducir importantes conclusiones acerca
de sta, a partir del anlisis e interpretacin de la misma.
Ejemplo 1.2: Supngase ahora que el profesor de Historia decide usar las notas
promedios en una de la clase de Historia para estimar la nota promedio obtenida en los
diez grupos del mismo curso de Historia. El proceso para estimar esta nota ser un
problema de inferencia estadstica. Obviamente, cualquier conclusin que realice el
profesor acerca de los diez grupos del curso estar basada en una generalizacin que va
ms all de los datos originalmente obtenidos en el curso de Historia. La generalizacin
del profesor puede no ser completamente vlida y l debe establecer cuanto tiene de
cierto.
Al efectuar una investigacin o experimento, es necesario definir qu datos se pretenden obtener de la
POBLACIN en estudio.
Para ello debemos definir los siguientes conceptos:
POBLACIN: Es una agrupacin de todos los elementos que se estn estudiando y de los cuales se
est tratando de obtener conclusiones. Se debe definir esta poblacin para precisar si un elemento que
pertenece a la poblacin.
POBLACIN FINITA: Cuando una poblacin consta de un nmero limitado (finito) de elementos. Por
ejemplo, si se desea obtener informacin acerca de la capacidad didctica de los 40 profesores de una
universidad, se obtendrn datos de una poblacin finita.
POBLACIN INFINITA: Cuando una poblacin consta de un nmero ilimitado de elementos. Por
ejemplo, la poblacin formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una
moneda es infinita, puesto que hipotticamente la moneda puede lanzarse un nmero infinito de veces.
MUESTRA: Una muestra es una agrupacin de algunos elementos de la poblacin, pero no todos. La
mayora de las veces no es posible o prctico observar todos los elementos de la poblacin, en todo
caso se toma solo una parte de ella.
PARMETRO: Cuando una medida se calcula a partir de los datos de una poblacin.
ESTADSTICO: Cuando una medida se calcula a partir de los datos de una muestra.
MEDIDA
Media aritmtica (Promedio)
ESTADSTICO (MUESTRA)
Desviacin Estndar
Nmero de datos o elementos
VARIABLE:
S
n
PARAMETR0 (POBLACIN )
Es una caracterstica que toma valores diferentes en personas, lugares y cosas diferentes.
VARIABLE ALEATORIA:
VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta
puede obtener (estos valores se asocian a cualquier valor entero).
Ejemplos 1.3:
Estadstica Descriptiva
VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los
contenidos en un intervalo de recta.
Ejemplo 1.4:
La estadstica est desempeando un importante papel ascendente en casi todas las facetas del
progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se
extiende a la agricultura, biologa, negocios, qumica, comunicaciones, economa, educacin,
electrnica, medicina, fsica, ciencias polticas, psicologa, sociologa, y otros campos de la ciencia. Este
desarrollo de la estadstica est ligada a los mtodos cientficos en la toma, organizacin, presentacin
y anlisis de los datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables
de acuerdo con tales anlisis.
No cabe la menor duda de la importancia de los efectos de las tcnicas estadsticas en todos y cada
uno de nosotros. Los resultados estadsticos se pueden ver, aunque quizs no se comprendan, al recibir
nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra
satisfaccin al consumir diversos productos y en nuestra propia salud.
Estadstica Descriptiva
En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres
trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas
con base en estas calificaciones identifquense aquellas que se derivan de mtodos descriptivos
y aquellos que se derivan de inferencia estadstica.
a)
La calificacin promedio de los tres trabajadores es 85, y la calificacin promedio de las tres
trabajadoras es 89.
La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los
trabajadores.
En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones
mas bajas que las trabajadoras.
b)
c)
2.-
Tres bombillas de marca A dejaron de funcionar despus de 1100, 900 y 1000 hrs. de uso
continuo. Cuatro bombillas de la marca B dejaron de funcionar despus de 1050, 960, 1070 y
840 hrs. de uso continuo. Se llega a las siguientes conclusiones, Cules de ellas provienen de
la estadstica descriptiva y cules de la inferencial?
a)
La duracin promedio de las tres bombillas marca A es de 1000 hrs mientras que la duracin
promedio de las cuatro bombillas marca B es de 980 hrs.
La duracin promedio de todas las bombillas marca A es mayor que todas las bombillas de la
marca B.
La diferencia entre los dos promedio es de 20.
La diferencia entre los dos promedio es demasiado pequea para llegar a la conclusin de que
las bombillas marca A son mejores que la marca B.
Si se selecciona y prueba otra bombilla de marca A, probablemente durar ms que el promedio
de las bombillas marca B.
Usted decide comprar bombillas marca A en vez de bombillas marca B.
b)
c)
d)
e)
f)
Estadstica Descriptiva
RECOPILACIN DE DATOS
De acuerdo a la localizacin de la informacin los datos estadsticos pueden se clasificados en
datos Internos y datos Externos.
DATOS INTERNOS: Es cuando la informacin cuantitativa es obtenida dentro de la organizacin
que hace el estudio estadstico; Tal como los sueldos de empleados de una lista de pagos,
recibos de caja de la oficina de contabilidad de la organizacin.
DATOS EXTERNOS: Es cuando la informacin es obtenida fuera de la organizacin. Los datos
externos son usualmente obtenidos de dos maneras:
- Datos publicados:
Estadstica Descriptiva
11
Estadstica Descriptiva
3
2
1
0
-1
-2
-3
10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son
susceptibles de provocar reacciones de tipo Psicolgico positivo o negativos y alterar la respuesta.
Ej. El Presidente de la Repblica mencion en su discurso. Usted qu Opina?
En este caso el presidente eclipsa el asunto que se discuta.
12
Estadstica Descriptiva
11.- Por ltimo es conveniente destacar los siguientes puntos que influyen en forma determinante en la
redaccin de un buen cuestionario:
al
Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.
Pregunta introductoria: Deben ser fciles de contestar, estn antes del tema principal y sirven para
introducirlo.
Preguntas Bsicas: Es el elemento clave del cuestionario aquel estn traducida las observaciones de la
investigacin y deben ser lo suficientemente extensas para que cubra los mismos.
Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como
cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente
manera la misma pregunta.
Pregunta de Clasificacin: Tara de la informacin sobre el individuo, edad sexo domicilio, no. de hijos,
nacionalidad etc., son preguntas de identificacin al final del cuestionario por que podran influir en la
respuesta si fueran al principio.
ORGANIZACIN DE DATOS ESTADSTICOS
Dentro de una organizacin de datos estadsticos debemos tomar en cuenta:
1).- Crtica y correccin de datos recopilados. Un corrector puede encontrar una o varias de las
siguientes cosas que deberan ser corregidas y tratadas.
a).- Las respuestas son inconsistentes
b).- La escritura no es determinable
c).- Las respuestas son incompletas
d).- Se necesitan clculos
2).- Clasificacin de datos corregidos. Hay muchas formas de clasificar datos estadsticos en general las
clasificaciones pueden ser determinadas de acuerdo a 4 bases:
Tiempo, lugar, cantidad y cualidad.
13
Estadstica Descriptiva
CUALITATIVA.- En esta clasificacin la distincin es mas bien de clases que de cantidad. Por ejemplo,
cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia
cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios,
administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su
origen.
CUANTITATIVA.- Cuando los valores se modifican con respecto a una caracterstica mensurable,
conviene una clasificacin cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con l
numero de hijos, las empresas industriales, segn l nmero de obreros empleados y tambin
desacuerdo con el valor de los artculos producidos. La mayora de las distribuciones cuantitativas son
distribuciones de frecuencia, que son la forma bsica de organizacin de los datos para sus anlisis
estadsticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases
cuantitativas, mediante cambios muy ligeros.
CRONOLGICA.- Los datos cronolgicos o las series cronolgicas contienen cifras relativas a un
fenmeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar
la cotizacin diaria de cierre de ciertas acciones durante un periodo de meses o aos, puede registrarse
el coeficiente anual de natalidad de varios aos, puede indicarse la produccin mensual de carbn
durante un lapso dado de aos. Las series cronolgicas tiene un cierto modo algn parentesco con las
distribuciones cuantitativas, por el hecho de que cada ao o mes sucesivo de una serie esta un ao o
un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o ms bien los
acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre s.
Ocasionalmente una serie cronolgica puede convertirse en una distribucin de frecuencias.
GEOGRFICA.- La distribucin geogrfica es esencialmente un tipo de distribucin cualitativa, pero en
general se considera como una clasificacin especial. Por ejemplo, cuando se muestra la poblacin de
cada unos de los estados, tenemos datos clasificados geogrficamente. Aun cuando existe una
diferencia cualitativa entre dos estados cualesquiera, la distincin que se establece no es de clase sino
de situacin. A veces es posible esperar una distribucin geogrfica en forma de distribucin de
frecuencias.
3).- Tabulacin de datos clasificados. Despus de que se han decidido las clasificaciones adecuadas o
deseadas el siguiente paso en la organizacin de los datos es arreglar la masa de hechos cuantitativos
en una forma resumida basadas en las clasificaciones.
Este proceso se llama tabulacin son:
1).- Tarjetas de escritura manual
2).- Hojas de registro
3).- Tarjetas de perforacin manual
4).- Tarjetas perforadas
5).- Procesamiento electrnico de datos
14
Estadstica Descriptiva
15
Estadstica Descriptiva
k 1 3.3 Log( N )
k = Nmero de clases.
N = Nmero de datos.
Podemos agregar que la experiencia y el uso a que est destinado el agrupamiento, son criterios
determinantes en algunos casos.
La recomendacin de elegir un nmero impar de intervalos es con el fin de mantener la posible simetra
de una distribucin de datos.
16
Estadstica Descriptiva
k
Numero Intervalos
Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultara engorroso el trabajar con
cuatro dgitos despus del punto decimal, por lo que tomaremos la aproximacin de 6.3 con ancho del
intervalo. Aqu debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros
datos son discretos o continuos. Pues si fueran datos discretos tomaramos i = 7, ya que si tomamos el
valor 6, no concordara con el nmero de intervalos que previamente se haban calculado, (esto lo
podemos calcular con un pequeo despeje de i = R/k, lo cual tendramos k = R/i ), y tendramos que
utilizar un intervalo ms para poder meter los valores ms altos.
Al fijar los limites de clase, es necesario tomar en cuenta que el valor mnimo de los datos debe quedar
incluido en el primer intervalo de clase y el valor mximo en el ltimo. Para que el valor mnimo de los
datos quede incluido en el primer intervalo de clase, el primer lmite inferior de clase deber escogerse
en tal forma que sea igual o menor que l. De la misma manera, para que el valor mximo de los datos
quede incluido en el ltimo intervalo de clase, el ltimo lmite superior de clase deber ser igual o mayor
que l.
Los intervalos quedaran as:
I1
53.0
a
,
I2
59.3
b
I3
65.6
I4
71.9
I5
78.3
I6
84.6
I7
90.0
97.2
17
Estadstica Descriptiva
a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; a mayor que y estrictamente menores que b; b menor que.
( a, b ]
a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; a mayor que y estrictamente menores o iguales que b; b menor o igual que.
[ a, b ]
a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; a mayor o igual que y estrictamente menores o iguales que b; b menor o
igual que.
[ a, b )
a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; a mayor o igual que y estrictamente menores que b; b menor que.
CLASES
Li
Ls
53.0 - 59.3
59.3 - 65.6
65.6 - 71.9
71.9 - 78.2
78.2 - 84.5
84.5 - 90.8
90.8 - 97.1
FRECUENCIA
xi
56.15
62.45
68.75
75.05
81.35
87.65
93.95
Suma de frecuencias =
FRECUENCIAS
RELATIVAS
fr
4/80 = 0.05
13/80 = 0.1625
7/80 = 0.0875
30/80 = 0.375
9/80 = 0.1125
10/80 = 0.125
7/80 = 0.0875
f
4
13
7
30
9
10
7
fr
= 80
FRECUENCIA
ACUMULADA
C
4
17
24
54
63
73
80
1.0000
Marca Clase
Li Ls
53 .0 59 .3
56 15
.
2
18
Estadstica Descriptiva
FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las
clases y se expresa generalmente en porcentaje.
fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25%
Estadstica Descriptiva
NOTA DE PIE:
Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar
algunas partes incluidas en la tabla que no son explicadas en otras partes.
FUENTE:
20
Estadstica Descriptiva
GRFICAS ESTADSTICAS
Hay una gran variedad de grficas usadas para representar datos estadsticos, los tipos ms comunes
de grficas son:
1).- Grfica de lnea
2).- Grfica de barras
3).- Grficas de partes componentes
4).- Grfica de dimensiones
5).- Pictogramas
6).- Mapas estadsticos.
GRFICAS DE LNEAS
Las curvas o grfica de lnea se usan a menudo para representar las series cronolgicas, as como las
distribuciones de frecuencia. Los datos clasificados cualitativa y geogrficamente raras a veces se
presentan por medio de lneas; en su lugar se usan grficas de barras.
La Lnea o lneas que representan los datos debern resaltar claramente sobre el fondo de la grfica.
La lnea deber, pues, dibujarse con un trazo mas grueso que las coordenadas de lnea.
Cuando se trazan varias lneas en el mismo cuadrante, es esencial que cada lnea se destaque con
claridad. Para ello se pueden usar tanto lneas continuas, de puntos y de guiones, como lneas gruesas
y delgadas. Cuando en una grfica aparecen dos o ms curva, deben distinguirse unas de otras. Esto
puede lograrse, de preferencia, rotulando las lneas. De ordinario es conveniente evitar el uso de mas
de dos o tres lneas en una grfica. Especialmente si se cruzan, es muy probable que se produzca
alguna confusin.
GRFICAS DE BARRAS
Cuando se espera que la grfica de simplemente una impresin muy general pueden hacerse grficas
de barras simples, sin escalas. Cuando se desea dar una impresin menos vaga, se utilizara la escala y
si los intervalos de tiempo son diferentes, los espacios entre barra y barra tambin lo sern de acuerdo
a la magnitud de dichos intervalos.
Las grficas de barras se usan para hacer representaciones de datos clasificados cronolgicamente,
arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan
comparaciones de datos clasificados cualitativa o geogrficamente, se usan, por lo general, barras
horizontales.
Aun cuando no hay reglas establecidas para dibujar las grficas de barras, son tiles ciertas
consideraciones:
1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.
2.- Entre barra y barra deber dejarse un espacio que no sea menos, aproximadamente, que la mitad
del ancho de una barra, ni mayor que el ancho de la misma.
3.- La escala es generalmente til. La distancia a la que se colocara no deber exceder de la mitad de
una barra a partir de la ms alta, cuando son horizontales, o de la izquierda, cuando son verticales.
4.- Las lneas que sirven como gua ayudan a leer la grfica.
21
Estadstica Descriptiva
Para representar grficamente una serie cronolgica pueden usarse una grfica de barras o de lneas.
Si la serie abarca muchos aos, por lo general, no es adecuada una grfica de barras, que es difcil de
construir. Una grfica lineal facilita el estudio de la variacin general que ha experimentado la serie;
mientras que una grfica de barras permite comparar determinados aos con mayor facilidad.
Es un diagrama formado con rectngulos o barras cada uno de ellos pertenecientes a una clase. Cada
rectngulo tiene de ancho el tamao de clase.
En el eje "Y" se grafica la frecuencia, y en el eje "X" los lmites reales de clase. En el centro de su base
se seala la marca de clase.
Las ventajas de los histogramas son:
-
30
25
20
15
10
5
0
Intervalos de clase
POLGONO DE FRECUENCIA:
Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la
frecuencia del intervalo. Es un diagrama de lneas que se forma uniendo los centros (marca de clase) de
la parte superior de los rectngulos de un histograma mediante segmentos rectos.
La ventaja de los polgonos de frecuencia son:
-
22
Estadstica Descriptiva
F
r
e
c
u
e
n
c
i
a
s
POLIGONO DE FRECUENCIAS
35
30
25
20
15
10
5
0
Intervalos de clase
OJIVA:
Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y
cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convencin de que antes
del primer intervalo considerado, la frecuencia acumulada es cero y despus del ltimo es el total de
datos (N).
OJIVA
F
r
e
c
u
e
n
c
i
a
s
A
c
u
m
u
l
a
d
a
s
90
80
70
60
50
40
30
20
10
0
Intervalos de Clase
Estadstica Descriptiva
Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y
310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de
nios fueron de 65, 110, 140, 120 y 195.
Ttulo
( MILES DE AUTOS )
Compaa
Encabezado
Conceptos
Manufactu- Vendidos
rados
G.M.
10
9.2
K.W.
14
12.8
M.S.
5*
Nota de Encabezado
Cuerpo
d)
e)
f)
GRFICAS CIRCULARES
Se emplean para demostrar la relacin existente entre los componentes de una clase. Cada uno de los
sectores del crculo representa una parte de un agregado de un total.
Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a
los 360 grados, o bien, cuando se trata de porcentajes, a 100%.
24
Estadstica Descriptiva
Para evitar los clculos resulta muy conveniente emplear un transportador de porcentajes que tiene
graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos
simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta
multiplicar el porcentaje por este factor y el producto as obtenido equivale a los grados que le
corresponde en la circunferencia.
Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendr
dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a l.
PICTOGRAMAS
Las grficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los
datos que representan son ms atractivas; sin embargo; como ya se sealo presentan mayores
dificultades, tanto para su elaboracin como para su adecuada interpretacin.
Este valor pictrico, puede conservarse usando varios dibujos pequeos que representen una cantidad
fija de los datos, del mismo tamao, y arreglndolos de manera que se forme una grfica de barras. A la
grfica resultante se le llama pictograma.
Aunque este diagrama es esencialmente una grfica de barras es ms atractivo y, por lo tanto, hay
mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen
series cronolgicas, se arreglan en forma horizontal, porque aparece ms adecuado poner los dibujos
(cosas o personas) uno al lado del otro y no uno encima del otro.
Las reglas fundamentales para la construccin de pictogramas estadsticos son:
1.- Los smbolos deben explicarse por s mismo
2.- Las cantidades mayores se indican por un nmero mayor de smbolos y no por smbolos ms
grandes
3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos
4.- Los pictogramas slo deben utilizarse para hacer comparaciones y no afirmaciones aisladas
MAPAS ESTADSTICOS
Los mapas estadsticos son artificios grficos que muestran la informacin cuantitativa sobre una base
geogrfica. Los tipos ms comunes son los mapas sombreados o rayados, los mapas punteados y los
mapas de alfileres.
25
Estadstica Descriptiva
MEDIA ARITMTICA ( X )
Es la suma de las observaciones o datos entre el nmero de observaciones totales. Es una de
las medidas digna de confianza porque se determina con mayor certeza que otras medidas.
N
x
I 1
VENTAJAS:
DESVENTAJAS:
Puede afectarse por los valores extremos que no son representativos del resto de los valores.
MEDIANA ( Md )
La mediana es el valor nico de un conjunto de datos que mide al elemento central de los datos.
Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si
el conjunto de datos tiene un nmero impar de elementos, el elemento de la mitad del arreglo es la
mediana { (N+1)/2 }. Si hay un nmero par de elementos, la mediana es el promedio de los dos
elementos de la mitad { N/2 }.
VENTAJAS:
Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la
media.
Se puede encontrar la mediana an cuando los datos sean descripciones cualitativas
como el color o la claridad.
26
Estadstica Descriptiva
DESVENTAJAS:
Debido a que la media es un promedio de posicin, se deben de organizar los datos
antes de realizar cualquier tipo de clculo. Esto consume tiempo para un conjunto de
datos muy grande.
MODA ( Mo )
La moda es aquel valor que se repite ms en un conjunto de datos.
VENTAJAS:
Se puede usar como una medida de localizacin central tanto para datos cualitativos
como cuantitativos.
La moda no esta afectada por los valores extremos.
DESVENTAJAS:
Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores
que se repiten ms de una vez.
Otras veces, cada valor es la moda porque cada valor aparece el mismo nmero de
veces.
Cuando el conjunto de datos tiene dos, tres o ms modas, stas son difciles de
interpretar y comparar.
i 1
fi xi
x A
f i di
i 1
A = Media supuesta
(marca de clase del intervalo central)
di = Desviacin en unidades de intervalo
i = Amplitud del intervalo
27
Estadstica Descriptiva
Md L inf
N 1
2
C ant
i
f Md
Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.
d1
Mo L inf
i
d
d
2
1
MEDIDAS DE DISPERSIN:
Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de
dispersin se usan para poder verificar si el promedio es representativo o no de la muestra y como base
de control de la variacin misma.
Una dispersin pequea indica un alto grado de uniformidad. Las medidas de dispersin son:
desviacin estndar, varianza y rango.
VARIANZA:
S2
( xi
x) 2
i 1
S2 =Varianza.
xi = Dato individual o
marca de clase.
x = Media Aritmtica.
N = Total de datos.
Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo,
"dlares al cuadrado" o "dlares cuadrados", no son expresiones intuitivas claras de interpretar. Por esta
razn, debe efectuarse un cambio significativo en la varianza para calcular una medida de desviacin
til, una que no presente problemas con las unidades de medidas y sea menos confusa. Este parmetro
es llamado la DESVIACIN ESTNDAR y es la raz cuadrada de la varianza.
28
Estadstica Descriptiva
f (x X )
S i
i 1
2
X = Media Aritmtica.
N = Total de datos.
f = frecuencia del intervalo.
si
i 1
fi d
f
d
i i
i 1
N
N
2
i
S = Desviacin Estndar.
xi = Dato individual.
di = Desviacin en unidades
de intervalo.
N = Total de datos.
f = frecuencia del intervalo.
i = Amplitud de la clase.
Bibliografa.
Anderson, D. (2007) Estadstica para Administracin y Economa. Mxico: Pearson
Berenson, M., Levine, D. (1996) Estadstica Bsica en Administracin, Conceptos y Aplicaciones. (6aEd.). Mxico :Prentice Hall Hispanoamericana
Hildebrand, D. (1998). Estadstica Aplicada a la Administracin. Mxico: Pearson
Levin, R. I., (2004). Estadstica para Administracin y Economa. Mxico: Pearson
Levine, D., Krehbiel, T., Berenson, M. (2006). Estadstica para Administracin. (4ta. Ed.). Mxico.:Printece Hall
Webster, A. (2005). Estadstica Aplicada a los Negocios y la Economa. (3ra Ed. ). Mxico: Prentice Hall.
Stephen, P. Shao (1970) Estadstica para economistas y administradores de empresas. (6aEd.). Mxico: Trillas
29