Professional Documents
Culture Documents
CARRERA:
INGENIERA EN ADMINISTRACIN
MATERIA:
ESTADISTICA I
ALUMNA:
CAHUICH NOH SHEYLA AURORA
MAESTRO:
RAMON AGUSTIN BOCOS PATRON
GRADO:
3 SEMESTRE
GRUPO:
VD3
FECHA DE ENTREGA:
2 DE SEPTIEMBRE 2015
2
NDICE
qu es la estadstica moderna?................................................ 4
por qu estudiar estadstica?................................................... 5
partes en que se divide la estadstica moderna para su estudio .. 6
el mtodo cientfico en la estadstica ......................................... 6
mtodos para la obtencin de datos, principio "bebs". ............... 7
cmo recolectar datos? ........................................................... 7
tipos de datos estadsticos ........................................................ 8
propiedades que describen una serie numrica de datos ............ 9
medidas de tendencia central para cantid. pequeas ................ 11
comparacin entre la media, mediana y moda .......................... 15
medidas de dispersin para cantidades pequeas de datos ...... 16
el manejo de grandes cantidades de datos ............................... 19
medidas de tendencia central para datos agrupados ................ 20
medidas de posicin ............................................................... 24
medidas de dispersin para datos agrupados .......................... 27
histograma, polgono de frecuencia y ojivas ............................. 29
importancia de la forma de los datos ....................................... 32
CARACTERISTICAS DE UN ENSAYO
Aunque sea difcil describir todas las caractersticas de un ensayo por ser un
gnero literario esencialmente libre, podemos resumir sus principales caracteres
en la siguiente lista:
- Libertad temtica
Una segunda razn para tomar un curso de estadstica es que las tcnicas
estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria, que
afectan nuestro bienestar personal.
Los mtodos estadsticos utilizan el mtodo cientfico, que consiste en cinco pasos
bsicos:
1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de
7
un estudio o un anlisis.
2. Formular un plan para recopilar los datos necesarios.
3. Reunir los datos.
4. Analizar e interpretar los mismos.
5. Anotar las conclusiones y otros descubrimientos, de manera que sean
fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones.
Calificaciones de exmenes.
Cantidad de caf por taza despachada por una mquina vendedora.
Resistencia a la rotura de fibras de plstico.
Porcentaje de azcar en cereales, etc.
Una variante reciente de GIGO lo traduce como (Entra Basura, basura Sale). Esto
describe la tendencia de la gente de aceptar el rendimiento de un sistema sin
juzgarlo crticamente. Aun si la entrada es basura, creemos en el resultado,
normalmente porque no entendemos bien cmo funciona el sistema para
producirlo. Esto se llama a veces la fe ciega. Si entra basura en el proceso de
riesgo puede haber una falta de objetivos convenidos, identificacin de riesgo
inadecuada o perezosa, o el uso de respuestas al riesgo poco apropiadas.
Tanto los datos nominales como los jerarquizados, que por su naturaleza no son
numricas, se convierten en "datos discretos".
Existe otro tipo de datos que por su naturaleza especial pueden ser clasificados
segn tu conveniencia, estos son los cronolgicos, por ejemplo los aos de la
historia 2005,2006, 2007 puedes usarlos como discretos (aos enteros), continuos
(aos con subdivisiones en decimales de ao), nominales (por el nombre) o
jerarquizados (ordenados), depende del uso que se le van a dar.
Variable contina
Datos continuos
Mediciones de la Variacin
La variacin es la cantidad de dispersin o propagacin en los datos.
El rango: es la diferencia entre la mayor y la menor observacin en una serie de
datos. El rango mide la propagacin total en la serie de datos. La debilidad del
rango es que no logra tomar en cuenta la forma en que los datos se distribuyen
realmente entre el mayor y el menor valor. Sera impropio usar el rango como una
medicin cuando uno de o ambos componentes son observaciones extremas.
El rango inter-cuartil: es la diferencia entre el tercer y primer cuartil. No se ve
influida por valores extremos.
La varianza y la desviacin estndar: a diferencia de las mediciones anteriores la
varianza y la desviacin estndar toman en cuenta como se distribuyen las
observaciones. La Varianza de muestra es el promedio de las diferencias
cuadradas entre cada una de las observaciones de una serie de datos y la media.
La desviacin estndar es simplemente la raz cuadrada de la varianza. La
varianza y la desviacin miden la dispersin promedio alrededor de la media, es
decir, como las observaciones mayores fluctan por encima de sta y como las
observaciones menores se distribuyen por debajo de sta.
El Coeficiente de Variacin: es una medida relativa de variacin. Se expresa como
porcentaje antes que en trminos de las unidades de los datos particulares. Mide
la dispersin en los datos relativa a la media.
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numricos a fin de describir los datos
cuantitativos que los forman.
Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los
estudiantes de la universidad o el peso promedio de las bolsas de cereal que son
llenadas por una determinada mquina en un proceso de produccin o las ventas
de un negocio.
Las medidas de tendencia central son tambin frecuentemente usadas para
comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido
por un grupo de vendedores de una zona comparado con el promedio de ventas
otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de
una sucursal, comparado con el promedio de reclamos de otra sucursal.
Otras caractersticas generales de las medidas de tendencia central son las
siguientes:
Permiten apreciar qu tanto se parecen lo grupos entre s.
Son valores que se calculan para un grupo de datos y que se utiliza para
describirlos de alguna manera.
Se utiliza la letra X con una barra horizontal sobre el smbolo para representar la
media de una muestra ( ), mientras que la letra (mu) se usa para la media
aritmtica de una poblacin, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable y luego dividido por n: 13
donde n es el nmero de sumandos, o en el caso de estadstica el nmero de
datos se da el resultado.
Media ponderada
Mediana
Aqu dos valores que estn por debajo del y otros dos que quedan
por
Dnde:
= -inferior de la clase modal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta pre-
modal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta
post-modal.
= Amplitud del intervalo modal
Las medidas de dispersin, variabilidad o variacin nos indican si esos datos estn
prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se
encuentran los datos. Estas medidas de dispersin nos permiten apreciar la
distancia que existe entre los datos a un cierto valor central e identificar la
concentracin de los mismos en un cierto sector de la distribucin, es decir,
permiten estimar cun dispersas estn dos o ms distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmtica el dato central ms utilizado. Cuando
existe una dispersin pequea se dice que los datos estn dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersin sea grande el
valor central no es muy confiable. Cuando una distribucin de datos tiene poca
dispersin toma el nombre de distribucin homognea y si su dispersin es alta se
llama heterognea.
Rango
Es un intervalo entre el acceso autorizado y el valor mnimo; por ello, 17
comparte unidades con lo obtener una idea de la dispersin de los datos, cuanto
mayor es los rangos, ms dispersos estn los datos de un grupo Por ejemplo, para
una serie de datos de carcter cuantitativo, como lo es la estatura medida en
centmetro tendramos:
Nio nota
1 6,0 Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1
Calificaciones 1 2 3 4 5 6 7 8 9
Nmero de alumnos 2 2 4 5 8 9 3 4 2
MEDIDAS DE POSICIN
Son indicadores usados para sealar que porcentaje de datos dentro de una
distribucin de frecuencias superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo
que tambin se les llama " Medidas de Tendencia Central.
Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir
determinadas condiciones para que lean verdaderamente representativas de la
variable a la que resumen. Toda sntesis de una distribucin se considerara como
operativa si intervienen en su determinacin todos y cada uno de los valores de la
distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre
calculable y de fcil obtencin. A continuacin se describen las medidas de
25
posicin ms comunes utilizadas en estadstica, como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales:
primero, segundo y tercer cuartil.
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno
decil).
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales:
(primero al noventa y nueve percentil).
Dnde:
Dnde:
FORMULARIO
RANGO
VARIANZA
DESVIACIN ESTNDAR
OJIVAS
La representacin grfica de un cuadro de frecuencia acumulada son curvas
30
llamadas ojivas. En la grfica de ojiva, el ltimo intervalo no se une con el eje
horizontal.
La ojiva apropiada para informacin que presente frecuencias mayores que el dato
que se est comparando tendr una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendr una pendiente
positiva. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se
obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y
de igual manera que stas, existen las ojivas mayores que y las ojivas menores
que.
POLGONO DE FRECUENCIA
31
TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora
de los datos est en la parte izquierda de la media. Este tipo de distribucin
presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de
los datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se
dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando
el valor de la media aritmtica es menor que la mediana y ste valor de la mediana
a su vez es menor que la moda, en smbolos
MEDIDAS DE ASIMETRA
Dnde:
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con
relacin a la distribucin normal, es decir, mide cun puntiaguda es una
distribucin.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la
regin central de la distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.
MEDIDAS DE CURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:
Los datos cualitativos pueden ser difciles de ilustrar. El mejor mtodo para
presentar los datos, cualitativos o cuantitativos, es a travs del uso de grficas.
Muchos mtodos de grficas pueden ilustrar los datos cualitativos y cuantitativos.
Una representacin visual de los datos reunidos te puede ayudar a describir
rpidamente que el dato se est ilustrando sin tener que entrar en una explicacin
profunda, que tal vez no sea fcilmente entendida sin las grficas de todas formas.
Una grfica es una forma rpida y eficiente de captar la atencin y describir
una idea sin utilizar mucho tiempo o muchas palabras.
GRFICAS ESTADSTICAS
Las grficas estadsticas nos permiten familiarizarnos con los datos que se
han recopilado y resumido. Se considera como una tcnica inicial de ANLISIS
EXPLORATORIO DE DATOS que produce una representacin visual. Las
grficas resultantes revelan un patrn de comportamiento de la variable en
estudio. Se ofrecen muchos tipos de grficos para describir el conjunto de datos.
Dependiendo del tipo de datos y lo que se quiera representar, se har uso del
mtodo grfico ms adecuado.
GRAFICA DE BARRAS
33
EURO 33 33
33
UEN 27 36
Otros 66 29
GRAFICA DE PASTEL
Una grfica circular, tambin llamada grfico de pastel, grfico de torta o grfica
de 360 grados, es un recurso estadstico que se utiliza para
representar porcentajes y proporciones. El nmero de elementos comparados
dentro de un grfico circular puede ser de ms de 4.
Al igual que en la grfica de barras, el empleo de tonalidades o colores facilita la
diferenciacin de los porcentajes o proporciones. A diferencia de otros tipos de
grficos, el circular no tiene ejes x o y.
Se utilizan en aquellos casos donde interesa no slo mostrar el nmero de veces
que se da una caracterstica o atributo de manera tabular sino ms bien de
manera grfica, de tal manera que se pueda visualizar mejor la proporcin en que
aparece esa caracterstica respecto del total.
A pesar de su popularidad, se trata de un tipo de grfico poco recomendable
37
debido a que nuestra capacidad perceptual para estimar relaciones de proporcin
o diferencias entre reas de sectores circulares es mucho menor que, por ejemplo,
entre longitudes o posiciones, tal y como sucede en otras grficas.
DIAGRAMA CIRCULAR