Professional Documents
Culture Documents
Concepto de Estadstica
Sistema o mtodo encargado de suministrar diferentes tcnicas y procedimientos que permitan: Recolectar Organizar Elaborar Analizar e interpretar datos
Para la toma ms eficiente de decisiones
El Mtodo Estadstico
Es un mtodo de investigacin terica cuyo fundamento lo constituye la aplicacin y desarrollo de la teora de probabilidades
Etapas del mtodo estadstico: 1. Planificacin. Planificacin. 2. Recoleccin de informacin. informacin. 3. Crtica y codificacin. 4. Procesamiento de los datos recogidos. 5. Anlisis e interpretacin de los resultados.
Divisiones de la Estadstica
La Estadstica Descriptiva es el mtodo de recolectar, organizar, resumir y presentar los datos de manera informativa sin llegar a generalizar. generalizar.
La Inferencia estadstica persigue la obtencin de conclusiones sobre un gran nmero de datos (Poblacin) Poblacin) basndose en la observacin de una muestra obtenida a partir de esta poblacin; tambin intenta medir su poblacin; significacin, es decir la confianza que nos merecen
Trminos de inters
Poblacin: Total de elementos o medidas que cumplen con una caracterstica en comn. Muestra: Subconjunto de la poblacin. Marco muestral: lista, mapa que contiene todas las unidades perfectamente identificadas y actualizadas de la cual se toma la muestra. Unidad de Muestreo: Elementos bajo estudio, de interes. Unidad de observacin: Unidades que cumplen con la caracterstica de inters.
Trminos de inters
Variable: cada uno de los rasgos o caracterstica de los elementos de una poblacin y que varan de un individuo u objeto a otro (Salario, Sexo,) . Dato: Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo
Tipos de Variables
Variables cualitativas (o categricas): aquellas que no aparecen en forma numrica, sino como categoras o atributos (sexo, profesin,). Los valores que puede asumir no constituyen un espacio mtrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, no son significativas
ESCALAS DE MEDIDA
Nominal: hace referencia a datos que slo pueden clasificarse en categoras; existen slo conteos; no existe orden particular para los grupos. Ejemplo: gnero, tipos de tratamientos, instrumentos para realizar tomas de agua. Ordinal: corresponde a aquellos datos que se pueden agrupar en categoras y ordenarlas segn algn tipo de gradacin. Ejemplo: Estrato socioeconmico, escolaridad.
Tipos de Variables
Variables cuantitativas: las que pueden expresarse numricamente (temperatura, salario, precipitacin). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados. Variables cuantitativas segn el tipo de valores que pueda tomar pueden ser discretas o continuas.
ESCALAS DE MEDIDA
de Intervalo: incluye todas las caractersticas de la escala ordinal, pero adems la distancia entre valores es constante pues los valores que toma este tipo de variables corresponde al orden de los nmeros naturales. Cero relativo Ejemplo: Temperatura, escalas psicotcnicas (Coef. Intelectuales).
Tipos de Variables
ESCALAS DE MEDIDA
de Razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pudindose aplicarles todo tipo de instrumental matemtico. Ejemplo: Gravedad, kW, precipitacin, peso, salario.
De acuerdo al tipo y Escala de Medida se podr hacer uso de las Herramientas Estadsticas
Taller 1. Se piensa realizar un estudio para determinar la tasa de consumo de bebidas de los Caleos. Para llevar a cabo este estudio desde el punto de vista Estadstico, que aclaraciones o consideraciones hara para su desarrollo. - Mtodo Estadstico - Definicin de poblacin objetivo. - Unidad de Observacin. - Unidad de Muestreo. - Variables a Indagar.
Distribucin de Frecuencias
Una distribucin de frecuencias es una herramienta estadstica muy til para organizar un grupo de observaciones. Es una serie de datos agrupados en intervalos, en los cuales se muestra el nmero de observaciones que contiene cada intervalo.
Distribucin de Frecuencias
Intervalo de Clase M.C. xi Frecuencia Absoluta ni Frecuencia Relativa hi Frecuencia Acumulada Absoluta Ni Relativa Hi Densidad hi*
Intervalo de Clase (IC). Rangos en se divide la serie de datos para agrupar los datos. Marca de clase (xi). Valor central del intervalo de clase. Frecuencia Absoluta (ni). Nmero de valores datos que se encuentran en el IC.
Distribucin de Frecuencias
Intervalo de Clase M.C. xi Frecuencia Absoluta ni Frecuencia Relativa hi Frecuencia Acumulada Absoluta Ni Relativa Hi Densidad hi*
% de datos que se
m
n
i !1 m i !1
Densidad (hi*).
hi*
hi ! C
C: Ancho del IC
Distribucin de Frecuencias
Ejemplo.
Los datos representan el tiempo de atencin (en minutos) de los pacientes en la recepcin del servicio de urgencias de un hospital.
13.1 7.1 14.8 19.0 10.2 18.0 19.8 15.0 17.4 10.8 22.3 14.5 17.1 14.9 12.0 14.0 18.4 10.2 15.8 16.5 15.0 17.6 4.2 13.4 21.2 14.7 13.8 21.0 14.3 11.1 18.9 8.3 16.6 11.2 20.2 14.4 13.5 18.2 12.4 17.0 26.7 15.5 22.0 12.9 17.9 7.4 18.0 19.8 16.0 21.2
Nmero de Intervalos. Es arbitrario, entre 5 y 20. Muy pocos no revelaran ningn detalle sobre lo datos, y demasiados seria tan confuso como los mismos datos.
m! n o m ! 1 1.33 ln n
Distribucin de Frecuencias
Ejemplo. Ancho de los intervalos.
Marca de clase.
x' i ! Linf Lsup 2
Distribucin de Frecuencias
Ejemplo.
M.C. Intervalos de Clase x'i (4,2 - 7,5] (7,5 - 10,8] (10,8 - 14,1] (14,1 - 17,4] (17,4 - 20,7] (20,7 - 24] (24 - 27,3] 5,85 9,15 12,45 15,75 19,05 22,35 25,65 Absoluta ni 3 4 10 16 11 5 1 50 Relativa hi 0,06 0,08 0,2 0,32 0,22 0,1 0,02 1 Absoluta Ni 3 7 17 33 44 49 50 Relativa Hi 0,06 0,14 0,34 0,66 0,88 0,98 1 0,0182 0,0242 0,0606 0,0970 0,0667 0,0303 0,0061 Frecuencia Frecuencia Acumulada Densidad
Al agrupar los datos se produce perdida de informacin pero se gana generalidad. No deben existir intervalos vacos. Procurar IC de la misma longitud, facilita el anlisis. Comparaciones directas.
Histograma - Ojiva
Distribucin del tiempo de espera en el servicio de urgencias
35% 30% 25% 20% 15% 10% 5% 6% 0%
(4,2 - 7,5] (7,5 - 10,8] (10,8 - 14,1] (14,1 - 17,4] (17,4 - 20,7] (20,7 - 24] (24 - 27,3]
120% 100% 100% 80% 66% 60% 40% 34% 20% 14% 0%
98% 88%
Grafica que consiste en una serie de Rectngulos, cuya base son los Intervalos de Clase y su altura su frecuencia relativa.
Ejercicio.
Qu % de los pacientes tienen un tiempo de atencin entre los 10.3 min y los 15.4 min?
A 0.08 7.5 10.8 10.3 + 0.20 + 0.20 14.1 15.4 B 0.32 17.4
0.3382
El 34% aproximadamente de los pacientes son atendidos entre 10.3min y los 15.4min
* i
* i
CUARTILES DECILES - PERCENTILES Cuartiles. Es una medida de posicin conformada por 3 valores, los cuales dividen la distribucin en 4 partes iguales, cada una con el 25%. Q1 = El 25% de los datos es menor que Q1 Q2 = El 50% de los datos es menor que Q2 Q3 = El 75% de los datos es menor que Q3
25%
X min
25% Q1 Q2
25% Q3
25%
X max
Q2 ! Linf
Una medida de tendencia central ubica e identifica el punto alrededor del cual se centran los datos Existen tres mtodos comunes para identificar el centro de un conjunto de datos: la Media la Mediana y la Moda Media,
La Media
n
X 1 X 2 ... X n X! ! n
X
i !1
X !
Propiedades
i !1
' hi xi
x x
! 0
i i !1
La media es como en punto central de una bscula. Punto de Equilibrio. Centro de Gravedad
ax
y!
i !1
x
!a
i !1
! ax
z ax by
ax by
z! n ! n ! n n
! ax b y
x 1 , x 2 ,..., x k
X !
n 1 x 1 n 2 x 2 ... n k x k n
ni x i n
La Mediana
Es el valor que supera no ms de la mitad de los datos y es superado por no ms de la mitad de los datos. Es el segundo cuartil Para datos no agrupados
Me ! X n1 si n es impar
2
Xn Xn Me !
2 2
1
si n es par
Ejercicio
2 , 4 , 5, 6, 8 Calcule la Media y la mediana Media =5, Mediana =5
2 , 4 , 5, 6, 80
2 , 4 , 5, 6, 8,10
La Moda
Es el dato que ms se repite 1, 4, 3, 1, 5, 1, 3, 1, 3, 7 Lo moda Mo = 1
Mo ! Linf
El Intervalo de clase donde se ubica la Moda es aquel donde la concentracin de datos sea mayor.
Indicadores de Dispersin
El nivel de representatividad de los indicadores de tendencia central dependen del grado de Homogeneidad o Heterogeneidad de los Datos de la muestra.
A
2 , 98 , 3 , 97
B
49 , 51, 48 , 52
X ! 50
Desviacin media
n
DM !
i !1 n
xi Me n
Datos no agrupados
DM !
i !1
hi xi' Me
Datos Agrupados
2, 5 , 8, 1, 4
2 4 5 4 8 4 1 4 4 4 5 !2
DM !
i !1
En promedio los datos estn separados 2 unidades de la mediana La DM es un indicador de fcil interpretacin directa, pero su estructura matemtica (valor absoluto) ha hecho difcil su uso en desarrollos inferenciales de la estadstica.
S !
2 i !1
n 2
x x
2 i
Datos no agrupados
n 1
ni x x S ! n 1 i !1
' i
Datos Agrupados
No es fcil su interpretacin directa, sus unidades no coinciden con las de la variable de inters.
S! S
En promedio los datos estn alejados de la media dispersos en S unidades PROMEDIO DE LOS ERRORES CON RESPECTO A LA MEDIA
Ejemplo
n
2, 5 , 8, 1, 4
2 2 2 2 2
S !
2 i !1
2 4
5 4
8 4
1 4
4 4
4
! 7.5
S ! 7.5 ! 2.739
xi2 W2 ! x i !1 n
n
2. La varianza es siempre no negativa. 3. La varianza de una constante es igual a cero. 4. Si una muestra x1, x2, ,xk que tiene varianza Sx2 y cada dato se multiplica por una constante K, la varianza queda multiplicada por K2.
2 2 yi ! kxi S y ! k 2 S x
Principio de Tchebycheff:
Para cualquier muestra x1, x2, ,xn, se cumple que si se contruye un ntervalo con centro en la Media y con extremos ubicados a una distancia de k veces la desviacin estndar, en dicho intervalo se encuentra por lo menos
Indicadores de Dispersin
Es decir:
1 hx kS ; x kS u 1 2 k 1 hx 2 S ; x 2 S u 1 2 ! 0.75 2
Un Intervalo a 2 Desviaciones Estndar a cada lado de la media est por lo menos el 75% de los datos.
S C.V ! *100 x
Indicadores de Dispersin
El C.V. permite comparar la variabilidad en distintas poblaciones, tengan o no la misma unidad de medida. < 20 % Homogeneidad > 20 % Heterogeneidad
CV =
No es regla
Taller 2.
Los datos representan el nmero de meses de duracin de 40 bateras de automvil.
22 34 25 33 47 41 16 43 31 38 35 31 34 37 32 45 33 36 44 26 32 38 29 32 39 37 31 33 41 30 30 47 39 19 42 26 37 31 34 35
Cual es la variable de investigacin, diga cual es el tipo y escala de medida Construya la tabla de frecuencias, Histograma, Ojiva y diagrama de Cajas. Calcule las Medidas de Tendencia Central y de variacin e interprete Qu % de las bateras tienen una duracin entre los 27 y los 38 meses? Cunto duran como mnimo el 9% de las bateras con la vida til ms prolongada? Qu sugerencias hara ud, para mejorar la validez y confiabilidad del estudio?
Quizz
Una muestra de 500 Trabajadores tiene un salario promedio de $108.000, si el salario promedio de los hombres es de $120.000 y el de las mujeres de $100.000. Cuntos hombres y mujeres hay?
Tcnicas de Conteo
Mtodos para determinar sin numeracin directa el Nmero de resultados posibles de un experimento, o de un conjunto en particular Anlisis Combinatorio Experimento. Cualquier proceso que genere un conjunto de datos. Puede repetirse n veces. Ejem. Se lanzan 3 monedas al aire, de cuntas maneras diferentes pueden caer las monedas? Se lanzan 7 monedas al aire, de cuntas maneras diferentes pueden caer las monedas? Las tcnicas de conteo permiten contar grandes nmeros sin la numeracin directa
Tcnicas de Conteo
Principio Fundamental del Conteo. Si un evento puede realizarse de n1 maneras diferentes, y un 2do evento puede realizarse de n2 maneras y un 3er de n3 maneras y as sucesivamente, entonces el nmero de maneras en que el experimento puede realizarse en el orden indicado es producto de n1*n2*n3*. Ejem. Supongamos que una placa de automvil consta de 2 letras diferentes seguidas de 3 dgitos de los cuales el 1ro no es cero. Cuntas placas diferentes pueden grabarse? Cuntas placas si la primera letra es una consonante y el ltimo nmero adems es impar ?
Tcnicas de Conteo
Permutaciones. Es una ordenacin de un conjunto de n objetos en un orden dado. Una ordenacin de r objetos de (r <= n) en un orden dado, se llama permutacin de r o permutacin de los n objetos tomados r a la vez
Ejemplo. Consideremos el conjunto de las letras {a,b,c,d}. bdca, dcba, acdb. bad, adb, abd, bca. ad, cb, da, bd. Son permutaciones de las 4 letras tomadas todas a la vez Son permutaciones de las 4 letras tomadas 3 a la vez Son permutaciones de las 4 letras tomadas 2 a la vez
Tcnicas de Conteo
El nmero de permutaciones de n objetos tomados r a la vez se denota por: Pn, r
! n Pr
Hallar el nmero de permutaciones de 6 objetos (a,b,c,d,e,f) tomados 3 a la vez. 6 * 5 * 4 = 120 palabras
6 3=
n! @ n Pr ! nn 1 n 2 n 3 n r 1 ! ... n r !
Tcnicas de Conteo
Permutaciones con repeticin. El nmero de permutaciones de n objetos las cuales n1 son iguales, n2 iguales nr iguales es: n!
n1! n2 !n3!...nr !
Ejem. Formar todas las palabras posibles de 5 letras usando la palabra DADDY. Nmero de palabras.
5 P5 ! 5! ! 120
Tcnicas de Conteo
Ejem. Cuntas seales diferentes, cada una con 8 banderas sin marcar colocadas en lnea vertical pueden formarse con un conjunto de 4 banderas rojas, 3 blancas y 1 azul.
8! ! 280 4!3!
Seales diferentes
Tcnicas de Conteo
Pruebas Ordenadas.
Muchos de los problemas de anlisis combinatorio y en particular de probabilidad se relacionan con la escogencia de una bola tomada de una urna que contiene n bolas (personas, objetos, artculos, cartas ) Con Sustitucin. Se escoge una bola y se regresa a la urna antes de tomar la siguiente.
n v n v n v n v ... v n ! nP' r ! n r
n! n Pr ! n r !
Tcnicas de Conteo
Ejem. De cuntas maneras se pueden escoger 3 cartas de una baraja de 52 cartas. Con Sustitucin. Sin Sustitucin.
52 P'3 ! 52 3 ! 140.608
52 P3 !
52! ! 132.600 52 3 !
Combinaciones. Supongamos que tenemos una coleccin de n objetos. Una combinacin es un subconjunto de estos n objetos tomados r a la vez. (r <= n)
n n! C n, r ! nCr ! ! r n r r! !
Tcnicas de Conteo
Ejem. Hallar el nmero de Combinaciones y el nmero de Permutaciones con las letras a,b,c.
Combinacin a,b,c Permutacin (a,b,c,) (a,c,b,) (b,a,c,) (b,c,a,) (c,a,b,) (c,b,a,)
Ejem. Cuntos comits de 3 personas se pueden formar con 8 personas? 8 8! ! ! 56 Se pueden formar 56 3 8 3 3! comits diferentes. ! Ejem. De cuntas maneras puede escogerse un comit compuesto por 3 hombres y 2 mujeres de un grupo de 7 hombres y 5 mujeres? Se pueden formar 350 7 5 7! 5! ! 3 2 7 3 3! v 5 2 2! ! 35 v 10 ! 350 comits diferentes. ! !
Tcnicas de Conteo
Problema. Una delegacin de 4 Estudiantes se selecciona todos los aos para asistir a la asamblea. Hay 12 Estudiantes elegibles. De cuantas maneras puede escogerse la delegacin?
12 12! ! 4 4 4! ! 495 ! 12
De cuantas maneras si dos estudiantes elegibles no asisten al tiempo? Ninguno de los dos asiste Asiste A pero no B Asiste B pero no A
10 10! ! 4 4
4! ! 210 ! 10
10 10! ! 2v ! 240 10 ! 3 3
3! Se pueden escoger 450 delegaciones diferentes.
Tcnicas de Conteo
Otra forma. A y B van juntos
10 10! ! 2 2 2! ! 45 ! 10
No puede suceder
495 45 = 450 Delegaciones diferentes donde a y b no asisten al tiempo De cuantas maneras si dos estudiantes elegibles estn casados y asisten solo si van juntos? No van
Van juntos
Tcnicas de Conteo
Problema. Un estudiante tiene que contestar 8 de 10 preguntas. Cuntas maneras de escoger tiene?
10 10! Pueden escoger de 45 ! ! 45 8 8
8! maneras. ! 10 Cuntas maneras si las 3 primeras son obligatorias? 7 7! Pueden escoger de 21 ! ! 21 5 7 5
5! maneras. !
Cuntas maneras si tiene que escoger 4 de las 5 primeras? Escoge las 5 primeras Escoge las 4 de las 5 primeras
5 5 * ! 10 5 3 5 5 * ! 25 4 4
Probabilidad
Es el estudio de experimentos aleatorios o de libre determinacin. Concepto Frecuentista. Supongamos que se realiza un Frecuentista. experimento, donde S es el nmero de aciertos y n el nmero de veces que se repite el experimento. experimento. Supongamos que se lanza un dado. dado. S: Nmero de acierto (obtener 6) n: Nmero de lanzamientos. lanzamientos. La relacin f(s): s/n, frecuencia relativa tiende a estabilizarse f(s): cuando n se hace grande, es decir se aproxima al lmite. lmite. Esta es la base de la Probabilidad
Probabilidad
Concepto Clsico. Histricamente (Laplace) la probabilidad Clsico. comenz con el estudio de los juegos de azar, de ah: ah:
s p : PA : n
Espacios Equiprobables Concepto Subjetivo. Se basa en la idea de que la probabilidad que Subjetivo. una persona da a un suceso debe depender de su juicio y experiencia personal, pudiendo dar dos personas distintas probabilidades diferentes a un mismo suceso En teoria de Probabilidad, se define un modelo matemtico de los fenmenos, asignando un valor probabilidad a cada uno de los eventos asociados con el experimento
Probabilidad
Espacio Muestral ;. Es el conjunto ; de todos los resultados posibles de un experimento. experimento. Evento. Evento. Un evento A, es un conjunto de resultados que pertenecen a ;. Es decir que A ;. (A subconjunto de ;) Eventos Simples. Cuando el evento A consta de un Simples. solo resultado del experimento. experimento. Observar 6 al lanzar un dado Eventos Compuestos. Cuando el evento A consta de Compuestos. ms de un resultado del experimento. experimento. Observar nmero impar
Probabilidad
Como los eventos se definen como subconjuntos de ;, es posible realizar operaciones entre conjuntos, es decir, entre eventos del experimento. experimento. Sean A y B, eventos de un Espacio Muestral ;
Unin
Interseccin
Probabilidad
Diferencia
El suceso
Dos sucesos A y B, se llaman mutuamente exclusivos o excluyentes cuando no tienen ningn elemento comn. Es decir, cuando = (A y B son disjuntos)
Probabilidad
Las operaciones unin, interseccin y complemento verifican las propiedades
Unin 1. Conmutativa 2. Asociativa 3. Idempotente 4. Simplificacin 5. Distributiva 6. Elemento neutro 7. Absorcin Interseccin
A las familias de conjuntos que verifican las propiedades anteriores se les denomina lgebras de Boole.
Probabilidad
En el lgebra de Boole anterior se verifican las siguientes propiedades, conocidas como leyes de Morgan:
El suceso contrario de la unin de dos Eventos es la interseccin de sus Eventos contrarios El suceso contrario de la interseccin de dos Eventos es la unin de sus Eventos contrarios
Probabilidad
Definicin formal de Probabilidad. Los anteriores conceptos de lo que debera ser la probabilidad de un suceso, llevaron a Kolmogorov a dar una definicin axiomtica de probabilidad. Es decir, a introducir rigor matemtico en el concepto de probabilidad, de forma que se pudiera desarrollar una teora slida sobre el concepto definido Axiomas de Probabilidad. Sea ; un espacio muestral, sea ) la clase de eventos, y se a P una funcin de valores reales definida en ). Entonces P se llama Funcin de Probabilidad y P(A) es llamada la probabilidad del evento a si se cumple:
1. P : A p ? ,1A 0 2. P ; ! 1 3. PA ! 1 PA
Probabilidad
Axiomas de Probabilidad. 4. Si A y b son Mutuamente Excluyentes, entonces
PA B
! PA
PB
5. Si A1, A2, A3, es una serie de eventos mutuamente exclusivos, entonces
PA1 A2 A3 ...
! PA1
PA2
P A3
...
6. Si A y B son dos eventos.
PA B
! PA
P B
PA B
7. Si A, B y C son eventos.
PA B C
! PA
PB
PC
PA B
PA C
PB C
PA B C