GUÍA PROBABILIDIAD Y ESTADÍSTICAok

UNIVERSIDAD AUTNOMA DE QUERTARO FACULTAD DE INGENIERA
PROBABILIDAD Y ESTADSTICA
GUA DEL MAESTRO
Que para obtener el ttulo de Ingeniero Civil
PRESENTA: Israel Luna Vaca
Asesor: M. en I. Pablo Talamantes Contreras
Fecha: Mircoles 11 de mayo del 2011.
Llegar el da en el que el pensamiento estadstico ser una condicin tan necesaria para la convivencia eficiente como la capacidad de leer y escribir H.G. Wells
Agradecimientos. El autor ha intentado escribir esta gua de modo que suscite el inters del instructor de la materia. En ninguna manera pretendo sustituir la libertad de ctedra la consulta externa de textos sobre probabilidad y estadstica. La intensin es permitir al profesor tener a la mano los temas que involucra el programa de dicha materia. Muchas personas participaron directa o indirectamente en el desarrollo de este trabajo, y deseo expresarles mi agradecimiento por sus comentarios y sugerencias que mucho he apreciado. Especficamente, quiero dar las gracias a las siguientes personas por su contribucin: 3
M. en I. Pablo Talamantes Contreras, catedrtico de la FI-UAQ.
M en C. Crisgono de Santiago Guerrero, catedrtico de la FI-UAQ.
Dra. Teresa Flores Guzmn, catedrtica de la FI-UAQ.
M.Q.Hernndez Garciadiego Cecilia, catedrtica de la FI-UAQ.
NDICE RECOMENDACIONES PARA EL PROFESOR8 COMPETENCIAS ACADMICAS...8 LINEAMIENTOS SUGERIDOS....9
4 UNIDAD I. INTRODUCCIN. 1.1 Definicin...18 1.2 Pasos para realizar un estudio estadstico......18 1.3 Mtodo cientfico y estadstica.......20 1.4 Poblacin y muestra.....21 1.5 Variables, tipos de Variables......21 1.6 Tablas de frecuencia24 1.7Grficos......28
UNIDAD 2. ESTADSTICA DESCRIPTIVA. 2.1 Definicin y parmetros estadsticos..32 2.2 Medidas de tendencia central..33 2.3Medidas de dispersin...40 2.4Medidas de posicin...44 2.5Asimetra y apuntamiento.............46
UNIDAD 3. REGRESIN Y CORRELACIN 3.1 Diagramas de dispersin.54 3.2 Covarianza.56 3.3 Correlacin.57 3.4 Regresin lineal simple61 5
UNIDAD 4. FUNDAMENTOS DE PROBABILIDAD 4.1 Conjuntos y su lgebra66 4.2 Experimentos aleatorios, espacios muestrales y eventos.71 4.3 Teora fundamental del conteo..75 4.4 Permutaciones y combinaciones...76 4.5 Probabilidad..79 4.6 Probabilidad condicional.85 4.7 Independencia de eventos............87 4.8 Probabilidad total.88 4.9 Teorema de Bayes...91
UNIDAD 5. VARIABLES ALEATORIAS. 5.1 Variables aleatorias discretas..99 5.2 Variables aleatorias continuas103 5.3 Medidas de tendencia central de una variable aleatoria 105
5.4 Medidas de dispersin de una variable aleatoria. ..109 5.5 Medidas de posicin de una variable aleatoria....110 5.6 Medidas de apuntamiento de una variable aleatoria. .......112
UNIDAD 6. MODELOS PROBABILSTICOS BSICOS. 6.1 Distribuciones discretas115 Bernoulli. Binomial. Poisson. Hipergeomtrica. 6.2 Distribuciones continuas..131 Normal. Chi-Cuadrada. T de student. Distribucin F. UNIDAD 7. INTRODUCCIN A LA INFERENCIA ESTADSTICA. 7.1 Propiedades de un estimador....155 7.2 Teorema central del lmite..162 7.3 Intervalos de confianza....167 7.4 Muestreo.176 7.5 Tamao de la muestra.187 6
UNIDAD 8. PRUEBAS DE HIPTESIS. 8.1 Ideas bsicas en una prueba de hiptesis..192 8.2 Clasificacin de hiptesis..196 8.3 Regin crtica y nivel de significancia..197 8.4 Tipos de error..198 7 8.5 Pruebas de hiptesis para muestras de la distribucin normal..201 GLOSARIO DE TRMINOS.206 Apndice A..211 reas bajo la curva normal estndar de 0 a Z. Apndice B..212 Valores percentiles t de Student con para la distribucin grados de libertad.
Apndice C..213 Valores percentiles de Chi cuadrado con para la distribucin
grados de libertad.
Apndice D..214 Ordenadas y de la curva normal estndar. NDICE DE TABLAS...215 NDICE DE ESQUEMAS....216 BIBLIOGRAFA....221
RECOMENDACIONES PARA EL PROFESOR. La presente gua constituye un apoyo para el docente, ya que en sta se presentan los contenidos mnimos para desarrollar en el curso de Probabilidad y Estadstica establecido en la UAQ. Utilizar la gua para tener un panorama general a la hora de planear el curso. 8 Utilizar la gua como apoyo de las actividades a realizar en clase. Consultar la gua para fijar un sistema de evaluacin que vaya acorde con las necesidades del profesor. Realizar algunas de las actividades sugeridas para los docentes y alumnos que vayan acordes con las necesidades del profesor.
COMPETENCIAS ACADMICAS Comprender el rol de la Probabilidad y la Estadstica en la resolucin de problemas de ingeniera. Utilizar el Mtodo cientfico, para poder aplicar el mtodo estadstico a cualquier fenmeno natural o social que se presente. Utilizar las herramientas que proporciona la Probabilidad y la Estadstica para discernir con mayor eficacia cualquier fenmeno de tipo natural o social. Tener conocimiento de la importancia de la recoleccin de datos para el buen desarrollo de la Estadstica. Utilizar de manera adecuada la representacin grfica de un fenmeno natural o social de acuerdo a la recoleccin de datos. Comprender y discernir la veracidad de la informacin que recibe de los diferentes medios informativos sobre un fenmeno social o natural.
Comprender la interaccin de la Probabilidad y la Estadstica y otras ciencias en la comprensin y anlisis de fenmenos naturales y sociales.
SUGERENCIAS Revisar los conocimientos previos al iniciar un nuevo tema. Realizar actividades con la finalidad de incentivar al alumno e inducirlo al tema. Analizar y discutir el tema mediante tcnicas grupales. Realizar prcticas de laboratorio mediante cualquier software estadstico tal como Excel, MINITAB, SPSS, que permitan al alumno un aprendizaje significativo. Incorporar en clase el uso de programas estadsticos presentes en toda calculadora cientfica. 9
LINEAMIENTOS SUGERIDOS. UNIDAD I: INTRODUCCIN Para el profesor: Establecer con la participacin del grupo, la manera como trabajar durante el curso, sealando con claridad qu se espera de los alumnos, del profesor y de la asignatura, as como dejando el claro los criterios de evaluacin; para que sean congruentes con los objetivos de la asignatura. Identificar los conocimientos previos de los estudiantes mediante algunas tcnicas didcticas conocidas. Presentar ciertas problemticas que involucren el uso de la estadstica en la ingeniera a travs de fenmenos sociales y/o naturales.
Para el alumno: Presentar por medio de ideas cmo se desea trabajar durante el curso y cmo se puede lograr una mejor participacin en el curso, y cmo espera ser evaluado al final del curso. Participar de manera colaborativa con sus compaeros para que se logre en el grupo mejores resultados. Identificar los diferentes usos de la Estadstica. Realizar actividades ejercicios sugeridos en la gua o por el profesor. Disear una encuesta o cuestionario. 10
Distribucin de frecuencias. Para el profesor: Guiar al alumno para que construya los diferentes tipos de mtodos tabulares que existen en la Estadstica. Resolver ejercicios que conlleven a los diferentes mtodos tabulares. Proponer una serie de ejercicios para ser resueltos en clase y extraclase. Proponer que el alumno mediante el programa Excel presente los datos recolectados mediante los diferentes mtodos tabulares vistos en clase. Para el alumno: Investigar los diferentes Estadstica. Diferenciar las ventajas y desventajas que tiene cada mtodo tabular y sealar las caractersticas de cada uno. mtodos tabulares que existen en la
Realizar las actividades sugeridas por el docente. Realizar en equipo las graficas en Excel de los datos que recolect en la encuesta y presentarlos mediante una tabla.
Representacin grfica Para el profesor: Guiar al alumno para que construya los diferentes tipos de grficas que existen en la Estadstica. Resolver ejercicios que conlleven a los diferentes mtodos grficos. Proponer una serie de ejercicios para ser resueltos en clase y extraclase. Proponer que el alumno grafique los datos que ya tabul en la encuesta propuesta con anterioridad. Proponer que el alumno mediante el programa Excel presente los datos recolectados mediante los diferentes mtodos tabulares vistos en clase. Para el alumno: Investigar los diferentes mtodos grficos que existen en la Estadstica. Diferenciar las ventajas y desventajas que tiene cada grfica y sealar las caractersticas de cada una. Realizar las actividades sugeridas por el docente. Realizar en equipo las grficas en Excel de los datos que recolect en la encuesta y presentarlos mediante una grfica. UNIDAD II: ESTADSTICA DESCRIPTIVA. Para el profesor: Explicar qu es una medida de centralizacin y para qu sirve. 11
Definir cada una de las medidas de centralizacin. Diferenciar cada una de las medidas de centralizacin. Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto en clase.
Aplicar las medidas de centralizacin en la encuesta que se propuso en clase.
12
Calcular y reflexionar sobre las posibilidades de su clculo mediante el programa Excel las diferentes medidas de centralizacin vistas en clase.
Para el alumno: Investigar las diferentes medidas de centralizacin que existen en la estadstica. Presentar un resumen de las diferentes medidas de centralizacin. Aportar ideas o bien dudas durante la explicacin al profesor. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Elaborar un formulario que sirva para resolver ejercicios de
Centralizacin.
UNIDAD III: REGRESIN Y CORRELACIN. Para el profesor: Explicar qu es un diagrama de dispersin y para qu sirve. Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto en clase.
Proponer mediante el programa Excel ejercicios donde se identifique la correlacin entre las variables X,Y y se muestre la recta de regresin lineal.
Para el alumno: Con la ayuda de Excel presentar los posibles casos de correlacin usando diagramas de dispersin. 13 Presentar un resumen sobre la covarianza, desarrollar ejemplos en clase. Aportar ideas o bien dudas durante la explicacin al profesor. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Resolver los ejercicios propuestos en la gua.
UNIDAD IV: FUNDAMENTOS DE PROBABILIDAD Parte 1 Conjuntos. Para el profesor: Explicar cmo realizar las operaciones con conjuntos. Explicar la utilizacin de los diagramas de Venn y sus aplicaciones. Organizar equipos para fomentar conclusiones. Propondr ejercicios en clase y extra-clase para retroalimentar lo visto en clase Para el alumno: Investigar todos los conceptos que involucran a la teora de conjuntos. la discusin y anlisis y generar
Elaborar un mapa conceptual de todos los elementos de la teora de conjuntos.
Aportar ideas o bien dudas durante la explicacin al profesor. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Elaborar un formulario que sirva para identificar los diferentes smbolos involucrados en la teora de conjuntos. 14
Parte 2 Probabilidad. Para el profesor: Explicar los diferentes enfoques de la teora de la probabilidad. Desarrollar diversos problemas donde obtendr la probabilidad en base a la definicin. Explicar la relacin que existe entre la probabilidad y la teora de conjuntos. Propondr ejercicios en clase y extra-clase para retroalimentar lo visto en clase. Explicar la relacin que existe entre la probabilidad y la estadstica.
Para el alumno: Identificar los principales conceptos de la teora de probabilidades y los relacionar con la teora de conjuntos. Elaborar un mapa conceptual relacionando lo antes mencionado. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Resolver los ejercicios propuestos en la gua. Elaborar un formulario que sirva para resolver ejercicios de Probabilidad.
UNIDAD V: VARIABLES ALEATORIAS. Para el profesor: Explicar qu es una variable aleatoria y para qu sirve. Definir y diferenciar entre variable aleatoria discreta y continua. 15 Desarrollar los temas de momentos con respecto a la media y con respecto al origen. Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto en clase. Para el alumno: Presentar un cuadro donde agrupe las principales caractersticas de variable aleatoria y variable continua. Investigar los momentos con respecto a la media y con respecto al origen. Aportar ideas o bien dudas durante la explicacin al profesor. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Resolver los ejercicios propuestos en la gua.
UNIDAD VI: MODELOS PROBABILSTICOS BSICOS Para el profesor: Ensear y describir las condiciones para discriminar un modelo de otro a la hora de resolver un problema de distribucin de probabilidad. Coordinar a los alumnos en la presentacin de los principales modelos probabilsticos por equipos en exposicin ante el grupo.
Para el alumno: Formar equipos y cada uno desarrollar y expondr ante la clase un modelo probabilstico con aplicacin a un problema de ingeniera. Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Resolver los ejercicios propuestos en la gua. 16 UNIDAD VII: INTRODUCCIN A LA INFERENCIA ESTADSTICA. Para el profesor: Explicar los diferentes tipos de muestreo estadstico. Sealar para qu sirve cada uno de los diferentes tipos de muestreo estadstico. Coordinar una sesin de preguntas y respuestas en base a una lectura o artculo periodstico o de revista de divulgacin cientfica que involucre inferencia estadstica. Guiar a una discusin grupal. Formar equipos de trabajo. Guiar y asesorar a los equipos de trabajo para que ellos seleccionen una muestra representativa. Para el alumno: Elaborar de forma individual un cuadro comparativo donde se presenten los mtodos de muestreo, sus caractersticas y condiciones para su uso. Discutir el cuadro comparativo de manera grupal y elaborar una conclusin final. Resolver los ejercicios propuestos por el profesor en clase y extraclase.
Resolver los ejercicios propuestos en la gua.
UNIDAD VIII: PRUEBAS DE HIPTESIS. Para el profesor: 17 Explicar qu es una prueba de hiptesis y para qu sirve. Definir cada una de las medidas de variabilidad. Diferenciar los tipos de hiptesis existentes.
Para el alumno: Utilizar Excel para representar la prueba bilateral (2 colas), unilateral izquierda (cola izquierda) y unilateral derecha (cola derecha). Resolver los ejercicios propuestos por el profesor en clase y extra-clase. Resolver los ejercicios propuestos en la gua. Desarrollar por equipos y presentar en clase una prueba de hiptesis aplicada a un problema de ingeniera segn preferencia del equipo.
UNIDAD 1: INTRODUCCIN. OBJETIVO: Conocer un panorama general de los fundamentos de la estadstica y las representaciones grficas.
1.1 Definicin. Estadstica.- La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms efectiva (Ruiz Muoz, 2004). Para lograr este fin la estadstica se apoya en la teora de probabilidades y es por ello que se tiene una estrecha relacin entre estos dos conceptos. Esta se aplica en la ciencia moderna, administracin y en la vida cotidiana de cualquier persona. El papel fundamental de la estadstica es sin lugar a duda cuantificar la incertidumbre. Definicin 2.- Es un conjunto de tcnicas para la coleccin, manejo, descripcin y anlisis de informacin, de manera que las conclusiones obtenidas de ella tengan un grado de confiabilidad especificado (Irwin Miller, 1993). 18
1.2 Pasos para un estudio estadstico. 1.- Definir el tipo de proyecto a realizar: Experimental.- Manejo de datos, existe manipulacin de datos. Prospectivo.- Planea la investigacin y se ejecuta en un futuro inmediato. Retrospectivo.- Con bastante aplicacin en el mbito de la medicina. Los estudios retrospectivos se realizan basndose en observaciones
clnicas, o a travs de anlisis especiales, estos revisan situaciones de exposicin a factores sospechosos, comparando grupos de
individuos enfermos (casos), con grupos de individuos sanos (controles). A partir de la frecuencia observada en cada uno de los grupos expuestos al factor en estudio se realiza un anlisis estadstico. Longitudinal.- Aquello que se mide a lo largo del tiempo sobre la poblacin que interesa. 19 Transversal.- Parecida a una encuesta, es una poblacin cambiante. Descriptivo.- Una sola poblacin. Comparativo.- Dos o ms poblaciones. Se tienen que visualizar los alcances y limitaciones que se tendrn con la investigacin que se est realizando (plantear la hiptesis). 2.- Cantidad de informacin necesaria. 3.- Forma de recoleccin. 4.- Tcnicas para adquirirla. 5.- Anlisis.
ESQUEMA 1.01 Anlisis descriptivo de los datos.
6.-
Cuantificar
el
grado
de
incertidumbre
mediante
los
principios
probabilsticos.
7.- Validacin de la hiptesis a travs de la inferencia estadstica o estadstica inductiva que permiten llegar a conclusiones correctas.
1.3 Mtodo cientfico y estadstica.
Qu es el mtodo cientfico? Definimos el Mtodo Cientfico como un mtodo o conjunto sistematizado de procesos en los que se basa la ciencia para explicar cualquier fenmeno y las leyes que los administran, las etapas de este son: 1. Formulacin de hiptesis 2. Obtencin de datos pertinentes al problema 3. Confrontacin de datos con las hiptesis Las anteriores fases engloban el proceso de pasos de un estudio estadstico por ello su papel es fundamental en este mtodo. Estadstica presenta dos ramas principales: Descriptiva.- Es un conjunto de tcnicas para la organizacin, presentacin, grficas y clculo de cantidades representativas de un grupo de datos (organiza y representa). Inferencia estadstica.- Conjunto de tcnicas que permiten hacer induccin en los que el grado de incertidumbre es cuantificable a travs de probabilidades.
20
1.4 Poblacin y muestra. Poblacin.- Cualquier conjunto de personas, objetos, ideas o acontecimientos que se someten a la observacin estadstica de una o varias caractersticas que comparten sus elementos y que permiten diferenciarlos. (Alejandro Crdoba, 2002) Muestra.- Es la parte seleccionada de una poblacin en la que los elementos que la componen no tienen ninguna caracterstica esencial que los distinga de los restantes. Se utiliza cuando es necesario disponer de una parte representativa poblacin. Crdoba, 2002). En resumen: Un registro de datos se conoce como de la 21
(Alejandro
muestra y el conjunto de todos los posibles registros se le conoce como poblacin.

ESQUEMA 1.02 Proceso estadstico.
1.5 Variables y tipos de variables. Variable.- "una variable es un smbolo, tal como X, Y, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante." (Murray R. Spiegel, 1992). Es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Las variables segn la medicin pueden ser cuantitativas o cualitativas: Cuantitativas.- Son las variables que se expresan mediante cantidades numricas.
Cualitativas.-
Son
las
variables
que
expresan
distintas
cualidades,
caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores.
Discretas (para contar)
No existen posibilidades intermedias ej. manzanas, habitantes.
22
Cuantitativas (Numricas)
Kg, mts.,hrs.
Contnuas (para medir)
Infinidad de valores intermedias. ej. Estatura, espesor de hoja.
Nominales.
Cualitativas (Categoras)
gero, moreno, etc..
Condicin especfica del sujeto en estudio. ej. Domicilio, nacionalidad, religin.
Jerarquizadas.
Caracterstica de tamao u orden. ej. Chico, mediano, malo, bueno.
ESQUEMA 1.03 Tipos de variables.
Ejercicio. Indica que variables son cualitativas y cuales cuantitativas. 1.- Comida Favorita. Cualitativa. 2.- Profesin que te gusta. Cualitativa. 3.- Nmero de goles marcados por tu equipo favorito en la ltima temporada. Cuantitativa.
4.- Nmero de alumnos de tu Instituto. Cuantitativa. 5.- El color de los ojos de tus compaeros de clase. Cualitativa. 6.- Coeficiente intelectual de tus compaeros de clase. Cuantitativa 23
Ejemplo: La siguiente grafica representa en el eje vertical, el nmero de personas de una poblacin con los pesos en kilogramos. Identifique los intervalos que se indican:
ESQUEMA 1.04 Clasificacin de personas por peso.
a). Entre 59 y 62 kg. b). Mayor de 60kg. c). Mayor o igual que 60kg. d). Menor de 60kg. e). Menor o igual que 60kg.
Nota.- los pesos se estn considerando en kg enteros esto es un ajuste a la medida exacta y se obtiene una variable discreta a partir de variables continuas.
56.5
57
57.5
58
58.5
59
59.5
60
60.5
61
61.5
62
62.5
a)
24
b)
c)
d)
e)
ESQUEMA 1.05 Variable discreta y continua.
La relacin entre las variables discretas y continuas es de gran importancia dentro de la probabilidad y la estadstica.
1.6 Tabla de frecuencias Los datos estadsticos, obtenidos de encuestas, experimentos, o cualquier serie de medidas, son tan numerosos que virtualmente son poco tiles a menos que se condensen en una forma conveniente. Una tabla de distribucin de frecuencias divide los datos en un nmero relativamente menor de clases haciendo una lista con el nmero de observaciones que corresponden a cada clase. (Irwin Miller, 1993). Es la forma ms comn de organizar un gran nmero de datos. Conceptos fundamentales a conocer: Nmero de clases. Intervalo de la clase. Frecuencia de elementos de cada clase
Los elementos exactos Las marcas de clase o vales representativos Las frecuencias relativas Las frecuencias acumuladas Cuntas clases debern establecerse? El rango deber oscilar entre 5 y 20 clases. La ley de Sturges determina el nmero de clases a travs de: M= 1+ 3.3 logN Donde N= nmero total de datos M= nmero de clases Estas clases obtenidas son las recomendadas para iniciar la tabla de frecuencias. Cabe aclarar que en ocasiones el resultado de esta expresin es un nmero no entero, por lo que se recomienda considerar el valor entero que ms se aproxime a la cifra. Calcular el rango que estas clases contendrn para agrupar los datos mismos que se obtiene: R=A/M = R=A/M Donde: R.- El rango de cada clase. A.- La amplitud de datos. M.- Nmero de clases. La amplitud A.- Se define a travs de la diferencia del valor mximo menos el valor mnimo de la coleccin de datos: A=Vmax- Vmin 25
Nota.- Se recomienda hacer los ajustes necesarios a fin de que el rango sea de preferencia un nmero entero. Con el valor del rango se definirn los valores de los lmites de cada clase. Considerar el valor mnimo como lmite inferior y as sucesivamente hasta llegar al lmite superior de la ltima clase, de acuerdo a las clases definidas. Ley de parntesis.- Permite ubicar la pertenencia de un dato. 26 ( ms del valor representado [contiene al valor representado] )menos del valor representado
Calcular el valor representativo o la marca de clase mediante
Donde Li rango.- Lmite inferior del rango de la clase. Ls rango.- Lmite superior de la clase. Vm.- Valor medio representativo de la clase. La distribucin de frecuencias consiste bsicamente en agrupar los valores contenidos en la coleccin de datos de las clases ya definidas con sus respectivos lmites.
39 35 44 28 43 37 45 36 55 37 40 32 29 41 38 35 30 34 39 27 39 27 34 41 28 32 41 36 36 51 33 34 28 44 50 44
TABLA 1.01 Edades recolectadas.
Ejemplo: Edades de 36 profesores de una facultad. Calcular el nmero de clases recomendables para el diseo de la tabla de frecuencias: M= 1+3.3 Log N N= 36 M= 6.13 = 6 clases Clculo del rango o ancho de clase: R Determinar la amplitud A: A= 55-27=28 R= A/M = 28/6 = 4.66 = 5 Definir los lmites: El lmite inferior estar asociado al valor mnimo. Clase 1 2 3 4 5 6 Rango-intervalo [27-32] [32-37] [37-42] [42-47] [47-52] [52-57] Xm 29.5 34.5 39.5 44.5 49.5 54.5 27
TABLA 1.02 Clasificacin por clases.
Definir el valor representativo (*) el valor que representara a cada clase en todos los clculos. Clasificar los datos en funcin de su valor, esto es ubicar los valores en la clase que le corresponda.
Conteo. Obtener la frecuencia fi.- Es la cantidad de datos que pertenecen a determinada clase. Obtener la frecuencia relativa.- A la proporcin de valores que caen dentro de un intervalo de clase se le denomina frecuencia relativa de ocurrencia (Daniel, 1987). Fri= fi/N Calcular la frecuencia acumulada.- fai.- Es el total acumulado hasta cada clase. Evaluar la frecuencia relativa acumulada fari.- Es la proporcin o porcentual acumulado por cada clase. 28
xm 1 2 3 4 5 6 29.5 34.5 39.5 44.5 49.5 54.5
conteo IIII/IIII IIII/IIII/I IIII/III IIII/ II I
Fi 9 11 8 5 2 1 36
fri 0.25 0.30 0.22 0.14 0.06 0.03 1
fai 9 20 28 33 35 36
Frai 0.25 0.55 0.77 0.91 0.97 1
TABLA 1.03 Frecuencias.
1.7 Grficos.- Valen ms que mil palabras En comparacin de los datos que son ms difciles de comprender, las graficas permiten una visualizacin integral del comportamiento de los datos de forma ms objetiva. Los grficos son representaciones visuales que emplean smbolos, barras, polgonos y sectores, de los datos contenidos en tablas de frecuencias. (Vctor Quesada, 2007).
Las ms comunes son: histograma, polgono, pastel, la ojiva, y el de cajas y ejes, entre otras. Histograma.- La grfica de la izquierda se denomina histograma; las alturas de los rectngulos son proporcionales a las probabilidades correspondientes y las bases se tocan en tal forma que no hay espacios vacos entre los rectngulos que representan los valores sucesivos de la variable aleatoria. La grfica de la derecha se denomina diagrama de barras, las alturas de los rectngulos tambin son proporcionales a las probabilidades correspondientes, pero son angostos y su ancho no tiene ningn significado.(Jos Muoz, 1987). 29
Grficas de distribucin de probabilidad f(x) f(x)
0.5 0.4 0.3 0.2 0.1 x
0.5 0.4 0.3 0.2 0.1 x FI-UAQ
Histograma
Diagrama de barras
ESQUEMA 1.06 Comparacin histograma y diagrama de barras.
Polgono de frecuencias.- En l las frecuencias de clase son graficadas sobre las marcas de clase, esto es, graficamos los puntos marca de la clase de la i-sima clase y donde es la
es la frecuencia correspondiente y los
puntos sucesivos son unidos por medio de lneas rectas despus de haber agregado clases con frecuencia cero en los puntos lmite de la
distribucin.(Jos Muoz, 1987).
Grfica de pastel.- Si las frecuencias se expresan en porcentajes y stos totalizan el 100%, el pastel o diagrama circular constituye un mtodo de representacin adecuado. (G. Berry,1997).
GRFICA DE PASTEL
Ventas
Miriam Lidia Jos Mary Alex Juan Hugo FI-UAQ
18 % 16 %
8%
30
12 % 4%
25 %
18 %
ESQUEMA 1.07 Grfica de pastel.
Ojiva o curva S.- Las distribuciones acumuladas por lo general se presentan grficamente en forma de ojivas, lo cual es similar a los polgonos de frecuencia, excepto en que graficamos las frecuencias acumuladas sobre las fronteras de clase en lugar de graficar las frecuencias ordinarias sobre las marcas de clase. Los puntos as determinados se unen otra vez mediante segmentos rectilneos, como se muestra en la figura. (Jos Muoz, 1987).
Ojiva
f(x)
80
frecuencia acumulada
60
40
20
4.95
8.95
12.95
16.95
20.95
24.95
28.95
32.95
Emisin de xido de azufre (tons) FI-UAQ
.
ESQUEMA 1.08 Ojiva.
Cajas y ejes.- Diagrama basado en cuartiles. Proporciona una visin general de la simetra de la distribucin de los datos. En un solo eje se representa los valores mnimo y mximo, la primera y tercera cuartila y la mediana. Si la media no est en el centro del rectngulo eso significa que la distribucin no es simtrica. (Walter A. Rodrguez, 2008).Ejemplo de representacin horizontal. 31
CAJAS Y EJES
20
24.5
33.5
39
45
X mn
Q1
Q2
Q3
X mx FI-UAQ
ESQUEMA 1.09 Cajas y ejes, representacin horizontal.
20
Aos estudiados
15
50 % 95 %
Mediana
10
Atpicos
Extremos
FI-UAQ
ESQUEMA 1.10 Cajas y ejes, representacin vertical
UNIDAD 2 ESTADSTICA DESCRIPTIVA.
OBJETIVO: Estudiar y analizar los elementos bsicos para describir patrones generales y derivaciones de stos en un conjunto de datos especficos.
2.1 Definicin y parmetros estadsticos. Los registros u observaciones efectuados proporcionan una serie de datos que necesariamente deben ser ordenados y presentados de una manera inteligible. La Estadstica Descriptiva desarrolla un conjunto de tcnicas cuya finalidad es presentar y reducir los diferentes datos observados. (Santiago Fernndez, 2002). Mtodos tabulares y grficos.- Tabla de frecuencia, histograma, polgono, la curva S, cajas y ejes y pastel. Medidas descriptivas. Medidas de tendencia central. Media, mediana, moda.
32
Medidas de dispersin. Amplitud, varianza, desviacin estndar, coeficiente de variacin.
Medidas de posicin. Cuartiles, centiles, deciles, sesgo, curtosis.
Medidas de asociacin se desarrollan en el Capitulo 3.
.-SIGMA.- indica la operacin de suma
As Xi ; es la suma de los nmeros

i= 1
2.2 Medidas de tendencia central. 33 Son indicadores estadsticos que muestran hacia qu valor (o valores) se agrupan los datos. (Vctor Quesada, 2007).
Son tambin llamadas medidas de ubicacin y son las que refieren las medidas que se sitan o tienen la tendencia a situarse en la parte central de la distribucin de los datos. Media ( ).- Es el promedio aritmtico de un grupo de datos que se determina mediante la suma de los valores de los datos, dividida por el nmero de valores. Dados los n nmeros { como: }, la media aritmtica se define simplemente
Donde .- media muestral. .- suma de los valores.
n.- nmero de datos de la muestra. Desventaja.- La media por ser un punto de equilibrio de los datos, es muy sensible a la presencia de observacin extrema.
Ejemplo.- Se presentan los volmenes de venta de energa elctrica en una agencia por cada da durante 13 das, dado el valor en miles de pesos. Calcular el promedio de ventas durante el periodo. 7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6 34
Media para datos agrupados:
Ejemplo.- Calcular la media de los datos agrupados de la tabla de frecuencia dada. Mediana.- Es el valor central de mis datos, y se utiliza cuando existe asimetra en la distribucin y en este caso la media no sera una buena medida de tendencia central, ya que por ser el punto de equilibrio de los datos resulta muy afectada por los valores extremos. Mediana Me= .- Es el conjunto de nmeros ordenados de menor a mayor y donde se ubicara el valor que se encuentre a la mitad. Si n es un nmero non, solo habr un valor central si n es un nmero par habr dos valores compatibles y la x se obtiene al calcular la media de estos. Ejemplo: Calcular la mediana de los datos mostrados. 7 5 8 9 6 10 9 4 5 6 7 6 6
5 6 6 6
6 7
9 10
Observa el comportamiento con un valor extremo de los datos anteriores:
Por lo tanto la mediana representa el 50% de mi informacin La mediana para datos agrupados: se localiza en aquella clase donde esta el 50% de mis datos. Para encontrar la clase de la mediana se deber observar la frecuencia relativa acumulada e identificar aquella clase que agrupe el 50% de mis datos y definirla en funcin de su valor para asignar Llc, M de clase LSc.
Moda:.- Es el valor (si existe) que ocurre con mayor frecuencia, si este valor es nico se conoce como unimodal en caso de que se presenten 2 o ms valores con la misma frecuencia mxima se dice que es bimodal o trimodal.
35
La moda es una medida de tendencia central poco usada debido a que puede no existir o a menudo no es un valor nico. Ejemplo: 7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6 La moda es su frecuencia es 4
Para calcular la moda en datos agrupados solo se identificara la clase que tenga mayor frecuencia y esta ser la clase modal y se asignara para ello la marca de clase.
Cuando la distribucin de frecuencia es simtrica la
,,coincidirn.
Ejemplo.- Sean las horas de trabajo empleados para realizar una encuesta. 6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8, Calcular
, , :
Al comparar las medidas de tendencia central se pueden presentar 3 casos.
.- En este caso se dice que tiene asimetra hacia la derecha, esto es
que el histograma o polgono de frecuencia presenta una cola extendida hacia la derecha.
Curva de asimetra positiva.

36
Eje de simetra.
FI UAQ
ESQUEMA 2.01 Asimetra positiva.
Si
la relacin se invierte
la distribucin es simtrica
Ahora si.-
Curva simtrica
FI.UAQ
ESQUEMA 2.02 Curva simtrica.
Ancdota para reflexionar en clase:
Confundir media y mediana, es una moda?
mediana moda Media
37
Media FI-UAQ
ESQUEMA 2.03 Ilustracin media, mediana y moda.
En una nota informativa se encontr el comentario de un presidente con el subsiguiente comentario burln del periodista. Quin estaba ms errado?
El presidente se ha mostrado muy consternado al comprobar el resultado de una estadstica fiable, segn la cual la mitad de los ciudadanos tiene una inteligencia por debajo de la media. No soy capaz de recordar si era inteligencia, nivel cultural u otra cosa similar, en todo caso era una cualidad positiva la que se estaba midiendo. El resto de la noticia era una mofa hacia el compungido presidente, que se poda resumir as: Qu burro el presidente, no sabe que por definicin de la media, eso debe ocurrir necesariamente! Es una confusin muy comn. Adems socialmente es muy excusable. Hoy en da es incluso de buen tono exhibir ignorancia en cuestin de nmeros, y no digamos de estadsticas. Es sin embargo ah donde nos engaan todos los das. El anumerismo (de los dems, claro est) es una de las mejores herramientas de manipulacin.
En el caso que nos ocupa, a mi no me queda claro que la estulticia presidencial estuviera por encima de la media, ni que la del comentarista estuviera por debajo. Para empezar, debiera comentar que la intuicin no es una herramienta de fiar en matemticas. Es tan importante como la inspiracin en los poetas, pero no ms. No creo que con inspiracin se pueda componer una gran obra, sino con mucho trabajo y sudor. Posiblemente el presidente caa en un error, pero el comentarista caa en otro con total certeza. Vamos a explicarlo. Debido a una cosa muy interesante y muy profunda de la que me gustara hablar mas adelante y que se llama el Teorema central del lmite, estamos acostumbrados a las distribuciones simtricas, como la de la figura A. En ellas coincide la media (que todo el mundo sabe lo que es), la moda (que es el valor con mayor frecuencia observado) y la mediana, que es el valor que deja tantas observaciones por arriba como por debajo. Si la distribucin no es simtrica, tenemos situaciones como la de la figura B. La media est desplazada respecto a las dems medidas centrales, y es claro que en este segundo caso ms de la mitad de la poblacin est por debajo de la media. Siempre ser la mediana, por su propia definicin la que estar centrada respecto al nmero de observaciones a ambos lados, no la media. 38
Tena nuestro hipottico presidente motivos de pesar? Pues segn se mire, s. Si la distribucin hubiera sido asimtrica en sentido contrario a la de la figura B, ms de la mitad de la poblacin hubiera tenido una inteligencia, cultura o educacin superior a la media, puesto que la mediana sera de valor superior a la media. Esto supone un desplazamiento de la masa total hacia valores ms altos, y es claramente positivo para la poblacin, si el parmetro que se mide es una cualidad positiva para la misma. Eso no se produca, pues la noticia implicaba una distribucin simtrica. Se refera a eso el presidente?
Lo dudo. Tena motivos de mofa el comentarista? Pues realmente, si los tena no era por lo que l crea... HISTORIAS MATEMTICAS. Jess M. Landart.
2.3 Medidas de dispersin. Las medidas anteriores no son suficientes para caracterizar la forma en que se distribuye la informacin. Este es el otro aspecto a considerar que debe tomarse en cuenta que es la variabilidad de las observaciones. Medidas de dispersin.- Son medidas que describen la variacin o variabilidad de una coleccin de datos en funcin de sus valores medios. Se clasifican en: Amplitud, varianza, desviacin estndar y coeficiente de variacin. Ejemplo.- Se tienen las dos muestras de una misma poblacin, calcular las medidas de tendencia central. A.- 0, 4, 5, 8, 11, 12, 16, 16, 0, 5, 5, 8, 8, 11, 11, 16, 17, 8, 8, B.- 8, 8, 8, 10, 11, 7, 5, 6, 9, 3, 5, 6, 7, 9, 11, 13, 13, 16, 18 Medidas de tendencia central
TABLA 2.01 Media, mediana y moda.
39
A 8.9 8 8
B 9.1 8 8
Las medidas de dispersin nos ayudan a conocer que tan homogneos son los datos, que tan variables son, que tan densos o que tan dispersos se encuentran nuestros datos. Amplitud, ventaja la facilidad con la que se calcula y es la diferencia entra las observaciones de mayor y menor valor numrico de nuestros datos. La comparacin de cada uno de nuestros datos con la media=desviacin media: es la suma del valor absoluto de las diferencias de cada valor respecto de la media y se divide entre el nmero de datos, con esto se obtiene el promedio de las diferencias de cada valor respecto a la media. L a des vi a c i n medi a se rep re sen t a p o r
40
Varianza.- Es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. L a va ria n za se re pre se n t a p o r
Caracterstica es que esta medida de dispersin no presenta su valor en las unidades de la muestra por ello se emplea la medida de dispersin ms utilizada que es: Desviacin estndar: que es la raz cuadrada de la varianza.
Ejemplo: Calcular la amplitud, la desviacin media, la varianza y la desviacin estndar, para los pesos en Kg reportados de una muestra de 10 personas. 63, 52, 78, 49, 71, 62, 68, 48, 56, 67, Amplitud=30
s2=99.6
s= 9.98 41
Para datos agrupados: Varianza: V a rian za p a ra da t o s a gru p ad o s
Desviacin estndar: Calcular las medidas anteriores para los datos del ejemplo de la tabla de frecuencia Ejemplo: Determinar la desviacin estndar de las ventas de energa en miles de pesos, de dos agencias cuyos datos son los siguientes: Agencia A: Agencia B: SA= 2.0976 SB=O.6325 20, 16, 17, 16, 21 18, 17, 18, 19, 18
Ambas agencias tienen el mismo promedio de ventas pero la agencia B sus ventas son ms estables, lo que se refleja en su S menor.
Ejemplo: los siguientes datos representan los pesos y estaturas de estudiantes de ingeniera. KG. 1 2 3 4 5 6 7 8 9 10 63 52 78 49 71 62 68 48 58 67 CM. 162 158 167 151 162 168 167 153 152 173 Si al valor de la , se le suma y resta 2 veces el valor de la S se tendr el 95.46% de los datos. % Calcular las medidas de tendencia central y las medidas de dispersin vistas. Existe una regla emprica que relaciona la S con la distribucin de una curva normal, esto es que los datos estn uniformemente distribuidos a lo largo de la curva, mismo que se hizo teorema que es actualmente uno de los ms importantes de la estadstica. Teorema de Tchebysheff Si al valor de la media se le suma y se le resta el valor de S, se tiene que dentro de esa rea est comprendido el 68.21% de los datos. 42
TABLA 2.02 Pesos y estaturas.
Si al valor de la , se le suma y resta 3 veces el valor de la S, se tendr el 99.73% de los datos. %
Este teorema nos puede dar una idea de cunto va a valer la desviacin estndar
Se garantiza que en 4S se tendr el 100% de todos los datos.
Coeficiente de variacin.- C.V. Es un valor relativo expresado en porcentaje y ayuda a comparar dos poblaciones o muestras, a fin de observar que tanto vara una de otra. Esto es dos colecciones de datos pero relacionados con la misma variable. El C.V. es tpicamente menor que 1. En forma algebraica se expresa:
43 Ejemplo.- Calcular el coeficiente de variacin de los pesos y estaturas e indica cual de los dos tiene mayor variacin. CvX=16.25% Cvy=4.7% Los pesos tienen una mayor variabilidad en las 10 personas consideradas. Ejemplo.- En un proceso de certificacin, dos auditores A y B realizan auditorias a diferentes facultades en periodos y tiempos iguales, despus de tomar los datos y realizar un anlisis estadstico se llego al siguiente resultado: el auditor A obtuvo un promedio de registros errneos auditados de 300 y una S=10, el auditor B tuvo un promedio de registros errneos auditados de 150 y una S= 9. Cul de los dos nos dar mayor certidumbre en la certificacin? Va= 10/300=0.033 Vb= 9/150= 0.06 El B tiene mayor variacin que A.
2.4 Medidas de posicin. Determina la conformacin geomtrica de las distribuciones mostradas en un polgono de frecuencias, su importancia radica en conocer cmo se comportan los datos motivo de estudio a travs de las curvas de distribucin.
Cuartiles, centiles, y deciles.- Son medidas de posicin ms finas dentro de la muestra. Cuartiles.- Es la coleccin de datos dividida en cuatro partes y se obtiene su ubicacin o posicin de estos por analoga el Q2= mediana cuyo valor se sita justo a la mitad de los datos ordenados. 44
25%
50%
75%
100%
ESQUEMA 2.04 Cuartiles.
Deciles. Son los cuantiles que dividen una distribucin en 10 tantos o intervalos, por lo que se tienen 9 puntos de divisin, los deciles, que originan los 10 intervalos. Los deciles, que se representan por como la siguiente: y pueden ser marcados en una grfica
D1
D2
D3
D4
D5
D6
D7
D8
D9
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
ESQUEMA 2.05 Deciles.
Centiles es la coleccin de datos dividida en cien partes, cada una de ellas corresponde a un centil, por lo que se tienen 100 centiles, as, el centil 50 es igual a la mediana. La determinacin de los centiles se realiza mediante la expresin siguiente. [( ) ]
Donde Cx.-Centil que se desea calcular. X.- Nmero del centil. L.- Lmite inferior de la clase. I.- Amplitud del rango de la clase del centil. N.- Nmero de datos. 100.- Cien centiles. F.- Frecuencia acumulada de la clase anterior a la clase del centil. Fi.- Frecuencia de la clase que contiene al centil.
45
Para identificar la clase que contiene al centil se emplea la relacin.
Y el resultado se buscara en la frecuencia acumulada el primer valor mayor al obtenido y esta ser la clase del centil. Para el clculo de los cuartiles se emplea una expresin anloga de la forma siguiente. [( ) ]
Donde Qx.-Cuartil que se desea calcular. X.-Nmero del cuartil. N.-Nmero de datos. I.- Amplitud del rango de la clase del cuartil. L.- Lmite inferior de la clase del cuartil. F.- Frecuencia acumulada de la clase anterior a la clase del cuartil. Fi.- Frecuencia de la clase del cuartil. Qi Q3.- Es el rango intercuartlico rango intercuartil. 46
2.5 Asimetra y apuntamiento. Sabemos cmo calcular valores alrededor de los cuales se distribuyen las observaciones de una variable sobre una muestra y sabemos cmo calcular la dispersin que ofrecen los mismos con respecto al valor de central. Nos proponemos dar un paso ms all en el anlisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma simtrica con respecto a un valor central, o si bien la grfica que representa la distribucin de frecuencias es de una forma diferente del lado derecho que del lado izquierdo. Si la simetra ha sido determinada, podemos preguntarnos si la curva es ms o menos apuntada (larga y estrecha). Este apuntamiento habr que medirlo comparado a cierta distribucin de frecuencias que consideramos normal (no por casualidad es ste el nombre que recibe la distribucin de referencia). Estas ideas son las que vamos a desarrollar en lo que resta del captulo.
Para saber si una distribucin de frecuencias es simtrica, hay que precisar con respecto a qu. Un buen candidato es la mediana, ya que para variables continuas, divide al histograma de frecuencias en dos partes de igual rea. Podemos basarnos en ella para, de forma natural, decir que una distribucin de frecuencias es simtrica si el lado derecho de la grfica (a partir de la mediana) es la imagen por un espejo del lado izquierdo. Figura: Distribuciones de frecuencias simtricas y asimtricas. 47
Cola
Me
ESQUEMA 2.06 Distribucin de frecuencias simtrica y asimtrica.
Me
FI-UAQ
Cuando la variable es discreta, decimos que es simtrica, si lo es con respecto a la media. Observacin.
Se podra pensar que definir la simetra usando la mediana para variables continuas y usando la media para variables discretas es una eleccin arbitraria. En realidad esto no es as, pues si una variable es continua, coinciden ambos criterios de simetra (con respecto a la media y a la mediana). Es ms, se tiene que media y mediana coinciden para distribuciones continuas simtricas. Por otro lado, en el caso de variables discretas, la distribucin es simtrica si el lado derecho del diagrama se obtiene por imagen especular desde la media. En este caso coincide la media con la mediana si el nmero de observaciones es impar.
Si la variable es continua simtrica y unimodal, coinciden la media, la mediana y la moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales: Asimetra positiva: Si las frecuencias ms altas se encuentran en el lado izquierdo de la media, mientras que en derecho hay frecuencias ms pequeas (cola). 48
Asimetra negativa: Cuando la cola est en el lado izquierdo. Figura: Asimetra positiva y asimetra negativa
Asim. positiva
Asim. negativa
Me
ESQUEMA 2.07 Asimetra positiva y negativa.
Me
FI-UAQ
Cuando realizamos un estudio descriptivo es altamente improbable que la distribucin de frecuencias sea totalmente simtrica. En la prctica diremos que la distribucin de frecuencias es simtrica si lo es de un modo aproximado. Por otro lado, an observando cuidadosamente la grfica, podemos no ver claro de qu lado estn las frecuencias ms altas. Conviene definir entonces unos estadsticos que ayuden a interpretar la asimetra, a los que llamaremos ndices de asimetra, y que denotaremos mediante . Vamos a definir a
continuacin algunos de los ndices de asimetra ms usuales como son el
ndice basado en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media o la media y la mediana. Sesgo o Skewness.- Determina el grado de asimetra de la curva o polgono de frecuencia. Si esta curva tiene la cola ms larga hacia la derecha se dice que tiene sesgo positivo o que est cargada hacia la derecha. Si la cola ms larga la tiene hacia la izquierda se dice que tiene un sesgo negativo o que est cargada hacia la izquierda. 49
Para determinar el valor del sesgo se emplea la expresin siguiente:
Si el sesgo =
es una curva o simtrica
FI-UAQ
Curva simtrica.
ESQUEMA 2.08 Curva simtrica.
Eje de simetra.
Si el sesgo (-).- Entonces est cargada a la izquierda.
Curva de asimetra negativa.
Eje de simetra.
50
FI-UAQ
ESQUEMA 2.09 Curva asimtrica negativa.
Si el sesgo (+).- Entonces est cargada a la derecha.
Curva de asimetra positiva.
Eje de simetra.
FI UAQ
ESQUEMA 2.10 Curva asimtrica positiva
Nota.- El valor ms cercano a 0 tiende a la normal, por lo que el grado de asimetra es menor que aquel que se aleja del cero. No importa el valor del sesgo sino el sentido. Ejemplo.- Tiempo aceptable en contrato y puesta en servicio de la luz. (Hasta su conexin). El sesgo ayuda a definir especificaciones o niveles, mnimos mximos o deseables. Coeficiente de apuntamiento o Curtosis (K) Determina el grado de pronunciamiento de la cspide de la curva o polgono de frecuencias o histograma es una medida de Picudez La interpretacin del resultado est dada: cuando K= 0.26 curva mesocrtica forma: regular 51
FI-UAQ
Curva mesocrtica
ESQUEMA 2.11 Curva mesocrtica.
K= < 0.20
curva leptocrtica
forma: punta
FI-UAQ
Curva leptocrtica.
52
ESQUEMA 2.12 Curva leptocrtica.
K > 0.26
curva platicrtica
forma: plana
FI-UAQ
Curva platicrtica.
ESQUEMA 2.13 Curva platicrtica.
Para determinar el valor se usa la expresin siguiente:
Donde: K.- coeficiente de Curtosis Q3.- Cuartil 3. Q1.-Cuartil 1. C90.- Centil noventa o percentil 90. C10.- centil 10 o percentil 10 Ejemplo analizar las 72 lecturas del consumo de energa en industrias por hora en Watts. Xi 1 2 3 4 5 6 7 27-31 31-35 35-39 39-43 43-47 47-51 51-55 29 33 37 41 45 49 53 F 16 17 20 10 6 2 1 F 16 33 53 63 69 71 72
53
TABLA 2.03. Consumo de energa.
Calcular: M de tendencia central M de dispersin M de posicin o de forma
UNIDAD 3: REGRESIN Y CORRELACIN. OBJETIVO: Estudiar y analizar el comportamiento de dos o ms muestras. La credibilidad de cualquier inferencia realizada utilizando la metodologa estadstica depende fuertemente de que se cumplan las suposiciones bajo las cuales se derivan las tcnicas usadas.(Infante y Zrate de L, 1990). 54 3.1 Diagrama de dispersin: Se usan en el anlisis de correlacin dentro de las tcnicas estadsticas para identificar la relacin que existe entre dos variables. Cuando se trata del anlisis de dos variable se llama anlisis bivariado Por lo tanto el anlisis de correlacin ser un anlisis de ese tipo. Al analizar el comportamiento de dos variables y se muestra a travs del diagrama de dispersin que, una variable tiene influencia sobre a otra se dice que existe correlacin, desde el punto de vista matemtico una variable es dependiente y la otra ser independiente. Ejemplo. Si se tiene un terreno, donde se tienen plantados determinados tipos de vegetales, stos son alimentados con una mnima cantidad de agua que constantemente produce bajo rendimiento en la cosecha. Si a esta plantacin se le suministra una mayor cantidad de agua, la cosecha tendr un rendimiento mayor dado que el agua es un elemento indispensable para el crecimiento de los vegetales. Si incrementamos el volumen de agua an mas se observar que el rendimiento de la cosecha se incrementar, (Entendemos que existe un punto de equilibrio en el suministro de agua, de lo contrario podemos caer en el error de suministrar agua en exceso e inundar la plantacin, situacin negativa para la cosecha). De lo anterior se deduce que la variable volumen de agua tiene influencia sobre la variable rendimiento de la cosecha, por lo tanto existe una correlacin, una forma de demostrarlo es construyendo el diagrama de dispersin, tomando
datos de la variable volumen de agua (x) y datos de la variable rendimiento de la cosecha (y). Se construye una tabla donde se muestra los pares ordenados y se grafican dentro de un eje de coordenadas mostrando slo los puntos de stos. Y los resultados posibles de un diagrama de dispersin son:
y
55
x No hay correlacin.
x Hay correlacin positiva.
x Hay correlacin negativa.

ESQUEMA 3.01 Diagramas de dispersin.
A. Correlacin perfecta negativa (-) B. Correlacin perfecta positiva (+).
3.2 Covarianza. El anlisis de covarianza es una tcnica que combina los aspectos del anlisis de varianza y de regresin, el cual consiste en elegir una o ms variables adicionales o covariables que estn relacionadas con la variable respuesta. Las observaciones concomitantes pueden ser usadas para incrementar la precisin de las comparaciones de tratamientos, previendo que las observaciones concomitantes y las observaciones principales sobre las unidades 56 experimentales, pudiesen estar correlacionadas. (Cox, 1958). Si Sxy> 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y.
Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relacin lineal entre las dos variables estudiadas. Es decir, puede directamente no haber relacin entre las variables, o bien existir una relacin no lineal.
Si Sxy< 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeos valores de y. [
]]
Otro coeficiente ms usado y que se apoya en la covarianza es el coeficiente de correlacin (r) que se calcula de la forma siguiente.
Donde: Scxy= covarianza [ ] 57
Donde:
r = coeficiente de correlacin serial Scxy= Suma de cuadrados de xy (covarianza) Scx= suma de cuadrados de x Scy= suma de cuadrados de y N= nmero de pares ordenados (pares de datos x, y) 3.3 Correlacin. La correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad. La relacin entre dos variables cuantitativas queda representada mediante la lnea de mejor ajuste, trazada a partir de la nube de puntos. Los principales
componentes elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el sentido y la forma:
La fuerza extrema segn el caso, mide el grado en que la lnea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una lnea recta, lo que indica que la relacin es fuerte; si la nube de puntos tiene una tendencia elptica o circular, la relacin es dbil. 58
El sentido mide la variacin de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relacin es positiva; si al crecer los valores de A disminuyen los de B, la relacin es negativa.
La forma establece el tipo de lnea que define el mejor ajuste: la lnea rectal, la curva monotnica o la curva no monotnica.
Una vez construido el diagrama de dispersin y bajo el criterio de comportamiento podremos decir si existe correlacin y de qu tipo o simplemente no hay correlacin. Si hay correlacin es necesario conocer que tanta correlacin existe, que me permita tomar decisiones sobre la variable independiente y que logre buenos resultados sobre la variable dependiente.
El resultado del coeficiente de correlacin r se basa en las siguientes propiedades: -Su valor se encuentra entre -1 y 1 -Si es mayor, ejemplo 1.3, indica que algo anda mal -Si es mayor a simultneamente. indica que las variables crecen o decrecen
-Si es menor a viceversa.
indica que cuando una crece la otra decrece y
-Si su valor es aproximadamente 1 -1 existe una alta asociacin entre las dos variables. Anlisis de los parmetros anteriores
ALTA CORRELACIN.
NULA CORRELACIN.
ALTA CORRELACIN.
59
0 -1 -0.7 0.7 1
MALA CORRELACIN.
Conclusin.- para un valor de r muy cercano a 1 -1 se tendr alta correlacin entre las variables X y Y. Ejemplo: En una planta generadora se cuenta con un grupo de motores que con el paso del tiempo se registro su antigedad y los costos de mantenimiento dan los resultados siguientes en miles de pesos: Antigedad MOTORES 1 2 3 4 5 6 7 8 9 10 (aos) 8 9 3 5 8 6 7 4 3 11 Costo de Mantenimiento 276 543 69 120 378 246 351 147 192 423
11 12 13 14
5 10 11 10
330 315 543 456
TABLA 3.01 Registro de antigedad y mantenimiento.
Calcular el coeficiente de correlacin lineal y demostrar que tanta correlacin existe entre estas 2 variables.
60
Resultados
Antigedad X
Costo Y
xy 36009 820 1665099
100
4389
Scxy= 4659 Scx= 105.71 Scy= 289147.50 Al sustituir los resultados anteriores en la ecuacin de r se obtuvo el valor de: COEFICIENTE DE CORRELACIN En conclusin se tiene una alta correlacin.
61
ESQUEMA 3.02 Diagrama de dispersin.
3.4 Regresin lineal simple.
Con el fin de tener la posibilidad de hacer predicciones o estimacin sobre una muestra de datos, se calcular y construir la recta de mejor empleando el anlisis de regresin lineal. Para realizar dichas estimaciones es necesaria la construccin de la recta de mejor ajuste cuya ecuacin es la siguiente: ajuste,
DONDE:
Para conocer las constantes
se emplean las ecuaciones siguientes:
62 Para el ejemplo anterior tenemos:
Con las constantes determinadas tenemos que la recta de mejor ajuste ser:
Conociendo la ecuacin de la recta se podr construir esta asignando valores a la variable dependiente (X) Y se obtiene el valor de la variable Y. Si x=2 Y=-1.2976 + 44.072(2) Y= 86.8456 Si x=12 Y= -1.2976 + 44.072 (12) Y= 527.56185
Los valores de x fueron asignados de acuerdo a la coleccin de datos y se toman solo dos valores que son suficientes para construir la recta considerando como aprecio los valores extremos que son 2 y 12 como caso postular de esta coleccin. Se procede a construir la grafica en el diagrama de dispersin dando el resultado siguiente: 63
ESQUEMA 3.03 Recta de regresin.
Ya con la recta trazada, es posible realizar algunas predicciones con base a los resultados Ejemplo: si se tiene la entrada de un equipo con 8.7 aos de antigedad podemos a travs de la recta estimar cual ser el costo de mantenimiento, mediante la grafica anterior: 1.- Ubicar la edad 8.7 y trazar una recta hasta intersecar la recta de ajuste.
2.- A partir del punto de interseccin se traza otra lnea hacia la izquierda al eje de mantenimiento. 3.- El punto donde cruza ser el costo especfico para la edad del equipo que result 382.
El resultado se conoce como una estimacin y es evidente que el resultado no tendr la exactitud deseada, pero se considera aceptable como estimacin.
Ejercicio 1. Los datos siguientes fueron
tomados de un estudio donde se
usaron mezclas de gasolina y una gasolina reformulada. Motor Edad Base 1 0 2 0 3 2 4 11 5 7 6 16 7 9 8 0 9 12 10 4 124 142 64
1.72 4.38 4.06 126 531 57
337 344 74 494 489 69
Reformada 1.88 593 554 267 653 74

TABLA 3.02 Registro del tipo de gasolina.
Construir la grafica de dispersin y discutir en clase. Ejercicio 2. La corrosin de las barras de acero de refuerzo es el problema de durabilidad ms importante para las estructuras de concreto reforzado. La carbonatacin del concreto resulta de una reaccin qumica que disminuye el valor del pH lo suficiente para iniciar la corrosin de las barras. Datos. X.- Profundidad de la carbonatacin (mm). Y.- Resistencia (MPa). Los datos son de una muestra tomada de un determinado edificio.
x y x y 8 22.8 38 19.5 15 27.2 40 12.4 16.5 23.7 45 13.2 20 17.1 50 11.4 20 21.5 50 10.3 27.5 18.6 55 14.1 30 16.1 55 9.7 30 23.4 59 12 33 13.4 65 6.8
TABLA 3.03 Registro de carbonatacin y resistencia.
Construir la grfica de dispersin y discutir en clase.
Ejercicio 3. Los datos siguientes muestran el nmero de milmetros de lluvia mxima total en 30 meses que se han presentado en la ciudad de Adela Mara, Argentina.
MESES ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE
2005 213 48 76 55 10 2 11 29 26 83 117 40
2006 111 185 182 129 7 5 8 0 5 77 108 184
2007 127 171 180 20 14 31 10 0 120 131 18 97
65
Fuente: Gobierno de Argentina.

TABLA 3.04 Registro de mm de lluvia.
A travs de un anlisis estadstico determine: - Grficos: Histograma, Ojiva, Cajas y ejes. - Medidas de tendencia central - Medidas de dispersin. - Medidas de asociacin.
Calcular la correlacin y an si no existiera calcular la recta que mejor se ajuste.
UNIDAD 4: FUNDAMENTOS DE PROBABILIDAD OBJETIVO: Anlisis y conocimiento de la probabilidad como una manera de describir cuantitativamente los fenmenos aleatorios.
Abarcar la parte de la probabilidad que tiene relacin ms directa con problemas de inferencia estadstica permite cuantificar el incertidumbre. grado de 66
4.1 Conjuntos y su algebra. Un evento es en realidad un conjunto, es por ello que la teora elemental de conjuntos se puede usar para estudiar eventos. Conjunto.-Una coleccin o agrupacin de objetos que tienen en comn alguna propiedad. Tales objetos pueden ser materiales o tambin pueden ser abstractos (como los nmeros). Se acostumbra usar letras maysculas del alfabeto para designar conjuntos y letras minsculas para representar sus elementos. (Marian Wisniewski, 2001). Simbologa.
CONJUNTO A= Los nombres de la clase de PYE { Son formas de representacin de conjuntos }
DIAGRAMAS DE VENN- EULER Son representaciones grficas de los eventos de un experimento. Usando
rectngulos para el espacio muestral y figuras circulares u ovaladas para los eventos. (Olga Vladivmirovna, 2005).
U
A B
67
FI-UAQ
ESQUEMA 4.01 Diagrama de Venn- Euler.
Las siguientes operaciones se usan para construir eventos nuevos a partir de eventos determinados. 1.- La unin de dos eventos A y B se denota por A UB es el evento que consiste en los resultados que estn ya sea en A B en ambos eventos.
(A U B) C U AUB=U AU=A AUB=BUA

ESQUEMA 4.02 Conjunto A U B.
FI-UAQ
2.- La interseccin de dos eventos A y B se denota
es el evento que
consiste en los resultados que estn tanto en A como en B (elementos comunes de los eventos).
U
68
ESQUEMA 4.03 Conjunto
FI-UAQ
3.- Complemento.- son los elementos del universo que no pertenecen al conjunto A y se denota .
FI-UAQ
La diferencia de A y B se denota como A/B y es el conjunto de elementos que pertenecen a A pero al conjunto B.
U
69
FI-UAQ
EJEMPLO: Dados los siguientes conjuntos A= {1,2,3,4,5} B= {1,3,5,7,9} C={2,4,6,8,10}
Definir el universo y encontrar:
EJEMPLO: Dados los conjuntos.
{ { { } }
Definir Universo y encontrar.
70 Ejercicio resuelto: Se realizo una encuesta a 1000 personas en relacin a sus adquisiciones en distintas libreras, los resultados de la investigacin fueron los siguientes: 300 personas compraron en la librera A 200 en la librera B 250 en la librera C 50 en la librera B y A 75 en la librera A y C
50
A
200 25 25 35 140 115
60 en la librera B y C 25 en las 3 libreras

ESQUEMA 4.06 Ejercicio resuelto.
410
C
FI-UAQ
Con la ayuda del Diagrama de Venn-Euler. Indicar: a) Cuntas personas no compraron en ninguna de las 3 libreras. 410. b) Cuantas compraron nicamente en la A. 200.
c) Cuntas compraron solamente en la B. 115. Ejercicio. Dibujar en diagrama de Venn-Euler lo siguiente: a) b) c) Lo anteriormente expuesto se liga con las leyes de probabilidad ya que se tienen ms facilidades para interpretar. 71
4.2 Experimentos aleatorios, espacios mustrales y eventos. Azar y desconocimiento.- Seleccionar un articulo sin verlo no se sabe si es B M Azar e incertidumbre.- Cuando desconocemos el posible resultado de un gran negocio exitoso o de fracaso. Experimento.- Proceso mediante el cual obtenemos una observacin y puede ser aleatorio o determinstico. Aleatorio.- No se sabe que va a ocurrir, aquel cuyos resultados no pueden producirse antes de su realizacin y estn sujetos al azar. Determinstico.- Aquel cuyo resultado siempre es el mismo. Espacio muestral.- Es el conjunto de todos los posibles resultados de un experimento probabilstico y se denota por S. Los elementos de un espacio muestral se llaman puntos muestrales. (Olga Vladimirovna, 2005). El espacio muestral obliga a tener mucha claridad en la poblacin objetivo cuando est bien definido. Ejemplo: cul es tu opinin del gobierno que sale?
Tipos de espacio muestral. { { } }
NOTA: Cuando se tenga una observacin se debe tener lugar donde caiga esta. 72 1.- Ejemplo: Se toma un litro de leche y se desea determinar el porcentaje de agua por volumen, definir el espacio muestral.
2.- Ejemplo: En una muestra de sangre se desea determinar el nmero de glbulos blancos y rojos por Existen 2 caractersticas x, y { } : definir el E.M.
3.- Cual es el tiempo que tarda un corredor en recorrer 100 m y cul es su capacidad respiratoria. 2 variables (T, Cr) { }
Definir cul es un EM discreto y cual es un EM continuo de los ejemplos anteriores. El ejemplo 2: espacio bidimensional discreto.
El ejemplo 3: espacio bidimensional continuo.
Para cualquier experimento es de gran importancia especificar el espacio muestral, ya que algunos subconjuntos interesan ms que otros. Ejemplo: Ms del 80% de agua est presente en la leche esto es inaceptable por lo que se define un subconjunto A en donde ACEM. 73 EM = {x / 80% < x < 100%} No es leche.
A ESTE TIPO DE CONJUNTOS SE LE CONOCE COMO EVENTOS EN EL ESPACIO MUESTRAL.
Es claro que para determinar al EM en un experimento aleatorio es necesario entender perfectamente. 1.- Qu se va a hacer? 2.- Qu se va a observar o contar?
Ejemplo: Si un juego consiste en tirar todos los volados que hagan falta hasta obtener tres guilas seguidas o hasta que sean 15 volados si nos fijamos en el numero de volados requeridos el EM seria 3, 4, 5,, 15 pero si nos fijamos en el nmero de sellos entonces el EM ser 0, 1, 2,,15 En conclusin: Cuando se tiene un EM se le llama formalmente evento a cualquier subconjunto del EM. Del ejemplo anterior el EM 3,4,5 ,,15 un evento de estos seria 3,5,7,,15 evento en el que el numero de tiros es non. Si al hacer los volados nos queda: AASAASSSAAA
Han cado 3 guilas seguidas el evento si se realiza ya que el nmero necesario para ellos fueron 11 y es non. En cambio si resulta: SSSAAA como han cado 3 guilas seguidas, se detiene pero el evento no se realizo por sexto. Por lo general conviene subdividir el EM. en un cierto nmero de eventos E1,E2,E3..En. Una regla es que para cualquier par de eventos ser stos eventos independientes o excluyentes. Particiones Es posible definir particiones sobre el espacio muestral. Formalmente hablando, una particin sobre el EM se define como un conjunto numerable: { } por 74
A esta subdivisin se le conoce como particin de un espacio muestral.
E2
E3 E5 E4
E1
FI-UAQ
ESQUEMA 4.07 Particin de un espacio muestral.
Ejemplo: El experimento consiste en medir el % de humedad relativa en un invernadero. EM= { x / 0<x<100% } Si un porcentaje est determinado entre se tendrn 3 75
subconjuntos en los cuales su interseccin entre ellos dar como resultado Q y la unin de los 3 ser el espacio muestral una particin. estos conjuntos estn formando
4.3 Teora fundamental del conteo. Es la base para el desarrollo del anlisis combinatorio que permite determinar el nmero de posibilidades lgicas en algn evento sin enumerar
necesariamente cada cosa. El teorema o teora del conteo establece que si algn evento puede ocurrir en n1 maneras diferentes y si despus de este evento un segundo evento puede ocurrir en n2 maneras, un tercer evento puede ocurrir en n3 maneras y as sucesivamente, entonces el nmero de maneras en que los eventos pueden ocurrir en el orden indicado ser: Ejemplo de Placa de un Automvil NOTACIN FACTORIAL Es el producto de los enteros positivos en orden descendente n! Donde por axioma n!= 5*4*3*2*1*0! = 120 En diferentes casos se tomara de algn conjunto parte de sus elementos a todos ellos para formar diferentes agrupaciones que se van a distinguir por el orden de sus elementos o por la naturaleza de alguno de ellos. Entre los mtodos ms conocidos estn permutaciones y combinaciones.
4.4 Permutaciones y combinaciones. PERMUTACIN. Arreglos sin repeticin: Permutaciones.(Olga Vladimirovna, 2005). Dado un conjunto finito con todos sus elementos diferentes, llamamos permutacin a cada una de las posibles ordenaciones de los elementos de dicho conjunto. 76 n= objetos r= forma Permutacin Lineal.P(n, r)= n(n-1)(n-2),(n-r+1)
Si r=n tenemos que P(n, r) = n! Si se tienen 4 chips distintos a,b,c,d y se toman uno a la vez tendramos 4 posibilidades de suceso del E. M. Si consideramos que tomamos 2 a la vez el resultado sera ab, ba, ca, ac, ad, da, bc, cb, bd, db, cd, dc. E.M. = 12 Se observa que: ab y ba tienen diferente orden ac y ab tendrn diferente contenido. Ejemplo 1. De cuntas formas diferentes pueden ocuparse una gerencia y una subgerencia si existen 8 candidatos que pueden ocupar indistintamente la gerencia o la subgerencia.
Ejemplo 2. Si en una carrera de 400 metros participan 12 atletas. De cuantas formas distintas podrn ser premiados los 3 primeros lugares con medalla de oro, plata y bronce.
Ejemplo 3. Cuantos nmeros de los 3 dgitos se pueden formar con los 6 dgitos siguientes 146789. 77
Ejercicio propuesto: Cuantos nmeros de 3 dgitos diferentes r se pueden formar con los dgitos siguientes. 1, 4, 7, 8, 9, 5. Cuantos son menores que 600 Cuantos son nones Cuantos son mltiplos de 5 Permutaciones circulares. Ahora estudiaremos algunos ejemplos de arreglos circulares, sabemos que si queremos sentar a cuatro personas una al lado de la otra en fila, el nmero de arreglos que podemos hacer es 4!; ahora bien, si las queremos sentar al rededor de una mesa circular, de cuntas formas lo podemos hacer? Observemos los siguientes arreglos:
A B 1 C D B
A 2 D C C
A 3 B D C
A 4 D B D
A 5 B C D
A 6 C
FI-UAQ
ESQUEMA 4.08 Permutaciones circulares.
Por cada una de las permutaciones o arreglos circulares tenemos 4 de ellos diferentes en fila; esto es, el arreglo circular 1 puede leerse en sentido contrario a las agujas del reloj de las siguientes formas: ABCD, BCDA, CDAB, y DABC, que son 4 arreglos diferentes si fueran en filas; pero es un solo arreglo circular. Entonces, en lugar de tener 4! que es el nmero de arreglos en fila, tenemos solamente . En consecuencia se puede establecer 78 PERMUTACIONES CIRCULARES "El nmero de permutaciones circulares de n elementos tomados todos a la vez es (n - 1) !" y lo denotaremos por Pcir,n = (n - 1)!
Investigar.- Permutacin con repeticin
COMBINACIN.- Es una forma en la que pueden presentarse los objetos y en la que el orden de aparicin no importa. Ejemplo la multiplicacin de los dgitos 2,5,8 el resultado es el mismo. La formula general de las combinaciones viene dada:
n.- nmero total de objetos r.- nmero de objetos a considerar El nmero de objetos tomados a la vez. De cuantas maneras puede elegirse un comit de 4 personas de un club de 15 miembros.
De cuantas maneras puede seleccionarse un comit de 5 hombres y 4 mujeres de un grupo de 10 hombres y 8 mujeres.
Ejercicio. Cuantas palabras de 5 letras 3 consonantes diferentes y 2 vocales diferentes se pueden formar con un alfabeto que consta de 27 letras de los cuales 5 son vocales.
79
Cuantas contienen la letra B y C Cuantas empiezan con B y contienen a C Cuantas empiezan con B y terminan con S Ejemplo. En una caja hay 39 esferas, mezcladas con los nmeros del 1 al 39. Si se toman al azar 6 esferas diga cuntas formas diferentes pueden resultar. Si se considera el orden de aparicin: Si no se considera el orden de aparicin:
4.5 Probabilidad. Esta surge de los juegos de azar, cartas, dados, monedas, etc. Y est relacionada con las tcnicas de conteo. Para conocer una probabilidad es necesario conocer el espacio muestral (E.M.)
Una de las maneras de conocer el EM es a travs del diagrama de rbol, este ayuda a conocer todas las formas posibles en que se da un experimento. Ejemplo: Moneda, lanzar dado. Una probabilidad Priori es conocida de antemano, se sabe que es lo que va a ocurrir. Las leyes de probabilidad sirven para los fenmenos aleatorios. 80 Axiomas de Probabilidad 1.- P(U) = 1 P(E.M.) = 1
2.- P(A)= 0 y 1 para cada evento de A 3.- P(A U B)= P(A)+P (B) si son mutuamente excluyentes Por lo tanto:
Calcular la probabilidad de al lanzar 3 veces una moneda, el resultado sean 2 guilas seguidas.
A= {AAA, 1
AAS, ASA, ASS, SAA, SAS, SSA, SSS} 2 3 4 5 6 7 8
ESQUEMA 4.09 Espacio muestral.
Ahora, si se supone que la moneda presenta un espacio muestral cuyos resultados anteriores tienen las siguientes probabilidades:
Recordando que la sumatoria de los puntos muestrales da como resultado el espacio muestral: Si el evento A es el de calcular la probabilidad de que al lanzar 3 veces una moneda, se presente en el primer lanzamiento guila.
Calcular la probabilidad de que al lanzar un par de dados sus nmeros sean iguales.
81
Ahora, si el evento A es la suma de los nmeros de los 2 dados sea 7. Cul ser su probabilidad?
Es evidente que el conteo de puntos muestrales, es sencillo, pero a medida que ste resulta ms complejo, se hace necesario el apoyo de los mtodos combinatorios. Teoremas de probabilidad. 1.- Si
es el conjunto vaco
2.3.4.-
5.Ejemplo. Si A y B son mutuamente excluyentes y se conoce la P(A)=0.20 y P (B)=0.30
Si no son mutuamente excluyentes se tiene que 82 Ejemplo 1. Una caja contiene 6 resistencias con un voltaje de 10 volts, 3 resistencias con un voltaje de 50 volts y una resistencia con un voltaje de 100 volts. a) Determine la probabilidad de que, al extraer al azar una de stas resistencias, ste tenga un voltaje de 50 de 100 volts.
(
Otra solucin sera
Eventos independientes es cuando no se ven afectados por otros.
b) Determine la probabilidad de que al extraer 2 de stos, ambos sean de 10 volts. La primera resistencia deber de ser de 10 volts.
Pero tambin la segunda resistencia debe ser de 10 volts.
La
probabilidad
de
que
los
eventos
se
presenten
simultneamente es la multiplicacin de ambas. 83
Evento dependiente. Cuando un evento afecta la probabilidad de que suceda otro. Ejemplo 2. Un enorme plato giratorio de madera est dividido en 58 sectores circulares (rebanadas) del mismo tamao de los cuales 14 son azules, 23 son rojos y 21 son verdes. Si se lanzan 2 dardos, diga cul es la probabilidad de que: a) Ambos dardos peguen en sectores azules.
b) Ningn dardo pegue en sector azul. ( ) ( )
c) Uno los 2 dardos peguen en sectores azules.
Ejercicio 1. Un campamento tiene a la mano 1 caja con 20 lmparas que no han sido utilizadas desde el verano anterior. 3 lmparas se quedaron a la intemperie durante el invierno, por lo tanto ya no sirven. Si se seleccionaron 4 lmparas al azar, Cul es la probabilidad de que estn buenas?
n=17, r=4
Ejercicio 2. Se va a seleccionar por lote a un comit de 4 personas a partir de un grupo de 8 hombres, 2 de los cuales son hermanos: a) Cul es la probabilidad de que los hermanos estn en el comit? 84
b) Cul es la probabilidad de que por lo menos1 hermano est en el comit?
Ejercicio3.Se va a seleccionar por lote un comit de 5 hombres a partir de un grupo de 8 norteamericanos, 5 ingleses y 3 mexicanos. Cul es la probabilidad de que el comit est compuesto por 2 norteamericanos, 2 britnicos y 1 mexicano?
Ejercicio 4. De un grupo de 100 estudiantes universitarios, 60 estudiaron biologa, 15 biologa y geologa, 20 geologa, 7 biologa y topografa, 10 topografa, 3 geologa y topografa y 3 estudiaron las 3 materias. Si se selecciona al azar un estudiante, Cul es la probabilidad de que haya estudiado slo una de stas 3 materias?
4.6 Probabilidad condicional. Probabilidad condicionada es la probabilidad de que ocurra un evento A, sabiendo que tambin sucede otro evento B. La probabilidad condicional se escribe P (A|B), y se lee la probabilidad de A dado B. No tiene por qu haber una relacin causal o temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir simultneamente. A puede causar B, viceversa o pueden no tener relacin causal. Las relaciones causales o temporales son nociones que no pertenecen al mbito de la probabilidad. Pueden desempear un papel o no dependiendo de la interpretacin que se le d a los eventos. Definicin (Irwin Miller, 1986). Si A y B son eventos en S y 85
, la
probabilidad condicional de A con respecto a B est dada por
Interpretacin P( A / B ) se puede interpretar como, tomando los mundos en los que B se cumple, la fraccin en los que tambin se cumple A. Si el evento B es, por ejemplo, tener la gripe, y el evento A es tener dolor de cabeza, P( A / B ) sera la probabilidad de tener dolor de cabeza cuando se est
FI-UAQ
enfermo de gripe.
ESQUEMA 4.10 Conjunto P( A / B).
Grficamente, si se interpreta el espacio de la ilustracin como el espacio de todos los mundos posibles, A seran los mundos en los que se tiene dolor de cabeza y B el espacio en el que se tiene gripe. La zona verde de la interseccin representara los mundos en los que se tiene gripe y dolor de cabeza .
En este caso P( A / B ), es decir, la probabilidad de que alguien tenga dolor de cabeza sabiendo que tiene gripe, sera la proporcin de mundos con gripe y dolor de cabeza (color verde) de todos los mundos con gripe: El rea verde dividida por el rea de B. Como el rea verde representa B representa a P (B), formalmente se tiene que: y el rea de 86
Ejemplo 1. Cul es la probabilidad de que al extraer al azar una carta de un juego de naipes ocurra A=As de Trboles, dado que se nos informa que es un Trbol?
Ejemplo 2. Hay 2 tarjetas en un cajn, una negra por ambas caras y otra negra y blanca. Se saca una tarjeta al azar y se coloca sobre la mesa. Se nos dice que la cara que est hacia arriba es negra. Cul es la probabilidad de que la cara que esta hacia abajo sea negra?
Ejercicio 1. Si la probabilidad de que un sistema de comunicacin tenga alta fidelidad es 0.81 y la probabilidad de que tenga alta fidelidad y selectividad es 0.18, Cul es la probabilidad de que un sistema con alta fidelidad tenga tambin alta selectividad?
Solucin. Si A es el evento de que un sistema de comunicacin tenga alta selectividad y B es el evento de que posea alta fidelidad, tenemos que , sustituyendo en la frmula obtenemos Ejercicio 2. Si la probabilidad de que un proyecto de investigacin est bien planeado es 0.80 y la probabilidad de que ser bien planeado y ejecutado es 0.72, Cul es la probabilidad de que un proyecto de investigacin bien planeado tambin est bien ejecutado? Solucin. resultado Sustituyendo en la frmula de probabilidad condicional arroja el 87
4.7 Independencia de eventos. Por definicin, dos eventos A y B no vacos se llaman independientes si ocurre que | , o bien | Es claro que cualquiera de stas 2
igualdades implica la otra, ya que
(Gabriel Velasco, 2001).
O sea que si A y B son independientes, su probabilidad conjunta,
P(A, B) puede ser expresada como el producto de las probabilidades individuales. Equivalentemente: P(A / B) = P(A) P (B / A) = P (B)
En otras palabras, si A y B son independientes, la probabilidad condicional de A dado B es simplemente la probabilidad de A y viceversa. INDEPENDENCIA DE EVENTOS. Dos sucesos A y B son mutuamente excluyentes si y slo si Entonces, . 88 .
Adems, si P(B) > 0 entonces P(A / B) = 0.
Eventos mutuamente excluyentes.
FI-UAQ
ESQUEMA 4.11 Los conjuntos A y B no interceptan. Son mutuamente excluyentes.
4.8 Probabilidad total La probabilidad total de un evento es la suma exhaustiva de las probabilidades de todos los casos mutuamente excluyentes que conducen a dicho evento.(Gabriel Velasco, 2001). Es algo as como sumar todos los caminos que llevan a Roma. Ejemplo 1. Supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cul es la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que haga buen tiempo.
La frmula para calcular esta probabilidad es: |
Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un accidente) es igual a la suma de multiplicar cada una de las probabilidades condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A. Para que este teorema se pueda aplicar hace falta cumplir un requisito: Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%). Ejemplo 2. Al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman un sistema completo, no hay ms alternativas: la suma de sus probabilidades es el 100% Ejemplo 3. Al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema completo, ya que no contempla todas las opciones (podra salir el 5 o el 6). En este caso no se podra aplicar el teorema de la probabilidad total. 89
Ejercicio 1: En un saquito hay papeletas de tres colores, con las siguientes probabilidades de ser elegidas: a) Amarilla: probabilidad del 50%. b) Verde: probabilidad del 30% c) Roja: probabilidad del 20%.
Segn el color de la papeleta elegida, podrs participar en diferentes sorteos. As, si la papeleta elegida es: a) Amarilla: participas en un sorteo con una probabilidad de ganar del 40%. b) Verde: participas en otro sorteo con una probabilidad de ganar del 60% c) Roja: participas en un tercer sorteo con una probabilidad de ganar del 80%. Con esta informacin, qu probabilidad tienes de ganar el sorteo en el que participes?: 1.- Las tres papeletas forman un sistema completo: sus probabilidades suman 100% 2.- Aplicamos la frmula: | 90
Luego,
Por tanto, la probabilidad de que ganes el sorteo es del 54%.
Ejercicio 2: Van a cambiar a tu jefe y se barajan diversos candidatos: a) Carlos, con una probabilidad del 60% b) Juan, con una probabilidad del 30% c) Luis, con una probabilidad del 10% En funcin de quien sea tu prximo jefe, la probabilidad de que te suban el sueldo es la siguiente:
a) Si sale Carlos: La probabilidad de que te suban el sueldo es del 5%. b) Si sale Juan: La probabilidad de que te suban el sueldo es del 20%. c) Si sale Luis: La probabilidad de que te suban el sueldo es del 60%. En definitiva, cul es la probabilidad de que te suban el sueldo?: 1.- Los tres candidatos forman un sistema completo 2.- Aplicamos la frmula:
91
Por tanto, la probabilidad de que te suban el sueldo es del 15%.
4.9 Teorema de Bayes. El teorema de Bayes es un resultado enunciado por Thomas Bayes en 1763 que expresa la probabilidad condicional de un evento aleatorio A dado B en trminos de la distribucin de probabilidad condicional del evento B dado A y la distribucin de probabilidad marginal de slo A.
| (Irwin Miller, 1987).
| |
En trminos ms generales y menos matemticos, el teorema de Bayes es de enorme relevancia puesto que vincula la probabilidad de A dado B con la probabilidad de B dado A. Es decir que sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podra saber -si se tiene algn dato ms-, la probabilidad de tener gripe si se tiene un dolor de cabeza, muestra
este sencillo ejemplo la alta relevancia del teorema en cuestin para la ciencia en todas sus ramas, puesto que tiene vinculacin ntima con la comprensin de la probabilidad de aspectos causales dados los efectos observados.
Thomas Bayes. Telogo, matemtico y miembro de la Royal Society desde 1742, Bayes fue el primero en utilizar la probabilidad inductivamente y establecer una base matemtica para la inferencia probabilstica (la manera de calcular, a partir de la frecuencia con la que un acontecimiento ocurri, la probabilidad de que ocurrir en el futuro). La frmula de Bayes encuentra aplicaciones importantes en la teora de artillera de largo alcance como es conocer con ms precisin las condiciones de tiro. Gnedenko, B. V., The Theory of Probability, 4th Ed., Chelsea Publishing Company, 1968.
92
Vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema tambin exige que el suceso A forme un sistema completo.
Ejemplo 1. El parte meteorolgico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente: a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10% c) Si hay niebla: probabilidad de accidente del 5%. Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no sabemos qu tiempo hizo (llovi, nev o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades: Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el 20%). Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori". 93
Vamos a aplicar la frmula: | | |
a) Probabilidad de que estuviera lloviendo:
La probabilidad de que efectivamente estuviera lloviendo el da del accidente (probabilidad a posteriori) es del 71,4%. b) Probabilidad de que estuviera nevando:
La probabilidad de que estuviera nevando es del 21,4%. c) Probabilidad de que hubiera niebla:
La probabilidad de que hubiera niebla es del 7,1% Ejemplo 2. Los 4 ayudantes de una gasolinera deben limpiar el parabrisas de los autos de los clientes. Juan, quien atiende el 20% de todos los autos, no cumple su cometido 1 vez cada 20 autos; Toms quien atiende el 60% de los autos, no limpia el parabrisas 1 vez cada 10 autos; Jorge quien atiende el 15% de ellos, no cumple su cometido 1 vez cada 10 autos; y Pedro quien atiende al 5% de los autos, no limpia el parabrisas una vez cada 20 autos. Si un cliente se queja de que su parabrisas no fue lavado, Cul es la probabilidad de que lo haya atendido Juan? Solucin. Sustituyendo las diversas probabilidades en el teorema, obtenemos | Y es interesante observar que si bien Juan no lava el parabrisas de slo un auto por cada 20, es decir, el 5% de los autos; ms del 11% de los parabrisas que no son lavados en la gasolinera estn bajo su responsabilidad.
94
UNIDAD 5: VARIABLES ALEATORIAS. OBJETIVO: Estudiar y analizar el concepto de variable aleatoria como la representacin de cualquier fenmeno aleatorio. Supongamos que a cada punto del espacio muestral le asignamos un nmero. Tenemos entonces una funcin definida en el espacio muestral. Esta funcin recibe el nombre de variable aleatoria (o variable estocstica). Usualmente se denota con una letra mayscula, como X o Y. En general, una variable aleatoria tiene alguna significacin fsica, geomtrica o de otro tipo. (R. Murray, 2007). Variable aleatoria.- Es una funcin que a cada elemento de un espacio muestral le asocia un numero real. Funcin de probabilidades.La funcin de probabilidades para una variable aleatoria discreta X es el conjunto de pares ordenados. { } 95
Es la probabilidad asociada con el valor particular de X y debe cumplir con las siguientes condiciones:
La funcin de probabilidad deben ser probabilidades positivas hasta 1.
Funcin de distribucin de probabilidad Funcin de densidad de probabilidad

TABLA 5.01 Funciones de probabilidad.
Cualquier formas.
fenmeno medido se va a poder llevar a cualquiera de estas 2
Lo anterior simplifica un universo de poblacin. Caracterizar la funcin, para que nos d ms informacin de la que existe (Media, varianza, S), para definir stas caractersticas se efectan los llamados momentos de una variable aleatoria.
96
-Esperanza (Media) Momentos de una variable aleatoria -Varianza -Skewness (Asimetra) -Kurtosis (Suavidad)
ESQUEMA 5.01 Momentos de una variable aleatoria.
Ilustracin. Aunque en el siguiente diagrama se cumple considerarse funcin de probabilidad ya que
no puede no cumple
No es funcin de probabilidad
0.5
FI-UAQ
ESQUEMA 5.02 No es funcin de probabilidad.
97
Ejemplo: Si se define la variable aleatoria X = nmero de caras obtenidas al arrojar dos monedas.
s
ss cc sc cs
Rx 0 2 1
FI-UAQ
ESQUEMA 5.03 Espacio muestral.
Qu valores puede tomar x?
Se denomina recorrido Rx al conjunto de valores que puede tomar la variable.
Existen dos tipos de variaciones aleatorias Discretas.- Es cuando tiene un conjunto definido de valores posibles (nmeros que no tienen posibilidad intermedia). Ejemplos: El nmero de hijos de una familia, la puntuacin obtenida al lanzar un dado. 98
Continuas.- Cuando toma cualquier valor de un intervalo dado (toma posibilidades intermedias infinitas). Ejemplos: La altura de los alumnos de una clase, las horas de duracin de una pila. Ejercicio. De las siguientes variables indica cules son discretas y cuales son continuas. 1.- Nmero de acciones vendidas cada da en la Bolsa. Discreta 2.-Temperaturas registradas cada hora en un observatorio. Continua 3.-Perodo de duracin de un automvil. Continua 4.- El dimetro de las ruedas de varios coches. Continua 5.-Nmero de hijos de 50 familias. Discreta 6.- Censo anual de los mexicanos. Discreta
5.1 Variables aleatorias discretas. Una variable aleatoria es discreta cuando toma un nmero contable de valores. Entonces entre dos valores consecutivos de una variable aleatoria discreta no hay ningn nmero que pertenezca al recorrido de la variable. { } Donde cada Xi es un valor de la variable aleatoria. 99
En general, estos valores no sern igualmente probables, sino que cada X tendr asignada una probabilidad. Luego, para caracterizar una variable aleatoria discreta es necesario conocer su recorrido y la probabilidad de cada elemento del recorrido Sigamos con el ejemplo X = Cantidad de caras al tirar dos monedas P(X = 0) = P (SS) = P(X = 1) = P (SC; CS) = P(X = 2) = P (CC) =
Funciones de probabilidad P(x)

0.50
0.25
x 0 1 2
FI-UAQ
ESQUEMA 5.04 Funciones de probabilidad.
Propiedades: 1) P (Xi) 0 2) P (xi) = 1

100 Ejemplo.- Se toma una muestra en una ciudad de 10 000 personas para ver el nmero de horas completas que ven TV diariamente. Tenindose los siguientes resultados:
No de horas
0 10 0
8 180 8
9 10 9
Total 10,000 Variable de la variable aleatoria X Probabilidad asociada a la funcin de probabilidad = 1
1000 2000 3000 2500 700 400 200 1 2 3 4 5 6 7
0.001
0.1
0.2
0.3
0.25 0.07 0.04 0.02 0.018 0.001
TABLA 5.02 Frecuencias.
Lo anterior debe cumplir 2 condiciones:
Esto es que el 14.9% de las personas ven 5hrs ms de TV de las 10 000 personas. Un modelo de probabilidad puede ser cualquier funcin de notada por:
101
X 1 3/35 3/35 2 5/35 8/35 3 7/35 15/35 4 9/35 24/35 5 11/35 35/35 Total 1
TABLA 5.03 Probabilidades.
Cuando X=1, Esto puede ser una funcin de probabilidad. En la prctica se hacen modelos probabilsticos ya establecidos. Poisson, T student, Ji-cuadrado, Normal, Binomial. Construir el histograma de probabilidades para la variable aleatoria X. Si existieran datos de temperatura, la variable aleatoria relacionada seria T.
Histograma de probabilidades
12/35 12/35
Temperaturas
V.Discreta
10/35
V.Discreta
10/35
8/35
8/35
fx
(x)
6/35
ft
(t)
6/35
4/35
4/35
2/35
2/35
4 5 2 3 Variable aleatoria X
-3
-2 -1 0 1 Variable aleatoria t FI-UAQ
ESQUEMA 5.05 Histograma de probabilidades.
Funcin de distribucin acumulativa de probabilidades viene dada por:
Propiedades:
102
Ejemplo: Calificaciones de alumnos

E 1 0.1 0.1 2 0.2 0.3 3 0.4 0.7 4 0.2 0.9 5 0.1 1
V.A. DISCRETA FUNCIN DE DISTRIBUCIN DE PROBABILIDAD F. DE DIST. ACUMULATIVA DE PROBABILIDADES
TABLA 5.04 Ejemplo: Calificaciones de alumnos.
1.0
0.4
0.8
fE
(e)
0.3
FE
(e)
0.6
0.2
0.4
0.1
0.2
4 5 2 3 Variable aleatoria E
4 5 2 3 Variable aleatoria E FI-UAQ
ESQUEMA 5.06 Variable aleatoria.
5.2 Variables aleatorias continuas.
Variable aleatoria continua: Su caracterstica es que tiene infinidad de posibilidades intermedias. 103
fx
(x)
Da la forma; no existe ningn salto, y no se puede sumar, se necesita efectuar una integracin.
Densidad de probabilidades.
a b
Variable aleatoria FI-UAQ
ESQUEMA 5.07 Variable aleatoria continua.
Se debe determinar un intervalo para calcular probabilidades
Se trabaja con: Funcin de densidad de probabilidades. Para variables aleatorias continuas, la distribucin terica o FUNCION DE DENSIDAD DE PROBABILIDAD (FDP) puede representarse por una curva continua.
Por DENSIDAD entendemos la concentracin de probabilidad dentro de un intervalo de valores de la variable x. Esta PROBABILIDAD puede ser interpretada como un AREA (integral) bajo la curva f(x), llamada CURVA DE DENSIDAD, limitada por las ordenadas en dos puntos de un intervalo. 104 Esta se caracteriza por tener un continuo de valores.
Funcin de densidad f. La probabilidad de un intervalo es el rea que existe entre la funcin y el eje de abscisas.
P[a<X<b] a b
x
FI-UAQ
ESQUEMA 5.08 Funcin de densidad.
La funcin da la forma; no existe ningn salto, no se puede sumar, se necesita efectuar una integracin. Observacin. Por ser f una funcin integrable, la probabilidad de un punto es nula: [ ] [ ]
Y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad nula: [ ] [ ] [ ] [ ]
Se debe determinar un intervalo para calcular probabilidades P(a< X <b). 105
5.3 Medidas de tendencia central de una variable aleatoria.
Los momentos de una variable aleatoria X son los valores esperados de algunas funciones de la variable aleatoria X y constituyen una coleccin de medidas descriptivas con las que se puede caracterizar de manera nica a su distribucin de probabilidad f(x). Usualmente estas definiciones se las hace usando como referencia el origen, o la media de X.
Bernoulli Binomial Distribuciones discretas Poisson Hipergeomtrica Modelos probabilsticos ms usados Gamma Normal - N. estndar Distribuciones contnuas Log-Lineal Raleigh Weibull Gumbel FI-UAQ Binomial negativa
ESQUEMA 5.09 Modelos probabilsticos.
En este apartado se analizarn el momento que describe la tendencia central de la variable aleatoria, con respecto al origen y con respecto a la media. Momentos respecto del origen Dada una variable aleatoria X con funcin de probabilidad o densidad f(x) podemos definir una funcin de X que sea igual a la variable elevada a un exponente entero no negativo. 106
El valor esperado de z(x) es el k-simo momento de la variable X respecto a su origen: [ ]
[ [ ]
] [ ]
A este primer momento respecto al origen que es igual al valor esperado se le llama tambin media aritmtica de la variable y se le denomina 1, simplemente .
En la mayora de los casos, la media expresa la tendencia central de la variable o el orden de magnitud de sus valores. El resto de los momentos respecto al origen tienen escaso inters en la mayora de los casos.
El primer momento con respecto al origen es la esperanza o media de X al origen. El primer momento
107
Ejemplo:
-3
-2
-1
0.1 0.2 0.4 0.2 0.1 1
Aplicando el primer momento respecto al origen se tiene:
Para visualizar que la media se encuentra en ese valor se grafica el histograma de probabilidades.
50% 0.4
50%
fw
(w)
0.3
El valor de la media es un valor de la variable aleatoria.
0.2
0.1
w -3 FI-UAQ -2 -1 0 1
Punto de equilibrio Esperanza de W=Mx
ESQUEMA 5.10 Punto de equilibrio.
Momentos respecto a la media Dada una variable aleatoria X con funcin de probabilidad o densidad f(x) podemos definir una funcin de X que sea igual a la diferencia entre la variable y su media aritmtica elevada a un exponente entero no negativo. 108 El valor esperado de z(x) es el k-simo momento de la variable X respecto a la media y se llama k. [ ]
[ [ ] [
] ] [ ]
Es decir, en cualquier variable aleatoria su primer momento respecto de la media es igual a 0. Esta propiedad se utilizar reiteradamente en las demostraciones estadsticas.
5.4 Medidas de dispersin de una variable aleatoria.
Este segundo momento respecto de la media se le llama tambin varianza. [ ]
109
La varianza de una variable mide la dispersin de sus valores respecto al valor central . Para calcular la varianza por un mtodo ms sencillo se utiliza la expresin: [ ] [ ] [ ] [ ]
Es decir, la varianza de una variable es igual a la media de los cuadrados menos el cuadrado de la media.
5.5 Medidas de posicin de una variable aleatoria. Volviendo al tema de los momentos respecto a la media, veamos los dos siguientes que tambin son interesantes, [ ] 110
El tercer momento respecto de la media mide la asimetra de la distribucin, es decir, si existen o no observaciones muy extremas en algn sentido con frecuencias razonablemente altas. Si la asimetra es negativa, la variable toma valores muy bajos con mayor frecuencia que valores muy altos y se dice que tiene una cola izquierda pesada o que es asimtrica hacia la izquierda. Si la asimetra es positiva, la variable toma valores muy altos con mayor frecuencia que valores muy bajos y se dice que tiene una cola derecha pesada o que es asimtrica hacia la derecha. Si la asimetra es cero, los valores bajos y altos de la variable tienen probabilidades iguales (el ejemplo ms tpico de variable simtrica es la variable normal) La asimetra tiene el mismo problema que la varianza y la covarianza en cuanto a sus unidades de medida y, por ello, normalmente se utiliza una medida adimensional de la asimetra que es el coeficiente de asimetra, g1, que se calcula como el cociente entre el tercer momento y el cubo de la desviacin tpica.
ESQUEMA 5.11 Coeficiente de asimetra.
Resumen momentos con respecto a la media. Definicin (r-simo momento con respecto a la media) Se buscan otros momentos a partir de la media, r es un entero positivo
El primer momento respecto a la media = 0 Si r=1
111
Propiedades de la esperanza E(x)=x

a) b) c) d)
El segundo momento respecto a la media = varianza Si r=2
Propiedades de la varianza Var(x)

a) b) c) d) e) [ ]
El tercer momento respecto a la media = Skewness
Si r=3
El cuarto momento respecto a la media = Curtosis Si r=4
112
5.6 Medidas de apuntamiento de una variable aleatoria.
El cuarto momento respecto de la media mide la curtosis de la distribucin, es decir, la forma de la distribucin de probabilidad. Al representar grficamente variables con curtosis pequea, platicrticas, se observan curvas o histogramas con colas cortas y aspecto aplanado o en meseta; si la variable tiene curtosis grande, es decir, si es leptocrtica, su grfica es alta y estilizada, con colas largas y pesadas. La curtosis de una variable siempre es positiva y se mide en las unidades de la variable elevadas a potencia 4. Por tanto, nuevamente se nos plantean los problemas relacionados con las unidades de medida y las escalas y necesitamos una medida adimensional de la curtosis. Esta medida
adimensional de la curtosis es el coeficiente de curtosis, g2, que se calcula como el cociente entre el cuarto momento y el cuadrado de la varianza, al que se le resta 3 unidades. Esta correccin se debe a que, sin ella, las variables normales tendran coeficiente de curtosis igual a 3; al restar 3 conseguimos que el coeficiente de curtosis de la variable normal sea 0 y que las variables platicrticas tengan coeficiente de curtosis negativo y la leptocrticas positivo, lo cual es ms mnemotcnico que la distincin entre curtosis pequea y grande.
FI-UAQ
g2 = 0
g2 > 0
g2 < 0
113
ESQUEMA 5.12 Coeficiente de curtosis
Ejercicio propuesto. Graficar y encontrar Mx1S que son las distancias donde se localiza la mayor parte de los datos.
-3 0.1 -0.3
-2 0.2 -0.4
-1 0.4 -0.4
0 0.2 0
1 0.1 0.1
1 -1 0 0
VAR(x) 1.2
TABLA 5.05 Ejercicio de momentos.
Nota: ningn modelo modela al 100%. El modelo presenta una muy buena aproximacin.
UNIDAD 6: MODELOS PROBABILSTICOS BSICOS. OBJETIVO: Anlisis y conocimiento de las diferentes condiciones de aplicacin de las funciones de distribuciones de variables aleatorias s. Cuando la distribucin de una variable aleatoria permite representar (as sea de manera aproximada) el comportamiento aleatorio de una variable bajo estudio decimos que tenemos un modelo probabilstico para la variable. Un modelo probabilstico de una variable aleatoria X. Es la forma especfica de la funcin de probabilidades que se supone refleja el comportamiento de X. Las probabilidades que se presentan en el estudio de un fenmeno son descritas por ciertas constantes denominadas o conocidas como parmetros, que son caractersticas de la poblacin. Para los estimadores se usan letras latinas. Para los parmetros se usan letras griegas 114
Bernoulli Binomial Distribuciones discretas Poisson Hipergeomtrica Modelos probabilsticos ms usados Gamma Normal - N. estndar Distribuciones contnuas Log-Lineal Raleigh Weibull Gumbel FI-UAQ Binomial negativa
ESQUEMA 6.01 Modelos probabilsticos.
Todos estos modelos estn caracterizados, esto es que se conoce su X y su S efectuado con los momentos las probabilidades asociadas a ellos ya estn calculadas. En inferencia estadstica se tienen otros modelos como son: Ji-cuadrada, t de student, F, etc. que vienen derivados de la normal estndar y esta viene de la normal.
FI-UAQ
Cualquier valor normal se va a llevar a una variable (Z) con X=0, S
115
-1
ESQUEMA 6.02 Distribucin normal.
El smbolo
significa se distribuye.
n-Grados de libertad. m-Grados de libertad.
6.1 Distribuciones discretas
Modelo probabilstico (M.P) Bernoulli o Binomial Puntual. Este es un modelo de arranque para los otros modelos.
Se presenta en la tabla siguiente:
Var(x) X= 0,1
Caractersticas M={xito (1) o fracaso (0)}
pq
TABLA 6.01 Modelo de Bernoulli.
Es una distribucin de probabilidad discreta, que toma valor 1 para la probabilidad de xito (p) y valor 0 para la probabilidad de fracaso (q = 1 p). Si X es una variable aleatoria que mide "nmero de xitos", y se realiza un nico experimento con dos posibles resultados (xito o fracaso), se dice que la variable aleatoria X se distribuye como una Bernoulli de parmetro p. 116
XBe(p) La frmula ser: f(x) = px(1 p)1 x con x = {0,1} Su funcin de probabilidad viene definida por:
Un experimento al cual se aplica la distribucin de Bernoulli se conoce como Ensayo de Bernoulli o simplemente ensayo, y la serie de esos experimentos como ensayos repetidos. Esperanza matemtica: E[X]= p Varianza: Var [X]= p (1 p) = pq
Moda: 0 si q > p (hay ms fracasos que xitos) 1 si q < p (hay ms xitos que fracasos) 0 y 1 si q = p (los dos valores, pues hay igual nmero de fracasos que de xitos)
Asimetra (Sesgo):
117
Curtosis:
La Curtosis tiende a infinito para valores de p cercanos a 0 a 1, pero para p=1/2 la distribucin de Bernoulli tiene un valor de curtosis menor que el de cualquier otra distribucin, igual a -2. Ejemplo 1. "Lanzar una moneda, probabilidad de conseguir que salga cruz". Se trata de un solo experimento, con dos resultados posibles: el xito (p) se considerar sacar cruz. Valdr 0,5. El fracaso (q) que saliera cara, que vale (1 p) = 1 - 0,5 = 0,5. La variable aleatoria X medir "nmero de cruces que salen en un lanzamiento", y slo existirn dos resultados posibles: 0 (ninguna cruz, es decir, salir cara) y 1 (una cruz). Por tanto, la v.a. X se distribuir como una Bernoulli, ya que cumple todos los requisitos. XBe (0,5)
P(X = 0) = f (0) = 0,500,51 = 0,5 P(X = 1) = f(1) = 0,510,50 = 0,5 Ejemplo 2. "Lanzar un dado y salir un 6". Cuando lanzamos un dado tenemos 6 posibles resultados: = {1,2,3,4,5,6} Estamos realizando un nico experimento (lanzar el dado una sola vez). Se considera xito sacar un 6, por tanto, la probabilidad segn el teorema de Laplace (casos favorables dividido entre casos posibles) ser .
118
Se considera fracaso no sacar un 6, por tanto, se considera fracaso sacar cualquier otro resultado.
La variable aleatoria X medir "nmero de veces que sale un 6", y solo existen dos valores posibles, 0 (que no salga 6) y 1 (que salga un 6). Por tanto, la variable aleatoria X se distribuye como una Bernoulli de parmetro
La probabilidad de que obtengamos un 6 viene definida como la probabilidad de que X sea igual a 1.
La probabilidad de que NO obtengamos un 6 viene definida como la probabilidad de que X sea igual a 0.
xito: Es el fenmeno de inters. Ejemplo en una fbrica el xito pudiera ser encontrar un producto defectuoso. Sentido contrario al cotidiano. Ejemplo 3. Supngase que en una imprenta se producen libros de los cuales 3 son defectuosos y 30 son no defectuosos. Se elige un libro de tal manera que cada uno de ellos tiene la misma probabilidad de ser escogido. Se registra si el artculo es defectuoso y si lo es, se anota como xito. En caso contrario se anota como fracaso.
119
Control de calidad: 33 artculos.
Bueno (30) Defectuoso (3)
FI-UAQ
ESQUEMA 6.03 Artculos registrados.
P (E) = 3/33 P (q) = 30/33
P=P (xito) q= P (fracaso)
Aplicando Bernoulli
( (
) )
( (
) )
HISTOGRAMA DE PROBABILIDADES
fx
(x)
Concentracin de informacin segn Chevicheff
120
X 0
v.a.
FI-UAQ
ESQUEMA 6.04 Histograma de probabilidades.
Binomial. Es la Bernoulli aplicada n veces en forma repetida Modelo probabilstico Binomial.

Var(x) X= 0,1,2,,n Caractersticas M= {E, F}, Los ensayos son impedientes.
np
npq
TABLA 6.02 Modelo Binomial.
La distribucin binomial es una distribucin de probabilidad discreta que mide el nmero de xitos en una secuencia de n ensayos independientes de Bernoulli con una probabilidad fija p de ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotmico, esto es, slo son posibles dos resultados. A uno de estos se denomina xito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se repite n veces, de forma
independiente, y se trata de calcular la probabilidad de un determinado nmero de xitos. Para n = 1, la binomial se convierte, de hecho, en una distribucin de Bernoulli. Para representar que una variable aleatoria X sigue una distribucin binomial de parmetros n y p, se escribe:
121 Las siguientes situaciones son ejemplos de experimentos que pueden modelarse por esta distribucin:
Se lanza un dado diez veces y se cuenta el nmero X de tres obtenidos: entonces X ~ B(10, 1/6)
Se lanza una moneda cuatro veces y se cuenta el nmero X de caras obtenidas: entonces X ~ B(4, 1/2)
Una partcula se mueve unidimensionalmente con probabilidad p de moverse hacia atrs y q de moverse hacia adelante.
Existen muchas situaciones en las que se presenta una experiencia binomial. Este tipo de experiencias se caracteriza por estar formada por un nmero predeterminado n de experimentos iguales. Cada uno de los experimentos es independiente de los restantes (la probabilidad del resultado de un experimento no depende del resultado del resto). El resultado de cada experimento ha de admitir slo dos categoras (a las que se denomina xito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes en todos los experimentos (se denotan como p y q p y 1-p). Se designa por X a la variable que mide el nmero de xitos que se han producido en los n experimentos. Cuando se dan estas circunstancias, se dice que la variable X sigue una distribucin de probabilidad binomial, y se denota B(n, p). Su funcin de probabilidad es
( )
Donde Siendo( x en x).
las combinaciones de n en x (n elementos tomados de 122
Ejemplo1. Tiro al blanco. La probabilidad de que Ana logre un objetivo en cualquier momento es p=1/3, ella pierde con q=2/3. Suponga que ella dispara 7 veces al objetivo. Encuentre la probabilidad de que ella alcance el objetivo 3 veces. ( )
( )( )
)( )
Ejemplo 2 Supongamos que se lanza un dado 50 veces y queremos la probabilidad de que el nmero 3 salga 7 veces. En este caso tenemos una X ~ B (50, 1/6) y la probabilidad sera P(X=7):
)( )
)( )
Ejemplo 3. La probabilidad que un hombre de en el blanco es de 0.25. Si dispara 7 veces, Cul es la probabilidad de que 2 den en el blanco? 1.- Ver si el modelo se ajusta al problema. 123
( ) ( ) ( )
( )
Ejemplo 4. El examen de estadstica est diseado para que el 70% con un coeficiente intelectual de 90 lo aprueben: Encontrar las probabilidades para que entre 15 personas con el mismo C.I de 90 lo presentan. Cul es la probabilidad de que: a) 12 lo aprueben b) Cuando ms de 6 lo aprueben c) Cuando menos 12 lo aprueben
0.0152
EJERCICIO PROPUESTO. Graficar el histograma de probabilidades para aplicando Binomial. n=12, P=0.6, as como
Resumen Identificar la variable aleatoria Binomial Prueba de asociacin Forma de distribucin Valor representativo Poisson. En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta que expresa la probabilidad que un determinado nmero de eventos ocurran en un determinado periodo de tiempo, dada una frecuencia media conocida e independientemente del tiempo discurrido desde el ltimo evento. Fue descubierta por Simon-Denis Poisson, que la dio a conocer en 1838 en su trabajo Recherches sur la probabilit des jugements en matirescriminelles et matirecivile (Investigacin sobre la probabilidad de los juicios en materias criminales y civiles). La probabilidad de xito es muy rara, el valor promedio de defectuosos se efecta considerando todos los lotes. (Alto grado de control de calidad). 124
Var(x)
Caractersticas
-=Promedio
de xitos en n repeticiones. -La probabilidad de xito es pequea.

TABLA 6.03 Modelo de Poisson.
Bernoulli
Binomial
Defecto cte. por lote
Poisson
E E E E E E F F F F F F E E E E E E F F F F F F E E E E E E F F F F F F
Defecto mnimo por bloque.
Particular
Lote
E F
E E F F E E F F
125
FI-UAQ
ESQUEMA 6.05 Comparacin de Bernoulli, Binomial yPoisson.
La funcin de masa de la distribucin de Poisson es:
Donde
k es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento suceda precisamente k veces). es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribucin de Poisson con = 104 = 40.
e es la base de los logaritmos naturales (e = 2,71828 ...)
Tanto el valor esperado como la varianza de una variable aleatoria con distribucin de Poisson son iguales a . La distribucin de Poisson es el caso lmite de la distribucin binomial. De hecho, si los parmetros n y de una distribucin binomial tienden a infinito de manera que de Poisson. se mantenga constante, la distribucin lmite obtenida es
Aproximacin normal Como consecuencia del teorema central del lmite, para valores grandes de , una variable aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente
126 Converge a una distribucin normal de media nula y varianza 1.
Ejemplos. La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio. Ejemplos de estos eventos que pueden ser modelados por la distribucin de Poisson incluyen:
El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente distantes de los semforos) durante un periodo definido de tiempo.
El nmero de errores de ortografa que uno comete al escribir una nica pgina.
El nmero de llamadas telefnicas en una central telefnica por minuto. El nmero de servidores web accedidos por minuto. El nmero de animales muertos encontrados por unidad de longitud de ruta.
El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad de radiacin.
El nmero de ncleos atmicos inestables que decayeron en un determinado perodo en una porcin de sustancia radiactiva. La radiactividad de la sustancia se debilitar con el tiempo, por lo tanto el
tiempo total del intervalo usado en el modelo debe ser significativamente menor que la vida media de la sustancia.

El nmero de estrellas en un determinado volumen de espacio. La distribucin de receptores visuales en la retina del ojo humano. La inventiva de un inventor a lo largo de su carrera.
Ejemplo 1. Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas usamos la distribucin de Poisson. En este caso concreto, k es 5 y , , el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es
127
Este problema tambin podra resolverse recurriendo a una distribucin binomial de parmetros k = 5, n = 400 y =0,02. Ejemplo 2. Un auditor examina la lista de asistencia y se sabe que el nmero de inasistencias en promedio y considerando todo el ao presenta una distribucin Poisson con Cul es la probabilidad de que el auditor encuentre: a) 0 inasistencias.
b) 2 inasistencias.
c) 3 o ms inasistencias.- De tablas se tiene.
128 d) 3 o menos inasistencias.- De tablas. =43.35%
Hipergeomtrica. Si una variable aleatoria X definida en un espacio de probabilidad representa al nmero de xito en una muestra aleatoria de n elementos que se extrae de una poblacin con N elementos, su funcin de densidad es tambin es:
N = Tamao de poblacin. n = Tamao de muestra. C = Todos o cantidad de elementos que cumple caracterstica deseada. X = Cantidad de xitos. EJEMPLO 1. En una jaula hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar calcular posibilidad de que 3 de ellos hablen chino (caracterstica deseada). N = 50
n = 10 C = 20 X=3 ( )( ( ) 129 )
EJEMPLO 2. De los 20 hombres y 18 mujeres del saln el 50% rprobo el examen de estadstica, si tomamos 10 alumnos al azar probabilidad. A) 4 alumnos reprobados B) 3 mujeres reprobadas A) N = 38 n = 10 c = 19 x=4 ( )( ( ) )
B) N = 38 n = 10 C=9 x=3 ( )( ( ) )
130
En un vagn de ferrocarril que acarrea a 60 reses el 20% de ellas estn enfermas de vaca loca, si extraemos con propsito de inspeccin sanitaria una muestra del 10% de las reses calcula la probabilidad de que hayan 2 vacas con dicha enfermedad? N = 60 n=6 c = 12 x=2 ( )( ( ) )
De 60 aspirantes a la UNIVERSIDAD 40 son de Baja California, si seleccionamos 20 aspirantes al azar Calcular la probabilidad de que 10 sean de Baja California? N = 60 n = 20 c = 12 x = 10 ( )( ( ) ) 131
6.2 Distribuciones continuas Normal. Se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el
diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos.
La distribucin normal fue presentada por vez primera por Abraham de Moivre en un artculo del ao 1733, que fue reimpreso en la segunda edicin de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximacin de la distribucin binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teora analtica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace. Laplace us la distribucin normal en el anlisis de errores de experimentos. El importante mtodo de
2
132
mnimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el mtodo desde 1794, lo justific rigurosamente en 1809 asumiendo una distribucin normal de los errores. El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin cuando analizaba datos astronmicos y algunos autores le atribuyen un descubrimiento independiente del de De Moivre. Esta atribucin del nombre de la distribucin a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler. El nombre de "campana" viene de Esprit Jouffret que us el trmino "bell surface" (superficie campana) por primera vez en 1872 para una distribucin normal bivariante de componentes independientes.
1. Abraham de Moivre, "Approximatio ad Summam Terminorum Binomii (a + b) in Seriem expansi" (impreso el 12 de noviembre de 1733 en Londres para una edicin privada).], Apndice 5, pginas 254-267. 2. Havil, 2003.
n
3. Wussing, Hans. Leccin 10. Lecciones de Historia de las Matemticas (1 (castellano)

edicin). Siglo XXI de Espaa Editores, S.A.. pp. 190.
Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son:

Caracteres morfolgicos de individuos como la estatura; Caracteres fisiolgicos como el efecto de un frmaco; Caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos;
Caracteres psicolgicos como el cociente intelectual; Nivel de ruido en telecomunicaciones; Errores cometidos al medir ciertas magnitudes; etc.
133
La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las mediasmuestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos test estadsticos estn basados en una supuesta "normalidad". Funcin de densidad. Se dice que una variable aleatoria continua X sigue una distribucin normal de parmetros y y se denota X~N(, ) si su funcin de densidad est dada por:
Donde (mu) es la media y (sigma) es la desviacin estndar (2 es la varianza). Se llama distribucin normal "estndar" a aqulla en la que sus parmetros toman los valores = 0 y = 1. En este caso la funcin de densidad tiene la siguiente expresin:
Su grfica se muestra abajo y con frecuencia se usan tablas para el clculo de los valores de su distribucin.
134
0.4
FI-UAQ
0.3
0.2
34.1%
34.1%
0.1 2.1% 0.1% 0.0 13.6% 13.6% 2.1% 0.1%
ESQUEMA 6.06 Distribucin de probabilidad alrededor de la media en una distribucin N ( , ).
Algunas propiedades de la distribucin normal son: 1. Es simtrica respecto de su media, ; 2. La moda y la mediana son ambas iguales a la media, ; 3. Los puntos de inflexin de la curva se dan para x = y x = + . 4. Distribucin de probabilidad en un entorno de la media:
1. En el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el 68,26% de la distribucin; 2. En el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3. Por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar. 135
Ejercicio 1.
Supongamos que sabemos que el peso de una mquina de control sigue una distribucin aproximadamente normal, con una media de 140 kg y una desviacin estndar de 20 kg. Determine: a) La probabilidad de que una mquina tenga un peso menor o igual a 150 kg. b) La probabilidad de que una mquina, elegida al azar, tenga un peso mayor o igual a 150 kg. c) La probabilidad de que una mquina, elegida al azar, tenga un peso entre 115 y 150 kgs. a) La probabilidad de que una mquina tenga un peso menor o igual a 150 kg.
Paso 1. Interpretar grficamente el rea de inters.
P(X<150)
140
150
136
FI-UAQ
ESQUEMA 6.07 Paso 1.
Paso 2. Determinar el valor de Z
Paso 3. Buscar en la tabla del rea bajo la curva normal
Paso 4. Hacer la suma o resta de reas para encontrar la probabilidad deseada.
0.50
0.1915
P(X<150)
140
150
FI-UAQ
b) La probabilidad de que una mquina, elegida al azar, tenga un peso mayor o igual a 150 kg. Paso 1. Interpretar grficamente el rea de inters.
137
P(X>150)
140
150
FI-UAQ
Paso 2. Determinar el valor de Z
P(X>150)
0.1915
FI-UAQ
c) La probabilidad de que una mquina, elegida al azar, tenga un peso entre 115 y 150 kgs.
Paso 1. Interpretar grficamente el rea de inters.
P(115l <X<150)
138
115
140
150
FI-UAQ
Paso 2. Determinar el valor de Z Cuando
Cuando
P(115 <X<150)
139
0.3944 0.1915
FI-UAQ
Para resolver en clase Ejercicio 2. Se desea encontrar la probabilidad de que
P(Z<1.73)
P(Z>1.73)
1.73
FI-UAQ
ESQUEMA 6.13 Ejercicio 2.
Ejercicio 3. Se desea encontrar
P(-0.17 <Z<1.82)
140
-0.17 0
1.82
FI-UAQ
ESQUEMA 6.14 Ejercicio 3
Ejercicio 4. Se desea conocer
P(-3.6 <Z<3.6)
-3.6
3.6
FI-UAQ
Ejercicio 5. Se desea encontrar
P(-2.6 <Z<2.6)
141
2.6 0 2.6
FI-UAQ
Se aprecia al comparar el ejercicio 4 & 5 que ambas probabilidades son casi iguales teniendo una diferencia de la variable aleatoria de 1. Ejercicio 6. Se desea encontrar la probabilidad de que
P(Z<-1.4)
P(Z>2.8)
-1.4
2.8
FI-UAQ
Se les conoce cono zonas de rechazo en la prueba de hiptesis.
Ejercicio 7. Se desea encontrar la probabilidad de Z tal que
142
-1.71
FI-UAQ
Ejercicio 8. Se desea encontrar Z tal que
0.95
0.025
0.025
-Z
FI-UAQ
Esta es una forma de encontrar valores de la variable aleatoria a partir de una probabilidad dada. Ejercicio 9. Sea X una variable aleatoria N (50,10), se quiere encontrar la probabilidad de
Primero se estandariza la funcin normal. 143
0.0228
-2
FI-UAQ
Ejercicio 10. Si Cul es la probabilidad de que X est entre -3.1 y 9.2?
Primero se estandariza la funcin normal para ambas X.
-1.025
2.05
144
FI-UAQ
Esta es la probabilidad asignada a los datos originales.
T de student. Es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.
La distribucin de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fbrica de cerveza, Guiness, que prohiba a sus empleados la publicacin de artculos cientficos debido a una difusin previa de secretos industriales. De ah que Gosset publicase sus resultados bajo el seudnimo de Student.
1
Walpole, Roland; Myers, Raymond y Ye, Keying (2002). Probability and Statistics for Engineers and Scientists. Pearson Education.
Presenta un parecido a la normal.
Comparacin distribucin normal y T de student Normal
T de student
145
-t( )
t( )
FI-UAQ
ESQUEMA 6.22 Comparacin entre Normal y T de Student.
Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. Cuando los grados de libertad tienden a infinito (deslice el valor de v y observe las probabilidades acumuladas), la distribucin T tiende a coincidir con la distribucin normal standard. Es decir, en la medida que aumentemos el nmero de observaciones de la muestra, la desviacin standard calculada estar ms prxima a la desviacin standard de la poblacin y entonces la distribucin T correspondiente se acerca a la distribucin normal standard. El uso de la distribucin T presupone que la poblacin con que estamos trabajando tiene una distribucin normal.
La distribucin t de Student es la distribucin de probabilidad del cociente
Donde

Z tiene una distribucin normal de media nula y varianza 1 tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes es una variable aleatoria que 146
Si es una constante no nula, el cociente
sigue la distribucin t de Student no central con parmetro de no-centralidad . Propiedades de las distribuciones t 1. Cada curva t tiene forma de campana con centro en 0. 2. Cada curva t, est ms dispersa que la curva normal estndar z. 3. A medida que disminuye. 4. A medida que , la secuencia de curvas t se aproxima a la curva aumenta, la dispersin de la curva t correspondiente
normal estndar, por lo que la curva z recibe a veces el nombre de curva t con La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a infinito las dos distribuciones sern las mismas. Ejercicio 1: Encuentre la probabilidad de
Solucin: Como deja un rea de 0.05 a la derecha, y deja un rea de 0.025 a .
la izquierda, encontramos un rea total de
147
0
FI-UAQ
Ejercicio 2. Encontrar el valor de t con 14 grados de libertad, tal que la probabilidad ( ) de un valor mayor es de 0.05.
Solucin.
148
0 1.7613
FI-UAQ
Esta grfica se le conoce como prueba de cola derecha.
Ejercicio 3. Encontrar los valores de
-t
FI-UAQ
Esta grfica se le conoce como prueba de dos colas.
Distribucin Ji-Cuadrada Esta distribucin es la base para los clculos de probabilidad para la variable aleatoria discreta. Esta distribucin probabilstica es muy importante ya que se usa en una gran cantidad de mtodos estadsticos, por ejemplo en: 149 1.- Pruebas de bondad de ajuste. 2.- Pruebas de independencia. 3.- Prueba de homogeneidad (Prueba de dos muestras que se han extrado de la misma poblacin). 4.- Obtener los intervalos de confianza para la varianza de una distribucin normal. Comentarios. 1. De varios modelos posibles que puede representar nuestro trabajo, el que tenga mejor bondad es el que se aplica. 2. Importante. Supuestos que se deben de cumplir para analizar cualquier estadstica. (Normalmente se supone independencia). 3. Supuestos bsicos para trabajar regresin. Homocedasticidad en muestras.- Si existe una varianza igual entre nuestras muestras, son de la misma poblacin. Heterocedasticidad.- No son muestras de una misma poblacin. 4. Los lmites en los que se maneja la variable aleatoria.
Ji-Cuadrada.
es una serie de variables aleatorias normales
estandarizadas y pueden ser:
Definicin. El nmero de variables aleatorias normales estndar al cuadrado nos dar los grados de libertad de la Ji-cuadrada. 150
La forma de distribucin de la Ji-cuadrada va a cambiar dependiendo del nmero de grados de libertad que se tengan; al aumentar el nmero de grados de libertad de la Ji-cuadrada aumenta la Entre ms grados de libertad la Ji-cuadrada, tiende a ser normal, trabajando con variables aleatorias discretas. Distribucin Ji-cuadrada.
( )
( )
La solucin de la ecuacin anterior, ya est en tablas o usando los paquetes estadsticos. Grados de libertad.-Nmeros de elementos que se pueden definir libremente. a Probabilidad 0.01..0.999 Valores de la variable aleatoria que estemos trabajando
TABLA 6.04 Distribucin Ji-Cuadrada.
Nmero de variables independientes.
Presenta la probabilidad aleatoria con
(a) de tener un valor especfico de la variable
grados de libertad.
En funcin de los grados de libertad utilizados, la forma de la grfica se ira modificando. As tambin los valores encontrados se leern de derecha a izquierda de la grfica en la distribucin Ji-cuadrada. 151
Distribucin Ji-Cuadrada
(Probabilidad)
( )
FI-UAQ
ESQUEMA 6.26 Distribucin Ji-Cuadrada.
Ejercicio 1. En la distribucin Ji-cuadrada con 15 grados de libertad, se desea encontrar el valor de la variable aleatoria, tal que la probabilidad de un valor mayor o igual sea de 0.05.
Se expresa mediante ( )
=0.05
152
2
)=24.9958
FI-UAQ
Ejercicio 2. Dado un valor de se desea encontrar la probabilidad de un valor con
grados de libertad que sea mayor o igual a 3.9403. ( ( ) )
=0.05
)=24.9958
FI-UAQ
Distribucin F Compara dos ms poblaciones tratamientos dependiendo del experimento (Compara varianza de normales).
153
h(F)
DISTRIBUCIN F
Zona de aceptacin
Zona de rechazo
FI-UAQ
ESQUEMA 6.29Zonas de aceptacin y de rechazo de la hiptesis planteada bajo la distribucin F. Prueba de una cola.
m 1,2,3,.,500 n Valores de F dados en probabilidad
TABLA 6.05 Distribucin F.
Ejercicio 1. Encontrar el valor de F tal que la probabilidad de un valor mayor con 4 y 15 grados de libertad sea de 0.05
) 154
Nota: Existen cuatro tablas que presentan en cada una la posibilidad para ambos intervalos de confianza.
UNIDAD 7. INTRODUCCIN A LA INFERENCIA ESTADSTICA. OBJETIVO: Anlisis y conocimiento de los tipos de muestreo as como razonamiento estadstico inferencial y sus procedimientos bsicos. 7.1 Propiedades de un estimador
Poblacin (Parmetros)
x sx sx
155
2
x=X s x=S s x=S

2
Muestra (Estimadores)
....
FI-UAQ
ESQUEMA 7.01 Estimadores.
Un estimador es un estadstico (esto es, una funcin de la muestra) usado para estimar un parmetro desconocido de la poblacin. Por ejemplo, si se desea conocer el precio medio de un artculo (el parmetro desconocido) se recogern observaciones del precio de dicho artculo en diversos
establecimientos (la muestra) y la media aritmtica de las observaciones puede utilizarse como estimador del precio medio. Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).
Propiedades de los estimadores Sesgo Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parmetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parmetro que se desea estimar. 156 Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es un estimador insesgado de la misma, ya que su esperanza (valor esperado) es igual a la media de la poblacin. En efecto, si una muestra X=(X1,X2,...,Xn)t procede de una poblacin de media , quiere decir que: E[Xi] = para cualquier i=1...n La media aritmtica o media muestral,
Con lo que, al aplicar las propiedades de linealidad de la esperanza matemtica se tiene que:
[ ]
Eficiencia Diremos que un estimador es ms eficiente o ms preciso que otro estimador, si la varianza del primero es menor que la del segundo. Por ejemplo, si y son ambos estimadores de y ( ) ,
Diremos que es ms eficiente que . Un estimador es ms eficiente (ms preciso), por tanto, cuanto menor es su varianza. La eficiencia de los estimadores est limitada por las caractersticas de la distribucin de probabilidad de la muestra de la que proceden. El teorema de Cramr-Rao determina que la varianza de un estimador insesgado de un parmetro es, como mnimo, [[ ] ] 157
Donde f(X;) es la funcin de densidad de probabilidad de la muestra en funcin del parmetro , (denominada funcin de
verosimilitud). Si un estimador alcanza esta cota mnima, entonces se dice que el estimador es de mnima varianza. Consistencia Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable para un estimador es que a medida que el tamao de la muestra crece, el valor del estimador tienda a ser el valor del parmetro, propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, ms o menos restrictivas, pero la ms utilizada es la denominada consistencia en media cuadrtica que exige que: [ ]
Robustez El estimador ser un estimador robusto del parmetro si la vulneracin de los supuestos de partida en los que se basa la estimacin (normalmente, atribuir a la poblacin un determinado tipo de funcin de distribucin que, en realidad, no es la correcta), no altera de manera significativa los resultados que ste proporciona. Suficiencia Se dice que un estimador es suficiente cuando resume toda la informacin relevante contenida en la muestra, de forma que ningn otro estimador pueda proporcionar informacin adicional sobre el parmetro desconocido de la poblacin. Invarianza Se dice que un estimador es invariante cuando el estimador de la funcin del parmetro coincide con la funcin del estimador del parmetro, [ . Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para estimar la desviacin tpica poblacional ser razonable utilizar la desviacin tpica muestral. Para que nuestro estimador sea bueno se requiere que sea a) Insesgado. ( ) Donde: ] 158
159
0 Valor verdadero de la poblacin. Parmetro constante.
ESQUEMA 7.02 Estimador insesgado.
FI-UAQ
Ejemplo.
Poblacin objetivo
3 13 13 8
Muestra
6 15 2 7 11 2 1
8 3
FI-UAQ
ESQUEMA 7.03 Seleccin de la muestra.
En un caso prctico por lo general no se conoce la media poblacional. Se toman muestras de la poblacin.
Nota.- Todo el muestreo en inferencia es con reemplazo, pueden existir otras combinaciones. De lo anterior se toma que el estimador del parmetro es una variable aleatoria. As tenemos que
160
Si se efecta una infinidad de medidas ste tiende al valor de la media poblacional. Se debe tener cuidado al tomar la muestra, para que sea representativa de sta.
x6 x5 x 4 0 1 2 3 4 x2 5 6
x
x3 8 9 10
x1 11 12
FI-UAQ
ESQUEMA 7.04 La muestra tiene que ser representativa.
b) De mnima varianza. El parmetro estar definido por el de menor dispersin. Esto es que si se tienen diferentes valores de se debe escoger el de mnima varianza, que en este ejemplo (diagrama de abajo) ser
03 02
161
01
FI-UAQ
ESQUEMA 7.05 Mnima varianza.
Estimadores que usualmente usamos. Lo ms utilizado se muestra en la tabla siguiente. Distribucin de probabilidad Normal Ji-Cuadrada se debe
Parmetros
Estimadores
V.A.
Continua Continua
Cuando se hable de V.A.
pensar en su funcin de probabilidad.
TABLA 7.01 parmetros y estimadores.
( )
En mtodos estadsticos se usa la varianza en vez de la desviacin estndar, ya que su distribucin es ms sencilla. Estimadores puntuales Si a partir de las observaciones de una muestra se calcula un solo valor como estimacin de un parmetro de la poblacin desconocido, el procedimiento se denomina estimacin puntual. Ejemplos. 1. De una poblacin se escogieron al azar 10 personas y se les tomo la estatura. Los resultados en cm fueron: 160, 170, 170, 150, 160, 180, 160, 170, 130, 150. Estime la media y la desviacin estndar.(Sol. 160,14). 2. En una universidad se desea conocer la opinin de los estudiantes acerca de ciertas medidas que han tomado las directivas. De 120 estudiantes consultados, 90 estuvieron a favor. Estime la proporcin de estudiantes que estn a favor de las medidas.(Sol. 75%). 3. Un conjunto residencial est formado por 200 apartamentos. Se seleccionaron 18 apartamentos y se observ que, en promedio, viven 4.5 personas por apartamento. Estime el total de personas que viven en el conjunto residencial. (Sol. 900 personas). 4. De un lote de 1.000 licuadoras se escogen aleatoriamente 30 y se encontr que 2 de ellas estaban estropeadas; Cuntas licuadoras se estima que estn estropeadas? (Sol. 67 licuadoras). 162
7.2 Teorema del lmite central. Entre la normal estndar y este teorema se construye toda la estadstica paramtrica. Teorema del lmite central. Si es la media de una muestra aleatoria de tamao n extrada de una poblacin que tiene la media entonces y la varianza finita ,
es el valor de una variable aleatoria cuya funcin de distribucin se aproxima a la de la distribucin normal estndar cuando .(Jos Muoz, 1986). 163
En la prctica, la distribucin normal brinda una excelente aproximacin a la distribucin muestral de la media cuando n es del orden de 25 30, sin ninguna condicin restrictiva sobre la forma de la poblacin. La importancia prctica del Teorema del lmite central es que la funcin de distribucin de la normal puede usarse como aproximacin de algunas otras funciones de distribucin. Por ejemplo:
Una distribucin binomial de parmetros n y p es aproximadamente normal para grandes valores de n, y p no demasiado cercano a 1 0 (algunos libros recomiendan usar esta aproximacin slo si np y n(1 p) son ambos, al menos, 5; en este caso se debera aplicar una correccin de
2
continuidad).
La normal aproximada tiene parmetros = np, = np(1 p).
Una distribucin de Poisson con parmetro es aproximadamente normal para grandes valores de . La distribucin normal aproximada tiene parmetros = 2 = .
La exactitud de estas aproximaciones depende del propsito para el que se necesiten y de la tasa de convergencia a la distribucin normal. Se da el caso tpico de que tales aproximaciones son menos precisas en las colas de la distribucin. El Teorema de Berry-Essen proporciona un lmite superior general del error de aproximacin de la funcin de distribucin.
Grfica de la funcin de distribucin de una normal con 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0 5 10 15 20
y aproximando la funcin de distribucin de una binomial con n=48 y p=1/4
164
25 FI-UAQ
ESQUEMA 7.06 Distribucin normal.
Ejercicio 1. La distribucin de todas las cuentas por cobrar de un de un auditor est sesgada de manera positiva (observa la grfica). Esta distribucin tiene una . Si extraemos una muestra aleatoria de 36
cuentas, Cul es la probabilidad de que las cuentas por cobrar promedien menos de $250.00? Datos:
FI-UAQ
Solucin. Observa que la distribucin no es normal ya que se encuentra sesgada a la derecha, pero como la muestra es mayor a 30 entonces podemos utilizar la distribucin normal para aproximar la distribucin de muestreo por el teorema del lmite central, para ello primero encontramos el error estndar.
Ahora buscamos el valor de Z
0.4082
165
0.0918
250 260 Z=0 270 Escala Pesos Escala Z
FI-UAQ
Z=-1.33
ESQUEMA 7.07 Solucin ejercicio 1.
Entonces, la probabilidad de que la media muestral sea menor que $250.00 es 9.18%.
Ejercicio 2. Si un bote de 1 galn de cierta clase de pintura cubre en promedio con una desviacin estndar de , Cul es la probabilidad de
que el rea media cubierta por una muestra de 40 de estos botes est entre ? Solucin. Calculamos el rea bajo la curva normal entre
Y buscando stos valores en tablas obtenemos una probabilidad de 0.6553. Ntese que, si hubiese resultado mucho menor que 513.3, (digamos, menor que 500), esto podra despertar serias dudas de que la muestra realmente procediera de una poblacin que tuviera Ejercicio propuesto. Lanzar un dado comn y corriente 30 veces, de 3 tiros cada vez, obtener su media e irlos graficando por un diagrama de puntos. Se observa que va a tender a una distribucin normal y simtrica. 166
fx
(x)
Distribucin uniforme discreta 1/6
FI-UAQ
ESQUEMA 7.08 Distribucin uniforme discreta.
FI-UAQ
Por extensin, Cuadrada).
(la varianza de las muestras se distribuye como Ji-
Recordemos:
. | |
7.3 Intervalos de confianza. La tcnica de la estimacin confidencial consiste en asociar a cada muestra un intervalo que se sospecha que debe contener al parmetro. A ste se le denomina intervalo de confianza. Este parmetro ser la media o la varianza para distribuciones normales. En el muestreo repetido, a partir de una poblacin con distribucin normal, el 100(1-) por ciento de todos los intervalos de la forma:
167
Incluirn en la mayora de las veces, la media de la poblacin, . La cantidad 1- se conoce como coeficiente de confianza y el intervalo
se le denomina intervalo de confianza para . Dependiendo del valor
de probabilidad con el cual se acepte un error, el investigador decidir el mismo; los valores que se utilizan con frecuencia son 0.95 y de 0.99. El valor de Z al 95% de confianza es de 1.96 y al 99% es de 2.58, los cuales corresponden al rea bajo la curva normal estndar de 0 a Z. (Snedecor y Cochran, 1967). Para comprobar si un estimador muestral es representativo del parmetro correspondiente a la poblacin, conviene que el error de estimacin | |
Donde B es el lmite del error de estimacin. Caer en el intervalo sealado tiene una probabilidad de: (| | )
Donde
sera la probabilidad (esperada o fijada como lmite de riesgo) de no
caer dentro del intervalo que hemos supuesto confiable. Por ejemplo, si decimos que estamos acotando un intervalo de confianza tal que
el 95% de los estimadores estn dentro de los lmites del error. En trminos generales, un intervalo de confianza se representa as: ( Donde: ) 168
[ Donde:

][
Ejemplo. [ [
][ ][ ]
][
P<0.975
P>0.975
169
Z=-1.96
Z=1.96
FI-UAQ
ESQUEMA 7.09 Intervalo de confianza.
Expresando matemticamente la media poblacional ( ( ( )) ( ( ))
) estar en el rango:
Se observa la regla de Tchebysheff, El rango de datos de se encuentra el 95% de los mismos. Si
Ejemplo. Si se tiene del ejercicio :
ser:
El intervalo de confianza para
170
LIC
x4 9 10 11 12
LSC
13
14
15
16
FI-UAQ
ESQUEMA 7.10 Lmite inferior y superior de confianza.
Ejemplo del mismo problema: Calcular el intervalo de confianza para:
El intervalo de confianza ser:
171
LIC
x4 4 5 6
LSC
10 11 12 13 14
FI-UAQ
ESQUEMA 7.11 Lmite inferior y superior de confianza. Ejemplo.
Resumiendo los intervalos de confianza generados para el ejemplo de la clase tenemos: 10.66 9.6 4.33 5.33 9.66 3.66 L.I.C. 7.82 1.025 0.69 3.601 1.11 1.30 L.S.C. 13.05 18.17 7.97 7.059 18.24 6.01 0.05 0.05 0.05 0.05 0.05 0.05 0.95 0.95 0.95 0.95 0.95 0.95 Prob. 95% 95% 95% 95% 95% 95%
TABLA 7.02 Intervalos de confianza.
FI-UAQ
ESQUEMA 7.12 Intervalos de confianza.
172
LIC
x6
LSC
LIC LIC LIC LIC LIC
x5 x4 x3
LSC LSC
LSC
x2 x1
9 10 11 12
LSC
LSC
13
14
15
16
17
18
19
FI-UAQ
ESQUEMA 7.13 Intervalos de confianza y sus lmites.
% Confiabilidad 90 95 99 0.90 0.95 0.99 0.10 0.05 0.01
L.I.C.
L.S.C.
0.05 0.025 0.005
1.645 1.960 2.580
TABLA 7.03 Tabla para utilizar directamente, cuando es normal la variable.
Ahora, si deseamos encontrar t-student, tendramos que buscar los valores respectivos para t, entonces en la tabla anterior no sera la Z sino la variable t. Graficando la tabla anterior se tiene:
0.90
0.05 0.05
-1.645
1.645
FI-UAQ
173
ESQUEMA 7.13 Confiabilidad 0.90.
0.95
0.025 0.025
-1.96
1.96
FI-UAQ
0.99
0.005 0.005
-2.58
2.58
FI-UAQ
Presentando los intervalos respectivos, para una media se tiene:
y una
174
LIC
LSC
90%
LIC
LSC
95%
LIC
LSC
99%
x
FI-UAQ
ESQUEMA 7.16 Confiabilidad 0.90, 0.95 y 0.99.
CONCLUSIONES -A mayor variabilidad (

)
es menor el intervalo de confianza y viceversa. ) es ms amplio el intervalo de confianza y
-A mayor confiabilidad ( viceversa.
ESTIMACIN POR INTERVALOS
-Implica estimar un parmetro poblacional ( ) con un estimador ( ) a travs de un intervalo al que le asociamos una confiabilidad probabilidad. Ejercicio 1. El problema de la venta promedio es de si en trminos de
Encuentre un intervalo de confianza para una confiabilidad de un 90%.
][
175
Lo anterior se puede presentar en la forma siguiente.
CONCLUSIN. Con un 90% de confiabilidad, podemos asegurar que el parmetro promedio de las ventas que estamos estimando se encuentra entre 9.042 y 9.158 miles de pesos. Ejercicio 2. En un estudio para encontrar el promedio de ingreso medio en salarios mnimos de la poblacin econmicamente activa de la delegacin de Coajimalpa, Morelos. Despus de tomar una muestra se obtuvo una salarios mnimos con la muestra se realiz en 403
individuos. Encuentre el intervalo de confianza con un 95% de confiabilidad.
CONCLUSIN. Con un 95% de confiabilidad podemos asegurar que el parmetro ingreso promedio medido en salario medio de la poblacin econmicamente activa de la delegacin Coajimalpa Morelos, que estamos estimando se encuentra entre 1.048 y 1.153 salarios mnimos. *Si no usamos inferencia estadstica, se tendr que revisar a toda la poblacin. Lo anterior tiene muchas aplicaciones. Es diferente la variable aleatoria a la variable aleatoria ya que: 176
Existe relacin, pero son diferentes variables. 7.4 Muestreo. Se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin. Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin. Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin muestral. Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin). Cuando este ltimo cumple con la condicin de que todos los elementos de la poblacin tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la poblacin es conocida de antemano, recibe el nombre de muestreo probabilstico. Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir cmo tomar una muestra aleatoria ms adelante. 177
Tipos de muestreo Muestreo probabilstico Forman parte de este tipo de muestreo todos aquellos mtodos para los que puede calcular la probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. En este caso se habla de muestras probabilsticas, pues no es en rigor correcto hablar de muestras representativas dado que, al no conocer las caractersticas de la poblacin, no es posible tener certeza de que tal caracterstica se haya conseguido.
Sin reposicin de los elementos: Cada elemento extrado se descarta para la subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una
"poblacin" de bombillas para estimar la vida media de las bombillas que la integran, no ser posible medir ms que una vez la bombilla seleccionada. Con reposicin de los elementos: Las observaciones se realizan con reemplazamiento de los individuos, de forma que la poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse sin reposicin aunque, realmente, no lo sea. Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse sin reposicin. Cada elemento extrado se descarta para la subsiguiente extraccin. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin de nmeros aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. Muestreo estratificado Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica. Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado:
178
Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al tamao del estrato dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres. Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por mi y si2, respectivamente. Muestreo sistemtico Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevacin K= N/n; donde N es el tamao del universo y n el tamao de la muestra. Determinar en qu fecha se producir la primera extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno. Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n), dividimos el nmero de la poblacin por el nmero de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el orden del intervalo.
179
Muestreo por estadios mltiples Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difcil acceso. En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel. Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas determinado, stos pueden subdividirse en unidades primarias representadas por circunscripciones didcticas y unidades secundarias que seran los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extraccin. Muestreo por conglomerados Tcnica similar al muestreo por estadios mltiples, se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio. Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del grupo, o slo se les podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplificar la recogida de informacin muestral. Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseo se llama muestreo bietpico. 180
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo funciona mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre s. Homogeneidad de las poblaciones o sus subgrupos Homogneo significa, en el contexto de la estratificacin, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto ms homogneos son cada uno de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura de una poblacin, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la poblacin total. Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas diferencias dentro del estrato que en toda la poblacin, no hay por qu usar este mtodo de muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la poblacin, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto a la caracterstica a estudiar y los conglomerados, si representan fielmente a la poblacin, esto es, contienen toda su variabilidad, o sea, son heterogneos. Muestreo de juicio Aqul para el que no puede calcularse la probabilidad de extraccin de una determinada muestra. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la informacin aportada por esas personas es vital para la toma de decisiones. 181
Muestreo por cuotas Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer lugar es necesario dividir la poblacin de referencia en varios estratos definidos por algunas variables de distribucin conocida (como el gnero o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de poblacin que representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato. Muestreo de bola de nieve Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de los propios entrevistados. Partiendo de una pequea cantidad de individuos que cumplen los requisitos necesarios estos sirven como localizadores de otros con caractersticas anlogas. Muestreo subjetivo por decisin razonada En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas de manera racional y no casual. Una variante de esta tcnica es el muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para determinadas variables se acerque a la media de la poblacin. El inters del muestreo es extrapolar con una muestra y hacer inferencia hacia la poblacin. 182
EJEMPLO.
Muestra 2. No representativa.
34
Poblacin
29 15
40 18 14 12 12 19
183
FI-UAQ
13 17 13 1
16 13 2
18 3
Muestra 1. No representativa (porque tiene sesgo)
ESQUEMA 7.17 Muestra no representativa.
Riesgo de una muestra no representativa, ya que no representa al grueso de los datos.
FI-UAQ
ESQUEMA 7.18 Riesgo de una muestra no representativa.
Para que una muestra sea representativa, se toman datos al azar. Maneras ms comunes de introducir sesgos: Al seleccionar una muestra es comn introducir sesgos que alteran la representatividad de la muestra. Tres de ellos son los ms comunes: 1.- Sesgos de seleccin por parte del investigador. Favorece parte de la muestra. Este sesgo se elimina aleatorizando.
2.- Sesgos de autoseleccin iatrotrpicos. Parte de la poblacin se deja seleccionar con mayor facilidad que otra parte de la poblacin. (Familia). Este sesgo se evita formando bloques. Ejemplo, bloque de padre de familia y otro bloque de madre de familia. Se da en caractersticas heterogneas. 3.- Sesgos de autoseleccin inherentes. 184 Es el ms comn, se presenta cuando otra variable est relacionada con la variable de inters. Ejemplo, las clases sociales. Una vez identificado se forman bloques. Si existe sospecha se maneja como covariable. La interpretacin depende de muchos factores, del cmo se interpreta el resultado. Eg. Religin, postura, educacin, etc. Esquemas del muestreo. Son las formas de tomar una muestra.
1.- Muestreo aleatorio simple. 2.- muestreo estratificado aleatorio Distribucin Distribucin Distribucin Distribucin igual. proporcional. de Neimar. ptima.
3.- Muestreo polietpico. 4.- Muestreo sistemtico.
Muestreo aleatorio simple. Supone que la poblacin tiene unidades homogneas. Consiste en extraer de una poblacin al azar n individuos. ste es la base de todos los dems. Muestreo estatificado aleatorio. Consiste en identificar estratos de toda la poblacin. Adems permite ahorrar dinero y tiempo, ya que reduce el tamao de la muestra. Eg. Preferencia del chocolate Tin Larn. Es diferente por tipo
de sexo, la diferencia puede estar sesgada hacia las mujeres. Se efecta un muestreo aleatorio simple para cada tamao de muestra del estrato. Se puede tener: a) Estratos de igual tamao y la variacin es igual en todos los estratos, sta se mide con el coeficiente de variacin y debe ser menor del 5%. b) Estratos con diferentes tamaos pero con coeficiente de variacin igual, menor al 5%. c) Estratos diferentes y su coeficiente de variacin es mayor de 5%. d) Estratos diferentes y coeficiente de variacin de 5%. Presenta mayor costo de la encuentra. Ejemplo 1. En la delegacin de Coajimalpa de Morelos se desea conocer el promedio de ingreso del salario mnimo de la poblacin econmicamente activa. Se tomaron 30 variables y de stas, se eligi la de mayor variacin. 185
Cuajimalpa de Morelos
El componente ms importante para fijar un tamao de muestra es la variabilidad. En este caso la variable de mayor variacin fue el ingreso, con ste se calcul n (tamao de la muestra) 100. Se efecta una muestra piloto o premuestra que viene dada antes del muestreo, donde se obtendr informacin sobre la variabilidad de las preguntas del cuestionario.
Identificar plenamente en dnde estn los estratos.
Opciones. Se limita a tiempo, dinero y caractersticas del estudio. se elige al azar. El que dirige la encuesta va analizando a la poblacin. Ejemplo 2. El promedio de salario mnimo de la ciudad de Mxico si se efecta un muestreo aleatorio simple, el tamao de la muestra es muy extenso.
EJEMPLO. Edo. de Mxico.
186
Azcapotzalco
Gustavo A. Madero
Miguel Hidalgo Cuahutmoc Benito Jurez
Venustiano Carranza Iztacalco
Cuajimalpa
lvaro Obregn
Iztapalapa Coyoacn
Tlahuac La Magdalena Contreras Xochimilco
Tlalpan Milpa Alta
Se estratifica por delegacin y con sto se disminuye considerablemente la muestra.
FI-UAQ
ESQUEMA 7.19 Ciudad de Mxico.
Muestreo Polietpico. Es la identificacin de estratos en los estratos. Esto es que n muestral se reduce an ms, lo anterior conlleva a ahorrar trabajo, reducir la variabilidad, y presenta un tamao de muestra pequea.
Del ejemplo anterior, de delegaciones se pasara a colonias, de colonias a manzanas, de manzanas a calles, y de calles a casas. Muestreo sistemtico. Consiste en fijar cantidad intermedia entre un valor y otro, ejemplo casas, la encuesta se har a cada 10 casas.
7.5 Tamao de la muestra 187 Es el nmero de sujetos que componen la muestra extrada de una poblacin, necesarios para que los datos obtenidos sean representativos de la poblacin. Objetivos de la determinacin del tamao adecuado de una muestra. 1. Estimar un parmetro determinado con el nivel de confianza deseado. 2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mnimo de garanta. 3. Reducir costes o aumentar la rapidez del estudio. Por ejemplo, en un estudio de investigacin epidemiolgico la determinacin de un tamao adecuado de la muestra tendra como objetivo su factibilidad. As: 1. Si el nmero de sujetos es insuficiente habra que modificar los criterios de seleccin, solicitar la colaboracin de otros centros o ampliar el periodo de reclutamiento. Los estudios con tamaos muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusin errnea de que no existe tal diferencia. 2. Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vista econmico y humano. Adems es poco tico al someter a ms individuos a una intervencin que puede ser menos eficaz o incluso perjudicial.
El tamao de una muestra es el nmero de individuos que contiene.
La expresin para calcular el tamao de la muestra en un muestreo aleatorio simple. Para muestra finita:
188
Para muestra infinita:
Donde:
Con los valores de la muestra se determina el intervalo de confianza (Lmites). Resumiendo.
Premuestra
-N 2 -S -X -X
Determina n. Tamao de la muestra
Muestra -S
2
Informa el intervalo de confianza

189
ESQUEMA 7.20 Premuestra y muestra.
Dependiendo de la variable se van a tener los cambios:
Ejemplo 1. Observar cmo cambia el tamao de la muestra con el ejercicio del salario mnimo visto en el subtema anterior.
Es completamente similar al tamao de la muestra anterior.
Eg.
El tamao poblacional (N) poco afecta el tamao de la muestra, sta depender de la variabilidad. 190 Por ejemplo, para:
Se observa que la variabilidad (Varianza o Desviacin Estndar) s afecta bastante el tamao de la muestra. Por ejemplo, para:
Entre ms seguro se requiera (Confiabilidad) se tiene que aumentar el tamao de la muestra. Por ejemplo, para:
Cuando se requiera mayor precisin se deber tener mayor tamao de muestra.
191
UNIDAD 8. PRUEBAS DE HIPTESIS. OBJETIVO: Capacitar al alumno en la forma como se deben de aplicar las pruebas de hiptesis dentro de un proceso estadstico. Una hiptesis estadstica es una aseveracin sobre un modelo probabilstico. (Infante y Zrate, 1984).
192 8.1 Ideas bsicas en una prueba de hiptesis Es un procedimiento para juzgar si una propiedad que se supone cumple una poblacin estadstica es compatible con lo observado en una muestra de dicha poblacin.
El objetivo principal se deriva de la comparacin de poblaciones.
Elementos de una prueba de hiptesis. Establecer el sesgo de hiptesis. Utilizar la estadstica de prueba aprobada (de acuerdo a la variable aleatoria y a la ).
Definir la regin de rechazo. Concluir.
Se deben distinguir tres tipos de diferencias: A) Las que todo mundo observa.- (lechuga vs. Jitomate) B) Las que observa el experto.- (conocimiento del tema, es suficiente para distinguir doctor)
C) Las que observa el experto con ayuda de una herramienta. (Se usa la prueba de hiptesis.- Comparar dos o ms poblaciones en donde el experto ya no alcanza a diferenciar si son iguales o deferentes.) Ejemplo de a) Lechugas vs. Jitomates.- Existe una separacin obvia, es absurdo aplicar la prueba de hiptesis.
193
Jitomate
Lechuga
FI-UAQ
ESQUEMA 8.01 Absurdo aplicar prueba de hiptesis.
Ejemplo de b) Doctor.- Observa al paciente y diagnostica el tipo de enfermedad. Viral o infecciosa.
Infecciosa
Viral
FI-UAQ
ESQUEMA 8.02 Observacin del experto.
Ejemplo de c)
No alcanza a distinguir lo que pasa. Poblaciones que se
parecen tanto que se solapan. En este caso se necesita una herramienta para verificar que pasa con estas poblaciones, esta es la prueba de hiptesis.
FI-UAQ
194
ESQUEMA 8.03 Necesario aplicar prueba de hiptesis.
Cmo se lleva a cabo una prueba de hiptesis? Existe una gran variedad de mtodos que hacen prueba de hiptesis, cuyo objetivo es comparar poblaciones en funcin del tipo de variable y el tipo de distribucin. Todas ellas son diferentes pero se estructuran igual. El estimador se debe recordar para comprender la prueba de hiptesis. Para que un estimador sea bueno tiene que ser insesgado y de mnima varianza.
FI-UAQ
E(x)=
ESQUEMA 8.04 Estimador insesgado y de mnima varianza.
Para todas las pruebas de hiptesis se presentan dos planteamientos: Ho- Hiptesis nula, que contienen a la igualdad.
HA- Hiptesis alternativa, puede ser mayor que menor que. Existen 3 opciones para analizar una prueba de hiptesis.
Prueba bilateral o de 2 colas
195
Zona de aceptacin
Regin crtica Regin crtica
-zo
Nivel de significancia
z=0
zo
FI-UAQ
ESQUEMA 8.05 Prueba de 2 colas.
Prueba unilateral izquierda o de cola izquierda
Zona de aceptacin
Regin crtica
-zo
z=0
zo
FI-UAQ
ESQUEMA 8.06 Prueba de cola izquierda.
Prueba unilateral derecha o de cola derecha
Zona de aceptacin
Regin crtica
196
-zo
z=0
zo
FI-UAQ
ESQUEMA 8.07 Prueba de cola derecha.
El procedimiento estadstico fija la probabilidad de cometer el error tipo I en un valor llamado alfa o nivel de significancia. La prueba de hiptesis consiste
en rechazar o no rechazar la hiptesis nula Ho.
8.2 Clasificacin de hiptesis La hiptesis puede adoptar diferentes y clasificarles de acuerdo a la convivencia de cada autor:
- Hiptesis general: Es cuando trata de responder de forma amplia a las dudas que el investigador tiene acerca de la relacin que existe entre las variables.
- Hiptesis especfica: Es especfica aquella hiptesis que se deriva de la general, estas tratan de concretizar a la hiptesis general y hace explcitas las orientaciones concebidas para resolver la investigacin.
- Hiptesis estadstica: La hiptesis estadstica es aquella hiptesis que somete a prueba y expresa a las hiptesis operacionales en forma de ecuaciones matemticas. -Hiptesis nula: Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer una hiptesis nula. La hiptesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos. Por ejemplo, supongamos que un investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que no recibieron entrenamiento. 197
Para demostrar su hiptesis toma al azar una muestra de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo recibi. Una hiptesis nula es importante por varias razones: Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin. El hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al azar. No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis nula es aquella por la cual indicamos que la informacin a obtener es contraria a la hiptesis de trabajo. Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema flucta, por tanto, debe rechazarse como tal. 8.3 Regin crtica y nivel de significancia Nivel de significancia -La mxima cantidad de error que estamos dispuestos a aceptar para dar como vlida nuestra hiptesis. Se establece
convencionalmente el 5% y debe ser definida antes de realizar nuestra investigacin.
Regin crtica y nivel de significancia
198
Zona de aceptacin
Regin crtica Regin crtica
-zo
z=0
zo
FI-UAQ
ESQUEMA 8.08 Regin crtica y nivel de significancia.
8.4 Tipos de error El error de tipo I es el error que se comete cuando el investigador rechaza la hiptesis nula (Ho) siendo sta verdadera en la poblacin y alfa () es la probabilidad de que ocurra este error. La hiptesis de la que se parte H0 aqu es el supuesto de que la situacin experimental presentara un estado normal. Si no se advierte este estado normal, aunque en realidad existe, se trata de un error estadstico tipo I. Algunos ejemplos para el error tipo I seran:
Se considera que el paciente est enfermo, a pesar de que en realidad est sano; hiptesis nula: El paciente est sano.
Se declara culpable al acusado, a pesar de que en realidad es inocente ; hiptesis nula: El acusado es inocente.
No se permite el ingreso de una persona, a pesar de que tiene derecho a ingresar; hiptesis nula: La persona tiene derecho a ingresar.
El error de tipo II, se comete cuando el investigador no rechaza la hiptesis nula siendo sta falsa en la poblacin. Beta () es la probabilidad de que exista ste error. Se acepta en un estudio que el valor del error beta est entre el 5 y el 20%. Contrariamente al error tipo I, en la mayora de los casos no es posible calcular la probabilidad del error tipo II. La razn de esto se encuentra en la manera en que se formulan las hiptesis en una prueba estadstica. Mientras que la hiptesis nula representa siempre una afirmacin enrgica (como por ejemplo H0: Promedio = 0) la hiptesis alternativa, debido a que engloba todas las otras posibilidades, es generalmente de naturaleza global (por ejemplo H1: Promedio 0). El grfico de abajo ilustra la probabilidad del error tipo II (rojo) en dependencia del promedio desconocido. 199
ESQUEMA 8.09 probabilidad del error tipo II.
Representacin de los valores posibles de la probabilidad de un error tipo II (rojo) en el ejemplo de un test de significancia estadstica para el parmetro . El error tipo II depende del parmetro . Mientras ms cerca se encuentre este del valor supuesto bajo la hiptesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido a que el verdadero valor de es desconocido al hacer la presuncin de la hiptesis alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se puede calcular. 200
El poder o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o efecto, si existe en la poblacin. Es el complementario del error de tipo II (1-). Errores en la prueba de hiptesis. Una vez realizada la prueba de hiptesis, se habr optado por una de las dos hiptesis, la hiptesis nula o base Ho, o la hiptesis alternativaH1, y la decisin escogida coincidir o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro: Ho es cierta Se escogi Ho Se escogi
H1 H1es cierta
No hay error (verdadero positivo) Error de tipo I ( o falso positivo)
Error de tipo II ( o falso negativo)
No hay error (verdadero negativo)
TABLA 8.01 Errores en la prueba de hiptesis.
Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se suele denotar por la letra griega , y en las mismas condiciones, se denota por la probabilidad de cometer el error de tipo II , esto es:
En este caso, se denomina Potencia del contraste al valor 1-, esto es, a la probabilidad de escoger cuando esta es cierta . Cuando es necesario disear una prueba de hiptesis, sera deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin embargo, con una muestra de tamao prefijado, disminuir la probabilidad del error de tipo I, , conduce a incrementar la probabilidad del error de tipo II, . Usualmente, se disean las pruebas de tal manera que la probabilidad sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones ms relajadas o ms estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir , probabilidad de error d e tipo II, es aumentar el tamao muestral, lo que en la prctica conlleva un incremento de los costes del estudio que se quiere realizar. 8.5 Pruebas de hiptesis para muestras de la distribucin normal A continuacin se muestra un caso prctico de prueba de hiptesis aplicado a la distribucin normal. Ejemplo. Una fbrica que embotella refrescos asegura que el contenido promedio de sus botellas es de 32.5 onzas de lquido. Los consumidores la acusan de que su llenado es inferior de modo que rechazan la afirmacin de la empresa. Proteccin al consumidor toma una muestra de 60 botellas (al azar), las cuales dan un promedio mquina es Se sabe que la desviacin estndar de llenado de la La precisin requerida ser del 5% (0.05). Rechaza esta 201
muestra lo afirmado por la empresa o lo confirma?
Nivel 95%
de
confianza:
=32.5 =3.6 n = 60
ESQUEMA 8.10 Promedio de lquido=32.5 onzas.
Distribucin normal. Una sola cola.
202
z=-1.64 z=-1.29 z=0
Z 1.6
REAS SEGN TABLAS DE DISTRIBUCIN NORMAL 0.00 0.01 0.02 0.03 0.04 0.4452 0.4463 0.4474 0.4485 0.4495
0.05 0.4505
Se acepta lo afirmado por la fbrica
Qu pasara si del ejercicio anterior, el promedio de la muestra fuera menor, por ejemplo Entonces:
Distribucin normal. Una sola cola.
203
z=-2.15 z=-1.64
z=0
ESQUEMA 8.10 Promedio de lquido=31.5 onzas en zona de rechazo.
Conclusin. En este caso se rechaza lo afirmado por la empresa ya que 31.5 onzas quedan fuera del intervalo de confianza.
Ejemplo 2. Los siguientes datos son los pesos de 6 diamantes sintticos en quilates. Se requiere 99% de confiabilidad. 0.46 0.61 0.52 0.48 0.57 0.54
Planteamiento.
Nota. Cuando se tengan menos de 30 datos se usa la prueba t de student.
La estadstica de prueba es
Los grados de libertad
Ho
HA
204
1.31 No rechazo Ho Rechazo Ho
3.3649
FI-UAQ
ESQUEMA 8.11 Se usa T de Student.
Conclusin. En virtud de que t calculada no es mayor igual que el valor de t de tablas para un no rechaza Ho, por lo tanto el peso promedio de los diamantes es igual a 0.5 k. Ejemplo. Dos muestras de 8 y de 10 mediciones respectivamente tienen varianzas muestrales.
La estadstica de prueba es una La regla es rechazar Nota. La estadstica de prueba F siempre se maneja como una prueba de cola derecha.
Ho No rechazo Ho
2.22 3.347
HA Rechazo Ho
205
FI-UAQ
ESQUEMA 8.12 Se aplica la prueba F.
Conclusin. Como F observada (calculada) no es mayor o igual a la F de tablas, no rechazo Ho y por lo tanto la varianza es igual con un , el nivel de significancia observado es de (damos razn de donde se encuentra este valor). Ejemplo.- Si hubiera pasado que esto indica que est muy cerca del valor por lo tanto se deben tomar precauciones al sacar las conclusiones.
GLOSARIO DE TRMINOS. Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte. Aleatoriamente: Actividades o mtodos producidos o llevados a cabo simulando un comportamiento al azar. Clase: Subdivisin de escala de datos. Correlacin: Cuando dos fenmenos sociales, fsicos o biolgicos crecen o decrecen de forma simultnea y proporcional debido a factores externos, se dice que los fenmenos estn positivamente correlacionados. Si uno crece en la misma proporcin que el otro decrece, los dos fenmenos estn negativamente correlacionados. El grado de correlacin se calcula aplicando un coeficiente de correlacin a los datos de ambos fenmenos. Una correlacin positiva perfecta tiene un coeficiente + 1, y para una correlacin negativa perfecta es -1. La ausencia de correlacin da como coeficiente 0. Por ejemplo, el coeficiente 0,89 indica una correlacin positiva grande, -0,76 es una correlacin negativa grande y 0,13 es una correlacin positiva pequea. Cuartiles, Deciles y Percentiles: Si un conjunto de datos est ordenado por magnitud, el valor central (o la media de los dos centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro partes iguales. Esos valores denotados Q 1, Q2, y Q3, se llaman primer cuartil, segundo cuartil y tercer cuartil, respectivamente. EL Q2 coincide con la mediana. Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se le denotan D1, D2,...,D9, mientras que los valores que lo dividen en 100 partes iguales se llaman percentiles, denotados por P1, P2,...,P99. El 5 decil y el 50 percentil coinciden con la mediana. Los 25 y 75 percentiles coinciden con el primer y tercer cuartiles. Colectivamente, cuartiles, deciles y percentiles se denominan cuantiles. Curva Normal: La forma prevista de la distribucin normal. Datos: Son los valores cualitativos o cuantitativos mediante los cuales se miden las caractersticas de los objetos, sucesos o fenmenos a estudiar.
206
Desviacin: Diferencia entre un valor y otro valor medio o tpico. (Desviacin Media)
Desviacin Tpica: La desviacin de un elemento del conjunto es su diferencia con respecto a la medida; por ejemplo, en sucesin x1, x2, ..., xn la desviacin de x1 es x1-x, y el cuadrado de la 2 desviacin es (x1- x ) . La varianza es la medida del cuadro de las desviaciones. Por cuadrada de la varianza, y se calcula de la siguiente manera:
207

Si la desviacin tpica es pequea, los datos estn agrupados cerca de la media; si es grande, estn muy dispersos. Es una medida de dispersin expresada normal comprendido entre la media y +/- . Entrevista y Encuesta: Son mtodos de recoleccin de datos, la entrevista es una serie de preguntas realizadas personalmente y la encuesta es llevada a cabo generalmente a travs de algn formulario que la persona debe llenar. Estadstica: La Estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas con tal anlisis. En un sentido menos amplio, el trmino estadstica se usa para denotar los propios datos, o nmero derivados de ellos, tales como los promedios. As se habla de estadstica de empleo, estadstica de accidentes. Estadstico: Unidad de medida referente a la muestra. Se le llama estadstico tambin a la persona que trabaja con la estadstica. Frecuencia: Nmero de veces en que se repite un dato. por el espacio de la curva
Frecuencia Acumulada: Es el nmero de estudiantes con calificaciones iguales o menores que el rango de cada intervalo sucesivo. (Frecuencia).
Frecuencia Relativa: Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos.
Histograma: Es una serie de rectngulos con bases iguales al rango de los intervalos y con rea proporcional a sus frecuencias. Inferir: Es emitir juicios o conclusiones basados en algn conocimiento o experiencia sobre un evento o suceso. Inferencia Estadstica: Es aplicar resultados de estudios de una muestra a la poblacin y emitir juicios o conclusiones sobre esa poblacin en general. (Estadstica). Ejemplo: Estudio: Causas de la desercin estudiantil en la Universidad Rmulo Gallegos. Poblacin: 4000 alumnos. Muestra: 10% de la poblacin. Resultados del Estudio de la Muestra: La situacin econmica, dificultad en el aprendizaje. Conclusiones: Se puede inferir que las causas de desercin de los alumnos de la Universidad Rmulo Gallegos son la situacin econmica y la dificultad en el aprendizaje. Intervalo de Clase: Pequea seccin de la escala segn la cual se agrupan las puntuaciones de una distribucin de frecuencia. Tamao o rango de la Clase.
208
Lmites del Intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
Media Aritmtica: La media de un conjunto de N nmeros, X1, X2, X3, .. XN. Se define por:
Media Aritmtica Ponderada: A veces asociamos con los nmeros X 1, X2, X3, ..Xk ciertos factores peso (o pesos) W 1, W 2, W 3, .. W K dependientes de la relevancia asignada a cada nmero. En tal caso,
Se llama la media aritmtica ponderada con pesos f1, f2, ..., fk. Ejemplo: Si el examen final de un curso cuenta tres veces ms que una evaluacin parcial, y un estudiante tiene calificacin 85 en el examen final y 70 y 90 en los dos parciales, la calificacin media es:
209
Mediana: La mediana de un conjunto de nmeros ordenados en magnitud es o el valor central o la media de los dos valores centrales.
Medidas de la Dispersin: Normalmente la estadstica tambin se ocupa de la dispersin de la distribucin, es decir, si los datos aparecen sobre todo alrededor de la media o si estn distribuidos por todo el rango. Una medida de la dispersin es la diferencia entre dos percentiles, por lo general entre el 25 y el 75. El percentil r es un nmero tal que un r por ciento de los datos son menores o iguales que r . En particular, los percentiles 25 y 75 se denominan cuartiles inferior y superior respectivamente. La desviacin tpica es otra medida de la dispersin, pero ms til que los percentiles, pues est definida en trminos aritmticos como se explica a continuacin. Medidas de Tendencia Central: Un promedio es un valor tpico o representativo de un conjunto de datos. Tales valores suelen situarse hacia al centro del conjunto de datos ordenados por magnitud.
Moda: Es el valor que ocurre con mayor frecuencia; es decir, el valor ms frecuente. La moda puede no existir, e incluso no ser nica en caso de existir.
Ejemplo: El conjunto 2,2,5,7,9,9,9,10,10,11,12 Una distribucin con moda nica se dice unimodal.
18
tiene
moda
9.
Observacin de Campo: Es la observacin que realiza el investigador en el lugar donde ocurren los sucesos o eventos, para extraer los datos. Poblacin y Muestra: Al recoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica, suele ser imposible o nada prctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado poblacin o universo, se examina una pequea parte del grupo, llama damuestra.Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consistente en todas las tuercas producidas por una fbrica un cierto da es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita. Polgono de frecuencia: Se obtiene conectando un histograma de frecuencias Porcentaje: Es la proporcin de una cantidad de datos especficos, con respecto al total de esos datos. Probabilidad: Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo determinado. Dichos eventos pueden ser medibles a travs de una escala de 0 a 1, donde el evento que no pueda ocurrir tiene una probabilidad de 0 y uno que ocurra con certeza es de 1. Ejemplo: Cuando se lanza una moneda, se desea saber cul es la probabilidad de que se sello o cara, es decir existe un 0,5 (50%) de que sea cara o 0,5 (50%) de que sea sello. Promedio: Es una medida que caracteriza un grupo de datos bajo algn criterio. Como: la media aritmtica y la media ponderada. Rango: Situacin de un dato respecto de una distribucin. Tamao de la Muestra: Es la cantidad de datos que sern extrados de la poblacin para formar parte de la muestra. Validez: Importancia predictiva para los propsitos que se persiguen. los puntos medios de cada intervalo de acumuladas con segmentos rectilneos.
210
APNDICE A.
reas bajo la curva

normal estndar de 0 a Z
0 Z
FI-UAQ
Z 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
0 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 0.4990 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999
0.01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 0.4987 0.4991 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999
0.02 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.4783 0.4830 0.4868 0.4898 0.4922 0.4941 0.4956 0.4967 0.4976 0.4982 0.4987 0.4991 0.4994 0.4995 0.4997 0.4998 0.4999 0.4999 0.4999
0.03 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2967 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.4788 0.4834 0.4871 0.4901 0.4925 0.4943 0.4957 0.4968 0.4977 0.4983 0.4988 0.4991 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999
0.04 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.4793 0.4838 0.4875 0.4904 0.4927 0.4945 0.4959 0.4969 0.4977 0.4984 0.4988 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999
0.05 0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0.3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0.4798 0.4842 0.4878 0.4906 0.4929 0.4946 0.4960 0.4970 0.4978 0.4984 0.4989 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999
0.06 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.4406 0.4515 0.4608 0.4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961 0.4971 0.4979 0.4985 0.4989 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999
0.07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 0.4989 0.4992 0.4995 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000
0.08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 0.4990 0.4993 0.4995 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000
0.09 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 0.4990 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999 0.4999 0.5000
211
0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 3.9 Fuente: R. A. Fisher y F. Yates, Statistical Tables for Biological, Agricultural and Medical research.
APNDICE B.
Valores percentiles para la distribucin t de Student con grados de libertad

p 1-p 0 tp
FI-UAQ
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
0.158 0.142 0.137 0.134 0.132 0.131 0.130 0.129 0.129 0.129 0.129 0.128 0.128 0.128 0.128 0.128 0.128 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.126 0.126 0.126
0.325 0.289 0.277 0.271 0.267 0.265 0.263 0.262 0.261 0.260 0.260 0.259 0.259 0.258 0.258 0.258 0.257 0.257 0.257 0.257 0.257 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.255 0.254 0.254
0.727 0.617 0.584 0.569 0.559 0.553 0.549 0.546 0.543 0.542 0.540 0.539 0.538 0.537 0.536 0.535 0.534 0.534 0.533 0.533 0.532 0.532 0.532 0.531 0.531 0.531 0.531 0.530 0.530 0.530 0.529 0.527 0.526
1.000 0.816 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.851 0.848 0.845
1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.851 0.848 0.845
3.080 1.890 1.640 1.530 1.480 1.440 1.420 1.400 1.380 1.370 1.360 1.360 1.350 1.340 1.340 1.340 1.330 1.330 1.330 1.320 1.320 1.320 1.320 1.320 1.320 1.320 1.310 1.310 1.310 1.310 1.300 1.300 1.290
6.310 2.920 2.350 2.130 2.020 1.940 1.900 1.860 1.830 1.810 1.800 1.780 1.770 1.760 1.750 1.750 1.740 1.730 1.730 1.720 1.720 1.720 1.710 1.710 1.710 1.710 1.700 1.700 1.700 1.700 1.680 1.670 1.660
12.710 4.300 3.180 2.780 2.570 2.450 2.360 2.310 2.260 2.230 2.200 2.180 2.160 2.140 2.130 2.120 2.110 2.100 2.090 2.090 2.080 2.070 2.070 2.060 2.060 2.060 2.050 2.050 2.040 2.040 2.020 2.000 1.980 1.960
31.820 6.960 4.540 3.750 3.360 3.140 3.000 2.900 2.820 2.760 2.720 2.680 2.650 2.620 2.600 2.580 2.570 2.550 2.540 2.530 2.520 2.510 2.500 2.490 2.480 2.480 2.470 2.470 2.460 2.460 2.420 2.390 2.360 2.330
63.660 9.920 5.840 4.600 4.030 3.710 3.500 3.360 3.250 3.170 3.110 3.060 3.010 2.980 2.950 2.920 2.900 2.880 2.860 2.840 2.830 2.820 2.810 2.800 2.790 2.780 2.770 2.760 2.760 2.750 2.700 2.660 2.620 2.580
212
0.126 0.253 0.524 0.842 0.842 1.280 1.645 Fuente: R. A. Fisher y F. Yates, Statistical Tables for Biological, Agricultural and Medical research.
APNDICE C.
Valores percentiles para la distribucin chi cuadrado con grados de libertad

p
2
p 1-p
FI-UAQ
213
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0.0000 0.0100 0.0717 0.207 0.412 0.676 0.989 1.34 1.73 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.5 11.2 11.8 12.5 13.1 13.8 20.7 28.0 35.5 43.3 51.2 59.2 67.3 0.0002 0.0201 0.115 0.297 0.554 0.872 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.9 9.5 10.2 10.9 11.5 12.2 12.9 13.6 14.3 15.0 22.2 29.7 37.5 45.4 53.5 61.8 70.1 0.0010 0.0506 0.216 0.484 0.831 1.240 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.3 11.0 11.7 12.4 13.1 13.8 14.6 15.3 16.0 16.8 24.4 32.4 40.5 48.8 57.2 65.6 74.2 0.0039 0.103 0.352 0.711 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.10 10.90 11.60 12.30 13.10 13.80 14.60 15.40 16.20 16.90 17.70 18.50 26.50 34.80 43.20 51.70 60.40 69.10 77.90 0.0158 0.211 0.584 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.1 10.9 11.7 12.4 13.2 14.0 14.8 15.7 16.5 17.3 18.1 18.9 19.8 20.6 29.1 37.7 46.5 55.3 64.3 73.3 82.4 0.102 0.575 1.21 1.92 2.67 3.45 4.25 5.07 5.90 6.74 7.58 8.44 9.3 10.2 11.0 11.9 12.8 13.7 14.6 15.5 16.3 17.2 18.1 19.0 19.9 20.8 21.7 22.7 23.6 24.5 33.7 42.9 52.3 61.7 71.1 80.6 90.1 0.455 1.39 2.37 3.36 4.35 5.35 6.35 7.34 8.34 9.34 10.3 11.3 12.3 13.3 14.3 15.3 16.3 17.3 18.3 19.3 20.3 21.3 22.3 23.3 24.3 25.3 26.3 27.3 28.3 29.3 39.3 49.3 59.3 69.3 79.3 89.3 99.3 1.320 2.77 4.11 5.39 6.63 7.84 9.04 10.2 11.4 12.5 13.7 14.8 16.0 17.1 18.2 19.4 20.5 21.6 22.7 23.8 24.9 26.0 27.1 28.2 29.3 30.4 31.5 32.6 33.7 34.8 45.6 56.3 67.0 77.6 88.1 98.6 109.0 2.710 4.61 6.25 7.78 9.24 10.6 12.0 13.4 14.7 16.0 17.3 18.5 19.8 21.1 22.3 23.5 24.8 26.0 27.2 28.4 29.6 30.8 32.0 33.2 34.4 35.6 36.7 37.9 39.1 40.3 51.8 63.2 74.4 85.5 96.6 108.0 118.0 3.840 5.99 7.81 9.49 11.1 12.6 14.1 15.5 16.9 18.3 19.7 21.0 22.4 23.7 25.0 26.3 27.6 28.9 30.1 31.4 32.7 33.9 35.2 36.4 37.7 38.9 40.1 41.3 42.6 43.8 55.8 67.5 79.1 90.5 102.0 113.0 124.0 5.020 7.38 9.35 11.10 12.8 14.4 16.0 17.5 19.0 20.5 21.9 23.3 24.7 26.1 27.5 28.8 30.2 31.5 32.9 34.2 35.5 36.8 38.1 39.4 40.6 41.9 43.2 44.5 45.7 47.0 59.3 71.4 83.3 95.0 107.0 118.0 130.0 6.630 9.21 11.30 13.30 15.1 16.8 18.5 20.1 21.7 23.2 24.7 26.2 27.7 29.1 30.6 32.0 33.4 34.8 36.2 37.6 38.9 40.3 41.6 43.0 44.3 45.6 47.0 48.3 49.6 50.9 63.7 76.2 88.4 100.0 112.0 124.0 136.0 7.880 10.60 12.80 14.90 16.7 18.5 20.3 22.0 23.6 25.2 26.8 28.3 29.8 31.3 32.8 34.3 35.7 37.2 38.6 40.0 41.4 42.8 44.2 45.6 46.9 48.3 49.6 51.0 52.3 53.7 66.8 79.5 92.0 104.0 116.0 128.0 140.0 10.800 13.80 16.30 18.50 20.5 22.5 24.3 26.1 27.9 29.6 31.3 32.9 34.5 36.1 37.7 39.3 40.8 42.3 43.8 45.3 46.8 48.3 49.7 51.2 52.6 54.1 55.5 56.9 58.3 59.7 73.4 86.7 99.6 112.0 125.0 137.0 149.0
Fuente: E.S. Pearson y H.O. Hartley, Biometrika Tables for Statisticans, Vol. 1 (1966).
APNDICE D.
Ordenadas y de la Curva normal estndar Z

y
FI-UAQ
Z
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4
0
0.3989 0.3970 0.3910 0.3814 0.3683 0.3521 0.3332 0.3123 0.2897 0.2661 0.2420 0.2179 0.1942 0.1714 0.1497
1
0.3989 0.3965 0.3902 0.3802 0.3668 0.3503 0.3312 0.3101 0.2874 0.2637 0.2396 0.2155 0.1919 0.1691 0.1476
2
0.3989 0.3961 0.3894 0.3790 0.3653 0.3485 0.3292 0.3079 0.2850 0.2613 0.2371 0.2131 0.1895 0.1669 0.1456
3
0.3988 0.3956 0.3885 0.3778 0.3637 0.3467 0.3271 0.3056 0.2827 0.2589 0.2347 0.2107 0.1872 0.1647 0.1435
4
0.3986 0.3951 0.3876 0.3765 0.3621 0.3448 0.3251 0.3034 0.2803 0.2565 0.2323 0.2083 0.1849 0.1626 0.1415
5
0.3984 0.3945 0.3867 0.3752 0.3605 0.3429 0.3230 0.3011 0.2780 0.2541 0.2299 0.2059 0.1826 0.1604 0.1394
6
0.3982 0.3939 0.3857 0.3739 0.3589 0.3410 0.3209 0.2989 0.2756 0.2516 0.2275 0.2036 0.1804 0.1582 0.1374
7
0.3980 0.3932 0.3847 0.3725 0.3572 0.3391 0.3187 0.2966 0.2732 0.2492 0.2251 0.2012 0.1781 0.1561 0.1354
8
0.3977 0.3925 0.3836 0.3712 0.3555 0.3372 0.3166 0.2943 0.2709 0.2468 0.2227 0.1989 0.1758 0.1539 0.1334
9
0.3973 0.3918 0.3825 0.3697 0.3538 0.3352 0.3144 0.2920 0.2685 0.2444 0.2203 0.1965 0.1736 0.1518 0.1315
214
1.5 1.6 1.7 1.8 1.9
0.1295 0.1109 0.0940 0.0790 0.0656
0.1276 0.1092 0.0925 0.0775 0.0644
0.1257 0.1074 0.0909 0.0761 0.0632
0.1238 0.1057 0.0893 0.0748 0.0620
0.1219 0.1040 0.0878 0.0734 0.0608
0.1200 0.1023 0.0863 0.0721 0.0596
0.1182 0.1006 0.0848 0.0707 0.0584
0.1163 0.0989 0.0833 0.0694 0.0573
0.1145 0.0973 0.0818 0.0681 0.0562
0.1127 0.0957 0.0804 0.0699 0.0551
2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9
0.0540 0.0440 0.0355 0.0283 0.0224 0.0175 0.0136 0.0104 0.0079 0.0060 0.0044 0.0033 0.0024 0.0017 0.0012 0.0009 0.0006 0.0004 0.0003 0.0002
0.0529 0.0431 0.0437 0.0277 0.0219 0.0171 0.0132 0.0101 0.0077 0.0058 0.0043 0.0032 0.0023 0.0017 0.0012 0.0080 0.0006 0.0004 0.0003 0.0002
0.0519 0.0422 0.0339 0.0270 0.0213 0.0167 0.0129 0.0099 0.0075 0.0056 0.0042 0.0031 0.0022 0.0016 0.0012 0.0008 0.0005 0.0004 0.0003 0.0002
0.0508 0.0413 0.0332 0.0264 0.0208 0.0163 0.0126 0.0096 0.0073 0.0055 0.0040 0.0030 0.0022 0.0016 0.0011 0.0008 0.0005 0.0004 0.0003 0.0002
0.0498 0.0404 0.0325 0.0258 0.0203 0.0158 0.0122 0.0093 0.0071 0.0053 0.0039 0.0029 0.0021 0.0015 0.0011 0.0008 0.0005 0.0004 0.0003 0.0002
0.0488 0.0396 0.0317 0.0252 0.0198 0.0154 0.0119 0.0091 0.0069 0.0051 0.0038 0.0028 0.0020 0.0015 0.0010 0.0007 0.0005 0.0004 0.0002 0.0002
0.0478 0.0387 0.0310 0.0246 0.0194 0.0151 0.0116 0.0088 0.0067 0.0050 0.0037 0.0027 0.0020 0.0014 0.0010 0.0007 0.0005 0.0003 0.0002 0.0002
0.0468 0.0379 0.0303 0.0241 0.0189 0.0147 0.0113 0.0086 0.0065 0.0048 0.0036 0.0026 0.0019 0.0014 0.0010 0.0007 0.0005 0.0003 0.0002 0.0002
0.0459 0.0371 0.0297 0.0235 0.0184 0.0143 0.0110 0.0084 0.0063 0.0047 0.0035 0.0025 0.0018 0.0013 0.0009 0.0007 0.0005 0.0003 0.0002 0.0001
0.0449 0.0363 0.0290 0.0229 0.0180 0.0139 0.0107 0.0081 0.0061 0.0046 0.0034 0.0025 0.0002 0.0013 0.0009 0.0006 0.0004 0.0003 0.0002 0.0001
Fuente: R. A. Fisher y F. Yates, Statistical Tables for Biological, Agricultural and Medical research.
NDICE DE TABLAS.
TABLA 1.01 Edades recolectadas. P 26 TABLA 1.02 Clasificacin por clases. P 27 TABLA 1.03 Frecuencias. P 28
215
TABLA 2.01 Media, mediana y moda. P 39 TABLA 2.02 Pesos y estaturas. P 42 TABLA 2.03. Consumo de energa. P 53
TABLA 3.01 Registro de antigedad y mantenimiento. P 59 TABLA 3.02 Registro del tipo de gasolina. P 64 TABLA 3.03 Registro de carbonatacin y resistencia. P 64 TABLA 3.04 Registro de mm de lluvia. P 65
TABLA 5.01 Funciones de probabilidad. P 95 TABLA 5.02 Frecuencias. P 100 TABLA 5.03 Probabilidades. P 101 TABLA 5.04 Ejemplo: Calificaciones de alumnos. P 102 TABLA 5.05 Ejercicio de momentos. P 113
TABLA 6.01 Modelo de Bernoulli. P 116 TABLA 6.02 Modelo Binomial. P 120 TABLA 6.03 Modelo de Poisson. P 124 TABLA 6.04 Distribucin Ji-Cuadrada. P 150 TABLA 6.05 Distribucin F. P 153
TABLA 7.01 Parmetros y estimadores. P 161 TABLA 7.02 Intervalos de confianza. P 171 TABLA 7.03 Tabla para utilizar directamente, cuando es normal la variable. P 172 TABLA 8.01 Errores en la prueba de hiptesis. P 200
216
NDICE DE ESQUEMAS.
ESQUEMA 1.01 Anlisis descriptivo de los datos. P 19 ESQUEMA 1.02 Proceso estadstico. P 21 ESQUEMA 1.03 Tipos de variables. P 22 ESQUEMA 1.04 Clasificacin de personas por peso. P 23 ESQUEMA 1.05 Variable discreta y continua. P 24
ESQUEMA 1.06 Comparacin histograma y diagrama de barras. P 29 ESQUEMA 1.07 Grfica de pastel. P 30 ESQUEMA 1.08 Ojiva. P 30 ESQUEMA 1.09 Cajas y ejes, representacin horizontal. P 31 ESQUEMA 1.10 Cajas y ejes, representacin vertical. P 31
ESQUEMA 2.01 Asimetra positiva. P 36 ESQUEMA 2.02 Curva simtrica. P 36 ESQUEMA 2.03 Ilustracin media, mediana y moda. P 37 ESQUEMA 2.04 Cuartiles. P 44 ESQUEMA 2.05 Deciles. P 44 ESQUEMA 2.06 Distribucin de frecuencias simtrica y asimtrica. P 47 ESQUEMA 2.07 Asimetra positiva y negativa. P 48
ESQUEMA 2.08 Curva simtrica. P 49
ESQUEMA 2.09 Curva asimtrica negativa. P 50 ESQUEMA 2.10 Curva asimtrica positiva. P 50 ESQUEMA 2.11 Curva mesocrtica. P 51 ESQUEMA 2.12 Curva leptocrtica. P 52 ESQUEMA 2.13 Curva platicrtica. P 52
217
ESQUEMA 3.01 Diagramas de dispersin. P 55 ESQUEMA 3.02 Diagrama de dispersin. P 61 ESQUEMA 3.03 Recta de regresin. P 63
ESQUEMA 4.01 Diagrama de Venn- Euler. P 67 ESQUEMA 4.02 Conjunto A U B ESQUEMA 4.03 Conjunto ESQUEMA 4.04 Conjunto ESQUEMA 4.05 Conjunto P 67 P 68 P 68 P 69
ESQUEMA 4.06 Ejercicio resuelto. P 70 ESQUEMA 4.07 Particin de un espacio muestral. P 74 ESQUEMA 4.08 Permutaciones circulares. P 77 ESQUEMA 4.09 Espacio muestral. P 80 ESQUEMA 4.10 Conjunto P( A / B). P 85 ESQUEMA 4.11 Los conjuntos A y B no interceptan. Son mutuamente excluyentes. P 88
ESQUEMA 5.01 Momentos de una variable aleatoria. P 96 ESQUEMA 5.02 No es funcin de probabilidad. P 97 ESQUEMA 5.03 Espacio muestral. P 97 ESQUEMA 5.04 Funciones de probabilidad. P 99
218
ESQUEMA 5.05 Histograma de probabilidades. P 101 ESQUEMA 5.06 Variable aleatoria E. P 102 P 103
ESQUEMA 5.07 Variable aleatoria continua. ESQUEMA 5.08 Funcin de densidad. P 104
ESQUEMA 5.09 Modelos probabilsticos. P 105 ESQUEMA 5.10 Punto de equilibrio. P 107 ESQUEMA 5.11 Coeficiente de asimetra. P 110 ESQUEMA 5.12 Coeficiente de curtosis. P 113
ESQUEMA 6.01 Modelos probabilsticos. P 114 ESQUEMA 6.02 distribucin normal. P 115 ESQUEMA 6.03 Artculos registrados. P 119 ESQUEMA 6.04 Histograma de probabilidades. P 120 ESQUEMA 6.05 Comparacin de Bernoulli, Binomial y Poisson. P 125 ESQUEMA 6.06 Distribucin de probabilidad alrededor de la media en una distribucin N ( , ). 134 ESQUEMA 6.07 Paso 1. P 136 ESQUEMA 6.08 Paso 4. P 136 ESQUEMA 6.09 Paso 1. P 137 ESQUEMA 6.10 Paso 4. P 137 ESQUEMA 6.11 Paso 1. P 138 ESQUEMA 6.12 Paso 4. P 139 P
ESQUEMA 6.13 Ejercicio 2. P 139 ESQUEMA 6.14 Ejercicio 3. P 140 ESQUEMA 6.15 Ejercicio 4. P 140 ESQUEMA 6.16 Ejercicio 5. P 141 ESQUEMA 6.17 Ejercicio 6. P 141 ESQUEMA 6.18 Ejercicio 7. P 142 ESQUEMA 6.19 Ejercicio 8. P 142 ESQUEMA 6.20 Ejercicio 9. P 143 ESQUEMA 6.21 Ejercicio 10. P 144 ESQUEMA 6.22 Comparacin entre Normal y T de Student. P 145 ESQUEMA 6.23 Ejercicio 1. P 147 ESQUEMA 6.24 Ejercicio 2. P 148 ESQUEMA 6.25 Ejercicio 3. P 148 ESQUEMA 6.26 Distribucin Ji-Cuadrada. ESQUEMA 6.27 Ejercicio 1. P 152 ESQUEMA 6.28 Ejercicio 2. P 152 ESQUEMA 6.29 Distribucin F. P 153 P 151
219
ESQUEMA 7.01 Estimadores. P 155 ESQUEMA 7.02 Estimador insesgado. P 159 ESQUEMA 7.03 Seleccin de la muestra. P 159 ESQUEMA 7.04 La muestra tiene que ser representativa. P 160 ESQUEMA 7.05 Mnima varianza. P 161 ESQUEMA 7.06 Distribucin normal. P 164 ESQUEMA 7.07 Solucin ejercicio 1. P 165
ESQUEMA 7.08 Distribucin uniforme discreta. P 166 ESQUEMA 7.09 Intervalo de confianza. P 169 ESQUEMA 7.10 Lmite inferior y superior de confianza. P 170 ESQUEMA 7.11 Lmite inferior y superior de confianza. Ejemplo. P 171 ESQUEMA 7.12 Intervalos de confianza. P 172 ESQUEMA 7.13 Intervalos de confianza y sus lmites. P 172 ESQUEMA 7.13 Confiabilidad 0.90. P 173 ESQUEMA 7.14 Confiabilidad 0.95. P 173 ESQUEMA 7.15 Confiabilidad 0.99. P 173 ESQUEMA 7.16 Confiabilidad 0.90, 0.95 y 0.99. P 174 ESQUEMA 7.17 Muestra no representativa. P 183
220
ESQUEMA 7.18 Riesgo de una muestra no representativa. P 183 ESQUEMA 7.19 Ciudad de Mxico. P 186 ESQUEMA 7.20 Premuestra y muestra. P 189
ESQUEMA 8.01 Absurdo aplicar prueba de hiptesis. P 193 ESQUEMA 8.02 Observacin del experto. P 193 ESQUEMA 8.03 Necesario aplicar prueba de hiptesis. P 194 ESQUEMA 8.04 Estimador insesgado y de mnima varianza. P 194 ESQUEMA 8.05 Prueba de 2 colas. P 195 ESQUEMA 8.06 Prueba de cola izquierda. ESQUEMA 8.07 Prueba de cola derecha. P 196 ESQUEMA 8.08 Regin crtica y nivel de significancia. P 198 ESQUEMA 8.09 probabilidad del error tipo II. P 199 P 195.
ESQUEMA 8.10 Promedio de lquido=32.5 onzas. P 202
ESQUEMA 8.10 Promedio de lquido=31.5 onzas en zona de rechazo. P 203 ESQUEMA 8.11 Se usa T de Student. P 204 ESQUEMA 8.12 Se aplica la prueba F. P 205
221 Bibliografa
DE VORE JAY L., PROBABILIDAD Y ESTADSTICA PARA INGENIERA Y CIENCIAS, ED. Thomsom. 2001. DURA J.M., LPEZ J.M.: "Fundamentos de Estadstica. Estadstica descriptiva y modelos probabilsticos para la inferencia", Ed. Ariel Economa, 1988. HERNNDEZ LERMA, Onsimo. Elementos de probabilidad y estadstica, Mxico, Fondo de cultura Econmica, 1979. INFANTE, ZARATE, MTODOS ESTADSTICOS, Ed. Trillas.1993. JEFFREY, R.C., Probability and the Art of Judgment, Cambridge University Press.1992. KISH, Leslie. Muestreo de encuestas, 3 reimp, Mxico, Trillas, 1982. KREYSZIG, Introduccin a la Inferencia Estadstica. Limusa. 2003. LEVIN, Richard I. Estadstica para administradores. 2 ed. Mxico: Prentice -Hall Latinoamericana, 1988. MENDENHALL, William; REINMUTH, James. Estadstica para administracin y Economa,[trad. Joaqun Daz Saiz, Federico O Reill y], Mxico, Grupo Editorial Iberoamrica, 1986. MORENO BONATT, Elementos de Probabilidad y Estadstica. Asociacin Iberoamericana de Educacin a Distancia. 2004. MUNICH, Lourdes; NGELES, Ernesto. Mtodos y Tcnicas de investigacin. 2. ed.. Mxico: Trillas, 1990. MURRAY R. Spiegel, Probabilidad. SerieShaums. 2003. P. ARMITAGE, G. BERRY: HARCOURT&BRACE, 1997. Estadstica para la investigaci n biomdica, Ed.
QUESADA V., I LPEZ: "Curso y Ejercicios de Estadstica", Ed. Alhambra, 1989. RAJ, Des. La estructura de las encuestas de muestreo, Mxico, Fondo de cultura Econmica, 1979. SPIEGEL, Murray R. Teora y problemas de probabilidad y estadstica. [trad. Jairo Osuna Surez], Mxico, Mc Graw Hill, 1979. VELASCO,Gabriel& WISNIEWSKI,Piotr: Probabilidad y estadstica para ingeniera y ciencias, Ed. Thomson, 2001. WALPOLE R.E., MYERS R.H., MYERS S.L.: "Probabilidad y Estadstica para Ingenieros", Ed. Prentice Hall, 1998, 6 edicin.

GUÍA PROBABILIDIAD Y ESTADÍSTICAok

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

GUÍA PROBABILIDIAD Y ESTADÍSTICAok

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD AUTNOMA DE QUERTARO FACULTAD DE INGENIERA

GUA DEL MAESTRO

Que para obtener el ttulo de Ingeniero Civil

PRESENTA: Israel Luna Vaca

Asesor: M. en I. Pablo Talamantes Contreras

Fecha: Mircoles 11 de mayo del 2011.

M. en I. Pablo Talamantes Contreras, catedrtico de la FI-UAQ.

M en C. Crisgono de Santiago Guerrero, catedrtico de la FI-UAQ.

Dra. Teresa Flores Guzmn, catedrtica de la FI-UAQ.

M.Q.Hernndez Garciadiego Cecilia, catedrtica de la FI-UAQ.

NDICE RECOMENDACIONES PARA EL PROFESOR8 COMPETENCIAS ACADMICAS...8 LINEAMIENTOS SUGERIDOS....9

Apndice C..213 Valores percentiles de Chi cuadrado con para la distribucin

Aplicar las medidas de centralizacin en la encuesta que se propuso en clase.

Elaborar un mapa conceptual de todos los elementos de la teora de conjuntos.

Resolver los ejercicios propuestos en la gua.

ESQUEMA 1.01 Anlisis descriptivo de los datos.

1.3 Mtodo cientfico y estadstica.

muestra y el conjunto de todos los posibles registros se le conoce como poblacin.

Discretas (para contar)

No existen posibilidades intermedias ej. manzanas, habitantes.

Contnuas (para medir)

Infinidad de valores intermedias. ej. Estatura, espesor de hoja.

Condicin especfica del sujeto en estudio. ej. Domicilio, nacionalidad, religin.

Caracterstica de tamao u orden. ej. Chico, mediano, malo, bueno.

ESQUEMA 1.03 Tipos de variables.

ESQUEMA 1.04 Clasificacin de personas por peso.

ESQUEMA 1.05 Variable discreta y continua.

Calcular el valor representativo o la marca de clase mediante

TABLA 1.01 Edades recolectadas.

TABLA 1.02 Clasificacin por clases.

xm 1 2 3 4 5 6 29.5 34.5 39.5 44.5 49.5 54.5

conteo IIII/IIII IIII/IIII/I IIII/III IIII/ II I

fri 0.25 0.30 0.22 0.14 0.06 0.03 1

Frai 0.25 0.55 0.77 0.91 0.97 1

TABLA 1.03 Frecuencias.

Grficas de distribucin de probabilidad f(x) f(x)

0.5 0.4 0.3 0.2 0.1 x

0.5 0.4 0.3 0.2 0.1 x FI-UAQ

ESQUEMA 1.06 Comparacin histograma y diagrama de barras.

es la frecuencia correspondiente y los

distribucin.(Jos Muoz, 1987).

ESQUEMA 1.07 Grfica de pastel.

Emisin de xido de azufre (tons) FI-UAQ

ESQUEMA 1.09 Cajas y ejes, representacin horizontal.

ESQUEMA 1.10 Cajas y ejes, representacin vertical

UNIDAD 2 ESTADSTICA DESCRIPTIVA.

Medidas de dispersin. Amplitud, varianza, desviacin estndar, coeficiente de variacin.

Medidas de posicin. Cuartiles, centiles, deciles, sesgo, curtosis.

Medidas de asociacin se desarrollan en el Capitulo 3.

.-SIGMA.- indica la operacin de suma

As Xi ; es la suma de los nmeros

Donde .- media muestral. .- suma de los valores.

Media para datos agrupados:

Observa el comportamiento con un valor extremo de los datos anteriores:

Cuando la distribucin de frecuencia es simtrica la

Al comparar las medidas de tendencia central se pueden presentar 3 casos.

.- En este caso se dice que tiene asimetra hacia la derecha, esto es

Curva de asimetra positiva.

ESQUEMA 2.01 Asimetra positiva.

ESQUEMA 2.02 Curva simtrica.

Ancdota para reflexionar en clase:

Confundir media y mediana, es una moda?

mediana moda Media

Para datos agrupados: Varianza: V a rian za p a ra da t o s a gru p ad o s