Libro de Probabilidad

Probabilidad y Estad stica
C esar A. Herazo Henriquez 15 de abril de 2012
Indice general
1. Estad stica Descriptiva 1.1. Introducci on . . . . . . . . . . . . . . . . . . . 1.2. Estudio Descriptivo de los Datos . . . . . . . 1.2.1. Descripci on por Gr acas y Tablas . . 1.2.2. Descripcion por Medidas . . . . . . . . 1.3. Medidas Descriptivas para Datos Agrupados . 1.4. Ejercicios . . . . . . . . . . . . . . . . . . . . 1 1 2 3 12 23 26 31 31 32 34 36 39 40 43 47 48 49 50 55 56 61 61 65 65 68
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
2. Elementos de Probabilidad 2.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Conceptos b asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Axiomas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Propiedades de P (.) . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Espacios Muestrales Finitos . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Espacios Muestrales Finitos con resultados igualmente posibles 2.5.2. Espacios Muestrales Finitos sin resultados igualmente posibles 2.6. Continuidad de la funci on P . . . . . . . . . . . . . . . . . . . . . . 2.6.1. Probabilidades 0 y 1 . . . . . . . . . . . . . . . . . . . . . . . 2.6.2. Selecci on aleatoria de puntos de intervalos . . . . . . . . . . . 2.7. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Independencia Entre Eventos . . . . . . . . . . . . . . . . . . . . . . 2.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Variables Aleatorias 3.1. Variables Aleatorias . . . . . . . . . . . . . . . . . 3.2. Funciones de distribuci on . . . . . . . . . . . . . . 3.2.1. Propiedades de la funci on de distribuci on F 3.3. Clases de Variables Aleatorias . . . . . . . . . . . . i
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
ii 3.3.1. Variables Aleatorias Discretas . 3.3.2. Variables Aleatorias Continuas 3.4. Esperanzas y Momentos . . . . . . . . 3.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
INDICE GENERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 70 72 85
Cap tulo 1
Estad stica Descriptiva

1.1. Introducci on
La palabra Estad stica viene del lat n Status que signica estado y por varias d ecadas fu e asociada solamente con la presentaci on de hechos y guras relacionados con la econom a, la demograf a y otras situaciones pol ticas sobresalientes en un pa s. El t ermino estad stica es hoy ampliamente usado y es as , entre algunos ejemplos, como los m edicos llaman a la historia de los pacientes, la estad stica de estos; los comentaristas del deporte llaman al reporte de los equipos(partidos jugados, ganados, perdidos, puntos, etc), estad stica de los equipos. Sin embargo, este uso del t ermino, no es el mas apropiado, pues la estad stica se ocupa de situaciones en las cuales la ocurrencia de un evento no puede ser predicho con certeza. La Estad stica es un cuerpo de conceptos y m etodos usados para coleccionar e interpretar datos provenientes de un area particular de la investigaci on y para sacar conclusiones en situaciones donde la incertidumbre y la variaci on est an presentes. De acuerdo a esto, la estad stica contempla el arte y la ciencia de la colecci on, interpretaci on, y an alisis de datos, y la habilidad para sacar generalidades l ogicas que relacionen el fen omeno bajo investigaci on. Si se recuerdan los estados esenciales del m etodo cient co (que incluye especicaci on de objetivos, recolecci on de informaci on, an alisis de datos y exposici on de lo encontrado), es claro que la estad stica penetra extensamente en el dominio de la investigaci on cient ca. Despu es que los datos han sido coleccionados, hay una gran necesidad de usar m etodos estad sticos. Uno de estos m etodos esta dise nado para resumir la informaci on contenida en los datos y describir los rasgos prominentes, el otro m etodo est a encaminado para sacar generalidades o inferencias acerca del fen omeno de estudio. El 1
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA
primero se conoce como Estad stica Descriptiva y el segundo como Estad stica Inferencial . En una investigaci on hay, en general, un conjunto de datos que puede ser muy grande y que por muchos factores no se pueden coleccionar todos, sin embargo para hacer alguna inferencia sobre estos se debe tomar una parte de ellos. Esto conduce a las siguientes deniciones Denicion 1.1. Una poblaci on (estad stica) es el conjunto completo de medidas posibles o el registro de alg un rasgo cualitativo correspondiente a la colecci on completa de unidades para la cual ser an hechas las inferencias. Denicion 1.2. Una muestra de una poblaci on es el conjunto de m edidas que son realmente coleccionadas en el curso de una investigaci on. Con base en una muestra, que debe ser bien tomada se obtienen las conclusiones acerca de una poblaci on.(Objetivo fundamental de la estad stica) Los objetivos principales de la estad stica son: Hacer inferencias acerca de una poblaci on de un an alisis de informaci on contenida en datos muestrales. Hacer evaluaci on de la incertidumbre incluida en estas inferencias. Dise nar el proceso y extensi on del muestreo de manera que las observaciones formen una base para hacer inferencias v alidas y seguras
1.2.
Estudio Descriptivo de los Datos
El proceso de la colecci on de datos puede incluir actividades diversas tales como experimentos de laboratorio, pruebas de campo, estudios de opini on, el examen de registros hist oricos, etc. De esta manera resulta un conjunto de datos consistente de m edidas num ericas que pueden ir desde unas pocas guras a una complejidad de cientos o miles de n umeros. Esta informaci on debe ser organizada y analizada para sacar conclusiones. El resumen y la exposici on de los aspectos m as importantes de un conjunto de datos se llama Estad stica Descriptiva e incluye la condensaci on de los datos en forma de tablas, su representaci on gr aca y el c alculo de indicadores num ericos del centro y la variabilidad. Los aspectos principales para describir un conjunto de datos son:
1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS a. Resumen y descripci on del patr on total de los datos por: Presentaci on por tablas y gr acas.
Examen de la forma total de los datos gracados para observar rasgos importantes, incluyendo simetr a. Inspeci on de los datos gracados para examinar si hay observaciones inusuales (Outliers) las cuales parecen estar lejos de la mayor a de los datos. b. C alculo de medidas num ericas para identicar: Un valor t pico o representativo que indique la localizaci on central de los datos. La cantidad de variaci on presente en los datos.
1.2.1.
Descripci on por Gr acas y Tablas
Cuando los datos son cuantitativos (medidos, contados, etc.), los dos m etodos gr acos principales para representar un conjunto de datos son: el diagrama de puntos, que se emplea cuando se tienen pocas observaciones (menos de 25) y el histograma de frecuencias relativas que se usa cuando hay un gran n umero de datos. Diagrama de Puntos Cuando hay pocas observaciones, ellas pueden ser representados gr acamente dibujando una l nea con una escala que cubra el rango de los valores de las medidas y sobre esta se dibujan los datos como puntos prominentes. La gura as obtenida se llama diagrama de puntos . Ejemplo 1.1. El autor de un texto pr oximo a publicar observa, al hojear 20 paginas, que los errores por pagina son: 1, 2, 2, 2, 12, 3, 3, 3, 4, 4, 10, 4, 4, 5, 5, 5, 6, 7, 4, 3. Construya el diagrama de puntos y hacer las observaciones pertinentes. Soluci on. Se construir a una l nea horizontal que tenga una escala de 0 a 12 y sobre ella se colocan los puntos de manera que si una observaci on se repite se coloca encima del dato id entico a la observaci on. La gura 1.1 muestra el diagrama de puntos de esta situaci on.
Se observa que la mayor a de los datos est an distribuidos alrededor de un valor central, 4 o 5, excepto para los valores 10 y 12, los cuales se desv an sustancialmente de los otros. El autor debe examinar estas dos u ltimas observaci ones.
Figura 1.1. Diagrama de puntos de los errores por p agina
Distribuci on de Frecuencias Cuando el conjunto de datos es grande, gracar un diagrama de puntos es tedioso, m as a un, el api namiento de estos en el diagrama puede resultar que oscurezca detalles en las areas donde las observaciones est an fuertemente concentradas. En tales casos, es conveniente condensar los datos agrupando las observaciones cercanas y construir una tabla de frecuencias . Para construir una distribuci on de frecuencias se procede as : a. Se encuentran los valores m nimo(xmin ) y m aximo(xmax ) en el conjunto de datos. b. Se escoge un n umero, k , de sub-intervalos o celdas de igual longitud, L, que cubra el rango ,R, entre el m nimo y el m aximo, sin sobreposici on. Estos son llamados intervalos de clase y sus puntos nales se conocen como acotamiento de clase. c. Se cuenta el n umero de observaciones que pertenecen a cada intervalo de clase. La suma de cada clase se llama frecuencia de clase fi .
i d. Se determina la frecuencia relativa de cada clase por fik = f n . Donde n es el n umero de datos. La frecuencia relativa de una clase da el porcentaje de informaci on en la clase .
Observaci on. La escogencia del n umero y posici on de los intervalos de clase es fundamentalmente una materia de prueba y error: El n umero de clases usualmente va de 6 a 15 dependiendo del n umero de observaciones en los datos. Agrupar las observaciones en clase sacrica la informaci on concerniente a c omo las observaciones est an distribuidas en cada celda.
1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS
Si hay pocas celdas, la p erdida de informaci on es seria, y si hay muchas y el conjunto de datos es muy peque no, las frecuencias de una celda a la pr oxima tienden a subir y a bajar de una forma ca otica y no producen un patr on para la distribuci on total de los datos. Como un paso inicial, las frecuencias pueden ser determinadas con un gran n umero de intervalos que pueden ser combinados posteriormente como se desean para obtener una escogencia as que el patr on de la distribuci on sea visible. Existen varias reglas que pretenden dar el n umero ideal de intervalos: Una es la regla de Sturges que establece: tome k el entero m as cercano a 1+ 3, 322 log n; otra establece que k debe ser el entero m as cercano al n umero 2, 5 4 n. Para n grande estos dos n umeros son parecidos. Un lugar decimal extra (.5, .05, .005, etc.) se usa para denir el acotamiento de clase, dependiendo si los datos son enteros, con un decimal, con dos decimales, etc. De esta manera ningua observaci on puede caer exactamente sobre el acotamiento evitando as la ambig uedad en la clasicaci on de los datos. Ejemplo 1.2. En un grupo de 60 trabajadores dedicados a una actividad especca se hizo una prueba sobre esa acitvidad y los puntajes obtenidos se muestran abajo. Construir una distribuci on de frecuencias. Puntajes de 60 trabajadores sobre una actividad X 84.1 83.3 80.1 86.3 81.9 88.8 88.9 85.0 82.8 87.8 86.4 81.5 90.2 87.7 81.3 80.7 86.1 85.5 80.4 85.8 86.7 92.0 85.5 85.2 83.7 87.2 84.7 82.1 85.7 89.8 83.6 87.7 88.2 80.6 90.8 83.6 82.3 86.0 79.1 82.6 84.5 86.9 87.5 83.9 82.9 83.1 83.9 82.6 86.4 83.9 87.0 81.8 86.7 91.2 84.4 84.2 77.4 89.1 83.4 84.8
Tabla 1.1: Datos para el Ejemplo 2. Soluci on. De los datos se observa que: xmin = 77,4 y xmax = 92,0. Luego, R = 14,6 Se calcula ahora 2,5 4 n; como n = 60, entonces 2,5 4 60 6,958, sea k = 7 Adem as R/k = 2,09, sea L = 2,2. Ser a que si se toma L=2.1, funciona? La distribuci on de frecuencias de los datos se da en la Tabla 1.2: En esta tabla se han usado los siguientes critierios para denir los intervalos:
6 Intervalos
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA fi 2 6 17 14 13 5 3 60 fir 0.0333 0.1000 0.2800 0.2333 0.2167 0.0833 0.0500 0.9966 hi = fir /L 0.0151 0,0454 0.1272 0.1060 0.0985 0.0378 0.0227
77,35 79,55 79,55 81,75 81,75 83,95 83,95 86,15 86,15 88,35 88,35 90,55 90,55 92,75
Tabla 1.2: Distribuci on de frecuencias para la actividad de 60 trabajadores El l mite inferior del primer intervalo se construye asi: Vmin 0,5 y para obtener el l mite superior se le suma la longitud L al l mite inferior. El l mite inferior del segundo intervalo es el l mite superior del primero y su l mite superior se obtiene sumandole L. En general, el l mite superior del intervalo k es su l mite inferior mas k veces L. Despu es de resumir un gran conjunto de datos en la forma de una distribuci on de frecuencias, este puede ser representado gr acamente en un histograma de frecuencias relativas , el cual es una representaci on visual del patr on de la distribuci on. Para dibujar un histograma de frecuencias relativas, los intervalos de clase son marcados en una l nea horizontal y, sobre cada intervalo un rect angulo vertical es levantado con area igual a la frecuencia relativa de ese intervalo. En este punto debe tenerse en cuenta que la altura de cada recta angulo hi se obtiene como se indica en la columna 4 de la tabla 1.2, es de anotar que cuando hay intervalos ir de diferente amplitud, se emplea la f ormula hi = f Li , donde fir es la frecuencia relativa del intervalo i y Li es la longitud del mismo intervalo. El area de cada rect angulo en un histograma de frecuencias relativas representa la proporci on de las observaciones que ocurren en el intervalo de clase sobre el cual se levanta el rect angulo. De aqu que el area de la suma de todos los rect angulos en un histograma es 1. La convenci on de usar el area de todos los rect angulos mas bien que sus alturas para representar sus frecuencias relativas, tiene la siguiente ventaja: a ojo se pueden comparar dos partes de un histograma o dos histogramas diferentes, y cuando dos histogramas est an basados en intervalos de clase de diferente amplitud, la propiedad de tener area igual a 1 hace a estos comparables.
Ejemplo 1.3. En el ejemplo 2 de la prueba a los 60 trabajadores, construir un histograma de frecuencias relativas. Soluci on. De acuerdo a la tabla 1.2 se colocan los intervalos sobre una linea horizontal y luego se levantan los rectangulos con las alturas obtenidas en la columna 4.
Figura 1.2. HFR de la prueba a 60 trabajadores La regla que sugiere intervalos de clase iguales no es apropiada cuando los datos est an separados sobre un amplio rango, pero est an altamente concentrados en una peque na parte del mismo con relativamente pocos datos dispersos. Usando intervalos de peque na longitud donde los datos est an altamente concentrados e intervalos grandes cuando los datos est an bien dispersos, ayuda a reducir la p erdida de informaci on debido al agrupamiento. Las tabulaciones de ingreso, edad y otras caracter sticas en reportes ociales se hacen a menudo con intervalos de clase desiguales. Cuando los intervalos de clase no son todos iguales, el histograma debe ser gracado de acuerdo a la convenci on de usar el area de los rect angulos para representar las frecuencias relativas, para conducir el patr on correcto de la distribuci on. Ejemplo 1.4. La distribuci on de frecuencias del n umero de personas muertas en los grandes tornados en los E.E.U.U. entre 1900 y 1973 se muestra en la tabla 1.3. Gracar el histograma de frecuencias relativas y comentar la forma de la distribuci on. Soluci on. Se construye primero una distribuci on de frecuencias de manera que las clases sean cont nuas (ver tabla 1.4). Con el objeto de construir el histograma de la gura 1.3 se han acotado el primer y u ltimo intervalo. La longitud de estos depende de como est an relacionadas las frecuencias relativas del primero con el segundo y la del pen ultimo con la del u ltimo. Por ejemplo, si la frecuencia relativa del u ltimo intervalo es menor que la del pen ultimo, se toma ese intervalo con igual longitud a la del anterior. Se observa adem as, que la distribuci on de muertes en los tornados es sesgada a la derecha.
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA N de muertos 24 25 49 50 74 75 99 100 149 150 199 200 249 250 Frecuencia 8 16 16 11 6 2 4 1
Tabla 1.3: Distribuci on de frecuencias para los muertos en los tornados en E.E.U.U. entre 1900 y 1973
Figura 1.3. HFR de personas muertas en tornados en USA Diagrama de L neas de Frecuencias Relativas Algunas veces el conjunto de datos consiste de cuentas, tales como el n umero de ni nos por familia o el n umero de art culos defectuosos por d a en un proceso de producci on o el n umero de accidentes de tr ansito por d a, en vez de ser medidos sobre una escala cont nua. Si el n umero de valores distintos en tal conjunto de datos no es muy grande, se construye una distribuci on de frecuencias usando los valores individuales como las clases en vez de usar intervalos de clase. Los datos son presentados en la forma de un Diagrama de L neas de Frecuencias Relativas . Un diagrama de l neas de frecuencias relativas se construye as : Los valores distintos son localizados sobre una l nea horizontal y luego l neas verticales con alturas iguales a las frecuencias relativas se levantan sobre estos valores. Las l neas reemplazan los rect angulos para enfatizar que las frecuencias no est an realmente cubriendo intervalos.
1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS Intervalos 0,5 24,5 24,5 49,5 49,5 74,5 74,5 99,5 99,5 149,5 149,5 249,5 249.5 fi 8 16 16 11 6 6 1 64 fir 0.125 0.250 0.250 0.172 0.094 0.094 0.016 1.001
Tabla 1.4: Distribuci on de frecuencias corregida para los muertos en los tornados
Un histograma puede ser construido tambi en dibujando rect angulos centrados sobre los valores distintos de los datos, con tal que las frecuencias relativas sean consideradas como las alturas. Aunque los diagramas de l nea y los rect angulos son usados por datos contados, los diagramas de l nea nunca deben ser dibujados para medidas sobre una escala cont nua. Ejemplo 1.5. En un centro de c omputo , el n umero diario de interrupciones del computador debido a error de m aquina fueron registrados por un per odo de 40 d as y los datos de abajo fueron obtenidos. Construir una distribuci on del n umero de interrupciones por d a y un diagrama de l neas.
1 1 4
2 2 0
0 0 2
0 0 2
1 1 6
5 0 1
4 0 0
3 0 0
3 1 1
1 1 3
2 0
5 2
0 0
0 2
3 4
Soluci on La distribuci on de frecuencia se realiza teniendo en cuenta que los datos son contados y el n umero de valores distintos es poco. Esta se encuentra en la tabla 1.5 y el diagrama de l neas se da en la gura 1.4.
10
Figura 1.4. D.L.F.R. del n umero de interrupciones
N de Interrupciones 0 1 2 3 4 5 6 Total
Frecuencia 14 9 7 4 3 2 1 40
Frecuencia Relativa 0.350 0.225 0.175 0.100 0.075 0.050 0.025 1.000
Tabla 1.5: Distribuici on de Frecuencias del n umero diario de interrupciones de un computador debido a un error de m aquina
Pol gono de Frecuencias Relativas Esta gr aca se obtiene del histograma de frecuencias relativas uniendo mediante trazos los puntos medios (altos) de los rect angulos; como punto de partida se toma el punto medio del intervalo anterior al primero (?) y como punto de llegada el punto medio del intervalo siguiente al u ltimo (?). La gura 1.5 muestra el pol gono de frecuencias para la prueba de los 60 trabajadores. Las interrogaciones se deben a que en la l ogica com un no se concibe algo antes de lo primero ni despu es de lo u ltimo.
11
Figura 1.5. P.F.R. de la prueba a 60 trabajadores Otros m etodos gr acos Cuando las categor as b asicas no son cuanticables tales como: tendencia pol tica, preferencias de color, fuentes de energ a, entre otros, se emplean el diagrama del pastel y el diagrama de franjas. El diagrama del pastel es un gr aco donde se dibuja un c rculo (o un pastel) y se divide este en sectores(en rebanadas) de acuerdo al total o porcentaje de cada categor a. Ejemplo 1.6. En una f abrica se encontr o que el personal total se distribuye de la siguiente manera: De ocina 25 %, operarios 40 %, profesionales 20 % y otros 15 %. Dibuje un diagrama de pastel. Soluci on. En la gura 1.6 aparece el diagrama donde, por ejemplo el sector correspondiente a operarios es el 40 % equivalente a los 360 grados del c rculo.
Otros 15 % Ocina 25 % 40 % 20 % Profesionales
Operarios Figura 1.6 Diagrama de pastel para el personal de la empresa
12
El diagrama de franjas se construye colocando las categor as sobre una l nea horizontal (o vertical) separadas por una longitud establecida y luego se dibujan rect angulos con el total o proporci on de cada una de ellas. Ejemplo 1.7. En un curso de Matem aticas de primer semestre las notas denitivas fueron: 6 excelentes(E), 9 buenas(B), 16 regulares(R) y 19 malas(M). Construya un diagrama de franjas. Soluci on. Las notas de este curso corresponden en porcentajes a: Excelentes 12 %, Buenos 18 %, Regulares 32 % y Malos 38 %. En la gura 1.7 est a construido el diagrama de franjas vertical de esta informaci on.
Figura 1.7. Diagrama de franjas las notas de 50 estudiantes
1.2.2.
Descripcion por Medidas
Otra forma, muy importante,de describir un conjunto de datos es mediante el c alculo de medidas num ericas llamadas de localizaci on y de variabilidad.
Medidas de Localizaci on Estas medidas intentan localizar puntos importantes en el conjunto de datos como son el centro o cualquier percentil. Quiz as el aspecto m as importante del estudio de la distribuci on de una muestra de medidas es la posici on de un valor central, es decir, un valor representativo alrededor del cual las medidas est an distribuidas. Cualquier medida num erica que intente representar el centro de un conjunto de datos, se llama medida de tendencia central. Las dos medidas del centro m as
1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS usadas son la media y la mediana.
13
Denicion 1.3. La media muestral o promedio de un conjunto de n medidas x1 , x2 , ..., xn es la suma de las medidas dividida por n. La media es denotada por x y de acuerdo con la denici on es:
x =
n i=1 xi
(1.1)
De acuerdo al concepto de promedio, la media representa el centro de un conjunto de datos. Si se dibuja el diagrama de puntos de un conjunto de datos como una barra horizontal delgada sobre la cual cubos de igual tama no y peso son colocadas en las posiciones de los puntos de los datos, entonces la media x representa el punto de equilibrio sobre el cual la barra est a balanceada. El c alculo de x y su interpretaci on geom etrica se ilustra en el ejemplo 8. Ejemplo 1.8. Las medidas en cent metros (cm) de 7 beb es al nacer en un hospital en cierto d a son: 45, 49, 52, 48, 50,55,53. La media de estas medidas es: 352 x = 45+49+52+48+50+55+53 = =50,29 7 7 El diagrama de puntos aparece en la gura 1.8 donde la media muestral es el punto de balanceo o centro del gr aco.
45
50 x
55
Figura 1.8. Interpretaci on Geom etrica de la media
Denicion 1.4. La mediana muestral de un conjunto de medidas x1 , x2 , ..., xn es el valor intermedio cuando las medidas est an ordenadas de menor a mayor. Si n es un n umero impar, hay un valor intermedio u nico y este es la mediana. Si n es par, hay dos valores intermedios y la mediana se dene como el promedio de ellos. La mediana se denota por ,5 o por x .
14
En lenguaje com un, la mediana es el valor que divide los datos en dos mitades iguales;es decir, 50 % de los datos est an a la izquierda o encima de la mediana y 50 % est an a la derecha o debajo de la mediana. Luego 0,5 = x = x( n+1 )
2
si n es impar, si n es par.
+ x( n x( n 2) 2 +1)
Ejemplo 1.9. Encontrar la mediana de las medidas de los nacimientos de los beb es del ejemplo 8. Soluci on. Las medidas arregladas de menor a mayor son: 45 48 49 50 52 53 55
Se observa que el u nico que est a en el centro es 50, por lo tanto la mediana es ,5 = 50cm. Ejemplo 1.10. Los ingresos mensuales (por diezmil pesos) para 10 t ecnicos de una empresa son: 95,92, 105, 122, 125, 132, 237, 90, 145 y 280. Calcular la media y la mediana. Soluci on.
x =
n i=1
xi
10
1420 = 10 =142
Luego, el ingreso promedio mensual para el grupo es $1.420.000. Este valor es cuestionable como ingreso mensual t pico porque 7 de los 10 valores est an por debajo de 142. Los valores 237 y 280 inan dr asticamente la media. Para encontrar la mediana ordenemos los datos de menor a mayor, as: 90 92 95 102 122 125 132 145 237 280
Los dos valores del medio son 122 y 125. Luego, el ingreso mediano es: ,5 = 122+125 =123,5 2
De manera que el ingreso mediano es de $1.235.000, lo cual parece ser una medida central m as sensata que la media.
15
Comentario Este ejemplo muestra que la mediana no est a afectada por unas pocas observaciones muy peque nas o muy grandes, mientras que la presencia de tales extremos tendr an un efecto signicante sobre la media. Para distribuciones extremadamete asim etricas la mediana es una medida m as sensata del centro que la media. Este es el por qu e los reportes del gobierno sobre distribuciones de ingresos, citan el ingreso mediano como un resumen antes que el promedio. Cuando la distribuci on no es altamente asim etrica , la media es preferida y es ampliamente m as usada, porque la mediana carece de algunas ventajas te oricas cuando se hacen inferencias. Si el n umero de observaciones es grande (mayor que 25),es u til extender la noci on de la mediana y dividir el conjunto de datos en cuartos, obteniendose los llamados cuartiles. Sin embargo, un concepto mas general y que involucra a los cuartiles son los percentiles, pues como se ver a enseguida, el primer, el segundo y el tercer cuartil son respectivamente los percentiles del 25, 50 y 75 % . Observese que si p, 1 0 < p < 1, es una fracci on entonces 100p representa un porcentaje. Por ejemplo, 5 es sin onimo de 20 %. Denicion 1.5. El 100p-simo percentil, notado p , es un valor tal que, despu es de que los datos han sido ordenados de menor a mayor, al menos 100p % de las observaciones est an a la izquierda (arriba) de este valor y al menos 100(1 p) % est an en o a la derecha (abajo) de este valor. 0 < p < 1. Los cuartiles son simplemente el vig simo quinto percentil (,25 ), la mediana (,5 ) y el septimog simo quinto percentil (,75 ). Se hace la siguiente identicacin:
Cuartil Inferior: Q1 =0,25 Segundo Cuartil: Q2 =0,5 Cuartil Superior: Q3 =0,75 Ademas se adoptar a la siguiente convenci on: Se tomar a un valor observado para el percentil muestral, excepto, cuando dos valores adyacentes satisfagan la denici on, en cuyo caso su promedio es tomado como el percentil. Esto coincide con la denici on de la mediana cuando el tama no muestral es par. Cuando todos los valores en un intervalo saatisfacen la denici on de
16
un percentil, la convenci on particular usada para localizar un punto en el intervalo no altera apreciablemente el resultado, excepto quiz as, para la determinaci on de percentiles extremos (aquellos que est an antes del quinto (0,05 ) o despu es del nonag esimo quinto (0,95 ). Se ilustra el m etodo de encontrar percentiles mediante el siguiente ejemplo. Ejemplo 1.11. Los datos 40 medidas del nivel de trco en una interseccin se presentan abajo y est an ordenados de menor a mayor. Localizar los cuartiles y los percentiles 0,5 , 0,12 , 0,95 . 52.0 56.7 60.2 62.1 54.4 56.8 60.3 62.6 54.5 57.2 60.5 62.7 55.7 57.6 60.6 63.1 55.8 58.9 60.8 63.6 55.9 59.4 61.0 63.8 55.9 59.4 61.4 64.0 56.2 59.5 61.7 64.6 56.4 59.8 61.8 64.8 56.4 60.0 62.0 64.9
Soluci on. Para determinar el primer cuartil, se deben contar al menos 0,25 40 = 10 observaciones desde la medida m as peque na y al menos 0,75 40 = 30 observaciones desde la mayor. La observaci on d ecima es 56.4 y la trig esima a partir de la mayor es 56.7. Luego Q1 es: 56,4+56,7 =56,55 2
Q1 =
Para determinar la mediana contamos al menos 0,5 40 = 20 obervaciones a partir de la menor y 20 observaciones a partir de la mayor hacia la izquierda. La observaci on 20 a partir de la menor es 60.0 y la 20 desde la mayor es 60,2, luego la mediana es: 60,0+60,2 =60,1 2
Q2 =
Para el tercer cuartil se cuenta al menos 30 observaciones desde la menor, que es 62,0 y 10 observaciones desde la mayor, que es 62,1. Por tanto, 62,0+62,1 =62,05 2
Q3 =
17
Para ,05 se deben contar al menos 0,5 40 = 2 observaciones desde la menor, esta es 54.4; y contar al menos 0,95 40 = 38 observaciones desde la mayor, esta es 54.5. Luego, 54,4+54,5 =54,45 2
0,05 =
Para 0,95 se tiene que: 64,6+64,8 =64,7 2
0,95 =
Para 0,12 , se calcula 0,12 40 = 4,8, se toma la observaci on 5; se calcula 0,88 40 = 35,2 y se toma la observaci on 36. Como estas dos observaciones coinciden se tiene que 0,12 = 55,8. Otras medidas de tendencia central con usos especcos son: La moda , la cual se dene como la observaci on que m as aparece en el conjunto de datos. Puede no ser u nica. La media geom etrica ,G, se dene por:
G=
x1x2...x3 n
n 1 i=1 xi
(1.2)
La media arm onica ,H , se dene por:
H=
(1.3)
Es de anotar que la media geom etrica es u til para promediar valores en proporciones o porcentajes , mientras que la arm onica se usa para promediar ciertos tipos de relaciones o tasas: tasas de nacimiento, de mortalidad, velocidades en km/h, hectarea/h, etc. Existen dos medidas, llamadas la media recortada y la media de Winzor, las
18
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA cuales han ganado importancia en los u ltimos a nos. Como se dijo, la media es sensible a la existencia de unas pocas observaciones insualmente grandes o peque nas , mientras que la mediana los ignora. Las medias recortada y de Winzor pueden ser vistas como un t ermino medio entre la media y la mediana. Lamedia recortada o truncada , x r , es la media de las observaciones que quedan cuando se remueven las observaciones inferiores a Q1 y las superiores a Q3 . Lamedia de Winzor , x w , es la media de las observaciones de los datos que se obtienen al remplazar las observaci on inferiores a Q1 por Q1 y las superiores a Q3 por Q3 .
Estas medias no son alteradas por la presencia de una fracci on peque na de observaciones inusuales o err oneas que son extremadamente grandes o peque nas. Los estad sticos han encontrado que estas dos medidas son casi tan buenas como la media, en distribuciones sim etricas cuando no hay observaciones inusuales, pero ambas medidas son usualmente mejores en la presencia de valores extra nos. Cuando una distribuci on tiene una larga cola , estas medidas suministran ndices alternativos de un valor central diferente de aquellos suministrados por la media y la mediana. Las medias anteriores tambi en se denen considerando los percentiles 0,05 y 0,95 , y, 0,10 y 0,90 , dependiendo de las colas de la distribuci on de los datos. Ejemplo 1.12. En con los datos del ejemplo 10, encontrar la media, la media recortada y la media de Winzor. Soluci on. Para la media: x = 2358 =59,625 40
Para la media recortada, quitamos las observaciones por debajo de Q1 = 56,55 y las que est an por encima de Q3 = 62,05, quedando las observaciones:
1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS 56.5 60.2 56.7 60.3 56.8 60.5 57.2 60.6 57.6 60.8 58.9 61.0 59.4 61.4 59.4 61.7 59.5 61.8 59.8 62.0 60.0 62.05
19
x r =
1314,2 = 59,736 22
Para la media de Winzor se tiene que: x w = 10Q1 +1195,6+10Q3 2381,6 = 40 =59,54 40
Medidas de Variaci on Adem as de la localizaci on del centro de los datos, un aspecto importante de un estudio descriptivo de datos es una medida num erica del grado de variaci on alrededor del centro. Dos conjuntos pueden mostrar similar posici on del centro pero pueden ser marcadamente diferentes con respecto a la variabilidad. En esta secci on se presentan algunas medidas num ericas que facilitan una comparaci on objetiva del grado de variaci on en diferentes conjuntos de datos. Los principales son la varianza y la desviaci on est andar Denicion 1.6. La varianza muestral , S 2 , de un conjunto de medidas x1 , x2 , ..., xn se dene por:
S =
n i=1 (xi
x )2 n1
(1.4)
Cada xi x se llama desviaci on y podr a pensarse que el promedio de todas las desviaciones ser a una buena medida de dispersi on , pero no, puesto que:
n i=1 (x
x ) = 0
20
Porque en la varianza inuye la suma de cuadrados, sus unidades son el cuadrado de la unidad en la cual las medidas est an expresadas. Para obtener una medida de variabilidad en la misma unidad que los datos, se toma la ra z cuadrada de la varianza, llamada desviaci on est andar. Esta, mejor que la varianza, sirve como una medida b asica de variabilidad.
S=
V arianza =
n i=1 (xi
x )2 n1
(1.5)
A diferencia de la interpretaci on simple de x como el punto de balanceo para la distribuci on del conjunto de medidas, una interpretaci on f sica de la desviaci on est andar S no es tan transparente. En la comparaci on de dos conjuntos de datos, un alto valor de S reeja la presencia de una mayor variaci on en ese conjunto de datos que en el otro. Sin embargo, en el contexto de un conjunto de datos particular, el valor num erico de S en relaci on a la dispersi on de los puntos no es claro. Un resultado debido al matem atico ruso Chebyshev, suministra una fracci on de los datos en conexi on con intervalos alrededor de la media y que involucran a S . Regla de Chebyshev. Para todo conjunto de datos, el intervalo ( x kS, x + kS ) 1 contiene al menos 100(1 k 2 ) % de los datos, para k > 1 . La regla de Chebyshev garantiza la inclusi on de una fracci on m nima de los datos en un intervalo que est a centrado en x y se extiende en un m ultiplo de S en ambas direcciones. Ejemplo 1.13. Examinar la regla de Chebyshev para la prueba de la actividad de los 60 trabajadores del ejemplo 2. Soluci on. En este ejmplo x = 84,95, y S = 3,1. Para ilustrar la ragla de Chebyshev, se consideran los dos intervalos ( x 1,5S, x + 1,5S ) y ( x 2S, x + 2S . El primer intervalo es equivalente a (80.3 , 89.6) y seg un la regla debe contener al menos el 55,56 % de los datos, es decir, 34. Realmente este intervalo contiene 52. El segundo intervalo es equivalente a (78.75 , 91.15) y debe contener al menos el 75 % de los datos, es decir, 45. Hay 57 datos en este intervalo .
21
Otras medidas de Variaci on y que se usan algunas veces son: 1. La desviaci on media, notada Dm y est a denida por la expresi on:
Dm =
n i=1 |xi
x |
(1.6)
2. La desviaci on mediana, notada Dme y denida por:
Dme =
n i=1 |xi
,5 |
(1.7)
3. El rango muestral notado R y denido por R = xmax xmin , da la longitud del intervalo que contiene todo el conjunto de datos. El rango se usa, en vez de la varianza, como una medida de dispersi on cuando el conjunto de datos es menor que 8. 4. El rango intercuart lico, notado Ri , se dene como Ri = Q3 Q1 . Esta medida da la longitud del intervalo que cubre la mitad del centro de los datos. Se usa frecuentemente en reportes gubernamentales sobre ingresos, y en distribuciones que tienen largas colas en una direcci on. 5. El coeciente de variaci on, notado CV , se dene por CV = S x 100. Se utiliza cuando se comparan diferentes poblaciones o diferentes muestras, consider andose m as variabla aquella cuyo CV sea mayor. M etodo Gr aco para detectar outliers- Boxplots Los boxplots o diagrama de cajas y bigotes son t ecnicas gr acas que muestran la distribuci on de uno o mas conjuntos de datos. Estos m etodos alternos a los histogramas son particularmente u tiles cuando se comparan 2 o mas conjuntos de datos. Ellos muestran: la localizacion, el sesgo, la dispersion, la longitud de las colas y los Outliers. Para dibujar un Boxplot se debe:
22
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA Obtener el primero, segundo y tercer cuartil; es decir, Q1 ,Q2 y Q3 . Calcular Ri = (Q3 - Q1 ), y luego 1.5Ri y 3Ri . Dibujar una caja rectangular que empiece en Q1 y termine en Q3 . Dibuje tambi en una barra vertical en la posici on de la mediana. Antes de Q1 y hasta Q1 , y despues de Q3 dibuje los bigotes,que son lineas a cada lado de la caja. Cuelquier dato que no se encuentre entre los bigotes se considera un Outlier(dato at pico) y debe ser gracado. Datos entre un bigote y la linea Q1 3Ri ( o Q3 +3Ri ) se consideran outliers suaves(representados por un circulo) y datos despu es de esta l neas se consideran outliers fuertes(simbolizados por un c rculo obscuro).
Hay varias reglas para determinar los extremos de los bigotes. Algunas son: El m nimo y m aximo de todos los datos. El dato mas peque no que se encuentre dentro del 1.5Ri de Q1 y el dato mas alto dentro del 1.5Ri de Q3 . El noveno percentil(,09 ) y el percentil del 91 %(,91 ). La siguiente gr aca muestra como se construye un Diagrama de caja y bigotes: Q2
Q1 1.5Ri 3Ri
Ri
Q3 1.5Ri 3Ri
Figura 1.9. Construcci on de un Diagrama de Caja y Bigotes En la pr actica el diagrama se presenta s olo con la caja, los bigotes y los outliers como se muestra en el ejemplo. Ejemplo 1.14. Para los 20 datos del ejemplo 1 el boxplot se da en la gura y se observa claramente que los valores: 10 es un outlier suave y 12 un outlier fuerte.
1.3. MEDIDAS DESCRIPTIVAS PARA DATOS AGRUPADOS Q2 +
23
0 1 2 3 4 5 6 7 8 9 10 11 Figura 1.10. Diagrama de Caja y Bigotes del ejemplo 1
12
1.3.
Medidas Descriptivas para Datos Agrupados
Para el c alculo de estas medidas se ampl a la distribuci on de frecuencias estudiada hasta ahora, ubicando algunas columnas adicionales de manera que se faciliten los c alculos. Estas columnas son: La de las marcas de clase, mi , que se denen como el punto medio de cada Ls intervalo. Es decir, mi = Li + . 2 La de las frecuencias acumuladas, Fi , que se dene de la siguiente manera: F1 = f1 , F2 = F1 + f2 , F3 = F2 + f3 ,...; en general Fk = Fk1 + fk . Ocasionalmente la de las frecuencias acumuladas relativas, Fir , las que se i denen por Fir = F n . Suponiendo que se tiene una distribuci on de frecuencias con k intervalos y que se desea calcular la media, la mediana, la varianza y, los percentiles en general, se denen: La media por:
x =
La Varianza por:
k i=1 mi fi
(1.8)
S =
k i=1 (mi
x ) 2 fi
(1.9)
24
De esta expresi on se puede obtener f acilmente que:
S =
k 2 i=1 mi fi
x 2
(1.10)
Para encontrar el percentil de 100p %, p , se procede de la siguiente manera.
1. Se determina el intervalo cuya frecuencia acumulada sea igual o mayor al valor np, donde n es el n umero total de observaciones. Este intervalo se llama la clase percentil del 100p %, y llame al l mite inferior de este intervalo Lip . 2. Calcule la fracci on (np Fi1 )/fi , donde Fi1 es la frecuencia acumulada del intervalo anterior al de la clase del percentil y fi es la frecuencia de la clase del percentil. 3. El percentil de orden p es,
p = Lip +
np Fi1 L, fi
(1.11)
donde L es lalongitud del intervalo. Ejemplo 1.15. En el ejemplo 2, referente a los 60 trabajadores dedicados a una actividad, encontrar la media, la desviaci on est andar, la mediana, los percentiles del 25 % y del 95 %. Soluci on En la distribuci on encontrada adicionamos las columnas de las marcas de clase y de las frecuencias acumuladas, obtenindose la tabla 1.6.
x =
7 i=1
mi f i 5096,4 = = 84,94 60 60
1.3. MEDIDAS DESCRIPTIVAS PARA DATOS AGRUPADOS Intervalos 77,35 79,55 79,55 81,75 81,75 83,95 83,95 86,15 86,15 88,35 88,35 90,55 90,55 92,75 mi 78.45 80.65 82.85 85.05 87.25 89.45 91.65 fi 2 6 17 14 13 5 3 Fi 2 8 25 39 52 57 60 fk 0.0333 0.1000 0.2800 0.2333 0.2167 0.0833 0.0500 Fik 0.033 0.133 0.416 0.650 0.866 0.950 1.000
25
Tabla 1.6: Distribuci on de frecuencias completa del ejemplo 2

7 i=1
S2 = Luego, S = 3,096.
m2 i fi x 2 = 7224,39 (84,94)2 = 9,587, 60
Para calcular la mediana, obsrvese que p = 0,5 y que el intervalo cuya frecuencia acumulada alcanza o excede justamente a np = 30 es (83.95, 86.15). Luego, este es el intervalo de la clase mediana Li0,5 = 83,95. En ese intervalo fi = f4 = 14, adem as de que Fi1 = F3 = 25, por lo tanto, (30 25) 2,2 = 84,74 14 Para calcular 0,25 , obsrvese que el intervalo cuya frecuencia acumulada alcanza o excede justamente a np = 15 es (81.75, 83.95). Luego, este es el intervalo de la clase del percentil del 25 % y se tiene que Li,25 = 81,75. En ese intervalo fi = f3 = 17, adem as de que Fi1 = F2 = 8, por lo tanto, 0,5 = 83,95 15 8 2,2 = 82,66 17 Para encotrar 95 , el intervalo cuya frecuencia acumulada excede o alcanza justamente a np = 57 es (88.35, 90.55), entonces fi = f6 = 5, Fi1 = 52 y por tanto, ,25 = 81,75 ,95 = 88,35 57 52 2,2 = 90,55 5
M etodo Gr aco para hallar Percentiles Cuando un conjunto de datos est a agrupado en intervalos de clase, tambi en pueden obtenerse los percentiles utilizando un gr aco de frecuencia acumulada relativa.
26
Este consiste en dibujar los intervalos de clase sobre el eje horizontal del plano XY y sobre el eje vertical positivo se colocan las frecuencias relativas acumuladas, Fik . Al l mite superior de cada intervalo de clase se le asigna su frecuencia relativa acumulada y al l mite inferior del primero se le asigna la frecuencia relativa acumulada 0 (como es l ogico). Luego se dibujan trazos de recta que unan los puntos as obtenidos, resultando una l nea recta quebrada. Para hallar el percentil 100p %, se ubica p en el eje vertical, y a partir de esta se traza una recta paralela al eje X hasta que intercepte el gr aco; desde este nuevo punto se baja una recta paralela al eje Y hasta que corte la recta de los intervalos. Este punto, que puede ser medido, es el percentil buscado. Ejemplo 1.16. En el ejemplo anterior, obtener por el m etodo gr aco la mediana y los percentiles de 25 % y 95 %. Soluci on. En la tabla 1.6 se construyen dos columnas adicionales, la de la frecuencia relativa y la de la frecuencia acumulada relativa. Usando el proceso descrito, se obtiene la gura 1.10 en la cual se observa que ,25 = 82,70, ,5 = 84,90, ,95 = 90,80, los cuales son muy pr oximos a los obtenidos en el ejemplo anterior.
Figura 1.11. Percentiles obtenidos por el M etodo Gr aco
1.4.
Ejercicios
1. Las siguientes notas resultaron de una prueba hecha a un curso de C alculo I: 3.5, 3.2, 3.8, 2.5, 3.8, 3.5, 4.0, 3.7, 3.0, 2.7, 2.0, 3.2, 2.8, 5.0, 3.5, 2.7 . a) Hacer un diagrama de puntos. b) Entre que valores se encuentra el mayor volumen de los datos? c) Interpretar este conjunto de datos.
1.4. EJERCICIOS
27
2. Las medidas en cent metros, de los huevos de 50 gallinas en experimentaci on en un d a fueron: 7.08 6.80 7.98 8.19 6.68 7.44 8.00 6.25 7.12 7.20 6.90 7.65 9.00 8.70 8.75 8.14 6.96 7.25 8.25 7.30 7.40 8.55 8.10 6.00 8.15 6.15 7.50 7.80 8.75 6.45 7.55 7.30 8.60 7.00 7.95 8.90 8.45 7.90 9.25 8.75 9.40 7.25 6.22 6.40 6.45 7.65 6.57 8.35 7.75 7.99
a ) Clasicar la longitud de los huevos usando 10 intervalos de clase y, usando el n umero de intervalos dado por la regla de Sturges. b ) En los casos anteriores, contruir los histogramas de frecuencias relativas. c ) Obtener la media, la mediana y los percentiles del 25 %, 75 % y 95 % d ) Por el m etodo gr aco obtener la mediana y los percentiles del inciso anterior. Comparar. 3. Los porcentajes de cambios en la producci on de petr oleo crudo de 2009 a 2010 para 51 pa ses de Norteam erica, Latino-am erica, Europa, Medio Oriente, Africa y Asia(Fuente: OPEC. Annual Statistical Bulletin 2010/2011), fueron: -0.9 -0.8 16.0 0.1 3.3 -5.1 2.8 38.2 -21.8 -0.2 0.9 -2.3 1.2 -9.5 2.4 11.2 5.3 -9.5 4.6 3.7 -4.3 9.1 6.1 -7.2 -6.6 -8.4 17.1 -3.1 -1.0 -2.2 3.1 2.5 2.0 -0.4 -2.7 7.4 -1.0 -5.8 0.9 -11.9 10.4 1.1 -1.3 2.2 7.6 -1.8 -8.4 -10.1 6.4 2.1 -3.6
a) Construir un histograma de frecuencias relativas. b) Obtener el porcentaje medio de cambio y la mediana de cambio. c) Vericar que se cumple la regla de Chebyshev para k = 2. d) El valor extremadamente grande de 38.2 fu e de Albania y se debi o al aumento de su reserva, y el valor -21.8 fu e de los Pa ses Bajos y se debe a una reducci on anual de su reserva. Elimine estos valores y responda los tres puntos anteriores. Calcule el coeciente de variacion y en general, compare. e) Una regla emp rica sugiere que la desviaci on est andar puede ser aproximada por u n cuarto del rango . Calcular esta aproximaci on de S y compararla con la obtenida anteriormente.
28
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA 4. La variaci on diaria, en porcentaje, de las acciones de mayor rendimiento en Colombia(El Tiempo 11/11/2011) fueron: -3.33 0.00 0.00 -1.49 -1.38 -0.12 -0.80 0.00 -0.41 0.42 0.86 0.00 -2.26 0.00 -1.86 -1.17 -4.62 0.94 0.00 -0.42 0.59 0.17 -0.33 0.00 0.41 0.69 0.00 -1.00 0.50 0.00 0.00 0.00 -1.06 -0.43 0.76 0.00 -0.06 -0.63 -2.95
a) Construir un histograma de frecuencias relativas y comente sobre la forma de esta informaci on. b) Obtener la variaci on diaria media de cambio. c) Vericar que se cumple la regla de Chebyshev para k = 2. d) Es el valor 4,62 % un outlier?. 5. La poblaci on de votantes de un pa s se identican como: 30 % dem ocratas, 28 % rep ublicanos, 20 % socialistas, 15 % comunistas y 7 % otros. Realice el m etodo gr aco que usted crea deba hacer para analizar esta informaci on. 6. La reserva de petroleo, en millones de barriles, para Am erica Latina en el 2010(Fuente: OPEC. Annual Statistical Bulletin 2010/2011), era: Argentina 2.505 Brasil 12.857 Colombia 1.360 Ecuador 7.206 Mexico 11.692 Venezuela 296.501 Otros 2.760 Realice un diagrama de pastel, utilizando porcentajes. 7. Sea los m as claro posible: a) Distinga entre Estad stica Descriptiva e Inferencial. b) Cu al es el valor de una representaci on gr aca de un conjunto de datos? c) Mencione 5 medidas de tendencia central y def nalas. d) Que uso se puede hacer de la desigualdad de Chebyshev en la descripci on de un conjunto de datos? 8. En la siguiente distribuci on de frecuencia, xi es el n umero de estudiantes que participaron en 30 talleres especiales en un colegio.
1.4. EJERCICIOS xi fi 4 5 5 4 6 6 7 9 8 1 9 3 10 1 11 1
29
a) Encontrar la media, la mediana, la moda y la varianza. b) Qu e porcentaje de la distribuci on est a entre( x 2S, x + 2S ). Concuerda esto con la regla de Chebyshev? 9. Reconstruya la distribuci on de frecuencias de abajo. Para su inter es n = 54, L = 11 y m5 = 73. Intervalos mi fi fir 0.111 0.185 0.259 0.222 0.148 0.074 Total 0.999 Fi Fir
Calcule ahora media, mediana, varianza y cualquier prcentil. 10. Los puntajes de 50 estudiantes para ingresar a una Universidad fueron: 70.8 68.8 84.5 79.0 92.5 74.4 80.0 72.5 62.7 64.8 69.0 76.5 65.7 83.5 77.6 81.4 69.6 79.8 81.9 66.8 74.0 85.5 62.5 71.2 72.6 61.5 75.5 90.0 87.3 58.9 75.5 82.5 72.5 82.5 73.1 89.0 77.5 81.0 67.3 81.4 94.0 85.0 78.0 87.4 64.5 76.5 73.0 86.2 71.9 79.3
a) Construir una buenadistribuci on de frecuencias. b) Vericar que se cumple la regla de Chebyshev. c) Obtener la mediana y los percentiles del 5 % y del 95 %. d) Cuantos estudiantes estan en el 5 % superior? e) Mediante el m etodo gr aco obtener la mediana y los percentiles del 5 % y del 95 %. Comparar con los obtenidos en el inciso anterior. 11. El tiempo de vida(en a nos) de ciertas bater as para autom oviles similares se garantiza por 3 a nos. En una muestra de 50 tiempos de vida de estas bater as
30
CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA se obtuvier on los siguientes datos: 3.3 4.1 3.6 3.8 2.9 a) b) c) d) e) 3.4 3.8 3.4 3.2 3.5 2.5 1.6 2.9 3.4 3.2 4.7 4.3 3.5 3.3 3.1 2.2 3.2 3.1 4.1 3.0 3.1 3.9 3.7 2.8 3.0 3.5 4.2 3.3 3.7 3.3 2.6 2.0 4.2 3.2 3.0 3.7 3.3 3.0 3.3 3.8 3.4 2.8 3.7 3.6 3.2
Encuentre la media, la mediana y la varianza Encuentre la media recortada y la de Winzor al 10 %. Compare Cree usted que la garant a est a bien sustentada? Determine outliers, si los hay Verique la Regla de Chebyshev
12. En un estudio acerca de los efectos del tabaquismo sobre los patrones de sue no se obtuvieron los siguientes datos(tiempo en minutos): Fumadores: 45.6 36.4 11.8 25.2 50.7 22.2 54.0 50.1 41.8 62.2 51.2 67.3 No fumadores: 35.0 31.6 27.8 28.6 24.1 30.4 31.8 36.9 15.9 40.6 37.5 27.4 33.9 31.2 22.1 18.5 38.4 12.7 36.4 17.5 Use los diagramas de cajas y bigotes para comparar estos dos conjuntos de datos. Que le dice los coecientes de variaci on? 13. El calor espec co de ciertas sustancias a 250 C y presi on constante se da a kj continuaci on en kg k: 1.005 2.093 0.5203 0.2253 1.694 0.4781 0.6496 0.6228 0.8439 0.806 1.744 1.527 0.8237 5.193 1.649 14.30 1.663 0.248 2.226 1.039 1.030 1.040 0.9992 0.918 1.664 1.669 1.531 0.5415 0.8334 0.9291 1.865 0.1583 a) b) c) d) Calcule media ,mediana, varianza y tres percentiles cualesquiera. Verique la regla de Chebyshev. Obtenga una buena distribuci on de frecuencias(completa). Calcule media, mediana, moda, varianza y los tres percentiles del punto a) para los datos agrupados y compare. e) Obtenga los 3 percentiles anteriores por el m etodo gr aco. f) Determine mediante un diagrama de Cajas y Bigotes(Box-Plots) los posibles y tipos de outliers si los hay.
Cap tulo 2
Elementos de Probabilidad
2.1. Introducci on
Una de las herramientas principales de la Estad stica es la Teor a de la Probabilidad, la cual tuvo su comienzo formal con los juegos de azar en el siglo XVII. Estos, como su nombre lo indica, implican actividades como lanzadas de una moneda, de un dado, extracci on de una carta de una baraja, etc, en los cuales el resultado de uno de estos experimentos es incierto. Sin embargo, hay un resultado predecible a largo plazo para la ocurrencia de un evento. Es conocido, por ejemplo, que en muchas tiradas de una moneda sim etrica, una mitad de las pruebas resulten caras. En este largo plazo de regularidad predecible es que las casas de juegos son capaces de entrar en negocios. Un tipo de incertidumbre y regularidad a largo plazo ocurre a menudo en ciencia experimental. Por ejemplo, en gen etica es incierto si el nacimiento es ni no o ni na, pero en una gran racha de nacimientos es conocido aproximadamente qu e porcentaje de nacimientos ser an ni nos y qu e porcentaje ser an ni nas. En la siguiente secci on se dan algunos conceptos y resultados necesarios para presentar posteriormente la teor a b asica de la probabilidad.
31
32
CAP ITULO 2. ELEMENTOS DE PROBABILIDAD
2.2.
Conceptos b asicos
Denici on 2.1. Experimento. Un Experimento es un fen omeno por el cual se hace una observaci on. Se dice aleatorio si un resultado particular no se puede predecir con certeza. Los experimentos se representar an por . Ejemplo 2.1. Son ejemplos de experimentos: 1 : Lanzar un dado y observar el n umero que aparece en la cara superior. 2 : Lanzar dos monedas y observar las caras superiores. 3 : Observar el tiempo de duraci on(en horas) de una bombilla el ectrica. 4 : Observar la estatura x y el peso y de los estudiantes de Probabilidad. 5 : Sacar un articulo de un proceso de producci on y observar el nivel de calidad. Se observa en cada uno de estos experimentos, que existe un conjunto de resultados posibles para cada uno de ellos. Esto es lo que se llama espacio muestral. Denici on 2.2. Espacio Muestral. El conjunto de todos los resultados posibles de un experimento se llama Espacio Muestral o Espacio de Sucesos y se denota con la letra may uscula S o por . En este texto se emplea preferiblemente En los ejemplos anteriores: = {1, 2, 3, 4, 5, 6} para 1 = {cc, cs, sc, ss} para 2 , dode c denota cara y s sello. = {t|0 t < } para 3 , donde t < signica que en alg un tiempo nito la bombilla se funde. = {(x, y )|x > 1,5, y > 45}, x est a dado en metros e y en kilos, para 4 = {b,m} Si solo se aceptan las condiciones de bueno(b) o malo(m), en 5 . Un espacio muestral se dice discreto si es nito o enumerable. Un conjunto que es nito o contablemente innito se dice contable. Cuando el espacio incluye resultados que pueden asumir cualquier valor en un intervalo se dice que es un espacio
2.2. CONCEPTOS BASICOS
33
muestral continuo. de 1 , 2 y 5 son discretos, mientras que los de 3 y 4 son continuos. En la realizaci on de un experimento se esta interesado en la ocurrencia de algunos suconjuntos del espacio muestral S, estos se llaman Eventos o Sucesos y se denotan con las primeras letras mayusculas del alfabeto, A, B, C, D, E, etc. Sin embargo cuando se est a interesado en n eventos se emplear a una sola de estas letras con subindice, como E1 , E2 , ..., En . Denici on 2.3. Evento. Dado un experimento, , cualquier conjunto caracterizado por un razgo com un se llama Evento o Suceso . En los experimentos anteriores se consideran los siguientes eventos: A es el evento de que aparezca un n umero par en 1 , entonces A = {2, 4, 6}. B es el evento de que aparezca una cara en 2 , entonces B = {cs, sc}. C es el evento de que la bombilla dure menos de 200 horas en 3 , entonces C = {t|0 < t < 200}. D es el evento de que la estatura sea menor que 1,70m en 4 , entonces D = {(x, y )|1,5 < x < 1,7, y > 45}. E es el evento de que el art culo sea bueno en 5 , entonces E = {b} Es de anotar que un evento ocurre si uno cualquiera de sus resultados ocurre. Adem as, como los eventos son conjuntos, las operaciones de union, interseccion, complemento y diferencia son v alidas. Si E y F son eventos entonces: a) E F es el evento que ocurre si y solo si E o F ocurren o ambos. b) E F es el evento que ocurre si y solo si E ocurre y F ocurre. c) E c es el evento que ocurre si y solo si E no ocurre. d) F E es el evento que ocurre si y solo si F ocurre y E no. Denici on 2.4. Evento elemental. Un evento se dice evento elemental si este contiene exactamente un resultado del experimento. E = 3 en 1 es un evento elemental.
34
Denici on 2.5. Eventos mutuamente excluyentes. Dos eventos E y F se dicen mutuamente excluyentes si E F = . Los eventos E1 , E2 , se dice que son mutuamente excluyentes si son mutuamente excluyentes a pares; es decir, si Ei Ej = para i = j . La probabilidad surge antes de la creaci on de la teor a de conjuntos, sin embargo en 1933 A. N. Kolmogorov propone un sistema de axiomas(teor a) basado en conjuntos que involucra todos los conceptos conocidos de probabilidad. Una denici on fundamental es la de una - algebra. Denici on 2.6. - algebra. Sea F un conjunto no vac o de subconjuntos de , se dice que F es una algebra sobre si: 1. si E F , entonces E F . 2. si E1 , E2 , es una sucesi on nita o innita de conjuntos de F , entonces n En F . De esta denici on es claro que F , pues E E = para cualquier cojunto E , y ad emas tambi en pertenece a F . Observaci on. Los elementos de F se llamar an eventos, se llamar a evento seguro , y evento imposible. Decir que un evento E ocurre signica que el resultado obtenido al realizar el experimento es un elemento de E .
2.3.
Axiomas de Probabilidad
Una de las metas de la ciencia est a en predecir y describir eventos en el mundo en el cual vivimos. Una manera mediante la cual se da esto es en la construcci on de modelos matem aticos, los cuales describen adecuadamente el mundo real. Por ejemplo, la ecuaci on v = e on entre las cantidades v, e y t, y t expresa una relaci es un modelo matem atico. La raz on para mencionar esta ecuaci on es que la teor a de la probabilidad hace algo similar: se construye un modelo de probabilidad que puede ser usado para describir eventos en el mundo real. Por ejemplo, se puede desear encontrar una ecuaci on que pueda ser usada para predecir el sexo de cada nacimiento en una cierta localidad. Tal ecuaci on ser a muy compleja y no ha sido encontrada. Sin embargo, un modelo de probabilidad puede ser construido, el
2.3. AXIOMAS DE PROBABILIDAD
35
cual aunque no ayude mucho con el tratamiento de un nacimiento individual, es ampliamente u til en los trabajos con grupos de nacimientos. De aqu que se puede postular un n umero p que representa la probabilidad de que un nacimiento sea ni no. De esta probabilidad fundamental se pueden resolver preguntas como: Cu al es la probabilidad de que en 20 nacimientos al menos 8 sean ni nos? Cu al es la probabilidad de que haya 5 nacimientos ni nos consecutivos en los pr oximos 12?. Para responder estas preguntas y muchas similares, se debe desarrollar un modelo de probabilidad idealizado. Denici on 2.7. Funci on de Probabilidad. Sea un espacio muestral y F una - algebra sobre . Una funci on de probabilidad P (.) es una funci on de conjunto con dominio en F y recorrido en el intervalo [0, 1], la cual satisface los siguientes axiomas: a) P (E ) 0 para cualquier evento E F . b) P () = 1 c) Si E1 , E2 , ..., En , ..., es una sucesi on de eventos mutuamente excluyentes en F , y si
E1 E2 ... En ... = entonces,

Ei
i=1
P(
i=1
Ei ) =
i=1
P (Ai )
P (E ) o P [E ] se lee: la probabilidad del evento E o la probabilidad de que el evento E ocurra . La terna (, F , P ) se llama espacio de probabilidad , y es un t ermino u nico que da un camino expedito para asumir le existencia de las tres componentes en su notaci on, las cuales est an relacionadas: F es una colecci on de subconjuntos de y P (.) es una funci on que tiene a F como su dominio. Ejemplo 2.2. Sea = {1, 2, 3, 4} y F = {, , {1, 3} , {2, 4}} la funci on P denida sobre F por
36
es una medida de probabilidad.
0, 1 , P (E ) = 3 2 , 3 1,
si si si si
E E E E
= , = {1, 3}, = {2, 4}, =
Denici on 2.8. Evento Nulo. Sea (, F , P ) un espacio de probabilidad, cualquier evento E con probabilidad cero se llama evento nulo. Ejemplo 2.3. Sea = {1, 2, 3}, F = {, , {1}, {2, 3}} y sea P la medida de probabilidad siguiente; 1, si 2 E, P (E ) = 0, si 2 /E Entonces son eventos nulos {1} y .
2.4.
Propiedades de P (.)
En cada uno de los teoremas sigiuentes, sea (, F , P ) un espacio de probabilidad Teorema 2.1. P () = 0. Demostraci on. Sea E1 = , E2 = , E3 = , ..., entonces
=
i=1
Ei .
Luego:

P () = P (
i=1
Ei ) =
i=1
P ().
Entonces 0=
P ().y por tanto P () = 0

i=1
Teorema 2.2. Si E1 , E2 , ..., En , son eventos mutuamente excluyentes en F , entonces,
2.4. PROPIEDADES DE P (.)
37
P (E1 E2 En ) =
P (Ei )
i=1
Demostraci on. Sea En+1 = En+2 = = , entonces

n
Ei =
i=1 i=1
P (Ei ).
y por tanto,
n n n
P
i=1
Ei
=P
i=1
Ei
=
i=1
P (Ei ) +
i=1
P (Ei ) =
i=1
P (Ei )
Teorema 2.3. Si E es un evento en F , entonces, P (E ) = 1 P (E )
Demostraci on. Como E y E son mutuamente excluyentes y E E = , se tiene que: P () = P (E E ) = P (E ) + P (E ), peroP () = 1. Por tanto, P (E ) = 1 P (E ) Teorema 2.4. Si E y F estan en F , entonces P (E ) = P (E F ) + P (E F ), y P (E F ) = P (E F ) = P (E ) P (E F ) Demostraci on. E = E (F F ) = (E F ) (E F ). Entonces, P (E ) = P (E F ) + P (E F ). Adem as: P (E F ) = P (E ) P (E F ). Teorema 2.5. Para dos eventos E y F cualesquiera en F , se tiene que:
38
P (E F ) = P (E ) + P (F ) P (E F ) Para dos eventos E, F y G cualesquiera en F , se tiene que: P (E F G) = P (E ) + P (F ) + P (G) P (E F ) P (E G) P (F G) + P (E F G) En general, para eventos E1 , E2 , , En , en F , se tiene que:
n
P
i=1
Ei
n i=1
= P (Ei Ej Ek ) + (1)n+1 P (E1 E2 En )
P (Ei )
<
<
donde, E1 E2 En signica E1 E2 En . Demostraci on. Para esta prueba se descompone E F en dos conjuntos mutuamente excluyentes, entonces E F = (E F ) = (E F ) (F F ) = F (E F ).
Obs ervese que F y E F son mutuamente excluyentes. Luego,
P (E F ) = P (F (E F )) = P (F ) + P (E F ) = P (F ) + P (E ) P (E F ). La demostraci on en el caso general se hace por inducci on matem atica. Teorema 2.6. Si E y F son dos eventos en F y E F , entonces P (E ) P (F ). Demostraci on. El evento F se puede descomponer como la uni on de dos eventos mutuamente excluyentes. En efecto F = F = F (E E ) = (F E ) (F E ). Luego, P (F ) = P (F E ) + P (E F ) = P (E ) + P (E F ). P (F ) = P (E ) + P (E F )) P (E )
Como P (E F ) 0, entonces
2.5. ESPACIOS MUESTRALES FINITOS
39
Teorema 2.7. Desigualdad de Boole. Si E1 , E2 , , En , est an en F , entonces P (E1 E2 En ) P (E1 ) + + P (En ). Demostraci on. (Usar Inducci on Matem atica). El siguiente ejemplo ilustra algunas de estas propiedades y es adem as una introducci on para la siguiente secci on. Ejemplo 2.4. i) Una moneda es insesgada o legal si siempre que sea lanzada, la probabilidad de obtener cara es la misma de obtener sello. Si una moneda legal es lanzada y se mira la parte superior cual es la probabilidad de obtener cara? Soluci on. Aqu = {c, s} y adem as = {c} {s} y {c} {s} = , luego P () = P ({c} {s}) = P ({s}) + P ({c}).Por la denici on de probabilidad se sabe que P () = 1 luego P ({s}) + P ({c}) = 1. Como la moneda es legal P ({c}) = P ({s}), as que P ({c}) + P ({c}) = 2P ({c}) = 1
1 . por lo tanto P ({c}) = 2
ii) Supngase ahora que la moneda lanzada no es legal, de manera que es tres veces m as posible de salir sello que cara, Cual es la probabilidad de obtener cara? Soluci on P ({s}) + P ({c}) = 1, ahora P ({s}) = 3P ({c}) por lo tanto P ({c}) + 3P ({c}) = 1, as P ({c}) = 1 as P ({s}) = 3 4 y adem 4.
2.5.
Espacios Muestrales Finitos
Para un gran n umero de experimentos, existe un n umero nito de resultados, por ejemplo N y pueden ser igualmente posibles o no.
40
2.5.1.
Espacios Muestrales Finitos con resultados igualmente posibles

N
Si el espacio muestral consta de N resultados igualmente posibles, = {1 , 2 , . . . , N } entonces =

i=1
{ i }
N
de donde 1 = P () = P
N i=1
{ i }
=
i=1
P ({i })
pero P ({i }) = p para i = 1, 2, . . . , N entonces

N
1=
i=1
p = Np
por lo tanto
1 N Teorema 2.8. Concepto A-priori o Cl asico de probabilidad Sea el espacio muestral de un experimento que tiene N resultados igualmente posibles, entonces para cualquier evento E que contiene n (E ) elementos de , p = P ({i }) = P (E ) = n (E ) N
Demostraci o n. Sea = {1 , 2 , . . . , N } con estos resultados igualmente posibles, y sea E = un k de , luego i1 , i2 , . . . , in(E) donde ij es alg n(E ) n(E ) n(E ) n (E ) 1 = P ij = P (E ) = P ij = N N j =1 j =1 j =1 Ejemplo 2.5. i) Consid erese el experimento de lanzar un dado legal y observar la cara superior. Cualquiera de las de las seis caras puede aparecer arriba y estos resultados son mutuamente exclusivos, puesto que dos caras no pueden aparecer arriba simultan eamente. Adem as, como el dado es legal, es un cubo sim etrico, as que los seis resultados son igualmente posibles.
2.5. ESPACIOS MUESTRALES FINITOS
41
Suponiendo que se quiere encontrar la probabilidad del evento E obtener un n umero impar, luego tres de los seis resultados posibles tienen el atributo de 3 ser impar, es decir, E = {1, 3, 5} y puesto que n = 6, entonces P (E ) = 6 = 1/2. Similarmente, si E es el evento de obtener un n umero primo impar, entonces 2 = 1/3. E = {3, 5} y por consiguiente P (E ) = 6 ii) Consid erese el experimento de sacar una carta de una baraja inglesa. Sea F el evento de obtener una pica. Como de las 52 cartas 13 son picas, entonces 13 = 1/4. nF = 13 y de esta manera P (F ) = 52 Sea ahora G el evento de obtener una letra. Puesto que hay 16 letras en toda la baraja, entonces P (G) = 16 52 = 4/13. La aplicaci on de la denici on de estos ejemplos sencillos es obvia, pero se debe tener cuidado en que los resultados deben ser mutuamente exclusivos, e igualmente posibles. Obs ervese los siguientes ejemplos: a) Consid erese el experimento de lanzar una moneda legal dos veces (o dos monedas simult aneamente) y se quiere obtener la probabilidad del evento A de obtener dos sellos. Una persona desprevenida puede razonar de la siguiente manera: Hay tres resultados posibles para las dos tiradas = {cc, cs, ss}. Uno de estos resultados 1 . tiene el atributo deseado, es decir, el conjunto E = {ss}, y por tanto P (E ) = 3 Este razonamiento no es correcto, porque los tres resultados no son igualmente posibles, ya que el resultado una cara y un sello puede ocurrir de dos maneras, puesto que puede aparecer la cara en la primera tirada y el sello en la segunda o viceversa. Luego hay cuatro resultados igualmente posibles as que 1 = cc, cs, sc, ss. Si E = ss, P (E ) = 4 , que es la probabilidad correcta. b) Consid erese de nuevo el experimento de sacar una carta de una baraja y sea F el evento de que la carta sacada sea un as o una pica. En la enumeraci on de los resultados favorables se puede contar que hay 4 ases y 13 picas, y por tanto hay 17 resultados con el atrbuto deseado, o sea que, P (F ) = 17 52 . Este resultado es claramente incorrecto, porque los 17 resultados
42
CAP ITULO 2. ELEMENTOS DE PROBABILIDAD no son mutuamente exclusivos, ya que el as de pica es as y a la vez pica. Luego, hay 16 resultados con el atributo deseado y la probabilidad correcta es P (F ) = 16 52 = 4/13.
Ejemplo 2.6. Se lanza una moneda legal tres veces (o lanzar tres monedas de una vez). Halle la probabilidad de obtener a lo sumo una cara. Soluci on. = {ccc, ccs, csc, scc, css, scs, ssc, sss} Sea E el evento de obtener a lo sumo una cara, entonces E = {css, scs, ssc, sss}, los 8 resultados de son igualmente posibles y adem as n (E ) = 4, luego la probabilidad de E es 1 4 P (E ) = = 8 2 Ejemplo 2.7. Un elevador con dos pasajeros para en el 2do , 3ro y 4to piso. Si es igualmente posible que un pasajero baje en cualquier piso, Cual es la probabilidad de que los pasajeros bajen en pisos diferentes? Soluci on. Supongase que a y b denotan los pasajeros, un resultado de es por ejemplo, a3 y b2 que signica que a se baja en el tercer piso y b se baja en el segundo piso, luego = {a2 b2 , a2 b3 , a2 b4 , a3 b2 , a3 b3 , a3 b4 , a4 b2 , a4 b3 , a4 b4 } y son igualmente posibles. Sea E el evento de que los pasajeros se bajen en el mismo piso entonces, 1 2 que P (E c ) = 1 P (E ) = 3 es E = {a2 b2 , a3 b3 , a4 b4 } entonces P (E ) = 3 9 = 3 , as la probabilidad de que los pasajeros se bajen en pisos diferentes. Ejemplo 2.8. Un n umero es seleccionado al azar de N1 = {1, 2, 3 . . . 1000} Cual es la probabilidad de que el n umero sea divisible por 3 o 5? Soluci on. N = n () = 1000, sea E el evento de obtener un n umero divisible por 3 y F el evento de obtener un n umero divisible por 5. Se debe hallar P (E F ) pero E F EF = = = x|x = 3m, 1 m 1000 = 333 , n (E ) = 333 3 1000 = 200 , n (F ) = 200 x|x = 5m, 1 m 5 1000 x|x = 15m, 1 m = 66 , n (E F ) = 66 15
2.5. ESPACIOS MUESTRALES FINITOS as que P (E F ) = = = P (E ) + P (F ) P (E F ) 200 66 333 + 1000 1000 1000 0, 467
43
En este ejemplo [a] es el mayor entero menor o igual a a(ver apendice). Ejemplo 2.9. Una urna contiene 6 bolas blancas y 9 bolas negras. Se eligen al azar 5 bolas. Calcule la probabilidad de que entre las bolas extraidas hayan 2 bolas blancas y 3 rojas. Soluci on. Cuando se dice que la extracci on es al azar signica que no existe una tendencia a tomar un color determinado y que cada bola tiene la misma posibilidad de salir. Si E es el evento de obtener 2 bolas blancas y 3 rojas, entonces 9 n(E ) = 6 alisis combinatorio ). 2 3 .(ver apendice an El espacio muestral, tiene entonces, N = 15 5 resultados posibles, luego P (E ) = n(E ) = N
6 2 15 5 9 3
= 0,4196
2.5.2.
Espacios Muestrales Finitos sin resultados igualmente posibles
Para estos espacios las cosas no son tan simples como en el caso anterior, pero los valores de P (E ) pueden ser denidos para cada uno de los 2N (S ) eventos. Sea = {1 , 2 , , N } y se supone que Pi = P ({i }), para i = 1, 2, , N . Puesto que P () = 1, entonces,
N N N
1 = P(
j =1
j ) =
j =1
P (j ) =
j =1
Pj Pj , donde la suma es sobre
Para cualquier evento E se dene como P (E ) =

j
aquellos j que est an en E . Ejemplo 2.10. Considere el experimento que tiene N resultados posibles s1 , s2 , , sN , donde se conoce que el resultado sj +1 es dos veces m as posible que el resultado sj , j = 1, 2, , N . Hallar P (Ak ), donde Ak = {s1 , s2 , , sk }.
44
Soluci on. Por hip otesis pj +1 = 2pj , de manera que p2 = 2p1 , p3 = 2p2 = 22 p1 , p4 = 3 2p3 = 2 p1 , , pN = 2N 1 p1 , entonces,
N N N
1=
j =1
pj =
j =1
2 j 1 p 1 = p 1
j =1
2j 1 = p1 (2N 1)
de ah que, p1 = Ahora,
k
2N
1 1
k
p(Ak ) =
j =1
pj =
1 N 2 1
2 j 1 =
j =1
2k 1 2N 1
En este ejemplo el resultado fu e f acil de obtener porque el evento seleccionado toma los primeros k resultados del espacio muestral y hay adem as una ley de formaci on para las probabilidades de los eventos elementales, sin embargo cuando los resultados no son igualmente posibles o no son mutuamente excluyentes el concepto cl asico no es aplicable y, en este caso, el experimento se repite varias veces y un gran n umero de veces, para luego tomar la estabilizaci on de la frecuencia relativa del evento(cuando se d a) como la probabilidad del evento.(Concepto Aposteriori o frecuencial). Denici on 2.9. Concepto A-posteriori o frecuencial de P. Si fn (E ) es la estabilizaci on de la frecuencia relativa del evento E en la n- esima repetici on de un experimento, entonces P (E ) = l m fn (E )
n
Ejemplo 2.11. Si el 25 % de la poblaci on de una ciudad lee el peri odico A, 20 % lee el peri odico B , 15 % lee el C , 10 % lee A y B , 7 % lee A y C , 5 % lee B y C , y 3 % lee los tres peridicos. Cual es la probabilidad de que una persona seleccionada de esta poblaci on no lea ninguno de los tres peri odicos? Soluci on. Sean E , F y G eventos, donde cada uno de ellos indican que el individuo seleccionado lea el peri odico A, el individuo lea el peri odico B y que el el individuo lea el peri odico C respectivamente. Los porcentajes de lectura equivalen a la freciuencias relativas de los eventos, as que P (E ) = 0, 25, P (F ) = 0, 2, P (G) = 0, 15, P (E F ) = 0, 10, P (E G) = 0, 7, P (F G) = 0, 05 y P (E F G) = 0, 03.
2.5. ESPACIOS MUESTRALES FINITOS La probabilidad de que el individuo no lea ni A ni B ni C , es P (E c F c Gc ) pero Como, P (E F G) = P (E ) + P (F ) + P (G) P (E F ) P (E G) P (F G) + P (E F G) P (E c F c Gc ) = P ([E F G] ) = 1 P (E F G)
c
45
= 0, 25 + 0, 2 + 0, 15 0, 1 0, 07 0, 05 + 0, 03 = 0, 36
Luego, la probabilidad de que ninguno lea los tres peri odicos es P (Ac B c C c ) = 1 P (A B C ) = 1 0, 36 = 0, 64 Se ha hablado de aleatoriedadpretendiendo que cada resultado de un experimento tiene la misma oportunidad de selecci on. Los dos caminos b asicos de tomar una muestra son: con reemplazamiento y sin reemplazamiento. Por ejemplo, si un experimento consiste en sacar bolas de una urna y si una muestra es tomada, se dice que esta es con reemplazamiento si cada vez que se saca una bola se retorna a la urna antes de sacar la pr oxima; y es sin reemplazamiento si la bola sacada no es retornada. Ejemplo 2.12. a) Sup ongase que una urna contiene M bolas numeradas de 1 a M , donde las primeras K bolas son defectuosas y el resto M K no lo son. El experimento consiste en sacar n bolas de la urna. Sea Ak el evento de que en la muestra de n bolas haya exactamente k . Hallar P (Ak ). Soluci on. = {(s1 , s2 , , sn ) : sj = n umero de la bola tomada en la j- esima sacada}. Suponiendo que el muestreo es con reeplazamiento, entonces N ()=M n y Ak es aquel subconjunto de para el cual exactamente k de las sj son bolas numeradas de 1 a K , inclusive. Estas K bolas numeradas deben caer en alg un subconjunto n de k posiciones del n umero total de las n posiciones posibles. Hay caminos k de seleccionar las k posiciones para las bolas numeradas de 1 a K , inclusive caer
46
CAP ITULO 2. ELEMENTOS DE PROBABILIDAD en ella. Para cada una de las n-t uplas diferentes, por tanto: n (K )k (M K )nk k (M )n n k n k posiciones diferentes hay K k (M K )nk
P (Ak ) =
(2.1)
Si el muestreo es sin reemplazamiento, para cada una de las diferentes hay (K )k (M K )nk n-t uplas diferentes, donde (N )k = N (N 1) (N (k 1)). Luego,
posiciones
P (Ak ) =
n (K )k (M K )nk k (M )n
(2.2)
Puede demostrarse que este u ltimo resultado es: K k M k nk M n
P (Ak ) =
(2.3)
b) Obtener la proabilidad de que en una mano de 10 cartas, 5 sean picas. Soluci on. Una baraja consta de 52 cartas, de las cuales K = 13 son picas. Se quiere encontrar P (A5 ), luego k = 5 y n = 10. A5 denota el evento de sacar 5 picas, entonces. 13 5 52 13 10 5 52 10
P (A5 ) =
= 0,0468
P 2.6. CONTINUIDAD DE LA FUNCION
47
2.6.
Continuidad de la funci on P
Una funci on f : R R es continua en a si l m f (x) = f (a), f es continua en R xa si es continua en todo a R. Esta denici on es equivalente al criterio secuencial, f : R R es continua en R si y solo si para una sucesi on {xn }n1 convergente en R l m f (xn ) = f l m xn
n n
Denici on 2.10. Sea {En }n1 una sucesi on de eventos. a) {En } se dice creciente si E1 E2 En En+1 . . . b) {En } se dice decreciente si E1 E2 En En+1 . . . c) la suceci on {En } se dice monotona si E1 E2 En . . . En+1 . . . , o, E1 E2 En En+1 . . . Denici on 2.11. Sea {En } es una sucesi on mon otona, se dene el l mite de En por: a) Si En es creciente,
n
l m En =
n=1
En
b) Si En es decreciente,
n
l m En =
n=1
En
Teorema 2.9. Continuidad de P. Sea {En } una sucesi on de eventos tal que, cuando n , En es creciente o En es decreciente. Entonces: P ( l m En ) = l m P (En ).
n n
Demostraci on. Se supone que En es creciente, entonces:

n
l m En =
n=1
En
Pero el miembro derecho de esta igualdad se puede escribir como:

n=1 c c c En = E1 (E1 E2 ) (E1 E2 E3 ) .
48 Luego,
c c c P ( l m En ) = P (E1 (E1 E2 ) (E1 E2 E3 ) ) n
= P (E1 (E2 E1 ) (E3 A2 ) (En En1 ) )
= P (E1 ) + P (E2 E1 ) + P (E3 E2 ) + + P (En En1 ) + = P (E1 ) + P (E2 ) P (E1 E2 ) + + P (En ) P (En En1 ) + = P (E1 ) + P (E2 ) P (E1 ) + + P (En ) P (En1 ) + = l m P (En )
n
La siguiente secci on es una aplicaci on de la continuidad.
2.6.1.
Probabilidades 0 y 1
Supongase que un experimento consiste en seleccionar al azar un punto del intervalo (0, 1). Puesto que cada punto en (0, 1) tiene una representaci on decimal como 0, 30434783 . . . el experimento es el equivalente a tomar un decimal innito en (0, 1) aleatoriamente. Si en tal experimento se quiere hallar la probabilidad de seleccionar 1 = 0, 3333 . . . , sea En el evento de que el decimal seleccionado tenga el el punto 3 3 en los primeros n dgitos, as E1 = {x|x = 0, 31 2 , . . . , i = 0, 1, 2, . . . , 9}
E2 = E3 = . . . . . . En =
{x|x = 0, 331 2 , . . . , i = 0, 1, 2, . . . , 9} {x|x = 0, 33312 , . . . , i = 0, 1, 2, . . . , 9} . . . x|x = 0, 33 . . . 31 2 . . . , i = 0, 1, 2, . . . , 9

nveces3
1 luego E1 E2 En . . . por lo tanto P (E1 ) = 10 porque se debe escoger 1 el 3 de los n umeros 0, 1, 2, . . . , 9, ahora P (E2 ) = 102 ya que se debe escoger el 1 n umero 33 de los n umeros 00, . . . , 10, . . . , 99, en general P (En ) = 10 n , puesto que 1 y es una sucesi o n decreciente entonces, la probabilidad de tener el E = n i=1 3
P 2.6. CONTINUIDAD DE LA FUNCION punto

1 3
49
es
P
n=1
En
= = = =
l m En
l m P (En ) 1
n 10n
l m
0
1 3
De esta manera se tiene un evento, 1 3 = y la probabilidad es 0. El punto es transcendental, se puede escoger cualquier t (0, 1) y P ({t}) = 0. El evento Et = (0, 1) {t} = , para cualquier t (0, 1) P (Et ) = = = = P ((0, 1)) P ((0, 1) {t}) 1 P ({t}) 10 1
no
Es decir, existen eventos diferentes de con probabilidad 1.
2.6.2.
Selecci on aleatoria de puntos de intervalos
El hecho de que la probabilidad de seleccionar cualquier punto de un intervalo (a, b) sea 0 implica que si [, ] (a, b) entonces el evento de que el punto caiga en [, ], (, ), (, ], [, ) son todas equivalentes. Ahora considerando los intervalos a+b b b es el punto medio del intervalo es razonable y a+ a, a+ 2 2 , b puesto que 2 asumir que p1 = P
b como a, a+ 2
a,
a+b 2
= p2 = P
t
a+b 2 ,b
a+b ,b 2 , entonces
a+b 2 ,b
b = y (0, 1) = a, a+ 2
a,
a+b 2
a+b ,b 2
= P ((a, b)) = 1 = p1 + p2
entonces 2p1 = 1 as p1 = 1 2 = p2 , es decir, la probabilidad de que un punto b aleatorio seleccionado de (a, b) caiga en el intervalo a, a+ es 1 2 2 , y observe que es 1 1 ( b a ) = L ( a, b ). 2 2
50
+b a+2b +b , 3 , , 2a3 Si (a, b) se divide en tres intervalos de igual longitud, a, 2a3 2a+b a+2b , b , es razonable asumir que p = p = p donde p = P t a, , 1 2 3 1 3 3 +b a+2b b p2 = P t 2a3 , 3 , b entonces p + p + p = 1 as que y p3 = P a+2 1 2 3 3 1 3p1 = 1 por lo tanto p1 = 1 3 de donde se concluye que p1 = p2 = p3 = 3
2a + b a + 2b , 3 3
1 1 (b a) = L (a, b) 3 3
Denici on 2.12. Un punto se dice que es seleccionado aleatoriamente de (a, b) si cualquier dos subintervalos de (a, b) que tengan la misma longitud son igualmente probables de incluir el punto. La probabilidad asociada con el punto de que el subintervalo (, ) de (a, b) lo contenga es ba , es decir P (t (, )) = ba
2.7.
Probabilidad Condicional
Para ambientar el concepto,considerese la siguiente situaci on: Se sabe que de los estudiantes de primer a no del 2010 de un programa de matem aticas, 70 % ganaron Geometr a, 50 % ganaron c alculo diferencial y 40 % ganaron ambas asignaturas. Si se seleccion o al azar un estudiante de primer a no de matem aticas y se encontr o que gan o geometr a, cual es la probabilidad de que halla ganado c alculo?. Sean E y F los eventos que el estudiante seleccionado haya ganado geometr a y c alculo respectivamente. No se pide obtener P (F )(porque se conoce),lo que se pide es calcular P (F dado que E ocurri o). Sea n el n umero de estudiantes de primer a no de matem aticas del 2010; entonces el n umero de estudiantes que ganaron geometr a es 0, 70n, y el n umero de estudiantes que ganaron geometr a y c alculo es 0, 40n, luego la 0,40n 4 P (ganar c alculo dado que gan o geometr a) = P (F |E ) = 0 ,70n = 7 . Denici on 2.13. Sean E yF dos eventos en F del espacio de probabilidad dado (, F , P (.)). La probabilidad condicional del evento E dado el evento F , denotado por P (E |F ) se dene por: P (E |F ) = P (E F ) , si P (F ) > 0. P (F ) (2.4)
Ejemplo 2.13. Del conjunto de familia con dos hijos se selecciona una familia al azar y se encontr o que tiene una ni na. Cual es la probabilidad de que el otro hijo sea ni na?
2.7. PROBABILIDAD CONDICIONAL
51
Soluci on Sean E y F los eventos tales que la familia seleccionada tiene una ni na y dos ni nas respectivamente. Aqu = {nn, nN, N n, N N } donde n denota ni no y N denota ni na, entonces E = {nN, N n, N N } y F = {N N }. Luego P (F |E ) =
P (E F ) P (F )
P (F ) P (E )
1 4 3 4
1 3
Es evidente de la denici on 1.4 que P (E F ) = P (E |F )P (F ), si P (F ) > 0 y P (E F ) = P (F |E )P (E ), si P (E ) > 0 Estas f ormulas se conocen como la regla de multiplicaci on La denici on de probabilidad condicional es compatible con la aproximaci on frecuencial de probabilidad, pues si se observa un gran n umero, a saber N , de ocurrencias de un experimento , para el cual los eventos E y F est an denidos, entonces P E |F ) representa la proporci on de ocurrencia en la cual F ocurri o, as como tamE F bi en E ; es decir, P (E |F ) = NN , donde N denota el n u mero de ocurrencias F F del evento F en las N ocurrencias del experimento, y NE F denota el n umero de ocurrencias del evento E F en las N ocurrencias del experimento. Ahora, P (E F ) =
NE F N
y P (F ) =
NF N
, as que: = NE F = P (E |F ) NF
P (E F ) = P (F )
NE F N NF N
Ejemplo 2.14. Dos monedas son lanzadas. Si se supone que los cuatro resultados en el espacio muestral S = {(cc), (cs), (sc), (ss)} son igualmente posibles, cu al es la probabilidad: a) De que ambas resultes caras, dado que una cara apareci o en la primera moneda? b) De que ambas resulten caras, dado al menos una cara? Soluci on. Si A = {(cc)} es el evento que denota que ambas monedas caen caras y si B = {(cc), (cs)} es el evento que denota obtener cara en la primera moneda, entonces,
52
a) La probabilidad de obtener dos caras dado que en la primera sali o cara es: P (A|B ) = P (A) 1/4 1 P (A B ) = = = P (B ) P (B ) 1/2 2
b) Sea C = {(cc), (cs), (sc)} el evento de obtener al menos una cara, entonces la probabilidad de obtener dos caras dada al menos una cara es: P (A|B ) = P (A) 1/4 1 P (A C ) = = = P (C ) P (C ) 3/4 3
Ejemplo 2.15. Una urna contiene 10 bolas blancas, 7 amarillas y 8 negras. Una bola es escogida aleatoriamente de la urna y se nota que no es amarilla, Cu al es la probabilidad de que sea negra? Soluci on. Sea A el evento que denota una bola negra y B el evento que denota que la bola seleccionada no es amarilla. Entonces B es el evento de obtener bola blanca o negra, por lo tanto, P (A B ) = P (A). Se desea encontrar P (A|B ) = P (A B )/P (B ) = P (A)/P (B ). Es decir, P (A|B ) =
8/25 18/25
8 18
=4 9
Cuando se habla de probabilidad condicional se est a condicionando sobre alg un evento dado F . Este evento es como un nuevo espacio muestral. La pregunta que salta inmediatamente es P (|F ) una funci on de probabilidad? En efecto, P (|F ) es una funci on de probabilidad puesto que: 1. P (E |F ) = P (E F )/P (F ) 0, para todo E F . 2. P (|F ) = P ( F )/P (F ) = P (F )/P (F ) = 1. 3. Si E1 , E2 , , es una sucesi on de eventos tales que Ei Ej = para i = j y
si
i=1
Ei F ,

entonces:
P Ei |F =
i=1
P
i=1
Ei F
P (F )
i=1
P (Ei F ) P (F )
=
i=1
P (Ei |F )
2.7. PROBABILIDAD CONDICIONAL
53
Dado un espacio de probabilidad (, F , P (.)) y F F tal que P (F ) > 0, se puede demostrar que las propiedades de P () tambi en se satisfacen para P (|F ). Teorema 2.10. Teorema de las Probabilidades Totales. Dado un espacio de probalidad (, F , P (.)), si F1 , F2 , , Fn es una colecci on de eventos mutuamente excluyentes en F tales que:
n i=1
Fi = y P (Fi ) > 0, para i = 1, 2, , entonces para todo E F ,

n
P (E ) =
i=1
P (E |Fi )P (Fi )
(2.5)
Demostraci on. E = E = E (
Fi ) =
i=1
i=1
(E Fi )
Como para i = j , E Fi y E Fj son mutuamente excluyentes, entonces

n n n
P (E ) = P (
i=1
(E Fi )) =
i=1
P (E Fi ) =
i=1
P (E |Fi )P (Fi )
Corolario 2.1. Dado un espacio de probabilidad (, F , P (.)) y sea F F tal que 0 < P (F ) < 1. Entonces para cualquier E F , se tiene que: P (E ) = P (E |F )P (F ) + P (E |F )P (F ) Teorema 2.11. F ormula de Bayes. Dado un espacio de probabilidad (, F , P (.)), si F1 , F2 , , Fn es una colecci on de eventos mutuamente excluyentes en F que satn
isface
i=1
Fi = y P (Fi ) > 0, para i = 1, 2, , n, entonces para todo E F , con P (E |Fk )P (Fk ) P (E |Fi )P (Fi )
P (E ) > 0 se tiene que: P (Fk |E ) = Demostraci on P (Fk |E ) = P (E Fk ) P (E )

n i=1 n
(2.6)
i=1
P (E |Fk )P (Fk ) P (E )
pero P (E ) =
P (E |Fi )P (Fi ), luego
54 P (Fk |E ) = P (E |Fk )P (Fk )
i=1
P (E |Fi )P (Fi )
Ejemplo 2.16. Cinco urnas enumeradas de 1 a 5, tienen 10 bolas cada una. La urna i tiene i bolas defectuosas y 10 i no defectuosas, para i = 1, 2, 3, 4, 5. Si se selecciona al azar una urna y luego se toma una bola de la urna escogida, cu al es la probabilidad de que la bola venga de la urna 4 dado que la bola es defectuosa?. Soluci on. Sea E el evento de que la bola seleccionada sea defectuosa y sea Fi el evento de que la urna i sea seleccionada. Se desea encontrar P (F4 |E ).
5
Como P (E ) = 1, 2, 3, 4, 5 entonces:
5 i=1
P (E |Fi )P (Fi ) y P (Fi ) = 1/5 y P (E |Fi ) = i/10 para i =
P (E ) = (1/5)
i=1
i 10
1 50 (1
+ 2 + 3 + 4 + 5) =
3 10 .
P (E |F4 ) Luego P (F4 |E ) = P (E )
(4/10)(1/5) = 4/15. 3/10
Teorema 2.12. Regla de Multiplicaci on. Dado un espacio de probabilidad dado (, F , P (.))y sean E1 , E2 , , En eventos de F para los cuales P (E1 E2 En1 ) > 0 entonces,
n
P
i=1
Ei
= P (E1 )P (E2 |E1 )P (E3 |(E1 E2 )) P (En |E1 E2 En1 ) (2.7)
Demostraci on. Usar inducci on matem atica. Ejemplo 2.17. Una urna contiene 12 bolas de las cuales 4 son blancas y 8 son rojas. Se proyecta el siguiente juego: una bola es sacada aleatoriamente, se observa su color y esta es reemplazada con dos bolas del mismo color. Cu al es la probabilidad de que una bola blanca sea sacada en cada una de las tres primeras extracciones? Soluci on. Suponga que Ei denota el evento de seleccionar una bola blanca en la i- esima extracci on, se debe encontrar P (E1 E2 E3 ). Por la regla de multiplicaci on se tiene que
2.8. INDEPENDENCIA ENTRE EVENTOS P (E1 E2 E3 ) = P (E1 )P (E2 |E1 )P (E3 |(E1 E2 )).
55
De los datos del problema, P (E1 ) = 4/12 = 1/3. Ahora, dado que la primera bola fu e blanca, P (E2 |E1 ) = 6/14 = 3/7; y adem as dado que la primera y la segunda bola fueron blancas, P (E3 |(E1 E2 )) = 8/16 = 1/2. Luego, P (E1 E2 E3 ) = (1/3)(3/7)(1/2) = 1/14.
2.8.
Independencia Entre Eventos
Si P (E |F ) no depende del evento F , es decir, P (E |F ) = P (E ), parece natural decir que E es independiente de F . Denici on 2.14. Dado un espacio de probabilidad (, F , P (.)). Sean E y F dos eventos en F . Se dice que E yF son independientes si y s olo si se satisface una cualquiera de las siguientes condiciones. 1. P (E F ) = P (E )P (F ). 2. P (E |F ) = P (E ), si P (F ) > 0. 3. P (F |E ) = P (F ), si P (E ) > 0. Para argumentar que estas 3 condiciones son equivalentes, basta mostrar que a implica b, b implica c y c implica a. Ejemplo 2.18. Sean E y F eventos independientes tales que P (E F ) = 0,6 y P (E ) = 0,4, halle P (F ). Soluci on. Como P (E F ) = P (E ) + P (F ) P (E F ) y P (E F ) = P (E )P (F ) por ser E y F independientes, entonces P (E F ) = P (E ) + P (F ) P (E )P (F ). Luego, P (F ) = 0,60,4 Por tanto, P (F ) = 10,4
P (E F ) P (E ) . 1P (E )
0 ,2 0 ,6
1 3.
Teorema 2.13. Si E y F son eventos independientes denidos en (, F , P (.)), entonces E y F , E y F , y E y F son independientes.
56
Demostraci on. Se probar a que P (E F ) = P (E )P (F ), los otros dos casos son similares. P (E F ) =P ([E F ] ) = 1 P (E F ) = 1 P (E ) P (F ) + P (E F ) Por ser E y F independientes se tiene que: P (E F ) =1 P (E ) P (F ) + P (E )P (F )
=1 P (E ) P (F )[1 P (E )] =[1 P (E )][1 P (F )] = P (E )P (F ).
Denici on 2.15. Dado un espacio de probabilidad (, F P (.)) y sean E1 , E2 , , En eventos en F . Estos eventos, se dice que son independientes si y s olo si: P (Ei Ej ) =P (Ei )P (Ej ), para i = j P (Ei Ej Ek ) =P (Ei )P (Ej )P (Ek ), para i = j j = k k = i . . .
n n
P
i=1
Ei
=
i=1
P (Ei )
(2.8)
Observaci on. La independencia a pares no implica la independencia de los eventos. En efecto, considere el experimento de lanzar dos dados. Si E1 es el evento de obtener un n umero impar en el primer dado, E2 es el evento de obtener un n umero impar en el segundo dado, y E3 es el evento de obtener una suma impar. Entonces, P (E1 )P (E2 ) = (1/2)(1/2) = P (E1 E2 ). P (E1 )P (E3 ) = (1/2)(1/2) = P (E1 E3 ). P (E2 )P (E3 ) = P (E2 E3 ) = 1/4 =. Luego, E1 , E2 , E3 son independiente a pares. Sin embargo, P (E1 E2 E3 ) = 0 = P (E1 )P (E2 )P (E3 ) = (1/1)(1/2)(1/2) = 1/8. Luego, E1 , E2 , E3 no son independientes.
2.9.
Ejercicios
1. Dado P (A) = 0,5 y P (A B ) = 0,6. Hallar P (B ), si:
2.9. EJERCICIOS a) A y B son mutuamente excluyentes. b) A y B son independientes. c) P (A|B ) = 0,4
57
2. Si A yB son independientes y P (A) = 1/3 y P (B ) = 1/4. Hallar P (A B ). 3. Si A1 , A2 , A3 son eventos mutuamente excluyentes y si P (Ai ) = 1/3 y P (B |Ai ) = i/6 para i = 1, 2, 3. Hallar P (B ). 4. Sean los eventos Aj , con j = 1, 2, 3. Si A1 A2 A3 y P (A1 ) = 1/2, P (A2 ) = 5/12 y P (A3 ) = 7/12. Calcular la probabilidad de los siguientes eventos:
a ) A 1 A2 . b ) A 1 A3 . c ) A 1 A2 A3 .
5. Si dos dados son lanzados una vez, cu al es la probabilidad de que el n umero total de puntos: a ) Sea igual a 5. b ) Sea divisible por 3. 6. 20 bolas numeradas de 1 a 20 son colocadas en una urna y mezcladas. Dos bolas son tomadas sucesivamente y sin reemplazamiento. Si x1 y x2 son los n umero escritos en la primera y segunda bola, respectivamente, cu al es la probabilidad de que: a) x1 + x2 = 8 b) x1 + x2 5 7. Si las letras A, C, I, I, F, N y O son escritas en 7 chas y colocadas en una urna. Cu al es la probabilidad de formar la palabra OFICINA ? 8. Si P (A ) = a y P (B ) = b, probar que P (AB ) 1 a b. 9. Si P (A ) = c y P (B ) = d, probar que P (A|B ) c+d1 d .
10. Entre los n umeros 1, 2, , 50 se escoge un n umero al azar. Cu al es la probabilidad de que el n umero escogido sea divisible por 6 o por 8?.
58
11. De 6 n umeros positivos y 8 negativos, se eligen 4 al azar (sin sustituci on) y se multiplican. Cu al es la probabilidad de que el producto sea un n umero positivo?. 12. Una urna contiene 3 bolas rojas, 2 blancas y 1 amarilla. Una segunda urna contiene 1 bola roja, 2 blancas y 3 amarillas. a) Una bola es seleccionada aleatoriamente de cada una. Describa el espacio muestral para este experimento. Encontrar la probabilidad de que ambas sean del mismo color. Es la probabilidad de que ambas sean rojas mayor que la probabilidad de que ambas sean blancas? b) Las bolas de las dos urnas son mezcladas en una sola urna y se toma una muestra de tres. Encontrar la probabilidad de que aparezcan los tres colores cuando: El muestreo es con reemplazamiento. Es sin reemplazamiento. 13. Los 24 vol umenes de la Enciclopedia Brit anica son arreglados en un estante. Cu al es la probabilidad que: a) Todos los 24 vol umenes aparezcan en orden ascendente? b) Todos los 24 vol umenes aparezcan en orden ascendente dado que los vol umenes 14 y 15 aparcen en orden ascendente y que los vol umenes 1 a 13 preceden al vol umen 14? 14. Suponga que a probabilidad de que ambos, de un par de gemelos sean ni nos es 0,30 y que la probabilidad de que ambas sean ni nas es 0,26. Dado que la probabilidad de que un hijo sea ni no es 0,52, cu al es la probabilidad de que: a) El segundo gemelo sea un ni no, dado que el primero es un ni no? b) El segundo gemelo sea una ni na, dado que la primera es una ni na? 15. Tres m aquinas I, II y III fabrican el 20 %, 30 % y 50 %, respectivamente, de la producci on total de ciertos art culos. De estos 4 %, 3 % y 2 % respectivamente, son defectuosos. Un art culo es tomado aleatoriamente, probado y se encontr o que es defectuoso. Cu al es la probabilidad de que el art culo fuese manufacturado por la m aquina III?. 16. Una urna I contiene dos bolas blancas y dos negras; una urna II contiene tres bolas blancas y dos negras. Una bola es transferida de I a II, luego una bola es tomada de la urna II y result o ser blanca. Cu al es la probabilidad de que la bola transferida haya sido blanca?
2.9. EJERCICIOS 17. Demostrar el Teorema 2.5. 18. Demostrar la desigualdad de Boole. 19. Demuestre la Regla de la Multiplicaci on( Teorema 2.12).
59
60
Cap tulo 3
Variables Aleatorias y Distribuciones de Probabilidad

3.1. Variables Aleatorias
Es frecuente el caso que en el desarrollo de un experimento se est e interesado principalmente en alguna funci on de los resultados en vez de ellos mismos. Por ejemplo, en la lanzada de dos dados se est a interesado a menudo en la suma de las caras superiores y no realmente en los valores individuales de los dados. Tambi en , en las tiradas de una moneda, se puede estar interesado en el total de caras que ocurren y no en la sucesi on de caras y sellos que resulten. Estas cantidades de inter es o estas funciones de valor real denidas en el espacio muestral, se conocen como variables aleatorias. Denicion 3.1. Variable Aleatoria. Para un espacio de probabilidad dado (, F , P (.)), una variable aleatoria X, X. o X (.) es una funci on denida en y codominio los reales. Esta funci on X debe ser tal que el conjunto Ar , denido por Ar = {s : X (s) r} es un elemento de F . En general, para denotar variables aleatorias se usar an las u ltimas letras may usculas X, Y, U, V, W y Z del alfabeto Ingl es, y para denotar un valor de la variabe aleatoria, se usar an letras min usculas x, y, u, v, w y z . Cuando sobre un mismo espacio de probabilidad est an denidas varias variables aleatorias se usa una sola 61
62
CAP ITULO 3. VARIABLES ALEATORIAS
de estas letras acompa nada de un subindice, como X1 , X2 , , etc. Ejemplo 3.1. Consid erese el experimento de lanzar una moneda legal. Sea X la variable aleatoria que denota el n umero de caras. Entonces S = {c, s} y Xr = 0, si r = s, y Xr = 1 si r = c. As es que la variable aleatoria X asocia un n umero real con cada resultado del experimento. Puede demostrarse que esta funci on es realmente aleatoria. El lector puede comprobarlo fcilmente. Observaci on. Por lo que los valores de una variable aleatoria est an determinados por los resultados de un experimento, se pueden asignar probabilidades a los valores posibles de la variable aleatoria. En el ejemplo anterior P (X = 0) = 1/2 y P (X = 1) = 1/2. Ejemplo 3.2. Suponga que el experimento consiste en lanzar dos monedas legales. Si X denota la variable aleatoria del n umero de caras obtenidas, entonces X es la variable aleatoria que toma uno de los valores 0, 1, 2 con probabilidades respectivas: P (X = 0) = 1/4 = P ({ss}), P (X = 1) = 1/2 = P ({cs, sc}), P (X = 2) = 1/4 = P ({cc}). Puesto que X toma uno solo de los valores 0, 1, 2, se debe tener que:
2
1 = P(
i=0
{X = i}) =
P (X = i), lo cual es cierto.

i=1
Ejemplo 3.3. Condidere el experimento de lanzar dos dados legales, def nanse las dos variables aleatorias: X como la suma de las caras superiores, y Y como la diferencia absoluta de las caras superiores. La variable aleatoria X puede tomar los valores 2, 3, , 12 y puesto que el especio muestral consta de 36 resultados posibles, se puede dar una distribuci on de probabilidadesde esta, como se muestra a continuaci on.
2
1 36
3
2 36
4
3 36
5
4 36
6
5 36
7
6 36
8
5 36
9
4 36
10
3 36
11
2 36
12
1 36
P (X = i)
3.1. VARIABLES ALEATORIAS
63
donde por ejemplo P (X = 4) = P ({(i, j ) : i + j = 4}) = P ({(1, 3), (2, 2), (2, 1)}). Estas tablas pueden ser expresada por un gr aco y algunas veces por una f ormula. Una f ormula que expresa la distribuci on de probabilidades anterior, es: (i = 1)/36, i = 2, 3, , 7 (13 i)/36, i = 8, 9, , 12
P (X = i) =
La variable aleatoria Y puede tomar uno de los valores 0, 1, , 5 y su distribuci on de probabilidades se da a continuaci on:
0
6 36
1
10 36
2
8 36
3
6 36
4
4 36
5
2 36
P (Y = j )
donde, por ejemplo P (Y = 5) = P ({(i, j ) : |i j | = 5}) = P ({(1, 6), (6, 1)}). En el ejemplo anterior se ha hablado de una distribuci on de probabilidades y esta se ha presentado como una tabla, una f ormula o un gr aco y es este precisamente lo que se entiende por la distribuci on de probabilidades de una variable aleatoria. Denicion 3.2. Distribuci on de probabilidad. Una tabla, una f ormula o un gr aco que involucran los valores de una variable aleatoria y sus respectivas probabilidades, se llama la distribuci on de la variable aleatoria. Ejemplo 3.4. Tres bolas son escogidas aleatoriamente de una urna que contiene 3 bolas blancas, 4 rojas y 5 negras. Si se gana $1.oo por cada bola blanca seleccionada y se pierde $1.oo por cada bola roja seleccionada, y X denota la variable aleatoria ganancia total. Hallar su distribuci on de probabilidades. Soluci on. La variable aleatoria puede tomar uno de los valores 0, 1, 2, o 3, y para obtener las probabilidades respectivas debe notarse que los eventos: a) {X = 0} ocurre si todas las bolas seleccionadas son negras o hay una de cada color, es decir,
64
P {X = 0} =
5 3 4 + 3 1 1 12 3
5 1
70 10 + 60 = 220 220
b) {X = 1} ocurre si una bola blanca y dos negras o dos bolas blancas y una roja son seleccionadas, es decir, 3 1 5 3 + 2 2 12 3 4 1
P {X = 1} =
42 220
c) {X = 2} ocurre si dos bolas blancas y una negra son selecionadas, es decir, 3 2 12 3 5 1 15 220
P {X = 2} =
d) {X = 3} ocurre si tres bolas blancas son seleccionadas, es decir, 3 3 12 3 1 220
P {X = 3} =
e) {X = 1} ocurre si una bola blanca y dos rojas o una roja y dos negras son seleccionadas, es decir, 3 1 4 4 + 2 1 12 3 5 2
P {X = 1} =
58 220
f) {X = 2} ocurre si dos bolas rojas y una bola negra es seleccionada, es decir,
3.2. FUNCIONES DE DISTRIBUCION
65
P {X = 2} =
4 2 12 3
5 1
30 220
g) {X = 3} ocurre si 3 bolas rojas son seleccionadas, es decir, 4 3 12 3 4 220
P {X = 3} =
Luego, la distribuci on de probabilidades de la variable aleatoria ganancia totales:
3 4/220
2 30/220
1 58/220
P (X = i)
70/220
42/220
15/220
1/220
3.2.
Funciones de distribuci on
Denicion 3.3. Funci on de distribuci on. La funci on de distribuci on acumulativa de una variable aleatoria X (o simplemente la funci on de distribuci on de X ), denotada por F o por FX (.), se dene para todo real b como:
FX (b) = P (X b) = P ({s : X (s) b})
(3.1)
En palabras, F (b) denota la probabilidad de que la variable aleatoria X tome un valor menor o igual que b.
3.2.1.
Propiedades de la funci on de distribuci on F
Sea F la funci on de distribuci on de una variable aleatoria X
66
a) F es una funci on no decreciente, es decir, si a < b, entonces FX (a) FX (b). En efecto, si a < b, entonces el evento {X a} est a contenido en el evento {X b} y por tanto P (X a) P (X b), o sea que FX (a) FX (b). b) Se cumple que:
x
l m FX (x) = 0
y
x+
l m FX (x) = 1
En efecto, si x , el evento {X x} converge al evento {X < }, es decir, si x , se tiene que

x
l m {X x} = {X }
y por tanto,
x
l m FX (x) = P ( l m {X x}) = P (X < ) = P () = 0

x
Ahora , si x +, el evento {X x} converge al evento {X < }, es decir, si x +, se tiene que

x+
l m {X x} = {X +}
y por tanto,
x+
l m FX (x) = P ( l m {X x}) = P (X < +) = P () = 1

x+
c) FX (.) es cont nua por la derecha, es decir,

xx+
l m FX (x) = FX (x), o l m FX (x + h) = FX (x)

0<h0
Todas las probabilidades acerca de X pueden ser respondidas en t ermino de la funci on distribuci on. Por ejemplo: P (a < X b) = F (b) F (a) En efecto, el evento {X b} es la union de {X a} y {a < X b}, es decir, P (X b) = P (X a) + P (a < X b) y por tanto se tiene el resultado deseado.
3.2. FUNCIONES DE DISTRIBUCION Ejemplo 3.5. En el Ejemplo 1 la funci on de distribuci on es: 0 , x < 0 1 FX (x) = 2 , 0x<1 1, x 1,
67
o tambi en:
1 I(0,1) (x) + I(1,) (x). 2 Ejemplo 3.6. En el Ejemplo 3 la funci on de distribuci on de la variable aleatoria diferencia absoluta es: FX (x) = 0, 6 36 , 16 36 , FX (x) = 24 36 , 30 36 , 34 , 36 1, x0 0x<1 1x<2 2x<3 3x<4 4x<5 x5
Para obtener la probabilidad de que X sea estrictamente menor que x, se aplica la propiedad de continuidad para obtener: P (X < b) = P ( l m {X b 1/n}) = l m P (X b 1/n)
n n
= l m FX (b 1/n)
n
Ad emas, como {X = a} {X < a} = {X a} se tiene tambi en que P (X = a) = FX (a) P (X < a), o, FX (a) = P (X = a) + P (X < a) Ejemplo 3.7. Supngase que la funci on de distribuci on de una variable aleatoria X est a dada por: 0, x<0 x/ 4 , 0 FX (x) = (1/2) + (x 1)/4, 1 x < 2 11/12, 2x<3 1 , x3
68
Hallar P (X = 2), P (1/2 < X 3/2) yP (X < 2). Soluci on. Se encontrar a primero P (X < 2). P (X < 2) = l m F (2 1/n) = l m
n 1 1) 1 (2 n + n 2 4 1 1 1 3 1 = + = 4 4n 2 4 4
1 + l m 2 n
11 3 1 = , y 12 4 6 3 1 1 1/2 1 P (1/2 < X 3/2) = F (3/2) F (1/2) = + 2 = 2 4 4 2 P (X = 2) = F (2) P (X < 2) =
3.3.
Clases de Variables Aleatorias
En este trabajo se distinguen dos clases de variables aleatorias: las discretas y las continuas.
3.3.1.
Variables Aleatorias Discretas
Denicion 3.4. Una variable aleatoria X se dice que es discreta si puede tomar a los m as, un n umero contable de valores posibles, es decir, un n umero nito o innito enumerable de valores. Para una variable aleatoria discreta X se dene la funci on de masa de probabilidad por: p(x) = pX (x) = P (X = x). (3.2)
La funci on de masa de probabilidad p(x) es positiva para a lo m as un n umero contable de valores de x. Es decir, si X es discreta con valores posibles x1 , x2 , ,. Entonces, p(xi ) 0
y ademas se cumple tambi en que
p(xi ) = 1
i=1
Teorema 3.1. Si X es una variable aleatoria discreta, FX (.) puede ser obtenida de pX (.) y viceversa.
3.3. CLASES DE VARIABLES ALEATORIAS
69
Demostraci on. Sean x1 , x2 , , los valores posibles de la variable aleatoria X y supongmos que p(.) = pX (.) es dado, entonces: FX (x) = P (X x) = pX (xj )
{j : x j x }
Recprocamente, si FX (.) es dado, entonces pX (x) = P (X = x). En efecto, 1 n
pX (x) =P (X x) P (X < x) = FX (x) l m P

n
X x
=FX (x) l m F
n
1 x n
Para ilustrar el teorema anterior se considera el siguiente ejemplo. Ejemplo 3.8. Considre el experimento de lanzar un dado legal y observe la cara superior. Si X denota el n umero de puntos en la cara superior, obtener la funci on de masa de probabilidad y la funci on de distribuci on. Soluci on. Puesto que X toma los valores posibles 1, 2, 3, 4, 5, 6, con probabilidades 1/6, entonces 1 pX (x) = I{1, 2, , 6} (x) 6 . Otra manera de expresar esta funci on es p(x) =
1 6,
0,
para x = 1, 2, 3, 4, 5, 6 en otro caso
La funci on de distribuci on de esta variable aleatoria es 0 , x < 1 1 6, 1 x < 2 2 6, 2 x < 3 3 F (x) = P (X x) = 6 , 3x<4 4 6, 4 x < 5 5 , 5x<6 6 1, x 6
70
En t erminos de la funci on indicadora

5
FX (x) =
i=1
i I[i,i+1) (x) + I[6,) (x) 6
Si x = 2,8, entonces, FX (2,8) =

{j :xj 2,8}
pX (xj ) = pX (1) pX (2) =
2 1 = 6 3
Si X es una variable discreta cuyos valores posibles son x1 , x2 , , donde x1 < x2 < , entonces la funci on de distribuci on F es una funci on paso. Es decir, el valor de F es constante en los intervalos [xi1 , xi ) y luego toma un paso o un salto de tama no p(xi ) en xi . En el ejemplo anterior, la funci on de distribuci on se representa en la gura 3.1.
F (x) 1 1 2 3 4 5 6 Figura 3.1 Funci on de distribuci on del ejemplo 3.8
3.3.2.
Variables Aleatorias Continuas
Denicion 3.5. Una variable aleatoria X se dice que es continua, si existe una funci on fX (.), no negativa tal que:
x
F (x) =
fX (t)dt,
(3.3)
para cada n umero real x. La funci on f se llama la funci on de densidad de probabilidad de la variable aleatoria X y es tal que:
fX (x)dx = 1.
3.3. CLASES DE VARIABLES ALEATORIAS
71
Todas la posibilidades acerca de X pueden ser obtenidas en t erminos de f . En efecto:

b a
P (a < X b) = FX (b) FX (a) = As ,
f (x)dx
f (x)dx,
P (a < X b) = Si a = b en la ecuaci on anterior:

a
f (x)dx.
a
P (X = a) =
a
f (x)dx = 0.
El resultado anterior nos lleva a que:

a
P (X < a) = P (X a) =
f (x)dx = FX (a).
Teorema 3.2. Si X es una variable aleatoria cont nua, entonces FX (.) puede obtenerse de fX (.) y viceversa. Demostraci on. Si fX (.) es dado, entonces,
x
FX (x) = P (X x) = Si FX (x) es dado, entonces, fX (x) =
fX (u)du.
d FX (x). dx
Ejemplo 3.9. El tiempo, en horas, X , en que un computador funciona antes de hacerle matenimiento es una variable aleatoria cont nua con funci on de densidad fX (x) = ex/120 , x 0. Cu al es la probabilidad de que funcione al menos 80 horas?
72
Soluci on. La funci on dada tiene una constante que puede ser conocida usando el hecho que:

1 = FX () =
f (x)dx =
b 0
ex/120 dx
1 = 120
0
du = 120 l m
b 0
eu du = 120, luego =
1 120
De esta manera, 1 P (X < 80) = 120 Por tanto, P (X 80) = 0,513

80 80/120 ex/120 dx = ex/120 |80 = 0,487, 0 = 1e
3.4.
Esperanzas y Momentos de Variables Aleatorias
Uno de los conceptos m as importantes en la teor a de probabilidad es el del valor esperado de una variable aleatoria. De igual forma es interesante conocer los momentos y la funci on generadora de estas. Denicion 3.6. Sea X una variable aleatoria, la media o la esperanza o el valor promedio de X denotado por , X , o E (X ) se dene por: xi p(xi ), si X es una variable aleatoria discreta que toma i=1 valores x1 , x2 , , con funci on de probabilidad p. E (X ) = X = xf (x)dx, si X es una variable aleatoria continua, con funci on de densidad f. Una denici on m as general que no incluye el conocimiento de la funci on de masa de probabilidad o de la funci on de densidad de probabilidad es la siguiente:
3.4. ESPERANZAS Y MOMENTOS
73
Denicion 3.7. Sea X cualquier variable aleatoria cuya funci on de distribuci on es FX (.), se dene el valor esperado de X por:
0
E (X ) =
0
[1 F (x)]dx
F (x)dx
(3.4)
Ejemplo 3.10. Considrese el experimento de lanzar dos dados legales y sean X y Y como se denieron en el Ejemplo 3. Obtener E (X ) y E (Y ). Soluci on.
12
E (X ) =
x=2
xp(x) =2 =
1 36
+3
2 36
+ + 11
2 36
+ 12
1 34
252 =7 36
Esto no signica que en una lanzada particular de los dos dados, necesariamente se espere obtener 7, sino que E (X ) = 7 es el n umero que se espera obtener en un gran n umero de desarrollos del experimento.
5
E (Y ) =
y =0
yp(y ) = 0
6 36
+1
10 36
+ + 5
2 36
70 36
= 1,94 La acotaci on anterior vale tambi en para este caso. Ejemplo 3.11. De 6 candidatos que buscan tres posiciones en un centro de consultor a, 2 son graduados en ciencias sociales y 4 no. Si los tres candidatos son seleccionados aleatoriamente, hallar el n umero esperado de graduados en ciencias sociales. Soluci on. Sea X el n umero de personas seleccionadas en este experimento y que son graduados en ciencias sociales. Entonces X toma los valores 0, 1 y 2, con
74 probabilidades:
p(0) = P (X = 0) =
4 3 6 3 2 1 6 3 2 2 6 3
4 20
p(1) = P (X = 1) =
4 1
12 20
p(1) = P (X = 2) =
4 1
4 20
Luego, la distribuci on de probabilidad de X es:
0
4 20
1
12 20
2
4 20
p(x)
Por tanto, E (X ) = 0 4 20 +1 12 20 +2 4 20 = 1.
Ejemplo 3.12. Sea X una variable aleatoria continua con funci on de densidad dada por: f (x) = |x|I(1,1) (x). Hallar E (X ). Soluci on
1 0 1
E (X ) =
xf (x)dx =
1
x |x|dx =
x(x)dx +
x xdx.
3.4. ESPERANZAS Y MOMENTOS Luego,

0 1
75
E (X ) =
1
x2 dx +
x2 dx =
0
x3 3
+
1
x3 3
=
0
1 1 + =0 3 3
Ejemplo 3.13. Sea X una variable aleatoria continua con funci on de distribuci on dada por F (X ) = (1 pex ). x > 0. Hallar E (x). Soluci on Usando la denici on 6, se tiene que E (X ) es:
E (X ) =
0
pex dx ya que para x 0, F (x) = 0.
Luego,
b
E (X ) = l m p
b 0
ex dx =
p l m ex b
b 0
Entonces, E (X ) =
p p l m (eb + 1) = b
Otro de los conceptos de mucha importancia es el de la varianza de una variable aleatoria, la cual se dene como: Denicion 3.8. Sea X una variable aleatoria con media E (X ) = x , la varianza 2 de X , denotada por 2 , X o V (X ), se dene por:
i=1 (xi
x )2 p(xi ),
V (X ) = =
(x x )2 f (x),
si X es discreta y toma valores posibles x1 , x2 , . si X es continua
con funci on de densidad f . 2 0 2x[1 F (x) + F (x)]dx x , para cualquier variable alea toria arbitraria X. (3.5)
76
Observaci on. E (X ) representa el centro de gravedad o centroide de la unidad de masa que determina la funci on de densidad de X y V (X ) representa el momento de inercia. Denicion 3.9. La desviaci on est andar de la variable aleatoria X , denotada por , se dene por: = V (X ). Ejemplo 3.14. Obtener la varianza y la desviaci on est andar de las variables aleatorias de los ejemplos 11 al 13. Soluci on. En el ejemplo 11 se encontr o que x = 1, entonces:
2
V (X ) = V (X ) = (1)2
x=0
(x 1)2 p(x), luego,
4 8 2 2 4 + 0 + (1)2 = = ; y= . 20 20 20 5 5 En el ejemplo 12, para la variable aletoria X , continua, se encontr o que E (X ) = 0, por tanto:
1 0 1
V (X ) =
1
x |x|dx =
4 0
=
2
x 4
+
1
x 4
1 4 1 0
x dx + =
x3 dx
0
1 1 1 + = . 4 4 2
Como = 1/2, entonces =
1/2.
En el ejemplo 13, tambi en de variable aleatoria continua, se encontr o que E (X ) = p/, por tanto:
V (X ) =
0
2x(pex )dx
, ya que F (x) = 0
Luego,
V (X ) = 2p
0
xex dx
2p p2 2 2
p(2 p) = 2
3.4. ESPERANZAS Y MOMENTOS Por lo tanto, 2 = p(2 p) , y= 2 p(2 p)
77
En muchas ocasiones interesa encontrar el valor de una funci on de la variable aleatoria, esto condujo a la siguiente denici on la cual se conoce como la Ley del estad stico inconsciente. Denicion 3.10. Sea X una variable aleatoria y g (.) una funci on real. La esperanza o el valor esperado de la funci on g(.) de la variable aleatoria X , denotada por E [g (X )], se dene por:
g (x)P (x),
i
si X es una variable aleatoria discreta con funci on de probabilidad p
E [g (x)] =
Es de anotar que E (X ), V (X ) y E [g (X )] existen si y slo si las sumatorias o las integrales que denen estas existen. Ejemplo 3.15. Sea X el n umero de caras obtenidas cuando dos monedas son lanzadas. Calcular E (X 2 ). Soluci on. Como la distribuci on de probabilidad de X es:
f (x)dx,
si X es una variable aleatoria continua con funci on de densidad f
(3.6)
0
1 4
1
1 2
2
1 4
p(X )
78 Sea Y = g (X ) = X 2 , entonces:
2
E (X 2 ) = E (Y ) =
x=0
x2 p(x) = 0 + 1
1 2
+ 22
1 4
3 = 2 Ejemplo 3.16. Sea X una variable aleatoria con funci on de densidad f (x) = 1, para 0 < x < 1. Hallar E (ex ). Soluci on. Sea Y = ex , entonces:
1
E (ex ) = E (Y ) =
y dx =
0
ex dx = ex |0 = e 1
Observaci on. De la denici on es claro que si g (x) = x, entonces E [g (X )] = E (X ), y si g (x) = (x )2 , entonces E [(X )2 ] = V (X ). Teorema 3.3. Sean X una variable aleatoria, a y b constantes g y h funciones reales. Entonces a) E (a) = a. b) E [ag (X )] = aE [g (X )]. c) E [ag (X ) + bh(X )] = aE [g (X )] + bE [h(X )]. d) Si g (x) h(x), para todo x entonces E [g (X )] E [h(X )]. Demostraci on. Se supondr a que X es una variable aleatoria discreta y se demostr an b) y d), las otras dos quedan como ejercicio lo mismo que todas en el caso en que X sea continua. b). Sea ag (X ) = L(X ), entonces E [ag (X )] = E [L(X )] O sea que, E [ag (X )] =
X
L(X )p(x) =
X
ag (X )p(x)
=a
X
g (X )p(x)
Luego, E [ag (X )] = aE [g (X )].
79
d ). Si g (x) h(x) para todo x, entonces h(x) g (x) 0. Sea L(x) = h(x) g (x), entonces E [L(X )] 0. Pero, E [L(X )] = E [h(X ) g (X )] = E [h(X )] E [g (X )] 0 Luego, E [h(X )] E [g (X )] Teorema 3.4. Sea X una variable aleatoria, entonces, V (X ) = E (X 2 ) [E (X )]2 Demostraci on Por la observaci on previa al teorema anterior se tiene que V (X ) = E {[X E (X )]2 } = E {X 2 2XE (X ) + [E (X )2 ]}. Es decir, V (X ) = E (X 2 ) 2E (X )E (X ) + [E (X )2 ] = E (X 2 ) [E (X )]2 Teorema 3.5.(Desigualdad de Markov.) Sea X una variable aleatoria y g una funci on real no negativa, entonces P [g (X ) k ] E [g (X )] , k>0 k (3.7)
Demostraci on. Sea k > 0 y supongase que X toma cualquier valor en (, ). Es claro que (, ) = {x : g (x) < k } {x : g (x) k } luego,
E [g (x)] =
g (x)dx =
{x:g(x)<K }
g (x)f (x)dx +
{x : g ( x ) K }
g (x)f (x)dx,
Ahora, puesto que g (x) 0 y f (x) > 0, entonces, esta manera, Eg (X )

{x : g ( x ) K }
{x:g(x)<K }
g (x)f (x)dx 0 De
g (x)f (x)dx k
{x : g ( x ) K }
f (x)dx = P [g (X ) k ]
80 Es decir,
E [g (X )] P [g (X ) k ], k > 0 (3.8) k Corolario. Desigualdad de Chebyshev. Si X es una variable aleatoria con varianza nita 2 y media , entonces para cualquier k > 0 2 k2 2 Demostraci on. Sea g (x) = (x ) 0. Entonces, P (|X | k ) P (|X | K ) = P [(x )2 K 2 ] Observaci o n. La desigualdad anterior es equivalente a 2 , k2 el cual se obtiene usando la propiedad del complemento. P (|X | k ) 1 Ejemplo 3.17. Si X es una variable aleatoria con media 7 y varianza 4. Que puede decirse acerca de la P (2 < X < 12)? Soluci on. Como no se conoce la distribuci on exacta de X , podemos usar la desigualdad de Chebyshev, pues, P (2 < X < 12) =P (2 7 < X 7 < 12 7) = P (5 < X 7 < 5) 4 = 0,840 =P (|X 7| < 5) 1 25 Teorema 3.6.Desigualdad de Jensen. Sea X una variable aleatoria con media . Si g es una funci on convexa, entonces E (g (X )) g (E (X )). (3.10) E [(X )2 ] 2 = K2 K2 (3.9)
Demostraci on. Una funci on h se dice que es convexa si es por lo menos dos veces diferenciable y h (x) 0, para todo x en el dominio de denici on . Si se hace una expansi on en serie de g alrededor de , se tiene que, g (x) = g () + g ()(x ) + g (s)(x s)2 2
3.4. ESPERANZAS Y MOMENTOS donde s es alg un valor entre x y . Dado que g es convexa, g (s) 0 y por tanto, g (x) g () + g ()(x ). Luego, E [g (X )] E [g () + g ()]E (X ) = g () = g [E (X )].
81
Ejemplo 3.18. Una variable aleatoria X tiene = 5, que se puede decir acerca de E (eX )? Soluci on. Sea g (x) = ex , luego g es convexa, puesto que g (x) = ex 0, para todo x. As que, E (eX ) = E [g (X )] g [E (X )] = g (5) = e5 . Observaci on. El valor esperado y la varianza son casos especiales de los momentos, los cuales tienen un papel importante en la teor a estad stica. Denicion 3.11. Sea X una variable aleatoria, el k- esimo momento de X , denotado k se dene por:
k k = E (X )
(3.11)
siempre que ese valor esperado exista. Estos momentos son llamados por algunos autores, momentos alrededor del origen. Puede notarse que 1 = E (X ) = , la media de X . Denicion 3.12. Sea X una variable aleatoria, el k- esimo momento central o k- esimo momento alrededor de la medida , denotado k , se dene por: k = E [(X )k ] (3.12)
Puede verse que 1 = 0 y 2 = V (X ); adem as los momentos centrales pueden ser expresados en t erminos de los momentos E (X ), E (X )2 , . Por ejemplo,
2 V (X ) = E [(X )2 ] = E (X 2 ) [E (X )]2 = 2 (1 )
82
Como en el caso descriptivo, aqu se puede hablar de otras medidas como la mediana y la moda, las cuales como el primero de estos, son casos particulares de nociones m as generales, llamadas percentiles. Denicion 3.13. Percentil. Sea 0 < p < 1, el percentil del (100p) % o el cuartil de orden p de una variale aleatoria X , denotado por p , se dene como el n umero m as peque no que satisface: F ( ) p. A p se le llama tambi en el p- esimo percentil de X . Denicion 3.14. La mediana de una variable aleatoria X , denotada por ,5 , es el percentil del 50 %. Alternativamente se dene como aquel n umero que satisface: P (X ) Observaci on. Si X es una variable aleatoria continua, el percentil del 100p % de X est a dado por el n umero m as peque no que satisface F ( ) = p. La mediana de X , ,5 , si X es una variable aleatoria continua, satisface:
,5
1 1 , y P (X ) 2 2
f (x)dx =
,5
f (x)dx =
1 2
Comentarios E (X ) y ,5 , son considerados como medidas que localizan el centro de la distribuci on. Otra medida considerada tambi en como de localizaci on central es la moda la cual se dene como aquel valor de X en el cual f (x) alcanza su valor m aximo . La varianza es usada como una medida de separaci on o de dispersi on de una distribuci on. Otras medidas de dispersi on son denidas en t erminos de los percentiles. Una de estas es el rango intercuart lico, que se dene por ,75 ,25 . En general, p 1p es una medida de dispersi on para p, 1/2 < p < 1.
83
3 es usado como una medida de asimetr a o sesgo. Se puede demostrar que distribuciones sim etricas como la de la gura 3.1, tienen 3 = 0. Una curva como f1 (X ) de la gura 3.2, se dice que es sesgada a la derecha y puede demostrarse que 3 > 0 y una curva como f2 (x) de la gura 3.3, se dice que es sesgada a la izquierda y puede mostrarse que 3 < 0.
Figura 3.1: Densidad Sim etrica
El conocimiento de 3 no da siempre una pista sobre la forma de una distribuci on, pues a veces 3 = 0 y sin embargo la curva de la densidad puede no ser etrica . Sin embargo, existe una magnitud llamada cociente de sesgo sim 3 = on es sim etrica y toma un gran valor 3 / el cual es: cero si la distribuci 1 positivo (o negativo) para una distribuci on que tiene una gran cola a la derecha (o a la izquierda). La cantidad s =(media - mediana)/(desviaci on est andar) es usada como medida alternativa de sesgo.
4 es usada a menudo como una medida de exceso o curtosis. El coeciente de exceso o curtosis se dene por 2 = 4 / 4 3 y da el grado de achatamiento de una densidad de probabilidad acerca de su centro. Si 2 > 0 la distribuci on se llama leptocurtica y ser a mas picuda que la densidad de la distribuci o n normal est andar, y si 2 < 0, la distribuci on ser a m as achatada que la densidad de la distribuci on normal est andar y se llama mesocurtica.
84
Figura 3.2: Densidad Sesgada a la derecha
Figura 3.3: Densidad Sesgada a la izquierda
Para nalizar este cap tulo se hablar a de una clase especial de esperanza matem atica mediante la cual se pueden encontrar todos los momentos. Esta es la noci on de la funci on generatriz de momentos. Denicion 3.15. Sea X una variable aleatoria con funci on de densidad f (x) o de masa p(x). Se dene la funci on generatriz de momentos de la variable aleatoria X por el valor esperado de etx , si este existe para alg un valor de t, tal que h < t < h y h > 0.
3.5. EJERCICIOS La funci on generatriz de momentos se denota por M (t), luego:
85
M (t) = E (e ) =
tx
Si la funci on generatriz de momentos existe, entonces M (t) es continuamente diferenciable en alguna vecindad de t = 0. Derivando M (t), k veces con respecto a t, se tiene que: k tx k x x e p( x ) , d M (k) (t) = k M (t) = k k tx dt x e f (x)dx,
etx f (x)dx,
tx x e p( x ) ,
si X es discreta si X es continua
(3.13)
caso discreto caso continuo
(3.14)
Luego, M (k) (0) = E (X k ) = k.
Ejemplo 3.19. Una variable aleatoria X tiene funci on de masa de probabilidad p(x) = px (1 p)1x I{0,1} (x), con 0 < p < 1. Hallar la funci on generatriz de X y con base en esta su media y su varaianza. Soluci on.
1
MX (t) =
x
etx p(x) =
0
etx px (1 p)1x = 1 p + pet
Ahora,
(t) = pet (t) = MX MX
Luego,
(0)2 = p p2 (0) MX E (X ) = MX (0) = p, y V (X ) = E (X 2 ) [E (X )2 ] = MX
3.5.
Ejercicios
1. Si la variable aleatoria X toma los valores 1, 2, , y si P (X = i) = 1/2i ; i = 1, 2, , calcular:
86 a) P (X sea par). b) P (X > 5). c) P (X ) sea divisible por 3).
2. Demostrar que la funci on p(x) denida en el ejercicio 1 es una funci on de masa de probabilidad. Encontrar la moda de esta distribuci on. 3. La variable aleatoria continua X tiene funci on de densidad f (x) = 3x2 , para 1 x 0. Si b es un n umero tal que satisface 1 < b < 0. Calcular la P [X > b)|(X < b/2}]. Sugerencia: use la noci on de probabilidad condicional de eventos. 4. Si la variable aleatoria X toma valores 0, 1, . . . , con funci on de masa de probabilidad pX (x) = C/3x, x = 0, 1, . . . a) Determinar la constante C . b) Calcular P (X > 10). 5. En cada caso hallar la funci on de distribuci on de la variable aleatoria X , en donde es discreta o continua, segun el caso. b) f (x) = 3(1 x)2 , 0 < x < 1. a) p(x) = 1/3, x = 1, 0, 1.
c) p(x) = x/15, x = 1, 2, 3, 4, 5.
d) f (x) = 1/3, 0 < x < 1 o 2 < x < 4. 6. En el problema anterior encontrar la media, la mediana, la moda y la varianza de la variable X . 7. En el problema 4, encontrar E (X 2 ) y E (X 2 ), si existen. 8. Si X es una variable aleatoria con funci on de densidad dada por f (x) = |1x|, 0 x 2, encontrar su media y su varianza. 9. Hallar la P (X 2 < X < X + 2 ), donde X tiene funci on de probabilidad dada por: a) p(x) = (1/2)x , x = 1, 2, 3,
1
b) f (x) = 6x(1 x), 0 < x < 1.
10. Si la varianza de la variable aleatoria X existe, demostrar que E (X 2 ) [E (X )]2 .
3.5. EJERCICIOS 11. Si X es una variable aleatoria que toma valores 1, 2, 3, ...,
87
a) Demuestre que pX (n) = 1/n(n + 1), n 1 es una funci on de masa de probabilidad. b) Halle E (X ) y V (X ) 12. Si X es una variable aleatoria continua con funci on de densidad dada por: a) f (x) = 1/2, 1 < x < 1.
b) f (x) = (1 x)/2, 1 < x < 1.
c) f (x) = (x + 1)/2, 1 < x < 1. Demostrar que la distribuci on de X es sim etrica en caso a) ; sesgada a la derecha en el caso b) ; y sesgada a la izquierda en el caso c). Encontrar el coeciente de curtosis en cada caso y hacer los comentarios pertientes.
13. Si X es una variable aleatoria tal que E (X ) = 3 y E (X 2 ) = 13, determinar el acotamiento inferior para P (2 < x < 8). 14. Si X es una variable aleatoria con E (X ) = y que satisface P (X 0) = 0, demostrar que P (X > 2) 1/2. 15. Si X es una variable aleatoria cuya funci on de masa de probabilidad est a dada por p(x) = (1 ) x, x = 0, 1, 2, y 0 < < 1. Hallar la funci on generatriz de momentos y luego calcular E (X ) y V (X ). 16. Si M (t) es la funci on generadora de momentos de la variable aleatoria X y si (t) = ln M (t). Probar que (0) = X y (0) = V (X ). 17. Usando M (t) de la variable aleatoria X del ejercicio 15 obtenga (t) y encuentre E (X ) y V (X ). 18. Sea X una variable aleatoria con funci on generatriz de momentos M (t), para h < t < h y h > 0. Probar que: P (X a) eat M (t), para 0 < t < h y P (X a) eat M (t), para h < t < 0
Indice alfab etico

continuidad de P, 47 cuartil, 15 desigualdad de Boole, 39 de Chebyshev, 80 de Jensen, 80 de Markov, 79 desviaci on estandar, 76 diagrama de cajas y bigotes, 21 de franjas, 12 de lineas, 8 del pastel, 11 diagrama de puntos, 3 distribuci on de frecuencias, 4 de probabilidad, 63 espacio de probabilidad, 35 muestral, 32 estad stica, 1 descriptiva, 2 inferencial, 2 evento, 33 elemental, 33 imposible, 34 nulo, 36 seguro, 34 eventos creciente, 47 decreciente, 47 excluyentes, 34 independientes, 55 experimento, 32 funci on de densidad, 70 de distribuci on, 65 de masa, 68 de probabilidad, 35 generatriz, 84 histograma de frecuencias, 6 media de winzor, 18 geom etrica, 17 muestral, 13 recortada, 18 arm onica, 17 mediana, 82 muestral, 13 moda, 17 muestra, 2 percentil, 15, 82 poblaci on, 2 pol gono de frecuencias, 10 probabilidad, 35 88
INDICE ALFABETICO cl asica, 40 frecuencial, 44 condicional, 50 regla de Bayes, 53 de chebyshev, 20 de multiplicaci on, 51, 54 sucesi on mon otona, 47 suceso, 33 valor esperado, 72 variable aleatoria, 61 continua, 70 discreta, 68 varianza, 75 muestral, 19
89

Libro de Probabilidad

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Libro de Probabilidad

Uploaded by

Copyright:

Available Formats

Probabilidad y Estad stica

C esar A. Herazo Henriquez 15 de abril de 2012

Estad stica Descriptiva

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Estudio Descriptivo de los Datos

Descripci on por Gr acas y Tablas

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Figura 1.1. Diagrama de puntos de los errores por p agina

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Figura 1.4. D.L.F.R. del n umero de interrupciones

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

Otros 15 % Ocina 25 % 40 % 20 % Profesionales

Operarios Figura 1.6 Diagrama de pastel para el personal de la empresa

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Figura 1.7. Diagrama de franjas las notas de 50 estudiantes

Descripcion por Medidas

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS usadas son la media y la mediana.

Figura 1.8. Interpretaci on Geom etrica de la media

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

Para 0,95 se tiene que: 64,6+64,8 =64,7 2

La media arm onica ,H , se dene por:

Para la media de Winzor se tiene que: x w = 10Q1 +1195,6+10Q3 2381,6 = 40 =59,54 40

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

1.2. ESTUDIO DESCRIPTIVO DE LOS DATOS

2. La desviaci on mediana, notada Dme y denida por:

1.3. MEDIDAS DESCRIPTIVAS PARA DATOS AGRUPADOS Q2 +

0 1 2 3 4 5 6 7 8 9 10 11 Figura 1.10. Diagrama de Caja y Bigotes del ejemplo 1

Medidas Descriptivas para Datos Agrupados

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

De esta expresi on se puede obtener f acilmente que:

Para encontrar el percentil de 100p %, p , se procede de la siguiente manera.

Tabla 1.6: Distribuci on de frecuencias completa del ejemplo 2

m2 i fi x 2 = 7224,39 (84,94)2 = 9,587, 60

CAP ITULO 1. ESTAD ISTICA DESCRIPTIVA

Figura 1.11. Percentiles obtenidos por el M etodo Gr aco

CAP ITULO 2. ELEMENTOS DE PROBABILIDAD

2.2. CONCEPTOS BASICOS

CAP ITULO 2. ELEMENTOS DE PROBABILIDAD

2.3. AXIOMAS DE PROBABILIDAD

E1 E2 ... En ... = entonces,

CAP ITULO 2. ELEMENTOS DE PROBABILIDAD

es una medida de probabilidad.

= , = {1, 3}, = {2, 4}, =

P ().y por tanto P () = 0

Teorema 2.2. Si E1 , E2 , ..., En , son eventos mutuamente excluyentes en F , entonces,

2.4. PROPIEDADES DE P (.)

Demostraci on. Sea En+1 = En+2 = = , entonces

Teorema 2.3. Si E es un evento en F , entonces, P (E ) = 1 P (E )

CAP ITULO 2. ELEMENTOS DE PROBABILIDAD

= P (Ei Ej Ek ) + (1)n+1 P (E1 E2 En )

Obs ervese que F y E F son mutuamente excluyentes. Luego,

2.5. ESPACIOS MUESTRALES FINITOS

Espacios Muestrales Finitos

CAP ITULO 2. ELEMENTOS DE PROBABILIDAD

Espacios Muestrales Finitos con resultados igualmente posibles

Si el espacio muestral consta de N resultados igualmente posibles, = {1 , 2 , . . . , N } entonces =

pero P ({i }) = p para i = 1, 2, . . . , N entonces

2.5. ESPACIOS MUESTRALES FINITOS

Espacios Muestrales Finitos sin resultados igualmente posibles