Professional Documents
Culture Documents
1
República Bolivariana de Venezuela
Asesor de Contenido
Diseñadora Instruccional
2
UNIDADES CURRICULARES ESPECIALIZADAS
ESTADÍSTICA II
horas
Trabajo Acompañado 3
Trabajo Independiente 3
Horas por semana 6
Total horas por trimestre 42
3
Puntual
Hipótesis
UNIDAD
3. Prueba de
2. Estimación
TEMÁTICA
Correlación
4. Regresión y
1. Probabilidad
Grales. del proceso administrativo
COMPETENCIAS
proyectosFormular
Habilidades y Destrezas
Relaciones asertiva.s
Compromiso social
4
Tabla de Contenidos
Pág.
Programa instruccional 4
Introducción 6
Contenidos de Repaso. Teoría de conjuntos 7
UNIDAD 1 PROBABILIDAD 13
• Experimento, Resultado y Evento 16
• Distribuciones de probabilidad 18
o Probabilidad binomial 19
o Probabilidad normal 23
o Aproximación de la distribución normal a la binomial 29
UNIDAD 2 ESTIMACIÓN PUNTUAL 30
• Población y muestra 32
• Métodos de muestreo 32
• Teorema del límite central 34
• Estimadores 35
o Estimador puntual 35
o Intervalos de confianza 36
o Determinación de parámetros para la media y la proporción 37
o Características de un buen estimador 39
• Cálculo del tamaño de la muestra 41
UNIDAD 3 PRUEBA DE HIPÓTESIS 44
• ¿Qué es una hipótesis? 46
• ¿Qué es una prueba de hipótesis? 46
• Procedimiento para probar una hipótesis 46
• Prueba para una o dos colas 50
• Pruebas para media y proporción 51
UNIDAD 4 REGRESIÓN Y CORRELACIÓN 59
• Variable dependiente e independiente 61
• Diagrama de dispersión 62
• Coeficiente de correlación 62
•
•
Respuestas
Bibliografía
Anexos
PROGRAMA INSTRUCCIONAL
Objetivo General:
Analizar situaciones organizacionales a través de estadísticos idóneos que permitan
considerar el efecto y la interacción entre los diferentes factores que intervienen en la
toma de decisiones administrativas.
Sinopsis de Contenidos:
UNIDAD 1. PROBABILIDAD
Objetivo: Aplicar los conceptos de probabilidad que permitan reducir los riesgos en la
toma de decisiones
Conceptos básicos:
Probabilidad
Experimento, resultado y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
Concepto, propiedades e importancia
Función de probabilidad
Áreas bajo la curva
Tablas
Ajuste de la distribución normal a la distribución experimental
y a la binomial
7
INTRODUCCIÓN
8
Contenidos de Repaso
A
Todos los B
estudiantes la Todos los
clase especialistas en
economía
“A intersección de B”
Especialistas en economía en la clase
Notación
Por lo regular se usan letras mayúsculas para representar a los conjuntos, y letras
minúsculas para representar a los elementos de un conjunto dado. Si es un conjunto,
y todos sus elementos, es común escribir:
para definir a tal conjunto . La notación empleada para definir al conjunto se llama
notación por extensión. Para representar que un elemento pertenece a un conjunto
, escribimos (léase en ). La negación de se escribe .
9
donde el símbolo se lee "tal que", y puede ser remplazado por una barra . Por
ejemplo, el conjunto puede definirse por
Complemento de un conjunto
Igualdad de conjuntos
Subconjuntos y Superconjuntos
Un conjunto se dice subconjunto de otro , si todo elemento de es también
elemento de , es decir, cuando se verifique
y también
,
significando que es superconjunto propio de .
10
Por el principio de identidad, es siempre cierto , para todo
elemento , por lo que todo conjunto es subconjunto (y también superconjunto) de sí
mismo.
Vemos que es una relación de orden sobre un conjunto de conjuntos, pues
para todo ,y es reflexiva.
,y es antisimétrica
,y es transitiva
Intersección
Los elementos comunes entre y forman un conjunto denominado intersección de
y , representado por :
Entonces:
Diferencia
Vemos que
,
de manera que
11
. Pero también
,
de modo que
Diferencia simétrica
Cuantificadores
Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen
con cierta propiedad. Tales cuantificadores son:
Se definen
Aplicaciones
Sean y dos conjuntos. Un subconjunto , se dice aplicación de en
, lo que se representa por
siempre que se verifiquen
12
Si , el elemento se dice imagen de por , y el elemento se llama
antecedente de por .
Sea una aplicación . Se emplea la notación para representar a la
imagen de por , y por tanto .
Sean las aplicaciones y . Se define
13
Unidad I
Probabilidad
Objetivo:
Conocer los conceptos de probabilidad a fin de establecer las posibles
relaciones entre eventos que permitirán reducir riesgos en a toma de
decisiones en a practica profesional
Contenidos:
Probabilidad normal
Conceptos Básicos
Probabilidades
Experimentos, resultados y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
14
“No sé cuando
podrá realizarse el
sueño de Bolívar
pero nosotros
iremos poniendo
las piedras”
Augusto
Sandino
Probabilidad
El propósito de esta unidad es ofrecer en una primera parte los conceptos básicos
sobre probabilidad y luego la aplicación de dichos conceptos en la construcción de las
distribuciones de probabilidad, que es una lista que contiene todos los resultados de un
experimento y la probabilidad de ocurrencia de cada uno de ellos.
15
UNIDAD I. PROBABILIDAD
Probabilidad
Si por ejemplo durante el año pasado hubo 200 nacimientos en un hospital local, de los
cuales 122 fueron varones el modelo de frecuencia relativa revela que la probabilidad
de que el próximo nacimiento o un nacimiento seleccionado al azar sea una niña se
obtiene dividiendo el número de niñas que nació el año anterior dividido entre le número
total de nacimientos:
78
P (niña ) = = 0,39
200
16
Para ejemplificar observemos la aplicación de la ecuación
P(cara)= Número de formas en las que el evento puede ocurrir / Número total de
posibles resultados
1
P (cara ) = = 0,5
2
En este ejemplo sólo hay una posibilidad de que salga cara, y dos posibles resultados,
que salga cara o que salga sello. Según el resultado de la ecuación existen iguales
posibilidades de que salga cara o sello, pues la probabilidad se halla en medio de 0 y 1.
Aun sin conocer a fondo la probabilidad clásica, se puede estar consciente de que la
probabilidad de obtener una cara en el lanzamiento de una moneda es de la mitad.
Tipos de
Probabilidad
Probabilidad
Probabilidad
Objetiva
Modelo de
Modelo Clásico Frecuencia Modelo Subjetivo
Relativa
Experimento
Seguramente asocias la palabra experimento a las ciencias físicas donde nos
imaginamos a alguien mezclando químicos y manipulando tubos de ensayos, sin
embargo, en administración se realizan experimentos para conocer los posibles
resultados de una acción. Se dice que experimento es toda acción definida que conlleva
a un resultado único bien definido que tiene dos o más posibles resultados y no se sabe
cuál va a ocurrir.
Resultado
Una consecuencia particular de un experimento.
Evento
Una colección de uno o más resultados. De acuerdo a como se relacionan los eventos
de un experimento se pueden clasificar en: mutuamente excluyentes, colectivamente
exhaustivos, independientes o complementarios.
Mutuamente excluyente: la ocurrencia de cualquiera de los eventos implica que
ninguno de los otros eventos puede ocurrir al mismo tiempo. Como ejemplo tenemos el
lanzamiento de una moneda en la cual si sale cara garantiza que no puede salir sello.
17
Colectivamente exhaustivo: por lo menos uno de los eventos tiene que ocurrir, un
ejemplo es el lanzamiento de un dado, los resultados posibles son 1,2,3,4,5 y 6 y existe
la certeza que uno de ellos va a ocurrir.
Independientes: son eventos en los que la ocurrencia de uno no tiene nada que ver con
la ocurrencia del otro, por ejemplo lanzar un dado y una moneda a la vez, el resultado
del lanzamiento del dado no afecta al de la moneda.
Complementarios: son los eventos en los que si un evento no ocurre debe ocurrir el
otro. Una buena representación de estos eventos la podemos apreciar al lanzar un
dado podemos decir que un evento A es sacar un número par, pero si esto no ocurre, el
complemento es sacar un número impar. En estos casos los eventos se denominan “A”
y “no A”.
Existe una última categoría que son los eventos compuestos consiste en la co-
ocurrencia de dos o más eventos aislados. Las operaciones de conjuntos de
intersección y unión implican eventos compuestos. De esta manera si se lanza una
moneda y un dado a la vez el resultado es un evento compuesto y se puede calcular la
probabilidad de tal evento. Los eventos compuestos son más interesantes e incluso
más útiles en la administración ya que por medio de ellos pueden estudiarse las
relaciones entre dos sucesos que ocurren de forma paralela.
En el experimento del lanzamiento de un dado hay seis posibles resultados, pero hay
muchos eventos posibles.
Ejercicio 1:
Clasifica los siguientes eventos:
18
Espacio de Muestras y Eventos
Los elementos de básicos de la teoría de probabilidades son los resultados del proceso
o fenómenos bajo estudio. Cada tipo posible de ocurrencia se denomina un evento. Un
evento simple puede describirse mediante una característica sencilla. La complicación
de todos los eventos posibles se llama espacio muestral. Un evento conjunto es un
evento que tiene dos o más características.
Distribuciones de Probabilidad
Variable Aleatoria.
Una variable aleatoria es aquella que asume diferentes valores, a consecuencia de los
resultados de un experimento aleatorio, cada uno de los cuales tiene una determinada
probabilidad. Por ejemplo si contamos la cantidad de alumnos inasistentes a las clases
de estadística II durante un mes, el número de ausencias es la variable aleatoria. Si esa
variable toma sólo valores enteros, se dice que es de tipo discreto, tal es el caso del
ejemplo anterior, sería imposible decir que faltaron 3,5 estudiantes. Pero si por el
19
contrario la variable puede tomar valores fraccionarios se dice que es de tipo continuo.
Un ejemplo de una variable aleatoria discreta es el peso de los perros que recibe un
veterinario en su consulta, 50.5 Kg, 25.6 Kg, etc.
Supongamos que tenemos una variable aleatoria x, y que esta puede tomar los valores
x1, x 2 , x 3 ... x n que pueden ser discretos o continuos; cada uno de estos valores tiene
cierta probabilidad que en la práctica se desconoce; sin embargo, a través de
planteamientos teóricos podemos obtener dichas probabilidades, a las cuales
designamos por f(x); al desarrollo que toman estos valores de f(x), es lo que se llama
distribuciones de probabilidad de la variable aleatoria x. Estas distribuciones de
probabilidad toman diferentes formas o tipos, sin embargo, las más importantes son la
distribución binomial y la distribución normal.
Valor Esperado.
Probabilidad Binomial
1. Sólo debe haber dos resultados posibles. Uno se identifica como éxito y el otro
como fracaso, pero este resultado no trae una connotación de bueno o malo, es
decir, un éxito no significa que el resultado sea deseable.
2. La probabilidad de que una observación se clasifique como éxito, p, es constante
de observación a observación. Por tanto, la probabilidad de que una observación se
clasifique como fracaso, q= 1-p, es constante sobre todas las observaciones.
3. Cada observación puede clasificarse en una o dos categorías mutuamente
excluyentes y colectivamente exhaustivas. El resultado de cualquier observación es
independiente del resultado de cualquier observación.
4. El experimento puede repetirse muchas veces, pues un experimento no afecta al
otro.
20
Como ya se mencionó el símbolo p representa la probabilidad de un éxito y el símbolo
q ( 1- p ) representa la probabilidad de un fracaso. Para representar cierto número de
éxitos, utilizaremos el símbolo r y para simbolizar el número total de ensayos
emplearemos el símbolo n.
P Probabilidad de éxito.
Q Probabilidad de fracaso.
r Número de éxitos deseados.
n Número de ensayos efectuados.
n!
P= p r q n −r Recordemos que el símbolo factorial!
r! ( n − r )!
Significa, por ejemplo que es 3! = 3*2*1 =
6
Los matemáticos definen 0! = 1.
Las calculadoras científicas traen la función
Ejemplo:
21
La Línea área Conviasa tiene 5 vuelos diarios a Barquisimeto. Supongamos que la
probabilidad de que alguno de los vuelos salga retrasado es de 0.20 ¿Cuál es la
probabilidad de que ninguno de los vuelos hoy salga retrasado?
n! n −r
Utilicemos la fórmula P = r! (n − r )! p q , considerando que n=5 vuelos, y p=0,20
r
No olvides que
q=1-p
n! 5! 120
P= p r q n −r = 0,20 0 0,80 5 = 1(0,3277 ) =1(0,3277 ) = 0,3277
r!(n − r )! 0!(5 − 0)! 1(120 )
n! 5! 120
P= p r q n −r = 0,20 10,80 4 = 0,2(0,4096 ) = 5(0,08 ) = 0,4096
r!(n − r )! 1!(5 −1)! 1( 24 )
n! 5! 120
P= p r q n −r = 0,20 5 0,80 0 = 0,0032 (1) = 1(0,0032 ) = 0,0032
r!( n − r )! 5!(5 − 5)! 120 (1)
Ejercicio 2:
Ahora realiza tú la ecuación sustituyendo r por los valores 2, 3 y 4. En la tabla de la
Distribución Binomial, que se te presenta a continuación, se muestran los resultados
para que verifiques tu ejercicio:
22
La distribución binomial también se puede expresar de forma gráfica
0,45 0,4096
0,4
0,3277 Recuerdas los gráficos de
0,35
barras estudiados en
Probabilidad
0,3
0,25 0,2048
Estadística I, ahora también
0,2 los puedes utilizar para
0,15 graficar la Distribución de
0,1 0,0512 Probabilidad Binomial.
0,05 0,0064 0,0003
0
Vuelos retrasados
Ejercicio 3:
Imaginemos una escuela primaria donde los alumnos llegan tarde a menudo. Cinco
alumnos están en el jardín de niños. La directora lleva tiempo estudiando el problema,
habiendo llegado a la conclusión de que hay una probabilidad de 0.4 de que un alumno
llegue tarde y de que los alumnos lleguen independientemente uno de otro ¿Cómo
trazamos una distribución binomial de probabilidad que ilustre las probabilidades de que
0,1,2,3,4 ó 5 estudiantes lleguen tarde simultáneamente?
µ =np
donde :
n= número de ensayos.
p= probabilidad de éxitos. Recuerda que la
Desviación Estandar se
Y la desviación estándar de la siguiente forma: determina calculándole la
σ = n. p.q raíz cuadrada de la
donde : Varianza( σ 2 ), por lo que
n= número de ensayos. inferimos que σ 2 = (npq )
p= probabilidad de éxito.
q= probabilidad de fracaso.
23
Ejemplo:
Una máquina empaquetadora que produce 20% de paquetes defectuosos. Si se extrae
una muestra aleatoria de 10 paquetes, podremos calcular la media y la desviación
estándar de la distribución binomial de ese proceso en la forma que sigue:
µ = np = 10*0.2 = 2 Media.
Probabilidad normal
Leptocúrtica
Ambas mitades de la
campana son idénticas
Mesocúrtica
Platicúrtica
La distribución normal tiene varias propiedades teóricas importantes, entre las cuales
están:
1. Tiene forma de campana, es simétrica en apariencia y posee un solo pico en el
centro de la distribución.
2. Sus mediciones de tendencia central (media, mediana, moda) son iguales y se
ubican en el pico.
3. Su dispersión media es igual a 1.33 desviaciones estándar. El valor de su
alcance intercuartil puede diferir ligeramente de 1.33 desviaciones estándar.
4. La curva normal desciende suavemente en ambas direcciones a partir del valor
central. Es asintótica, lo que significa que la curva se acerca cada vez más al eje de
las X pero jamás llega a tocarlo. Es decir, las colas de la curva se extienden de
manera indefinida en ambas direcciones.
Para saber si una distribución es simétrica, hay que precisar con respecto a qué. Un
buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual área. Podemos basarnos en ella para, de forma
natural, decir que una distribución es simétrica si el lado derecho de la gráfica (a
partir de la mediana) es la imagen por un espejo del lado izquierdo
25
Si la variable es continua simétrica y unimodal, coinciden la media, la mediana y la
moda.
Dentro de los tipos de asimetría posible, vamos a destacar los dos fundamentales
Asimetría positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la media, mientras
que en derecho hay frecuencias más pequeñas (cola).
Asimetría negativa:
Cuando la cola está en el lado izquierdo.
26
Cómo se construye una Distribución de Probabilidad Normal
Construir una distribución de probabilidad, tal y como lo hicimos con la binomial sería
imposible debido a que la probabilidad normal está determinada por la media ( µ ) y la
desviación estándar ( σ ). Lo bueno es que podemos utilizar un solo dato de la familia de
distribuciones normales para dar respuestas a todos los problemas que decidamos
resolver con este tipo de distribución. La que tiene una media de 0 y una desviación
estándar de 1 se le conoce como distribución normal estándar. Todas las distribuciones
normales pueden convertirse a “distribución normal estándar” restando la media de cada
observación y dividiendo por la desviación estándar, utilizando un valor z.
Valor Z:
La distancia entre un valor seleccionado, designado X, y la media
µ , dividida por la desviación estándar.
X −µ
Z =
σ
Donde:
X: es el valor de cualquier observación o medición específica.
µ : es la media de la distribución.
σ : es la desviación estándar de la distribución
Las tablas estadísticas indican porciones del área bajo la curva normal que están
contenidas dentro de cualquier número de desviaciones estándar (más, menos) a partir
de la media.
No es posible ni necesario tener una tabla distinta para cada curva normal posible. En
lugar de ello, podemos utilizar una distribución de probabilidad normal estándar para
encontrar áreas bajo cualquier curva normal. Con esta tabla podemos determinar el
área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro
de ciertas distancias a partir de la media. Estas distancias están definidas en términos
de desviaciones estándar.
27
Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el
mismo número de desviaciones estándar a partir de la media contendrán la misma
fracción del área total bajo la curva para cualquier distribución de probabilidad normal.
Datos:
n = 30 x =10.547 σ = 0.718
Base de datos: Nivel de Hemoglobina en gestaciones de adolescentes en el 3er.
Trimestre del embarazo. n = 30
10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9
10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5
X 11
Media 10.55 0
Z 0.64
28
X f(X) Z f(Z)
Interpretación:
La probabilidad de que el valor de hemoglobina en una gestante adolescente que curse
el tercer trimestre del embarazo sea menor a 11 mg/dl es de 0.64. Es decir, el 64% de
las gestantes adolescentes que acuden a maternidad de Lima sufren de anemia
asociada a la gestación.
Ejercicio 4:
El costo de una chupetas de diferentes marcas tiene una distribución aproximadamente
normal con una media de 500 y una desviación estándar de 10¿Cuál es el valor z para
un valor x de 520 y otro de 490?
z = (x - m ) / s
en la que:
29
x = valor de la variable aleatoria que nos preocupa
m = media de la distribución de la variable aleatoria
s = desviación estándar de la distribución
z = número de desviaciones estándar que hay desde x a la media de la distribución.
¿Por qué utilizamos z en lugar del número de desviaciones estándar? Las variables
aleatorias distribuidas normalmente tienen unidades diferentes de medición: bolívares,
dólares, pulgadas, kilogramos, segundos, etc. Como vamos a utilizar una tabla,
hablamos en términos de unidades estándar (que en realidad significa desviaciones
estándar), y denotamos a éstas con el símbolo z.
Los extremos de la distribución normal se acercan al eje horizontal, pero nunca llegan a
tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequeña)
de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos
mucha precisión al ignorar valores tan alejados de la media. Pero a cambio de la
conveniencia del uso de este modelo teórico, debemos aceptar el hecho de que puede
asignar valores empíricos imposibles.
Aunque la distribución normal es continua, resulta interesante hacer notar que algunas
veces puede utilizarse para aproximar a distribuciones discretas, debido a que generar
una distribución binomial para muestras grandes puede llevar mucho tiempo es más
eficiente hacer una aproximación de la distribución normal a la binomial
Una distribución binomial B(n,p) se puede aproximar por una distribución normal,
siempre que n sea grande y p no esté muy próxima a 0 o a 1. La aproximación consiste
en utilizar una distribución normal con la misma media y desviación típica que la
distribución binomial. En la práctica se utiliza la aproximación cuando:
En cuyo caso:
30
Unidad II
Estimación Puntual
Objetivo:
Calcular los intervalos de confianza de los estimadores para la toma de
decisión.
Contenidos:
Población y muestra
Métodos de muestreo
Muestro aleatorio simple
Muestreo aleatorio sistemático
Muestreo aleatorio estratificado
Muestreo por conglomerados
Estimadores
Intervalos de confianza para la media y la proporción
Determinación del tamaño de la muestra
31
“Vive como si
fueras a morir
mañana.
Aprende como
si fueras a vivir
siempre.”
Mohandas
Gandhi
Estimación Puntual
En administración es usual realizar estudios en los que se aborden diversas
poblaciones, sin embargo acceder a cada miembro de esas poblaciones es un trabajo
imposible de realizar, por ello se seleccionan muestras que nos den una evidencia de lo
que gusta, opina, etc. una población, no obstante el hecho de no poseer los datos
reales nos obliga a estimarlos, para ello existen los estimadores. En esta unidad
encontrarás algunos aspectos relacionados con los estimadores puntuales y sus
intervalos de confianza.
32
UNIDAD II. ESTIMACIÓN PUNTUAL
Población y Muestra
Métodos de Muestreo
El muestreo es una herramienta para inferir algo respecto a una población mediante la
selección de una muestra de esa población. En muchas oportunidades el muestreo es
la única herramienta para determinar algo con respecto a la población por:
1. Es costoso abordar a todos los integrantes de la población
2. La idoneidad de los resultados de la muestra, es decir, para muchos estudios no
es esencial indagar sobre la totalidad de la población pues con una muestra se
obtiene los datos necesarios sin afectar significativamente los resultados
3. Es dificultoso poner se en contacto con todos los miembros de una población.
4. La naturaleza destructivas de ciertas pruebas, como lo es el caso de las pruebas
de control de calidad, si se toma un objeto para determinar su punto máximo de
flexión, el cual al pasarlo se rompe, si tomamos a toda una población (producción
e un día, por ejemplo) eliminaríamos por completo todos los elementos de la
población.
Qué es una muestra probabilística: Muestra seleccionada de tal forma que cada artículo
o persona de la población tienen la misma probabilidad de ser incluida en la muestra. Si
por el contrario se utilizan métodos no probabilísticas no todos los artículos tienen la
33
misma probabilidad de ser incluidos por lo tanto se corre el riesgo de que los resultados
estén sesgados, lo que significa que los resultados no sean representativos a la
población.
Muestreo Sistemático
Muestreo Estratificado
El muestreo por conglomerados ofrece ciertas ventajas sobre otros métodos. Consiste
en dividir toda la población en conglomerados o grupos y luego seleccionar una
muestra de estos conglomerados. Todas las observaciones en estos conglomerados
seleccionados están incluidas en la muestra. Este procedimiento con frecuencia es
34
más fácil y rápido que el muestreo aleatorio simple o estratificado. También es posible
combinar el muestreo estratificado con el muestreo por conglomerados.
El Teorema del Límite Central dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que
éste sea), la suma de ellas se distribuye según una distribución normal. Por ejemplo:
la variable "tirar una moneda al aire" sigue la distribución de Binomial. Si lanzamos la
moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre
si) se distribuye según una distribución normal. Este teorema se aplica tanto a suma de
variables discretas como de variables continuas.
35
X − µx 60 − 50
Z = = =2
σx 5
(*) 5 es la raíz cuadrada de 25, o sea la desviación típica de esta distribución
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es
tan sólo del 2,28%.
Ejercicio 5
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada
clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál es la
probabilidad de tener que salir a la pizarra más de 15 veces?
Estimadores
Estimador puntual:
36
esté próximo al parámetro de la población, se desearía expresar que tan cerca está,
para ello sirve el intervalo de confianza.
Estimación por Intervalos, un intervalo es un rango de valores dentro del cual se estima
está el parámetro de la población.
Intervalo de Confianza:
37
s
Intervalo de confianza de 95 % para una media x ±1,96
n
s
Intervalo de confieanza de 99 % para una media x ± 2,58
n
X
P (X éxitos)= , donde:
n
X= número de éxitos
N= tamaño de la muestra
Cómo se calcula el intervalo de confianza para proporción de la población
P ± zσ p
38
c) Una idea del valor aproximado del parámetro que queremos medir (en este caso una
proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%).
Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de
diabetes?
Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor
p = 0,5 (50%) que maximiza el tamaño muestral:
donde:
Za 2 = 1.962 (ya que la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1 – 0.05 = 0.95)
d = precisión (en este caso deseamos un 3%)
donde:
N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p =
0.5 (50%) que maximiza el tamaño muestral.
(Tomado de http://www.fisterra.com/material/investiga/8muestras/8muestras.htm)
Cuando se tiene una fórmula para estimar y se aplica a una muestra aleatoria, el
resultado es aleatorio, es decir los estimadores son variables aleatorias.
40
• defectuosos.
Podemos seleccionar al azar algunos de ellos para darnos una idea de la proporción de
defectuosos en el embarque. El parámetro de interés es la proporción de defectuosos
en toda la población, pero lo que observamos es la proporción de defectuosos en la
muestra. El valor de la proporción en la muestra es una variable aleatoria cuya
distribución está emparentada directamente con la binomial (si se tratara del número de
defectuosos, sería binomial).
• Distribución de probabilidad.
• Valor esperado.
El valor esperado de un estimador nos da un valor alrededor del cual es muy probable
que se encuentre el valor del estimador. Para poner un ejemplo, si supiéramos que el
valor esperado de una estadística es 4, esto significaría que al tomar una muestra:
Ya que es muy probable que el valor del estimador esté cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del parámetro que se pretende estimar. Al menos, quisiéramos que el valor esperado
no difiera mucho del parámetro estimado. Por esa razón es importante la cantidad que,
técnicamente llamamos sesgo. El sesgo es la diferencia entre el valor esperado del
estimador y el parámetro que estima.
Varianza de un estimador
41
esperado. Para aclarar esto, considere dos estimadores T1 y T2, suponga que ambos
son instigados y suponga que la varianza de T1 es menor que la de T2 ¿Qué quiere
decir esto? Simplemente que en un entorno fijo del valor del parámetro, los valores de
T1 son más probables que los de T2. O sea que vamos a encontrar a T1 más cerca del
valor del parámetro que a T2. Esto hace que nuestras preferencias estén con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es
más eficiente.
Para la Media
42
Z 2σ 2
Para una población finita n0 =
e2
Para la Proporción
ps − p e
z≈ = z 2 pq
pq pq . Se llega a: n =
e2
n n
Z 2 pq
Para población finita hay que tomar en cuenta el factor de corrección, n0 =
e2
En resumen:
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
44
Unidad III
Prueba de Hipótesis
Objetivo:
Aplicar con propiedad y de forma pertinente a situaciones
administrativas la prueba de hipótesis
Contenidos:
Qué es una hipótesis
Qué es una prueba de hipótesis
Contraste de hipótesis
Paramétricas (Media aritmética y proporción)
Para una población
Para dos poblaciones
45
“El que aprende y aprende
y no practica lo que
aprende es como el que
ara y ara y nunca siembra.”
Platón
Prueba de Hipótesis
46
UNIDAD III. PRUEBA DE HIPÓTESIS
Hipótesis estadística
Prueba de Hipótesis:
Existen cinco pasos que sistematiza una prueba de hipótesis, y cuando se llega al paso
5 se está listo para rechazar o aceptar la hipótesis. Veamos los pasos representados en
el siguiente diagrama:
47
Paso 1 Paso 2 Paso 3 Paso 4
Establecer las Seleccionar un Identificar la Formular la
hipótesis nula y nivel de estadística de regla de
alternativa significancia prueba decisión
No rechazar H0
Paso 5
Tomar una
muestra, llegar
Rechazar H0 y a una decisión
Aceptar H1
Se debe recalcar además que si no se rechaza la hipótesis nula, con base en los datos
de la muestra, no es posible decir que la hipótesis nula sea cierta. En otras palabras, la
imposibilidad de rechazar la hipótesis nula no demuestra que H0 sea verdadera;
significa que no fue posible de rechazar H0. Para demostrar la hipótesis nula sería
necesario conocer el parámetro de la población y recabar los datos con la población en
pleno; como eso es prácticamente imposible, la única alternativa es tomar una muestra
de la población.
Hipótesis nula
Una afirmación respecto del valor de un parámetro de la
Hipótesis alternativa
Una afirmación que se acepta si los datos de la muestra
evidencian suficientemente que la hipótesis nula es
48
Paso 2: Seleccionar el nivel de significancia
El nivel de significancia es designado con la letra alfa ( α ) del alfabeto griego, también
se le conoce como nivel de riesgo, y éste quizás sea un termina más apropiado, pues
es este nivel es el riesgo que se asume al rechazar la hipótesis nula cuando de hecho
es verdadera. No hay un nivel de significancia que se aplique a todas las pruebas, el
investigador toma la decisión de utilizar cualquier valor entre 1 y 0, es decir, entre 0 y
10 por ciento.
Por que se comentó al inicio que el nivel de significancia se podía llamar también de
riesgo, porque de acuerdo al nivel de significancia que se establezca se puede cometer
el error de rechazar una hipótesis verdadera, observemos este ejemplo planteado por
Lind, Mason y Marchal (2003):
Suponga que una firma que fabrica computadoras personales utiliza una gran
cantidad de tarjetas de circuitos impresos. Los proveedores concursan para
abastecer las tarjetas y, a quien presenta la cotización más baja, se le otorga
un contrato considerable. Suponga también que el contrato especifica que el
departamento de control de calidad del fabricante de las computadoras hará
un muestreo de todos los embarques de tarjetas de circuitos que reciba. Si
más del 6 por ciento de las tarjetas de la muestra están por debajo de la
norma, el embarque será rechazado. La hipótesis nula es que los embarques
de las tarjetas que se reciben contienen 6 por ciento o menos de tarjetas por
debajo de la norma. La hipótesis alternativa es que está defectuoso más del
6% de las tarjetas.
El embarque de 50 tarjetas del lote que se recibió rebeló que cuatro de ellas,
es decir, un 8%, estaban por debajo de la norma, entonces la decisión de
regresar las tarjetas al proveedor es correcta. Suponga que las 4 tarjetas
seleccionadas en la muestra de 50 eran las únicas defectuosas en todo el
embarque de 4.000 tarjetas. Entonces, sólo 1/10 de 1 por ciento estaban
defectuosas (4/4000=0,001). En ese caso, menos del 6% de todo el
embarque estaba por debajo de la norma y el rechazo del mismo fue un
error.
H0 H0
Acción
Es verdadera Es falsa
Acepto Decisión
Error tipo II β
H0 correcta
Rechazo Decisión
Error tipo I α
H0 correcta
49
Error tipo I: Rechazar una hipótesis verdadera.
Error tipo II: No rechazar una hipótesis nula que es falsa
Una regla de decisión es una afirmación de las condiciones bajos las que se rechaza la
hipótesis la y bajo las que no se rechaza. El área de rechazo define la ubicación de
todos aquellos valores que son tan grandes o tan pequeños que la probabilidad de que
ocurran bajo una hipótesis nula verdadera es bastante remota. En el gráfico que se
muestra a continuación el valor crítico es 1,65 es divide la zona de rechazo o
aceptación de la hipótesis
Región de rechazo
Valor Crítico
Punto de división entre la región en que se rechaza la
hipótesis nula y la región en la que no se rechaza
50
Los valores críticos determinan la zona de rechazo. Para hallarlos se divide entre dos
el 95%. En la tabla z (revisar anexos), el área de 0,95/2=0,4750 lo que indica un valor
de 1.96. El 5% restante está distribuido entre las dos colas, son 2,5% en cada zona de
rechazo. Es posible encontrar los valores críticos al otro lado de la cola:
Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección,
como:
H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Distribución de muestreo para el valor estadístico z, prueba de una cola, nivel de
significancia de .05
51
Una prueba es de dos colas cuando no se establece una dirección específica de la
hipótesis alterna H1, como:
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Distribución de muestreo para el valor estadístico z, prueba de dos colas, nivel de
significancia de 0.05
Cuando se hace una prueba para la media poblacional de una muestra grande y se
conoce la desviación estándar, el estadístico de prueba está dado por:
X −µ
Z =
σ
n
Ejemplo:
Una cooperativa fabricante de salsa de tomate indican en su etiqueta que el contenido
de la botella es de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa
el contenido. La muestra de la última hora tiene un peso medio de 16.12 onzas con una
desviación estándar de .5 onzas. ¿Está el proceso fuera de control para un nivel de
significancia de .05?
Paso 3: calcule el valor del estadístico de prueba: H0 se rechaza si z <- 1.96 o z > 1.96
Paso 4: decisión sobre H0: no se rechaza H0 porque 1.44 es menor que el valor crítico
1.96
52
Si se desconoce la desviación estándar de la población y el tamaño de la muestra es n
≥ 30
X −µ
Z =
σ
n
Datos:
Día Usuarios Día Usuarios Día Usuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
4 510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
53
x−µ
Z=
s
n
54
iguales. Para este caso se siguen igualmente los cinco pasos planteados pero habrá
una diferencia en la fórmula para la estadística z:
X1 − X 2
Z=
s12 s 22
+
n1 n 2
GRUPO
A 3 4 3 4 4 4 5
GRUPO
B 4 1 2 3 1 3 2 3
¿Proporcionan los datos evidencias suficientes que indique que la efectividad de los
dos tratamientos no es la misma? Utilice un nivel de significación de 0.05.
Solución:
1. Planteamiento de hipótesis:
Ho: μ1 = μ2
H1: μ1 ≠ μ2
3. Prueba estadística:
X1 − X 2 3,85 − 2,71 1,14 1,14 1,14
Z= = = = = =
s2
s 2
2,85 2
7,42 2
1,16 + 7,86 9,02 3 0,38
1
+ 2
+
n1 n 2 7 7
Como lo hemos venido trabajando para probar una hipótesis calculamos un valor z y lo
comparamos con un valor crítico de Z con base al nivel de significancia seleccionado. El
valor p para probar hipótesis es un método alternativo en caso de variables discretas. El
valor p también es aplicado a hipótesis de una cola o de dos colas.
Un ejemplo de las hipótesis que podemos manejar con la prueba de proporción son:
Estas preguntas abarcan los datos de una escala nominal de mediación, si recordamos
Estadística I esta escala se caracteriza por tener categorías sin un orden valor de
jerarquización, por ejemplo la raza, la religión, etc.
Proporción (p)
Una fracción, relación o porcentaje que indica la parte de la
población o muestra que tiene una característica de interés
particular.
N ú m_ de _eré ox i _t eo n_sl a_ m u e s t r a
p=
N ú m_ me ru oe s t r e a d o
56
Un ejemplo de proporción es que 87 personas de 100 afirmaron tener mascotas en su
casa. La proporción de la muestra es 87/100=0,87 o 87%. Para probar una hipótesis
sobre una proporción de una población se elige una muestra aleatoria de la población
que cumpla con las suposiciones binomiales explicadas. Esta prueba es apropiada
cuando tanto np como n(1-p) son al menos de 5.n (n=tamaño de la muestra,
p=proporción de la población)
p −P
z=
Prueba de hipótesis para una proporción p (1 − P )
n
Por último se toma la decisión.
Ejemplo:
Una encuesta aplicada en Caracas a 2.000 personas reveló que 1550 de ellas realizas
compras en los megamercados realizados quincenalmente a la Av. Bolívar. La
proporción de 0,775 (1550/2000=0.775) está bastante cerca de 0,80 para llegar a la
conclusión de la mayoría de la población de Caracas compra sus alimentos en los
megamercados con regularidad.
Z es una estadística de prueba normalmente distribuida cuando la hipótesis es verdad y
las demás suposiciones también son verdaderas.
1550
− 0,80
p −P 2000
z= = = −2,80
p (1 − P ) 0,80 (1 − 0,80 )
n 2000
El valor z -2,80 está en la zona de rechazo, de modo que la hipótesis nula queda
rechazada en el nivel 0,05.
Ejercicio:
Se dan las siguientes hipótesis
57
H0= p ≤ 0.70
H1=p>0.70
En este tipo de pruebas interesa saber si dos proporciones de la población son iguales.
A continuación se presentan algunos ejemplos:
Una cooperativa de ropa casual elaboró un nuevo diseño de camisas para
caballeros, el nuevo modelo se le mostró a un grupo de posibles compradores
menores de 30 años y a otros mayores de 60 años. La cooperativa desea saber si
existe diferencia en la proporción de personas de ambos grupos a quienes les gusta
el nuevo diseño.
Una aerolínea está investigando sobre el miedo a volar entre adultos, de forma
específica quieren saber si existe alguna diferencia significativa entre la proporción
de hombres y de mujeres.
p1 − p 2
z=
Prueba de proporciones de dos muestras p c (1 − p c p c (1 − p c )
+
n1 n2
Donde:
n1 es el número en la primera muestra
n2 es el número en la segunda muestra
p1 es la proporción en la primera muestra que posee la característica
p2 es la proporción en la segunda muestra que posee la característica
pc es la proporción conjunta que posee la característica en la muestra combinada, se
calcula con la siguiente fórmula:
N ú m e_ troo t a_ ld e_ é x i t o s X 1 + X 2
Proporción conjunta pc = =
N ú m e_ troo t a_ dl e_ l a s_ m u e s t r an1s + n2
Donde:
X1 es el número que posee la característica en la primera muestra
X2 es el número que posee la característica en la segunda muestra
Ejemplo
Una fábrica de perfumes desarrollo una nueva fragancia llamada Rojo. Varias pruebas
indican que tiene una muy buena aceptación en el mercado, sin embargo interesa saber
si el perfume lo prefieren mujeres jóvenes o maduras. Se tomará una muestra aleatoria
de mujeres jóvenes y maduras y se les realizará una prueba dándoles a oler varios
perfumes entre ellos Rojo y se les piden que indiquen el que más les guste.
H0 no hay diferencia entre la proporción de mujeres jóvenes y maduras que prefieren
Rojo. La hipótesis alterna es que ambas proporciones no son iguales.
Ho: p1 = p 2
H1: p1 ≠ p 2
58
Seleccionemos el nivel de significancia, utilizaremos el 0.05
X1 20 X 2 100
p1 = = = 0.20 p2 = = = 0.50
n1 100 n2 200
Observemos que la proporción conjunta de 0.40 está más cerca de 0.50 que de 0.20.
Esto se debe a que el muestreo incluyó más mujeres maduras.
p1 − p 2 0.20 − 0.50 − 0.3
z= = = = −5.0
p c (1 − p c p c (1 − p c ) 0.4(1 − 0.4) 0.40 (1 − 0.4) 0.06
+ +
n1 n2 100 200
El valor z calculado de -5 está en el área de rechazo, es decir, que la hipótesis de que
es igual la proporción de mujeres jóvenes y maduras que prefieren Rojo se rechaza, por
lo que se acepta la hipótesis alternativa.
1. De 150 adultos que probaron unos caramelos nuevos de sabor a durazno, 87 les
parecieron muy buenos. De 200 niños a 123 les gustaron muchísimo. Utilizando un
nivel de significancia de 0.10 se puede concluir que existe una diferencia
significativa en la proporción de adultos contra la de niños que consideran el nuevo
sabor como excelente.
a. Cuál es la hipótesis nula y la alternativa
b. Cual es la probabilidad de un error tipo I
c. Es una prueba de una o dos colas, por qué
d. Cual es el valor crítico
e. Debería rechazarse la hipótesis nula
59
Unidad IV
Regresión y
Correlación
Objetivo:
Interpretar el coeficiente de correlación y determinación con el
propósito de obtener la relación o variación entre dos variables.
Contenidos:
Variables dependiente e independientes
Gráfico de dispersión
Coeficiente de correlación
Correlación lineal
Coeficiente de determinación
Modelo de análisis de regresión lineal
“Lo maravilloso de
Recta de mínimos cuadrados
Error estándar de estimación
aprender algo es que
nadie puede
arrebatárnoslo.”
B.B.King
60
Regresión y Correlación
La regresión y la correlación son las dos herramientas estadísticas más eficaces que se
pueden utilizar para solucionar problemas comunes en la administración por el hecho
de que se emplean para identificar y cuantificar la relación entre dos o más variables.
61
UNIDAD IV. REGRESIÓN Y CORRELACIÓN
Ejercicio:
A continuación escribe cuatro casos en los cuales reflejes las variables dependiente e
independiente:
Variable Variable
Caso
dependiente independiente
62
La variable dependiente o también llamada variable
de respuesta es aquella que se va a predecir.
Diagrama de Dispersión
Para recordar…
Correlación Lineal
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre
dos variables aleatorias. Por ejemplo, podemos preguntarnos si hay alguna relación
entre las notas de la asignatura Estadística I y las de Matemáticas I. Una primera
aproximación al problema consistiría en dibujar en el plano un punto por cada alumno:
la primera coordenada de cada punto sería su nota en estadística, mientras que la
segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual
podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal,
parabólica, exponencial, etc.) entre ambas notas.
Correlación de Pearson
Definición. Creado por Kart Pearson en el siglo XIX, es una técnica estadística que
permite evaluar el grado o nivel de relación entre dos variables, en otras palabras, es
una herramienta que permite evaluar en que medida el comportamiento de una variable
dependiente se ve afectada por la acción directa de una variable independiente. Por
ejemplo, si queremos establecer la razón del incremento de las ventas al detal en el
mes de diciembre (variable dependiente), es muy probable que encontremos una
correlación elevada si la cruzamos con la variable independiente ingreso familiar. La
correlación lineal adquiere valores entre -1 y 1.
0= correlación nula.
+1= Correlación directamente proporcional perfecta
-1= Correlación inversamente proporcional perfecta
64
Variables extrañas o correlaciones espurias. Cuando se
estudia la correlación entre dos variables hay que tener
presente la influencia de muchas otras variables conocidas y
desconocidas y controlables o no controlables, llamadas
variables extrañas; por ejemplo, una variable dependiente
como las reservas internacionales de un país puede verse
afectada en gran parte por el control de las divisas que un
estado ejecuta; sin embargo hay otras variables como el
gasto público, las tragedias naturales, el nivel de
inflación, etc., que también pueden incidir en mayor o menor
medida sobre dicha variable dependiente.
La CIP indica, que a medida que el valor de una variable aumente, el valor de la otra
disminuye, un ejemplo de esto lo encontramos si correlacionamos las variables altitud y
concentración de oxigeno, vemos así como a medida que aumenta la altitud, disminuye
la concentración de oxigeno en el aire, de allí por ejemplo la dificultad con la que se
respira en el pico Bolívar. Se habla de una correlación inversamente proporcional
perfecta cuando la formula de producto momento de Pearson da un resultado de -1,
esto en la realidad nunca ocurre, (ver correlaciones espurias y variables extrañas), ya
que como en el caso de la correlación directamente proporcional perfecta es muy difícil
que una variable se vea únicamente influenciada por otra.
Interpretación de la Correlación
Coeficiente de Correlación
Un coeficiente de Correlación es
una medida de la magnitud de la
relación lineal entre dos
66
Para determinar el valor numérico del coeficiente de correlación usamos la fórmula
siguiente
n(∑ XY ) − (∑ X )( ∑Y )
r=
[n( ∑ X 2
][
) − (∑ X ) 2 n(∑Y 2 ) − (∑Y ) 2 ]
Donde:
n: es el número de pares de observaciones
∑X : es la suma de las variables X
∑Y : es la suma de las variables Y
( ∑X ): es la suma de los cuadrados de la variable X
2
r n −2
t= con n-2 grados de libertad
1−r 2
-2,306 0 +2,306
67
El Coeficiente de Determinación
Análisis de Regresión
Es un modelo matemático para expresar la relación entre dos variables y estima el valor
de la variable dependiente Y basándonos en el valor de la variable independiente X.
Análisis de Regresión
Es una ecuación que define la relación entre dos
variables.
Y ' = a + bX
Donde:
n( ∑XY ) − (∑X )( ∑Y )
Pendiente de la línea de regresión b =
n( ∑X 2 ) − (∑X ) 2
68
Intersección con el eje Y a = ∑ − b ∑
Y X
n n
Donde:
Es una medida que describe que tan precisa es la predicción de Y con la base en X o,
inversamente, que tan inexacta puede ser la estimación. El error estándar de
estimación se denota con la letra sx.y. La desviación estándar mide la dispersión
alrededor de la media; el error estándar de estimación mide dispersión alrededor de la
línea de regresión.
n −2
O también podemos emplear la siguiente fórmula:
S x. y =
∑Y 2
− a (∑Y ) − b(∑ XY
n −2
a. Para cada valor X hay un grupo de valores Y, y estos valores Y están distribuidos
normalmente.
b. Todas las medias de estas distribuciones normales de Y están sobre la línea de
regresión.
c. Las desviaciones estándar de estas distribuciones normales son iguales.
d. Los valores de Y son estadísticamente independientes. Este significa que al
seleccionar una muestra, el valor Y escogido para una X determinada no
depende del valor de Y para ningún otra X.
69
Respuestas
Ejercicio 1:
Clasifica los siguientes eventos:
Ejercicio 2
n! 5! 120
P= p r q n −r = 0,20 2 0,80 3 = 0,04 (0,512 ) = 10 (0,0204 ) = 0,2048
r!( n − r )! 2!(5 − 2)! 2(6)
n! 5! 120
P= p r q n −r = 0,20 3 0,80 2 = 0,008 (0,64 ) = 10 (0,0051 ) = 0,0512
r!( n − r )! 3!(5 − 3)! 6( 2)
n! 5! 120
P= p r q n −r = 0,20 4 0,80 1 = 0,0016 (080 ) = 5(0,0012 ) = 0,0064
r!( n − r )! 4!(5 − 4)! 24 (1)
Ejercicio 3
P= 0.4
Q= 0.6
N= 5
Para R= 0 obtenemos que: P(0) = 5!/ 0!(5-0)! (0.4 )0 (0.6)5, P(0) = 0.07776
Para R= 1 obtenemos que: P(1) = 5!/ 1!(5-1)! (0.4 )1 (0.6)4, P(1) = 0.2592
Para R=2 obtenemos que: P(2) = 5!/ 2!(5-2)! (0.4 )2 (0.6)3, P(2) = 0.3456
Para R= 3 obtenemos que: P(3) = 5!/ 3!(5-3)! (0.4 )3 (0.6)2 P(3) = 0.2304
Para R= 4 obtenemos que: P(4) = 5!/ 4!(5-4)! (0.4 )4 (0.6)1 P(4) = 0.0768
Para R= 5 obtenemos que: P(5) = 5!/ 5!(5-5)! (0.4 )5 (0.6)0, P(5) = 0.01024
Ejercicio 4:
70
X − µ 510 − 500
Z= = =1
σ 10
X − µ 490 − 500
Z= = = −1
σ 10
Ejercicio 5
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
m = 0,10
s2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y
varianza son:
Media : n * m = 100 * 0,10 = 10
Varianza : n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:
Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del
curso es tan sólo del 4,75%.
71
Bibliografía
72
ANEXOS
73
TABLA DE DISTRIBUCIÓN NORMAL TIPIFICADA N(0,1)
74
Manejo de Tablas. Casos Más Frecuentes (Zonas de aceptación o rechazo)
75
Distribución t de Student
76