You are on page 1of 28

Estadstica Aplicada a la Investigacin

UNLP
ADULP

(clase 3)

2016
1
Repaso 1-2
Poblacin: conjunto de elementos de los cuales
deseamos obtener informacin. (N)
Muestra: subconjunto de la poblacin cuyas
caractersticas han sido observadas. (n)
Su objetivo ser poder hacer afirmaciones que tendrn
cierta validez sobre la poblacin completa. Por lo tanto,
la muestra debe ser representativa y estar basada en el
principio de aleatorizacin.

Variable: es la caracterstica a estudiar en los


elementos de la poblacin. (X)

2
Repaso 2-2

inferencias

informacin
muestral POBLACIN

muestra

3
Notacin
POBLACION Muestra
Media
Mediana Me
Modo Mo
Desvo estndar s
Varianza

4
Estadsticos Muestrales
Def: se trata de cualquier funcin de los datos de la muestra.

Si los datos de la muestra se designan por x1, x2, , xn, cualquier funcin
de los datos es un estadstico. Por tanto, solamente existen estadsticos
cuando la variable observada X es cuantitativa. El poder de sntesis de los
estadstico es muy grande, ya que cada uno resume el conjunto de todos
los datos en un nico valor. En contrapartida, la informacin suministrada
por cada estadstico tiene que ser forzosamente menor que la informacin
suministrada por toda la muestra.

Dependiendo del tipo de informacin que proporcione un estadstico


puede clasificarse en alguno de los siguientes tipos:
1. Estadsticos de tendencia central: media, mediana y modo.
2. Estadsticos de dispersin: varianza, desvo estndar y coeficiente de
variacin.

5
Algunas Definiciones 1-2
Esperanza: E(X)
Esperanza matemtica, valor esperado, media poblacional o media, de
una variable aleatoria X, es el nmero E(X) que formaliza la idea de valor
medio (o promedio) de un fenmeno aleatorio.

Propiedades:
Si X es siempre positiva, entonces siempre lo es E(X).
La esperanza matemtica de una constante es igual a esa misma
constante, es decir, si c es una constante, entonces E(c) = c.
Si X est delimitada por dos nmeros reales, a y b, tal que: a < X < b,
entonces tambin lo est su media: a < E(X) < b.
Linealidad. Si existe E(X) y se considera que Y = a + b.X, entonces
E(Y)=E(a+bX)=a+b.E(X)

6
linealidad
La esperanza es un operador lineal, entonces:

E(X+c) = E(X) + c
E(X+Y) = E(X) + E(Y)
E(aX) = a . E(X)

Por ende:
E(aX + bY) = a . E(X) + b . E(Y),
donde X e Y son variables aleatorias y, a y b son dos
constantes cualesquiera.
7
Algunas Definiciones 2-2
Varianza: V(X)
La varianza de una variable aleatoria es una medida de
dispersin definida como la esperanza del cuadrado de la desviacin
de dicha variable respecto a su media.
Est medida en la unidad de medida de la variable al cuadrado. Por
ejemplo, si la variable mide una distancia en metros, la varianza se
expresa en metros al cuadrado. La desviacin estndar es la raz
cuadrada de la varianza, es una medida de dispersin alternativa
expresada en las mismas unidades de los datos de la variable objeto de
estudio. La varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por
los valores atpicos y no se aconseja su uso cuando las distribuciones
de las variables aleatorias tienen colas pesadas.

8
Funciones de Probabilidad

Las funciones de probabilidad son el equivalente terico de


las distribuciones de frecuencias.

Distribuciones de Frecuencias: son la agrupacin de datos en


categoras mutuamente excluyentes que indican el nmero de
observaciones en cada categora. Absoluta, relativa,
acumulada.
Las Funciones de Probabilidad (FP): son expresiones
algebraicas que permiten calcular probabilidades, siempre
que previamente se pueda haber comprobado que se dan las
condiciones para su aplicacin. El conocer las FP que se
pueden aplicar hace sencillo resolver problemas que pueden
plantearse.

9
Funciones de Probabilidad
Dependiendo de las variables con las que se trabaja, las FP
pueden ser:

de Variables discretas: cuando los resultados que se pueden


obtener corresponden a valores aislados, usualmente los
nmeros enteros (y el cero). Por ejemplo: cantidad de hijos,
alumnos por aula, pases por regin, etc. (Clase 3).
de Variables continuas: cuando los resultados posibles no
tienen ms limitaciones que la unidad de medida y los
instrumentos de medicin, y pueden tericamente dar
cualquier resultado con o sin decimales. Por ejemplo: peso o
altura de las personas, superficie de las aulas o de las
provincias, edad o tiempo transcurrido desde un suceso, gasto
familiar mensual en alimentos, etc. (Clase 4).

10
Funciones de Probabilidad Discretas
Algunas distribuciones discretas:

1. Distribucin de Probabilidad de Bernoulli


2. Distribucin Binomial
3. Distribucin Hipergeomtrica
4. Distribucin de Poisson

11
Funcin de Probabilidad de Bernoulli
Es un caso particular de la Distribucin Binomial, donde
n = 1. O sea, un solo ensayo.
xito o fracaso son los dos nicos resultados del
experimento, mutuamente excluyentes (uno u otro) y
exhaustivos (no hay otros resultados posibles).

= = (1 ) , = 0, 1.
notacin: ~ ( )

E(X) = p
V(X) = p . q, donde q = (1-p)

12
Ejemplo de Bernoulli
Ejemplo: X toma el valor 1 si vendo mi auto 0 si no lo vendo. La probabilidad de
venderlo es de p. Entonces:

X P(X) X . P(X) . ( )
E: 1 p 1.p =p 1 .p =p
F: 0 q 0.q =0 0 .q =0
p p

= . =

= . ( ) = = 1 = .

Si p = 0.4, resulta: E(X) = 0.4; y, V(X) = 0.4 * 0.6 = 0.24

13
Ejemplo de Bernoulli (2)
Ejemplo 2: En un empresa textil el 80% de los empleados son mujeres. Sea X
la v.a. que toma el valor 1 cuando un empleado seleccionado aleatoriamente
es mujer y 0 cuando el empleado es hombre.
Obtener la media y la desviacin estndar de X.

Rta: Denominamos: xito si se selecciona aleatoriamente una mujer; y


fracaso si se selecciona aleatoriamente un hombre.
La distribucin de probabilidad de la v.a. X ser:

P(X=1)= p = 0.80
P(X=2)= 1-p = 0.20

Por lo tanto, E(X)=0.80, V(X)=0.80*(1-0.80)=0.16 y X =0.4.


14
Distribucin Binomial
Nmero fijo de pruebas.
Cada prueba es individual, es un ensayo de Bernoulli (xito-fracaso). O sea, existen
slo dos posibles resultados.
Las probabilidades son constantes e independientes de las pruebas anteriores.
La v.a. binomial X representa el nmero x de xitos en n ensayos independientes.
Esto implica que el muestreo se haga con reposicin.

Si se repite un experimento de Bernoulli n veces en forma independiente uno de


otro, lo cual implica que las probabilidades de xito y fracaso, p y q, se mantengan
constantes, definimos la variable aleatoria por nmero de xitos en n pruebas
repetidas e independientes a travs de dicha funcin de probabilidad. (n es
conocido)

= = ; ~ ( , )
E(X) = n . p
V(X) = n . p . q, donde q = (1p)

15
Binomial - combinatoria
Combinatoria:
!
, = =
!. !

Es el nmero de secuencias que contiene x xitos en n


repeticiones.

Aqu no importa el orden en que aparecen los resultados.

Luego por la regla de la suma de las probabilidades, la


probabilidad buscada es la suma de estas C(n,x) probabilidades
individuales.

16
Ejemplo Binomial (1-3)
Consideremos un gran lote de fusibles, el cual
10% de los mismos son defectuosos. Si se
extraen 4 fusibles del lote:

Calcular la probabilidad de que:


1. Slo 1 sea defectuoso.
2. Por lo menos 1 sea defectuoso.

17
Ejemplo Binomial (2-3)
Solucin:
Primero hay que verificar que podamos resolver el problema
usando la distribucin binomial.
n = 4 (se hacen 4 ensayos)
p = 0.10 (es la misma en cada extraccin, cosa que es cierta si el
lote es realmente grande)
En este contexto, el uso del trmino aleatorio indica que existe
independencia en los distintos ensayos.
Existen slo 2 resultados posibles. Llamaremos xito a extraer un
fusible defectuoso.

X: nmero de xitos en 4 ensayos independientes de Bernoulli


~ ( = 4; = 0.10)

18
Ejemplo Binomial (3-3)
Esta variable puede tomar los valores: x=0,1,2,3,4.

1. =1 = 0.1 1 0.1 = 0.2916

2. 1 podemos sumar las probabilidades de


x=1,2,3,4; o bien, trabajar con el complemento:
1 =1 <1 =1 =0 =
1 0.1 1 0.1 = 0.3439

Otra opcin sera sino utilizar la FDP Acumulada!


19
Distribucin Binomial
Funcin de Distribucin de Probabilidad
Acumulada:

= = (1 )

Por ser discreta es la suma de todas las


probabilidades puntuales hasta dicho valor x.

20
Distribucin Hipergeomtrica
Muestreo sin repeticin.
La poblacin N est dividida en dos clases mutuamente
excluyentes, el subconjunto k posee cierta caracterstica que (N-k)
no. N y k se conocen.
N no es grande en relacin a n. (n/N)>0.05.
La v.a. X representa el nmero de xitos sin reposicin en una
muestra aleatoria de n elementos.

. Notar que: p cambia


con cada observacin
= = muestral, dado que
no hay reposicin.

E(X) = n . (k/N)
V(X) = n . (k/N) . (N-k)/N . (N-n)/(N-1)

Factor de correccin por poblacin


finita, tiende a 1 cuando N es grande. 21
Ejemplo Hipergeomtrica (1-1)
Un alumno que no tiene mucho tiempo para
preparar un examen y cree que puede estudiar 10
de los temas que el profesor ha dictado en clase,
sabiendo que el profesor se ha comprometido a
extraer 5 al azar de entre los 15, para proponerlos
como preguntas en el examen.

Cul es la probabilidad de que el alumno conozca


al menos 3 de los temas del examen?
22
Ejemplo Hipergeomtrica (1-2)
Solucin:
Tamao de la poblacin: N=15
El profesor selecciona al azar 5 temas, n=5
!
= maneras diferentes de exmenes
!. !
Si n=5 y k=10, se puede calcular:

. .
3 = = = 0.4

23
Ejemplo Hipergeomtrica (2-1)
En un proceso de produccin se fabrican
componentes electrnicos en lotes de 50
unidades. Supngase que el proceso ha
funcionado mal y que 5 componentes de un lote
particular son defectuosos.

Cul es la probabilidad de que una muestra de


tamao 4 contenga exactamente 1 componente
defectuoso y 3 no defectuosos?

24
Ejemplo Hipergeomtrica (2-2)
Solucin:
N=50, de los cuales 5 son defectuosos.
X: n de elementos defectuosos en la muestra
de tamaa 4.
Se pide P(X=1):
.
1 = = 0.308

25
Distribucin de Poisson
Se utiliza para resolver problemas de lneas de
espera. (Siempre asimetra positiva).
Ocurrencia de sucesos en un intervalo de tiempo.
Lo nico que se necesita como dato es el
promedio:

.
= ; X~ ()
!

E(X) =
V(X) = , atencin que V(X) tambin eleva al cuadrado las
unidades de medida.
26
Ejemplo Poisson (1-2)
Una central telefnica recibe en promedio 2.3
llamadas por minuto.
A) Calcular la probabilidad que durante un
minuto se reciban:
1. Exactamente 4 llamadas.
2. Menos de 5 llamadas.
B) Hallar la probabilidad de que el nmero de
llamadas que ingresan en dos minutos sea
igual a 6.

27
Ejemplo Poisson (2-2)
Solucin:
X: nmero de llamadas que ingresan en 1 minuto
~ (=2.3)
A)1. P(X=4) = 0.1169
2. P(X5) = P(X4) =
P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4) = 0.9162
B) t = 2 (2 minutos) .t = =4.6
~ (=4.6)
P(X=6)=0.1323
28

You might also like