Estadistica Resumen

Estadstica
La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una
muestra representativa.
La estadstica es ms que eso, es la herramienta que proporciona tcnicas precisas para obtener
informacin y mtodos para el anlisis de esta. Estudia los mtodos cientficos para recoger, organizar,
resumir y analizar datos, sacar conclusiones y tomar decisiones.
POBLACION Y MUESTRA:
Para recoger datos relativos a las caractersticas de un grupo (de lo que sea), no es posible o practico
observar al grupo entero (x el nro. Si es grande). En vez de examinar a todo el grupo, llamado poblacin
o universo, se examina una pequea muestra.
La poblacin puede ser finita (bolitas en 8 frascos) o infinita (ej. Nro de estrellas).
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, se dedica a realizar el estudio sobre la poblacin completa,

observando una caracterstica de la misma y calculando parmetros que den informacin global.
Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros.
La estadstica inferencial o inductiva, (si una muestra es representativa de una poblacin se sacaran
buenas conclusiones). Realiza el estudio descriptivo de un subconjunto de la poblacin, la muestra y
extiende los resultados a toda la poblacin.
VARIABLES
Una variable es un smbolo que puede tomar un conjunto prefijado de valores, que
se llamara dominio de esa variable.
Si la variable toma un solo valor se llama CONSTANTE.
Una variable que puede tomar cualquier valor entre 2 valores dados, es una
VARIABLE CONTINUA.
Ej. La altura de una persona puede ser 1.75, o cualquiera.
Si no puede tomar cualquier valor es una VARIABLE DISCRETA. Ej el nro de hijos
de una flia puede ser 1, 2, pero no 0,345.
VARIABLE CUALITATIVA: Expresa atributo o caract. Ej. Rubio, morocho.
VARIABLE CUANTITATIVA: Podemos expresar numricamente. Ej. Cant. De hijos que
queremos tener.
GRAFICOS:
1.
2.
3.
4.
Diagrama de sectores
Diagrama de barras
Histograma
Diagrama de escalera
5. Pictograma
6. Cartograma
7. Poligono de frecuencias
DISTRIBUCIONES DE FRECUENCIAS:
DATOS: datos recogidos no ordenados numricamente.
ORDENACIONES: Es el conjunto de datos num. En orden creciente o decreciente.
La diferencia entre el mayor y el menor se llama RANGO.
DISTRIBUCION DE FRECUENCIAS: Cuando tenemos grandes colecc. De datos, es
mejor distribuirlos en clases y determinar el nro. De indiv. De cada una. Eso se
llama frecuencia de clase.
Poner los datos por clases con cada frecuencia, es una DISTRIBUCON DE
FRECUENCIAS (o tabla de frecuencias).
INTERVALOS DE CLASE: Ej. 1.60 1.62, ese es un intervalo. El 1 nro. Es el lim.
Inferior y el 2 el superior. Si careciera de los lim. Inferior y superior seria ABIERTO.
Ej. Personas que nacieron en el ao 65 o mas.
FRONTERA CLASE: Se promedia el lim. Sup. Y el inferior.
TAMAO O ANCHO DE UN INTERVALO DE CLASE: Es la diferencia entre las
fronteras de clase inf. Y superior.
MARCA DE CLASE: Es el punto medio del intervalo de clase y lo logro promediando
los limites inf. Y sup. De la clase. Tambin se denomina PUNTO MEDIO.
Reglas
generales
frecuencias
para
formar
distribuciones
de
1. Determinar el mayor y el menor de todos los datos, hallando as el rango.

2. Dividir el rango en un nmero adecuado de intervalos de clase del mismo
tamao. Si ello no es posible, usar intervalos de clase de distintos tamaos o
intervalos de clase abiertos. Se suele tomar entre 5 y 20 intervalos de clase,
segn los datos. Los intervalos de clase se eligen tambin de modo tal que
las marcas de clase (o puntos medios) coincidan con los datos realmente
observados. No obstante las fronteras de clase no debieran coincidir con
datos realmente observados.
3. Determinar el nmero de observaciones que caen dentro de cada intervalo
de clase, esto es, hallar las frecuencias de clase.
Distribuciones de frecuencias relativas

La frecuencia relativa de una clase es su frecuencia dividida por la frecuencia total
de todas las clases y se expresa como un porcentaje. Por ejemplo, la frecuencia
relativa de la clase 1,66-1,68 es 42/100= 42%. La suma de las frecuencias relativas
de todas las clases da 1, o sea 100 por 100.
Si se sustituyen las frecuencias de la tabla por las correspondientes frecuencias

relativas, la tabla resultante se llama una distribucin de frecuencias relativas,
distribucin de porcentajes o tablas de frecuencias relativas.
Distribuciones de frecuencias acumuladas y ojivas

La frecuencia total de todos los valores menores que la frontera de clase superior
de un intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de
clase inclusive.
Ejemplo: la frecuencia acumulada de clase 1,66 1,68 en la tabla es 5+18+42= 65,
lo que significa que 65 estudiantes tienen altura por debajo de 1,685. Una tabla que
presenta tales frecuencias acumuladas se llama una distribucin de frecuencias
acumuladas, tabla de frecuencias acumuladas, o distribucin acumulada.
Un grafico que tiene las frecuencias acumuladas por debajo de cualquiera de las
fronteras de clase superiores, se llama polgono de frecuencias acumuladas u ojivas.
Siempre que hablemos de distribuciones acumuladas u ojivas, se est hablando del
caso menor que.
La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la
frecuencia acumulada dividida por la frecuencia total. Por ello, la frecuencia
acumulada relativa de alturas menores que 1,685 es 65/100= 65%, lo que significa
que el 65% de los estudiantes mide menos de 1,68.
Tipos de curvas de frecuencias
1. Las curvas de frecuencias simtricas o en forma de campana, se caracterizan

porque las observaciones equidistantes del mximo central tienen la misma
frecuencia. Ej. La curva normal.
2. En las curvas de frecuencias poco simtricas o sesgadas, la cola de la curva a un
lado del mximo central es ms larga que al otro lado. Si la cola mayor esta a la
derecha, la curva se dice asimtrica a la derecha o de simetra positiva. En caso
contrario, se dice asimtrica a la izquierda o de asimetra negativa.
3. En una curva en forma de J o de J invertida, hay un mximo en un extremo.

4. Una curva de frecuencia en forma de U tiene mximos en ambos extremos.
5. Una curva de frecuencia bimodal tiene dos mximos.
6. Una curva de frecuencia multimodal tiene ms de dos mximos.
MEDIA MEDIANA MODA.

Media aritmtica
Tambin llamada media o promedio. La media aritmtica es el promedio de un
conjunto de nmeros, a1, a2, a3, . . ., an, obtenida sumando todos los nmeros y
dividindola entre n.
(Media aritmtica) = (a1+ a2+ a3 + . . . +a n) / n
Esta es una manera de encontrar un valor representativo de un conjunto de
nmeros. El resultado es que slo necesitamos trabajar con un nmero (la media
aritmtica) en lugar de un gran conjunto de datos, cuando se considera apropiado.
La media aritmtica es un promedio estndar que a menudo se denomina
"promedio".
La media se confunde a veces con la mediana o moda. La media aritmtica es el
promedio de un conjunto de valores, o su distribucin; sin embargo, para las
distribuciones con sesgo, la media no es necesariamente el mismo valor que la
mediana o que la moda.
La media, moda y mediana son parmetros caractersticos de una distribucin de
probabilidad.
Es a veces una forma de medir el sesgo de una distribucin tal y como se puede
hacer en las distribuciones exponencial y de Poisson.
Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores) es
Ejemplo:
medio.
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso
Media aritmtica para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media
es:
Propiedades de la media aritmtica
1. La suma de las desviaciones de todas las puntuaciones de una distribucin

respecto a la media de la misma igual a cero.
La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica

7.6 es igual a 0:
8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 =
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los valores de la variable con
respecto a un nmero cualquiera se hace mnima cuando dicho nmero coincide
con la media aritmtica.
3. Si a todos los valores de la variable se les suma un mismo nmero, la media

aritmtica queda aumentada en dicho nmero.
4. Si todos los valores de la variable se multiplican por un mismo nmero la media
aritmtica queda multiplicada por dicho nmero.
Observaciones sobre la media aritmtica

1. La media se puede hallar slo para variables cuantitativas.
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas. Si tenemos una
distribucin con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralizacin poco representativa
de la distribucin.
4. La media no se puede calcular si hay un intervalo con una amplitud
indeterminada.
En este caso no es posible hallar la media porque no podemos calcular la marca de
clase de ltimo intervalo.
Definicin de mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central
de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
Clculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas.
Li es el lmite inferior de la clase donde se encuentra la mediana.
La mediana es independiente de las amplitudes de los intervalos
Definicin de moda
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene
varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay
moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el
promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cuartil
Uno de los tres puntos que dividen un conjunto de datos numricamente ordenados
en cuatro partes iguales. A estos tres puntos se les llama primer cuartil (tambin
llamado el cuartil inferior), segundo cuartil (el cuartil medio; es la mediana) y el
tercer cuartil (cuartil superior), respectivamente. Se pueden utilizar para darnos una
idea de la dispersin de los datos.
Primer cuartil
Primero de los tres puntos que dividen un conjunto de datos ordenados
numricamente en cuatro partes iguales. Esto es, el primer cuartil de una lista
ordenada numricamente es un nmero tal que un cuarto de los datos de la lista se
encuentran debajo de l.
Segundo cuartil
Nmero que divide un grupo de datos numricamente ordenados en una mitad
inferior y una superior. El segundo cuartil es lo mismo que la mediana.
Tercer cuartil
Tercero de los tres puntos que dividen en cuatro partes iguales a un conjunto de
datos numricamente ordenados. Es decir, el tercer cuartil de una lista ordenada
numricamente es un nmero debajo del cual se encuentran las tres cuartas partes
de los datos.
Deciles.
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Percentiles.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos.
MEDIDAS DE DESPERSION:
Se inici el estudio de la estadstica descriptiva. Se organiz un conjunto de datos,
en una tabla de distribucin de frecuencias y se grafic la distribucin. Usando un
histograma o un polgono de frecuencias.
Esto ayuda a visualizar donde se agrupan los datos y la forma general de la
distribucin.
Calculamos varias medidas de tendencia central, esto nos permite definir un valor
tpico en un conjunto de observaciones. Ahora veremos la dispersin o variabilidad
de los datos.
Porque ver la dispersin?

Un promedio como la media, o la mediana, solamente localiza el centro de los
datos, pero no dice nada acerca de la diseminacin de los datos.
Un valor chico para una medida de dispersin indica que los datos se encuentran
acumulados cercanamente, por ej. Alrededor de la media. Entonces la media se
considera bastante representativa de los datos, es un valor confiable.
Pero una medida de dispersin grande, indica que la media no es confiable, es
decir, no es representativa de los datos.
Ejemplo 1. Edades de de un grupo, varan de 18 a 85 aos. Esta amplia dispersin

da como resultado una medida de 50 aos que no es muy significativa.
n empleados
edad
Ejemplo 2. Comparar cuan dispersas estn dos o ms distribuciones. Si la media de

la produccin diaria de una planta AA, es 50 y en otra BB, es tambin 50, con base
a esta informacin se podra decir que son idnticas las distribuciones de las
producciones diarias. Sin embargo, los registros para 9 das en las dos plantas
revelan que esa conclusin es errnea. Pues la produccin en la planta AA vara de
48 a 52, mientras que en la otra, la produccin es ms errtica, variando de 40 a 60
por da.
48
49
50
51
52
40
47
50
53
60
Medidas de dispersin:
Veremos varias medidas de dispersin: dispersin es la variacin de un conjunto de
datos.
1. Amplitud de variacin: es la ms sencilla. Es la diferencia entre el valor ms
grande y el ms chico de un conjunto de datos.
Amplitud de variacin: valor ms grande valor ms pequeo
Caractersticas principales:
a. Solo dos valores se utilizan
b. Tienen la influencia de valores extremos
c. Es fcil de calcular y comprender.
En nuestro ejemplo de la produccin, para la planta AA: 52-48= 4, para la planta BB
es: 60-40= 20.
Puede concluirse que:

a. Hay menos dispersin en la produccin diaria en AA.
b. La produccin en la planta AA se acumula cerca de la media de 50. De esta
manera la produccin media de la planta AA es un promedio ms
representativo que la media de 50 de la planta BB.
2. Desviacin media (absoluta): mide el valor en promedio en que varan los
valores de una poblacin o muestra con respecto a su media.
Caractersticas principales:
a.
No es influenciada nocivamente por valores grandes o pequeos.
b.
Todos los valores se utilizan en su calculo
Ejemplo. El nmero de clientes atendidos, para una muestra de 5 das es: 103, 97,
101, 106 y 103. Determinar e interpretar la desviacin media.
La media es: xi = 103 + 97 + 101 + 106 +103 = 102
n
5
DM = 12/5 = 2,4, esto es que el nmero de clientes en promedio varia en 2,4
respecto de la media de 102 clientes.
Varianza y desviacin estndar: se basan en desviaciones con

respecto a la media
Varianza: la media aritmtica de las desviaciones cuadrticas con respecto
la media.
Desviacin estndar: la raz cuadrada de la varianza.

Caractersticas principales de la varianza:
a. Todas las observaciones su usan en su clculo.
b. No tiene influencia impropia de observaciones extremas.
Caractersticas principales de la desviacin estndar.
a. Su valor esta en las mismas unidades que los datos originales.
b. Es la raz cuadrada de la distancia promedio respecto de la media, elevada al
cuadrado.
c. No puede ser negativa.
d. Es la medida de dispersin ms utilizada.
Teorema de Chebyshev
Para un conjunto cualquiera de observaciones (muestra o poblacin), la proporcin
mnima de los valores que se encuentran dentro de k observaciones estndares
desde la media es al menos 1- 1/k2, donde k es una constante mayor a 1.
Ejemplo. En muestro ejemplo anterior la media fue de X= 6185/120 = 51,54$ y la
desviacin fue de 7,51$
Qu porcentaje se encuentra a una distancia de ms de 3,5 desviaciones
estndares y menos de 3,5 desviaciones estndares?
Aproximadamente el 92%, 1- 1/(3,52) = 0,92
Regla emprica
Para una distr. De frecuencias simtrica, aproximadamente el 68% de las
observaciones estar a ms y menos una desviacin de la media; el 95% estar a
mas de dos y menos de dos desviaciones de la media y prcticamente todas las
observaciones, 99,7% se hallara a ms y menos tres desviaciones estndares de la
media.
70
-3s
80
-2s
90
100
-1s
110
120
130
1s
2s
3s
I--------- 68% --------I

I------------------- 95% ----------------I
I--------------------------- 99,7 % -----------------------I
Se ha observado que si una distribucin es simtrica con forma de campana,
prcticamente todas las observaciones se encuentran entre la media ms y menos
tres desviaciones estndares.
Ejemplo: una muestra de las cantidades mensuales de dinero destinado a viticos,
sigue aproximadamente una distribucin de frecuencias simtrica de campana. La
media mensual es 150$, la desviacin estndar es $20. Utilizando la regla emprica:
1. Aproximadamente, entre cuales dos cantidades esta el 68% de los gastos en
viticos?
Aproximadamente el 68% estn entre $130 y $170,
X
1 s= $150 1.$20
2. Aproximadamente, entre cuales dos cantidades se halla el 95% de los

gastos?
Aproximadamente el 95% estn entre $110 y $190
X 2s = $150
2.$20
3. Aproximadamente, entre cuales dos cantidades estn todos los gastos?

Aproximadamente el 99,7% estn entre $90 y $210
X 3s = $150
3.$20
Dispersin relativa
Es la razn de la desviacin estndar a la media aritmtica, expresada como un
porcentaje.
CV =
S
100
X
Ejemplo: un estudio de las calificaciones obtenidas en un curso de administracin y

los aos de servicio de los empleados que tomaron el curso, dio como resultado:
calificacin media 200, la desviacin estndar 40. La media del nmero de aos de
servicio fue de 20 aos y la desviacin estndar resulto de 2 aos.
Comparar la dispersin relativa de las dos distribuciones empleando el coeficiente
de dispersin.
Para las calificaciones. CV = 40 *100 = 20%

200
Para los aos de servicio. CV = 2 *100 = 10%
20
Se puede ver que existe mayor dispersin relativa con respecto a la media en la
distribucin de las calificaciones que en la distribucin de aos de servicio, porque
20% > 10%
Otras medidas de dispersin

La varianza y la desviacin estndar son las medidas de dispersin ms utilizadas.
Existen otros medios para describir la variacin en un conjunto de datos.
Un mtodo es determinar la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales. Estas medidas son los cuartiles, los deciles y los
centiles ( o percentiles).
Los cuartiles dividen el conjunto de observaciones en cuatro partes iguales. El 1
cuartil, Q1, es el valor abajo del cual se encuentra el 25% de las observaciones y el
Q3 es el valor por abajo del cual se encuentra el 75% de las observaciones. Y Q2 es
la mediana.
Los deciles dividen a un conjunto de observaciones en 10 partes iguales.
percentiles en 100 partes iguales.
Y los
Sea Lp la ubicacin del centil deseado. Si queremos obtener el centil o percentil 33

utilizamos L33, y si deseamos la mediana, el percentil es L50.
Si el numero de observaciones es n, se requiere ubicar la observacin central, su
posicin estar en (n+1)/2 o (n+1)* P/100, donde P es el percentil deseado.
Ubicacin de un percentil Lp = (n+1) P
100
Distribuciones normales
Caractersticas:
1. La curva normal es acampanada. La media, la mediana y la moda de la
distribucin son iguales y estn localizadas en el pico. De esta forma, la mitad del
rea bajo la curva se encuentra por arriba de este punto central y la mitad por
abajo.
2. Es simtrica con respecto a su media.
3. Decrece uniformemente en ambas direcciones a partir del valor central. Es
asinttica, lo cual significa que la curva se acerca cada vez ms al eje X, pero en
realidad nunca llega a tocarlo.
Distribucin normal estndar: tiene una media igual a 0 y una desviacin
estndar igual a 1. Cualquier distribucin normal puede convertirse en una
distribucin normal estndar.
Se convierte, o estandariza, la distribucin a una distribucin normal estndar
utilizando el valor z, denominado a veces, desvo normal estandarizado o
simplemente desvo normal. El valor z es la distancia a partir de la media, medida

en unidades de la desviacin estndar.
reas bajo la curva normal: usamos la regla emprica.

1. Aproximadamente 68,26% del rea bajo la curva normal esta dentro de ms
uno y menos uno de las desviaciones estndares respecto de la media. 1
2. Aproximadamente 95,44% del rea bajo la curva normal esta dentro de ms
dos y menos dos de las desviaciones estndares respecto de la media. 2
3. Prcticamente toda el rea (99,74%) del rea bajo la curva normal esta dentro
de ms tres y menos tres de las desviaciones estndares respecto de la media.
3.
4. El rea total bajo la curva normal es 1.
Ejemplo 1: Una prueba de vida til para un gran nmero de pilas, revelo que la
duracin media para un uso especfico antes de la falla, es 19 hs. La distribucin de
las duraciones se aproxima a una distribucin normal. La desviacin estndar de la
distribucin fue 1,2 hs.
a. Entre que par de valores fallo aproximadamente 68% de las pilas?
b. Entre cuales dos valores ocurri la falla de alrededor de 95% de las pilas?
c. Entre que par de valores fallaron prcticamente todas las pilas?
Muestreo de la poblacin:
El muestreo es la nica forma de determinar algo acerca de la poblacin. Algunas
de las principales razones son.
a. La naturaleza destructiva de ciertas pruebas. Si los catavinos tuvieran que beber
todo el vino para evaluar la vendimia, consumiran toda la produccin y no
quedara producto disponible para la venta. En el rea de la produccin industrial,
las placas de acero, el alambre y productos similares, frecuentemente deben
tener determinada resistencia mnima a la tensin. Para asegurar que el producto
cumpla con el estndar mnimo, se selecciona una muestra relativamente
pequea. Cada pieza es estirada hasta que se rompe y se registra el esfuerzo de
ruptura. Si todas las piezas se sometieran a prueba de resistencia a la tensin, no
quedara ningn producto para su venta o uso.
b. Imposibilidad fsica de revisar todos los integrantes de la poblacin:
c. El costo de estudiar a todos los integrantes de una poblacin, frecuentemente es
prohibitivo.
d. Lo adecuado de los resultados de la muestra: incluso si se contase con los
fondos, se necesaria mucho tiempo para entrevistar a toda la poblacin.
Error de muestreo:
diferencia entre un valor estadstico de muestra y su

parmetro de poblacin correspondiente. Es poco probable que una media muestral
sea idntica a la media poblacional. De igual forma, la desviacin estndar u otra
medida calculada a partir de la muestra, probablemente no sera exactamente igual
al valor correspondiente de la poblacin. Podemos esperar que haya alguna
diferencia entre un valor estadstico de muestra, como la media muestral o la
desviacin estndar, y el correspondiente parmetro poblacional. La diferencia
entre un valor estadstico de muestra y un parmetro de poblacin se denomina

error de muestreo.
Teorema de lmite central:
si se seleccionan de cualquier poblacin

todas las muestras de un tamao determinado, la distribucin de las medias
muestrales se acercara a una del tipo normal. Esta aproximacin aumenta en el
caso de muestras ms grandes.
Estimaciones puntuales e intervalos de confianza

Generalmente se desconoce la media poblacional (parmetro), se utiliza el
estimador puntual.
Estimacin puntual: el valor, calculado a partir de la informacin de muestreo, que
se emplea para estimar el parmetro de poblacin.
La media muestral, X, es una estimacin puntual de la media poblacional, , y
asimismo, s, es una estimacin puntual de, .
Sin embargo, el estimador puntual representa solo una parte de la historia, se
espera que la estimacin puntual se acerque al parmetro de la poblacin,
quisiramos medir que tan cerca se encuentra. Un intervalo de confianza cumple
con este propsito.
Intervalo de confianza: una gama de valores obtenidos a partir de datos de
muestreo, de modo que el parmetro ocurre dentro de esa variedad a una
probabilidad especfica. La probabilidad especfica en cuestin se denomina el nivel
de confianza.
Para muestras razonablemente mayores, se puede utilizar el teorema del lmite
central y afirmar lo siguiente:
1. Un 95% de las medias muestrales seleccionadas de una poblacin estar dentro
de 1,96 desvos estndar respecto de la media poblacional, .
2. Un 99% de las medias muestrales se encontrara dentro de 2,58 desviaciones
estndares respecto de la media de la poblacin.
Los intervalos calculados de esta manera se denominan el intervalo de confianza de
95% y el intervalo de confianza de 99%.
Error estndar de la media muestral:
desviacin estndar de la
distribucin de muestreo de las medias muestrales. Es una medida de la
variabilidad de la distribucin de muestreo de la media muestral.
Error estndar de la media, con base en la desviacin estndar de la muestra: sx =
s/
Dos valores afectan el tamao del error estndar. El 1 es la desviacin estndar, si
es grande, entonces el error estndar tambin lo ser. Y 2 el tamao de la muestra
tambin afecta al error estndar. Al aumentar el tamao de la muestra, el error
estndar disminuye, indicando esto que hay menor variabilidad en la distribucin de
las medias muestrales.
Cuando el tamao de la muestra, n, es al menos igual a 30, generalmente se acepta
que el teorema del lmite central asegura una distribucin normal de las medias
muestrales.
Intervalo de confianza de 95% para la media: X1,96 *s /

Intervalo de confianza de 99% para la media: X2,58 *s / Intervalo de confianza
para una media: Xz *s / , donde z es el nivel de confianza.
Seleccin de tamao de muestra adecuado

Cuando se disea un estudio estadstico se pregunta: cuantos elementos deben
incluirse en la muestra?. Si es demasiado grande, se gasta dinero intilmente en la
recoleccin de datos. De manera semejante, si la muestra es pequea, las
conclusiones resultantes podran ser incorrectas. El tamao correcto de la muestra
depende de 3 factores.
1. El nivel de confianza deseado
2. El mximo error permisible por el investigador
3. La variacin en la poblacin que se estudia
El investigador selecciona el nivel de confianza, cuanto ms alto sea el nivel de
confianza, tanto mayor ser el tamao de la muestra.
El error mximo permisible, denotado como E, es la cantidad que se suma y resta
de la media muestral para determinar los puntos extremos del intervalo de
confianza. Es la cantidad de error que el investigador esta dispuesto a tolerar. Un
pequeo error admisible requerir una muestra grande, y un error grande de esa
clase aceptara el uso de una muestra menor.
El tercer factor al determinar el tamao de una muestra es la desviacin estndar
de la poblacin. Si est dispersa ampliamente, se requiere una muestra grande. Por
otra parte, si la poblacin est concentrada (es homognea), el tamao requerido
ser menor.
METODOS Y DISTRIBUCION DE MUESTREO:

Dado que el objetivo en la inferencia estadstica es determinar algo acerca de
una poblacin con base en una muestra.
Pero no cualquier muestra, sino una muestra probabilstica. De la muestra
obtenemos resultados, para ello aplico mtodos basados en la teora de
probabilidades. Puedo aplicar esos resultados a la poblacin, siempre acompaado
con un grado de confianza, con una probabilidad de que ocurra, con un nivel de
incertidumbre.
Lo exacto es lo que obtengo con la muestra, puedo decir que en la poblacin ocurre
con una probabilidad o nivel de confianza. Solo puedo tener certeza si observo el
total de la poblacin.
La poblacin es el grupo completo de individuos u objetos en estudio, una muestra
es una parte o subgrupo de esa poblacin.
Analizamos anteriormente los conceptos de probabilidad describiendo las
funciones probabilsticas discretas (binomial, poisson, etc.) y continuas
(normal, exponencial, etc.). Las distribuciones de probabilidad engloban
todos los resultados posibles de un experimento y la probabilidad asociada a cada
resultado. Tales distribuciones se usan para evaluar algo que podra ocurrir.
Con el estudio del muestreo, vimos que una muestra es un medio utilizado para
inferir algo acerca de una poblacin mediante la seleccin de una parte de la
misma. Analizamos mtodos para escoger una muestra de una poblacin. Despus
se elaborara una distribucin de las medias muestrales para comprender la forma
en que tales valores medios tienden a agruparse alrededor de la media poblacional
y porque esta distribucin se aproxima a la distribucin normal.
Se establecen los intervalos de confianza, que definen una gama de los valores
dentro de la cual ocurrir, probablemente, el valor de la poblacin. Se definen
formulas que determinaran el numero de observaciones necesarias para diferentes
situaciones de muestreo.
El parmetro es el valor que estamos buscando de la poblacin, no lo conozco. Con
los datos de la muestra encuentro un resultado que estima el valor del parmetro,
este es el estimador.
Poisson:
En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin

de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que
ocurra un determinado nmero de eventos durante cierto periodo de tiempo.
La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos
fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un rea
determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio.
Ejemplos de estos eventos que pueden ser modelados por la distribucin de Poisson incluyen:
El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente distantes
de los semforos) durante un periodo definido de tiempo.
El nmero de errores de ortografa que uno comete al escribir una nica pgina.
Ejemplo:
Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, para obtener la
probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas
usamos la distribucin de Poisson. En este caso concreto, k es 5 y, , el valor esperado de libros
defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es
Este problema tambin podra resolverse recurriendo a una distribucin binomial de parmetros
k = 5, n = 400 y =0,02.
Binomial:
En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que mide el nmero
de xitos en una secuencia de n ensayos de Bernoulli independientes entre s, con una probabilidad
fija p de ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotmico, esto es, slo son posibles dos resultados. A uno de estos se denomina xito y tiene una
probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin binomial
el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad
de un determinado nmero de xitos. Para n = 1, la binomial se convierte, de hecho, en una distribucin
de Bernoulli.
Mtodos de muestreo probabilstico

Hay dos tipos de muestras, la muestra probabilstica y la muestra no probabilstica.
Muestra probabilstica: muestra que se selecciona de modo que cada integrante
de la poblacin en estudio tenga una probabilidad conocida (no igual a cero) de ser
incluido en la muestra.
Muestreo aleatorio simple: cada integrante de la poblacin tenga la misma

probabilidad de quedar incluido.
Muestreo aleatorio sistemtico: se ordenan los integrantes en alguna forma,
puede ser alfabticamente u otra forma, se selecciona al azar un punto de
partida y despus se elige para la muestra cada k-esimo elemento de la
poblacin.
Muestreo aleatorio estratificado: se divide en subgrupo la poblacin,
denominados estratos y se selecciona una muestra de cada uno. Despus la
muestra puede ser proporcional o no proporcional. Una muestra proporcional
requiere que el nmero de elementos en cada estrato tenga la misma
proporcin en que se encuentra en la poblacin
Muestreo por conglomeracin: se subdivide un rea extensa en reas menores.
Luego se elige al azar que reas entran en la muestra y se realizan estudios en
ellas.
No probabilstica: no todos los integrantes tienen posibilidad de ser incluidos en

la muestra. en estos casos, los resultados pueden estar sesgados, lo que significa
que tales resultados de la muestra pueden no ser representativos de la poblacin.
Los mtodos de muestreo probabilstico tienen un objetivo similar: permitir que el
azar determine los integrantes que se incluirn en la muestra.
Error de muestreo: diferencia entre un valor estadstico de muestra y su
parmetro de poblacin correspondiente.
Distribucin de muestreo de medias muestrales

Es una distribucin probabilstica que consta de todas las muestras posibles de un
tamao de muestra dado de una poblacin, y la probabilidad de ocurrencia asociada
a cada media muestra.
Ejemplo. Cierta empresa tiene 7 empleados de produccin (consideramos
poblacin). El salario por hora de cada trabajador se presenta en la siguiente tabla.
Empleado
Jos
Manuel
Susana
Roberto
Juan
Aurora
Teodoro
Salario
$7
7
8
8
7
8
9
a. Cul es la media de la poblacin?

b. Cul es la distribucin de muestreo de medias para una muestra de tamao
2?
c. Cul es la media de la distribucin de muestreo?
d. Que observaciones pueden formularse con respecto a la poblacin y a la
distribucin de muestreo?
Respuestas:
a. La media es =
Xi
/ 7 = $ 7,71
b. Se seleccionan todas las muestras posibles de tamao 2 sin reposicin en la

poblacin.
Hay NCn =
7
2
()
2!( 72 )
7!
= 21
Las 21 medias de todas las muestras posibles de tamao 2 que pueden

tomarse a partir de la poblacin, son:
muest
ra
empleados
salari
o
media
jose-samuel
7;7
jose-susana
7;8
7,5
jose-roberto
7;8
7,5
jose-juan
7;7
jose-aurora
7;8
7,5
jose-teodoro
7;9
samuelsusana
7;8
7,5
samuelroberto
7;8
7,5
samuel-juan
7;7
10
samuelaurora
7;8
7,5
7;9
11
samuelteodoro
12
susanaroberto
8;8
13
susana-juan
8;7
7,5
14
susanaaurora
8;8
15
susanateodoro
8;9
8,5
16
roberto-juan
8;7
7,5
17
robertoaurora
8;8
18
robertoteodoro
8;9
8,5
19
juan-aurora
7;8
7,5
20
juan-teodoro
7;9
21
aurorateodoro
8;9
8,5
c. La media de todas las medias muestrales es x = xi / 21 = $ 7,71

Distribucin de muestreo de las medias para n=2
media
muestral
cantid probabili
ad
dad
0,1429
7,5
0,4286
0,2857
8,5
0,1429
21
Valores de0.4290.429
poblacin
Distr. De medias muestrales

0.430.29
0.14
0.14
0.143
probabilidad
probabilidad
salarios por hora
7.5
8.5
medias muestrales
La media de la poblacin es igual al valor medio de las medias

muestrales.
Las medias muestrales se aproximan a una distribucin normal.
d. Pueden hacerse las siguientes observaciones:
La media de las medias muestrales ($7,71) es igual a la media
poblacional ($7,71).
La dispersin en la distribucin de las medias muestrales (0,4518) es
menor que la que corresponde a los valores de la poblacin (0,70). Las
medias muestrales varan de $7 a $ 8,5, y los valores de la poblacin
van de $ 7 a $ 9.
La forma de la distribucin de muestreo de las medias muestrales, y la
forma de la distribucin de frecuencias de los valores de la poblacin,
son diferentes.
La primera tiende a ser acampanada y se aproxima en su aspecto al de
la distribucin probabilstica normal.
Pruebas de Hipotesis
Ya vimos el modo en que podemos seleccionar una muestra al azar, y a partir de
ella, calcular el valor de un parmetro poblacional. Es decir, calculamos un
parmetro poblacional a partir de un valor estadstico muestral. Adems podemos
hallar un intervalo de confianza, dentro del cual se espera localizar el valor
poblacional.
En lugar de desarrollar una variedad de valores dentro del cual se espera que
ocurra el parmetro poblacional, se lleva a cabo una prueba de hiptesis.
Primero veremos que se entiende por hiptesis y que por pruebas de hiptesis.
Despus se describen los pasos a seguir para probar una hiptesis. Se realiza un
ensayo de hiptesis:
1. Comparando una media muestral con un valor hipottico.
2. Comparando dos medias muestrales para determinar si son iguales.
3. Analizaremos errores estadsticos posibles en las pruebas de hiptesis.
Que es una hiptesis?

Es un enunciado acerca de una poblacin. Luego se utilizan datos para verificar la
racionalidad del enunciado.
En la mayora de los casos la poblacin es tan grande que por diversas razones no
sera factible estudiar todos los elementos, objetos o personas en la poblacin.
Hiptesis: enunciado acerca de una poblacin elaborado con el propsito de poner

a prueba.
Que es una prueba de hiptesis?
La prueba de hiptesis principia con una afirmacin o supuesto, acerca de un
parmetro de poblacin, como la media poblacional.
Prueba de hiptesis: procedimiento basado en la evidencia muestral y en la
teora de probabilidad que se emplea para determinar si la hiptesis es un
enunciado razonable.
Ejemplo: una hiptesis podra ser la comisin mensual media de vendedores es de
$2000. Como no es posible entrevistar a todos los vendedores para establecer que
la media en realidad sea $2000. El costo de localizar e interrogar a cada vendedor
seria exorbitante. Para probar la validez de la afirmacin (=$2000), debe
seleccionarse una muestra de la poblacin, calcular valores estadsticos muestrales
y con base en determinadas reglas de decisin, aceptar o rechazar la hiptesis.
Una media muestral de $1000 provocara el rechazo de la hiptesis. Sin embargo
una media muestral de $1995. Se aproxima lo suficiente a $2000? Para aceptar el
supuesto de que la media poblacional vale $2000. Puede atribuirse la diferencia de
$5 entre las dos medias a error de muestreo, o esa diferencia es significativa
estadsticamente?
Procedimiento de 5 pasos para probar una hiptesis
Paso 1: plantear la hiptesis nula H0 y la hiptesis alternativa H1
El primer paso es plantear la hiptesis que ha de ser probada. Se la denomina

hiptesis nula, H0, el subndice cero indica no hay diferencia. Se plantea con el
objetivo de probar. Podemos rechazarla o aceptarla. Tal hiptesis es una afirmacin
que se aceptara si los datos muestrales no pueden proporcionar evidencia
convincente de que es falsa.
La hiptesis nula se acepta con base en datos muestrales, no es posible afirmar que
tal hiptesis es verdadera. Aceptarla no prueba que H 0 se cumple, sino ms bien
significa que no se pudo refutar H 0. Para probar sin duda alguna que la hiptesis
nula es verdadera, el parmetro poblacional debe ser conocido.
La hiptesis nula principia afirmando que: no hay una diferencia significativa
entre.
Hiptesis nula: afirmacin (o enunciado) acerca del valor de un parmetro
poblacional
La hiptesis alternativa describe lo que se considerara si se rechaza la hiptesis
nula. Se designa por H1. Con frecuencia se denomina tambin como la hiptesis de
investigacin ser aceptada si los datos muestrales proporcionan evidencias
estadsticas suficientes de que la hiptesis nula es falsa.
Hiptesis alternativa: afirmacin que se aceptara si los datos muestrales
proporcionan amplia evidencia de que la hiptesis nula es falsa.
Paso 2: seleccionar un nivel de significacin o riesgo.

Nivel de significancia: probabilidad de rechazar la hiptesis nula cuando es
verdadera.
Error de tipo I (): rechazar la hiptesis nula, H0, cuando en realidad es
verdadera.
Error de tipo II (): aceptar la hiptesis nula cuando en realidad es falsa.
investigador
Hiptesis nula
Se acepta H0
H0 es verdadera
Decisin correcta
H1 es falsa
Error de tipo II
Paso 3: calcular el valor estadstico de prueba.
Se rechaza H1
Error de tipo I
Decisin correcta
Existen muchos valores estadsticos de prueba. Usaremos el valor z.

Existen otros que se refieren a pruebas de hiptesis denominadas, t, F y X 2 (chi
cuadrada).
Valor estadstico de prueba: valor obtenido a partir de la informacin muestral,
que se utiliza para determinar si se rechaza la hiptesis nula.
Z de distribucin como valor estadstico de prueba z= (X- ) / (/ n
El valor z se basa en la distribucin muestral de x, que se distribuye de manera
normal cuando la muestra es razonablemente grande con una media igual a , y
una desviacin estndar que es igual a / n . De esta manera se puede

determinar si la diferencia entre la media muestral y la poblacional es
estadsticamente significativa encontrando el nmero de desviaciones estndares
que la media esta a partir de .
Paso 4: formular la regla de decisin.
Establece las condiciones cuando se rechaza H 0. La regin de rechazo define la
ubicacin de todos los valores que son demasiados grandes o demasiados
pequeos, por lo que es muy remota la probabilidad de que ocurran segn una
hiptesis nula verdadera.
Valor critico:
numero que es el punto divisorio entre la regin de aceptacin y

la regin de rechazo de la hiptesis nula.
Paso 5: tomar una decisin.
El ltimo paso es la toma de la decisin de rechazar o no la hiptesis nula. Con base
en informacin muestral se calcula el z, y con el nivel de significancia se toma la
decisin (valor crtico).
Pruebas para la media de la poblacin: muestra grande y se desconoce la
desviacin poblacional.
En la mayora de los casos es poco probable que se conozca la desviacin
poblacional. As que debe basarse en estudios previos, o se estima utilizando la
desviacin de la muestra, s. si el tamao de la muestra, n, es mayor que 30 se
puede sustituir por por s.
Ejemplo: una cadena de tiendas tiene su propia tarjeta de crdito. El gerente desea
averiguar si el saldo vencido medio mensual es mayor que 400$. El nivel de
significancia se fija en 5%.
Una revisin aleatoria de 172 saldos vencidos revelo que la media muestral es
407$, y la desviacin de la muestra es 38$. Debera concluir el gerente de crditos
que la media poblacin es mayor que 400$ o bien es razonable suponer que la
diferencia de 7$ se debe al azar.
Solucin:
H0: 400$
H1: 400$
Dado que tenemos una direccin, la prueba es a una cola. El valor critico 1,645. El
valor calculado de z es 2,42
Z= 407 400 = 2,42
38/
172
Dado que el valor estadstico de prueba, 2,42 es mayor que el valor critico, 1,645,
se rechaza la H0. El gerente de credito puede concluir que el saldo vencido es mayor
que 400$.
Prueba de hiptesis: dos medias poblacionales

Una prueba que compara dos medias poblacionales es caracterstica de un
problema industrial en la prctica.
Se utilizan bloques de concreto en los cimientos de edificios. Las especificaciones
indican que la media aritmtica mnima de las resistencias a la compresin de los
bloques debe ser igual a 1000 libras por pulgada cuadrada (psi).
Si dos compaas envan muestras de bloques que tienen tales resistencias
superiores a la mnima, entonces las especificaciones estipulan que debe tomarse
una de dos acciones:
1. Se aplica una prueba estadstica a los resultados muestrales, que indica que
ambas muestras pueden venir de poblaciones iguales o idnticas, entonces el
contrato para la adquisicin de divide por igual.
2. Si los valores estadsticos de muestra sealan que las medias no son iguales,
la compaa que presente los bloques con mayor resistencia a la compresin,
obtendr el contrato.
Una obra en construccin requiere un gran nmero de bloques de concreto. Dos
abastecedores, Stanblock Corporation e Hicomprensive Company, has surtido de
ese material a la constructora anteriormente.
Planteamos las hiptesis nula y alternativa
H 0 : 1 = 2
H 1 : 1 2
Como no especificamos una direccin, se usara una prueba a dos colas.
Nivel de significacin: 99% (es decir, la probabilidad de cometer un error de tipo I,

vale 0,01).
Prueba estadstica: se seleccionaran aleatoriamente cuando menos 30 bloques (n1)
de Stanblock y por lo menos 30 de Hipercompresive (n2). Se supone que las dos
poblaciones no estn relacionadas, supuesto de independencia.
La teora dice: si un numero grande de muestras aleatorias independientes se
seleccionan de las dos poblaciones, la distribucin de las diferencias entre las dos
medias muestrales, dividida entre el error estndar de la diferencia entre las los
medias se aproxima a una distribucin normal estndar.
Z=
x1
x2
s 12 s 22
+
n1 n2
Se selecciono aleatoriamente un total de 81 bloques de la produccin de Stanblock

y 64 bloques de la empresa Hicompresive.
Stanblock
X1 = 1070 psi
n1 = 81
s1 = 63 psi
El valor estadstico resulta ser 1,50. El
Hicompresive
X2 = 1055 psi
n2 = 64
s2 = 57 psi
valor critico (0,01) es de 2,58.
Por lo tanto no es posible rechazar la hiptesis de que es la misma la resistencia

media a la compresin de los bloques, la decisin final el dividir el contrato entre los
dos proveedores.
Prueba de hiptesis: muestras pequeas

Anteriormente utilizamos la distribucin normal estndar como valor estadstico de
prueba. Para emplear dicha distribucin se debe conocer la desviacin estndar
poblacional, o tener una muestra grande (al menos 30 observaciones). Sin
embargo, en muchos casos se desconoce, , y el nmero de observaciones en la
muestra es por lo menos 30. En ese caso se puede utilizar la desviacin estndar
muestral, s como un estimado de , pero no se puede emplear la distribucin z
como valor estadstico de prueba. La t de Student (o distribucin t como se
denomina comnmente) sirve como tal valor estadstico de prueba. Cuando se
utiliza la distribucin t, se supone que la poblacin est distribuida normalmente.
Caractersticas de la distribucin t de Student
Fue desarrollada por Gossett, a l le interesaba el comportamiento exacto de:
x
s/
Cuando deba usarse s como estimador de . Le preocupaba de discrepancia

entre s y cuando se calculaba s a partir de una muestra muy pequea. La
distribucin t es menos aguda y ms extendida que la distribucin z normal.
Las siguientes caractersticas de la distribucin t, se basan en el supuesto de que la
poblacin de inters es normal, o casi normal.
1. Como la distribucin z, es una distribucin continua.
2. Tambin, como la distribucin z, es acampanada y simtrica.
3. No hay una sola distribucin t, sino una familia de distribuciones t. Todas
tienen la misma media igual a cero, pero sus desviaciones estndares
difieren de acuerdo al tamao de muestra, n. Hay una distribucin t para un
tamao de muestra
20, otra para un tamao de muestra 22, y as
sucesivamente.
4. La distribucin t es ms extendida y menos aguda en el centro que la
distribucin normal estndar. Sin embargo a medida que aumenta el tamao
de muestra, la curva de la distribucin t se aproxima a la de la distribucin
normal estndar.
5. Los valores crticos de t para un nivel de significancia dado son mayores en
magnitud que los valores crticos de z correspondientes. Con un nivel de 0,05
de significancia, el valor critico para la prueba z es 1,645, mientras que para t
es 2,132.
Cul es la importancia del hecho que el valor critico para un nivel de significancia,
sea mayor para muestra pequeas que para muestras grandes?
El intervalo de confianza ser ms amplio que para muestras grandes
aplicando la distribucin z.
La regin de aceptacin de H0 ser ms amplia.
Ser necesario un mayor valor t calculado para rechazar la hiptesis nula.
Es decir, que dado que hay mayor variabilidad en las medias muestrales calculadas
a partir de muestras ms pequeas, se tiene menos confianza en los estimadores
resultantes y son menos adecuados para rechazar la hiptesis nula.
Teoria de los Juegos:

La teora de los juegos es una rama de la economa que estudia las decisiones en
las que para que un individuo tenga xito tiene que tener en cuenta las decisiones
tomadas por el resto de los agentes que intervienen en la situacin. La teora de
juegos como estudio matemtico no se ha utilizado exclusivamente en la economa,
si no gestin, estrategia, psicologa o biologa.
En la teora de juegos no tenemos que preguntarnos porque vamos a hacer,
tenemos que preguntarnos que vamos a hacer teniendo en cuenta lo que pensamos
que habran hecho los dems. Ellos actuaran pensando segn crean que van a ser
nuestras actuaciones. La teora de los juegos ha sido utilizada en muchas decisiones
empresariales, econmicas, polticas o incluso para ganar jugando al pker.
Se adelanta a la respuesta que va a dar el otro, sirve mucho en negociacin.
El dilema del prisionero:
El dilema del prisionero es el ejemplo tpico de la teora de juegos. Supongamos que

detienen a 2 personas por delitos menores que les costaran a cada una 2 aos de
crcel. La polica sabe que han cometido uno peor, pero necesitan pruebas,
supongamos que una declaracin de uno d elos dos. Si ambos delatan al otro por el
delito mayor, iran seis aos a prisin. Si uno delata y el otro no, el delator ira 1 ao
por colaborar y el otro ira 10 por el delito. Teniendo en cuenta que los prisioneros no
pueden comunicarse entre ellos (estn en abitaciones separadas) Qu harian?
PRISIONERO 2
No delatar
Delatar
PRISIONERO
No delatar
(-2,-2)
(-1,-10)
1
Delatar
(-10, -1)
(-6,-6)
Supongamos que somos uno de los prisioneros, no sabemos que har el otro por lo
que el mejor de los casos es delatar al otro independientemente de lo que haga, ya
que en ambas situaciones minimizamos los aos de pena esperados en la crcel. Si
el otro nos delata iremos seis aos en vez de 10 y si no nos delata iremos uno en
vez de 2. Dado que el otro es igual de inteligente que nosotros, lo mas probable es
que llegue a la misma decisin. Al final lo que acaba pasando es que ambos
acaban perdiendo 6 aos entre rejas, mientras que si hubieran cooperado hubieran
sido solo 2.
La situacin alcanzada es un EQUILIBRIO DE NASH, porque ambas partes no
pueden cambiar sino empeorar. Es decir, no se haya la mejor situacin para las
partes.
El encubre
El traiciona
Tu encubres
Maximo beneficio
comun
(-2,-2)
El gana, tu pierdes
(-1,-10)
Tu traicionas
Tu ganas, el pierde
(-10, -1)
Maximo perjuicio
comun
(-6,-6)
EQUILIBRIO DE NASH:
Un concepto que fue desarrollado por el economista Antonie Aguistin Cournot en su
anlisis denominado Oligopolios en 1838, y en el que plantea un modelo
competitivo de varias empresas que compiten por un mismo bien. Y que en el que
cada una de ellas intenta determinar la cantidad optima que deben producir para
maximizar sus ganancias individuales.
El equilibrio de Nash se ha utilizado para regular situaciones de competencia entre
empresas y disear subastas de adjudicaciones pblicas. Una legislacin que tenga
en cuenta el equilibrio de Nash puede evitar oligopolios, por eso en la legislacin
antimonopolios se suele buscar formas de evitar que se pacten precios entre las
partes implicadas.
Probabilidad:
El valor entre 0 y 1 que describe la probabilidad relativa de que ocurra un evento,

por lo tanto si no esta entre 0 y 1 no es probabilidad.
1. Experimento: Proceso que conduce a la ocirrencia de 1 y solamente una de
varias observaciones.
2. Resultado: Lo que resulta especficamente del experimento.
3. Evento: Conjunto de 1 o mas resultados de un experimento.
Enfoques de la probabilidad:
Objetiva o clsica: Se basa en la consideracin de que los resultados de un
experimento son igualmente posibles.
Siendo 1 de varios eventos puede ocurrir se dice que los eventos son mutuamente
excluyentes.
Se exresa esto poruqe la ocurrencia de cualquier evento que ningn otro puede salir
en el mismo momento.
En el experimento de tirar un dado, el evento de un nro. Impar y el evento un nro.
Par son mutuamente excluyentes. A esto se lo lama COHERSITIVAMENTE
EXAUSTIVO.
O sea, un evento tiene que ocurrir si o si.
PROBABILIDAD EMPIRICA:
Se define a la probabilidad en base a las frecuencias relativas. La probabilidad de
que un evento ocurra a largo plazo se determina observando en que fraccin de
tpo. Sucedieron los eventos semejantes en el pasado.
Probabilidad subjetiva:
Si existe para ninguna experiencia enla cual puede basarse una probabilidad
subjetiva. Esto significa evaluar las opiniones disponibles y la otra info subjetiva
para despus estimar o asignar la probabilidad. A esto se lo llama probabilidad
subjetiva.
Diagrama del rbol:
Una representacin grafica muy til para organizar clculos que ahorran varias
etapas. Cada segmento en el rbol es una etapa del problema. Se usa una tabla de
contingencia.
TEOREMA DE BAYES:
Se usa para calcular la probabilidad de algo en base a la evidencia que ya se
dispone.
Muestreos:
Aleatorio simple: Ej. Bolilla, azhar.

Aleatorio Sistemtico:
Estratificado
Conglomeracin
Analisis de Regresion: (Relacion lineal y correlacion)

Analisis de correlacion: Determina que tan intenso es la relacin de variables.
Coheficiente de correlacion (KARL Pearsson): Describe la intensidad de la
relacin entre 2 conjuntos de variables.
Prueba de significancia del coeficiente de correlacion:

Test de hiptesis
Principio de cuadrados minimos:
Tecnica para obtener la ecuacin de regresin minimizando la suma de
los cuadrados de las distancias verticales entre los valores Y
verdaderos y los valores pronosticados de Y.

Estadistica Resumen

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadistica Resumen

Uploaded by

Copyright:

Available Formats

Estadstica

La estadstica se divide en dos grandes reas:

La estadstica descriptiva, se dedica a realizar el estudio sobre la poblacin completa,

1. Determinar el mayor y el menor de todos los datos, hallando as el rango.

Distribuciones de frecuencias relativas

Si se sustituyen las frecuencias de la tabla por las correspondientes frecuencias

Distribuciones de frecuencias acumuladas y ojivas

Tipos de curvas de frecuencias

1. Las curvas de frecuencias simtricas o en forma de campana, se caracterizan

3. En una curva en forma de J o de J invertida, hay un mximo en un extremo.

MEDIA MEDIANA MODA.

Media aritmtica para datos agrupados

Propiedades de la media aritmtica

1. La suma de las desviaciones de todas las puntuaciones de una distribucin

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica

3. Si a todos los valores de la variable se les suma un mismo nmero, la media

Observaciones sobre la media aritmtica

Clculo de la mediana para datos agrupados

Porque ver la dispersin?

Ejemplo 1. Edades de de un grupo, varan de 18 a 85 aos. Esta amplia dispersin

Ejemplo 2. Comparar cuan dispersas estn dos o ms distribuciones. Si la media de

Puede concluirse que:

Varianza y desviacin estndar: se basan en desviaciones con

Varianza: la media aritmtica de las desviaciones cuadrticas con respecto

Desviacin estndar: la raz cuadrada de la varianza.

I--------- 68% --------I

2. Aproximadamente, entre cuales dos cantidades se halla el 95% de los

3. Aproximadamente, entre cuales dos cantidades estn todos los gastos?

Ejemplo: un estudio de las calificaciones obtenidas en un curso de administracin y

Para las calificaciones. CV = 40 *100 = 20%

Otras medidas de dispersin

Sea Lp la ubicacin del centil deseado. Si queremos obtener el centil o percentil 33

simplemente desvo normal. El valor z es la distancia a partir de la media, medida

reas bajo la curva normal: usamos la regla emprica.

diferencia entre un valor estadstico de muestra y su

entre un valor estadstico de muestra y un parmetro de poblacin se denomina

Teorema de lmite central:

si se seleccionan de cualquier poblacin

Estimaciones puntuales e intervalos de confianza

Error estndar de la media muestral:

Intervalo de confianza de 95% para la media: X1,96 *s /

Seleccin de tamao de muestra adecuado

METODOS Y DISTRIBUCION DE MUESTREO:

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin

Mtodos de muestreo probabilstico

Muestreo aleatorio simple: cada integrante de la poblacin tenga la misma

No probabilstica: no todos los integrantes tienen posibilidad de ser incluidos en

Distribucin de muestreo de medias muestrales

a. Cul es la media de la poblacin?

b. Se seleccionan todas las muestras posibles de tamao 2 sin reposicin en la

Las 21 medias de todas las muestras posibles de tamao 2 que pueden

c. La media de todas las medias muestrales es x = xi / 21 = $ 7,71

Distr. De medias muestrales

salarios por hora

La media de la poblacin es igual al valor medio de las medias

Que es una hiptesis?

Hiptesis: enunciado acerca de una poblacin elaborado con el propsito de poner

Paso 1: plantear la hiptesis nula H0 y la hiptesis alternativa H1

El primer paso es plantear la hiptesis que ha de ser probada. Se la denomina

Paso 2: seleccionar un nivel de significacin o riesgo.

Existen muchos valores estadsticos de prueba. Usaremos el valor z.

una desviacin estndar que es igual a / n . De esta manera se puede

numero que es el punto divisorio entre la regin de aceptacin y