You are on page 1of 21

Instituto Tecnolgico de Villahermosa

Ing. En Gestin Empresarial Materia: Estadstica Inferencial I Docente: Ing. Braulio Alberto Mateos Gallegos Semestre: 4to Alumna: Flor de Mara Snchez Crdova Fecha: 13-03-14

Unidad #2

ndice
INTRODUCCION ............................................................................................................................................. 3 2.1 Concepto bsico de inferencia estadstica ........................................................................................... 4 2.2 Distribuciones de muestreo ..................................................................................................................... 5 2.3 Estimacin puntual.................................................................................................................................... 7 2.4 Estimacin de intervalos .......................................................................................................................... 8 2.5 Intervalo de confianza para medias .....................................................................................................10 Intervalo de confianza para la media de una poblacin ..................................................................10 Intervalo de confianza para una proporcin ......................................................................................11 2.6 Intervalo de confianza para la diferencia de medias .........................................................................12 2.7 Intervalo de confianza para proporciones ...........................................................................................14 2.8 Intervalo de confianza para diferencias de proporciones .................................................................15 2.9 Intervalo de confianza para varianzas .................................................................................................16 2.10 Intervalo de confianza para razones de dos varianzas ..................................................................18 CONCLUSION ...............................................................................................................................................20 BIBLIOGRAFIAS .......................................................................................................................................21

INTRODUCCION
La estadstica para su estudio se divide en estadstica descriptiva y estadstica inferencial. Los mtodos bsicos de la estadstica inferencial son la estimacin y el contraste de hiptesis, que juegan un papel fundamental en la investigacin. Por tanto, algunos de los objetivos que se persiguen en este tema son: Calcular los parmetros de la distribucin de medias o proporciones mustrales de tamao n, extradas de una poblacin de media y varianza conocidas. Estimar la media o la proporcin de una poblacin a partir de la media o proporcin maestral. Utilizar distintos tamaos mustralos para controlar la confianza y el error admitido. Contrastar los resultados obtenidos a partir de muestras. Visualizar grficamente, mediante las respectivas curvas normales, las estimaciones realizadas. En la mayora de las investigaciones resulta imposible estudiar a todos y cada uno de los individuos de la poblacin ya sea por el coste que supondra, o por la imposibilidad de acceder a ello. Mediante la tcnica inferencial obtendremos conclusiones para una poblacin no observada en su totalidad, a partir de estimaciones o resmenes numricos efectuados sobre la base informativa extrada de una muestra de dicha poblacin

2.1 Concepto bsico de inferencia estadstica


Puede definirse la Inferencia Estadstica como El conjunto de mtodos estadsticos que permiten deducir (inferir) como se distribuye la poblacin en estudio o las relaciones estocsticas entre varias variables de inters a partir de la informacin que proporciona una muestra. Para que un mtodo de inferencia estadstica proporcione buenos resultados debe de: Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente validada. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao suficiente. La Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

2.2 Distribuciones de muestreo


Muestreo: operacin por la que se extrae de la poblacin los elementos que van a formar parte de la muestra. Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales. Con el anlisis de las distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como la media, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Distribucin Muestral de Medias Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la media muestral x para cada muestra; la coleccin de todas estas medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

El Teorema del Lmite Central tambin nos indica que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao pero provenientes de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la frmula de la distribucin normal con

s, es equivalente al error estndar de la media, entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

Error Estndar El error estndar indica la propagacin de las mediciones dentro muestra de datos. Es la desviacin estndar dividida por la raz del tamao de la muestra de datos. La muestra puede incluir de una

cuadrada datos de

las mediciones cientficas, resultados de exmenes, las temperaturas o una serie de nmeros al azar. La desviacin estndar indica la desviacin de los valores de la muestra a partir de la media de la muestra. El error estndar es inversamente proporcional al tamao de la muestra - cuanto ms grande la muestra, menor ser el error estndar.

2.3 Estimacin puntual


Una estimacin es puntual cuando se usa un solo valor extrado de la muestra para estimar el parmetro desconocido de la poblacin. Al valor usado se le llama estimador. La media de la poblacin se puede estimar puntualmente mediante la media de la muestra:

La proporcin de la poblacin se puede estimar puntualmente mediante la proporcin de la muestra:

La desviacin tpica de la poblacin se puede estimar puntualmente mediante la desviacin tpica de la muestra, aunque hay mejores estimadores:

2.4 Estimacin de intervalos


Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes conceptos: Intervalo de confianza El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial. Variabilidad del Parmetro Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota . Error de la estimacin Es una medida de su precisin que se corresponde con la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E = (2 - 1)/2. Lmite de Confianza Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y 0,01 respectivamente. Valor

Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (10095)/100 = 0,05 Valor crtico Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a su derecha un rea igual a /2, siendo 1 - el nivel de confianza. Normalmente los valores crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -1,28. Entonces Z/2 = 1,64. Si la media o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-)/ para su clculo. Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza segn las definiciones dadas. Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es decir, un mayor nivel de confianza.

2.5 Intervalo de confianza para medias


Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden

tomar muestras de

elementos. Cada una de estas muestras tiene a su vez una media

( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:3 Pero adems, si el tamao de las muestras es lo suficientemente grande, 4 la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin: . Esto se representa

como

sigue:

Si estandarizamos,

se

sigue

que: En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una distribucin normal). Se desea obtener una expresin tal que En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar un trmino opuesto). Para ello se necesita calcular el punto o, mejor dicho, su versin . (debido a que es el error que se cometer,

estandarizada

o valor crtico junto con su "opuesto en la distribucin"

10

Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:

As:

Haciendo operaciones es posible despejar

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral

el

producto del valor crtico Si no se conoce

por el error estndar

y n es grande (habitualmente se toma n 30):5

, donde s es la desviacin tpica de una muestra. Aproximaciones para el valor para y 2,576 para para los niveles de confianza estndar son 1,96 .6

Intervalo de confianza para una proporcin El intervalo de confianza para estimar una proporcin p, conocida una proporcin muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:

11

En la demostracin de estas frmulas estn involucrados el Teorema Central del Lmite y la aproximacin de una binomial por una normal.

2.6 Intervalo de confianza para la diferencia de medias


*Intervalo de confianza para la diferencia de medias de dos distribuciones normales, varianzas desconocidas pero iguales Si s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamao

n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100( por ciento para la diferencia entre medias es: )

En donde:

Es el estimador combinado de la desviacin estndar comn de la poblacin con n 1+n2 2 grados de libertad. Ejemplos: 1. Un artculo publicado dio a conocer los resultados de un anlisis del peso de calcio en cemento estndar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratacin del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estndar, se encontr que el peso promedio de calcio es de 90 con una desviacin estndar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviacin estndar de 4. Supngase que el porcentaje de peso de calcio est

12

distribuido de manera normal. Encuntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supngase que las dos poblaciones normales tienen la misma desviacin estndar. Solucin: El estimador combinado de la desviacin estndar es:

Al calcularle raz cuadrada a este valor nos queda que sp = 4.41

Expresin que se reduce a 0.72

1-

6.72

Ntese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede concluirse la existencia de una diferencia entre las medias.

13

2.7 Intervalo de confianza para proporciones


Dada una variable aleatoria con distribucin Binomial B(n, p), el objetivo es la construccin de un intervalo de confianza para el parmetro p, basada en una observacin de la variable que ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el nmero de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones de independencia. Existen dos alternativas a la hora de construir un intervalo de confianza para p:

Considerar la aproximacin asinttica de la distribucin Binomial en la distribucin Normal.

Utilizar un mtodo exacto.

Aproximacin asinttica Tiene la ventaja de la simplicidad en la expresin y en los clculos, y es la ms referenciada en la mayora de textos de estadstica. Se basa en la aproximacin que, trasladada a la frecuencia relativa, resulta Tomando como estadstico pivote que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asinttico: Donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha una probabilidad de /2 para un intervalo de confianza de (1 ) 100 %. Las condiciones generalmente aceptadas para considerar vlida la aproximacin asinttica anterior son:

14

2.8 Intervalo de confianza para diferencias de proporciones


*Intervalo de confianza para la diferencia de dos proporciones con datos independientes

Los lmites para el intervalo de una diferencia de proporciones correspondientes a dos muestras independientes son:

Donde el smbolo z/2 es el mismo valor crtico que antes, prob(Z > z/2) = /2, y corresponde a un intervalo de confianza 1 %. Este intervalo puede utilizarse de manera alternativa al contraste de hiptesis para decidir (con nivel de significacin %) si hay igualdad de los dos grupos. Se decidir por la igualdad de los grupos si el valor 0 queda incluido en cualquier posicin en el intervalo. Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable obtener el intervalo de confianza de la diferencia de medias, si ste ha resultado significativo, puesto que ayudar a interpretar si existe significacin aplicada adems de la estadstica. Si se dispone de alguna informacin previa y slo quiere calcularse alguno de los dos intervalos unilaterales, bastar sustituir z/2 por z y descartar el lmite superior o inferior del intervalo segn el caso. Por ejemplo, el intervalo unilateral derecho corresponde a:

15

2.9 Intervalo de confianza para varianzas


De una poblacin con distribucin normal con media m y varianza s 2 se obtiene una muestra aleatoria de tamao n. Para obtener el intervalo de confianza para la varianza ( s 2 ) se parte de la expresin (1.4):

Se divide por ns2 :

Se invierte:

Reescribiendo:

(2.6) Donde y y pertenecen a una distribucin chi-cuadrado con (n-1) grado de libertad, son diferentes y < .

por lo tanto, Ejemplo

La varianza de la resistencia a la rotura de 30 cables probados fu de 32.000 lbs 2. Halle un intervalo de confianza del 90 por ciento, para la varianza de la resistencia de todos los cables de sta marca.

16

Solucin Se utiliza la expresin 2.6. Los valores de

pertenecen a una

distribucin chi-cuadrado con 29 grados de libertad. Como puede observarse en la figura 2.3 el rea que hay por debajo de Z a /2 es 0,05, por lo tanto por debajo de es 0,95, por lo tanto =42,56 =17,71 y el rea que hay

Figura 2.3 Percentiles de la distribucin chi-cuadrado Reemplazando en la expresin 2.6 se obtiene:

Por razones de utilidad se halla el intervalo de confianza para la desviacin estndar, sacando la raz cuadrada de los lmites, por lo tanto:

Interpretacin El promedio de variacin o de dispersin de la rotura de los cables de dicha marca, est entre 150 y 233 lbs . con una confiabilidad del 90 por ciento.

17

2.10 Intervalo de confianza para razones de dos varianzas


Cuando se desea hacer inferencias acerca de las varianzas de dos poblaciones, es necesario colocarlas en forma de razn. Si las varianzas son iguales, entonces el cociente es igual a 1, en caso de que sean diferentes, su cociente tambin se alejar de 1. Como por lo general no se conocen las varianzas de las poblaciones de inters, cualquier comparacin que se desee, tendr que estar basada en las varianzas muestrales y , las cuales debern ser de muestras independientes y extradas de poblaciones normales.

Entonces, distribucin

es

un

estimador

insesgado

de

tendr

una

con n1 - 1 grados de libertad.

De

manera

similar

ser

un

estimador

de

tendr

una

distribucin

con n2 - 1 grados de libertad.

La razn de estos dos estimadores: sigue una distribucin F de Fisher, o simplemente distribucin F que posee las siguientes propiedades: 1. La distribucin F depende de dos valores de grados de libertad, uno correspondiente al numerador y otro al denominador, a los cuales nos referiremos como grados de libertad del numerador (glnum= n1 = n1 1) y grados de libertad del denominador (glden= n2 = n2 1). 2. La densidad de la variable F viene dada por:

3. 4. 5.

La distribucin F para cada par de valores de grados de libertad n1 y n2. Hay una distribucin F para cada par de valores de grados de libertad. Como la distribucin , una distribucin F es positivamente asimtrica, pero su asimetra se reduce con los aumentos de los grados de libertad. Si X tiene densidad , entonces tendr una distribucin , esto es

6.

18

7.

La distribucin muestral usada para hacer inferencias entre dos varianzas es la F de Fisher:

con n1 - 1 y n2 - 1 grados de libertad en el numerador y denominador, respectivamente.

El intervalo de confianza para el cociente de varianzas est dado por:

Despejando

se tiene:

NOTA: El valor de cola izquierda de la distribucin F de Fisher est dado por: , donde n1 = n1 - 1 y n2 = n2 - 1

19

CONCLUSION

En definitiva, como vimos en el desarrollo de la unidad, la idea consta de que , a partir de una poblacin se extrae una muestra por algunos de los mtodos existentes, con la que se generan datos numricos que se van a utilizar para generar estadsticos con los que realizar estimaciones o contrastes poblacionales. Existen dos formas de estimar parmetros: la estimacin puntual y la estimacin por intervalo de confianza. En la primera se busca, con base en los datos mustrales, un nico valor estimado para el parmetro. Para la segunda, se determina un intervalo dentro del cual se encuentra el valor del parmetro, con una probabilidad determinada. El estudio de la estadstica inferencial es de suma importancia, ya que se encuentra presente en muchas de las actividades de nuestra vida cotidiana.

20

BIBLIOGRAFIAS
http://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.html http://www.udc.es/dep/mate/estadistica2/sec1_2.html http://web.usal.es/~modesto/pdf/A4.-%20Teoria%20del%20muestreo.pdf http://es.wikipedia.org/wiki/Intervalo_de_confianza http://www.ematematicas.net/estadistica/muestreo/?tipo=intervalos http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t11.htm http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo11/B0C11m1t14.htm http://www.uoc.edu/in3/e-math/docs/Estimacion_IC.pdf

21

You might also like