You are on page 1of 16

INDICE

2.1
2.1 POBLACION
2.2 MUESTRA
2.3
HISTOGRAMAS Y POLIGONOS DE FRECUENCIA
2.4 MEDIANA
2.5 MEDIA
2.6 MODA
2.7 DESVIACION MEDIA
2.8
DESVIACION ESTANDAR
2.9
COVARIANZA
2.10
COEFICIENTE DE CORRELACION
2.11
COEFICIENTE DE VARIACION
2.12
COEFICIENTE DE ASIMETRIA
2.13
COEFICIENTE DE CURTOSIS
2.14
DESVIACION ESTANDAR MUESTRAL
2.15
SESGO
III.- MATERIALES
IV.- METODOLOGIA
4.1
DISTRIBUCION DE FRECUENCIAS
4.2
CUADRO DE DISTRIBUCION DE FRECUENCIAS
4.3
CALCULO DE MEDIDAS DESCRIPTIVAS
4.4
CALCULO DE MEDIA POBLACIONAL
V.- CALCULOS Y RESULTADOS
VI.- DISCUSIN E INTERPRETACION
VII.- CONCLUSIONES
VIII.- RECOMENDACIONES
IX.- BIBLIOGRAFIA

II.- MARCO TERICO.

2.1. DESVIACIN ESTNDAR MUESTRAL.


La varianza muestral est medida en el cuadrado de las unidades observadas al hacer las
mediciones contenidas en la muestra. Para devolverse a una estadstica que use las mismas
unidades que las observaciones, es necesario calcular su raz cuadrada.

Lo anterior conduce a la definicin de la estadstica denominada


'desviacin estndar muestral', que no es otra cosa que la raz cuadrada de
la varianza.
Para una muestra de tamao n, x1, ..., xn, se tiene que:

El uso de esta estadstica es recomendado en aquellos conjuntos de datos que ofrecen


cierto grado de simetra respecto de su centro. En estos casos, habitualmente tiene sentido medir
discrepancias de un valor con el centro de los datos usando mltiplos de la desviacin estndar.

A modo de ejemplo, se puede decir que un valor est bastante alejado del
centro de los datos si su distancia de l supera dos desviaciones estndar.
Apoyndose en la idea anterior, la desviacin estndar puede ser usada para
determinar valores que se encuentran 'cerca' del centro. Este uso va ms all
de la simple descripcin, en otros mbitos de Estadstica es usada para
tomar decisiones respecto de la poblacin de la que fue extrada la muestra.
2.2. SESGO
Segn el diccionario un sesgo es "una inclinacin parcial de la mente". En nuestro
mbito, la palabra sesgo sirve para definir la tendencia sistemtica de ciertos diseos de ensayos
clnicos para producir de forma consistente resultados mejores o peores que otros diseos.

Skewness o sesgo: Medida estadstica que describe la simetra de la


distribucin alrededor de un promedio. Si el sesgo es igual a cero, la
distribucin es simtrica; si el sesgo es positivo la distribucin una tendr
una cola asimtrica extendida hacia los valores positivos. Un sesgo
negativo indica una distribucin con una cola asimtrica extendida hacia los
valores negativos.

DISTRIBUCIN NORMAL o campana de Gauss-Laplace


Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre
indica su extendida utilizacin, justificada por la frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene
forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor
de p y valores de n cada vez mayores, se ve que sus polgonos de frecuencias se aproximan a
una curva en "forma de campana".
En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas
variables asociadas a fenmenos naturales que siguen el modelo de la normal

Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una especie,


p.ejm. tallas, pesos, envergaduras, dimetros, permetros,...

Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de


una misma cantidad de abono.

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo
de individuos, puntuaciones de examen.

Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un


medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadsticos muestrales, por ejemplo : la media.

Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...

Y en general cualquier caracterstica que se obtenga como suma de muchos factores.


FUNCIN DE DENSIDAD

Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la funcin de


densidad que corresponde a tales distribuciones viene dado por la frmula

Representacin grfica de esta funcin de densidad

La distribucin normal queda definida por dos parmetros, su media y su desviacin tpica y la
representamos as

FUNCIN DE DISTRIBUCIN

Puede tomar cualquier valor (-, + )

Son ms probables los valores cercanos a uno central que llamamos media .

Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual forma


a derecha e izquierda (es simtrica).

Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma ms


o menos rpida dependiendo de un parmetro , que es la desviacin tpica.

F(x) es el rea sombreada de esta grfica

TIPIFICACIN

Por tanto su funcin de densidad es

y su funcin de distribucin es

siendo la representacin grfica de esta funcin

a la variable Z se la denomina variable tipificada de X, y a la curva de su funcin de densidad


curva normal tipificada.
Caracterstica de la distribucin normal tipificada (reducida, estndar)

No depende de ningn parmetro

Su media es 0, su varianza es 1 y su desviacin tpica es 1.

La curva f(x) es simtrica respecto del eje OY

Tiene un mximo en este eje

Tiene dos puntos de inflexin en z =1 y z = -1

Aproximacin de la Binomial por la Normal (Teorema de De Moivre) :


Demostr que bajo determinadas condiciones (para n grande y tanto p como q no estn
prximos a cero) la distribucin Binomial B(n, p) se puede aproximar mediante una
distribucin normal

Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto ms prximo sea p a
0.5, tanto mejor ser la aproximacin realizada. Es decir, basta con que se verifique

gracias a esta aproximacin es fcil hallar probabilidades binomiales, que para valores grandes
de n resulten muy laboriosos de calcular.
Hay que tener en cuenta que para realizar correctamente esta transformacin de una variable
discreta (binomial) en una variable continua (normal) es necesario hacer una correccin de
continuidad.

MANEJO DE TABLAS. CASOS MS FRECUENTES.

La distribucin de la variable Z se encuentra tabulada

Aplicaciones de la distribucin Normal


La mayoria de las variables aleatorias que se presentan en los estudios relacionados con las
ciencias sociales, fsicas y biolgicas, por ejemplo, el peso de nios recin nacidos, talla de
jvenes de 18 aos en una determinada regin, son continuas y se distribuyen segn una funcin
de densidad , que tiene la siguiente expresin analtica :

Donde es la media de la variable aleatoria y es su desviacin tpica. Este tipo de variables se


dice que se distribuye normalmente. El rea bajo la funcin de densidad es 1. La funcin de
densidad, en el caso de la distribucin Normal, tiene forma de campana:

Para una variable aleatoria X, que se distribuye normalmente con media : y desviacin tpica :
, la probabilidad de que la variable X est comprendida entre los valores a y b es el rea teida
de rojo en la siguiente figura :

Y que analticamente se puede calcular as:

Como el clculo de esta integral es laborioso, para calcular el rea se realiza el siguiente cambio
de variable:

Cambio que origina una distribucin normal stndar de media = 0 y desviacin tpica = 1
cuya funcin de densidad es :

Y cuyos valores se tabulan:

INFERENCIA ESTADISTICA

La Inferencia Estadstica comprende los mtodos que son usados para sacar
conclusiones de la poblacin en base a una muestra tomada de ella. Incluye los mtodos
de estimacin de parmetros y las pruebas de hiptesis.
La Estimacin de parmetros comprende a su vez la Estimacin Puntual, en
donde se estudian los diversos mtodos de encontrar estimadores y las propiedades
ptimas que deben tener stos, y la Estimacin por Intervalos de Confianza, en donde
se estima un parmetro usando un intervalo centrado en un estimado del parmetro y de
longitud igual a dos veces el error de estimacin. El Error de estimacin depende del
nivel de confianza deseado, usualmente, 90, 95 99 por ciento.
Una Hiptesis Estadstica es una afirmacin que se hace acerca de un parmetro
poblacional. Por ejemplo, el tiempo de vida promedio para una persona diagnosticada
con cncer de pulmn es 180 dias. El porcentaje de personas que favorecen a un
candidato a la presidencia es 60%.
La afirmacin que est establecida y que se espera sea rechazada despus de
aplicar una prueba estadstica es llamada la hiptesis nula y se representa por Ho.
La afirmacin que se espera sea aceptada despus de aplicar una prueba
estadstica es llamada la hiptesis alterna y se representa por Ha. Una hiptesis alterna
puede ser de una o de dos lados. Por ejemplo, el tiempo de vida promedio para una
persona diagnosticada con cncer de pulmn es distinto 180 dias. El porcentaje de
personas que favorecen a un candidato a la presidencia es menor del 60%.
En problemas de expresin gentica cuando se hacen prueba de hiptesis acerca de la
media del nivel de expresin gentica de un gen. Si la hiptesis alterna es de la forma
> entonces se est probando si el gen est sobre regulado con repecto a la condicin
normal y si es de la forma < entonces se dice que el gen est sub-regulado con
respecto a la condicin normal
Una prueba estadstica es una frmula, basada en la distribucin del estimador
del parmetro que aparece en la hiptesis y que va a permitir tomar una decisin acerca
de aceptar o rechazar una hiptesis nula .
Al igual que una prueba de laboratorio para detectar cierta enfermedad, una
prueba estadstica no es ciento por ciento segura y puede llevar a una conclusin
errnea. Hay dos tipos de errores que pueden ocurrir. El error tipo I, que se comete
cuando se rechaza una hiptesis nula que realmente es cierta y el error tipo II que se
comete cuando se acepta una hiptesis nula que realmente es falsa.
La prueba rechaza la
hiptesis nula
La hiptesis nula Error tipo I
realmente es cierta
(FALSO POSITIVO)
La hiptesis nula No hay error
realmente es falsa

La prueba acepta la
hiptesis nula
No hay error
Error tipo II
(FALSO NEGATIVO

El nivel de significacin, representada por , es la probabilidad de cometer error


tipo I, y por lo general se asume que tiene un valor de .05 .01. Tambin puede ser
interpretado como el rea de la regin que contiene todos los valores posibles donde la
hiptesis nula es rechazada.
La probabilidad de cometer error tipo II, se representa por y al valor 1- se le
llama la potencia de la prueba. El error tipo II no es directamente controlado por el
usuario. Una buena prueba estadstica es aquella que tiene una potencia alta, pero hay
que tener en cuenta que si el nivel de significacin se toma ms pequeo entonces la
potencia de la prueba tambin disminuye.

7.1 Inferencias acerca de la Media Poblacional (varianza conocida).


Supongamos que de una poblacin normal con media desconocida . y varianza
conocida 2 se extrae una muestra de tamao n, entonces de la distribucin de la media
muestral x se obtiene que:
z=

Se distribuye como una normal estndar. Luego, P ( z a / 2 < z < z a / 2 ) = 1


Donde Z/2 es un valor de la normal estndar tal que el rea a la derecha de dicho valor
es /2, como se muestra en la siguiente figura:

1
/2

/2

-Z
/2

Z
/2

Figura 7.1. Relacin de /2 y Z/2 en la curva normal estndar

Sustituyendo la frmula de z se obtiene:


P ( z / 2 <

x
< z / 2 ) = 1

Haciendo un despeje algebrico, se obtiene


P( x - Z/2 / n < < x + Z/2 / n )=1-
De lo anterior se puede concluir que un Intervalo de Confianza del 100(1-)% para la
media poblacional ,. es de la forma:

x - Z/2 / n , x + Z/2 / n
Usualmente =.1, .05 .01, que corresponden a intervalos de confianza del 90, 95 y 99
por ciento respectivamente. La siguiente tabla muestra los Z/2 ms usados.
Nivel de
Confianza
90
95
99

Z/2
1.645
1.96
2.58

En la prctica si la media poblacional es desconocida entonces, es bien probable que la


varianza tambin lo sea puesto que en el clculo de 2 interviene . Si sta es la
situacin, y si el tamao de muestra es grande ( n>30, parece ser lo ms usado),
entonces 2 es estimada por la varianza muestral s2 y se puede usar la siguiente
frmula para el intervalo de confianza de la media poblacional:

x - Z/2 s/ n , x + Z/2 s/ n
Existen dos mtodos de hacer la prueba de hiptesis: el mtodo clsico y el
mtodo del "P-value".
En el mtodo clsico, se evala la prueba estadstica de Z y al valor obtenido se le
llama Z calculado (Zcalc). Por otro lado el nivel de significacin dado determina una
regin de rechazo y una de aceptacin. Si Zcalc cae en la regin de rechazo, entonces se
concluye que hay suficiente evidencia estadstica para rechazar la hiptesis nula basada
en los resultados de la muestra tomada.
Las frmulas estn resumidas en la siguiente tabla:
Caso I
Ho : =0

Ha : <0

Caso II
Ho : =0

Ha : 0

Prueba Estadstica:
Z=

x o

Caso III
Ho : =0

Ha : >0

Decisin:
Si Zcal < -Z entonces
se rechaza Ho

Si |Zcal |>Z/2 entonces


se rechaza Ho

Si Zcal >Z entonces


se rechaza Ho

Aqu Z es el valor de la normal estndar tal que el rea a la derecha de dicho


valor es . Recordar tambin que puede ser sustitudo por s, cuando la muestra es
relativamente grande (n>30). Los valores de ms usados son 0.01 y 0.05. Si se
rechaza la hiptesis nula al .01 se dice que la hiptesis alterna es altamente significativa
y al .05 que es significativa.
Trabajar slo con esos dos valores de simplificaba mucho el aspecto
computacional, pero por otro lado creaba restricciones. En la manera moderna de probar
hiptesis se usa una cantidad llamada P-value.
El P-value llamado el nivel de significacin observado, es el valor de al cual se
rechazara la hipotesis nula si se usa el valor calculado de la prueba estadstica. En
la prctica un P-value cercano a 0 indica un rechazo de la hiptesis nula. As un
P-value menor que .05 indicar que se rechaza la prueba estadstica.

Frmulas para calcular P-value:


i)
Si Ho: >o, entonces P-value=Prob(Z>Zcalc).
ii) Si Ho: <o, entonces P-value=Prob(Z<Zcalc).
iii) Si Ho: o, entonces P-value=2Prob(Z>|Zcalc|).
Los principales programas estadsticos dan los P-values para la mayora de las
pruebas estadisticas.
A travs de todo el texto usamos el mtodo del "P-value" para probar hiptesis.

7.2 Inferencias acerca de la Media Poblacional (Varianza Desconocida)


Supongamos que la poblacin es normal con media y varianza desconocida y que
se desea hacer inferencias acerca de , basada en una muestra pequea (n<30) tomada
de la poblacin. En este caso la distribucin de la media muestral x ya no es normal,
sino que sigue la distribucin t de Student.

La distribucin t de Student es bastante similar a la Normal Estndar, con la


diferencia que se aproxima ms lentamente al eje horizontal. El parmetro de esta
distribucin es llamado grados de libertad, y se puede notar que a medida que los grados
de libertad aumentan, la curva de la t y la curva normal estndar se asemejan cada vez
ms. Los grados de libertad guardan relacin con el nmero de datos que se usan para
calcular la expresin y el nmero de estimaciones de parmetros que aparecen en la
misma. Por cada estimacin de parmetro que aparece en la frmula se pierde un grado
de libertad.
Curva Normal Estandar y T con 5 grados de libertad
0.4
Curva Normal
Estandar

C2

0.3

0.2

0.1

t con 5gl.

0.0
-4

-3

-2

-1

x
Hecho por Edgar Acuna

Figura 7.6. Relacin entre la curva normal estndar y una curva t

Propiedad: Si de una poblacin Normal con media y desviacin estndar se extrae


una muestra de tamao n, entonces el estadstico:
t=

x
s
n

se distribuye como una t de Student con n-1 grados de libertad. Esta expresin es la
base para hacer inferencia estadstica para la media de una poblacin Normal cuando
la varianza no es conocida.
Un intervalo de confianza del 100(1-)% para . es de la forma:
( x - t(n-1,/2) s/ n , x + t(n-1,/2) s/ n )
donde s es la desviacin estndar muestral. Aqu t (n-1,/2) es un valor de t con n-1 grados
de libertad y tal que el rea a la derecha de dicho valor es /2.

Tambin se puede hacer las siguientes pruebas de hiptesis:

Caso I
Ho : =0
Ha : <0

Caso II
Ho : =0
H a : 0

Caso III
Ho : =0
Ha : >0

Prueba Estadstica
x o
T= s
es una t con n-1 g.l.
n
Decisin

You might also like