Professional Documents
Culture Documents
2.1
2.1 POBLACION
2.2 MUESTRA
2.3
HISTOGRAMAS Y POLIGONOS DE FRECUENCIA
2.4 MEDIANA
2.5 MEDIA
2.6 MODA
2.7 DESVIACION MEDIA
2.8
DESVIACION ESTANDAR
2.9
COVARIANZA
2.10
COEFICIENTE DE CORRELACION
2.11
COEFICIENTE DE VARIACION
2.12
COEFICIENTE DE ASIMETRIA
2.13
COEFICIENTE DE CURTOSIS
2.14
DESVIACION ESTANDAR MUESTRAL
2.15
SESGO
III.- MATERIALES
IV.- METODOLOGIA
4.1
DISTRIBUCION DE FRECUENCIAS
4.2
CUADRO DE DISTRIBUCION DE FRECUENCIAS
4.3
CALCULO DE MEDIDAS DESCRIPTIVAS
4.4
CALCULO DE MEDIA POBLACIONAL
V.- CALCULOS Y RESULTADOS
VI.- DISCUSIN E INTERPRETACION
VII.- CONCLUSIONES
VIII.- RECOMENDACIONES
IX.- BIBLIOGRAFIA
A modo de ejemplo, se puede decir que un valor est bastante alejado del
centro de los datos si su distancia de l supera dos desviaciones estndar.
Apoyndose en la idea anterior, la desviacin estndar puede ser usada para
determinar valores que se encuentran 'cerca' del centro. Este uso va ms all
de la simple descripcin, en otros mbitos de Estadstica es usada para
tomar decisiones respecto de la poblacin de la que fue extrada la muestra.
2.2. SESGO
Segn el diccionario un sesgo es "una inclinacin parcial de la mente". En nuestro
mbito, la palabra sesgo sirve para definir la tendencia sistemtica de ciertos diseos de ensayos
clnicos para producir de forma consistente resultados mejores o peores que otros diseos.
Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo
de individuos, puntuaciones de examen.
La distribucin normal queda definida por dos parmetros, su media y su desviacin tpica y la
representamos as
FUNCIN DE DISTRIBUCIN
Son ms probables los valores cercanos a uno central que llamamos media .
TIPIFICACIN
y su funcin de distribucin es
Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto ms prximo sea p a
0.5, tanto mejor ser la aproximacin realizada. Es decir, basta con que se verifique
gracias a esta aproximacin es fcil hallar probabilidades binomiales, que para valores grandes
de n resulten muy laboriosos de calcular.
Hay que tener en cuenta que para realizar correctamente esta transformacin de una variable
discreta (binomial) en una variable continua (normal) es necesario hacer una correccin de
continuidad.
Para una variable aleatoria X, que se distribuye normalmente con media : y desviacin tpica :
, la probabilidad de que la variable X est comprendida entre los valores a y b es el rea teida
de rojo en la siguiente figura :
Como el clculo de esta integral es laborioso, para calcular el rea se realiza el siguiente cambio
de variable:
Cambio que origina una distribucin normal stndar de media = 0 y desviacin tpica = 1
cuya funcin de densidad es :
INFERENCIA ESTADISTICA
La Inferencia Estadstica comprende los mtodos que son usados para sacar
conclusiones de la poblacin en base a una muestra tomada de ella. Incluye los mtodos
de estimacin de parmetros y las pruebas de hiptesis.
La Estimacin de parmetros comprende a su vez la Estimacin Puntual, en
donde se estudian los diversos mtodos de encontrar estimadores y las propiedades
ptimas que deben tener stos, y la Estimacin por Intervalos de Confianza, en donde
se estima un parmetro usando un intervalo centrado en un estimado del parmetro y de
longitud igual a dos veces el error de estimacin. El Error de estimacin depende del
nivel de confianza deseado, usualmente, 90, 95 99 por ciento.
Una Hiptesis Estadstica es una afirmacin que se hace acerca de un parmetro
poblacional. Por ejemplo, el tiempo de vida promedio para una persona diagnosticada
con cncer de pulmn es 180 dias. El porcentaje de personas que favorecen a un
candidato a la presidencia es 60%.
La afirmacin que est establecida y que se espera sea rechazada despus de
aplicar una prueba estadstica es llamada la hiptesis nula y se representa por Ho.
La afirmacin que se espera sea aceptada despus de aplicar una prueba
estadstica es llamada la hiptesis alterna y se representa por Ha. Una hiptesis alterna
puede ser de una o de dos lados. Por ejemplo, el tiempo de vida promedio para una
persona diagnosticada con cncer de pulmn es distinto 180 dias. El porcentaje de
personas que favorecen a un candidato a la presidencia es menor del 60%.
En problemas de expresin gentica cuando se hacen prueba de hiptesis acerca de la
media del nivel de expresin gentica de un gen. Si la hiptesis alterna es de la forma
> entonces se est probando si el gen est sobre regulado con repecto a la condicin
normal y si es de la forma < entonces se dice que el gen est sub-regulado con
respecto a la condicin normal
Una prueba estadstica es una frmula, basada en la distribucin del estimador
del parmetro que aparece en la hiptesis y que va a permitir tomar una decisin acerca
de aceptar o rechazar una hiptesis nula .
Al igual que una prueba de laboratorio para detectar cierta enfermedad, una
prueba estadstica no es ciento por ciento segura y puede llevar a una conclusin
errnea. Hay dos tipos de errores que pueden ocurrir. El error tipo I, que se comete
cuando se rechaza una hiptesis nula que realmente es cierta y el error tipo II que se
comete cuando se acepta una hiptesis nula que realmente es falsa.
La prueba rechaza la
hiptesis nula
La hiptesis nula Error tipo I
realmente es cierta
(FALSO POSITIVO)
La hiptesis nula No hay error
realmente es falsa
La prueba acepta la
hiptesis nula
No hay error
Error tipo II
(FALSO NEGATIVO
1
/2
/2
-Z
/2
Z
/2
x
< z / 2 ) = 1
x - Z/2 / n , x + Z/2 / n
Usualmente =.1, .05 .01, que corresponden a intervalos de confianza del 90, 95 y 99
por ciento respectivamente. La siguiente tabla muestra los Z/2 ms usados.
Nivel de
Confianza
90
95
99
Z/2
1.645
1.96
2.58
x - Z/2 s/ n , x + Z/2 s/ n
Existen dos mtodos de hacer la prueba de hiptesis: el mtodo clsico y el
mtodo del "P-value".
En el mtodo clsico, se evala la prueba estadstica de Z y al valor obtenido se le
llama Z calculado (Zcalc). Por otro lado el nivel de significacin dado determina una
regin de rechazo y una de aceptacin. Si Zcalc cae en la regin de rechazo, entonces se
concluye que hay suficiente evidencia estadstica para rechazar la hiptesis nula basada
en los resultados de la muestra tomada.
Las frmulas estn resumidas en la siguiente tabla:
Caso I
Ho : =0
Ha : <0
Caso II
Ho : =0
Ha : 0
Prueba Estadstica:
Z=
x o
Caso III
Ho : =0
Ha : >0
Decisin:
Si Zcal < -Z entonces
se rechaza Ho
C2
0.3
0.2
0.1
t con 5gl.
0.0
-4
-3
-2
-1
x
Hecho por Edgar Acuna
x
s
n
se distribuye como una t de Student con n-1 grados de libertad. Esta expresin es la
base para hacer inferencia estadstica para la media de una poblacin Normal cuando
la varianza no es conocida.
Un intervalo de confianza del 100(1-)% para . es de la forma:
( x - t(n-1,/2) s/ n , x + t(n-1,/2) s/ n )
donde s es la desviacin estndar muestral. Aqu t (n-1,/2) es un valor de t con n-1 grados
de libertad y tal que el rea a la derecha de dicho valor es /2.
Caso I
Ho : =0
Ha : <0
Caso II
Ho : =0
H a : 0
Caso III
Ho : =0
Ha : >0
Prueba Estadstica
x o
T= s
es una t con n-1 g.l.
n
Decisin