You are on page 1of 55

ESTADÍSTICA II

ESCUELA: PSICOLOGÍA

PONENTE: Ec. Miriam Guajala

BIMESTRE: II BIMESTRE

CICLO: ABRIL – AGOSTO 2007


PRUEBA DE T DE STUDENT PARA UNA
MUESTRA
Pruebas de homogeneidad

Estudian si dos o más muestras que se diferencian


en el valor de una característica proceden de
poblaciones donde los parámetros que las definen
son iguales.

Valoran si hay diferencias entre


medias,varianzas,proporciones, etc.
• Pruebas de homogeneidad de dos medias
• Pruebas de homogeneidad de dos
proporciones
Prueba de homogeneidad de dos medias

¿Pertenecen  2 Poblaciones
 2 Muestras
a2 1: 11
 1: N1, x1 poblaciones

S21 de igual  2: 2 2
 2: N2, x2 media?
S22

• Se desea contrastar las hipótesis:


– Ho= 1 = 2 (1 - 2 = 0)
– H1= (1  2 )
QUE ES LA PRUEBA T DE STUDENT?

La t de student, es una prueba práctica, bastante


poderosa ampliamente utilizada en las ciencias del
comportamiento.

Esta prueba es muy similar a la prueba Z y la


diferencia radica en que Z utiliza la una desviación
poblacional y la prueba t en cambio utiliza una
desviación estándar muestra
FORMULAS

x- x-
Zobt = tobt =
 N d N
USO:
2. Probar hipótesis en experimentos con una sola
muestra.
3. Estimar la media de la población al construir
intervalos de confianza.
4. Probar la significancia de la r de Pearson.
• PROBAR HIPOTESIS EN EXPERIMENTOS CON UNA SOLA
MUESTRA.
La prueba t es adecuada cuando:
• Se conoce la media poblacional de la Ho y se desconoce la

x-
tobt =
d N
La distribución t, es una familia de curvas que varían
con los grados de libertad asociados al cálculo de t.
Existe N-1 grados de libertad asociados con la prueba t
para una muestra.

Las curvas de la distribución muestral son simétricas,


con forma de campana y media = 0.

La prueba t es adecuada cuando la distribución


muestral de x es normal. Para que la distribución
muestral de x sea normal, la población de datos
debe poseer una distribución normal, o bien N<30
 Intervalos de confianza: Rango de valores que
probablemente, contengan al valor poblacional.

 Límites de confianza: Valores que delimitan al


intervalo de confianza.

 Significacia de la r de Pearson: Nos permite examinar


el valor de la muestra para ver si existe una
correlación de la población.
GRÁFICAS
Tipos de pruebas t

 Prueba t para una muestra: prueba si la media de la muestra


de una variable difiere significativamente de la media
conocida de la población

 Prueba t no pareada o independiente: prueba si las medias


estimadas de la población por 2 muestras independientes
difieren significativamente (grupo de hombres y grupo de
mujeres)

 Prueba t pareada: prueba si la media estimada de la


población por muestras dependientes difieren
significativamente (media de pre y post-tratamiento para el
mismo grupo de pacientes.
 La fórmula para grupos independientes
x1 - x2
 t=
S21/N1 + S22/N2

Con un nº de grados de Nº de datos que pueden


libertad de N1+N2-2 variar independientemente
para una determinada
operación

* Si t t,N se acepta la hipótesis nula


* Si t > t,N se rechaza la hipótesis nula.
 Pruebas de independencia
 Ver si en un estudio de 2 ó más variables, éstas
relacionadas

 Coeficiente de correlación de Pearson (r)

 Designa la magnitud de la relación entre 2 variables


Sus valores absolutos oscilan entre 0 y 1.
La correlación es perfecta positiva si su valor es +1
La correlación es perfecta negativa si su valor es -1
La relación entre 2 variables x e y es positiva cuando al
aumentar una, aumenta la otra y negativa cuando al
disminuir una disminuye la otra
VARIANZA - PRUEBA F
(ANOVA)
 Es usada para descubrir el efecto principal y los efectos
de interacción de variables categóricas independientes
(llamados factores) sobre un intervalo de la variable
dependiente
 Tipos de anova

 Anova de una forma prueba diferencias en un intervalo


de la variable dependiente entre dos, tres o más
grupos formados por las categorías de una variable
categórica independiente.
 Uno de las pruebas mas importantes que utiliza la
varianza en la F, que básicamente es la razón de dos
estimaciones independientes de la varianza de la misma
poblacion.

 Varian con los grados de libertad.


 La distribución F:
 Está sesgada positivamente
 No tiene valores negativos
 Posee una mediana aproximadamente igual a 1 según la
n de las estimaciones.
 La técnica del análisis de varianza se utiliza con los
experimentos con más de dos grupos independientes.
 Esta técnica permite comparar las medias de los
distintos grupos en una sola evaluación y asi evita el
aumento de probabilidad de cometer un error de tipo I.
– Se compara con la Ft de la tabla, para (N-1) gº de
libertad del numerador y denominador:

– Si F < Ft: no existen diferencias en las varianzas

 Cuando hay igualdad de varianzas: única


estimación de la varianza poblacional en la
diferencia de medias.
PRUEBA JI CUADRADO
 Una de las técnicas de inferencia de uso más frecuente,
para el análisis de datos nominales es la prueba no
paramétrica llamada Ji – cuadrado. Es adecuada para el
análisis de datos consistentes en frecuencias que
provienen de una o dos variables.
 Pruebas de homogeneidad de 2 proporciones
(Prueba de χ2)
 χ2 : Estadístico que indica, en general, la discrepancia
entre ciertas frecuencias observadas (empíricas) de
una variable cualitativa dividida en k categorías y la
frecuencia teórica.
 La Ji cuadrada mide, es esencia, la discrepancia entre la
frecuencia observada y la frecuencia esperada, para
cada una de las celdas en una tabla de doble entrada.
REQUERIMIENTOS

 Datos deberán estar en forma de frecuencias


 El total número de observaciones deberá exceder 20
 Frecuencia esperada en una categoría o en cualquier celda
deberá ser >5 (cuando un de las celdas tiene <5 observados
se usa corrección de Yates o si tiene <5 de esperados se usa
exacta de Fisher)
 El grupo de comparación deberá ser aproximadamente igual.
 Usada para probar la fuerza de asociación entre dos
variables cualitativas
 Usada para datos categóricos
• Se compara el valor de χ2 obtenido con el
teórico que proporciona la tabla de su función
de probabilidad:
– Si χ20> χ2t , se rechaza Ho
– Si χ20  χ2t , se acepta Ho.

• Se obtiene el estadístico χ2
 El valor de χ2 teórica depende de:
 Nivel de significación α
 Grados de libertad (k-1)(y-1)
 k = nº de muestras
 y = nº de categorías

 Al trabajar con una tabla de contingencia tetracórica de


2 X 2 el nº de gº de libertad es 1
1 2 1 2
A N1NA N2NA NA
A a1 a2 NA
N N
B b1 b2 NB B N1NB N2NB NB
N N
N1 N2 N N1 N2 N
Frecuencias observadas Frecuencias esperadas o
teóricas
Sumando cada diferencia:
χ2 = N (a1b2 – a2b1)
χ2
N1N2NANB
Como seleccionar la prueba estadística
adecuada
 Tipo de variables
 Cuantitativa (tensión arterial)
 Cualitativa (género)
 Tipos de preguntas de investigación
 Asociación
 Comparación
 Factor de riesgo
•Estructura de datos
•Independientes
•Dependientes
•Pareados
Pregunta de investigación
Asociación de 2 variables (dep, indep)
Tipos de variable Prueba
Dependiente independiente

categórica categórica chi-cuadrada

categórica cuantitativa Regresión logística

Cuantitativa categórica 1 Prueba T


+3 ANOVA

Cuantitativa Cuantitativa Correlación Spearman


Regresión lineal
Buscando el factor de riesgo

Tipos de variables Prueba


Dependiente algunas indep.

Categórica Categórica Regresión log


múltiple

Cuantitativa Categórica ANOVA

Cuantitativa Cuantitativa Regresión log lineal


DISTRIBUCIÓN BINOMIAL
N ensayos

2 posibles resultados

DISTRIBUCION Mutuamente excluyentes


BINOMIAL
Son independientes entre sí
D i s t r i
b u c i ó n
C/resultado posible es la misma
d e
p r o b a b
i l i d a d
(P+Q)N

DESARROLLO De donde:
BINOMIAL
P es la probabilidad de uno de
los dos resultados posibles en
un ensayo
Q es la probabilidad del otro
resultado posible
N es el número de ensayos
Sustituto del desarrollo binomial.

Proporciona la distribución binomial


para valores de N ( número de
USO DE TABLA ensayo) hasta 20 en la primera
BINOMIAL columna y los resultados posibles
están en la segunda columna, bajo
el encabezado “Número de eventos
P y Q.

El resto de columnas contienen


datos de probabilidad para diversos
valores de P o Q
Ejemplo:

Si lanzo tres monedas que no están


cargadas, una sola vez, ¿Cuál es la
probabilidad de obtener 2 caras y
una cruz? Suponga que cada
USO DE TABLA moneda sólo puede caer en cara o
BINOMIAL en cruz.

Datos.

N= 3 (monedas)
P= 2 (cara o cruz)
p= 0.50
PRUEBA DE HIPÓTESIS
Característica
DISEÑO DE Son la existencia de resultados
MEDIDAS pareados en las condiciones y la
REPETIDAS elaboración de un estudio que
analiza la diferencia entre
éstos.
HIPOTESIS
ALTERNATIVA
Afirma que la diferencia de resultados entre las
condiciones se debe a la variable
independiente.

No
Direccional
direccional
Cuando existe una Cuando el
buena base experimento es
teórica y buena básico para
evidencia de determinar el
apoyo literario hecho
Evalúa con un
Evalúa con un
valor de prob. De
valor de prob. De
dos colas
una cola
Es la contraparte lógica de la
alternativa, de modo que si la primera
es falsa, la segunda debe ser
verdadera.
HIPOTESIS NULA
H1 no direccionada  H0 especifica
que la Var. Ind. No influye sobre la
Var. Dep.

H1 direccionada  H0 establece que


la Var. Ind. No influye sobre la Var.
Dep. en la dirección dada
Siempre evaluamos los resultados de un
experimento evaluando la H0 porque
podemos calcular la prob. De los eventos
aleatorios.

EVALUACION
PEGLA DE
DECISION H0 es V y si esta es menor o igual al nivel
alfa o nivel de probabilidad crítica 
Rechazamos la Ho y aceptamos de manera
indirecta la H1. Por lo tanto los resultados
son significativos o confiables.

Si la prob. Obtenido es mayor al nivel alfa,


conservamos la Ho
ERROR TIPO I
Rechazamos la H0 cuando esta
es verdadera

ERROR TIPO II
No rechazamos la H0 cuando
esta es falsa
ERROR DE CONCLUSION
TIPO I Y DE Estado
TIPO II real
Decisión H0 (V) H0
(F)
Aceptar Ho Decisión
Correcta Error Tipo II
Rechazar H0 Error Tipo I
Decisión Correcta
Nivel al cual desean limitar la
probabilidad de cometer un
Error Tipo I
NIVEL CONCLUSION
ALFA Y EL Estado real
PROCESO Nivel Alfa Prob. Obt.
DE Decisión H0 (V)
DECISION H0 (F)
0.05 0.02
Aceptar Ho Decisión Correcta
Error Tipo II
0.01 0.02
Rechazar H0 Error Tipo I
Decisión Correcta
H1 no direccionada
Evaluamos el resultado
obtenido en ambas direcciones
o colas.
EVALUACION
DE LA COLA H1 direccionada
DE LA Evaluamos solamente la cola de
DISTRIBUCIO la distribución que está en la
N dirección dada por la H1
Necesitamos de Signos
positivos y negativos y hemos
de incluir de los resultados
positivos los tantos o valores
mas extremos.
Ejemplo.
N= 10 y p=0.50

EVALUACION Signos positivos: 9


DE LA COLA Tantos extremos: 0,1,9,10
DE LA Tabla B
DISTRIBUCIO
N P(0,1,9,10)=
p(0)+p(1)+p(9)+p(10)
=
0.0010+0.0098+0.0098+0.001
0
= 0.0216
Nivel alfa.
Determina si la evaluación de la
probabilidad debe ser de una o
dos colas.
EVALUACION
DE Regla.
PROBABILIDA La evaluación debe ser siempre
DES PARA de dos colas, a menos que el
UNA O DOS experimentador conserve H0
COLAS cuando los resultados sean
extremos en la dirección
opuesta a la prevista.
DISTRIBUCIONES MUESTRALES
Distribución Muestral

Todos los valores La probabilidad de


que se pueden obtener cada valor
asumir
Población de la hipótesis nula
Conjunto real o teórico de datos si se realiza sobre
toda la población y la variable independiente no
tuviese efectos.

Una distribución muestral. Proporciona todos los


valores que puede asumir un estadístico, junto con
la probabilidad de obtener cada valor si el muestreo
es aleatorio a partir de la población de hipótesis
nula.
La prueba (Z) de la desviación normalizada

Se utiliza cuando conocemos los parámetros de la


población de la H0.
Distribución muestral de la media

Proporciona todos los valores que puede asumir la


media, junto con la probabilidad de obtener cada
valor si el muestreo es aleatorio a partir de la
población de H0
Características de la dist. Muestral de la media

a). Tiene una media y una desviación estándar.


ux= es la media de la distribución muestral de la media
Gx= es la desviación estándar de la distribución muestral de
la media.
b). Tiene una media igual a la media poblacional de datos
crudos.
ux= u
c) Tiene una desviación estándar igual a la desviación estándar
poblacional de datos crudos, dividida entre la raíz cuadrada
de N (ensayos o población)
Gx= G / N
d) Presenta una forma normal que depende de cómo se
distribuya la población de datos crudos y del tamaño de la
muestra.

You might also like