You are on page 1of 34

Introduccin a Bioestadstica

Dr. M. H. Rahbar
Profesor de Bioestadstica
Departamento de Epidemiologa
Director, Centro de Coordinacin de
Datos
Colegio de Medicina Humana
Universidad Estatal de Michigan
Qu significa ESTADSTICA?
La palabra estadstica tiene varios significados:
1. Es usada frecuentemente al referirnos a datos
registrados
2. Estadstica tambin denota caractersticas calculadas
para un grupo de datos, por ejemplo, media de la
muestra
3. Estadstica tambin se refiere a metodologa
estadstica, tcnicas y procedimientos tratando con el
diseo de experimentos, coleccin, organizacin,
anlisis de la infromacin contenida en un grupo de
datos para hacer inferencias acerca de los parmetros
de la poblacin.
Qu hacen los estadsticos?

1. Guiar el diseo de un experimento o encuesta


antes de la coleccin de datos.

2. Analizar datos usando los procedimientos y


tcnicas estadsticos adecuados

3. Presentar e interpretar resultados a los


investigadores y otros tomadores de decisiones
incluyendo al gobierno y a la industria
Por qu estudiar estadstica?
1. Conocimiento de estadstica es esencial para
personas que hacen investigacin, manejo de
estudios
2. Entendimiento bsico de estadstica es til para
conducir investigaciones y una presentacin
efectiva
3. Entendimiento de estadstica puede ayudar a
discriminar entre hechos y suposiciones en la
vida diaria
4. Un curso de estadstica deber ayudar a saber
cuando un estadstico deber ser consultado.
Definicin de poblacin y muestra
Una poblacin es un grupo de medidas de inters
para un investigador.
Ejemplos:
1. Ingreso de familias viviendo en Karachi
2. Nmero de nios en familias viviendo en Pakistn
3. Status de salud de adultos en una comunidad

Un subgrupo de la poblacin es llamado muestra.


Una muestra es usualmente seleccionada de tal forma
que es representativa de la poblacin.
Estadstica descriptiva e inferencial
1. Estadstica descriptiva trata con la
enumeracin, organizacin y representacin grfica
de los datos
2. Estadstica inferencial est interesada en
llegar a conclusiones de informacin incompleta, o
sea, generalizado desde la muestra

Un ejemplo de estadstica inferencial incluye el uso


de informacin disponible acerca del status de
salud de las personas en una muestra para extraer
inferencias acerca de la poblacin de la cual se
obtuvo la muestra
Estadstica inferencial
El objetivo de la estadstica inferencial es hacer
inferencias acerca de los parmetros de la
poblacin basada en la informacin obtenida
de la muestra.
1. Estimacin (e.g., estimando la prevalencia de
hipertensin entre adultos viviendo en Karachi)
2. Probando hiptesis (e.g., probando la
efectividad de un nuevo medicamento para
reducir los niveles de colesterol)
Fuentes de datos
Los datos pueden obtenerse de diferentes fuentes:
1. Sistemas de vigilancia (e.g., NIH)
2. Encuestas planeadas (Gobierno, universidades, ONG)
3. Experimentos (Compaas farmacuticas)
4. Organizaciones de salud (Grupo de datos
administrativos)
5. Sector privado (Bancos, compaas, etc)
6. Gobierno (Todas las agencias gubernamentales)

Aqu, nos enfocaremos en encuestas y experimentos


Cul es la diferencia entre una encuesta y un
experimento?
Diferencia entre encuestas y
experimentos
Datos de una encuesta representan observaciones
de eventos o fenmenos sobre los cuales pocos o
ningn, control se impone.
(e.g., evaluando la asociacin entre diferentes
estilos de vida y enfermedad cardiaca)
En un experimento diseamos una investigacin
planeada a propsito para imponer controles
sobre la cantidad de exposicin (tratamiento) a
una medicamento. (e.g., estudios clnicos)
Mtodos de muestreo
1. Muestreo aleatorio (Simple)

2. Muestreo sistemtico

3. Muestreo estratificado

4. Muestreo agrupado

5. Muestreo por conveniencia

6. Muestreo ms complejo
Algunos estudios epidemiolgicos
Estudios retrospectivos:
Renen datos del pasado de casos y controles
seleccionados para determinar diferencias, si las
hay, en la exposicin a un factor de sospecha.
Comnmente son llamados estudios de caso-
control
Estudios prospectivos:
Generalmente son estudios cohorte en los cuales
enrolamos a un grupo de personas sanas y las
seguimos durante un cierto periodo de tiempo
para determinar la frecuencia con la cual se
presenta una enfermedad.
Variables cualitativas y cuantitativas
Ejemplos de variables cualitativas son
ocupacin, sexo, estado civil, etc.

Variables que producen observaciones que


pueden medirse, se considera que son
variables cuantitativas. Ejemplos de variables
cuantitativas son peso, estatura, edad.

Variables cuantitativas pueden clasificarse en


discretas o continuas
Tipos de variables

1. Variables categricas (e.g., Sexo, estado civil,


categora de ingreso)
2. Variables continuas (e.g., edad, ingreso,
peso, estatura, tiempo en lograr un resultado)
3. Variables discretas (e.g. nmero de nios en
una familia)
4. Variables dicotmicas o binarias (e.g.,
respuesta s o no)
Escala de variables

Escala de variable
Escala nominal
Escala ordinal
Escala de intervalo
Escala de razn de intervalo
Escala de datos
1. Nominal: estos datos no representan una cantidad (e.g.,
estado civil, sexo)

2. Ordinal: estos datos representan una serie de datos


ordenados (e.g., nivel de educacin)

3. Intervalo: estos datos son medidos en una escala de


intervalo teniendo iguales unidades pero teniendo un 0
arbitrario (e.g.: temperatura en Fahrenheit)

4. Razn de intervalo: variable como peso para el cual


podemos comparar significativamente un peso contra
otro (digamos, 100 Kg es dos veces 50 Kg)
Variables en el protocolo

Tipos de variable
independiente
dependiente
intermedia
confusora
Variable independiente

La caracterstica siendo observada y/o


medida que hipotticamente influencia a un
evento o resultado (variable dependiente).
NOTA
La variable independiente no es
influenciada por el evento o el resultado,
pero puede causarlo o contribuir a su
variacin.
Variable dependiente
Una variable cuyo valor depende del
efecto de las otras variables (variables
independientes) en la relacin siendo
estudiada. Sinnimo: variables resultado
o respuesta.
NOTA
Un evento o un resultado cuya variacin
buscamos explicar o contabilizar por la
influencia de variables independientes.
Variable intermedia
Una variable que ocurre en el camino causal
de una variable independiente a una variable
dependiente. Sinnimo: interventora,
mediadora
NOTAS
Produce variacin en la variable
dependiente, y es causada por a variable
independiente.
Tal variable est asociada con la variable
dependiente e independiente.
Variable confusora
Un factor (que es un determinante del
resultado), que distorsiona el efecto
aparente de una variable de estudio sobre
el resultado.
NOTA
Tal factor puede estar desigualmente
distribuido entre los expuestos y no
expuestos y por lo tanto influenciar la
magnitud aparente y an, la direccin
del efecto.
Organizando los datos
1. Tabla de frecuencias
2. Histograma de frecuencias
3. Histograma de frecuencias relativas
4. Polgono de frecuencias
5. Polgono de frecuencia relativa
6. Barras
7. Pastel
8. Tronco y hoja
9. Caja y lnea
Tabla de frecuencias

Suponga que estamos interesados en estudiar el


nmero de nios en las familias viviendo en la
comunidad. Los datos siguientes fueron
reunidos basados en una muestra aleatoria de
n=30 familias de la comunidad.
2, 2, 5, 3, 0, 1, 3, 2, 3, 4, 1, 3, 4, 5, 7, 3, 2, 4, 1, 0,
5, 8, 6, 5, 4 , 2, 4, 4, 7, 6
Organice estos datos en una tabla de
frecuencias!
X=No. de Cuenta Frecuencia
nios (Frecuencia) relativa
0 2 2/30=0.067
1 3 3/30=0.100
2 5 5/30=0.167
3 5 5/30=0.167
4 6 6/30=0.200
5 4 4/30=0.133
6 2 2/30=0.067
7 2 2/30=0.067
8 1 1/30=0.033
6

3
Freq.
2

0
0 1 2 3 4 5 6 7 8
Tabla de frecuencias
Suponga que necesitamos construir una tabla de
frecuencias similar para la edad de pacientes con
problemas relacionados al corazn en una clnica.

Los siguientes datos han sido reunidos basados en


una muestra aleatoria de n=30 pacientes quienes
fueron a emergencias de la clnica por problemas
relacionados al corazn.

Las mediciones fueron: 42, 38, 51, 53, 40, 68, 62,
36, 32, 45, 51, 67, 53, 59, 47, 63, 52, 64, 61, 43, 56,
58, 66, 54, 56, 52, 40, 55, 72, 69.
Grupos de Frecuencia Frecuencia
edad relativa
32 -36.99 2 2/30=0.067
37- 41.99 3 3/30=0.100
42-46.99 4 4/30=0.134
47-51.99 3 3/30=0.100
52-56.99 8 8/30=0.267
57-61.99 3 3/30=0.100
62-66.99 4 4/30=0.134
67-72 3 3/30=0.100
Total n=30 1.00
Medidas de tendencia central

Dnde est el corazn de la distribucin?

1. Media
2. Mediana
3. Moda
Media de la muestra
La media aritmtica ( o simplemente media) es
obtenida sumando todas las observaciones en la
muestra y dividindola entre el nmero de
observaciones.

Para una muestra de 5 ingresos 6000, 10,000,


10,000, 14000, 50,000 la media de la muestra es:

6000 + 10000 + 10000 + 14000 + 50000


X = = 18000
5
Mediana de la muestra
En una lista ordenada del ms pequeo al
mayor, la mediana es el valor de en medio

En nuestro ejemplo de cinco ingresos en


una vivienda, primero ordenamos las
mediciones
6,000, 10,000, 10,000, 14,000, 50,000

Mediana de la muestra 10,000


Medidas de dispersin o
variabilidad

1. Rango

2. Varianza

3. Desviacin estndar
Frmula para varianza y
desviacin estndar (S) de la
muestra
n
( xi - x ) 2

2 i=1
s =
n -1
Desviacin estndar = S
Clculo de varianza y desviacin
estndar

2 2 2 2
2 (6000-18000 ) +(10000-18000 ) +(10000-18000 ) +(14000-18000)+(50000-18000 )
S= =
5-1

2
S = 328,000,000
S 18110.77
Reglas empricas
Para una distribucin Normal, aproximadamente,

a) 68% de las mediciones caen dentro de una


desviacin estndar alrededor de la media

b) 95% de las mediciones caen dentro de dos


desviaciones estndar alrededor de la media

c) 99.7% de las mediciones caen dentro de 3


desviaciones estndar alrededor de la media.
Suponga que el tiempo de reaccin de una
droga en particular tiene una distribucin
Normal con una media de 10 minutos y una
desviacin estndar de 2 minutos
Aproximadamente,
a) 68% de los sujetos tomando el medicamento
tendrn la reaccin entreo 8 y 12 minutos

b) 95% de los sujetos tomando la droga tendrn la


reaccin entre 6 y 14 minutos

c) 99.7% de los sujetos tomando la droga tendrn


la reaccin entre 4 y 16 minutos.

You might also like