You are on page 1of 59

Unidad Acadmica:

Programa de Estudios Bsicos y Complementarios

3B-2
GUA DE PRCTICAS

BIOESTDASTICA

Autor (es): Mg. Agustina Ramrez Torres


Mg. Anne Aniceto Capristn
Dr. Carlos Francisco Albornoz Jimnez

Colaboradores:

F-CV3-3B-2 Rev. 3 Mar. 2015


CONTENIDO: Pg.

UNIDAD I: VARIABLES Y TEORA DEL MUESTREO

Prctica N1 Variables 04

Prctica N2 Poblacin y muestra 06

Prctica N3 Muestreo 08

Prctica N4 Elaboracin de una matriz de datos en SPSS 10

UNIDAD II: ANLISIS DESCRIPTIVO DE DATOS

Prctica N5 Tablas de frecuencias y grficos 13

Prctica N6 Medidas de tendencia central y posicin 16

Prctica N7 Medidas de dispersin y forma de distribucin 19

UNIDAD III: ESTIMACIN Y PRUEBA DE HIPTESIS PARA VARIABLES CATEGRICAS

Prctica N8 Intervalos de confianza 23

Prctica N9 Prueba de hiptesis para comparar proporciones 26

UNIDAD IV: PRUEBA DE HIPTESIS PARA VARIABLES NUMRICAS

Prctica N10 Prueba de hiptesis para comparar dos promedios 29

Prctica N11 Prueba de hiptesis para comparar dos promedios en

muestras pareadas 32

Prctica N 12 Anlisis de varianza (ANOVA o ANVA) 35

Prctica N 13 Prueba de comparaciones mltiples 37

Prctica N 14 Regresin y correlacin lineal 40

Prctica N 15 Entrega y exposicin de trabajos

F-CV3-3B-2 Rev. 3 Mar. 2015


INTRODUCCIN

La estadstica contribuye en el anlisis estadstico de datos que requieran las instituciones


gubernamentales, educativas, a nivel empresarial e ingeniera, investigacin cientfica y el
quehacer diario. En tal sentido, la gua de prctica de Bioestadstica tiene como finalidad de
proporcionar problemas a los estudiantes, de tal modo que adquiera la competencia de aplicar
las tcnicas estadsticas en el tratamiento y anlisis de datos cuantitativos a nivel bsico.

El contenido de la gua est dividido en cuatro unidades de aprendizaje de acuerdo a los temas
del contenido del slabo:

La Primera unidad corresponde a la definicin, medicin y clasificacin de variables, poblacin


y muestreo, as como los mtodos de recoleccin de datos para realizar un estudio.

La segunda unidad se realiza el anlisis descriptivo de datos con una sola variable de estudio,
donde los resultados se describen en tablas de frecuencias, grficas o estadsticos de resumen.
Tambin la asociacin de variables con tablas de contingencia, grficos de barras agrupadas y
los estadsticos de asociacin.

La tercera unidad se hace el anlisis estadstico como la estimacin de parmetros y prueba


de hiptesis para comparar proporciones y asociacin de variables cualitativas.

La cuarta unidad hace un anlisis de datos con pruebas estadsticas para variables numricas,
en muestras independientes y pareadas con dos grupos y anlisis de varianza.

Los resultados se obtienen con el software estadstico SPSS y Excel, los cuales se redactarn
en Word y se trabajar en equipo como tambin en forma individual.

Los autores

F-CV3-3B-2 Rev. 3 Mar. 2015


UNIDAD I VARIABLES Y TEORA DEL MUESTREO

PRCTICA 01: VARIABLES

1.1 MARCO TERICO

1. Definicin de estadstica.- Es la ciencia que proporciona un conjunto de


mtodos, tcnicas y procedimientos para recolectar, organizar, presentar y
analizar datos con el fin de describirlos o realizar generalizaciones vlidas,
comprende las fases: estadstica descriptiva y la Inferencia estadstica

Estadstica descriptiva.- Son mtodos y tcnicas de recoleccin, organizacin,


presentacin e interpretacin de resultados, que permiten describir
apropiadamente las caractersticas de un conjunto de datos. Comprende el uso
de grficos, tablas, diagramas y criterios para el anlisis.

Inferencia estadstica.- Son mtodos y tcnicas que hacen posible estimar una
o ms caractersticas de una poblacin para tomar decisiones, basadas en el
resultado de muestras. Estas conclusiones tienen cierto margen de error.

2. Variables.- Son propiedades, caractersticas o atributos medibles que se dan en


una unidad de estudio y que varan de uno a otro en una poblacin o muestra,
ejemplo: sexo, sector econmico, edad, grado de instruccin, talla, peso, hijos
por familia, etc.

Escala de medicin de las variables.- Nominal, ordinal, intervalo y razn

Clasificacin de las variables segn su naturaleza.- Se clasifican en:

a) Variables categricas o cualitativas; Expresan atributos sin orden cuyos


valores se miden en escala nominal, y atributos con orden que se miden en
escala ordinal.
b) Variables numricas o cuantitativas; Son valores que expresan cantidades
y se miden en escala de intervalo o razn, se clasifican en continuas y
discretas.
1.2 LOGRO DE APRENDIZAJE
Al finalizar la sesin, el estudiante clasifica y determina la escala de medicin
de variables de un estudio en una matriz de clasificacin de variables,
considerando su naturaleza de recoleccin de datos.
1.3 MATERIALES Y EQUIPOS
Pizarra acrlica, plumones y multimedia

1.4 PROCEDIMIENTO
Se realizar un ejemplo referente a la clasificacin de variables de estudio en
una matriz; cada equipo debatir el trabajo y justificarn sus respuestas. Luego
desarrollarn los problemas del cuestionario.

F-CV3-3B-2 Rev. 3 Mar. 2015


1.5 RESULTADOS
Al final de la clase cada equipo presentar la matriz desarrollada
completamente y los problemas del cuestionario en un documento Word con
[Apellidos y Nombre]. P1.
Ejemplo 1
El Director de un Centro de Salud, ha realizado un estudio con la finalidad de
conocer el grado de satisfaccin de los usuarios acerca de los servicios
ofrecidos. Algunas de las variables consideradas son: la Zona de residencia,
Edad, sexo, servicio que fue atendido, grado de satisfaccin, etc. Se pide
clasificar las variables.
Variables Tipo de variable Escala de medicin Valores
Lince
Zona de residencia cualitativo nominal nominal
Ate
29 aos
Edad en aos cumplidos cuantitativo continua intervalo
35 aos
Masculino
Sexo cualitativo nominal nominal
Femenino
Pediatra
Servicio de atencin cualitativo nominal nominal
Laboratorio
Insatisfecho
Grado de satisfaccin cualitativo ordinal ordinal Poco satisfecho
Satisfecho

1.6 CUESTIONARIO
Problema 01:
Clasifique las variables segn su naturaleza y escala de medicin.
Escala de Valores (Ej.
N Variable Tipo de variable
medicin Datos)
15 aos
1 Edad de gestantes Cuantitativo continua Intervalo 18 aos
32 aos
40cm
2 Talla del recin nacido Cuantitativo continua Intervalo 38cm
45cm

3 Temperatura corporal Cuantitativo continua Intervalo 35C


40C

4 Glucosa en sangre Cuantitativo continua Intervalo 13.4


15.15
Lince
Nominal /
5 Distrito donde vive Cualitativo nominal
Politmica
Surco
MIraflores
Leve
6 Intensidad del dolor Cualitativo ordinal Ordinal Moderado
Grave
Sobre la norma
7 Estado nutricional Cualitativo ordinal Ordinal Normal
Bajo la norma
Alta
8 Presencia de fiebre Cualitativo ordinal Ordinal Normal
Baja
Leves
9 Tipo de enfermedad Cualitativo ordinal Ordinal Moderadas
Graves
Tipo A
10 Grupo sanguneo Cualitativo ordinal Ordinal Tipo B
Tipo O

F-CV3-3B-2 Rev. 3 Mar. 2015


Problema 02:
Gutirrez y Huallpa en el ao 2013, realizaron un estudio de la automedicacin
en pobladores que asisten a una conocida cadena de boticas en la urbanizacin
progreso del distrito de Carabayllo, con el propsito de conocer el porcentaje
de personas que se automedican, los sntomas, el grupo teraputico,
las principales causas y el nivel de conocimiento de las consecuencias de
automedicarse en personas de 21 a 65 aos de edad. Los resultados revelan que
el 88,3% de la poblacin estudiada admite automedicarse. Este problema est
relacionado con los ms frecuentes: dolor (27,5 %), cuadros respiratorios
(18,9 %) e inflamacin (11,2 %). Los grupos teraputicos ms usados fueron
analgsicos (31,4 %), antibiticos (23,7 %) y antiinflamatorios (10,7 %). Las
principales causas fueron recomendacin de terceras personas (63,9 %),
carencia de dinero (62,7 %) y uso de recetas anteriores (60,1 %). El nivel de
conocimiento sobre las consecuencias de la automedicacin que tiene la
poblacin estudiada es de 44,5 % mientras que el 55,5 % desconoce el tema.
Elabore una matriz y realice la clasificacin de las variables segn su naturaleza
y escala de medicin.
N Variable Tipo de variable Escala de medicin Valores (Ej. Datos)
Si automedican
1 Automedicacin Cualitativa Nominal Nominal-Dicotmica
No automedican
Dolor
2 Sntomas Cualitativa Nominal Nominal-Politomica Cuadros respirtorios
Inflamacion
Analgesicos
3 Grupo teraputico Cualitativa Nominal Nominal-Poliatomica Antbioticos
Antiinflamtorios
Recomendacin de terceras
personas
4 Principales causas Cualitativa Nominal Nominal-Politomica
Carencia de dinero
Uso de recetas anteriores
Si conocen
5 Nivel de consecuencias Cualitativa Nominal Nominal-Dicotomica
No conocen

Problema 03:
El Director del seguro Integral de Salud (SIS), ha recibido constantes quejas de
los usuarios por la demora en el tiempo de espera para registrar su cita y recibir
atencin mdica en consultorio. Por tal motivo, desea realizar un estudio con
la finalidad de estimar el tiempo promedio (en das) de espera de los pacientes
que visitan los hospitales del MINSA, ubicados en la jurisdiccin de Lima
Metropolitana. Se pide clasificar las variables y la escala de medicin.
N Variable Tipo de variable Escala de medicin Valores (Ej. Datos)

1 Tiempo promedio (das) Cuantativa continua Intervalo [10;45> minutos

2 Usuarios Cuantitativa discreta Razon 0,1,2,3,4

3 Numero de Hospitales Cuantitativa discreta Razon 0,1,2,3,4

Problema 04:
Un especialista en nutricin, est interesado en comparar la efectividad de tres
dietas para reduccin del peso, en seoras de 40 aos de edad del estrato

F-CV3-3B-2 Rev. 3 Mar. 2015


socioeconmico B. Para tal efecto, se cuenta con 15 voluntarias, de tal manera
que a cada dieta se le asigna 5 seoras. Se pide:
a) Unidad de estudio: una seora 40 aos de del estrato socioeconmico B.
b) Poblacin objeto de estudio: las seoras 40 aos de del estrato
socioeconmico B.
c) Muestra: 15 voluntarias.
d) Variable de estudio: Reduccin del peso.
e) Tipo de variable: Cuantitativa continua.
f) Escala de medicin: Razn.

1.7 FUENTES DE INFORMACIN


1. Wayne D. Bioestadstica: base para el anlisis de las ciencias de la salud.
4 ed. Mxico; 2002.
2. vila RB. Estadstica Elemental. Lima:Estudios y ediciones R.A; 2010.
3. Gutirrez NR, Huallpa EM. Automedicacin en pobladores que asisten a
una cadena de boticas en la urbanizacin Progreso de Carabayllo. Tesis.
2013; [acceso febrero 2015] Disponible
en:http://tesis.uwiener.edu.pe/detalle.asp?ts=TU201400054

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA 02: POBLACIN Y MUESTRA

1.1 MARCO TERICO

Poblacin de estudio (universo).-es el conjunto finito o infinito de datos que


corresponde a las mismas caractersticas (variables) de las unidades de inters
para el estudio.

Cuando la poblacin de estudio es muy extensa es necesario considerar una


muestra representativa y adecuada de individuos que conformarn el estudio
de investigacin segn los objetivos.

Muestra.- Grupo de datos correspondiente a unidades de estudio debidamente


seleccionadas de la poblacin.

Unidad de estudio.- Es cada individuo, entidad o elemento afectada por un


problema del cual se miden las caractersticas de un estudio para luego
presentar su respectiva solucin.

Datos.- Son los valores categricos o numricos como resultado de la medicin


de las variables en cada unidad de estudio.

Para hacer la seleccin de cada una de las unidades de estudio que conformarn
la muestra, se utiliza la teora de tcnicas de muestreo y para determinar
cuntos llegarn a formar el estudio ser mediante la tcnica del clculo de
tamao de muestra.
El estudiante de Ciencias de la Salud para definir, identificar, analizar y hacer
aplicaciones de cada uno de los ejercicios propuestos debe conocer con claridad
y precisin:
Los conceptos o definiciones y diferencias bsicas entre poblacin y
muestra; variable y escala de medicin.
Debe saber cundo y por qu se debe calcular el tamao de muestra.
Los procedimientos para el clculo del tamao de muestra.
1.2 LOGRO DE APRENDIZAJE

Al finalizar la sesin, el estudiante aplica las estrategias de clculo de tamao


muestra y determina el nmero de unidades de estudio que debe conformar
una muestra.
1.3MATERIALES Y EQUIPOS
Pizarra acrlica, plumones y multimedia

1.4 PROCEDIMIENTO
Se resolver uno de los casos presentados segn el cuestionario con los alumnos,
explicando todo el proceso de reconocimiento de poblacin, muestra, unidad
de estudio, variable, tipo de variable y escala de medicin.

F-CV3-3B-2 Rev. 3 Mar. 2015


Los clculos para el tamao de muestra se realizarn mediante un programa
diseado en una hoja de clculo en Excel, en la que se ingresarn los datos
requeridos.

1.5 RESULTADOS
Al final de la clase cada equipo presentar los problemas del cuestionario en un
documento Word con [Apellidos y Nombre]. P2.

Ejemplo 2
Un grupo de investigadores estn interesados en estimar la prevalencia de
sobrepeso y obesidad infantil en nios menores de 5 aos en Lima
Metropolitana, porque compromete su salud a muy temprana edad,
desencadenando diversas enfermedades como la diabetes mellitus tipo II,
hipertensin arterial y algunos tipos de cnceres. Por estudios realizados por el
Instituto Nacional de Estadstica e Informtica (INEI), en sus Encuestas
Demogrfica y de Salud Familiar (ENDES) encontr una prevalencia del
indicador de peso para la talla por encima del peso normal es del 5,1%, 5,5% y
6,5% para los aos 1992,1996 y 2000. Se pide calcular el nmero de nios que
deben ser considerados en el nuevo estudio, cuyo margen de error es de 4%.

Solucin
Observe que las casillas en blanco deben ser rellenadas con datos del problema
planteado y luego calcular el tamao de muestra en el archivo de EXCEL!

Variable de estudio Tipo de variable Escala de medicin Valores


1)Normal
Obesidad infantil Cualitativa ordinal Ordinal
2)sobrepeso
Poblacin de estudio Nios menores de 5 aos residentes en Lima Metropolitana
Objetivo General Estimar la proporcin de nios obesos menores de 5 aos
Parmetro a estimar UNA PROPORCIN
Nivel de confianza 95% Margen de error 4%
Prevalencia estimada 15% Desviacin estndar No corresponde
Proporcin de prdidas 10% Tamao de muestra nc = 340

1.6 CUESTIONARIO

Problema 01:
En cada uno de los siguientes casos, identifique: Poblacin, Unidad de estudio,
variable, tipo de variable, escala de medicin y calcule el tamao de muestra.
Justifique sus respuestas.

F-CV3-3B-2 Rev. 3 Mar. 2015


1. Una nutricionista desea determinar la eficacia de prdida de peso promedio
de un nuevo rgimen de dieta controlada y ejercicios con una dieta habitual.
Para ello, se le proporciona a usted el peso perdido en kg. de pacientes que
siguieron la dieta habitual despus de tres meses: 3.0, 2.7, 4.0, 5.2, 3.4, 1.3,
2.9 Cuntos pacientes deben seleccionarse si se espera una diferencia de
1kg?
2. Un alcalde desea estimar el porcentaje de empleados en una ciudad que
tiene una fuerza de trabajo (personas que legalmente pueden trabajar) de
35,250 personas. Por un estudio realizado en la gestin anterior se determin
que el porcentaje de empleados fue del 75%. Qu tamao de muestra ser
necesario para estimar la proporcin de empleo?
3. La Directora del Programa de Estudios Generales desea conocer si el
porcentaje de aprobacin del curso de Matemtica Bsica es diferente al
porcentaje de aprobacin de Bioestadstica en el programa de Estudios
Generales de la Universidad Wiener. Calcule el tamao de muestra en cada
curso, si se sabe que el porcentaje anterior en Matemtica Bsica fue de 64%
y en Bioestadstica 81%.
4. El Director comercial de Boticas Fasa, desea precisar con mucho cuidado su
poltica de crditos en clientes que compran con la tarjeta de Boticas Fasa,
por tanto desea estimar la proporcin de crditos que se encuentran al da
en sus pagos. A cuntos clientes deben considerar en el estudio?
5. Un congresista desea realizar un programa de ayuda nutricional a travs de
una ONG, motivo por el cual desea realizar un estudio para conocer el
contenido de protenas en los alimentos que reciben los ancianos en los
albergues de Lima. El congresista, consulta a una nutricionista para evaluar
el contenido de protenas de cada una de las comidas, el cual result tener
una desviacin estndar de 2.5g Cuntas personas adultas mayores se deben
incluir en el estudio?
6. El Ministerio de Salud planea un estudio con el inters de conocer el
promedio de horas semanales trabajadas por las mujeres que tienen
problemas de estrs. La muestra ser extrada de una poblacin de 20000
mujeres que figuran en los registros del Seguro Social y de las cuales se
conoce a travs de un estudio piloto que la desviacin estndar es de 3.1
horas. Cul debe ser el tamao de la muestra?
13445 11818
7. Una obstetra desea determinar la proporcin de mujeres atendidas en la
Maternidad de Lima, que conocen y utilizan los mtodos anticonceptivos
Cuntas madres deben conformar la muestra?
8. Un mdico clnico, desea determinar la proporcin de nios menores de 5
aos con anemia del distrito de Ate y Ventanilla, sabiendo que la anemia
infantil es de 43% y 57% De qu tamao debe de ser la muestra?
9. Un alcalde le pide a usted determinar el ingreso familiar mensual para las
familias de Lima Metropolitana. Segn estudios similares la desviacin
estndar del sueldo familiar se estima en S/.300. Qu tamao de muestra
se requiere?
38415 27055

F-CV3-3B-2 Rev. 3 Mar. 2015


10. Un qumico farmacutico desea determinar la capacidad promedio de frascos
de un medicamento en mm3 de un lote de 8000 frascos recientemente
adquiridos. A travs de una muestra piloto de 5 frascos se encontr que la
desviacin estndar es de 0,2 mm3. De qu tamao debe de ser la muestra?
167 118
11. Una enfermera desea determinar el nivel de satisfaccin de los pacientes
sobre la atencin recibida en la unidad de hemodilisis del Hospital Nacional
Guillermo Almenara. Se tiene conocimiento por investigaciones previas que
el 18% estn insatisfechos con este servicio. A cuntas pacientes se debe
encuestar?

12. Un Mdico con especialidad en epidemiologa est interesado en conocer la


proporcin de escolares del colegio "Guadalupe" que tienen parsitos, de un
total de 3000 estudiantes. Estudios anteriores refieren que la proporcin de
escolares con parsitos es de 0.35. Se pide calcular el tamao de muestra
considerando un nivel de confianza del 95% y un error absoluto del 5%.

13. La enfermera jefe del servicio de Pediatra est interesada en realizar un


estudio sobre el estado nutricional en nios de 5 aos de edad de la
comunidad San Pedro. La poblacin est constituida por 900 nios de 5 aos
de edad. El propsito del estudio es conocer la proporcin de nios de 5 aos
que estn desnutridos, como tambin la estatura promedio. Para tal efecto,
realiz un estudio piloto, cuyos resultados revelan que el 35% estn
desnutridos y la estatura promedio de 120 cm con una desviacin estndar
de 20 cm. Se pide:

a) Calcular el tamao de muestra para estimar la proporcin de nios de 5


aos de edad que estn desnutridos, considerando un grado de confianza
del 95% y un error absoluto de 0.05.

b) Calcular un tamao de muestra para estimar la talla promedio de los nios


de 5 aos de edad, considerando un grado de confianza del 95% y un
margen de error de 5 cm.

1.7 FUENTES DE INFORMACIN


1. Box Gep, Hunter JS. Estadstica para investigadores: diseo, innovacin y
descubrimiento. 2 ed. Barcelona; 2008.
2. Fuentelsaz C. Clculo del Tamao de la Muestra. Matronas Profesin
Barcelona. 2004; vol. 5, n18 [acceso marzo 2010] Disponible en:
http://www.metodologiasytecnicas.ecaths.com/archivos/metodologiasytec
nicas/calculo_muestra.pdf

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA 03: MUESTREO

I. MARCO TERICO

Cuando una poblacin de estudio no se puede estudiar todas las unidades, ya


sea por la gran cantidad de unidades o por el costo que implica la investigacin,
se debe seleccionar una muestra representativa utilizando un mtodo de
seleccin llamado muestreo.

Muestreo.- Es el proceso de seleccin de las unidades de estudio (individuos o


elementos) que conformarn la muestra representativa de una determinada
poblacin de estudio, utilizando un muestreo probabilstico o no probabilstico
segn el diseo de la investigacin.

Tipos de muestreo.- Si la seleccin las unidades en forma aleatoria es un


muestreo probabilstico, tales como: muestreo aleatorio simple, muestreo
sistemtico, muestreo estratificado o muestreo por conglomerados, se puede
realizar de forma manual o mediante software. Si la seleccin de la muestra lo
determina el investigador considerando los criterios de inclusin y exclusin es
un muestreo no probabilstico como: Accidental, por seleccin de criterio, por
cuotas y bola de nieve.

El procedimiento de muestreo probabilstico utilizando software es necesario


tener el marco muestral en una base de datos como se desarrollar esta
prctica.

II. LOGRO DE APRENDIZAJE


Al finalizar la sesin, el estudiante aplica la tcnica de muestreo que debe ser
utilizada en un estudio en la seleccin de las unidades de la muestra,
considerando los criterios de aplicacin.

III. MATERIALES Y EQUIPOS


Pizarra acrlica, plumones, multimedia.

IV. PROCEDIMIENTO
Se resolver uno de los casos como ejemplo, de modo que el alumno reconozca
la tcnica de muestreo que se debera utilizar.
Se indicar el procedimiento de seleccin de las unidades de estudio mediante
un muestreo aleatorio simple y estratificado utilizando el SPSS.

a) Muestreo Aleatorio Simple

1. Abrir el archivo Datos de empleados.sav con la siguiente secuencia:


Archivo/Abrir/Datos/Datos de empleados.
2. Seleccione una muestra aleatoria simple de 112 empleados

Para obtener una muestra aleatoria simple se debe seleccionar en la barra de


men:

F-CV3-3B-2 Rev. 3 Mar. 2015


DATOS -> SELECCIONAR CASOS
MUESTRA ALEATORIA DE CASOS: Ejemplo
Exactamente: 112 casos de los primeros: 474
COPIAR CASOS SELECCIONADOS A UN NUEVO CONJUNTO DE DATOS
NOMBRE DE CONJUNTO DE DATOS: Muestra1
CONTINUAR
ACEPTAR

b) Muestreo Aleatorio Estratificado

La aplicacin de esta tcnica de muestreo consiste en dividir la poblacin en


sub-poblaciones homogneos llamados estratos, luego determinar los estratos
de la muestra en forma proporcional al tamao de cada estrato de la poblacin.

1. Solicitar una tabla de frecuencias de la variable categora laboral (catlab)

Categora Laboral
Porcentaje Porcentaje
Categora Laboral Frecuencia Porcentaje
vlido acumulado
Administrativo 363 76.6 76.6 76.6
Seguridad 27 5.7 5.7 82.3
Directivo 84 17.7 17.7 100.0
Total 474 100.0 100.0

2. Encontrar el tamao de cada grupo por categora laboral (estrato)

Categora
Frecuencia Proporcin ni = (Ni / N)*n
Laboral
Administrativo 363 0.766 85.8 86
Seguridad 27 0.57 6.4 6
Directivo 84 0.177 19.8 20
Total 474 1 112 112

Para obtener una muestra aleatoria estratificada se debe seleccionar en la


barra de men:
ANALIZAR -> MUESTRAS COMPLEJAS -> SELECCIONAR UNA MUESTRA
DISEAR UNA MUESTRA
Guardar en: Plan de muestra -> Empleados
ESTRATIFICAR POR ->Categora Laboral
MUESTREO ALEATORIO SIMPLE -> SIN REPOSICIN
VALORES DESIGUALES PARA LOS ESTRATOS -> DEFINIR
Administrativo: 86
Seguridad :6
Directivo : 20
CONTINUAR
TAMAO MUESTRAL -> SIGUIENTE
VALOR PERSONALIZADO: 112
NUEVO CONJUNTO DE DATOS: Muestra2
FINALIZAR

F-CV3-3B-2 Rev. 3 Mar. 2015


V. RESULTADOS
Los alumnos en equipo de 5 integrantes discutirn y resolvern cada caso
propuesto en el cuestionario de preguntas.

VI. CUESTIONARIO

Problema 01:
Se desea saber si un nuevo tratamiento modifica los tiempos de supervivencia
de los afectados por un determinado tipo de cncer, que hasta ahora son, por
trmino medio, de 38,5 meses. Una muestra de 121 enfermos a los que se les
ha aplicado el nuevo tratamiento presentaron una supervivencia media de 46,9
meses, con una desviacin tpica de 43,3meses.

Poblacin de estudio:________________________________________________
Objetivo General:___________________________________________________
Muestreo:__________________________________________________________

Problema 02:
Se desea conocer cul es el peso medio al nacer de los nios que nacen en el
Hospital"Materno infantil" de Lima. Para ello, se ha tomado una muestra de los
nios que nacieron en el 2014.

Poblacin de estudio:________________________________________________
Objetivo General:___________________________________________________
Variable de estudio:_________________________________________________
Muestreo:__________________________________________________________

Problema 03:
Un grupo de estudiantes se proponen investigar el nivel de conocimientos sobre
el uso de mtodos anticonceptivos en escolares de cuarto y quinto de
secundaria del colegio Nacional Tpac Amaru del distrito de Independencia.

Poblacin de estudio:________________________________________________
Variable de estudio:__________________________________________________
Muestreo:__________________________________________________________

Problema 04:
Una cadena dedicada a la venta de medicinas tiene farmacias en 5 ciudades del
Per, 38 en Lambayeque, 45 en Cuzco, 80 en Lima, 70 en Arequipa y 70 en La
Libertad.Se desea estimar el promedio del total de ventas y la proporcin de
farmacias con ventas superiores a los 50,000 dlares. Cul es el muestreo que
debe utilizar para el estudio. Sustente su respuesta

VII. FUENTES DE INFORMACIN


1. Crdova M. Estadstica Descriptiva e Inferencial. Aplicaciones. 5 ed. Lima:
Moshera; 2003.
2. Dawson B, Robert G. Bioestadstica Mdica. 4 ed. Mxico D. F; 2005.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA 04: ELABORACIN DE UNA MATRIZ DE DATOS EN SPSS

I. MARCO TERICO
La recoleccin de datos de una poblacin o muestra de estudio requiere el uso
de alguna tcnica como: Documentacin, observacin, entrevista, encuestas,
psicometra. Luego es necesario organizar la informacin recolectada para
realizar el procesamiento de datos, la misma que puede hacerse de forma
manual o con el uso de un software como Excel, Stata, Statgraphics, Minitab,
SPSS entre otros. La bondad de utilizar algn software para el procesamiento
de datos, es el manejo de muestras o poblaciones bastante grandes y la
velocidad en la obtencin de resultados.

Al usar algn software en el procesamiento de datos, en primer lugar es


necesario crear una matriz datos, tal como se ver en esta prctica con el
software estadstico SPSS.

II. LOGRO DE APRENDIZAJE


Al finalizar la sesin, el estudiante elabora una matriz de datos en SPSS a partir
de datos recolectados mediante una encuesta diseada para un estudio,
demostrando veracidad y precisin de la informacin.

III. MATERIALES Y EQUIPOS


Proyector de multimedia y computadoras con SPSS.

IV. PROCEDIMIENTO
Se indicar el procedimiento sobre el ingreso de variables cualitativas y
variables cuantitativas en SPSS, como tambin el ingreso de los datos mediante
el siguiente ejemplo.
Problema: El Centro Geritrico RENACER, desea realizar un estudio para
describir el estado nutricional y las enfermedades ms frecuentes de los
pacientes que son atendidos en este centro. La informacin de datos se obtuvo
de las historias clnicas de cada paciente a travs de las siguientes variables,
cuyos datos se encuentran en el Anexo 1.

Estado nutricional de pacientes institucionalizados del Centro Geritrico


RENACER- Rmac
FICHA DE DATOS
1. Sexo: 1) Masculino 2) Femenino
2. Peso:.
3. Talla:.
4. Edad:.
5. Diagnstico: 1) Enfermo Mental 2) Fsicamente enfermo 3) Retrasado mental
6. Lugar de Destino: 1) Hogar de familiares 2) No ha dejado el Geritrico
3) Fallecido 4) Hospital 5) Sanatorio particular 6) Otro Geritrico 7) Calle

F-CV3-3B-2 Rev. 3 Mar. 2015


1.Seleccionar: InicioProgramas IBM SPSS Statistics 21 y aparecer la
ventana del editor de datos con dos hojas activadas en la parte inferior: Vista
de datos y vista de variables

Ingresar
Ingreso de las
los datos
variables y sus
caractersticas

Fig. 1: ventana del editor de datos

2. Las variables se deben ingresar en la hoja vista de variables, respetando el


orden en que se encuentra redactado el cuestionario, es decir cada fila
representa una variable y las columnas indican sus caractersticas; como por
ejemplo: la fila 1 y la columna nombre escribir el nombre de la variable Sexo
en la casilla correspondiente.

3. Luego definir el tipo de variable en la columna tipo. Aqu, se especifica el


tipo de dato de la variable recogida en la encuesta que por defecto aparece
como numrica, pero puede cambiarse segn el tipo de dato, el ancho y el
nmero de decimales con la opcin que aparece:

Figura N2: Ventana para editar y definir el tipo de variable

En la columna TIPO aparecen los diferentes tipos de variables disponibles,


pero, por comodidad, dejaremos a todas como numricas (es posible cambiar
segn el tipo de datos); adems, especifica el ANCHO y NMERO DE
DECIMALES, usar segn los datos recogidos. La variable sexo no necesita
decimales, colocar 0.

4. Luego, en ETIQUETA se debe colocar el nombre que explique a la variable,


en nuestro ejemplo escribimos sexo.

F-CV3-3B-2 Rev. 3 Mar. 2015


5. Adems especifica el cdigo numrico de la variable cualitativa segn el
nombre de la categora que adquiera, como muestra el recuadro al hacer clic
en la parte derecha de la casilla de la variable ubicada en la misma fila.
Luego, en valor escribir 1 y en Etiqueta de valor escribir Hombre; hacer clic
en aadir, luego escribir 2; en Etiqueta de valor escribir Mujer, aadir y
una vez finalizado el ingreso de todas las categoras de la variable, pulsar
Aceptar.

Fig 3: Ingreso de las variables cualitativas y sus caractersticas

6. Tambin podemos etiquetar aquellos datos no especificados caso contrario


sern tomados en SPSS como perdidos o ausentes, el ancho de columna,
alineacin y la Medida que se refiere a la medicin de variable: Nominal
para variables cualitativas nominales. Ordinal para variables cualitativas
ordinales y Escala para variables cuantitativas (discretas y continuas). Por
Ej. La variable sexo su escala de medicin es Nominal.

7. Para no perder el trabajo realizado, debemos guardar el archivo. Ir al men


y seleccionar la opcin archivo y guardar como: Pacientes geritricos.sav

RECUERDE.!

Debe ingresar todas las variables de la encuesta, una a una sin repetir nombres,
una vez ingresado todas las variables (o preguntas) del instrumento de
recoleccin (encuesta, etc.).Pulsar la hoja que dice: VISTA DE DATOS; ahora,
podemos observar que en cada columna aparece las variables que fueron
ingresadas. Cada fila es un registro o caso de los datos recogidos por cada
encuestado siguiendo la enumeracin de la encuesta, es decir, la fila 1 ser
para la encuesta N1, la fila 2 para la encuesta N2 y as sucesivamente, hasta
ingresar todas las encuestas. No olvide guardar su archivo como Pacientes
geritricos.sav!

V. RESULTADOS
Los alumnos presentarn el archivo de SPSS con la matriz de datos completa y
lo enviarn a documentos compartidos: [Apellidos y Nombre]. P4.sav.

F-CV3-3B-2 Rev. 3 Mar. 2015


VI. CUESTIONARIO

1. Elaborar la matriz de datos en SPSS con los datos del archivo Pacientes
geritricos.xls:

2. Elaborar una matriz de datos en SPSS con el archivo o encuesta que


proporcione el docente.

3. Elaborar la matriz de datos en SPSS con los datos del trabajo de


investigacin.

VII. FUENTES DE INFORMACIN


1. FERRN M. SPSS Para Windows. Espaa: Mc Graw-Hill; 2001.
2. VISAUTA B. Anlisis Estadstico con SPSS para Windows. Estadstica Bsica.
Espaa: Mc Graw-Hill; 1999.

F-CV3-3B-2 Rev. 3 Mar. 2015


UNIDAD II ANLISIS DESCRIPTIVO DE DATOS

PRCTICA 05: TABLAS DE FRECUENCIAS Y GRFICOS

I. MARCO TERICO
La aplicacin de la estadstica est en cualquier actividad que desempean las
personas, sea en el campo acadmico, empresarial, gubernamental o
investigacin cientfica. Por tanto, un estudio estadstico requiere de datos
provenientes de una muestra o una poblacin, que puede ser recolectada por
el mismo investigador, por otras personas o entidades. Estos datos deben estar
debidamente ordenados para una mejor explicacin de resultados de los
objetivos del estudio.

Los mtodos para organizar y presentar los resultados son las tablas de
frecuencias y las grficas, las mismas que sirven para resumir y ver la tendencia
de los datos, luego analizar y tomar decisiones.

1. TABLAS DE FRECUENCIAS

Es una tabla de distribucin de los datos agrupados en categoras o clases


mutuamente excluyentes de acuerdo a la escala de medicin de los valores.
Cada categora indica el nmero de observaciones conocido como frecuencia
absoluta simple (fi), si est expresando la proporcin de observaciones que
pertenecen a una clase se llama frecuencia relativa simple (h i), en tanto si
hi multiplicamos por 100 representa el porcentaje de la frecuencia. La suma
de las frecuencias absolutas simples es el total de la muestra (n); en tanto
la suma de las frecuencias relativas simples es igual a 1. Una tabla de
distribucin de frecuencias de tener las siguientes partes: Nmero de la
tabla, encabezados de las columnas, cuerpo y fuente. Por ejemplo:

Tabla 1.
Ttulo de la tabla
Variable Frecuencia Porcentaje Encabezados
C1 f1 h1=(f1/n)*100
C2 f2 h2= (f2/n)*100 Cuerpo

Ck fk hk= (fk/n)*100
Total N 1
Fuente: (persona o entidad que recolecta los datos)

Las tablas de frecuencias sern presentadas de acuerdo al propsito del


estudio y son:

a) Tablas de frecuencias unidimensionales, cuando se va a describir una


variable

F-CV3-3B-2 Rev. 3 Mar. 2015


b) Tablas de frecuencias bidimensionales o contingencia, para asociar o
relacionar dos variables

2. ELABORACIN DE UNA TABLA DE DISTRIBUCIN DE FRECUENCIAS


AGRUPADAS EN INTERVALOS

El procedimiento es el siguiente:

1) Calcular el rango o recorrido de los datos (R), el cual se define:

R = Valor mximo valor mnimo

2) Determinar el nmero de clases o intervalos (K) por el mtodo de Sturges,


es mediante la frmula:

K = 1+3.32* log(n)

3) Determinar la Amplitud o anchura (C) de los intervalos, definido como:



=

4) Calcular los lmites de cada intervalo o clase.

Ejemplos:
[10 - 20] Intervalo cerrado
[10 20> Intervalo semicerrado
<10 - 20] Intervalo semicerrado

3. GRFICAS

Es la representacin de datos en forma visual llamado grfica, para ello se


debe considerar el tipo de la variable y su escala de medicin de los valores,
tales como:

Variables cualitativas: grfico de barras o sectores.


Variables cuantitativas discretas: grfico de barras.
Variables cuantitativas continuas: histograma de frecuencias, polgono de
frecuencias, ojivas, lneas, diagrama de cajas, grfico de dispersin, etc.

Ejemplo de grfico de Barras

El siguiente grfico muestra el nmero de viviendas afectadas en la provincia


de Pisco por el terremoto del 2007. Los datos fueron obtenidos del Censo de
Damnificados del sismo, el 15 de agosto del 2007 realizado por el INEI.

F-CV3-3B-2 Rev. 3 Mar. 2015


Grfico 1. Viviendas afectadas de la provincia de Pisco
por el terremoto del 2007

Fuente: INEI, Censos nacionales de poblacin y vivienda 2007

Ejemplo de grfico de sectores

Grfico 2. Estado nutricional del adulto mayor


institucionalizado del centro Canevaro - Rmac
Normal
5.4%

Desnutricin
46.9% Riesgo de
desnutricin
47.7%

Fuente: Elaborado por el grupo de investigacin

II. LOGRO DE APRENDIZAJE


Al finalizar la sesin, el estudiante elabora tablas de frecuencias y grficas
utilizando el software estadstico SPSS o EXCEL, describiendo la distribucin de
la variable en cantidades o porcentajes, demostrando su capacidad de anlisis
de resultados de una muestra o poblacin.

III. MATERIALES Y EQUIPOS


Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.

IV. PROCEDIMIENTO
Se mostrar el formato de presentacin de tablas y grficos, como tambin el
proceso con SPSS para obtener las tablas y grficos del archivo Pacientes
geritricos. sav. Asimismo, en un documento Word se redactar la

F-CV3-3B-2 Rev. 3 Mar. 2015


interpretacin de resultados; luego cada estudiante deber grabar el archivo
del siguiente modo: [Apellidos y Nombre]. P5.sav.

1. Elaboracin de tablas de frecuencias y grficas de variables cualitativas,


usando el software estadstico SPSS, en la barra de men se debe seguir la
siguiente secuencia:

ANALIZAR -> ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS


VARIABLES: Diagnstico mdico
MOSTRAR TABLAS DE FRECUENCIAS
GRFICOS:
TIPO DE GRFICO: GRFICO DE BARRAS
VALORES DEL GRFICO: FRECUENCIAS Y /O PORCENTAJES
CONTINUAR
ACEPTAR

Primero se selecciona la variable que se va a analizar, luego pasa al recuadro


de la derecha pulsando el botn . Por ejemplo, selecciona la variable
Diagnstico mdico, luego pulsa el botn grficos, elige el grfico de barras y
pulsa el botn continuar. Por defecto aparece marcado mostrar tabla de
frecuencias. Luego aparecer la tabla de frecuencias y el grfico solicitado en
un nuevo archivo llamado Resultados.

Fig.5: Cuadros de dilogos con la opcin Analizar->Estadsticos descriptivos-> Frecuencias

Una vez que ha obtenido la tabla de frecuencias o la grfica de inters, copiar


a un documento Word. Sin embargo, es necesario editar la grfica en SPSS a
travs de la ventana editar; luego enumerar, arreglar ttulos y cuerpo, colocar
tambin la fuente que hizo la recoleccin de datos cuando no fue recolectado
por usted, asimismo describir los principales resultados encontrados.

F-CV3-3B-2 Rev. 3 Mar. 2015


2. Elaboracin de tablas de frecuencias y grficas de variables cuantitativas
continuas llamado Histograma:

En la barra de men seguir la siguiente secuencia:


ANALIZAR -> ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS
VARIABLES: Edad
MOSTRAR TABLAS DE FRECUENCIAS
GRFICOS:
TIPO DE GRFICO: HISTOGRAMA DE FRECUENCIAS
CONTINUAR
ACEPTAR

3. Elaboracin de tablas de frecuencias agrupadas en intervalos para


variables cuantitativas: es necesario conocer los intervalos, caso contario
hacer el proceso de agrupacin de los intervalos (mtodo de Sturges o
cualquier otro). Con el software SPSS, se debe seguir el siguiente
procedimiento:

Transformar/Agrupacin visual/seleccionar la variable EDAD/ continuar

Debemos conocer
los intervalos, caso
contrario realizar
los clculos previos
como se indica.

Clculos previos:
MTODO STURGES

R = Valor mx Valor mn
= 90-18 = 72

K = 1+3.32*log(n)
= 1+3.32*log(40)= 6

C = R/K = 72/6 = 12

F-CV3-3B-2 Rev. 3 Mar. 2015


En la barra de men de SPSS seleccionar:

TRANSFORMAR -> AGRUPACIN VISUAL


VARIABLES PARA AGRUPAR: Edad
CONTINUAR
CREAR PUNTOS DE CORTE:
Posicin del primer punto de corte: VALOR MNIMO+C
Nmero de punto de corte: K
Anchura: C
APLICAR
CREAR ETIQUETAS:
VARIABLE AGRUPADA: Edades
ACEPTAR: Las especificaciones de agrupacin crearn 1 variable
ACEPTAR

Luego ir al men ANALIZAR / LA TABLA DE FRECUENCIAS DE LA NUEVA


VARIABLE AGRUPADA, como en el paso anterior.

V. RESULTADOS
Cada equipo de trabajo presentar los grficos y cuadros estadsticos con su
respectivo anlisis de los problemas del cuestionario, en un archivo en Word
del siguiente modo [Apellidos y Nombre]. P5.doc
VI. CUESTIONARIO
Problema 01:
El MINSA est interesado en conocer las causas de muertes infantiles con la
finalidad de elaborar un proyecto para reducir la mortalidad de nios de 5 a 9
aos en la comunidad de Chosica del departamento de Lima. Los datos fueron
recolectados de los registros de defunciones de la municipalidad de la localidad
durante el primer trimestre del ao 2014, los datos se muestra en los siguientes
cuadros.

Registro de datos de la variable


1 4 3 1 2 4 1 3 1 5 CAUSA DE MUERTE (Variable)
2 1 1 4 3 1 2 1 4 1
4 1 3 1 5 1 2 1 1 2 1: Accidente vehicular
5 1 1 4 1 5 3 1 2 1 2: Ahogamiento
2 3 1 1 2 1 4 1 4 1 3: Incendio en casa
1 2 4 1 1 1 3 4 1 1 4: Homicidio
1 1 2 1 1 2 1 1 2 3 5: Otros
3 3 1 5 2 3 4 1 3 4
1 1 2 4 5 4 1 4 1 5
4 1 1 4 1 5 1 1 2 4

Se pide elaborar un grfico y describa los resultados

F-CV3-3B-2 Rev. 3 Mar. 2015


Problema 02:
Con los datos de la matriz en SPSS del archivo [Pacientes Geritricos]. P4.sav.
procesar y presentar los resultados con su respectiva interpretacin en un
documento Word, debe considerar las siguientes tablas y grficas:

1. Elabore una grfica de barras para la variable Diagnstico mdico y describa


los resultados.
2. Describa de los empleados mediante una tabla de frecuencias.
3. Elabore una tabla de frecuencias agrupadas en tres intervalos (<Menores de
25], [25 a 59], [Mayores de 60>) de la variable Edad.
4. Elabore una tabla de frecuencias agrupadas en intervalos de igual amplitud
por el mtodo de Sturges de la variable Talla.
5. Analizar la simetra de la distribucin de datos del Peso con un grfico de
tallos y hojas.
6. Para obtener el estado nutricional de cada paciente: primero calcular el
ndice de masa corporal (IMC) para cada paciente; segundo categorizar
dicho IMC en una nueva variable, considerando los siguientes intervalos y
etiquetas (agrupar: <menos de 19] como bajo peso, [19.01 a 24.99] peso
normal, [25 a 2.99] sobrepeso, de [30 a 39.99] obeso y de [40 a ms> muy
obeso, el nuevo nombre de la variable ser Estado nutricional.
7. Elaborar un grfico de la variable estado nutricional e Interprete resultados
8. Explique los resultados de la variable Lugar de destino con una grfica
9. Elabore un grfico de barras agrupadas de las variables Diagnstico mdico
segn Sexo del paciente
10. Elabore una tabla de contingencia con las edades agrupadas (Menores a 25
aos), (25 a 59 aos) y (60 a ms aos) segn el diagnstico mdico.
11. Elabore una tabla de contingencia de Estado nutricional segn gnero
12. Elabore un grfico de barras agrupadas de la variable Lugar de destino y
sexo
13. Elabore un Histograma de frecuencias para el IMC de los pacientes y
describa la forma de distribucin de la variable
14. Describa tres conclusiones

Problema 03:

VII. FUENTES DE INFORMACIN


1. MILTON S. Estadstica para biologa y ciencias de la salud. 2ed: Mxico;
1994.
2. VISAUTA B. Anlisis Estadstico con SPSS para Windows. Estadstica Bsica.
Espaa. Mc Graw-Hill; 1999.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA N 6: ESTADSTICOS DE TENDENCIA CENTRAL Y POSICIN
I. MARCO TERICO
Los estadsticos o estimadores de una variable numrica sirven para resumir los
datos de una muestra con un slo valor, el cual se obtiene por procedimientos
matemticos y es til para aproximar los parmetros. Los estadsticos se
dividen en cuatro grupos:
Estadsticos de tendencia central: Media, mediana y moda
Estadsticos de Posicin: Percentiles o cuantiles
Estadsticos de dispersin: Rango, varianza, desviacin estndar y coeficiente
de variacin.
Estadsticos de forma: coeficiente de asimetra y coeficiente de curtosis
1. Estadsticos de tendencia central; Son valores calculados que tienden a
ubicarse en la parte central de las observaciones y describen el centro de la
distribucin de datos. Las medidas de tendencia central ms usuales son:
a) Media o promedio.- Es un valor central que representa el centro a un
conjunto de datos en una muestra o poblacin. Se define mediante la suma
de todos los datos y se divide entre el tamao de la muestra.

La frmula de la media muestral para datos sin agrupar es:


n
xi
X
i 1 n

La frmula de la media muestral para datos agrupados es:


k

x i fi
X i 1

n
Ejemplo 3

Se ha registrado la hemoglobina de 5 gestantes adolescentes que fueron al


servicio de ginecologa del centro de salud de Ventanilla para su control, los
datos son:

12 11 13 11 10
x1 x2 x3 x4 x5
Solucin
n
xi x1 x 2 x3 x 4 x5 12 11 13 11 10 57
X 11.4
i 1 n 5 5 5

Interpretacin.- Las gestantes que fueron a su control al centro de salud de


Ventanilla, registraron una hemoglobina promedio de 11.4

F-CV3-3B-2 Rev. 3 Mar. 2015


b) Mediana (Me).- Es un valor que indica el centro de un conjunto de datos
ordenados, donde el 50% de los datos son menores a dicho valor y el otro 50%
sern mayores.

Ejemplo 4
Los datos siguientes corresponden a las estaturas (en metros) de hombres
peruanos con 18 aos de edad. Calcule la mediana de las siguientes
estaturas.
1.78 1.55 1.82 1.60 1.65 1.50 1.70

Como la muestra est conformado por 7 personas. Por tanto n es impar

Procedimiento:
1 Ordenar los datos de menor a mayor

1.50 1.55 1.60 1.65 1.70 1.78 1.82


x1 x2 x3 x4 x5 x6 x7

50% Me 50%

2 Ubicar el valor mediano:

La mediana es el valor de x4 = Me = 1.65

Interpretacin.- El 50% (mitad) de los 7 hombres peruanos tienen una


estatura menor a 1.65 y el otro 50% tienen una estatura superior a 1.65
metros.

Ejemplo 5

Se ha registrado las notas de 6 alumnos de la asignatura de matemticas.


Calcular e interpretar la mediana del grupo de datos.

17 10 12 15 13 15

1 Ordenar los datos de menor a mayor

10 12 13 15 15 17
x1 x2 x3 x4 X5 X6

50% Me 50%

2 Ubicar el valor mediano: en el ejm. es x3+ x4 = (13+15)/2 = 14


Entonces: Me = 14

F-CV3-3B-2 Rev. 3 Mar. 2015


En este caso observamos que la muestra est conformado por 6 alumnos, un
nmero n par, dado que n=6. Entonces la mediana se obtiene sumando los
dos valores centrales cuando el tamao de la muestra es un nmero par.

Interpretacin.- El 50% (mitad) de las notas de los 6 alumnos son menores o


iguales a 14 y el otro 50% mayor tiene notas mayores a 14.

c) Moda (Mo).- Es el valor que aparece con mayor frecuencia. Una distribucin
unimodal tiene una sola moda y una distribucin bimodal tiene dos modas.

Ejemplo 6

Se ha registrado las edades de 5 finalistas a Miss Per en aos cumplidos:

18 19 21 22 21 20

El dato que ms veces se repite es 21, entonces:


Mo = 21
Interpretacin.- La edad ms frecuente de las 5 finalistas a Miss Per, es 21
aos.

2. Estadsticos de posicin
Son valores ordenados que indican la ubicacin de cualquier porcentaje
segn el nmero de divisiones que se realice al histograma, como: cuartiles,
quintiles, deciles, percentiles, etc. Se puede calcular en variables de escala
ordinal, intervalo o razn.

a) Cuartiles (Qk).- Son valores que dividen al conjunto de datos ordenados


en 4 partes iguales y cada una de ellas representa el 25% de los datos.

25% 25% 25% 25%


Q1 Q2 Q3
Donde :
Q1 : Es un valor que indica que el 25% de los datos son menores al valor
encontrado y el 75% son mayores
Q2: Es un valor que indica que el 50% de los datos son menores al valor
encontrado y el 50% son mayores
Q3: Es un valor que indica que el 75% de los datos son menores al valor
encontrado y el 25% son mayores

b) Deciles (Dk).- Son valores que dividen al conjunto de datos en 10 partes


iguales y cada una de ellas representa el 10% de los datos.

10% 10% ... 10%


D1 D2 .. D9

Donde:

F-CV3-3B-2 Rev. 3 Mar. 2015


D1 : es un valor que indica que el 10% de los datos son menores al valor
encontrado y el 90% son mayores
D3 es un valor que indica que el 30% de los datos son menores al valor
encontrado y el 70% son mayores

c) Percentiles (Pi).- Son valores que dividen al conjunto de datos en 100


partes iguales y cada una de ellas representa el 1% de los datos.
1% 1% ... 1%
P1 P2 .. P99

Donde:
P10 : es un valor que indica que el 10% de los datos son menores al valor
encontrado y el 90% son mayores
P20 es un valor que indica que el 20% de los datos son menores al valor
encontrado y el 80% son mayores
P90 es un valor que indica que el 90% de los datos son menores al valor
encontrado y el 10% son mayores

II. LOGROS DE APRENDIZAJE


A finalizar la sesin, el estudiante resuelve los problemas referentes a las
medidas de tendencia central y posicin, considerando su capacidad de anlisis
e interpretacin de resultados.
III. MATERIALES Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
El profesor resolver un ejemplo en SPSS y orientar al alumno en la solucin
del resto ejercicios en forma grupal de la base de datos [Apellidos y Nombre].
P6.sav.
En el SPSS se debe seguir la siguiente ruta:
ANALIZAR -> ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS
VARIABLES: Edad
ESTADSTICOS:
Tendencia central: media, mediana, moda
Posicin: Cuartiles, percentiles
Dispersin: Rango, min, max, desviacin tpica, varianza
Distribucin (forma): Asimetra, curtosis
CONTINUAR
ACEPTAR

V. RESULTADOS
Cada equipo de trabajo presentar las medidas de tendencia central, en un
archivo [Apellidos y Nombre]. P6.doc.

F-CV3-3B-2 Rev. 3 Mar. 2015


VI. CUESTIONARIO
Problema 01:
Se ha realizado la evaluacin del peso de los recin nacidos en el hospital
nacional de la ciudad de Arequipa con la finalidad de comparar los pesos
promedios. Las madres de los recin nacidos registran su residencia en el rea
rural y rea urbana.

2950 3200 3500 3350 3340 3900 3470


rea
rural 3350 2560 3270 3850 2780 3560 3900
4230 4500 3050 4510 3810 2940 3210
rea 3240 3150 3300 3750 3280 3700
urban 4220 3930 4030 3280 4280 3460 2480
a 2870 3230 3590 3700 3620 4600

1. Encuentre e interprete los estadsticos: Media, mediana y Moda


2. Comparar el peso promedio de los recin nacidos segn el rea de
residencia.
3. Cul es el valor del peso por debajo del cual se encuentran el 20% de los
recin nacidos?
4. Cunto debe ser elpeso de un recin nacido para decir que tiene mejor
peso que el 80% de la poblacin?
5. Si consideramos como nios con peso normal al 70% de la poblacin Cules
seran los lmites de normalidad del peso?

Problema 02:
Un equipo de mdicos desea investigar la cantidad de Zinc en cierto tipo de
preparados infantiles. Se ha tomado 100 gramos de este alimento y se ha
registrado la cantidad de zinc en mg de las principales marcas del mercado,
cuyas mediciones se presentan a continuacin:

5.1 3.0 3.6 4.2 4.8 5.4 5.7 5.8


5.5 5.8 4.1 3.7 3.5 4.4 4.7 5.0
5.6 5.0 5.5 5.8 3.8 4.6 4.3 5.7

1. Cul es la cantidad promedio de zinc en los preparados infantiles?


2. Cul es la cantidad frecuente de zinc?
3. Obtenga la cantidad mxima de zinc del 50% de los preparados infantiles
4. Encuentre la cantidad mxima de zinc para el 80% de los preparados
infantiles
5. Si usted desea adquirir uno de estos preparados del 5% que tenga la mayor
cantidad de zinc Cul sera la cantidad de zinc para que sea considerado
en su compra?

Problema 03:
De los datos registrados del archivo pacientes geritricos. Sav, del centro
Renacer, se desea evaluar del ndice de masa corporal (IMC):

F-CV3-3B-2 Rev. 3 Mar. 2015


1) Cul es el IMC mximo del 10% inferior para recibir un tratamiento con
suplemento vitamnico?
2) Cul es el ndice de masa corporal mnima del 5% superior para recibir una
dieta baja en grasa para regular su peso?

Problema 04:
En la poblacin de varones mayores de 18 aos de la comunidad "Valle de
Sarn", se tiene inters en evaluar su salud fsica mediante las caractersticas
como el Peso, Colesterol y Frecuencia Cardaca para una competencia
deportiva, los resultados clnicos de una muestra de 30 personas revelaronlos
siguientes valores:

Caractersticas fsicas Promedio Mediana Moda Desv. estndar


Peso 68 Kg 72Kg 75 kg 12 Kg
Colesterol 220 210 200 20
Frecuencia Cardiaca 90 p/m 100p/m 110 p/m 20 p/m

Se pide:
a. En cul de las variables hay mayor variabilidad.
b. Todas las variables del estudio son simtricas. De ser asimtricas, que tipo
de asimetra tienen.
c. De acuerdo a lo obtenido en (b), cul es la medida de tendencia central y
dispersin ms apropiada en cada una de las variables de estudio.
d. Interprete y comente los resultados obtenidos en cada variable.
VII. REFERENCIAS BIBLIOGRFICAS
1. Quesada N. Estadstica con SPSS 16: Lima; 2008.
2. Rius F. y Baron F. Bioestadstica. 1 ed. Madrid: Thompson; 2005.
3. Wayne D. Bioestadstica, Base para el anlisis de las ciencias de la salud. 4
ed. Mxico: Limusa S.A; 2002.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA N 7: ESTADSTICOS DE DISPERSIN Y FORMA

I. MARCO TERICO

3. Estadsticos de Dispersin: Son valores que nos permiten conocer sobre la


variabilidad o concentracin de los datos, entre las ms importantes
tenemos: El rango, la varianza, desviacin estndar y el coeficiente de
variacin.
a) Rango (R).- Indica entre que valores se encuentra el conjunto de datos. Es
la diferencia entre el valor de las observaciones mayor y el menor.

R = XDato mximo XDato mnimo

b) Rango Intercuartlico (RI).- concentra al 50% de datos alrededor del


promedio

RI = Q3 Q1

c) Varianza (S2).- Indica la variabilidad u homogeneidad de los datos. Es la


media de los cuadrados de las diferencias entre cada valor de la variable y
la media aritmtica de la distribucin. La frmula de la varianza para datos
sin agrupar es

(X i X )2
S2 i 1

d) Desviacin Estndar.- Indica la dispersin o distanciamiento de los datos


respecto al centro. Es la raz cuadrada de la varianza.

S S2

e) Coeficiente de variacin.- Cuando se quiere comparar el grado de dispersin


de dos distribuciones que no vienen dadas en las mismas unidades o que las
medias no son iguales, se utiliza el coeficiente de variacin de Pearson que
se define como el cociente entre la desviacin tpica y el valor absoluto de
la media aritmtica.

S
CV
*100
X
4. Estadsticos de forma.- Son valores que indican el comportamiento o
distribucin de los datos. Entre ellos tenemos los ndices de asimetra y
apuntamiento o curtosis:

F-CV3-3B-2 Rev. 3 Mar. 2015


a) Asimetra.- Indica la distribucin del conjunto de datos en forma
horizontal, es decir a travs del eje X. Compara la forma que tiene los
datos a travs del histograma con la distribucin normal.

Una distribucin de datos es simtrica cuando la mediana, moda y media


aritmtica tienen valores similares. Si los datos tienen distribucin
asimtrica a la derecha, las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha. Si las frecuencias descienden
ms lentamente por la izquierda, la distribucin es asimtrica a la
izquierda.

La frmula de asimetra est dada por el Coeficiente de Asimetra de


Pearson:

3( X Me) Q3 Q1 2 Me
As AS
S o tambin Q3 Q1

Si As = 0, la distribucin es simtrica
Si As > 0, la distribucin es asimtrica a la derecha
Si As < 0, la distribucin es asimtrica a la izquierda.

b) Curtosis.- Indica la distribucin del conjunto de datos en forma vertical,


es decir, a travs del eje Y. Mide el grado de elevacin de la distribucin
de datos. Se definen 3 tipos de distribuciones, segn su grado de curtosis:

Distribucin mesocrtica: presenta un grado de concentracin medio,


alrededor de los valores centrales de la variable (el mismo que
presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado grado de
concentracin alrededor de los valores centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de
concentracin alrededor de los valores centrales de la variable.

La frmula est dado por:

F-CV3-3B-2 Rev. 3 Mar. 2015


0.263 se llama leptocurtica
1( P75 P25 )
K= = 0.263 se llama platicurtica
2( P90 P10 ) 0.263
se llama mesocurtica

II. LOGRO DE APRENDIZAJE


Al finalizar la sesin, el estudiante resuelve los estadsticos de dispersin y
distribucin de datos en un estudio, considerando el anlisis de un problema
estudiado y demostrando capacidad de anlisis sobre la dispersin y
comportamiento de los datos del estudio.

III. MATERIALES Y EQUIPOS


Proyector de multimedia y ordenador con entorno Windows, software: Word,
Excel y SPSS para cada alumno.

IV. PROCEDIMIENTO
Se calcular los estadsticos de dispersin y forma en datos agrupados y no
agrupados, tambin se ensear con un ejemplo el procesamiento de datos con
SPSS, obtencin de resultados, presentacin e interpretacin en Word con datos
[Pacientes geritricos]. P4.sav.

En el software SPSS se debe seguir la siguiente ruta:


ANALIZAR -> ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS
VARIABLES: Edad
ESTADSTICOS:
Tendencia central: media, mediana, moda
Posicin: Cuartiles, percentiles
Dispersin: Rango, min, mx., desviacin tpica, varianza
Distribucin (Forma): Asimetra, curtosis
CONTINUAR
ACEPTAR

V. RESULTADOS
Cada equipo de trabajo presentar la interpretacin de los problemas del
cuestionario correspondiente a estadsticos de dispersin y forma de
distribucin de datos en un archivo Word, grabar como: [Apellidos y Nombre].
P7.doc

F-CV3-3B-2 Rev. 3 Mar. 2015


VI. CUESTIONARIO
Problema 01:
En un hospital de la ciudad de Arequipa se registra el siguiente nmero de
intervenciones quirrgicas mensuales durante los aos 2005 - 2010.

151 143 156 160 152 156 160 149 151


160 158 156 154 152 159 157 155 153
153 151 142 152 161 142 155 152 143
144 162 148 149 144 150 148 152 149
162 158 154 150 146 147 160 159 158
155 154 153 152 149 147 145 148 152
147 146 148 150 147 146 150 148 147
152 162 153 152 156 160 152 149 144

Hallar e interpretar: Desviacin estndar, varianza, coeficiente de variacin,


asimetra y curtosis.

Problema 02:
Una empresa comercializadora de productos farmacuticos del distrito de
Lince, realiza un pequeo sondeo de opinin sobre el gasto semanal promedio
en medicamentos por familia en soles, obteniendo los siguientes resultados:

27 25 20 44 42 25 45 25 25 10 25
30 10 10 18 35 18 31 15 28 20 28
26 30 23 22 15 20 29 16 28 23 28
16 26 26 42 33 21 21 38 42 21 42
12 39 39 12 21 14 37 24 39 10 39
20 40 43 10 19 17 45 14 34 12 34

1. Realice el anlisis de los estadsticos centrales: Media, mediana y Moda


2. Cul es la dispersin de los datos? Son homogneos?
3. Cul es la forma de distribucin de los datos?
4. Considerandocomo un estndarpara la poblacin del distrito, el gasto
promedio para el 95% de las familias que compran medicamentos durante
una semana Cules seran los lmites para el gasto promedio?
VII. REFERENCIAS BIBLIOGRFICAS
1. Martin Q. Cabero M. De Paz Y. Tratamiento estadstico de datos con SPSS.
Madrid: Thomson; 2008.
2. Rius F. y Baron F. Bioestadstica. 1 ed. Madrid: Thompson; 2005.
3. Wayne D. Bioestadstica: Base para el anlisis de las ciencias de la salud.
4 ed. Mxico: Limusa S.A; 2002.

F-CV3-3B-2 Rev. 3 Mar. 2015


UNIDAD III ESTIMACIN Y PRUEBA DE HIPTESIS PARA
VARIABLES CUALITATIVAS
PRCTICA 08: INTERVALOS DE CONFIANZA

I. MARCO TERICO
Inferencia es el mtodo estadstico que tiene por objetivo inferir y estimar un
parmetro poblacional a partir de las estadsticas muestrales.
Un intervalo de confianza son los lmites entre los que se estima el verdadero
valor del parmetro (proporcin, media,) con una probabilidad de acierto.
Para determinar o hallar estas medidas, el estudiante debe conocer y
diferenciar las definiciones o conceptos bsicos de promedio, probabilidades,
distribucin Z, distribucin t e intervalos de confianza.
Clculo del intervalo de confianza al 95%:

a. Para una proporcin poblacional:

p x (1 p ) p x (1 p )
P( p 1.96 x p p 1.96 x ) = 0.95
n n
Donde:
p = Proporcin de individuos
n = tamao de la muestra de datos
Z0.95 = 1.96

b. Para una media poblacional:


s s
X 1.96 * X 1.96 *
n n
Donde:
x = promedio
s = Desviacin estndar
n = tamao de muestra de datos
Z0.95 = 1.96

II. LOGROS DE APRENDIZAJE


Al finalizar la sesin, el estudiante determina los lmites de confianza del
parmetro de estudio, utilizando los conceptos de estimacin puntual y por
intervalos, demostrando capacidad de anlisis y precisin de resultados.

F-CV3-3B-2 Rev. 3 Mar. 2015


III. MATERIALES Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
Los alumnos desarrollaran las prcticas con asesoramiento del docente,
logrando la participacin activa en equipo mediante la resolucin de los
ejercicios del cuestionario.
Ejemplo 7
Se quiere estimar el peso promedio de nios al momento de nacimiento de
cierta poblacin, que segn estudios se conoce que el peso medio nacional es
de 3200 gr. Se tom una muestra de 50 recin nacidos de la poblacin en
estudio, se obtuvo un promedio de 2850 gr. con una desviacin estndar de
400 gr.

Construyendo el intervalo de confianza se tiene:

2739.12;2960.87
400 400
2850 1.96 x 2850 1.96 x
50 50

Luego, podemos concluir que el peso promedio de nios al nacer vara entre
2739.12 y 2960.87 gr. con una confianza de 95%. Como el intervalo no incluye
el valor =3200 gramos planteado en la hiptesis, entonces, sta es rechazada
con una confianza de 95% o una probabilidad de error menor a 0.05 (p 0,05).

V. RESULTADOS
Cada equipo de trabajo presentar los intervalos de confianza para las variables
de la base de datos [Apellidos y Nombre]. P4.sav. y los problemas del
cuestionario con su respectivo anlisis en Word, en un archivo [Apellidos y
Nombre]. P8.doc
VI. CUESTIONARIO

Problema 01:
La cantidad mnima requerida para que un anestsico surta efecto en una
intervencin quirrgica en promedio es de 50 mg, con una desviacin estndar
de 10.2 mg, en una muestra aleatoria simple de 60 pacientes sobre una
poblacin normal. Obtener un intervalo de confianza para la media al 99%.

Problema 02:
Se desea realizar una estimacin de intervalo de la estatura de los nios varones
de 10 aos de una ciudad con una confianza del 95%, para lo cual se toma una
muestra al azar de 101 nios, obtenindose los siguientes resultados: x = 139
cm y s2 = 29.16 cm2

Problema 03:

F-CV3-3B-2 Rev. 3 Mar. 2015


Un cardilogo desea encontrar los lmites de confianza para el promedio de
presin sistlica al 90%, para lo cual se ha seleccionado una muestra de 50
individuos y se obtuvo los siguientes resultados: x = 13 y s = 3. Se asume que la
presin sistlica tiene una distribucin normal.

Problema 04:
En una muestra de 25 bebs varones de 12 semanas de vida, se obtuvo un peso
medio de 5900 gr., y una desviacin tpica de 94 gr. Obtener un intervalo de
confianza al 95% para el peso promedio.

Problema 05:
En una clnica de servicio de odontologa, de una muestra aleatoria de 220
historiales clnicos se encuentra que 42 visitas dieron lugar a una extraccin
inmediata. Calcular un intervalo de confianza del 95% para la proporcin de
visitas que dieron lugar a extraccin inmediata.

Problema 06:
Un mdico ha observado que slo una parte de los pacientes que sufren un
determinado sndrome neurolgico consiguen una curacin completa. De 64
pacientes observados se han curado 41, estimar un intervalo de confianza del
90% de la proporcin de los que sanan.

Problema 07:
Un investigador est interesado en estimar la proporcin de muertes debidas al
cncer de estmago en relacin con el nmero de defunciones por cualquier
tipo de neoplasia. En una muestra de 67 pacientes se encontr que 25
fallecieron por cncer estomacal, calcular un intervalo de confianza del 90%.

Problema 08:
En un determinado servicio de odontologa se sabe que el 22% de las visitas
llevan consigo una extraccin dentaria inmediata. En cierto ao, de 2.366
visitas, 498 dieron lugar a una extraccin inmediata. A travs de un intervalo
de confianza del 95% establecer si existe contradiccin con las cifras de ese ao
y el porcentaje establecido de siempre.

VII. FUENTES DE INFORMACIN


1. Wayne D. Bioestadstica: Base para el anlisis de las ciencias de la salud. 4
ed. Mxico: Limusa S.A; 2002.
2. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA 09: PRUEBA DE HIPTESIS PARA COMPARAR PROPORCIONES

I. MARCO TERICO

Una hiptesis es una proposicin que puede ser verdadera o falsa y debe ser
demostrado. Una hiptesis estadstica es una proposicin concerniente a uno
o ms parmetros (,,) de una o ms poblaciones con el propsito de inferir
o estimar el parmetro poblacional a partir de las estadsticas muestrales. Se
formulan dos hiptesis contrapuestas:

a) Hiptesis nula (Ho).- afirmacin que inicialmente se supone cierta


b) Hiptesis alternativa (H1).-afirmacin contradictoria a Ho y donde cae el
peso de la prueba, expresa la opinin del investigador

Cada vez que el investigador someta a prueba un planteamiento de un


problema, se debe seguir el siguiente proceso:
1. Formulacin de las hiptesis
2. Determinar el nivel de significancia
3. Eleccin del estadstico de prueba
4. Estimacin del P-valor
5. Toma de decisin

Las pruebas estadsticas se dividen en pruebas estadsticas paramtricas y no


paramtricas, sirven para decidir cul de las hiptesis debe concluir los
resultados de la investigacin, se elige en base al tipo de estudio, nivel de
investigacin, objetivo estadstico, escala de medicin de la variable de estudio
y el comportamiento de la distribucin de los datos (cuando la variable es
numrica).

La prueba estadstica Chi cuadrado es una prueba parmetrica, se utiliza para


determinar la relacin o asociacin de dos variables categricas, como tambin
para comparar grupos. Observar los esquemas:
PRUEBAS PARA COMPARAR DOS GRUPOS

2 grupos

Muestras Muestras
independientes pareadas

Frecuencias
Chi Cuadrado
pequeas:
Correccin de McNemar
Prueba exacta de
Yates
Fisher

F-CV3-3B-2 Rev. 3 Mar. 2015


PRUEBAS PARA COMPARAR TRES GRUPOS

3 o ms grupos

Muestras Muestras
independientes pareadas

Chi Cuadrado Q de Cochran

II. LOGROS DE APRENDIZAJE


Al finalizar la sesin, el estudiante aplica la prueba estadstica para comparar
proporciones en estudios de variables categricas, considerando el objetivo
estadstico y la escala de medicin de la variable de estudio.
III. MATERIALES Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
El profesor incentivar la participacin activa de los alumnos, mediante la
formulacin de hiptesis, reconocimiento de la prueba estadstica segn el tipo
de variable; luego, se procesar los datos en SPSS para obtener los resultados y
su respectivo anlisis.
En el SPSS se debe seguir la siguiente ruta:
ANALIZAR -> ESTADSTICOS DESCRIPTIVOS -> TABLAS DE CONTINGENCIA
FILAS: uso de casco
COLUMNAS: Lesin de cabeza
Estadsticos: Chi cuadrado
CONTINUAR
ACEPTAR

V. RESULTADOS
Cada equipo de trabajo presentar los resultados de la base de datos: Infeccin
urinaria.zip, con su respectivo anlisis en Word, en un archivo [Apellidos y
Nombre]. P9.doc
VI. CUESTIONARIO

Problema 01:
Se realiz un estudio para evaluar la eficacia del uso de los cascos de seguridad
para ciclistas, para prevenir lesiones en la cabeza en caso de accidentes, para

F-CV3-3B-2 Rev. 3 Mar. 2015


lo cual se seleccion una muestra aleatoria de 793 individuos que sufrieron un
accidente en bicicleta, durante un periodo de un ao (Pagano, 2001). Los
resultados se muestran en la siguiente tabla:

Lesin en la cabeza
Uso de casco
Si No
Si 17 130
No 218 428

Puede usted indicar si el uso de casco fue efectivo para prevenir lesiones en
la cabeza para los ciclistas.

Problema 02:
Se realiz un estudio para verificar la exactitud de los certificados de
defuncin. En dos hospitales se compararon los resultados de 575 autopsias
con las causas de muerte anotadas en los certificados. Uno de los hospitales
que particip en el estudio era comunitario (hospital A) y el otro era un
hospital universitario, (hospital B). Los datos aparecen en la siguiente tabla
(Pagano, 2001):

Puede usted verificar si las prcticas para llenar los certificados son similares
en los dos hospitales
Estado del certificado de defuncin
Hospital Exactitud Inexacto sin Incorrecto
confirmada cambio modificado
A 157 18 54
B 268 44 34

Problema 03:
Se realiz un estudio para conocer si el consumo de triptfano natural estaba
relacionado con la aparicin de una extraa enfermedad conocida como SEM
(Sndrome de Eosinfilo-Mialgia) en Mxico, los resultados se muestran en la
siguiente tabla (Norman y Streiner,1998):

Consumo de SEM
triptfano SI NO
SI 28 9
NO 543 211
Puede usted concluir que el consumo de triptfano est relacionado con la
aparicin del SEM?

Problema 04:
En una investigacin poblacional se obtuvieron 38152 datos que fueron
clasificados segn si sufrieron un infarto o no, y dentro de estos fueron
desagrupados de acuerdo a si tenan un valor de glucosa alto (mayor a 140
mg/dl). Se trata de establecer si un valor alto de glucosa tiene incidencia en

F-CV3-3B-2 Rev. 3 Mar. 2015


sufrir infartos. Los datos mostrados son ficticios la tabla siguiente (Azzimonti,
2001).

Infarto
Glucosa alta
SI NO
SI 161 2475
NO 748 34020

Puede usted concluir que el infarto tiene relacin con la presencia de glucosa
alta en los pacientes?

VII. REFERENCIAS BIBLIOGRFICAS

1. Pagano M. Gauvreau K. Fundamentos de Bioestadstica. 2da ed. Thompson


Editores, S.A.: Mxico D.F.; 2001.
2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed.: Barcelona; 2008.

F-CV3-3B-2 Rev. 3 Mar. 2015


UNIDAD IV PRUEBA DE HIPTESIS PARA VARIABLES
NUMRICAS
PRCTICA N 10: PRUEBAS PARA COMPARAR PROMEDIOS

I. MARCO TERICO

Prueba t de Student

Es una prueba estadstica paramtrica, la cual tiene entre sus principales


requerimientos, la verificacin de la normalidad. Es decir, para aplicar la
prueba paramtrica las variables que se analizarn tienen que tener
distribucin normal.

Vamos a analizar tres situaciones que pueden resolverse utilizando la prueba t


de Student para la comparacin de medias.

1 Una muestra simple.


2 Dos muestras pareadas o relacionadas.
3 Dos muestras independientes.

PRUEBAS PARA COMPARAR PROMEDIOS


Variable cuantitaiva
Comparar dos grupos

Muestras Muestras
independientes pareadas

Distribucin Distribucin
normal? normal?
("paramtrica") ("paramtrica")

Si No Si No

U de Man- "t" de Student Prueba de


"t" de Student
Whitney pareada Wilcoxon

II. LOGROS DE APRENDIZAJE


Al finalizar la sesin, el estudiante, aplica la prueba estadstica para comparar
promedios de datos numricos, considerando el tipo de estudio, objetivo
estadstico, escala de medicin de la variable y la forma de distribucin de los
datos.

F-CV3-3B-2 Rev. 3 Mar. 2015


III. MATERIAL Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
El profesor incentivar la participacin activa de los alumnos, mediante la
formulacin de hiptesis, reconocimiento de la prueba estadstica segn el tipo
de variable; luego. Se procesar los datos en SPSS para obtener los resultados
y su respectivo anlisis.
Prueba t de Student para muestras independientes
En el SPSS se debe seguir la siguiente ruta:
ANALIZAR -> COMPARAR MEDIAS -> PRUEBA T PARA MUESTRAS INDEPENDIENTES
VARIABLES A CONTRASTAR: Presin
VARIABLE DE AGRUPACIN: Frmacos
DEFINIR GRUPOS:
Grupo: 1
Grupo: 2
CONTINUAR
ACEPTAR
V. RESULTADOS
Cada equipo de trabajo presentar los resultados de la base de datos:
Hipertensos. zip, con su respectivo anlisis en Word en un archivo: [Apellidos
y Nombre]. P10.doc
VI. CUESTIONARIO

Problema 01:
La tabla siguiente muestra los efectos de un placebo y de la hidroclorotiacida
sobre la presin sangunea sistlica de 11 pacientes por frmaco.

Placebo 211 210 210 203 196 190 191 177 173 170 163
H-cloro 181 172 196 191 167 161 178 160 149 119 156

Segn estos datos experimentales, podemos afirmar que existe diferencia en


la presin sistlica media durante la utilizacin de estos dos frmacos?

Problema 02:
Se desea estudiar la influencia de la hipertensin en los padres sobre la presin
sangunea de los hijos. Para ello se seleccionan dos grupos de nios, unos con
padres de presin sangunea normal (grupo 1) y otros con uno de sus padres
hipertenso (grupo 2), obtenindose las siguientes presiones sistlicas:
Grupo 1 104 88 100 98 102 92 96 100 96 96
Grupo 2 100 102 96 106 110 110 120 112 90 98

F-CV3-3B-2 Rev. 3 Mar. 2015


Problema 03:
Loa siguientes datos corresponden a los residuos de Parathion (ppm) en plantas
de un lote de apio. Los resultados fueron:
0.26 0.52 0.52 0.50 0.45 1.08 0.34 0.33 0.25 0.29 0.18 0.42 0.15
1.05 0.95 0.92 0.52 0.41 0.77 0.44 0.29 0.44 0.64 0.36 0.50 0.60
0.92 0.58 0.46 0.52 0.24 0.53 0.39 0.40 0.54 0.47 0.43 0.32 0.38
0.31 0.25 0.60 0.84 0.55 0.26 0.51 0.50 0.75 0.54 0.60 0.71 0.56
0.52 0.49 0.50 0.43 0.59 0.26 0.24 0.66 0.56 0.92 0.67 0.52 0.36

Un ente fiscalizador establece, que si el residuo de insecticida es mayor a 0.50


pmm, se debe rechazar el lote de plantas de apio para consumo humano Qu
decisin se tomar a partir de esta informacin, considerando un nivel de
significancia de 1%?

Problema 04:

Se ha realizado un experimento para probar una dieta rica en lecitina favorece


la produccin de leche, en vacas de raza Holando-peruano. Se han seleccionado
18 granjas homogneas en cuanto al manejo de crianza de ganado vacuno en la
regin Cajamarca, de los cuales 9 fueron asignados aleatoriamente para recibir
un suplemento de lecitina, y los restantes actuaron como grupo control. Debido
a fallas en el seguimiento de una de las granjas que no recibieron el suplemento
de lecitina, sus datos fueron descartados. Los resultados, expresados en lt/da
promedio por vaca son los siguientes:
Sin Lecitina 13.0 14.5 16.0 15.0 14.5 15.2 14.1 13.3
Con Lecitina 17.0 16.5 18.0 17.3 18.1 16.7 19.0 18.3 18.5

En base a los datos experimentales registrados, qu conclusin puede extraer


acerca de la Lecitina?
VII. FUENTES DE INFORMACIN

1. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006.


2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona: Reverte; 2008.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA N 11: PRUEBA PARA COMPARAR PROMEDIOS EN MUESTRAS PAREADAS

I. MARCO TERICO

Prueba t de Student para muestras pareadas

Es una prueba estadstica paramtrica, que compara medidas repetidas en


mismo grupo de estudio, conocido como antes-despus. Para aplicar la prueba
estadstica, se debe comprobar si los datos de las variables que se analizarn
tienen una distribucin normal.
V. LOGROS DE APRENDIZAJE
Al finalizar la sesin, el estudiante, aplica la prueba estadstica para comparar
promedios de datos numricos, considerando el tipo de estudio, objetivo
estadstico, escala de medicin de la variable y la forma de distribucin de los
datos.
VI. MATERIAL Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
VII. PROCEDIMIENTO
El profesor incentivar la participacin activa de los alumnos, mediante la
formulacin de hiptesis, reconocimiento de la prueba estadstica segn el tipo
de variable; luego. Se procesar los datos en SPSS para obtener los resultados
y su respectivo anlisis.
En el SPSS se debe seguir la siguiente ruta:
ANALIZAR -> COMPARAR MEDIAS -> PRUEBA T PARA MUESTRAS RELACIONADAS
VARIABLES EMPAREJADAS:
Variable 1: Peso inicial
Variable 2: Peso final
ACEPTAR

V. RESULTADOS
Cada equipo de trabajo presentar los problemas del cuestionario resueltos,
con su respectivo anlisis en Word en un archivo: [Apellidos y Nombre].
P11.doc
VI. CUESTIONARIO

Problema 01:
Se quiere probar que la disminucin en el consumo de carne(a 90 gr/semana),
influye directamente en la concentracin de cido rico en la sangre; para ello
se toma una muestra aleatoria de 12 personas, a las cuales se les registra el
contenido de cido rico en mg/dl al inicio, y luego de tres meses cuyos
resultados son los siguientes:

F-CV3-3B-2 Rev. 3 Mar. 2015


Inicio 8.72 8.72 8.54 8.50 10.3 9.63 6.93 9.40 6.50 8.50 9.30 9.35
3 6.70 5.63 6.84 6.25 7.25 7.23 5.40 6.20 5.24 5.96 6.45 6.28
meses

Problema 02:
En un programa de control de enfermedades crnicas, la hipertensin est
incluida como la primera patologa a controlar. 15 pacientes hipertensos son
sometidos al programa y controlados en su tensin asistlica antes y despus
de 6 meses de tratamiento. Con los siguientes datos Es efectivo el tratamiento?

Inic. 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220
Fin. 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150

Problema 03:
Se quiere conocer si la dieta vegetariana es efectiva en la disminucin de peso,
para lo cual se toma una muestra aleatoria de 12 mujeres de 30 a 40 aos; a
las cuales se les suministra la dieta durante 3 meses con los siguientes
resultados de pesos al inicio y final del tratamiento. Probar si la dieta
vegetariana es efectiva.
Inicio 54 62 58 51 53 64 72 64 56 65 54 53
3 meses 52 56 54 49 48 54 64 58 52 58 49 49

Problema 04:
Un mdico investigador est evaluando el efecto que una dieta tiene sobre el
peso y los niveles de triglicridos de sus pacientes. Para tal objetivo realiza un
experimento en 16 pacientes, que durante 6 meses los peso en un plan de dieta.
Los resultados son los siguientes:
180 139 152 112 156 167 138 160 107 156
Triglicridos 0
94 107 145 186 112 104
100 92 118 82 97 171 132 123 174 92
Triglicridos 2
121 150 159 101 148 130

Existe diferencia significativa entre las medidas de los triglicridos por efecto
de la dieta?
VIII. FUENTES DE INFORMACIN

1. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006.


2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona: Reverte; 2008.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA N 12: ANLISIS DE VARIANZA
I. MARCO TERICO

Las pruebas de comparacin de medias o promedios permite establecer si


existen diferencias estadsticamente significativas en la comparacin de dos
muestras de variables cuantitativas, sin embargo cuando se tratan de
establecer diferencias de tres o ms muestras se utilizar en estos casos el
anlisis de varianza (ANOVA o ANVA) para poder emitir conclusiones que validen
la investigacin en estos casos. Como por ejemplo, cuando se desea comparar
si el promedio del tiempo trabajo de parto es diferente bajo tres condiciones.

3 o ms grupos

Muestras Muestras
independientes pareadas

Distribucin Distribucin
normal? normal?
("paramtrica") ("paramtrica")

Si No Si No

ANOVA para
ANOVA Kruskal-Wallis medidas Friedman
repetidas

II. LOGROS DE APRENDIZAJE


Al finalizar la sesin de aprendizaje, el estudiante aplica la prueba estadstica
para comparar tres o ms promedios, considerando el tipo de estudio, objetivo
estadstico, escala de medicin de la variable y distribucin de los datos.
III. MATERIAL Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
Se incentivar la participacin activa de los alumnos en equipo, mediante la
formulacin de hiptesis, reconocimiento de la prueba estadstica para analizar
tres o ms promedios de grupos independientes.
En el SPSS se debe seguir la siguiente ruta:

ANALIZAR -> COMPARAR MEDIAS -> ANOVA DE UN FACTOR


DEPENDEINTES: Puntuacin de la calificacin

F-CV3-3B-2 Rev. 3 Mar. 2015


FACTOR: Marca del preservativo
OPCIONES: Homogeneidad de la varianza
CONTINUAR
ACEPTAR
V. RESULTADOS
Los alumnos resolvern los problemas del cuestionario por equipos de trabajo
presentando sus resultados y su respectivo anlisis. Presentarn los resultados
de sus anlisis en un archivo: [Apellidos y Nombre]. P11.doc.
VI. CUESTIONARIO
Problema 01:
Para promover la campaa sexo seguro para pecadores se decide investigar
cul es el preservativo ms eficaz. Para esto se selecciona cuatro marcas de
preservativos: Ramss (R), Jeque (J), Troyano (T) y una marca desconocida
(D).Se selecciona aleatoriamente a un grupo de voluntarios y se les solicita
calificar a los preservativos en una escala de 0 a 10 (para lo cual se les entreg
en sobre marrn). Los resultados se muestran en la siguiente tabla (Norman y
Streiner (1998): Donde 0 es desastre y 10 es el xtasis total.

Marca de preservativo Puntuacin de la calificacin


RAMSS 4 4 5 5 6 3 4 4 3 4
JEQUE 5 5 6 6 7 6 4 5 6 3
TROYANO 7 8 7 9 6 3 2 2 2 3
DESCONOCIDO 2 1 2 3 3 4 5 4 4 3

Problema 02:
Se desea conocer si el contenido de glbulos blancos es diferente en cada tipo
de sangre, para esto se seleccionaron aleatoriamente a 11 personas por cada
tipo de sangre. Los resultados se muestran en la siguiente tabla: Kuzma y
Bohnenblust (2001) en Chernick y Friiz(2003)

Tipo de sangre Cantidad de glbulos blancos por campo


A 5000 5500 6000 6500 8000 7700 10000 6100 7200 5500 9000
B 7000 7500 8500 5000 6100 7200 9900 6400 7300 5800 8950
AB 7200 7770 8600 6000 5950 7540 11000 6200 7000 6100 7800
O 5550 6570 7620 5900 7100 6980 8750 7700 8100 4900 5800
Puede usted indicar si existe diferencia en el contenido de glbulos blancos
en cada tipo de sangre?

Problema 03:
Se desea conocer si el grado de ansiedad promedio es el mismo, en tres
enfermedades distintas. Para ello, se tomaron tres muestras de 10, 12 y 8
personas, respectivamente, con esas enfermedades, y se les aplic a cada uno
de ellas un test que mide el grado de ansiedad del individuo. Los resultados se
dan en la tabla adjunta. Qu puede concluirse de los datos?

F-CV3-3B-2 Rev. 3 Mar. 2015


Enfermedad Grado de ansiedad
Tuberculosis 4 6 5 5 6 3 3 2 6 5
Hepatitis 2 1 5 5 4 6 4 4 4 3 3 2
Cncer 7 5 8 7 9 3 5 5

Problema 04:
En una experiencia para comparar la eficacia de diversas tcnicas en el
tratamiento del dolor producido por una intervencin quirrgica superficial, 28
pacientes se agruparon al azar en 4 grupos de 7, tratando al primero con
placebo, y a los siguientes con dos tipos de analgsicos (A y B) y acupuntura.
Los datos se dan en la siguiente tabla: Qu conclusiones pueden obtenerse de
esta experiencia?
Tratamiento Minutos para la remisin del dolor
Placebo 35 22 5 14 38 42 65
Analgsico A 85 80 46 61 99 114 110
Analgsico B 100 107 142 88 63 94 70
Acupuntura 86 125 103 99 154 75 160

Problema 05:
Se est llevando a cabo un estudio para comprobar el efecto de tres dietas
diferentes en el nivel de colesterina de pacientes con hipercolesterol. Para ello,
se han seleccionado al azar 3 grupos de pacientes, de tamaos 12, 8 y 10. Los
niveles de colesterina medidos despus de 2 semanas de dieta se representan
a continuacin: Analice los resultados obtenidos.

Dieta Nivel de colesterina


A 2.9 3.35 3.25 3.0 3.3 3.1 3.25 3.25 3.1 3.05 3.25 3.0
B 3.15 2.95 2.8 3.1 2.75 2.6 2.8 3.05
C 3.0 2.6 2.65 2.2 2.55 2.3 2.35 2.6 2.35 2.6

Problema 06:
Los datos de la tabla siguiente corresponden a un experimento que se llev a
cabo para determinar cmo afecta 5 tipos de trabajo a las pulsaciones del
trabajador. Cada grupo de trabajadores fue adiestrado para realizar la tarea
que se le asigno. Un da determinado despus del adiestramiento, se midieron
las pulsaciones despus de haber realizado los trabajos respectivos.
Tarea Pulsaciones
1 54 62 52 64 78 74
2 58 56 74 48 70 80
3 68 72 68 82 60 88
4 78 78 96 98 90 99
5 56 56 52 70 62 60
Puede usted indicar si los trabajos afectan de igual manera a las pulsaciones
de los trabajadores?

Problema 07:

F-CV3-3B-2 Rev. 3 Mar. 2015


Se est estudiando un nuevo frmaco ADTO3 en pacientes con depreciacin
permanente (SAD) con el fin de analizar como reduce el grado de ansiedad en
estos enfermos. Para realizar el estudio se seleccionaron aleatoriamente 20
individuos diagnosticados con SAD y cada uno de ellos fue seleccionado
aleatoriamente en uno de los cuatro grupos determinados por la dosis de
ADTO3: (G1) 30mg. De ADTO3, (G2) 20mg. De ADTO3, (G3) 5mg. De ADTO3 y
(G4) placebo. Se le administra diariamente, a cada paciente seleccionado, la
dosis asignada durante 2 meses, al cabo de los cuales se realiza un
reconocimiento mdico y un test que mide el grado de ansiedad actual de cada
uno de los individuos la puntuacin del test es de 35 a 85 puntos, de forma que
las puntuaciones ms bajas indican un grado de ansiedad moderado elevado y
las puntuaciones altas indican un grado de ansiedad nulo o leve. Las
puntuaciones obtenidas para los veinte pacientes son las siguientes:

Grado de ansiedad
G1 G2 G3 Placebo
56 64 45 42
55 61 46 39
62 50 45 45
59 55 39 43
30 56 43 41
Se pide:
a) Identificar los distintos elementos (unidades experimentales, factores,
tratamientos) que intervienen en el estudio.
b) Estudiar si los cuatro grupos de dosis producen la misma reduccin del grado
de ansiedad.

Problema 08:
El propsito de una investigacin es cuantificar los efectos que produce fumar
cigarrillos sobre las medidas estndar del funcionamiento pulmonar en
pacientes con fibrosos pulmonar idioptica. Entre las mediciones registradas
est el porcentaje del volumen residual pronosticado. Los resultados que se
registraron de tales mediciones son los siguientes:
Nunca 35 120 90 109 82 40 68 84 124 77 74
(n= 21)
140 127 58 110 42 57 93 70 51 74
Anterior 62 73 60 77 52 115 82 52 105 143 57
(n=44)
95 82 141 64 124 65 42 53 67 95 56
80 78 47 85 105 46 66 91 151 40 80
99 69 118 131 76 69 69 97 137 103 108
Actual (n=7) 96 107 63 134 140 103 158

F-CV3-3B-2 Rev. 3 Mar. 2015


Qu resultados pueden obtenerse con estas mediciones? Brinde sus
conclusiones.

Problema 09:
Azoulay Dupuis estudiaron la eficacia de cinco medicamentos para erradicar
el Streptococcus pneumoniae de los pulmones de ratones de laboratorio
hembras en varias ocasiones antes de la infeccin. Las siguientes mediciones
corresponden a la existencia de bacterias viales en los pulmones 24 horas
despus de aplicar seis inyecciones con las dosis determinadas. Analice los
resultados obtenidos e interpretar sus resultados.

DOSIS DE MEDICAMENTOS (MG/KG)


Controles Amoxilina,50 Entromicina,50 Temafloxacina,50 Oflaxamina,100 Ciproflaxacina,100
8,8 2,6 2,6 2,6 7,30 7,86
8,6 2,6 2,6 2,6 5,30 4,60
8,10 2,6 2,6 2,6 7,48 6,45
8,40
8,80

Problema 10:
Se examinaron las caractersticas de los sitios de unin de la H-imipramina en
pacientes. Una de las variables en las que se hicieron las mediciones en las
plaquetas sanguneas los resultados son los siguientes:

SAD 634 585 520 525 693 660 520 573 731 788 736 1007 846
NO - SAD 771 546 552 557 976 204 807 526
CONTROL 1067 1176 1040 1218 942 845

Proporcionan estos datos evidencia suficiente para indicar una diferencia en


la densidad de los sitios de la unin para la H- imipramina en pacientes
permanentemente deprimidos (SAD), pacientes deprimidos por corto tiempo
(no SAD), as como en individuos sanos (grupo de control)?

Problema 11:
La enfermera supervisora de un departamento de salud local quiere analizar el
efecto de la hora del da en la duracin de las visitas domiciliarias realizadas
por el personal de enfermera, para lo cual se obtuvo la siguiente informacin:

Duracin de la visita domiciliaria segn la hora del da


Enfermera En la maana A medio da Temprano por la tarde Por la tarde
A 10 10 10 10
B 20 20 20 20
C 10 10 10 10
D 10 10 10 10
Proporcionan estos datos evidencia suficiente para indicar una diferencia en
la duracin de las visitas domiciliarias en las diferentes horas del da?

VII. FUENTES DE INFORMACIN

F-CV3-3B-2 Rev. 3 Mar. 2015


1. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006.
2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona; 2008.

F-CV3-3B-2 Rev. 3 Mar. 2015


PRCTICA N 13: PRUEBAS DE COMPARACIONES MLTIPLES

I. MARCO TERICO
Cuando se rechaza la hiptesis nula en la prueba de ANOVA, es importante
determinar entre que grupos se encuentra la diferencia detectada. Para lograr
esto se puede recurrir a realizar una comparacin por pares de grupos, conocida
como prueba de comparaciones mltiples.
Existen pruebas de comparaciones mltiples para varianzas homogneas y
varianzas no homogneas, que permiten detectar entre qu grupos se
encuentran las diferencias detectadas por el ANOVA.
II. LOGROS DE APRENDIZAJE
Al finalizar la sesin de aprendizaje, el estudiante aplica la prueba estadstica
para comparar tres o ms promedios, considerando el tipo de estudio, objetivo
estadstico, escala de medicin de la variable y distribucin de los datos.
III. MATERIAL Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
En los ejercicios de la prctica N 11 donde se rechaz la hiptesis nula, se
realizar la prueba de comparaciones mltiples adecuadas.
En el SPSS se debe seguir la siguiente ruta:
ANALIZAR -> COMPARAR MEDIAS -> ANOVA DE UN FACTOR
DEPENDEINTES: Niveles de glicemia
FACTOR: Tipos de acidosis
OPCIONES: Homogeneidad de varianzas
POST HOC: Tuckey
CONTINUAR
ACEPTAR
V. RESULTADOS
Los alumnos resolvern los problemas del cuestionario por equipos de trabajo
presentando sus resultados y su respectivo anlisis. Presentarn los resultados
de sus anlisis en un archivo. [Apellidos y Nombre]. P12.doc
VI. CUESTIONARIO
1. Realizar las comparaciones mltiples, en los problemas que rechaz la
hiptesis nula en la prctica 12.

VII. FUENTES DE INFORMACIN


1. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006.
2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona; 2008

PRCTICA N 14: REGRESIN Y CORRELACION LINEAL

F-CV3-3B-2 Rev. 3 Mar. 2015


I. MARCO TERICO
La regresin lineal establece una funcin lineal de relacin entre dos variables,
una de ellas se denomina variable dependiente y otra es la variable
independiente. La correlacin lineal mide el grado de relacin entre las
variables dependiente e independiente.

Para determinar o hallar estas medidas, el estudiante debe conocer y


diferenciar las definiciones o conceptos bsicos de: probabilidades, regresin
y correlacin.
II. LOGROS DE APRENDIZAJE
Al finalizar la sesin, el estudiante resuelve problemas de correlacin de
variables numricas y formula modelos de regresin, demostrando su capacidad
de anlisis y precisin de resultados.
III. MATERIAL Y EQUIPOS
Proyector de multimedia y ordenador con entorno Windows, software
estadstico: Word, Excel y SPSS para cada alumno.
IV. PROCEDIMIENTO
El profesor incentivar la participacin activa de los alumnos en equipo,
mediante la formulacin de hiptesis, reconocimiento de las variables
dependiente e independiente; luego se procesar los datos en SPSS para
obtener la recta de regresin y su respectiva interpretacin de resultados.

2 variables
cuantitativas

Distribucin normal Distribucin no normal

Regresin lineal
Rho de Spearman
Correlacin de Pearson

En el SPSS se debe seguir la siguiente ruta:


ANALIZAR --> REGRESIN --> LINEAL

F-CV3-3B-2 Rev. 3 Mar. 2015


DEPENDEINTES: Peso
INDEPENDIENTE: Talla
ESTADSTICOS:
Estimaciones
Ajuste del modelo
CONTINUAR
ACEPTAR
V. RESULTADOS
Los alumnos resolvern los problemas del cuestionario por equipos de trabajo
presentando sus resultados y su respectivo anlisis. Presentarn los resultados
de sus anlisis en un archivo. [Apellidos y Nombre]. P13.doc
VI. CUESTIONARIO
1. Se realiza un estudio para establecer una ecuacin mediante la cual se
pueda utilizar la concentracin de estrona en saliva (X) para predecir la
concentracin del esteroide en plasma libre (Y). Se extrajeron los
siguientes datos de 14 varones sanos:
X 1.4 7.5 8.5 9 9 11.0 13 14 14,5 16 17 18 20 23
Y 30 25 31.5 27.5 39.5 38 43 49 55 48.5 51 64.5 63 68
Determinar la variacin de la concentracin de estrona en plasma por
unidad de estrona en saliva.

2. Los investigadores estn estudiando la correlacin entre obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre
el peso ideal (X). La respuesta al dolor se mide utilizando el umbral de
reflejo nociceptivo de flexin (Y), que es una medida de sensacin de
punzada. Se obtienen los siguientes datos:

X 89 90 75 30 51 75 62 45 90 20
Y 2 3 4 4,5 5,5 7 9 13 15 14

a. Hallar e interpretar el modelo de regresin


b. Qu porcentaje de sobrepeso podemos esperar para un umbral de
reflejo de 10?
c. Qu porcentaje de la varianza del peso es explicada mediante un
modelo de regresin lineal por la variacin del umbral de reflejo?

3. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la


capacidad corporal para absorber hierro y plomo. Participan en el estudio
10 sujetos. A cada uno se le da una dosis oral idntica de hierro y plomo.
Despus de 12 das se mide la cantidad de cada componente retenida en el
sistema corporal y, a partir de sta, se determina el porcentaje absorbido
por el cuerpo. Se obtuvieron los siguientes datos:
X: Porcentaje de hierro 17 22 35 43 80 85 91 92 96 100
Y: Porcentaje de plomo 8 17 18 25 58 59 41 30 43 58
a. Comprobar la idoneidad del modelo lineal de regresin.

F-CV3-3B-2 Rev. 3 Mar. 2015


b. Obtener la recta de regresin, sustentar si el modelo lineal es
adecuado.
c. Predecir el porcentaje de hierro absorbido por un individuo cuyo
sistema corporal absorbe el 15% del plomo ingerido.

4. Para estudiar el efecto de las aguas residuales de las alcantarillas que


afluyen a un lago, se toman medidas de la concentracin de nitrato en el
agua. Para monitorizar la variable se ha utilizado un antiguo mtodo
manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto una
alta correlacin positiva entre las medidas tomadas empleando los dos
mtodos, entonces se har uso habitual del mtodo automtico. Los datos
obtenidos son los siguientes:

X : Manual 25 40 120 75 150 300 270 400 450 575


Y : Automtico 30 80 150 80 200 350 240 320 470 583

a. Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es


apropiado, hallar la recta de regresin de Y sobre X y utilizarla para
predecir la lectura que se obtendra empleando la tcnica automtica
con una muestra de agua cuya lectura manual es de 100.
b. Indicar el grado de relacin que hay entre el mtodo manual y
automtico
c. Hallar el coeficiente de determinacin. Justifique a partir de todo lo
anterior porqu se denomina R2 como grado de bondad del ajuste lineal.

5. Se ha medido el aclaramiento de creatinina en pacientes tratados con


Captopril tras la suspensin del tratamiento con dilisis, resultando la
siguiente tabla:

Das tras la dilisis 1 5 10 15 20 25 35


Creatinina (mg/dl) 5.7 5.2 4.8 4.5 4.2 4 3.8

a. Hallar la ecuacin de regresin lineal que mejor exprese la variacin de


la creatinina, en funcin de los das transcurridos tras la dilisis, as como
el grado de bondad de ajuste y la varianza residual.
b. En qu porcentaje la variacin de la creatinina es explicada por el
tiempo transcurrido desde la dilisis?
c. Si un individuo presenta 4.1 mg/dl de creatinina, cunto tiempo es de
esperar que haya transcurrido desde la suspensin de la dilisis?

VII. FUENTES DE INFORMACIN

1. Glantz SA. Bioestadstica. 6 ed. Mxico: McGraw Hill Interamericana; 2006


2. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona; 2008.

BIBLIOGRAFA

F-CV3-3B-2 Rev. 3 Mar. 2015


1. Glantz A. Bioestadstica. 6a ed. Mxico: McGraw Hill Interamericana; 2006.
2. Hernndez R, Fernndez C, Baptista P. Metodologa de la Investigacin 2 ed.
Espaa: Mc Graw-Hill; 2010.
3. Martin Q. Cabero M. De Paz Y. Tratamiento estadstico de datos con SPSS.
Madrid: Thomson; 2008.
4. MacchiR. Introduccin a la Estadstica en Ciencias de la Salud. Buenos Aires:
Panamericana; 2001.
5. Pagano M, GauvreauK. Fundamentos de Bioestadstica. 2 ed. Mxico D. F:
Thompson Editores S.A; 2001.
6. Pagano, R. Estadstica Para Las Ciencias Del Comportamiento.7a. ed. Mxico
D.F: Editores S.A; 2006
7. Perez C. Tcnicas Estadsticas con SPSS. Madrid: Prentice Hall; 2001.
8. Quispe U. Fundamentos de Estadstica. 2 ed. Lima: San Marcos; 2005.
9. vila RB. Estadstica Elemental. Lima: Estudios y ediciones R.A; 2010.
10. Wonnacott H y Wonnacott R. Introduccin a la Estadstica. 2 ed. Mxico D.
F: Limusa S.A; 2002.
11. Villalta S, Pardell J, Alenta H. Manual de Bioestadstica. 3 ed. Barcelona:
Masson S.A; 2003.
12. Box GEP, Hunter JS. Estadstica para investigadores: Diseo, innovacin y
descubrimiento. 2 ed. Barcelona: Reverte; 2008.

F-CV3-3B-2 Rev. 3 Mar. 2015


ANEXO N1: Registro de datos de pacientes del Centro geritrico Renacer
N Sexo Peso Talla Edad Diagnstico Destino
1 Masculino 72 1.68 29 Enfermo mental Hogar de familiares
2 Masculino 67 1.68 35 Enfermo mental No ha dejado el Geritrico
3 Femenino 52 1.55 34 Fsicamente enfermo No ha dejado el Geritrico
4 Masculino 74 1.72 36 Enfermo mental No ha dejado el Geritrico
5 Femenino 54 1.57 25 Retrasado mental No ha dejado el Geritrico
6 Femenino 48 1.55 20 Enfermo mental No ha dejado el Geritrico
7 Femenino 55 1.60 31 Fsicamente enfermo No ha dejado el Geritrico
8 Femenino 51 1.60 89 Fsicamente enfermo Fallecido
9 Masculino 55 1.63 42 Retrasado mental No ha dejado el Geritrico
10 Masculino 53 1.68 41 Enfermo mental No ha dejado el Geritrico
11 Femenino 62 1.55 47 Fsicamente enfermo No ha dejado el Geritrico
12 Masculino 60 1.66 41 Fsicamente enfermo Hogar de familiares
13 Masculino 51 1.54 87 Enfermo mental No ha dejado el Geritrico
14 Femenino 55 1.59 56 Retrasado mental Fallecido
15 Femenino 55 1.57 50 Retrasado mental No ha dejado el Geritrico
16 Femenino 52 1.57 28 Fsicamente enfermo Otro Geritrico
17 Masculino 67 1.69 35 Retrasado mental No ha dejado el Geritrico
18 Femenino 52 1.59 23 Fsicamente enfermo No ha dejado el Geritrico
19 Femenino 48 1.56 39 Retrasado mental Hospital
20 Masculino 65 1.68 42 Enfermo mental No ha dejado el Geritrico
21 Femenino 48 1.56 72 Enfermo mental Sanatorio particular
22 Masculino 68 1.69 52 Enfermo mental No ha dejado el Geritrico
23 Femenino 57 1.62 31 Fsicamente enfermo No ha dejado el Geritrico
24 Masculino 70 1.72 35 Fsicamente enfermo Otro Geritrico
25 Masculino 59 1.67 42 Fsicamente enfermo No ha dejado el Geritrico
26 Femenino 68 1.68 29 Enfermo mental Hogar de familiares
27 Femenino 59 1.60 61 Retrasado mental No ha dejado el Geritrico
28 Femenino 57 1.53 18 Enfermo mental Hospital
29 Femenino 51 1.61 64 Retrasado mental No ha dejado el Geritrico
30 Masculino 61 1.68 51 Fsicamente enfermo No ha dejado el Geritrico
31 Femenino 52 1.57 30 Fsicamente enfermo Calle
32 Femenino 65 1.64 35 Retrasado mental No ha dejado el Geritrico
33 Masculino 57 1.66 40 Fsicamente enfermo Sanatorio particular
34 Masculino 57 1.58 76 Retrasado mental Hospital
35 Masculino 68 1.73 59 Fsicamente enfermo No ha dejado el Geritrico
36 Femenino 46 1.54 71 Enfermo mental Sanatorio particular
37 Femenino 48 1.52 62 Enfermo mental No ha dejado el Geritrico
38 Femenino 51 1.58 65 Enfermo mental Hospital
39 Masculino 75 1.73 51 Retrasado mental No ha dejado el Geritrico
40 Femenino 64 1.65 18 Retrasado mental Otro Geritrico

F-CV3-3B-2 Rev. 3 Mar. 2015

You might also like