You are on page 1of 30

Bioestadstica 1 de Medicina

1. NOCIONES BSICAS SOBRE EL MANEJO DEL SPSS

1.1. INTRODUCCIN.
El programa informtico SPSS para Windows, es un programa estadstico. La ltima versin de SPSS en el mercado es la V.11.0.
Cada versin ms moderna incorpora alguna mejora o soluciona algn error de programacin con respecto a la versin anterior.
El programa SPSS permite trabajar con conjuntos de datos (bases de datos) para realizar anlisis estadsticos y construccin de
grficas. Los archivos de datos compatibles con el programa SPSS son- adems de los archivos de datos de SPSS- archivos de datos de
texto (datos ASCII) y archivos de hoja de clculo, entre otros.
Para entrar en el programa SPSS, se pulsa con el ratn el botn Inicio situado en el margen inferior izquierdo de la pantalla del
ordenador. (Si no se especifica, siempre se pulsar el botn izquierdo del ratn).
Hecho esto, se visualiza un men en forma de persiana. Se arrastra el cursor y se pulsa sobre la opcin programas- SPSS-V 11.0.
Al iniciar, se visualiza un cuadro de dilogo. La mayora de las opciones de los mens acceden a un cuadro de dilogo cuando se
seleccionan. El cuadro de dilogo presenta varias opciones. Las dos opciones ms frecuentemente utilizadas son:
Introducir datos: si se quiere crear una base de datos nueva en SPSS.
Abrir una fuente de datos existente: si se quiere abrir una base de datos en formato SPSS ya creada y almacenada en un directorio del
ordenador o en un disquet.
Elegida la opcin deseada, se pulsa el botn de comando ACEPTAR. Los botones de comando son los botones que dan la instruccin
al programa para que realice una accin concreta.

1
Nociones bsicas sobre el manejo de SPSS
1.2. VENTANAS EN SPSS
El programa SPSS contiene tres tipos de ventanas que pueden almacenar archivos de forma independiente.
1.2.1. Ventana de editor de datos
La ventana de editor de datos es una ventana rectangular compuesta por una cuadrcula con diferentes filas, columnas y barras de
desplazamiento verticales y horizontales. Las barras de desplazamiento permiten el movimiento por la base de datos.
Contiene:
a) Barra de ttulos - en nuestro caso Sin ttulo-Editor de datos SPSS para Windows. En el margen superior derecho se sitan los
botones que minimizan (0), maximizan (1) lo cierran (r) la ventana.
b) Barra de mens - haciendo un click en cualquiera de los nombres, se despliega una lista de comandos con diferentes funciones.
c) Barra de herramientas - es un conjunto de botones con diferentes funciones. Algunas de las operaciones que se hacen desde el men,
pueden hacerse con la barra de herramientas de forma rpida.

La ventana de editor de datos contiene, adems, dos secciones que pueden ser intercambiadas haciendo un click sobre su lengeta
correspondiente (situada en la esquina inferior izquierda de la ventana de editor de datos):

1.2.1.1. Vista de datos


En esta seccin, las filas representan los casos. Las columnas, las variables de inters. Cada una de las celdas representa un dato.
Para fijar un dato basta con situarse en la celda, escribir el dato y pulsar la tecla enter.
Los datos empleados en los diferentes anlisis estadsticos y en la construccin de grficas aparecen visualizados en esta ventana.
1.2.1.2. Vista de variables
En esta seccin, las filas representan las variables de inters. Las columnas, las propiedades o caractersticas de cada variable.
Un archivo de datos en formato SPSS queda definido por la extensin sav.
1.2.2. Ventana de resultados
La ventana de resultados est compuesta por dos secciones. La seccin izquierda muestra un resumen de los resultados. La seccin
derecha de la ventana visualiza la totalidad de los resultados estadsticos.
Las grficas realizadas con el programa tambin se visualizan en esta ventana.
Un archivo de SPSS de resultados queda definido por la extensin spo.

2
Bioestadstica 1 de Medicina

1.2.3. Ventana de grficas


Las grficas obtenidas con el programa SPSS se visualizan dentro de la ventana de resultados pero desde esta ventana no pueden
ser modificadas. Para modificar una grfica es necesario editarla previamente. Situndose sobre la grfica y pulsando el ratn, la grfica
es editada. Tras esta accin aparece la ventana de grficas en la pantalla. A travs de la barra de mens o la barra de herramientas la
grfica puede ser modificada.

1.3. CREACIN DE UNA BASE DE DATOS EN SPSS.


La creacin de una base de datos se realiza desde la ventana de editor de datos. Puede accederse a esta ventana directamente al
entrar en el programa SPSS. El cuadro de dilogo que aparece al iniciar el programa permite la eleccin de la opcin Introducir datos.
Si el programa SPSS est ya abierto, la opcin de creacin de una nueva base de datos se realiza acudiendo a la barra de mens de
la ventana de editor de datos. Se selecciona ARCHIVO-NUEVO-DATOS.
1.3.1. Variables nuevas.

3
Nociones bsicas sobre el manejo de SPSS
Las variables nuevas, deben ser primero insertadas y despus definidas. La insercin puede realizarse desde la seccin Vista de
datos. Se acude al men DATOS-INSERTAR VARIABLE.

La definicin de las variables se realiza desde la seccin Vista de variables del editor de datos. En esta seccin tambin pueden
crearse nuevas variables.

Nombre. Desde esta opcin puede definirse la variable de inters. Permite introducir 8 caracteres (letras). Cada definicin se
visualiza en una columna de la seccin de Vista de datos de la ventana del editor de datos.
Tipo. Define el tipo de variable. Al pulsar sobre la celda de inters, se visualiza un cuadro de dilogo con diversas opciones. Las
tres opciones ms utilizadas son:
Numrico: Para realizar clculos estadsticos (Independientemente a que se introduzcan letras o nmeros).
Cadena: Para introducir nmeros y letras pero sin fines estadsticos, nicamente informativos o de definicin.
Fecha: Para introducir una fecha.
Anchura. Indica el nmero de caracteres permitidos para esa variable.
Decimales. Determina el nmero de decimales permitidos en las variables numricas.
Etiqueta. Permite introducir una definicin larga de la variable.
Valores. Desde este campo se pueden asignar cdigos a las diferentes categoras dentro de una variable cualitativa. Para
obtener informacin sobre los cdigos (etiquetas) de las variables cualitativas en la vista de datos:
1. En el men, ir a VER-ETIQUETAS DE VALOR.
2. En la barra de herramientas (2 botn por la derecha).
Perdidos. Opcin que permite definir valores perdidos. Los valores perdidos definidos desde esta opcin sern identificados por
el programa y eliminados del anlisis estadstico.
Normalmente los valores perdidos se definen mediante nmeros tales como 999, -99,99, etc.
Columnas. Alineacin. tiles para dar formato al aspecto de los datos.
Medida. La variable puede medirse en escala (cuantitativa), en medida ordinal (cualitativa ordinal) o en medida nominal
(cualitativa nominal).

Ejemplo prctico:
Pretendemos crear una base de datos sobre la prevalencia de actividad fsica entre una muestra compuesta por 10 individuos.
Disponemos del sexo y del nmero de horas semanales empleadas en la realizacin de ejercicio.
Id 1 2 3 4 5 6 7 8 9 10
Sexo Mujer Mujer Varn Mujer Mujer Varn Varn Varn Mujer Varn
Ejercic 3 1,5 3 0 0,5 -9,9 0 5 2 4

Procedimiento:
Inicio- programas- SPSS-V 11.0.- Introducir datos- ACEPTAR.
Vista de variable.
Nombre: id
Tipo: Numrico
Decimales: 0

4
Bioestadstica 1 de Medicina
Etiqueta- Nmero de identificacin
Medida: nominal
Con esto hemos introducido la variable Id. Ahora hacemos lo correspondiente con Sexo y Ejercicio, en filas diferentes:
Nombre: sexo
Tipo: Numrico
Decimales: 0
Etiqueta: Sexo
Valores: al sealar sobre el recuadro con los puntos suspensivos se abre una ventana desde la que se pueden indicar las etiquetas de valor.
Valor: 1- Etiqueta de valor: Hombre- AADIR
Valor: 2- Etiqueta de valor: Mujer- AADIR- ACEPTAR
Medida: nominal
Nombre: ejercic
Tipo: Numrico
Decimales: 1
Etiquetas: Etiqueta de variable: actividad fsica (horas/semana)
Valores perdidos: Valores perdidos discretos: 9,9- CONTINUAR
Medida: escala- ACEPTAR.
Ahora se pueden introducir los datos de cada individuo en la ventana de editor de datos. Para la variable sexo, introducir los datos como 1 y 2.
1.3.2. Transformacin de una variable cuantitativa.
La transformacin de una variable cuantitativa en otra tambin cuantitativa se realiza desde la opcin TRANSFORMAR-CALCULAR.
La variable de destino define la nueva variable trasformada a partir de la original. La variable original se selecciona a partir de la lista
de variables y se traslada automticamente al recuadro de expresin numrica tras pulsar el botn de flecha. Las operaciones que realiza
el programa son funciones y clculos matemticos.
NOTA: el smbolo significa multiplicacin y el elevacin al cuadrado.

Ejemplo prctico:
Deseamos transformar la prevalencia semanal de actividad fsica en prevalencia anual de ejercicio.
Procedimiento:
TRANSFORMAR-CALCULAR.
Variable de destino: actanual
Tipo y etiqueta: Etiqueta: actividad fsica anual- CONTINUAR
Seleccionar la variable original: ejercic- botn flecha
Expresin numrica: (ejercic/7)*365- ACEPTAR.
1.3.3. Recodificar una variable.
La recodificacin, supone la transformacin de una variable cuantitativa en una cualitativa ordinal o incluso nominal. Esta opcin
permite adems, la transformacin de una variable cualitativa en otra tambin cualitativa. No hay que confundir la recodificacin con la
creacin de etiquetas de valores.

5
Nociones bsicas sobre el manejo de SPSS
Se acude al men TRANSFORMAR-RECODIFICAR. La recodificacin puede realizarse en la misma o en diferente variable.
Nota: si elegimos la opcin en la misma variable, la variable de la cual recodificamos desaparecer y solo permanecer la nueva variable creada.
Ejemplo prctico
1-Deseamos transformar los valores perdidos (,) de nuestra base de datos por valores 9,9.
Para ello, se recodificarn todas aquellas variables con valores perdidos (,). En nuestro caso, la nica variable con valores perdidos (,) es la variable
denominada actanual.
Procedimiento:
TRANSFORMAR- RECODIFICAR- En las mismas variables.
Se selecciona la variable actanual
Valores antiguos y nuevos
Valor antiguo: Perdido por el sistema
Valor nuevo: -9,9- AADIR - CONTINUAR- ACEPTAR.
Nota: Al sustituir el valor (,) por un valor 9,9, el ordenador identifica 9,9 como valor real que incluir en todos los anlisis. Para evitar esto, se debe fijar
el valor 9,9 como valor perdido a travs de la vista de variables y identificando en la columna Perdidos al 9,9. De la misma forma, puede crear se una
etiqueta de valor para el 9,9, ya que no es un nmero como tal sino un cdigo, para ello se acudir al campo Etiqueta en esta misma vista.
2-Queremos clasificar la muestra segn el nivel de actividad fsica anual que realicen los sujetos. El nivel de actividad fsica se
medir mediante la variable nivejerc, con 4 categoras (no actividad, baja actividad, actividad intermedia y alta actividad). Baja
actividad tendrn aquellos individuos que dedican menos de 50 horas anuales al ejercicio, intermedia los que dedican de 50 a
150 horas anuales e intensa aquellos que dedican ms de 150 horas anuales a la realizacin de actividad fsica).
Procedimiento:
TRANSFORMAR- RECODIFICAR- En distintas variables.
Variable de entrada: actanual
Variable de resultado: Nombre: nivejerc- CAMBIAR
Valores antiguos y nuevos
Valor antiguo: 0 Valor nuevo: 0 AADIR
Rango: Del menor a 49,9 Valor nuevo: 1 AADIR
Rango: 50 hasta 149,9 Valor nuevo: 2 AADIR
Rango: 150 hasta el mayor Valor nuevo: 3 AADIR
CONTINUAR- ACEPTAR.

NOTA: deben asignarse etiquetas para cada cdigo de la variable nivejerc. Por otro lado, debern quedar fijados los valores perdidos (,) como valores -
9,9 y ser detectados como valores perdidos por el ordenador.
1.3.4. Otras operaciones.
Todas estas operaciones sencillas se hacen desde el men DATOS.
1.3.4.1.Ordenar casos. Se elige el comando ordenar casos. Aparece un nuevo cuadro de dilogo del cual se elige la variable y a
continuacin se decide la ordenacin (ascendente o descendente). A continuacin se pulsa ACEPTAR.
1.3.4.2.Insertar un caso. La operacin es similar a la utilizada para insertar una nueva variable. DATOS-INSERTAR CASO.

6
Bioestadstica 1 de Medicina
1.3.4.3.Borrar casos o variables. El borrar un caso y el borrar una variable, siguen el mismo procedimiento. Basta seleccionar una fila (si
es un caso) o una columna (si es una variable), ir a men EDICIN y pulsar BORRAR.
Puede hacerse tambin a travs del teclado, pulsando la tecla Supr.
1.3.4.4.Seleccionar casos. Esta opcin es empleada cuando solo interesan algunos casos especficos de una o varias variables de la
base de datos.
Se elige el comando DATOS-SELECCIONAR CASOS.
Existen diferentes criterios de seleccin. (Si se quieren seleccionar todos los casos, si se quiere seleccionar los casos que cumplan una
determinada condicin, si se quiere una muestra aleatoria de casos, o si lo que se quiere es un rango de casos). Hay que tener en cuenta
que los casos no seleccionados, pueden ser filtrados o eliminados. (En este 2 caso, los datos dejarn de visualizarse y se perdern al
guardar el archivo).
1.3.4.5.Segmentar archivo. Permite segmentar (dividir) la base de datos. La divisin se realiza en base a una o varias variables. Gracias
a esta opcin pueden realizarse anlisis estadsticos y construccin de grficas por grupos especficos.
Se elige el comando DATOS-SEGMENTAR ARCHIVO.
1.3.4. Guardar los datos.
Si se tiene una base de datos perteneciente a SPSS se debe acudir a la barra de men y elegir la opcin ARCHIVO- GUARDAR
COMO. Aparece una ventana donde se debe especificar:
Guardar en: directorio en el cual se quiere guardar el archivo. Se selecciona a travs de un men desplegable que aparece al pulsar el
botn flecha.
Nombre del archivo: se da un nombre al archivo.
Archivo de tipo: SPSS (*.sav). El nombre de un archivo de SPSS siempre finalizar con la extensin sav. GUARDAR.
Ejemplo prctico:
Procedimiento:
ARCHIVO-GUARDAR COMO.
Guardar en : Disco de 31/2 A o en la unidad U
Nombre del archivo: ejercicio
Archivo de tipo: SPSS (*.sav)- GUARDAR.

7
Nociones bsicas sobre el manejo de SPSS
1.4. INTRODUCCIN DE DATOS DE UN ARCHIVO DE SPSS.
Puede accederse a un archivo de datos de SPSS directamente al entrar en el programa. El cuadro de dilogo que aparece al iniciar el
programa permite la eleccin de la opcin Abrir un archivo creado anteriormente.
Si el programa SPSS est ya abierto, la opcin de creacin de una nueva base de datos se realiza acudiendo a la barra de mens de
la ventana de editor de datos. Se selecciona ARCHIVO-ABRIR.
La tercera opcin disponible en el programa es acudir al botn de herramientas colocado en primer lugar del men.
Aparece una ventana donde se pide:
Buscar en: directorio en el que se encuentra almacenado el archivo
Nombre del archivo: Se debe buscar en la lista desplegable de la parte superior de la ventana
Archivo de tipo: SPSS (*.sav). El nombre del archivo siempre finalizar con la extensin sav- ABRIR.

1.5. INTRODUCCIN DE DATOS ASCII.


Los datos ASCII, son datos de texto introducidos en una hoja en blanco bajo dos formatos diferentes. Las variables pueden
presentarse en columnas (Formato Fijo) o estar delimitadas por comas o tabuladores.

Formato FIJO Variables delimitadas por tabuladores / comas


1 0 1 0 1,0,1,0,2,0,1,0,3,1,2,0,4,1,3,1,5,0,4,1
2 0 1 0
3 1 2 0
4 1 3 1
5 0 4 1
Para abrir un archivo ASCII, se acude a: ARCHIVO-LEER DATOS DE TEXTO.
Buscar en: se busca el archivo en el directorio en el que se encuentra almacenado
Nombre del archivo: Debemos buscarlo en la lista desplegable de la parte superior de la ventana
Archivo de tipo: ASCII (*dat, *.txt). El nombre del archivo siempre finalizar con la extensin dat o txt- ABRIR.
Se visualiza un cuadro de dilogo titulado Asistente para la importacin de texto, (con 6 pasos). En el paso 2, aparece la opcin
sobre la forma de presentacin de las variables. Si las variables se han introducido en columnas se elige la opcin Ancho fijo. Si la
organizacin de las variables es mediante comas o tabuladores se elige la opcin Delimitadas.

Tras importar los datos, las variables sern definidas en SPSS (como se recordar se acude a la opcin DEFINIR VARIABLE).

8
Bioestadstica 1 de Medicina
NOTA: Es conveniente guardar la base de datos ASCII como archivo de SPSS.
Ejemplo prctico
Queremos seleccionar nicamente a los sujetos que consumen alcohol y tienen enfermedad cardiaca de la base de datos
Cardio.dat
Esta base de datos est compuesta por 4 variables introducidas como columnas. Las 4 variables son
N de identificacin Consumo de alcohol Enfermedad cardiaca.
Hbito tabquico 0= No consume alcohol 0=No
0=No Fuma 1= Consume alcohol 1=S
1=Fuma
La extensin *dat indica que se trata de una base de datos ASCII.
Procedimiento:
1-ARCHIVO-LEER DATOS DE TEXTO.
Buscar en: Disco de 3 (A:)- Basedat
Nombre de archivo: cardio.dat
Archivos de tipo: Archivos de datos (*.dat) (si el fichero tuviera extensin *.txt seleccionaramos archivo de texto)- ABRIR
Se siguen los pasos del asistente para la importacin de texto. Cabe hacer mencin a dos pasos elementales en la importacin de este tipo de datos.
Paso 2: En este caso las variables estn organizadas en forma de ancho fijo.
Paso 4: Las variables quedan delimitadas por tabuladores verticales en el paso 4. Los tabuladores ocupan las siguientes posiciones:

Variable 1 Variable 2 Variable 3 Variable 4

id tabaco alcohol enfcard

2-Las variables id, tabaco, alcohol y enfcard deben definirse desde el editor de datos. Algunas de ellas poseen etiquetas de valor.
3-Una vez importado el fichero, para seleccionar aquellos individuos de la base de datos que consumen alcohol y tienen enfermedad cardiaca: DATOS-
SELECCIONAR CASOS- Seleccionar si se satisface la condicin- SI:

La variable alcohol y la variable enfcard se colocan en el recuadro de


seleccin gracias al botn flecha.
La condicin de seleccin es que los individuos tengan un valor 1 en
la variable alcohol y en la variable enfcard. AsAlcohol=1 & enfcard=1
CONTINUAR-ACEPTAR
NOTA: Los casos no seleccionados sern filtrados; siguen
mantenindose en la base de datos pero no se utilizarn en los anlisis
posteriores.
4-Realizado el ejercicio, guardar el archivo con el nombre de
cardio.sav. ARCHIVO-GUARDAR COMO.
Guardar en: Disco de 3 A o unidad U
Nombre del archivo: cardio
Guardar como tipo: SPSS (*.sav)- GUARDAR.

9
Nociones bsicas sobre el manejo de SPSS
2- ESTADISTICA DESCRIPTIVA Y ESTIMACIN DE PARMETROS

2.1. CLCULOS BSICOS (MEDIDAS DE TENDENCIA CENTRAL, DISPERSIN, ETC).


Desde la barra de men, se elige la opcin ANALIZAR-ESTADSTICOS DESCRIPTIVOS-DESCRIPTIVOS. Se seleccionan las variables
de anlisis y se pulsa Opciones. Aparece un cuadro de dilogo con medidas de distribucin, medidas de tendencia central y medidas de
dispersin. CONTINUAR- ACEPTAR.

Muchas de las operaciones anteriores, pueden realizarse desde la opcin ESTADSTICOS DESCRIPTIVOS-FRECUENCIAS-
Estadsticos. Se seleccionan las medidas- CONTINUAR- ACEPTAR.

2.2. COMPROBACIN DE LA NORMALIDAD


Desde la opcin ANALIZAR-ESTADSTICOS DESCRIPTIVOS EXPLORAR.
Bajo el ttulo Dependientes, se coloca la variable de inters. El botn Grficas debe estar activo.
La nica opcin que debe marcarse es Grficas con pruebas de normalidad (en el apartado dispersin por nivel con prueba de
Levene, debe marcarse el ninguno). CONTINUAR- ACEPTAR.

NOTA: La prueba de normalidad da el resultado de dos test. El test de Shapiro-Wilks y el de Kolmogorov-Smirnov (con la correccin de Lilliefors). El
primero nicamente es vlido si el tamao de muestra es menor o igual a 50 casos. De los dos test es mejor utilizar el de Shapiro-Wilks, sobre todo cuando
se trabaja con la versin 6.1, porque en esta versin, el test K-S tiene un error de programacin y puede dar un resultado errneo (esto no ocurre en
versiones posteriores).
2.3.CLCULO DE LA MEDIANA, PERCENTILES Y CUARTILES.

10
Bioestadstica 1 de Medicina
Desde la opcin ANALIZAR-ESTADSTICOS DESCRIPTIVOS-FRECUENCIAS. Se selecciona la variable, se pulsa Estadsticos y se
marcan las opciones deseadas. Para el clculo de percentiles, se selecciona la opcin Percentiles- se incluye el nmero de percentil-
AADIR CONTINUAR-ACEPTAR.

2.4. ESTIMACIN DE UNA MEDIA Y CLCULO DE SU INTERVALO DE CONFIANZA.


Se realiza desde la opcin ANALIZAR-ESTADSTICOS DESCRIPTIVOS-EXPLORAR. Bajo el ttulo Dependientes, se coloca la variable
de inters- Estadsticos- Descriptivos.
Se escribe el intervalo de confianza que se quiere. A continuacin CONTINUAR- ACEPTAR.

Ejemplo prctico:
Contamos con una base de datos que contiene informacin sobre un total de 30 ancianos a los que se somete a diferentes niveles
de entrenamiento para valorar el nmero de escaleras que son capaces de subir. El archivo recibe el nombre de OLDOLD.sav.
Se desea saber.
A La edad media y la desviacin tpica de los hombres y de las mujeres de la base de datos.
B Comprobar que la variable edad sigue una distribucin normal tanto para los ancianos del grupo 1 como para los
ancianos del grupo 2.
C Calcular los quintiles de las variable escpre (escaleras subidas por los ancianos antes de la intervencin) y escpost
(escaleras subidas por los ancianos despus de la intervencin).
D Calcular la media y el intervalo de confianza al 90% de la variable tiempo de seguimiento de los ancianos (time).
Procedimiento:
A.
1-Abrir base de datos a travs de la opcin ARCHIVO-ABRIR.

2-Se desea calcular dos estadsticos separadamente en hombres y en mujeres. As, el archivo debe ser fragmentado (segmentado). Por un lado se
trabajar con hombres nicamente y por otro con mujeres. La variable de segmentacin es el SEXO. DATOS-SEGMENTAR ARCHIVO.
Organizar los resultados por grupos. Grupos basados en: sexo- ACEPTAR.

11
Nociones bsicas sobre el manejo de SPSS

3-ANALIZAR-ESTADSTICOS DESCRIPTIVOS-DESCRIPTIVOS

Variables: edad
Opciones: media- desviacin- CONTINUAR- ACEPTAR.

B. Para calcular la normalidad de la variable edad en este caso, el criterio de segmentacin vara. Se debe segmentar el archivo por la variable grupo.
Existe una opcin adicional para calcular la normalidad de una variable segn los valores de una segunda.

1-DATOS-SEGMENTAR ARCHIVO- Analizar todos los casos, no crear grupos.


2-ANALIZAR-ESTADSTICOS DESCRIPTIVOS EXPLORAR.
Dependientes: edad
Factores: grupo
Grficas- Grficas con pruebas de normalidad- CONTINUAR- ACEPTAR.
C. Los cuatro quintiles corresponden a los percentiles 20, 40, 60 y 80.
ANALIZAR-ESTADSTICOS DESCRIPTIVOS-FRECUENCIAS.
Variables: escpre, escprost
Estadsticos- Percentiles: 20- AADIR 40- AADIR- 60- AADIR- 80- AADIR- CONTINUAR- ACEPTAR.
D. ANALIZAR-ESTADSTICOS DESCRIPTIVOS-EXPLORAR.
Dependientes: time
Estadsticos- Descriptivos- Intervalo de confianza para la media- 90- CONTINUAR- ACEPTAR.

3. GRFICAS

Nota: Para trabajar con cualquier grfica de SPSS, es necesario editarla primero. La grfica puede modificarse nicamente desde la ventana de grficas.

3.1. DIAGRAMA DE BARRAS SIMPLES Y AGRUPADAS.


Esta opcin de grfica es utilizada para variables cualitativas nominales, cualitativas ordinales y cuantitativas discretas.
Las barras simples representan una nica variable cualitativa, mientras que las barras agrupadas y apiladas representan una variable
cualitativa o cuantitativa en funcin de una segunda variable cualitativa.
Sobre el eje X (abscisas) se representa la/s categoras de la/s variable/s y sobre el eje Y (ordenadas) la frecuencia de distribucin
(porcentaje, etc) de cada una de las categoras.

Ejemplo prctico:

12
Bioestadstica 1 de Medicina
A. Se desea representar mediante un diagrama de barras, la distribucin (en porcentaje) de la variable grado de disnea
provocada por el tabaco en la totalidad de la muestra del archivo tabaco.sav.
B. Se desea representar la distribucin (en frecuencia) de esta variable entre los individuos sanos y enfermos separadamente.
A.
1. La extensin sav del nombre del archivo, indica que tabaco.sav es un archivo perteneciente a SPSS. ARCHIVO-ABRIR.
2. GRFICOS- BARRAS- Simple- DEFINIR.
Las barras representan: Esta opcin permite representar en el eje Y, el porcentaje o frecuencia de casos de cada una de las categoras de la variable
que se desea representar (grado de disnea). En este caso % de casos.
Eje de categoras: disnea- ACEPTAR.

Existe otra posibilidad de realizar la grfica de barras simples.


ANALIZAR-ESTADSTICOS DESCRIPTIVOS-FRECUENCIAS
Variables: disnea
Grficos- Tipo de grfico: Grficos de barras - CONTINUAR-ACEPTAR.
B. En este caso, se desea representar la variable grado de disnea, mediante un diagrama de barras, pero teniendo en cuenta si el individuo se halla o no
enfermo. Entra en juego una segunda variable cualitativa (Presencia de enfermedad, s/no).
GRFICOS- BARRAS- Agrupado- DEFINIR.
Las barras representan: n de casos
Eje de categoras: disnea (grado de disnea)
Definir grupos por: La variable que define los grupos es la enferm (Presencia de enfermedad)- ACEPTAR

3.1.1 Operaciones realizables con diagramas de barras simples y agrupadas


Una vez editada, la grfica de barras puede sufrir mltiples transformaciones.
3.1.1.1. Eliminacin de una categora. A travs del men SERIES-VISUALIZADAS (o haciendo doble click en una de las barras).
El cuadro de dilogo pide especificar qu barras se quieren mostrar y que barras se desea omitir.
NOTA: Si una barra es omitida y posteriormente mostrada, el orden de las barras en la representacin grfica vara

3.1.1.2. Intercambio de ejes. A travs del men FORMATO- INTERCAMBIAR EJES o a travs de la barra de herramientas.
3.1.1.3. Cambiar rangos e intervalos de eje. A travs del men DISEO- EJES, aparece un cuadro de dilogo llamado seleccin de ejes.
En l, nos piden elegir entre las opciones escala o categora. Se elige la opcin escala (si se hace un doble click en el eje y, aparece
directamente el eje de escala). Los conceptos de inters son:
Rango. El ordenador muestra el rango de valores de la variable y pide qu rango se desea visualizar.
Divisiones. Tanto en las mayores como en las menores, se debe incluir el tamao de cada divisin del eje y.

Ejemplo prctico:
13
Nociones bsicas sobre el manejo de SPSS
En la variable intentos, al investigador solo le interesa representar los individuos que hayan intentado dejar de fumar por lo
menos 1 vez. Adems desea que el rango de valores de frecuencia representados en el eje y oscile de 0 a 10, en intervalos de 2
individuos cada uno.

3.1.1.4. Cambio de estilo de barras. Esta opcin permite representar las barras en tres dimensiones o sombreadas. FORMATO-ESTILO
DE BARRAS o a travs del botn 10 de la derecha. APLICAR TODO-CERRAR.
3.1.1.5. Cambio de estilo de etiquetas de barra. Esta opcin permite colocar una etiqueta de frecuencia de casos a cada una de las
barras representadas. FORMATO-ESTILO DE ETIQUETAS DE BARRA o a travs del botn 9 de la derecha. APLICAR TODO-CERRAR.
3.1.1.6. Cambio en una leyenda. En el caso de las representaciones de grficas agrupadas, las categoras de la variable de agrupacin
pueden ser descritas a travs de una leyenda. Esta leyenda puede ser modificada a travs de la opcin DISEO-LEYENDA.

3.2.HISTOGRAMA.

Esta representacin grfica es utilizada para variables cuantitativas continuas o discretas que poseen muchas categoras.

Existen diferentes procedimientos para la construccin de un histograma.

1-A travs del men GRFICOS- HISTOGRAMA.


Puede construirse un histograma con la curva Normal sobreimpresionada. En este caso, basta con marcar la opcin Ver curva normal,
tras elegir la variable.
2-Desde la opcin del men ANALIZAR- ESTADSTICOS DESCRIPTIVOS- FRECUENCIAS. Se introduce la variable a estudio y se pulsa el
botn Grficas: histograma -(Con o sin curva normal)-CONTINUAR- ACEPTAR.
3-Desde la opcin del men ANALIZAR-ESTADSTICOS DESCRIPTIVOS-EXPLORAR. En el cuadro de dilogo visualizado se coloca la
variable en el apartado lista dependiente y pulsar Grficas. Dentro del apartado Descriptivos, elegir histograma. CONTINUAR- ACEPTAR.

3.2.1. Operaciones realizables con un histograma


Las operaciones son bsicamente las mismas que en el caso de los diagramas de barras.
3.2.1.1. Cambiar rango e intervalos de eje. DISEO-EJES. Aparecern dos opciones: Escala e intervalo.
Escala: las operaciones a realizar sern sobre el eje y.
Intervalo: las operaciones se realizarn sobre el eje x.
NOTA: las operaciones sobre los ejes, pueden realizarse haciendo un doble click sobre el eje.

Ejemplo prctico:
Construir un histograma de la variable nmero de cigarrillos perteneciente al archivo tabaco.sav.
Se desea visualizar un rango de valores comprendido entre 0 y 70 cigarrillos y un total de 10 intervalos.

14
Bioestadstica 1 de Medicina
Procedimiento:

1.GRAFICAS- HISTOGRAMA.

Variable: numcig- ACEPTAR.

Se edita la grfica con un doble click.

2.DISEO- EJES- Intervalo- ACEPTAR.

Intervalo Personalizado- DEFINIR


Definicin- N de intervalos: 10
Rango: Visualizados 0, 70. CONTINUAR- ACEPTAR.

3.3. GRFICA DE SECTORES.


El diagrama de grficas de sectores es utilizado para variable cualitativas de tipo nominal.
Ejemplo prctico:
Construir una grfica de sectores para representar la distribucin de la variable sexo de la base de datos tabaco.sav. Se desea
representar el porcentaje y frecuencia de varones y mujeres.
1. GRAFICOS- SECTORES- Resmenes para grupos de casos- DEFINIR.
Los sectores representan: n de casos.
Definir sectores por: sexo- ACEPTAR.
Editada la grfica:
2. DISEO-OPCIONES.
Etiquetas: Texto, Valores, Porcentajes.
Editar texto: Etiqueta de los sectores. Etiqueta: Seleccionado el valor 1, cambiarlo por HOMBRES-CAMBIAR. Seleccionado el valor 2, cambiarlo por
MUJERES- CAMBIAR- CONTINUAR- ACEPTAR.

15
Nociones bsicas sobre el manejo de SPSS

3.4. DIAGRAMA DE CAJAS.


El diagrama de cajas puede representar la distribucin de una nica variable cuantitativa o la distribucin de una variable cuantitativa
segn los valores tomados por otra variable de tipo cualitativo.
Se construye a travs de:
1- ANALIZAR-ESTADSTICOS DESCRIPTIVOS-EXPLORAR. Debe colocarse la variable que se desea representar en la casilla con
ttulo lista dependiente. Si se quiere representar esta variable en funcin de otra, en la casilla Factores debe situarse la segunda variable de
inters. A continuacin se pulsa el botn Grficas. En el nuevo cuadro, se marcar Niveles de factores juntos dentro del apartado
Diagrama de cajas. Posteriormente, CONTINUAR- ACEPTAR.
2- GRFICOS-DIAGRAMAS DE CAJAS- Simple.
Los datos del grfico son:
Se presentan dos opciones.
Resmenes para grupos de casos: siempre y cuando se represente una variable cuantitativa en funcin de los valores tomados por
una segunda variable, esta vez de tipo cualitativo.
Resmenes para distintas variables: cuando nicamente se represente una varible cuantitativa.
Ejercicio prctico:
Deseamos representar, mediante un diagrama de cajas, la distribucin de la edad en que los individuos de la base de datos
tabaco.sav comenzaron a fumar dependiendo de que fueran hombres o mujeres.

Procedimiento:
1. GRFICOS- DIAGRAMAS DE CAJAS- Simple.
Los datos del grfico son: Resmenes para grupos de casos- DEFINIR.
Variable: Inicio
Eje de categoras: Sexo- ACEPTAR.
Una vez editada la grfica:
2. DISEO- EJES- Categora- ACEPTAR.
Etiquetas: Texto de la etiqueta. Etiqueta: Seleccionado el valor 1, cambiarlo por HOMBRES-CAMBIAR. Seleccionado el valor 2, cambiarlo por
MUJERES- CAMBIAR- CONTINUAR- ACEPTAR.

16
Bioestadstica 1 de Medicina

NOTA: Los datos perifricos son representados con el smbolo *, pero cuando la distancia desde el 1 o 3 cuartil al perifrico es inferior a 3 veces la
distancia intercuartlica, el smbolo que aparece es

3.5. GRAFICA DE RELACIN ENTRE DOS VARIABLES: DISPERSIN O NUBE DE PUNTOS.


Esta grfica representa la distribucin conjunta de dos variables de tipo cuantitativo.
Se acude a la opcin del men GRFICOS-DISPERSIN-SIMPLE-DEFINIR.
Se seleccionan las dos variables cuantitativas que quieren representarse y se colocan en los ejes X e Y- ACEPTAR.

3.5.1. Operaciones realizables con una dispersin.


3.5.1.1. Marcadores. En una dispersin de puntos, stos deben marcarse mediante algn tipo de smbolo. Puede elegirse el diseo y el
tamao de los smbolos empleados en este tipo de grficas. Existen dos procedimientos.
1.FORMATO- MARCADORES. Se elige el diseo y el tamao- APLICAR A TODO- CERRAR.
b

2.Desde la barra de herramientas mediante un botn con el smbolo de un asterisco.


Ejercicio prctico:
Representar grficamente mediante un diagrama de dispersin la distribucin de la variable talla y peso de la base de datos
tabaco.sav.
3.6. DIAGRAMA DE TALLO Y HOJAS.
Ejercicio prctico:
Realizar un tallo y hojas de las variables edad y nmero de cigarrillos pertenecientes al archivo tabaco.sav.
Procedimiento:
ANALIZAR-ESTADSTICOS DESCRIPTIVOS-EXPLORAR.
Lista dependiente: edad, numcig
Grficas: Descriptivos: Tallo y hojas- CONTINUAR- ACEPTAR.

3.7. GRFICAS DE LINEAS.


Las grficas de lnea resultan muy tiles para visualizar una posible interaccin entre dos variables.
Se eligir la opcin GRFICOS - LNEAS- Mltiple- DEFINIR. El cuadro de dilogo permite varias opciones en la representacin (n de
casos, % de casos, etc). En este caso, la opcin ms utilizada es la de Otra funcin de resumen. La funcin por defecto que presenta SPSS
es la media, aunque tenemos la posibilidad de cambiarla por otro estadstico.

3.8. OPERACIONES COMUNES A TODA GRFICA.


Para hacer todos estos cambios debe tenerse seleccionado el objeto del cambio.
Con un click, se selecciona el objeto (una barra, un eje, una palabra, etc)
Con dos clicks, aparecer directamente el cuadro de dilogo que ms directamente est relacionado con dicho objeto.
3.8.1. Cambio de color.

17
Nociones bsicas sobre el manejo de SPSS
Un cambio de color puede hacerse o desde el men FORMATO-COLOR o con un botn de la barra de herramientas con forma de
rotulador.
3.8.2. Insertar un ttulo.
Vamos al men DISEO- TTULO e introducimos el nombre/s del /los ttulo/s. Pulsamos ACEPTAR.
3.8.3. Relleno.
Podemos jugar con el tipo de relleno a travs del men FORMATO-TRAMA DE RELLENO. Elegimos la opcin que queramos y
pulsamos APLICAR-CERRAR.
De nuevo, con la barra de herramientas, se hace la misma operacin. Basta con pulsar el botn 14 empezando por la derecha.
3.8.4. Texto.
Podemos cambiar el estilo y el tamao del texto a travs de la opcin FORMATO-TEXTO o a travs del botn con forma de T, de la
barra de herramientas.
3.8.5. Cambiar una grfica por otra (siempre que sea factible; por ejemplo no se podr pasar de un histograma a una grfica de
sectores).
Desde la opcin GALERA. Se elige a qu tipo de grfica queremos cambiar y se pulsa bien NUEVO o bien REEMPLAZAR.

4. ANLISIS DE SUPERVIVENCIA

En el anlisis de supervivencia, la variable dependiente no es ni cuantitativa ni cualitativa, sino que toma la forma de tiempo
transcurrido hasta un suceso.
SPSS aporta diversos procedimientos de anlisis de supervivencia: Uno de ellos es descriptivo y se denomina Curvas de supervivencia
de Kaplan-Meier, donde los individuos pueden ser censurados. El individuo es censurado cuando sale del estudio por una causa diferente
al desenlace que se estudia. La variable evento puede tomar nicamente dos valores. Sugerimos asignar 1=si el evento se ha producido,
y 0= si el individuo ha sido censurado. Adems, la censura es no informativa. Con esto es asumido que los individuos censurados tendrn
un comportamiento idntico a los seguidos hasta el final (censura no informativa).
Ejemplo prctico:
A. Se quiere determinar la supervivencia de un grupo de pacientes diagnosticados de cncer e incluidos en la base de datos
pronostico.sav.
Procedimiento:
Abierto el archivo pronostico.sav:
1.La variable tiempo de observacin no est creada como tal en la base de datos. nicamente se dispone de la fecha del fin del seguimiento, muerte o
desaparicin del paciente (datefin) y de la fecha del diagnstico del tumor (datediag). Para la obtencin del tiempo de seguimiento:
TRANSFORMAR-CALCULAR.
Variable de destino: tmes
Tipo y etiqueta: Etiqueta: tiempo en meses- CONTINUAR
Expresin numrica: CTIME.DAYS (datefin-datediag)/30-ACEPTAR
2. ANALIZAR-SUPERVIVENCIA-KAPLAN MEIER.
Tiempo: tmes
Estado: estado- Definir evento- Valores que indican que el evento ha tenido lugar. Valor nico: 1- CONTINUAR

18
Bioestadstica 1 de Medicina

Opciones- Grficos: Supervivencia. CONTINUAR- ACEPTAR.

2- Queremos determinar dentro de la base de datos OldOld.sav en qu momento del seguimiento, la probabilidad de cada de
ancianos es del 50%. El tiempo de seguimiento se denomina time y la existencia o no de evento recibe el nombre Cada.
Realizar adems una tabla de supervivencia y un grfico de supervivencia.

5- COMPARACIN DE PARMETROS. TEST DE HIPOTESIS

5.1. TEST DE LA JI CUADRADO PARA UNA SOLA PROPORCIN (proporcin observada frente a la esperada).
Este procedimiento es aplicado cuando se desea comparar la distribucin observada de una variable categrica con respecto a una
distribucin tericamente esperada.
Ejemplo prctico:
A. Intentamos comprobar si la proporcin de mujeres en la poblacin de la que procede la muestra de la base de datos
tabaco.sav es del 50% y las diferencias encontradas son nicamente debidas al azar, o por el contrario, si hay en la poblacin
ms o menos proporcin de mujeres que la indicada.
B. Comprobar si la muestra procede de una poblacin donde las mujeres son tres veces ms numerosas que los hombres.
A. ANALIZAR-PRUEBAS NO PARAMTRICAS- CHI CUADRADO.

Contrastar variables: sexo


Valores esperados: Todas las categoras iguales- ACEPTAR

B. ANALIZAR-PRUEBAS NO PARAMTRICAS- CHI CUADRADO.

Contrastar variables: sexo


Se quiere saber si las mujeres son 3 veces ms frecuentes que los hombres en la poblacin. Por ello, la distribucin de la variable esperada sera:
Hombres: 1 Mujeres: 3

19
Nociones bsicas sobre el manejo de SPSS
Valores esperados: Valores
De esta manera se introducen cada una de las frecuencias.
1-AADIR-3-AADIR-ACEPTAR.

5.2. TEST DE LA JI CUADRADO PARA COMPARACIN DE DOS O MS PROPORCIONES.


Se utiliza este test cuando se quieren comparar dos variables de tipo categrico.
Este test permite obtener los valores de Ji-cuadrado de Pearson, de Ji-cuadrado de tendencia lineal, de Ji-cuadrado con correccin de
Yates y el test exacto de Fisher.
Ejercicio prctico
Queremos conocer la relacin entre el consumo de tabaco y la aparicin de casos de patologa de tipo cardiaco a partir de la base
de datos cardio.sav (creada en clases anteriores). El hecho de fumar se relaciona con una mayor probabilidad de patologa
cardiaca?
Procedimiento:
ANALIZAR-ESTADSTICOS DESCRIPTIVOS -TABLA DE CONTINGENCIA.

Fila: tabaco
Columna: casos
Estadsticos-Chi cuadrado- CONTINUAR.
Casillas- Frecuencias: Observadas- Esperadas.
Porcentajes: Fila- Columna- Total- CONTINUAR-ACEPTAR.

5.3. TEST DE MC NEMAR PARA DATOS EMPAREJADOS.

20
Bioestadstica 1 de Medicina
Cuando los datos se encuentran emparejados (dos medidas repetidas, dos poblaciones con idnticas caractersticas), el test de la Ji-
cuadrada no es vlido para establecer asociaciones. Se acude al test de Mc Nemar, que es un test no paramtrico.
Ejercicio prctico.
Queremos comparar la eficacia de 2 frmacos (el A y el B). Para realizar esta investigacin, elegimos una muestra de 10 sujetos a
los que administraremos los dos frmacos y comprobaremos la respuesta que se obtiene en ambos casos.
Crearemos dos variables respA (respuesta al frmaco A) y respB (respuesta al frmaco B).
El resultado positivo tendr un cdigo=1 y el negativo un cdigo = 0.
Los resultados obtenidos son:
ID 1 2 3 4 5 6 7 8 9 10
RespA 1 1 1 1 1 1 0 0 0 0
RespB 1 1 0 0 0 0 0 0 0 1
Procedimiento:
1-ARCHIVO-NUEVO-DATOS.
2-DATOS- En la ventana vista de variables definir cada una de las tres variables nuevas.
3-ANALIZAR-PRUEBAS NO PARAMTRICAS- 2 MUESTRAS RELACIONADAS.
Contrastar pares: RespA, RespB.
Tipo de prueba- Mc Nemar- ACEPTAR.

5.4. COMPARACIN DE UNA MEDIA CON UN VALOR DE REFERENCIA.

Sirve para comparar la media de una determinada variable cuantitativa con un valor de referencia asignado.

Ejemplo prctico:
Tenemos una muestra de individuos con lesiones de herpes (herpes_virus.sav). Nos preguntamos si podemos asumir que la
media de duracin de la lesin primaria de herpes de la poblacin de la cual procede la muestra es de 15 das.
Procedimiento:
Una vez abierta la base de datos de SPSS: ANALIZAR-COMPARAR MEDIAS- Prueba T para una muestra.

Contrastar variables: Duracin de la lesin primaria (dur1)


Valor de prueba: 15- ACEPTAR
Nota: No es necesario realizar un test de normalidad debido al gran tamao de la muestra.

5.5. COMPARACIN DE DOS MEDIAS.


Para utilizar la prueba de la t de Student, deben cumplirse 2 condiciones:

1. Normalidad de la variable cuantitativa o n> 30.


Para la prueba de normalidad existen 2 mtodos:
A).Comprobar los 3 supuestos de normalidad.
Hallar la media, asimetra, etc
B).Pedir un test de normalidad (mtodo ms completo).
2. Homogeneidad de varianzas.
La misma prueba T facilita el resultado del test de Levene y resuelve la operacin tanto con homocedasticidad como sin ella.

Ejemplo prctico:
Queremos determinar si la duracin de una lesin primaria causada por el virus Herpes Simple est condicionada por el tipo de
virus. Nuestra base de datos herpes_virus.sav contiene pacientes con virus Herpes tipo I y tipo II.
Procedimiento:
ANALIZAR-COMPARAR MEDIAS-PRUEBA T PARA MUESTRAS INDEPENDIENTES.

Contrastar variables: corresponde a la variable dependiente o cuantitativadur1 (Duracin de lesin primaria)


Variable de agrupacin: corresponde a la variable independiente o categricagroup (Tipo de herpes).

21
Nociones bsicas sobre el manejo de SPSS
Definir grupos: Grupo1: 1 (HSV Tipo I); Grupo2: 2 (HSV TIPO II). CONTINUAR -ACEPTAR.

Nota: No es necesario realizar un test de normalidad debido al gran tamao de la muestra.

5. 6. TEST DE LA U DE MANN WHITNEY.


El test de la U de Mann Whitney es un test no paramtrico. Se basa en la comparacin de dos medianas en vez de comparar dos
medias. Se emplea siempre y cuando la variable dependiente (cuantitativa) no siga una distribucin normal, sea una variable cualitativa
ordinal o el nmero de individuos sea inferior a 10 en cada uno o en ambas categoras.
Ejemplo prctico
Queremos saber si el padecer una enfermedad respiratoria, conlleva a tener un mayor inters en dejar de fumar. El inters se
valora en escala ordinal (valores 0, 1, 2 , 3; siendo 0 el menor inters). El tener enfermedad se codifica con un 1 y el no tenerla con
un 0. Los datos de estas variables se recogieron en el archivo tabaco.sav.
Procedimiento.
ANALIZAR-PRUEBAS NO PARAMTRICAS-2 MUESTRAS INDEPENDIENTES.
Contrastar variables: interes (inters por dejar de fumar)
Variable de agrupacin: enferm (Presencia de enfermedad respiratoria)
Definir grupos: Grupo1: 0(no enfermedad); Grupo2: 1 (si enfermedad). CONTINUAR-ACEPTAR.

5.7. TEST T PARA DATOS EMPAREJADOS.


Cuando los datos se encuentran emparajados (dos medidas repetidas, dos poblaciones con idnticas caractersticas) no puede
utilizarse un test de la t de Student normal, sino el test de la t de Student para muestras relacionadas.
Ejemplo prctico:
Queremos conocer la forma fsica de un grupo de ancianos, antes y despus de un entrenamiento deportivo. Se desea comprobar
la efectividad de la intervencin (entrenamiento deportivo). As, mediremos la cantidad de escaleras que son capaces de subir,
antes y despus de dicho entrenamiento. Nos basaremos en el archivo OldOld.sav.
Procedimiento:

22
Bioestadstica 1 de Medicina
Es un test paramtrico, as deben cumplirse los criterios de normalidad si la muestra es n 30. La variable diferencia (antes-despus, muestra A-muestra B)
debe seguir una distribucin normal.
1-TRANSFORMAR-CALCULAR (dif= diferencia escaleras antes - escaleras despus)
Variable de destino: dif
Expresin numrica: escpre-escpost- ACEPTAR
2-Realizar un test de normalidadANALIZAR-ESTADISTICOS DESCRIPTIVOS-EXPLORAR
Dependientes: dif
Etc...
3-ANALIZAR-COMPARAR MEDIAS-PRUEBAS T PARA MUESTRAS RELACIONADAS.
Variables relacionadas: escpre, escpost- ACEPTAR.

5.8. TEST DE WILCOXON PARA DATOS EMPAREJADOS.

Este test no paramtrico es utilizado en los casos en que el test de la t de Student para muestras relacionadas no puede aplicarse.

Ejemplo prctico:
Se realiza un estudio para comparar la eficacia de dos dietas diferentes en la reduccin de peso. Para ello, utilizamos una
muestra, a la que sometemos a las dos dietas con una separacin de un ao entre cada una de las dos dietas .
Tras seguir a 25 individuos, se recogen los siguientes datos:

Identificacin Kgs adelgazados Kgs adelgazados con Identificacin Kgs adelgazados Kgs adelgazados con
con dieta 1 dieta 2 con dieta 1 dieta 2
1 3 2 13 6 1
2 4 3 14 5 4
3 4 1 15 2 2
4 5 3 16 5 6
5 7 0 17 5 0
6 6 0 18 6 0
7 3 4 19 3 2
8 2 1 20 0 2
9 0 0 21 3 2
10 1 4 22 1 3
11 2 3 23 6 0
12 1 0 24 4 2
25 4 1
Son igualmente efectivas ambas dietas en el descenso de peso?
Procedimiento:
Situados en el editor de datos de SPSS:
1-ARCHIVO- NUEVO- DATOS.
2-En la ventana Vista de variables.
Nombre de variable: id
Tipo: Numrico;
Etiqueta- Nmero de identificacin
Medida: nominal
Nombre de variable: Diet1
Tipo: Numrico; 0 decimales-CONTINUAR
Etiquetas- Etiqueta de variable: Kgs adelgazados con dieta 1- CONTINUAR
Medida: escala- ACEPTAR
Idem con dieta 2.
Introducir los datos en la ventana de editor de datos.
3-ANALIZAR-P. NO PARAMTRICAS- 2 MUESTRAS RELACIONADAS.
Contrastar pares: Diet1, Diet2

23
Nociones bsicas sobre el manejo de SPSS
Tipo de prueba: Wilcoxon. -ACEPTAR
Nota: Hay que tener en cuenta que SPSS calcula el valor p de significacin estadstica para el test de Wilcoxon, mediante una aproximacin a la
distribucin Normal (calcula una z). Si el tamao de la muestra es n< 25, puede no ser vlida la aproximacin y hay que mirar en tablas el valor p.
4-Guardar la base de datos con el nombre dieta.sav. ARCHIVO- GUARDAR COMO
Guardar en: Disco de 3 A
Nombre del archivo: dieta
Guardar como tipo: SPSS (*.sav)-GUARDAR

6. ANOVA

6.1. ANOVA DE 1 VA.


El anlisis de la varianza es utilizado cuando la variable independiente es cualitativa con ms de dos categoras y la variable dependiente
es cuantitativa.
Ejemplo prctico:
Se realiz un estudio para determinar si el peso del nio a los 6 meses de edad est asociado con el consumo de tabaco de la
madre durante el primer trimestre de embarazo. Los datos se recogieron en un archivo con nombre peso.sav. Las madres fueron
clasificadas como no fumadoras, ex fumadoras, fumadoras de <1 paquete diario, fumadoras de > 1 paquete diario.
Procedimiento:
Para el empleo del anlisis de varianza deben cumplirse una serie de condiciones. (Normalidad, homogeneidad de varianzas).
La distribucin de los residuales debe aproximarse a una distribucin normal.
1-Obtencin de la media de peso en cada una de las categoras de la variable consumo de tabaco (tabaco).

DATOS- SEGMENTAR ARCHIVO- Organizar los resultados por grupos.

Grupos basados en: tabaco- ACEPTAR.

ANALIZAR- ESTADSTICOS DESCRIPTIVOS- DESCRIPTIVOS

Variables: peso
Opciones- Media- CONTINUAR- ACEPTAR.

DATOS-SEGMENTAR ARCHIVO-Analizar todos casos, no crear los grupos- ACEPTAR

2-Creacin de la variable RESID.

TRANSFORMAR-CALCULAR

Variable de destino: resid


Expresin numrica: peso-media de peso para no fumadoras
Pulsar botn SI
Incluir si el caso satisface la condicin:
Tabaco=1- CONTINUAR-ACEPTAR.

TRANSFORMAR-CALCULAR

Variable de destino: resid


Expresin numrica: peso-media de peso para ex fumadoras
Pulsar botn SI
Incluir si el caso satisface la condicin:
Tabaco=2. CONTINUAR-ACEPTAR.

Idem con el resto de categoras de la variable tabaco.

24
Bioestadstica 1 de Medicina

2- ANALIZAR- COMPARAR MEDIAS- ANOVA DE 1 FACTOR.

Dependientes: peso
Factor: tabaco
Debe realizarse la prueba de Levene para comprobar la homocedasticidad.
Opciones- Estadsticos- Descriptivos y Homogeneidad de varianzas- CONTINUAR- ACEPTAR.

6.1.1. Comparaciones a priori (CONTRASTES).


Este procedimiento es empleado cuando existe una agrupacin lgica de los diferentes grupos. Las posibles comparaciones entre
grupos se han planificado antes de iniciar el anlisis de los datos.
Ejemplo prctico
Siguiendo con el problema anterior, se han lanzado 3 hiptesis:
1. El peso de los nios es independiente de hbito tabquico de la madre (no haber fumado nunca con respecto a haberlo
hecho anteriormente o en la actualidad)
2. La media de peso de los nios de madres exfumadoras es igual a la media de peso de nios de madres fumadoras.
3. El peso de los nios a los 6 meses es independiente de la cantidad de cigarrillos fumados por la madre.
Procedimiento:
1-ANALIZAR- COMPARAR MEDIAS. ANOVA DE 1 FACTOR.
Etc...
2-Pulsar el botn Contrastes.
Existen 4 coeficientes (w) para cada uno de los 3 contrastes.
w1 (no fum) w2 (exfum) w3 (<1 paq) w4 (>1 paq)
25
Nociones bsicas sobre el manejo de SPSS
Contraste 1 +3 -1 -1 -1
Contraste 2 0 +2 -1 -1
Contraste 3 0 0 +1 -1
Contraste 1 de 1.
Coeficiente: 3 AADIR,-1 AADIR,-1 AADIR,-1AADIR.
Pulsar el botn Siguiente
Contraste 2 de 2.
Coeficiente: 0 AADIR,2 AADIR,-1 AADIR,-1 AADIR.
Pulsar el botn Siguiente
Contraste 3 de 3.
Coeficiente: 0 AADIR,0 AADIR,1 AADIR,-1 AADIR.
CONTINUAR-ACEPTAR

Nota: Puede retrocederse con el botn Anterior hacia el contraste anterior.


6.1.2. Contrastes a posteriori (COMPARACIONES MLTIPLES).
Son todas las posibles comparaciones de medias dos a dos. Suelen utilizarse cuando no existe una agrupacin lgica de las categoras.
Ejemplo prctico:
Siguiendo con el ejemplo anterior, analizar todas las posibles combinaciones dos a dos para comparar la media de peso de los
nios en funcin del hbito tabquico de la madre.
Procedimiento:
1-ANALIZAR- COMPARAR MEDIAS- ANOVA DE 1 FACTOR.
2-Pulsar el botn Post Hoc: Bonferroni- Scheff- S-N-K- Dunnett- CONTINUAR - ACEPTAR.

6.2. TEST DE KRUSKAL-WALLIS (COMPARACIN NO PARAMTRICA DE K MEDIAS).


Es la versin no paramtrica del ANOVA.
Ejemplo prctico:
Queremos determinar, si el n de cigarrillos influye en el grado de disnea (de 0 a 3). Nos interesa agrupar el nmero de cigarrillos
en 4 categoras.
Menos de 20 cig=1
De 20 a 39= 2
De 40 a 59=3
De 60 a 79= 4
Se utilizar la base de datos tabaco.sav.
Procedimiento:
1-TRANSFORMAR- RECODIFICAR- EN DISTINTAS VARIABLES.
Var.de entrada: numcig
Variable de resultado. Nombre: fum-CAMBIAR
Pulsar el botn Valores antiguos y nuevos
Rango: Del menor a 19,9 Valor nuevo: 1 AADIR

26
Bioestadstica 1 de Medicina
Rango: 20 hasta 39 Valor nuevo: 2 AADIR
Rango: 40 hasta 59 Valor nuevo: 3 AADIR
Rango: 60 hasta el mayor Valor nuevo: 4 AADIR
CONTINUAR-ACEPTAR.
2-ANALIZAR-P. NO PARAMTRICAS- K MUESTRAS INDEPENDIENTES.
Contrastar variables: disnea
Variables de agrupacin: fum
Definir rango- Mnimo: 1; Mximo: 4- CONTINUAR.
Tipo de prueba: H de Kruskal-Wallis- ACEPTAR

6.3. ANOVA DE DOS VAS.


Cuando queremos estudiar la relacin de dos variables cualitativas (independientes) sobre una tercera variable cuantitativa
(dependiente) debemos acudir a una ANOVA DE 2 vas.

Como en todos los procedimientos de ANOVA deben cumplirse los requisitos de homogeneiad de varianzas y de seguimiento de una
distribucin normal por parte de los residuales. SPSS permite calcular la homocedasticidad y calcular los residuales directamente desde
botones de comando del cuadro de dilogo del ANOVA de dos vas sin necesidad de transformaciones previas (a diferencia del ANOVA de
una va).

Ejemplo prctico:
Se quiere estudiar la influencia de inyecciones de tiroxina sobre el peso de pollos con siete semanas de vida. Valoraremos la
posible influencia del sexo (macho/hembra) y del tratamiento elegido (grupo control /grupo tratado con tiroxina). Utilizaremos la
base de datos tiroxina.sav.
Procedimiento:
1-ANALIZAR- MODELO LINEAL GENERAL- UNIVARIANTE.
Dependiente: peso
Factores fijos: sexo, tratam (Tipo de tratamiento)
Opciones-Estadsticos descriptivos-Pruebas de homogeneidad- CONTINUAR.
Grficos
Eje horizontal tratam
Lneas distintas: sexo- AADIR-CONTINUAR
Guardar
Residuos: No tipificados- CONTINUAR- ACEPTAR.
2-Comprobar la normalidad de los residuales. ANALIZAR- ESTADSTICOS DESCRIPTIVOS- EXPLORAR.
Etc

6.4. ANOVA DE MEDIDAS REPETIDAS (ANOVA DE DOS VIAS)


El ANOVA de medidas repetidas puede realizarse a travs de la resolucin de un ANOVA de dos vas con unas carctersticas
peculiares.
Un archivo de editor de datos de SPSS para medidas repetidas puede presentarse de dos formas diferentes. Segn el tipo de
presentacin se elegir una u otra opcin.
Opcin 1-ANOVA DE MEDIDAS REPETIDAS
Ejemplo de presentacin de datos:

27
Nociones bsicas sobre el manejo de SPSS

Opcin 2-ANOVA DE 2 VIAS

Se trabajar con la segunda opcin.

Ejemplo prctico:
Se ha tomado la tensin arterial sistlica a 8 pacientes de forma repetida (4 veces) pero por diferentes especialistas y en
situaciones distintas.
Existe influencia de estos factores sobre la correcta medicin de la presin arterial?
Los datos obtenidos aparecen en un archivo de texto de nombre TAS.txt.
Procedimiento:
1- Transformar un archivo de texto en archivo de SPSS.

ARCHIVO-LEER DATOS DE TEXTO.


Buscar en: Disco de 3 (A:)- Basedat
Nombre de archivo: TAS.txt
Archivos de tipo: Archivos de texto (*txt, *dat)- ABRIR

2- Definir las variables medida y tas en el editor de SPSS.

3- Introducir la variable id

4- ANALIZAR-MODELO LINEAL GENERAL-UNIVARIANTE.


Dependiente: tas
Factores fijos: medida, id
Modelo- Especificar modelo- Personalizado.
Modelo: medida, id
Guardar
Residuos: No tipificados- CONTINUAR- ACEPTAR.

28
Bioestadstica 1 de Medicina

6.5 TEST DE FRIEDMAN (COMPARACIN NO PARAMTRICA DE MEDIDAS REPETIDAS).


Cuando los valores residuales de una ANOVA de medidas repetidas no siguen una distribucin normal o la variable dependiente es una
variable cualitativa ordinal, se acude a este test.
Ejemplo prctico:
Se midi tres veces, la frecuencia cardiaca de un grupo de 10 pacientes (Frec.sav) y se clasificron las mediciones en
frecuencia baja, normal y alta (con los cdigos 1, 2 y 3 respectivamente).
Queremos averiguar si existen diferencias estadsticamente significativas entre las 3 medidas.
Procedimiento:
ANALIZAR-PRUEBAS NO PARAMTRICAS-K MUESTRAS RELACIONADAS.

Contrastar variables: med1, med2, med3


Tipo de prueba: Friedman. ACEPTAR

7. REGRESIN Y CORRELACIN

7.1. COEFICIENTE DE CORRELACIN.


La finalidad de la correlacin es determinar la direccin y la fuerza de asociacin entre dos variables de tipo cuantitativo.
Ejemplo prctico:
Estudiaremos la fuerza de asociacin entre el seguimiento de dos dietas de adelgazamiento para la reduccin de Kgs de peso.
Los datos se encuentran almacenados en el archivo dieta.sav.
Procedimiento:
ANALIZAR- CORRELACIONES-BIVARIADAS.
Variables: Diet1, Diet2
Coeficientes de correlacin: Pearson- Spearman- ACEPTAR.

7.2. REGRESIN LINEAL SIMPLE.

29
Nociones bsicas sobre el manejo de SPSS
La regresin lineal simple es un mtodo estadstico empleado para medir la relacin existente entre dos variables cuantitativas pudiendo
incluso predecir el comportamiento de una de ellas (variable dependiente) en funcin del valor tomado por la otra (variable independiente).
Ejemplo prctico:
Se dispone de un grupo de pacientes y se quiere predecir cual ser su tensin arterial sistlica en funcin de la edad de dichos
pacientes. Los datos se recogen en el archivo Tas_edad.sav.
Podemos realizar una representacin grfica o un anlisis estadstico.
1-Representacin grfica. GRFICOS- DISPERSIN SIMPLE- DEFINIR.

Eje Y: (donde colocaremos la variable dependiente, en ntro caso Tas)


Eje X: (donde colocaremos la independiente, en ntro caso edad)- ACEPTAR.

2-Regresin lineal simple. ANALIZAR- REGRESIN- LINEAL.


Dependiente: tas
Independientes: edad
Estadsticos- Coeficientes de regresin: Estimaciones, Ajuste de modelo , Intervalo de confianza, Descriptivos. CONTINUAR.
Guardar- Residuos: No tipificados- CONTINUAR.
Grficos- Grficos de residuos tipificados: Grfico de prob. Normal.
CONTINUAR-ACEPTAR.
3-Comprobar la normalidad de los residuales para establecer la validez del modelo- ANALIZAR- ESTADSTICOS DESCRIPTIVOS- EXPLORAR.
Etc.

30

You might also like