You are on page 1of 39

HOSPITAL DE CLNICAS DE PORTO ALEGRE GRUPO DE PESQUISA E PS GRADUAO

INTRODUO ANLISE ESTATSTICA UTILIZANDO O SPSS 18.0

Marilyn Agranonik Vnia Naomi Hirakata Suzi Alves Camey

Porto Alegre - Setembro de 2010

NDICE
1. INTRODUO AO SPSS ................................................................................... 3 1.1 - Banco de dados: definio .......................................................................... 4 1.2 - Como criar um banco de dados ................................................................... 4 1.3 - Como dar nome a uma varivel ................................................................... 6 1.4 - Como dar nome aos nveis de uma varivel ................................................ 6 1.5 - Como acessar um banco de dados j existente .......................................... 7 1.6 - Como exportar um banco de dados do spss para o excel ........................... 7 2. INTRODUO AOS MTODOS ESTATSTICOS.............................................. 8 2.1 - Tipos de variveis: definio ....................................................................... 8 2.2 - Descrio e explorao de dados................................................................ 8 2.3 - Anlise univariada ....................................................................................... 9
2.3.1 - Variveis quantitativas .................................................................................................9
2.3.1.1 - Como obter as estatsticas descritivas ................................................................................. 9 2.3.1.2 - Como obter um histograma ............................................................................................... 10 2.3.1.3 - Como obter um box-plot .................................................................................................... 11

2.3.2 - Variveis categricas (qualitativas) ..........................................................................13


2.3.2.1 - Como obter a distribuio de freqncias .......................................................................... 13 2.3.2.2 - Como obter grficos .......................................................................................................... 14 2.3.2.2.1 - Como obter grfico de barras ................................................................................. 14 2.3.2.2.2 - Como obter grfico de pizza ................................................................................... 16

2.4 - Como exportar o output para word ............................................................ 18 3 - CATEGORIZAO DE VARIVEIS ............................................................... 18 3.1 - Como categorizar uma varivel quantitativa .............................................. 18 3.2 - Como criar uma varivel a partir de datas ................................................. 21 3.3 - Como criar uma varivel atravs da combinao de outras duas .............. 22 3.4 - Como criar uma varivel atravs de um clculo com outras variveis ....... 23 3.5 - Como criar uma varivel a partir da contagem de outras ........................... 24 4. MANIPULAO DE DADOS........................................................................... 25 4.1 - Ordenao de casos: Sort Cases .............................................................. 25 4.2 - Seleo de casos: Select Cases ............................................................... 27 4.3 - Diviso de anlises por grupos: Split File .................................................. 30 4.4 - Juntar bancos de dados: Merge Files ........................................................ 32
4.4.1 - Juntando bancos com diferentes casos........................................................................32 4.4.2 - Juntando bancos com diferentes variveis ...................................................................32

4.5 - Manipulao de arquivos ........................................................................... 33 4.6 - Edio do arquivo de resultados (*.spo): como apagar anlises no desejadas no arquivo de resultados .................................................................. 34 5. ALGUMAS ANLISES BIVARIADAS .............................................................. 34 5.1 - Comparao de duas variveis categricas: Teste Qui quadrado ............. 34
5.1.1 - Como obter os resduos ajustados ...............................................................................36

5.2 - Como comparar mdias entre dois grupos: Teste t para Amostras Independentes. .................................................................................................. 37

1. INTRODUO AO SPSS
O pacote estatstico SPSS (Statistical Package for Social Sciences) uma ferramenta para anlise de dados utilizando tcnicas estatsticas bsicas e avanadas. um software estatstico de fcil manuseio e internacionalmente utilizado h muitas dcadas, desde suas verses para computadores de grande porte.

Tela inicial do SSPS 18.0 for Windows.

(a)

(b) Figura 1: Tela inicial do SSPS 18.0 for Windows. 1(a): Planilha Data View; 1(b): Planilha Variable View.

1.1 - Banco de dados: definio


Banco de dados um conjunto de dados registrados em uma planilha, em forma de matriz, com n linhas, correspondentes aos casos em estudo e p colunas, correspondentes s variveis em estudo ou itens de um questionrio. O nmero de casos (nmero de linhas da matriz) deve ser, em geral, maior do que o nmero de variveis em estudo (nmero de colunas).

1.2 - Como criar um banco de dados


Para se criar um BANCO DE DADOS novo procede-se da seguinte forma: a) Clicar em File; New; Data. Aparece a planilha data view. Na primeira linha esto indicadas as posies das variveis (VAR001,

b)

c) d)

e)

f)

g) h)

VAR002,etc.), e uma margem vertical numerada a partir de 1 (como mostrado na Figura1a). Na primeira coluna, correspondendo 1 VAR, criar uma varivel, por exemplo, NumCaso com o nmero do questionrio ou do caso em estudo. Veja exemplo 1 abaixo. Para serem registradas as caractersticas das variveis em cada coluna, clique duas vezes sobre a coluna var. Aparece a planilha variable view na qual cada varivel est definida em uma linha. Na primeira coluna (Name), digitar o nome da varivel desejada (Ex: NumCaso). Para o nome das variveis utilize 8 dgitos no mximo e no utilize espao em branco, nem os smbolos -, . e /. O SPSS no permite que o nome de uma varivel comece com um nmero. Clicar na coluna Type para definir o tipo de varivel. Aparece uma janela Variable Type onde deve-se deixar a opo Numeric se a varivel for numrica ou String se a varivel for alfa-numrica (texto). Preferencialmente use sempre a modalidade Numeric para variveis categricas, como por exemplo, sexo, estado civil, municpio, etc. criando-se um cdigo para as categorias. No caso de no-resposta ou respostas que no se desejam considerar para o tratamento estatstico, como por exemplo, respostas no corretas, no se aplica, sem resposta, etc..., clicar na coluna Missing, abre-se uma janela (Missing Values), registrar, na opo Discrete Missing Values, o cdigo de no-resposta, preferencialmente 9, 99, 999, etc. Clicar em OK. Entretanto, a melhor opo para no resposta deixar o espao em branco no banco de dados. Retornar planilha Data View e passar a digitar, em cada linha da coluna identificada, o valor da varivel. medida que as informaes vo sendo registradas no BANCO DE DADOS importante salv-las. Para tanto, se procede da seguinte forma: clicar em File Save as... (abre-se a janela na qual se escolhe o caminho desejado para salvar o arquivo) e criar um nome para o Banco de dados, que ter automaticamente a terminao .sav.

Exemplo 1: A tabela a seguir contm informaes sobre 5 indivduos para as seguintes variveis: 1) Nmero de identificao (numcaso) 2) Nome (nome) 3) Sexo (sexo) 4) Data de nascimento (datanasc) 5) Altura em metros (altura) Digite as informaes no SPSS:

numcaso nome 1 A 2 B 3 C 4 D 5 E *0: masculino e 1: feminino

sexo* 1 0 0 1 1

datanasc 05/01/1975 12/06/1984 24/09/1978 13/02/1981 30/04/1974

altura 1,65 1,80 1,87 1,68 1,75

1.3 - Como dar nome a uma varivel


No campo label possvel digitar um nome mais completo para a varivel. Por exemplo, para a varivel NumCaso possvel digitar em label a expresso nmero do questionrio.

1.4 - Como dar nome aos nveis de uma varivel


conveniente registrar no banco de dados os nomes das categorias de variveis categricas. Por exemplo, para a varivel sexo os cdigos poderiam ser: 0: masculino e 1: feminino. Para registrar estes nomes, clicar 2 vezes sobre a varivel sexo, abrindo a planilha Variable View e proceder da seguinte forma: a) Clicar no campo Values da varivel de interesse. Abre-se a janela Value Labels: b) Em Value, digitar 0; c) Em Label, digitar masculino; d) Clicar em ADD; e) Procede-se da mesma forma para os demais nveis de categorizao: digitar 1 para Value e feminino para Label, seguindo-se por ADD; f) Clicar em OK. OBSERVAO: A manipulao do BANCO DE DADOS nos permite: Criar e recodificar variveis; Realizar anlise de dados atravs de estatsticas descritivas, grficos, etc; Selecionar casos para anlise, repetir a anlise para grupos de casos diferentes.

importante dar ao arquivo o nome mais claro possvel para facilitar sua localizao e acesso. Os arquivos de dados so do tipo . sav. RECOMENDAO: A primeira coluna da matriz deve corresponder ao nmero do questionrio, nmero do caso, ou ainda cdigo do registro, pois facilita a localizao de informaes no caso de serem identificados equvocos de digitao.

1.5 - Como acessar um banco de dados j existente


Para acessar um banco de dados j existente, procede-se da seguinte maneira: a) Iniciar o programa SPSS (clicar 2 vezes sobre o cone); b) Clicar em File Open Data, abrir o arquivo que se deseja. Neste manual usaremos como exemplo o arquivo World95.sav que se encontra disponvel junto com o programa SPSS.

1.6 - Como exportar um banco de dados do spss para o excel


Para se exportar um BANCO DE DADOS do SPSS para o EXCEL procede-se da seguinte forma:
a) Clicar em File Save as (abre-se a janela do caminho desejado) e

criar um nome para o Banco de dados; b) Em Save as type escolher Excel; c) Clicar em Save. No local escolhido ser salvo um novo arquivo com a terminao .xls. Para exportar para outros programas procede-se da mesma maneira, penas mudando em Save as type para o tipo de sua preferncia.

2. INTRODUO AOS MTODOS ESTATSTICOS 2.1 - Tipos de variveis: definio


Do ponto de vista estatstico, para decidirmos qual a anlise estatstica apropriada, devemos distinguir entre dois tipos bsicos de variveis: Variveis quantitativas: so variveis que podem ser mensuradas atravs de escalas quantitativas, isto , escalas que tm unidades de medida. Ex.: Renda Familiar (medida em R$ ou em salrios mnimos); Idade (medida em anos, ou meses); Faturamento de uma Empresa (R$, US$); N de Empregados (N), Peso (em kg), Altura (em cm) Variveis qualitativas ou categricas: so variveis medidas originalmente em categorias. Ex: Sexo, Profisso, Religio, Municpio, Regio

2.2 - Descrio e explorao de dados


O objetivo bsico deste procedimento introduzir tcnicas que permitam organizar, resumir e apresentar os dados, de tal forma que possam ser interpretados de acordo com os objetivos da pesquisa e o tipo de varivel. Um primeiro passo para analisar qualquer banco de dados avaliar separadamente cada varivel (o que ser denominado de anlise univariada). Se as variveis so quantitativas usamos estatsticas descritivas (ex: mdia, desvio padro, valor mnimo, valor mximo) ou grficos (ex: histograma e box plot). Se as variveis so qualitativas usaremos tabelas de freqncia ou grficos (ex: grfico de barras e grfico de setores, tambm conhecido como grfico de pizza).

OBSERVAO: No podemos calcular mdia, varincia ou desvio-padro de variveis qualitativas ou variveis categricas.

2.3 - Anlise univariada 2.3.1 - Variveis quantitativas 2.3.1.1 - Como obter as estatsticas descritivas
A partir daqui ser utilizado o banco WORLD95.SAV. Para calcular as

estatsticas descritivas possvel proceder de 2 formas: 1 - Atravs do comando Frequencies a) Clicar em Analyze Descriptive Statistics Frequencies; b) Localizar na janela esquerda a varivel de interesse (por exemplo, babymort: mortalidade infantil) e clicar na ; c) Clicar em Statistics, e assinalar as opes desejadas (ex: quartiles, mean, standard deviation, minimum, maximum); d) Clicar em Continue; OK; e) Os resultados da anlise estatstica aparecem na janela de resultados (OUTPUT), que poder ser salva, dando origem a um arquivo do tipo .spo (SPSS output). EXEMPLO: Frequencies
Statistics Infant mortality (deaths per 1000 live births) N Mean Median Std. Deviation Minimum Maximum Valid Missing 109 0 42,313 27,700 38,0792 4,0 168,0

2 - Atravs do comando Descriptives f) Clicar em Analyze Descriptive Statistics Descriptives; g) Localizar na janela esquerda a varivel de interesse (por exemplo, mortalidade infantil (babymort)) e clicar na ; h) Clicar em Options, e assinalar as opes desejadas; i) Clicar em Continue; OK;

j)

Os resultados da anlise estatstica aparecem na janela de resultados (OUTPUT), que poder ser salva, dando origem a um arquivo do tipo .spo (SPSS output).

EXEMPLO: Descriptives
Descriptive Statistics N Infant mortality (deaths per 1000 live births) Valid N (listwise) 109 109 Minimum Maximum 4,0 168,0 Mean 42,313 Std. Deviation 38,0792

2.3.1.2 - Como obter um histograma


a) b) c) d) e) Clicar em Graphs, Histogram Localizar na janela a varivel desejada, Aps ter selecionado a varivel (neste caso, babymort), clicar na Pode-se clicar na opo Titles para dar um ttulo ao histograma. Clicar em OK

EXEMPLO: Histograma da varivel Babymort (Infant Mortality) :

10

2.3.1.3 - Como obter um box-plot


Clicar em Graphs Legacy diaogs Boxplot; Selecione Simple Summaries of separate variables; Clicar em Define; Em Variable selecionar uma varivel quantitativa (por exemplo, Babymort); e) Clicar em OK. a) b) c) d) RESULTADO: Explore
Case Processing Summary Cases Valid N Infant mortality (deaths per 1000 live births) 109 Percent 100,0% N 0 Missing Percent ,0% N 109 Total Percent 100,0%

11

INTERPRETAO: A tabela acima apresenta o nmero de casos vlidos (valid), o nmero de no respostas (missing) e o nmero total das observaes. Infant mortality (deaths per 1000 live births)

INTERPRETAO: Atravs do Box-plot possvel observar como as variveis esto distribudas em relao homogeneidade dos dados, valores de tendncia central, valores mximos e mnimos e valores atpicos, se existirem. Quando a caixinha (box) muito pequena, significa que os dados esto muito concentrados em torno da mediana, e se a caixinha for grande, significa que os dados so mais hetereogneos.

12

LEGENDA: Md: Mediana (linha horizontal escura dentro do box) Q1: Quartil inferior - 1quartil (limite inferior do box) Q3: Quartil superior - 3quartil (limite superior do box) d: diferena interquartlica (d = Q3 Q1) o : outlier (valores acima de 1,5 x d) x : outlier (valores acima de 3,0 x d) Se no existir nenhum valor abaixo de Q1-1,5d ou acima de Q3+1,5d, os limites do boxplot correspondem aos valores mnimo e mximo da varivel.

2.3.2 - Variveis categricas (qualitativas) 2.3.2.1 - Como obter a distribuio de freqncias


Para calcular as freqncias procede-se da seguinte forma:

a) Clicar em Analyze Descriptive Statistics Frequencies; b) Selecionar a varivel desejada (por exemplo, region), clicar na c) Selecionar Display frequency tables; d) Clicar em OK. ;

RESULTADO:

13

Statistics Region or economic group N Valid 109 Missing 0 Region or economic group Valid Cumulative Frequency Percent Percent Percent Valid OECD 21 19,3 19,3 19,3 East Europe 14 12,8 12,8 32,1 Pacific/Asia 17 15,6 15,6 47,7 Africa 19 17,4 17,4 65,1 Middle East 17 15,6 15,6 80,7 Latin America 21 19,3 19,3 100,0 Total 109 100,0 100,0 INTERPRETAO: A tabela acima apresenta na 1 coluna a freqncia simples de casos, na 2 coluna a freqncia relativa, na 3 coluna a freqncia relativa excluindo os missings e na 4 coluna a freqncia relativa acumulada.

2.3.2.2 - Como obter grficos


Para se obterem os diferentes tipos de grficos disponveis no programa procede-se da seguinte forma: a) Clicar em Graphs, selecionar o grfico desejado, que ao salv-lo, d origem a um arquivo do tipo .cht (Chart - arquivo de grficos). OBSERVAO: Com variveis categricas, o adequado fazer grfico de setores (Pie), de Colunas

2.3.2.2.1 - Como obter grfico de barras


EXEMPLO: Grfico de barras para a varivel region

14

a) Clicar em Graphs, Legacy dialogs selecionar Bar; b) Selecionar a opo Simple e, em Data in chart are, selecionar a opo Summaries for groups of cases e clicar em Define; c) Na opo Bars represent selecionar % of cases; d) Na opo Category axes selecionar a varivel region, clicar OK. RESULTADO:

Para colocar o valor percentual de cada categoria no grfico: a) Clicar duas vezes no grfico; b) Abre o SPSS Chart Editor; clicar em elements/show data labels; c) Na janela properties, em data value labels, selecionar percents; d) Clicar OK. RESULTADO:

15

2.3.2.2.2 - Como obter grfico de setores (pizza)


EXEMPLO: Grfico de Setores (Pie) para a varivel region

a) Clicar em Graphs, selecionar Pie; b) Selecionar a opo Summaries for groups of cases e clicar em Define; c) Na opo Define Slices by selecionar a varivel region.
RESULTADO:

16

Para colocar no grfico o valor percentual de cada categoria: a) Clicar duas vezes no grfico; b) Abrir a janela de edio de grficos (SPSS Chart Editor); c) Nesta janela, clicar em elements/show data labels; d) Abrir uma nova janela properties; e) Ir em data value labels, selecionar a opo percents; f) Clicar em OK. RESULTADO:

17

2.4 - Como exportar o output para word


Para se exportar o output para Word procede-se da seguinte forma: a) No output, clicar em File, Export, abre-se a janela Export output; b) Em Objects to export possvel escolher exportar tudo, apenas uma seleo, ou tudo que est visvel; c) Em Document, Type, escolha o tipo de arquivo para o qual se deseja exportar os resultados (neste caso WORD); d) Em File name digite o local e o nome do arquivo que ser salvo; e) Clique OK. No local escolhido ser salvo um novo arquivo com a terminao .doc. Para exportar para outros programas procede-se da mesma maneira, apenas mudando em Type para o tipo de sua preferncia.

3 - CATEGORIZAO DE VARIVEIS 3.1 - Como categorizar uma varivel quantitativa


Para exemplificar, usaremos uma varivel categorizada utilizando quartis. Os quartis so pontos de corte na escala da varivel de tal forma que cada grupo formado a partir destes pontos de corte ter um quarto dos casos, ou seja, 25% do tamanho total da amostra. Os passos necessrios para categorizar uma varivel utilizando os quartis so os seguintes: 1 OPO: utilizando o comando Recode Into Different Variables 1. Calcular os quartis da varivel em questo, neste caso, Populao (populatn), do seguinte modo: a) Clicar em Analyze Descritive Statistics Frequencies; b) Selecionar a varivel que se deseja categorizar na janela esquerda e clicar ; c) Retirar a opo de Display Frequency Tables, a fim de que no venha listada a totalidade de casos da varivel (no estudo em pauta o nmero de 109 casos); d) Clicar em Statistics e assinalar Quartiles; e) Clicar em Continue; OK.

18

RESULTADOS: Frequencies
Statistics Population in thous ands N Valid Miss ing Perc entiles 25 50 75

109 0 5000,00 10400,00 37100,00

2.

Criar uma varivel com 4 categorias, definidas pelos quartis, da seguinte maneira: Categoria 1 2 3 4 Intervalo de valores Mnimo at 5000,00 5001,00 at 10400,00 10401,00 at 37100,00 37101,00 at o valor mximo da varivel

Para categorizar a varivel populatn, usando os limites dados pelos quartis procede-se da seguinte forma: a) Clicar em Transform Recode Into Different Variables; b) Localizar, na janela esquerda, a varivel a ser categorizada ( populatn) e clicar na ; c) Digitar um novo nome para a varivel de sada ( Output Variable) - por exemplo POPREC - e clicar em Change; d) Clicar em Old and New Values; e) Clicar em Range (lowest through) e digitar o valor obtido para o primeiro quartil, no caso 5000; f) Em New Value, digitar 1; g) Clicar em ADD; h) Assinalar Range, colocando: 5001 at (Through) 10400 (segundo quartil); i) Na opo New Value, digitar 2; j) Clicar em ADD; k) Assinalar Range, 10401 at (Through) o terceiro quartil 37100; l) Na opo New Value, digitar 3; m) Clicar em ADD;

19

n) Clicar em Range (Through Highest) e digitar o valor imediatamente superior ao 3 quartil, no caso 37101; o) Na opo New Value, digitar 4; p) Clicar em ADD; Continue, OK. A nova varivel POPREC corresponde varivel populatn categorizada, sendo esta automaticamente includa no final banco de dados que estamos utilizando (World95.sav - Arquivo de dados). OBS: voc pode dar nome aos nveis desta nova varivel. Para isso, proceda da seguinte forma: a) No banco de dados, clique 2 vezes sobre a nova varivel Poprec, obtendo-se a planilha Variable View. b) Na linha da varivel Poprec, clicar em Values. Abre-se uma nova janela - Value Labels; c) Em Value, digitar 1; d) Em Label, digitar pop. inferior a 5000,00; e) Clicar em ADD; f) Procede-se da mesma forma para os demais nveis de categorizao: 2, 3 e 4; g) Clicar em Continue; OK.

2 OPO: utilizando o comando VISUAL BINNING a) Clicar em Transform Recode Visual Binning; b) Localizar, na janela esquerda, a varivel a ser categorizada ( populatn) e clicar na ; c) Clicar continue; d) Na caixa Binned variable incluir o novo nome da varivel em quartis (ex:popQuartis); e) Em make cutpoints, escolher a opo equal percentiles based on scanned cases; f) Preencher uma das seguintes opes: a. Number of cutpoints: n de grupos - 1, no caso, 4 - 1 = 3; OU b. Width (%): % de casos em cada grupo, no caso como so 4 grupos de mesmo tamanho, 100%/4 = 25% g) Clicar apply; h) Clicar em make labels; i) Clicar OK.

20

3.2 - Como criar uma varivel a partir de datas


Para criar uma varivel, p.ex. Idade, a partir da varivel data de nascimento (datanasc) e da data atual (hoje), utilizamos a funo DATEDIFF (datetime2,datetime1,unit). I. Para criar a varivel hoje: a) Criar uma coluna no banco de dados chamada hoje com formato de data (no necessrio digitar um por um); b) Clicar no menu Transform Compute variable; c) Em Target Variable digite o nome da varivel hoje para preencher todos os casos com a data de hoje; d) Na janela Functions selecionar a opo DATE.Dmy(Day,month,year) e clicar na e) Na janela Numeric Expression digite o dia,ms,ano dentro do parnteses (separado por vrgulas); f) Clicar em OK; II. Para calcular a idade: a) Criar a coluna datanasc com formato de data e digitar as datas de nascimento dos alunos; b) Selecionar Transform, Compute variable; c) Em Target Variable digite o nome da nova varivel, p. exemplo idade; d) Na janela Functions selecionar a opo DATEDIFF(datetime2,datetime1,unit) e clicar na ; e) Localizar na janela abaixo de Target Variable a varivel hoje e clicar na (a varivel selecionada deve ficar entre os parnteses, no lugar de datetime2); f) Na mesma janela, localizar a varivel datanasc (a varivel selecionada deve ficar entre os parnteses, no lugar de datetime1); g) No lugar de units digitar a unidade de tempo que voc deseja (years para anos, months para meses, days para dias, etc); h) Clicar em OK. Exerccio: No banco hosp.xls, calcular o tempo de internao (em dias), a partir das variveis DataInt (data de internao) e DataAlta (data da alta). Fazer a anlise descritiva apropriada.
21

3.3 - Como criar uma varivel atravs da combinao de outras duas


Nesta seo, ser utilizado o banco GSS93.sav, que tambm se encontra disponvel junto com o programa SPSS. Para criar uma varivel a partir da combinao de outras duas, como por exemplo, combinar a varivel sexo (sex) e a varivel raa (race) utilizaremos o seguinte procedimento para criar a varivel SEXRACE. Sabendo que a varivel SEX categorizada da seguinte forma: 1-Male e 2-Female e a varivel RACE categorizada da seguinte forma: 1- White, 2-Black e 3-Other pode-se criar a varivel SEXRACE com as seguintes categorias: 1- White Male, 2- White Female, 3- Black Male 4- Black Female 5- Other Male 6- Other Female Ento se procede da seguinte forma: a) Selecionar Transform, Compute variable; b) Em Target Variable digitar o nome da nova varivel, por exemplo SEXRACE; c) Na janela Numeric Expression digitar 1; d) Clicar em If; e) Selecionar a opo Include if case satisfies condition; f) Localizar na janela abaixo de Include if case satisfies condition a varivel desejada, g) Aps ter selecionado a varivel (neste caso, sex), clicar na ; h) Digitar =1 & na janela ao lado da varivel sex; i) Selecionar na janela ao lado a varivel race e clicar na ; j) Na janela ao lado da varivel race digitar =1; k) Aps esse procedimento a expresso na janela deve ser a seguinte: sex=1 & race=1;

22

l) Clicar em Continue e OK ou Paste. A varivel SEXRACE aparecer no final do banco de dados. m) Para criar as demais categorias da varivel SEXRACE procede-se de maneira anloga, alterando o cdigo na janela Numeric Expression para 2, 3, 4, 5 e 6 e a expresso da janela Include if case satisfies condition. Resultado das janelas: Numeric Expression 1 2 3 4 5 6

Include if case satisfies condition sex=1 & race=1 sex=2 & race=1 sex=1 & race=2 sex=2 & race=2 sex=1 & race=3 sex=2 & race=3

3.4 - Como criar uma varivel atravs de um clculo com outras variveis
Nesta seo, ser utilizado o banco imc.sav. Para criar a varivel IMC, a partir da combinao de outras duas (peso e altura), cuja frmula a seguinte: IMC = peso(kg) / altura(m), utilizaremos o seguinte procedimento para criar a varivel IMC. a) Selecionar Transform, Compute variable; b) Em Target Variable digite o nome da varivel IMC; c) Localizar na janela abaixo de Target Variable a varivel peso e clicar na ; d) No teclado virtual localizado no centro da janela, clicar em / (funo de diviso); e) Localizar na janela abaixo de Target Variable a varivel altura e clicar na ; f) No teclado virtual localizado no centro da janela, clicar em ** (funo de exponenciao) e 2; g) Clicar em OK ou PASTE. Salve o banco de dados, pois o mesmo ser utilizado em outro exerccio. Exerccio:
1) Categorize a varivel IMC (criada no banco IMC) nas seguintes categorias: 23

1: < 25 2: de 25 a 29,9 (sobrepeso) 3: 30 (obesidade) - Realizar a anlise descritiva adequada para a varivel IMC em categorias.

2) Com o banco de dados HAS.SAV, criar a varivel HAS (hipertenso arterial sistmica) que definida pela PAS >= 140 ou PAD >= 90.
- Realizar a anlise descritiva adequada para as variveis PAS, PAD e HAS.

3.5 - Como criar uma varivel a partir da contagem de outras


Muitas vezes nos deparamos com situaes onde necessrio contar em quantas variveis apareceu algum cdigo. Por exemplo, quantas medicaes o indivduo toma, ou quantas comorbidades o paciente possui, ou ainda, quantas variveis possuem dados perdidos (missing values). No comando Count values within cases (Menu Transform) possvel criarmos uma varivel cuja informao seja uma contagem a partir de outras. Para o nosso exemplo, utilizaremos o banco GSS93.SAV. A ideia contar quantos estilos musicais (dentre os estilos: country, blues, clssica, jazz, rap e heavy metal) as pessoas gostam. Originalmente, as variveis possuem 5 categorias vlidas: 1-gosto muito, 2-gosto, 3-tanto faz, 4-no gosto, 5-no gosto muito. Para o exemplo, iremos considerar que as categorias 1 e 2 indicam quem gosta do estilo. Os passos so os seguintes: a) Clicar no menu Transform, e depois em Count values within cases; b) Na janela Target variables, digitar o nome da varivel que vai armazenar a nossa contagem: nestilosmusicais; c) Na janela Target label, digitar um rtulo para a varivel: Quantidade de estilos musicais; d) Na janela das variveis, abaixo de Target variables, selecionar as variveis que interessam: country, blues, classicl, jazz, rap, hvymetal, clicando em para incluir na janela Variables; e) Clicar em Define values; f) Clicar em Range no quadro esquerda e digitar 1 (gosto muito) na caixa de cima e 2 (gosto) na caixa de baixo; g) Clicar em Add; h) Clicar em Continue; i) Clicar em Ok ou Paste; A tabela de frequencias deve ficar assim:

24

Quantidade de estilos musicais Cumulative Frequency Valid ,00 1,00 2,00 3,00 4,00 5,00 6,00 Total 95 345 383 375 229 54 19 1500 Percent 6,3 23,0 25,5 25,0 15,3 3,6 1,3 100,0 Valid Percent 6,3 23,0 25,5 25,0 15,3 3,6 1,3 100,0 Percent 6,3 29,3 54,9 79,9 95,1 98,7 100,0

Exerccio: - Com o banco stroke.sav, crie uma varivel (p.ex: numeroFR) que seja a quantidade de fatores de risco (sedentarismo, DM, obesidade, fumo e hipercolesterolemia) de cada paciente. - Realizar a anlise descritiva adequada para a varivel numeroFR.

4. MANIPULAO DE DADOS 4.1 - Ordenao de casos: Sort Cases


Uma das necessidades na hora da manipulao dos dados no dia-adia a ordenao dos casos segundo uma ou mais variveis. Para fazer isso no SPSS for Windows, usar o procedimento Sort Cases presente no menu Data. Aps clicar em Data opo Sort Cases, uma janela aberta. Movemos para o quadro Sort by a varivel segundo a qual o arquivo deve ser ordenado. Podemos mover para esse quadro mais do que uma varivel. Nesse caso, o arquivo ordenado, em primeiro lugar, pelos valores da primeira varivel no quadro e, em segundo lugar, pela segunda varivel no quadro; a segunda ordenao feita para os valores comuns da primeira varivel.

25

Podemos escolher tambm entre ordem crescente ou decrescente de ordenao para cada uma das variveis. Isso feito atravs do quadro Sort Order opes Descending (decrescente) ou Ascending (crescente). Vamos fazer uma ordenao segundo age (ordem decrescente) dentro dos cdigos de sex (ordem crescente). Para isso procede-se da seguinte forma: a) Mover a varivel sex para ao quadro Sort Cases e escolher a opo Ascending no quadro Sort Order. b) Mover em seguida a varivel age para o quadro Sort Cases e escolher a opo Descending no quadro Sort Order. c) Clicar OK para executar a ordenao.

Note que aps a execuo deste comando a posio dos indivduos nas linhas fica completamente alterada, pois o indivduo na linha 1 do banco de dados aps ordenado pode no ser o primeiro caso digitado. Para que esta informao no se perca essencial que exista uma varivel com o nmero do indivduo.

26

Outro jeito de ordenar os casos clicando com o boto direito do mouse no nome da varivel (retngulo cinza). Um menu com alguns comandos aberto. Vamos experimentar clicando na varivel ID, colocar o banco de dados em ordem novamente.

4.2 - Seleo de casos: Select Cases


Uma outra necessidade a seleo (temporria ou permanente) de parte do arquivo de dados. Digamos que estamos interessados em estudar um segmento especfico da amostra. O SPSS possui vrias formas de seleo de dados. Falaremos nessa seo de todas elas, mas discutiremos detalhadamente a mais usada de todas. Para maiores detalhes sobre as demais formas de seleo, recomenda-se que o leitor use o manual do SPSS for Windows. Para fazer qualquer tipo de seleo, devemos clicar o menu Data opo Select Cases.

27

No quadro central Select, esto presentes cinco opes diferentes para seleo: All cases opo usada por default, utiliza todas as observaes do banco de dados; If condition is satisfied atravs dessa opo, podemos definir expresses condicionais para seleo de casos; Random sample of cases podemos selecionar uma porcentagem ou nmero exato de casos; a seleo feita aleatoriamente; Based on time or case range usamos essa opo quando estamos interessados em selecionar uma faixa especfica de valores, por exemplo, os casos do nmero 100 ao 200; tambm utilizada para fazer selees baseadas em datas; User filter variable uma varivel escolhida no banco de dados e usada como filtro; todos os casos para os quais a varivel filtro assume o valor 0 no sero selecionados. Voc tem duas opes para o tratamento dos casos que no sero selecionados. atravs do quadro Unselected Cases Are que podemos fazer a escolha: Filter... os casos (linhas) que no so selecionados no so includos nas anlises posteriores, porm, permanecem na janela de dados; caso voc mude de idia e queira usar os casos no selecionados na mesma sesso do SPSS, basta desligar o filtro; Copy... - Nesta opo, o SPSS cria uma nova janela de dados com os casos selecionados. O nome da janela deve ser fornecido pelo usurio na lacuna Dataset name. Deleted os casos (linhas) no selecionados so apagados da janela de dados; caso voc mude de idia e queira usar os casos no selecionados, voc dever ler novamente o arquivo de dados original. Neste caso deve-se tomar o cuidado de salvar o banco de dados com outro nome (File...Save As). Suponha que estamos interessados em selecionar as mulheres que se casaram com menos de 20 anos (varivel agewed) no banco de dados GSS93.sav. A funo condicional para seleo nesse caso dada por: sex = 2 & agewed >= 13 & agewed <= 19 Portanto, o tipo de seleo de dados que faremos deve possibilitar a criao de sentenas matemticas lgicas para seleo dos casos. Para isso, clicamos em If condition is satisfied e entramos no retngulo If...

28

Atravs da janela que aberta, usamos o retngulo superior para escrever uma funo lgica na qual a seleo vai ser baseada. Para a construo da funo, podemos usar todas as variveis que esto no quadro esquerda e as funes disponveis no quadro inferior direito.

Uma vez escrita a funo que determina a regra de seleo dos casos, clique Continue e voc voltar janela anterior. No quadro inferior (Unselected cases are), vamos optar pelo modo Filtered (ou seja, os casos no selecionados permanecem na tela de dados, porm, no sero utilizados em anlises futuras) e clicar OK. Voc pode perceber que, depois de feita a seleo, a janela de dados sofre algumas alteraes. As linhas (casos) que no foram selecionadas apresentam uma listra no canto esquerdo da janela de dados. A barra localizada na parte inferior da janela apresenta a mensagem Filter On. Alm disso, uma coluna de nome filter_$ adicionada janela de dados. Essa nova coluna apresenta valor 0 para as linhas que no foram selecionadas e valor 1 para as linhas que foram selecionadas.

29

Apesar de voc conseguir ver os casos que no foram selecionados, qualquer anlise efetuada da para frente no leva em conta esses casos. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Temos duas maneiras de cancelar a seleo de casos, se a opo Filtered foi usada para efetuar a seleo. A primeira delas ativar a opo All Cases da janela de seleo de casos (menu Select Cases) e clicar OK. A Segunda maneira deletar a coluna filter_$ da janela de dados.

4.3 - Diviso de anlises por grupos: Split File


Vamos supor que, aps uma srie de anlises, chegamos concluso de que o comportamento dos homens e das mulheres completamente diferente com relao s preferncias para horas de lazer. No faz sentido, portanto, apresentar a anlise do questionrio de opinio sobre lazer com os homens e mulheres juntos. No fundo, o que pretendemos fazer, daqui para frente, so duas anlises idnticas, uma para cada sexo.
30

Para esse tipo de situao, podemos utilizar o procedimento Split File, presente no menu Data. Por default sempre analisamos todos os casos juntos, sem separao por grupos. Por esse motivo, a opo selecionada na janela Analyze all cases. Para repetir a anlise para as categorias de uma determinada varivel, clicamos em Compare groups ou Organize output by groups, e ento o quadro Groups Based on fica disponvel. Moveremos para esse quadro a varivel (ou variveis) que definiro os grupos para os quais a anlise deve ser repetida. Se mais do que uma varivel for selecionada, os grupos sero definidos pela combinao das categorias de todas as variveis. Podemos ainda escolher se o banco de dados deve ser ordenado pela varivel que definir os grupos ( Sort the file by group variables) ou se o banco de dados j est ordenado pela varivel que definir os grupos (File is already sorted). Se o banco no estiver ordenado corretamente, o comando no ser executado de forma adequada. No nosso caso, selecionamos a varivel gender e a movemos para o quadro Groups Based on e clicamos OK. A nica mudana que acontece na janela de dados a mensagem Split File On na barra inferior, ou a ordenao dos casos pela varivel que definiu os grupos, caso o banco de dados ainda no estivesse ordenado. Porm, qualquer anlise ou grfico feitos de agora em diante vo gerar dois resultados, uma para os homens e outro para as mulheres. Para exemplificar, vamos pedir uma anlise descritiva (mdia, desviopadro, quartis, mnimo e mximo) da varivel age separada por sexo do banco de dados GSS93.sav. A partir dos passos anteriores para dividir a amostra de acordo com o sexo, clicamos em Analize, depois em Descriptives e depois em Frequencies. Selecionamos a varivel age e, em Statistics, selecionamos as opes desejadas (quartiles, mean, std deviation, minimum, maximum). Aps clicamos em continue e em OK. Note que os resultados so apresentados em dois blocos, o primeiro para o sexo masculino e o segundo para o sexo feminino se a opo escolhida foi Organize output by groups. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Para cancelar o procedimento Split File basta ativar a opo Analyze all cases presente na janela de definio da opo Split File menu Data.

31

4.4 - Juntar bancos de dados: Merge Files


Muitas vezes os dados se encontram em diferentes bancos de dados e em algum momento precisamos uni-los para poder cruzar alguma varivel que est num banco com outra de outro banco ou ainda unificar em um mesmo banco, pacientes de diferentes bancos de dados (com as mesmas variveis). No comando Merge files, no menu Data, o SPSS permite juntar bancos de dados que tenham as mesmas variveis com diferentes sujeitos ou bancos que tenham variveis diferentes dos mesmos sujeitos.

4.4.1 - Juntando bancos com diferentes casos


Os bancos de dados GSS93 p1 casos.sav e GSS93 p2 casos.sav possuem diferentes indivduos cada um. Para juntar os bancos IMPRESCINDVEL que eles possuam as mesmas variveis (inclusive nos mesmos formatos). O procedimento o seguinte. a) Abrir o banco de dados GSS93 p1 casos.sav (File -> Open -> data); b) Clicar no menu Data -> Merge files -> Add cases; c) Na janela Add cases, voc deve escolher: a. An open dataset: se o outro banco de dados j estiver aberto em alguma janela; b. An external PASW statistics data file: se o banco estiver fechado, lembrando que o mesmo j deve estar em formato do SPSS, ou seja, ter sido salvo como .sav. d) Clicar em continue; e) As variveis com os mesmos nome nos dois bancos de dados so automaticamente includas na janela Variables in New Active Dataset; f) Se voc quiser identificar qual o banco de origem de cada caso no novo banco, clicar em Indicate case source as variable; g) Na janela Unpaired Variables, variveis seguidas de * esto no primeiro banco de dados e aquelas seguidas de + esto no banco novo; h) Clicar em OK ou Paste.

4.4.2 - Juntando bancos com diferentes variveis


Os bancos de dados GSS93 p1 var.sav e GSS93 p2 var.sav possuem diferentes variveis: no primeiro esto as variveis demogrficas
32

dos indivduos e no segundo as respostas de um questionrio de opinies e preferncias. Para juntar os bancos IMPRESCINDVEL que eles NO possuam as mesmas variveis e que os casos estejam ordenados. O procedimento o seguinte. a) Abrir o banco de dados GSS93 p1 var.sav (File -> Open -> data); b) Ordenar o banco de dados pela varivel Id: clicar com o boto da direita e em Sort Ascending; c) Clicar no menu Data -> Merge files -> Add variables; d) Na janela Add variables, voc deve escolher: a. An open dataset: se o outro banco de dados j estiver aberto em alguma janela e clique no Dataset que voc deseja mesclar; b. An external PASW statistics data file: se o banco estiver fechado, lembrando que o mesmo j deve estar em formato do SPSS, ou seja, ter sido salvo como .sav e clique em Browse para localizar o arquivo de dados. i) Clicar em continue; j) Clicar em Match cases on key variables in sorted files; ao clicar aqui, voc deve optar: a. Both files provide cases: se voc sabe que cada banco possui uma linha para cada indivduo da amostra; b. Non-active ou active dataset is keyed table: se um dos bancos possuir mais de um registro (linha) por paciente, que devem estar identificados pela mesma varivel chave (key variable); k) Clicar na varivel que identifica o nmero do caso (deve estar na janela Excluded Variables), que no nosso exemplo a varivel id e depois clicar em (a varivel dever aparecer na caixa Key variables; l) Na janela Excluded Variables, variveis seguidas de * esto no primeiro banco de dados e aquelas seguidas de + esto no banco novo; m) Clicar em OK ou Paste.

4.5 - Manipulao de arquivos


Para retornar aos arquivos: - *.sav (arquivo de dados) - *.cht (arquivo com cada grfico realizado) - *.spo (arquivo de resultados)

33

Procede-se da seguinte maneira: a) Clica-se na opo de menu Window; b) Seleciona-se a janela de sada desejada que consta na lista de arquivos abertos ou disponveis, clicando uma vez sobre sua indicao.

4.6 - Edio do arquivo de resultados (*.spo): como apagar anlises no desejadas no arquivo de resultados
Quando inadvertidamente realiza-se um procedimento no desejado, para corrigir o equvoco, procede-se da seguinte forma: a) Clica-se no menu Edit Select Output Block a partir deste momento ser selecionada a ltima sada executada , o que vai dar origem a uma tarja preta; b) Aperta-se o boto Delete, tornando sem efeito o ltimo procedimento efetuado. Tambm podem-se apagar outros blocos de resultados, bastando para tal colocar o cursor sobre o bloco que se deseja apagar e repetir a operao explicada acima.

5. ALGUMAS ANLISES BIVARIADAS 5.1 - Comparao de duas variveis categricas: Teste Qui quadrado
Para avaliar a associao entre duas variveis categricas, ou ainda, para fazer uma comparao de uma varivel categrica entre dois (ou mais) grupos, utilizado o teste de de associao ou de heterogeneidade, respectivamente. Na prtica, ambos so obtidos no mesmo comando. Para exemplificar, vamos verificar se homens e mulheres diferem em suas opinies sobre a permisso de porte de armas utilizando o banco GSS93.SAV. a) Entrar no menu Analyze Descriptive statistics Crosstabs; b) Como vamos comparar os sexos, incluir gunlaw nas colunas e a varivel sex na linha: procurar a varivel sex na lista de variveis esquerda e clicar em ao lado da caixa Row e depois localizar a varivel gunlaw e clicar em ao lado da caixa Column; c) Clicar em Exact e depois marcar exact, esta opo realiza os testes exatos ao invs dos assintticos, que so uma aproximao clicar em continue;

34

d) Clicar em Statistics, depois em Chi-square esta a opo para pedir que ele realize o teste de e depois clique em Continue; e) Na opo Cells, podemos pedir diversos valores que aparecero nas caselas da tabela. Clicar em Cells, depois em Row no quadrado das percentages e depois em continue; f) Clicar em Ok ou Paste. RESULTADO: gunlaw Favor or Oppose Gun Permits * sex Respondent's Sex
Crosstab
Favor or Oppose Gun Permits Favor Respondent's Sex Male Count % within Respondent's Sex Female Count % within Respondent's Sex Total Count % within Respondent's Sex Oppose Total

314 73,9% 497 88,9% 811 82,4%

111 26,1% 62 11,1% 173 17,6%

425 100,0% 559 100,0% 984 100,0%

Podemos observar que, enquanto 73,9% dos homens opinaram a favor da permisso de uso de armas, 88,9% das mulheres manifestaram a mesma opinio.
Chi-Square Tests Asymp. Sig. Value Pearson Chi-Square Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association 37,584
c b

Exact Sig. (2sided) ,000

Exact Sig. (1sided) ,000

Point Probability

df
a

(2-sided) 1 1 1 ,000 ,000 ,000

37,622

36,592 37,417

,000 ,000

,000 ,000 ,000 ,000

,000

,000

35

N of Valid Cases

984

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 74,72. b. Computed only for a 2x2 table c. The standardized statistic is -6,131.

Pelo teste de , podemos concluir que a diferena entre homens e mulheres estatisticamente significativa (P<0,001).

5.1.1 - Como obter os resduos ajustados


Verificada a associao global entre as variveis pode-se verificar se h associao local entre categorias, calculando-se os resduos ajustados. O resduo ajustado tem distribuio normal com mdia zero e desvio padro igual a 1. Desta forma, caso o resduo ajustado seja maior que 1,96, em valor absoluto, pode-se dizer que h evidncias de associao significante entre as duas categorias (p. ex. homem branco e salrio alto) naquela casela. Quanto maior for o resduo ajustado, maior a associao entre as categorias. Para obter os resduos ajustados procede-se da seguinte maneira: a) Selecionar Analyze, Descriptive Statistics, Crosstabs; b) Clicar em Cells, abre-se a janela Crosstabs: Cell Display; c) Assinalar a opo Observed e Adj. standardized; d) Clicar em Continue; OK. RESULTADO:
Crosstab
Favor or Oppose Gun Permits Favor Respondent's Sex Male Count % within Respondent's Sex Oppose Total

314 -6,1

111 6,1

425 100,0%

36

Female

Count % within Respondent's Sex

497 6,1 811

62 -6,1 173

559 100,0% 984

Total

Count

CONCLUSO: A associao entre sex (sexo) e gunlaw (permisso de porte de armas) j foi considerada significativa. Agora a pergunta : Quais categorias esto associadas localmente? Olhando os resduos ajustados vemos que os maiores valores (positivos) indicam forte associao entre homem e ser contra o porte de armas, bem como h forte associao entre mulher e ser a favor de porte de armas.

5.2 - Como comparar mdias entre dois grupos: Teste t para Amostras Independentes.
O teste t apropriado para comparar as mdias de uma varivel quantitativa entre dois grupos independentes.

EXEMPLO: Comparar a mdia de idade no primeira casamento entre homens e mulheres usando os dados do banco GSS93.sav . a) Sexo (sex) varivel categrica com dois grupos b) Idade no 1 casamento (Agewed) - Varivel resposta quantitativa Para a aplicao do teste t nesta situao procede-se da seguinte forma: a) Clicar em Analyze, Compare Means, Independent Samples t test; b) Clicar sobre a varivel de teste (Test Variables): Agewed ou, conforme o caso em estudo, clicar na varivel correspondente; c) Clicar sobre a varivel de grupo (Grouping Variable) Gender; d) Clicar em: Define Group; e) Abre-se uma janela, na qual se define a categoria correspondente ao Group 1 (no caso masculino) digitando-se o cdigo da categoria atribuda quando da construo do Banco de Dados,

37

nesse caso 1 e Group 2 (no caso feminino) digitando-se o cdigo 2. (Observao: No caso de se desejar confirmar os valores atribudos s variveis, clicar sobre a varivel e escolher a opo options) g) Clicar em Continue e OK.

RESULTADO:
Group Statistics Respondent's Sex Age When First Married Male Female N Mean Std. Deviation Std. Error Mean

492 710

24,16 21,84

4,867 4,929

,219 ,185

Independent Samples Test Levene's Test for Equality of Variances Sig. (2F Age When First Married Equal variances assumed Equal variances not assumed Sig. t df tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper t-test for Equality of Means

,342

,559

8,07 8,08

1200 1064,66

,000 ,000

2,320 2,320

,288 ,287

1,756 1,757

2,885 2,883

INTERPRETAO: Uma das suposies do teste t de que as varincias dos dois grupos sejam iguais. Por isso necessrio testar esta hiptese antes (atravs do teste de Levene) e com base no resultado deste teste, escolhe-se o resultado do teste t supondo varincias iguais ou supondo varincias diferentes.

38

Ao serem analisados os dados do exemplo acima vemos o seguinte: a) Observa-se o resultado do de Levene. Neste exemplo, o valor de p para o teste Levene 0,559, no se rejeita a hiptese de varincias iguais. b) O teste t a ser utilizado o que aparece na primeira linha ( Equal variances assumed), considerando que p < 0,001 (Sig 2-tailed), rejeita-se a hiptese nula (H0) de igualdade das mdias dos dois grupos, logo, pode-se concluir que as mdias da varivel agewed so significativamente diferentes entre os dois grupos de sexo.

As hipteses do teste Levene de igualdade de varincias so: Hiptese Nula (H0): As varincias dos dois grupos so iguais. Hiptese Alternativa (H1): As varincias dos dois grupos so diferentes. As hipteses do teste t para igualdade de mdias entre amostras independentes so: Hiptese Nula (H0): As mdias dos dois grupos so iguais. Hiptese Alternativa (H1): As mdias dos dois grupos so diferentes

39

You might also like