You are on page 1of 18

30/05/2012

Introducción a Stata

Alfonso Muriel
Alfonso Muriel
Unidad de Bioestadística Clínica. IRYCIS

4 de junio de 2012

STATA
• La versión básica es Stata/IC ( Intercooled Stata) 
maneja hasta 2 047 variables
maneja hasta 2.047 variables 
• La siguiente es Stata/SE (Special Edition ) maneja 
hasta 32.766 variables (variables cadena y 
matrices más grandes)
• La versión para Multicore/multiprocesadores es 
Stata/MP, mucho más rápida en ordenadores con
Stata/MP, mucho más rápida en ordenadores con 
dos o mas cores
• Las observaciones están limitadas por la memoria 
no pudiendo exceder de 2 milllones

1
30/05/2012

Almacén de 
Sintaxis

Almacén de Resultados

Almacén de Variables

Comandos
Única ventana en la que se puede escribir

Editar el 
Guardar   Traer al  Ventana 
Abrir Log fichero 
Fichero frente un  de  Parar
activo
gráfico Variables

Abrir
Abrir  Nuevo
Nuevo  Sigue el
Sigue el 
Abrir  Ayuda  fichero  Ver el  proceso
Imprimir
fichero ( View) do fichero

2
30/05/2012

Extensiones comunes de los ficheros

• dta: ficheros de datos en formato Stata.
• raw: ficheros de datos ASCII/Text.
• log: output de STATA.
• do: fichero de comandos.
• gph: Stata Graphic File.
• ado: Stata “Macro” files.

3
30/05/2012

Directorio de
Trabajo

Utilidades de fichero
• dir
St t t l fi h ti
– Stata muestra los ficheros que contiene ese 
directorio. 

• pwd
– Nos muestra la ruta donde está ubicado los 
ficheros. 
ficheros

– G:\CursoStata

4
30/05/2012

Ayuda
• help + ‘nombre de comando’
• help summ 

Abrir base datos
• Extension.dat
• Sintaxis 
. use "G:\CursoStata\VAS.dta", clear
. use VAS.dta ( igual si antes hemos cd)
. sysuse cancer.dat (ejemplos de Stata)

5
30/05/2012

Abrir base datos

• use sexo edad VAS // solamente selecciona 
las variables sexo y edad
l i bl d d
• use VAS in 1/5 // selecciona sólo las cinco 
primeras observaciones, todas las variables
• use sexo edad using VAS  in 1/5 // 
selecciona dos variables y cinco primeras
selecciona dos variables y cinco primeras 
observaciones

Similar a los archivos spo de SPSS


log using "G:\CursoStata\vas
G:\CursoStata\vas.smcl
smcl“
log using "G:\CursoStata\vas.smcl, text“
translate vas.smcl to vas.txt

6
30/05/2012

Ventana do
Similar a la ventana de sintaxis de SPSS
Si se pone un asterisco no ejecuta la orden
Si se pone un asterisco no ejecuta la orden
Por tanto, es útil para colocar notas aclaratorias y 
comentarios.
Por ejemplo:
• *Este es el archivo do para la práctica 1
• También se pueden adjuntar comentarios al 
comando poniendo /* Comentario */
• sum var1  /* Calcula un resumen de var1*/

Memoria versión 11 

Stata necesita hacer una copia de la base 
necesita hacer una copia de la base
de datos que vamos a analizar en la 
memoria RAM de nuestro  ordenador
Para ampliar la capacidad de la memoria 
RAM para Stata:
set mem 512m
set mem
set memory 512m
clear, borra los datos en memoria

7
30/05/2012

Variables
• Los nombres de las variables puede tener 
entre 1 y 32 caracteres
entre 1 y 32 caracteres
• No pueden empezar por un número
• No puede haber espacios
• No utilizar signos(& % $ ∙ ” !)
• Cuidado con los acentos
• Muy sensible
Sexo SEXO sexo son variables diferentes

Tipos de variables
Format
%8.0g
%8.0g
%12.0g
%9.0g
%10.0g

Format

%#s

Strings (Cadena) son guardadas como str# (,str1, str2, str3, ..., str244).
El número después de str indica la maxima extensión. Un str5 podría
valer para “varón", pero no para “masculino”.

Números son guardadas como byte, integer, long y float. Si se utilizan


valores con decimales el formato recomendado es float.

8
30/05/2012

Variables Fecha

Crear una nueva base en STATA

9
30/05/2012

Crear etiquetas
• Archivo de datos
• Variable
• Valores

Etiqueta archivo datos

 use "G:\CursoStata\VAS.dta", clear


G:\CursoStata\VAS.dta , clear

 label data "ESTE ES EL EJEMPLO DEL VAS"

 save "G:\CursoStata\VAS.dta", replace
file G:\CursoStata\VAS.dta saved

 use "G:\CursoStata\VAS.dta", clear
(ESTE ES EL EJEMPLO DEL VAS)

10
30/05/2012

Variables Manager

Etiquetar  valores de variables

11
30/05/2012

Crear una nueva base de datos
• Variables:
– Nº historia clínica
Nº historia clínica
– Sexo
– Fecha de nacimiento
– Fecha de visita
– Fumador(No, Si, EX fumador)
– AP Diabetes
AP Diabetes
– AP HTA
– AP  IAM
– Motivo consulta(texto libre)

Utilidades
 Calculadora
 display 140+1.96*sqrt(15)
* ( )

 147.59105

 Describir la base
 describe 
(resumen de base datos activa)

 describe using "G:\CursoStata\vas12pre.dta“  
(otra base no activa)
 codebook  (descripción mas detallada de base datos activa)

Informe con las 4  primeras observaciones


list in 1/4

12
30/05/2012

Sintaxis
• Signos útiles
+ suma  ‐ resta  *
t * producto  /
d t / división
di i ió ^ potencia
^ t i
> mayor < menor >=  <= 
~ not ! not | or & and ~= distinto  == igual

• Dos signos de igual == se usan para 
comparaciones lógicas y un solo para asignar 
un valor
• help operators

Sintaxis
• [quietly] [by group:] command [varlist] [weight] [if exp] [in range] [using 
filename] [, options]
• Entre corchetes son opcionales
Entre corchetes son opcionales
• quietly: Evita que se imprima salidas durante la ejecución.
• by group: Ejecuta el comando para grupos ordenados. 
• varlist: Lista de variables sobre las que aplica el comando.
• weight: Pesos sobre los que se pondera el estadístico
• if exp:  Sólo hace el comando si cumple la  condición
• in range: Sólo utiliza las observaciones que estan en ese rango
i Sól tili l b i t
• using filename: Fichero sobre el que se aplica el comando.
• , options: Opciones

13
30/05/2012

Sintaxis
 .INSTRUCCCIÓN VARIABLE(S), OPCIONES 

summarize edad
 Variable | Obs Mean Std. Dev. Min Max
 -------------+--------------------------------------------------------
 edad | 107 49.61157 15.10253 4.775542 88.4566

 .
 SELECCIONAR

 summarize edad if sexo==1 (sólo nos da la media en sexo=) 1


 Variable |       Obs Mean    Std. Dev.       Min        Max
 ‐‐‐‐‐‐‐‐‐‐‐‐‐+‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
 edad |        22    48.57535    13.45849   20.08838   72.30259

Si la variable es cadena entre comillas

if sexo==”hombre”
Un aspecto importante a tener en cuenta es que Stata
considera a los valores missing (“.”) como valores máximos

Ejercicio
• Realizar un listado de la base con los varones 
con fiebre menores de 50 años o mujeres > 60
con fiebre menores de 50 años o mujeres > 60 
con tos.(base datos tos.dta).

• Realizar un listado de los pacientes con valores 
de plaquetas menores que 100 o missing. 
R li
Realizar otro listado con los pacientes con 
t li t d l i t
valores de colesterol por encima de 300 o 
missing(base datos Cirrosis Biliar Primaria).

14
30/05/2012

Importar base datos a Stata(1)

Importar base datos a Stata(2)

15
30/05/2012

Importar base datos a Stata(3)
• Desde Spss
• cd "G:\CursoStata“(cambia directorio trabajo)
• clear(borra la base de datos)
• usespss hipertensos120.sav(no poner 
nombres con espacios)

Añadir Casos

use "G:\CursoStata\vas5.dta", clear

append using "G:\CursoStata\vas7.dta"

16
30/05/2012

Añadir Variables
• Merge
• permite combinar bases de datos que tiene 
una variable en común.
• Requiere que las dos bases de datos estén 
ordenadas de manera ascendente por la 
variable.
variable

17
30/05/2012

Añadir variables
merge 1:1 nhc using G:\CursoStata\vas12post.dta"

Transformar base datos
 reshape wide, long Este comando transforma la base de datos de una 
formato ancho (wide) a uno largo (long) y viceversa
Data > Create or change data > Other variable
variable- reshape long inc i(id) j(year)
reshape long inc, i(id) j(year) 
transformation commands > Convert data
between wide and long reshape wide inc, i(id) j(year) 
Wide

id  sex   inc80   inc81   inc82
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1    0    5000    5500    6000
2    1    2000    2200    3300

Long
Long    
i j           x_ij
id   year   sex    inc 
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1     80     0   5000 
1     81     0   5500 
1     82     0   6000 
2     80     1   2000 
2     81     1   2200 
2     82     1   3300 

18

You might also like