Professional Documents
Culture Documents
INTRODSTATA/ pag. 1
Fabin Mndez.
INTRODSTATA/ pag. 2
una ventana. Seleccione 250 ensayos y 17 xitos, y un intervalo de confianza de 99%. Haga click
en Submit. Esta es un ejemplo de uso de Stata como calculadora (sin cargar una base)
Un poco ms abajo est la barra de botones, la cual posee algunos de los comandos arriba
mencionados. Explore el uso de cada uno de los botones. Usted cuenta adems con la ayuda en
lnea. Busque en Help y despliegue esa ventana. En las opciones: Search o Stata Command, usted
puede escribir el comando para el que necesita ayuda.
En la sesin de hoy revisaremos algunos comandos bsicos para el manejo de bases de datos,
conoceremos una de las bases de datos que se utilizar durante el curso y haremos uso de ella
para algunos comandos.
B. Leer bases de datos
Hay diferentes mtodos a travs de los cuales el programa puede leer bases de datos en formatos
no-Stata. En el caso de datos separados por espacios, como es el de la base que utilizaremos a
continuacin, el comando a utilizar es infile.
El formato general de comando es:
infile varlist [_skip[(#)][varlist [skip[(#)]...]]] using filename [if exp] [in range]
Las expresiones en corchetes son opcionales y permiten ignorar algunas variables (_skip) o
algunas observaciones (if, in)
Se utilizarn los datos en el archivo MALARCOM12.CSV que se refiere a individuos residentes en
el rea peri-urbana de Buenaventura.
edad en aos
gnero: 1=M 0=F
etnia: 1= negro 0=otro
nmero de personas en la familia
nmero de aos en el barrio
ocupacin (rural=1; urbana=0)
nmero de aos de escolaridad
tom cloroquina ltimo ao (0=no, 1=s/SEM, 2=s/automedica)
antecedentes de malaria en el ltimo ao (1=s 0=no)
nmero de episodios previos de malaria en el ltimo ao
conoce los sntomas de la malaria(1=s 0=no)
conoce la etiologa de la malaria(1=s 0=no)
conocimiento sobre prevencin: toldillo (1=sabe, 0= no)
conocimiento sobre prevencin: fumigacin(1=sabe, 0= no)
conocimiento sobre prevencin: elimina criaderos (1=sabe,
0= no)
usa toldillo (1=s, 0=no)
usa repelente (1=s, 0=no
usa insecticida (1=s, 0=no)
resultado de gota gruesa (1=positivo 0=negativo)
Fabin Mndez.
INTRODSTATA/ pag. 3
26 0 1 4 4 0 7 0 0 0 1 1 0 1 1 1 0 1 0
13 1 0 6 3 0 6 0 0 0 1 1 0 0 0 0 0 0 0
Para leer la base de datos en Stata utilizamos el comando infile seguido de los nombres asignados
a las variables y el archivo fuente precedido de la palabra using. Denomine las variables con los
nombres que se sugieren en el comando a continuacin (el orden y los espacios son
fundamentales):
. infile edad fem0mas1 etnia perpfami yearbarr ocurural yearesco sem1aut2 malar93 malar93n
conosint conoetio conotol conofum conocri usatol usarepe usainse gg using
c:\suarchivo\malarcom12.csv
(1380 observations read)
OJO: Reemplace la palabra c:\suarchivo por el nombre de la carpeta donde usted tiene su archivo
(la ruta completa a su archivo). Si Stata no ley 1380 observaciones su comando tiene un error.
El uso de buenos nombres para sus variables es muy importante para evitar confusiones
posteriormente. Los nombres muy cortos son prcticos y ahorran espacio, papel y tinta; pero
puede que usted no recuerde luego su variable. Desde Stata 7.0 los nombres de las variables
pueden tener cualquier longitud (veremos luego que de todas maneras a las variables se le pueden
colocar etiquetas).
Esta forma de importar usando el comando infile, se puede considerar ahora obsoleta, pero es
posible que algn da la necesite. Sin embargo, existen desde hace algunos aos en el mercado
programas que facilitan la conversin entre formatos diferentes (uno de ellos es Stat-Transfer).
Digitando describe o usando la tecla F3 usted puede ver una descripcin general de los datos
importados. Note que las variables han sido grabadas (por defecto) en el formato o tipo float (de
esto depende cunto espacio es utilizado para grabar cada registro). Un listado de los tipos de
variables con los que puede guardar sus datos lo encuentra en la ayuda en lnea para datatypes.
En este caso, usted puede ahorrar espacio (porque sus variables tienen valores entre -127 y 126)
de la siguiente forma:
. clear
. infile byte( ..idem..) using
. describe [Note la diferencia del tamao de la base]
A continuacin puede usar el comando list para ver la base y puede etiquetar la base, las variables
o los valores utilizando el comando label.
. list in 1/1
Observation 1
edad
perpfami
yearesco
malar93n
conotol
usatold
gg
26
4
7
0
0
1
0
fem0mas1
yearbarr
sem1aut2
conosint
conofum
usarepe
0
4
0
1
1
0
etnia
ocurural
malar93
conoetio
conocri
usainse
1
0
0
1
1
1
INTRODSTATA/ pag. 4
Como dice la nota final, la base de datos debe grabarse despus de todos los cambios realizados.
Se usa el comando save, seguido de la ruta (directorio) donde desea grabar el archivo:
. save C:\suarchivo\malcom12.dta
file C:\suarchivo\malcom12.dta saved
En modificaciones subsiguientes usted slo necesitar escribir: save, replace.
Con la base grabada ya en formato Stata usted podr, en sesiones de trabajo posteriores, abrir su
base de datos (comando open) sin usar nuevamente el comando infile.
C. Cmo grabar e imprimir los resultados de una sesin
Para guardar e imprimir los resultados de una sesin en Stata, se necesita crear un archivo tipo
log. Usted puede utilizar el ratn para sealar en la lnea de botones de comandos el botn
correspondiente a log. Una ventana aparecer y pedir un nombre para este archivo, por ejemplo:
sesion1.log. Los comandos que a continuacin se digiten y las salidas respectivas quedarn
grabadas en l y podrn imprimirse directamente (use file en la lnea superior de comandos y
luego print log...) o leerse en un editor de texto.
Adicionalmente, usted puede seleccionar de la ventana de resultados, o de la ventana de grficas,
copiar y pegar en un editor de texto (con los comandos a los que Bill nos tiene acostumbrados:
control-Ccontrol-V).
Fabin Mndez.
INTRODSTATA/ pag. 5
20
Largest
80
81
83
85
35
53
62.5
75
Mean
Std. Dev.
24.5971
18.37547
Variance
Skewness
Kurtosis
337.6577
.9364916
3.222887
Para obtener estadsticas de una variable (Ej.: edad) clasificando los registros por la distribucin
de una segunda variable (Ej.: genero), se ordena la base (sort) y luego se utiliza la opcin by; por
ejemplo:
. sort fem0mas1
. by fem0mas1: su edad
2) Tablas (tabulate, table):
Existen dos comandos similares, pero con capacidades diferentes. El comando tabulate
(abreviado a tab) produce tablas de frecuencia de una o dos vas, con algunas opciones para
estadsticas resumen. La sintaxis es:
[by varlist:] tabulate varname1 varname2 [if exp][in range]
[,row col cell chi2 exact nolab plot]
Ejemplo:
. tab fem0mas1, plot
Fabin Mndez.
INTRODSTATA/ pag. 6
Para generar una variable creando categoras de edad en 3 grupos 0-10, 11-40 y >40 aos:
. generate grupedad=recode(edad,10,40,85)
. tab grupedad
Tenga en cuenta que los valores asignados a las categoras de esta variable deben modificarse, si
se quieren utilizar para clculos adicionales.
. recode grupedad 10=0 40=1 85=2
. tab grupedad
Luego puede asignarle rtulos a estos cdigos:
. label define catedad 0 "0-10 1 "11-40" 2 >40
. label values grupedad catedad
. tab grupedad
Existe, sin embargo, una opcin ms rpida con el comando recode. Puede usted descifrarla?
Fabin Mndez.
INTRODSTATA/ pag. 7
EJERCICIOS TALLER # 1:
EJERCICIO 1:
Derive las siguientes variables y asgneles etiquetas tanto a cada variable como a los valores.
Fabin Mndez.