Professional Documents
Culture Documents
COMANDO
using unidad:/nombre de la base.dta
use a:/ nombre de la base.dta
COMANDO
Click al icono (pergamino)
Elegir localizacin para guardar el
archivo
Asignar nombre al archivo con
extensin log
Abrir
Para cerrar click en el icono y en
close log file
Log using a:/nombre del archivo.log
Click al icono (pergamino)
Elegir localizacin del archivo
Elegir el archivo
Click a la opcin de append to
existing file
Para cerrar click en el icono y en
close log file
USO
Estos comando se utilizan para abrir una
base de datos. Es importante mencionar que
STATA solo puede ejecutar bases con
extensin dta. Para transformar las bases se
utiliza un paquete anexo denominado STATA
TRANSFER.
Esta opcin hace uso del menu propuesto
por el programa
USO
Para abrir archivo log que permite grabar
automticamente toda la informacin de
comandos y resultados generados en el
anlisis de la base de datos. Puede ser ledo
en el procesador de texto word.
de
desc
d
codebook
USO
Se utiliza para ver la hoja con los datos (tabla)
Para edicin de la base de datos
Para listar observaciones y las variables de cada
individuo
Para etiquetar variables
Para cambiar la codificacin de la variable
Para asignar los valor etiquetados a las variables
Para genera una nueva variable idntica a partir
de una existente en la base de datos. En este caso
se ejemplifica la generacin de una variable
idntica a la edad
Para recodificar los valores o categoras de una
variable. En este caso se ejemplifica la
recategorizacin de variable edad2 generada.
save, replace
clear
PASO
1
2
using a:/nombre de la
base principal.dta
sort folio
save as a:/nombre de la
base de datos hija.dta
using a:/nombre de la
base.dta
5
6
Sort folio
7
8
save, replace
10
11
describe
drop _merge
USO
Para abrir una base genrica localizada en A
Organizar esta base de datos de acuerdo con el
nmero de folio
Seleccin de las variables que se desean conservar
Guardar archivo de las variable seleccionadas en el
punto anterior
Para abrir la base a la cual deseamos pegar las
variables seleccionadas archivo: nombre de la base
de datos hija.dta
Organizar esta base de datos con base en la variable
folio. La variable folio debe ser igual en todos los
archivos
Para unir las variables al archivo en uso. La unin se
evidencia por la creacin automtica de la variable
_merge
Para verificar la unin. Debe observarse una sola
categora (3) con el total de las observaciones
Para guardar los cambios hechos en la base de datos
nombre de la base principal.dta
Para revisar que la nuevas variables fueron incluidas
Para borrar la variable creada _merge, dejando la
posibilidad de nueva uniones
CREACIN DE UN ARCHIVO DO
Es un archivo que construye incluye la relacin de todos los comandos necesarios para
abrir, ejecutar y analizar una base de datos. Es una rutina de comandos.
2. ANALISIS DE BASES DE DATOS
Ej.
summarize
summ
sum
summ edad peso talla
USO
Para estimar de una o ms variables
continuas numero de observaciones, media,
desviacin estndar y rango. En el ejemplo
se describirn las variables edad, peso y talla
summarize
summ
sum
adicionando var, detail
Ej. summ edad,de
tabulate
tab
Ej. tab raza
tabulate1
tab1
Ej. tab1 raza nivelsoc genero
lv
graph var
Graph var, box
graph var, norm
qnorm var
Sktest var
swilk var
ladder var
COMANDO
USO
RELACIN VARIABLE CONTINUA VS. DICOTMICA
sdtest var, by(var)
Se utiliza para comparar las varianzas una
Ej. sdtest edad, by(genero)
variable continua con una dicotmica. Ho: las
varianzas son iguales
ttest var, by(var)
Si las varianzas son iguales. Compara las
medias una variable continua con una
dicotmica. Ho: las medias de las categricas
son iguales.
ttest var, by(var) unequal
Si las varianzas no son iguales. Compara las
medias una variable continua con una
dicotmica. Ho: las medias de las categricas
son iguales.
tab var, summ (var)
Muestra una tabla de contingencia que
Ej. tab genero, summ (edad)
relaciona una variable dicotmica con una
continua
USO
Para generar variables indicadoras de una
variable de ms de dos categoras
ANLISIS MULTIVARIADO
COMANDO
pwcorr vardep varindep1 varindep2..
varindepp, sig
pcorr vardep varindep1 varindep2..
varindepp
Opciones: regress/reg
reg vardep varindep1 varindep2
varindep3..........varindepp
logit vardep varindep1 varindep2.
varindepp
USO
Correlacin de Pearsn. Esta correlacin
ajusta por el numero de regresores. Solo se
usa para variables continuas
Correlacin parcial. Sin ponderacin por
otras variables. Solo se usa para variables
continuas
Comando para regresin lineal mltiple para
anlisis multivariado con una variable
dependiente
continua
y
n
variables
independientes de cualquier tipo
Comando para regresin logstica mltiple
con una variable dependiente dicotmica y
n variables independientes de cualquier
tipo. Los resultados estimados estn en
escala logartmica, lo que permite estimar
probabilidades y proporciones ajustadas en
estudios de cohorte y transversales
respectivamente
Comando para regresin logstica mltiple
con una variable dependiente dicotmica y
n variables independientes de cualquier
tipo. Los resultados estimados estn en
escala real (razones de momios en estudios
de casos y controles y razones de momios
de prevalencia en estudios transversales).
Comando para usar el modelo lineal
generalizado
para
una
variable
con
distribucin poisson medida como conteo
(regresin
poisson)
y
n
variables
independientes de cualquier tipo
Comando para regresin poisson mltiple
para anlisis multivariado con una variable
dependiente de conteo y n variables
independientes de cualquier tipo. Los
resultados estn en escala logartmica
Comando para regresin poisson mltiple
para anlisis multivariado con una variable
dependiente de conteo y n variables
independientes de cualquier tipo. Los
resultados estn en escala real (riesgos
relativos)
Nota: la variable exposure se utiliza para
ajustar, cuando los denominadores no son
iguales
sw
Ej. sw logit vardep varindep1
varindep2.... varindepp, pr(0.2)
Forward = pe
Backward = pr
mayores de 2sqrt(p/n)
Permite listar los valores predichos mayores
de 2sqrt(p/n)
Nota: luego de omitir los puntos influyentes
debe correrse nuevamente el modelo.
ANLISIS DE MULTICOLINEALIDAD
Una vez corrido el modelo propuesto se
calcula el factor de inflacin de la varianza.
Valores mayores de 10 indican
multicolinealidad
vif
REGRESIN POISSON
COMANDO
USO
PRUEBAS DE BONDAD DE AJUSTE
poisgof
Una vez corrido el modelo propuesto y
posteriormente el modelo nulo se realiza esta
prueba de bondad de ajuste que compara
estos modelos. Ho: el modelo propuesto
ajusta los datos (los regresores incluidos
explican a Y).
Lrtest, s(0)
Una vez corrido el modelo propuesto se
escribe el comando lrtest, s(0), luego se
corre el modelo nulo y el comando lrtest.
Esta prueba de bondad de ajuste compara los
dos modelos, bajo la Ho: los dos modelos
explican igualmente el comportamiento de Y
ANLISIS DE RESIDUOS
glmpred nombre de la variable de los
Permite generar los residuos de devianza
residuos, dev
sum nombre de la variable de los
Permite la observacin de las caractersticas
residuos
de los residuos de devianza
qnorm nombre de la variable de los
Permite determinar la distribucin de los
residuos
residuos de devianza
swilk var
Prueba de Shapiro Wilk para probar
normalidad de los residuos de devianza (Ho:
los residuos de devianza tiene distribucin
normal)
REGRESIN LOGISTICA
COMANDO
USO
PRUEBAS DE BONDAD DE AJUSTE
lfit
Una vez corrido el modelo propuesto se
utiliza esta prueba para verificar si el modelo
ajusta los datos. Ho: el modelo ajusta los
datos
lfit, group(10)
Modificacin propuesta por Hosmer y
Lemeshow.
Ua vez corrido el modelo propuesto se utiliza
esta prueba para verificar si el modelo ajusta
los datos. Ho: el modelo ajusta los datos
lstat
Permite evaluar sensibilidad y especificidad
USO
Prepara a STATA para el anlisis de
supervivencia. Se le indica la variable tiempo
y censura
Permite la observacin de la variable censura
Permite la observacin de los valores
mximos y mnimos de la variable tiempo.
Incluye fallas y censuras
La descripcin se hace mediante la
construccin de tablas de vida. Los
principales parmetros son:
Time: tiempo de supervivencia
Begtotal= individuos vivos justo antes de
este tiempo.
fail=Numero de fallas
fail/beg total= probabilidad estimada de
supervivencia en el tiempo
9
. sts graph
. sts graph, by(etapa)
. sts test etapa,logrank
10
Comandos y su descripcin:
11
Se genera una nueva variable que puede ser independiente o bien ser origen de otra.
graph DFvar1 DFvar2, box yline
Permite realizar un grfico de caja condicionado con la finalidad de visualizar puntos
influyentes.
graph res pred
Se grafican los residuos estandarizados
graph res pred, yline twoway onaway box border
Se grafican los residuos estandarizados, con una lnea paralela al eje de las xs
perpendicular al eje de las (y), incluyendo adems, a un box plot paralelo a ambos ejes,
mostrando valores aberrantes.
graph res pred, yline(0)
Esta grafica permite ver los residuos estandarizados, con una lnea paralela al eje de
las X perpendicular al eje de las Y.
graph var
Permite realizar de forma sencilla, un histograma de una variable(X, Y).
graph var var
Permite realizar un grfico de correlacin entre dos variables visualizando la tendencia
graph var var, connect(l)
Se realiza un grfico de correlacin entre dos variables con una lnea que permite unir
todas las observaciones.
graph var, box
Diagrama o grfico de caja.
graph var, box by
Diagrama o grfico de caja condicionado por valores de cualquier otra variable
graph var, box by(var) yline
Presenta una lnea paralela al eje de las (X) y compatible en valores con eje de las (Y)
en diagrama de caja que compara dos variables.
graph var, his
Se realiza un histograma sencillo de la variable solicitada.
graph var, his norm
Permite realizar un histograma con lnea de distribucin visible.
graph var, his norm noaxis
Permite realizar un diagrama de frecuencias con lnea de distribucin visible.
graph var, his ylabel xlabel
Etiqueta un diagrama de frecuencias(histograma) en sus ejes de manera automtica.
Keep
Retiene en la base de datos, solo las variables que se deseen, eliminando
automticamente todas aquellas variables que no se escribieron posterior al comando.
keep if
Retiene los valores de una variable (X) de forma condicionada.
ksm var var
Permite realiza una diagrama de correlacin entre dos variables continuas, presentando
una lnea suavizada que se emplea para hacer un promedio de los valores de ambas
variables, pudiendo observarse una tendencia.
label data
Etiqueta la base de datos completa con el nombre que el investigador asigne.
label define
Este comando permite etiquetar categoras de exposicin o grupos previamente recodificados.
label values
A travs de este comando es posible observar como fueron nombradas las categoras
de exposicin y sus valores despus de haberse etiquetado.
label var
Etiqueta variables.
ladder
12
Permite visualizar los diferentes tipos de transformaciones de una variable para as,
poder elegir la mejor transformacin.
lfit
A travs de este comando se permite evaluar la prueba de Hosmer Lemeshow y ver si
los datos se ajustan al modelo.
lincom var-var
Realiza un prueba de asociacin (OR, p, IC) entre las diferentes categoras de una
variable evaluando su igualdad y de esta forma se agrupen con la condicin de haber
corrido previamente un modelo de regresin.
List
Permite explorar a la variable.
list folio if abs (DFvar1)>2/sqrt(n)
Enlista los folios con puntos influyentes de una variable DF en particular.
list folio if cook>1
Indica folios de valores influyentes.
list folio if dfits>2*sqrt(p/n)
Muestra a los folios con valores influyentes.
list folio if resid>1.96
Muestra folios que contienen los residuos condicionados a >1.96.
list if
Condiciona la observacin a un valor especfico.
list if abs(dfits)>2*sqrt(p/n
Lista puntos influyentes en los valores predichos.
list if abs(DFvar1)>2/sqrt(n)
Lista puntos influyentes de la primera variable DF mostrando los datos de todas las
variables de la base, incluyendo las nuevas variables que recin fueron generadas.
list if abs(resid)>1.96
Lista los residuos mayores a 1.96.
list var-var if
Lista las variables desde una inicial hasta una final (condicional).
log of
Deshabilitar el log.
log on
Habilita el log.
logistic var var
Realiza un modelo de regresin logstica bivariado as como multivariado.
lpredict dbet, dbeta
Sirve para generar residuos generando las distancias de diferentes variables
independientes incluidas en el modelo.
lpredict res, rstandard
Muestra los residuos estandarizados.
lpredict stand
Genera los residuos estandarizados.
lroc
Diagnstico del modelo atravs de la interpretacin del rea bajo la curva condicionado
por puntos de corte en su sensibilidad as como de su especificidad.
lstat
Hace diagnstico del modelo a travs de una prueba de tamiz.
lv var
Grfico de letras, mostrando valores aberrantes.
merge
Permite reunir dos bases de datos que tienen al menos una variable en comn.
predict cook, cooksd
Puntos influyentes en beta por la distancia de cook.
predict r_stu, rstu
13
14
15