You are on page 1of 14

Universidad de Puerto Rico

Recinto de Ro Piedras
Facultad de Ciencias Naturales
Departamento de Matemticas

Descripcin y anlisis de las variables recolectadas de la Unidad de Investigacin


sobre el Shock de la Universidad del Sur de California en Los ngeles, California

Larry M. Alejandro Vargas


801-15-0168
Paola M. Iglesias Feliciano
801-15-3696
MATE-3026-001
Prof. Ronald Sosa

I. Resumen
Este trabajo recoge datos de 113 pacientes crticamente enfermos de la unidad de
investigacin sobre el shock (Shock Research Unit) de la Universidad del Sur de
California en los Angeles, California. Cada record tiene 21 variables que van desde la
identificacin de las personas hasta sus condiciones mdicas. El objetivo principal es
definir y describir cada variable estadsticamente.

Para luego analizar las posibles

relaciones entre las diferentes variables utilizando el coeficiente de correlacin lineal, r, el


coeficiente de determinacin, R2 y la recta de regresin lineal, y = a + bx; entre otros
tipos de mtodos. Con estos mtodos estadsticos se puede relacionar las diferentes
variables explicativas y respuestas en diferentes modelos. Durante el anlisis se encontr
como unas variables tiene una fuerte relacin entre si y otras no tienen relacin. Entre las
que se relacionan se encontr: hemoglobina y hematocrito; presin arterial sistlica y
presin arterial media; y tiempo de aparicin de un colorante desde el lugar de inyeccin
hasta el lugar de muestreo y tiempo que tarda la sangre en recorrer un circuito
determinado.
II. Introduccin
La descripcin y el anlisis realizado de este trabajo se bas en un estudio
realizado por la Universidad del Sur de California que analiz las observaciones de
variables fisiolgicas recolectadas de 113 pacientes crticamente enfermos. Para hacer
esto se emple el conocimiento de distintos conceptos estadsticos. Uno de ellos fue el de
las variables cuantitativas y cualitativas. Las variables cuantitativas son aquellas que
toman valores numricos que representan diferentes magnitudes de las variables mientras
que las variables cualitativas consiste en observaciones que pertenecen a un conjunto
categrico (Agresti y Franklin, 2013).
Estas variables se miden en diferentes escalas. Las variables cualitativas se miden
en escala nominal u ordinal. La escala nominal consiste de cero ordenamiento ya que el
nico propsito es clasificar y nombrar los datos. Sin embargo en la escala ordinal s hay
orden y se sugiere un rango en las categoras de forma que una categora es ms
importante o mayor que otra. Las variables cuantitativas se miden en escala intervalar o
de razn. La escala intervalar se utiliza con datos numricos y cada sujeto recibe un

valor numrico. Por otra parte, la escala de razn se utiliza para indicar posiciones
relativas de los objetos.
Para poder describir las variables cualitativas se puede utilizar las grficas de
barras. Las grficas de barra permiten observar la cantidad de datos que pertenecen a
cada una de las categoras como un rea rectangular de tamao proporcional (Jonhson y
Kuby, 2008). Otro tipo de grafica que se puede utilizar para describir e interpretar
variables cualitativas es la grfica circular o diagrama de pastel. Esta grafica muestra la
cantidad de datos que pertenecen a cada una de las categoras como parte proporcional de
un circul (Johnson y Kuby, 2008).
En el caso de las variables cuantitativas se pueden utilizar las grficas de punto y
dispersin. Las grficas de punto presenta los datos de una muestra al representar cada
dato con un punto ubicado a lo largo de una escala que puede ser horizontal o vertical y la
frecuencia de los valores se presenta a lo largo de la otra escala (Brase y Brase, 2013).
De las grficas de punto tambin se pueden obtener la media y la mediana de los datos
observados. . La media es el promedio con el que probablemente el lector este mas
familiarizado y se encuentra al sumar todos los valores de la variable x y dividir la
suma entre el nmero de estos valores, n, mientras que la mediana es el valor de los
datos que ocupa la posicin media cuando los datos estn clasificados en orden de
acuerdo a su tamao (Johnson y Kuby, 2008). La media y la mediana nos permiten llegar
a conclusiones cruciales en varios estudios observacionales como experimentales. La
representacin grfica ms til para describir la asociacin de dos variables cuantitativas
es el diagrama de dispersin o nube de puntos, donde cada caso aparece representado
como un punto en el plano definido por el par ordenado (x,y). La variable x es la variable
independiente o explicativa y la variable y es la dependiente o respuesta.
Despus de ver qu tipo de relacin tienen las variables en el plano se utiliza un
anlisis de correlacin lineal para medir la fuerza de la relacin lineal entre dos variables.
La precisin del cambio en y cuando x aumenta determina el valor del coeficiente de
correlacin lineal, r. El coeficiente de correlacin lineal siempre tiene un valor entre -1 y
1. Donde positivo uno es una correlacin positiva fuerte y -1 es una relacin inversa
fuerte. Mientras ms cerca de 0 se encuentra r esto indica que las variables no estn
relacionadas.

Luego de buscar el valor del coeficiente de correlacin lineal, r, se procede a


realizar un anlisis de regresin lineal para encontrar la ecuacin que mejor describe la
relacin entre los dos variables. Esta ecuacin sirve para hacer predicciones sobre las
variables de la poblacin. El mtodo a utilizar para encontrar la recta de regresin lineal
se conoce como el mtodo de los mnimos cuadrados.
a es el intercepto en y , b es la pendiente
Por ltimo se calcula R2 que es un criterio de valoracin de la capacidad
de explicacin de los modelos de regresin, y representa el porcentaje de la varianza
justificado por la variable independiente. Se puede interpretar como el cuadrado del
coeficiente de correlacin lineal entre las variables dependiente e independiente, o
tambin como el cuadrado del coeficiente de correlacin entre los valores reales de una
variable y sus estimaciones. Si todas las observaciones estn en la lnea de regresin, el
valor de R2 es 1, y si no hay relacin lineal entre las variables dependiente e
independiente, el valor de R2 es 0. El coeficiente R2 es una medida de la relacin lineal
entre dos variables. A medida que su valor es mayor, el ajuste de la recta a los datos es
mejor, puesto que la variacin explicada es mayor; as, el desajuste provocado por la
sustitucin de los valores observados por los predichos es menor.
III. Metodologa empleada
La descripcin y el anlisis realizado en este trabajo se bas en un estudio
realizado por la Universidad del Sur de California que analiz las observaciones de
variables fisiolgicas recolectadas de 113 pacientes crticamente enfermos.

La

metodologa empleada para realizar dicho anlisis consisti en el uso del programa
estadstico R como medio para emplear el conocimiento estadsticos adquirido sobre:
variables cuantitativas y cualitativas; los distintos grficos para representar los distintos
tipos de variables; media y mediana; y la correlacin.

Mediante este programa se

pudieron crear diversos tipos de grficas que permitieron analizar las variables dadas y
poder discernir si existe relacin entre las variables. Para poder describir y analizar las

variables de: identificacin, la presin arterial sistlica de los pacientes al momento de


ingresar y salir de la unidad de cuidado crtico, el tiempo de aparicin de un colorante
desde el lugar de inyeccin hasta el lugar del muestreo de los pacientes al momento de
ingresar y salir de la unidad de cuidado crtico, y el nivel de hemoglobina se utiliz el
modelo de regresin lineal. Otro tipo de grafica utilizada para describir variables fue la
grfica de puntos. Las grficas descritas por la grfica de punto fueron: las edades de los
pacientes, la altura de los pacientes y el ndice cardiaco de los pacientes. Tambin se
utiliz el diagrama de pastel o grafica circular para describir las variables de gnero y
sobrevivencia de los pacientes. Tambin se utiliz la grfica de barras para describir y
analizar el tipo de shock que sufrieron los pacientes.

Luego de representar las

variables, se procedi a analizar y formular conclusiones con respecto a las mismas.


IV. Resultados de anlisis estadstico
La primera variable analizada fue el ID o identificacin de los 113 pacientes
crticamente enfermos. Al analizar dicha variable se pudo concluir que la misma no tiene
un uso pertinente a la investigacin ya que solo identifica a la persona que est siendo
tratada.

Esta variable es una categrica nominal.

Por esta razn al comparar esta

variable con la edad del paciente no se encontr correlacin. Esto se debe a que la
variable de identificacin es categrica mientras que la edad del paciente es una
cuantitativa. En la figura posterior se muestra una grfica de dispersin comparando las
dos variables.

Figura 1: ID vs. Edad del paciente que ingreso a la unidad de cuidado crtico

En la figura 1 se puede observar que no existe correlacin. Otro factor que nos indica
esto es el valor del coeficiente de correlacin lineal. En este caso el valor calculado fue
de 0.1636. Este valor nos indica que no existe una buena relacin entre las variables.
La segunda variable analizada fue AGE o la edad de los pacientes.

Esta

variable es una cuantitativa de razn. Para analizarla se utiliz la grfica de punto. La


figura posterior muestra la representacin de los valores de esta variable.

Figura 2: Frecuencia de edades de los pacientes

En la figura 2 se puede observar la frecuencia de las edades de los pacientes. Tambin se


puede observar que la mayora de los datos se encuentran entre 50 y 70 aos, la media
siendo 54.63 aos y la mediana 56.00 aos.
La tercera variable analizada fue HT o la altura de los pacientes. Esta variable
tambin es una cuantitativa de razn y nuevamente se utiliz la grfica de punto. La
figura posterior muestra la representacin de los valores de esta variable.

Figura 3: Frecuencia de alturas de los pacientes

En la figura 3 se puede observar la frecuencia de las edades de los pacientes. Tambin se


puede observar que la mayora de los datos se encuentran entre 160 y 170 cm, la media
siendo 164.8 cm y la mediana 165.0 cm
La cuarta y quinta variables en ser analizadas fueron: el gnero y la sobrevivencia
de los pacientes. Para poder representar estas dos variables se construy una grfica
circular o diagrama de pastel. Ambas graficas muestran la distribucin respectivas de
cada variable y nos permiten analizar la frecuencia con la cual aparecen las observaciones
de cada variable. Las grficas se muestran posteriormente.

Figura 5: Distribucin de la sobrevivencia de


los pacientes

En la figura 4 se puede observar la


distribucin del gnero de los pacientes. Claramente se puede observar una frecuencia
mayor en la cantidad de hombres en comparacin con las mujeres. Esto se puede
apreciar al mirar el ngulo del espacio proporcional al crculo designado para los
hombres en comparacin con el ngulo de las mujeres. En la figura 5 se puede observar
claramente que el ngulo superior corresponde a los pacientes que sobrevivieron en
comparacin a los pacientes que fallecieron.
La sexta variable analizada fue SHOCK_TYP o el tipo de shock que
sufrieron los pacientes. Esta variable es una cualitativa ordinal. Para esta variable se
utiliz la grfica de barra.

Las categoras consistieron de: No-shock, Bacterial,

Cardiognico, Hipovolmico, Neurolgico y Otro. En la parte posterior se muestran los


datos representados de esta variable.

Figura 6: Tipos de shock que sufrieron los pacientes

Como se puede observar en la figura 6, los tipos de shock que sufrieron los pacientes se
encuentran representados en la grfica de barra con una barra para cada categora. Esta
grfica nos permite ver la cantidad de pacientes que pertenecen a cada una de las
categoras o tipo de shock.
La sptima variable en ser analizada fue SBP o la presin arterial sistlica de
los pacientes al momento de ingresar y salir de la unidad de cuidado crtico. Esta
variable es una cuantitativa y se compar con la presin arterial media al momento de
ingreso y salida de los pacientes. Para poder determinar si existe una buena relacin
entre ambas variables cuantitativas se construyeron dos grficas de dispersin, una
representando los datos de entrada y la segunda los de salida de la unidad de cuidado
crtico. Ambas grficas se muestran posteriormente.

Figura 7: Presin arterial sistlica vs. Presin arterial media al momento del ingreso a la unidad de
cuidado crtico

Figura 8: Presin arterial sistlica vs. Presin arterial media al momento de salida de la unidad de
cuidado crtico

Al observar la figura 7 y 8 se puede apreciar que existe una correlacin entre ambas
variables. Todos los puntos caen exactamente en toda una recta como se puede ver en
ambas figuras. Tambin se puede ver que la recta tiene una pendiente positiva, por lo
tanto la variable y o la presin arterial media aumenta a medida que la variable x o la
presin arterial sistlica aumenta por cada unidad.

La octava variable en ser analizada fue el ndice cardiaco en los pacientes. Para
describir y analizar esta variable se construy una grfica de punto. Con esta grafica de
punto se pudo mostrar la frecuencia de las medidas de ndice cardiaco de los pacientes.

Figura 9: Frecuencia de ndice cardiaco en los pacientes

En la figura 9 se representa la frecuencia de ndice cardiaco en los 113 pacientes


estudiados. En esta grafica se puede observar que la mayora de los datos se encuentran
entre 2 y 4 litros/min por m2. Se obtuvo una media de 2.57 litros/min por m2 y una
mediana de 2.27 litros/min por m2. Por lo tanto el ndice cardiaco promedio entre los
113 pacientes toma un valor de 2.57 litros/min por m2.
La novena variable en ser analizada fue el tiempo de aparicin de un colorante
desde el lugar de inyeccin hasta el lugar del muestreo de los pacientes al momento de
ingresar y salir de la unidad de cuidado crtico. Esta variable es una cuantitativa de razn
y se compar con el tiempo que tarda la sangre en recorrer un circuito determinado al
momento de ingreso y salida de los pacientes. Para poder determinar si existe una buena
relacin entre ambas variables cuantitativas se construyeron dos grficas de dispersin,
una representando los datos de entrada y la segunda los de salida de la unidad de cuidado
crtico.

Figura 10: Tiempo de aparicin de un colorante vs. Tiempo que tarda la sangre en recorrer un circuito al
momento de entrada de la unidad de cuidado crtico

Figura 11: Tiempo de aparicin de un colorante vs. Tiempo que tarda la sangre en recorrer un circuito al
momento de salida de la unidad de cuidado crtico

Al observar la figura 10 y 11 se puede apreciar que existe una correlacin entre ambas
variables. Todos los puntos caen exactamente en toda una recta como se puede ver en
ambas figuras. Tambin se puede ver que la recta tiene una pendiente positiva, por lo
tanto la variable y o el tiempo que tarda la sangre en recorrer un circuito determinado
aumenta a medida que la variable x o el tiempo de aparicin de un colorante desde el
lugar de inyeccin hasta el lugar del muestreo tambin aumenta.

La dcima variable en ser analizada fue el nivel de hemoglobina de los pacientes


al momento de ingresar y salir de la unidad de cuidado crtico. Esta variable se compar
con el nivel de hematocrito al momento de ingreso y salida de los pacientes. Para poder
determinar si existe una buena relacin entre ambas variables cuantitativas se
construyeron dos grficas de dispersin, una representando los datos de entrada y la
segunda los de salida de la unidad de cuidado crtico, al igual que en otras variables
analizadas.

Figura 12: Hemoglobina vs. Hematocrito al momento del ingreso a la unidad de cuidado crtico

Figura 13: Hemoglobina vs. Hematocrito al momento de salida del ingreso a la unidad de cuidado crtico

Al observar la figura 12 y 13 se puede apreciar que existe una correlacin entre ambas
variables. Todos los puntos caen exactamente en toda una recta como se puede ver en
ambas figuras. Se puede apreciar que la recta tiene una pendiente positiva, por lo tanto la
variable y o el nivel de hematocrito en lo pacientes aumenta a medida que la variable
x o el nivel de hemoglobina aumenta.
VI. Conclusin y Sugerencias
Durante este trabajo estadstico se definieron y se correlacionaron variables de
pacientes en la entrada y salida a una sala de cuidado crtico. Las variables de inters
fueron ID, AGE, HT, SEX, SURVIVE, SHOCK_TYP, SBP, CI, AT y
HG. Donde ID, AGE, HT, SEX, SURVIVE SHOCK_TYP y CI eran los
mismos datos en la entrada y salida del centro de cuidado crtico, mientras que el resto de
las variables cambiaban. Estas variables se definieron como cuantitativas y categricas; y
se analizaron utilizando los mtodos del coeficiente de correlacin lineal y lneas de
regresin. Durante el uso de estos mtodos se encontr que las variables categricas no
tenan relacin entre s, pero las variables categricas que tenan que ver con presiones s.
Las variables categricas fueron de utilidad para ver frecuencias en el estudio, utilizando
grfica de puntos, barras y circulares. Un estudio completo de todas las variables
permitira obtener mayor informacin y un anlisis de regresin mltiple permitira
relacionar ms de una variable.

VII. Referencias Bibliogrficas


1. Alan Agresti, Christine Franklin. (2013). Statistics: The Art and Science of
Learning from Data. Boston, MA: Pearson Education, Inc.
2. Robert Johnson, Patricia Kuby. (2008). Estadstica elemental: Lo esencial. Santa
Fe, Mxico, D.F: Cengage Learning Editores.
3. Charles Brase, Corrinne Brase. (2013). Understanding Basic Statistics. Boston,
MA: Cengage Learning.

You might also like