Professional Documents
Culture Documents
resueltos
Correlacin Fi Correlacin de Spearman Correlacin de Pearson
Estadstica Estadstica
Aplicada a las Ciencias Sociales Aplicada a las Ciencias Sociales
I: Estadstica Descriptiva
-3-
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
Palabras iniciales
Estimados usuari@s: Este material que pongo a su disposicin est creado a partir de casos e investigaciones reales de distintos mbitos de las Ciencias Sociales. Los datos han sido cambiados para ajustarlos a situaciones didcticas ms claras para los estudiantes. Por ello, la informacin y conclusiones no son necesariamente vlidas en otros contextos. Este volumen est dirigido a tratar el tema del clculo e interpretacin de los coeficientes de correlacin ms frecuentes de encontrar en Ciencias Sociales. A saber: Coeficiente de correlacin , apropiado para anlisis de correlacin de variables dicotmicas, el coeficiente de correlacin de rangos de Spearman, para casos de variables ordinales y el coeficiente de correlacin lineal de Pearson para variables numricas. . El lector deber manejar los conceptos y procedimientos elementales de Estadstica y exhibir competencia en el uso de la calculadora cientfica de dos variables para calcular el coeficiente de correlacin. El uso de este material con fines comerciales no est permitido.
Atentamente;
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
r(W, X ) O,756;
r(W, Y ) -O,673;
r(W, Z ) -O,597;
r( X, Y ) 0,107
Sobre la base de estos resultados: 1.1. Cul es el coeficiente de correlacin ms adecuado para calcular r(Y, Z)? 1.2. Qu relacin es posible afirmar entre el embarazo adolescente y el hecho de haber completado o la educacin bsica? 1.3. Qu conclusin puede construirse a partir de la correlacin entre X e Y? 1.4. Qu conclusin se puede construir a partir de la correlacin entre W y X? 1.5. Cul sera el perfil de las adolescentes en riesgo de embarazo adolescente?
Solucin: 1.1. Cul es el coeficiente de correlacin ms adecuado para calcular r(Y, Z)? La variable Y est medida a escala dicotmica, mientras que Z es ordinal. Por lo tanto el coeficiente ms adecuado es el de Spearman. 1.2. Qu relacin es posible afirmar entre el embarazo adolescente y el hecho de haber completado o la educacin bsica? Observando la correlacin entre W e Y, es posible afirmar la existencia de una asociacin de mediana a alta, de tipo negativa, entre el embarazo adolescente y la educacin, de modo que el embarazo est asociado en forma muy clara a las nias que no han completado la educacin bsica. 1.3. Qu conclusin puede construirse a partir de la correlacin entre X e Y? La correlacin entre X e Y es muy baja, tal que puede ser despreciable. De este modo, el hecho de completar o no la educacin bsica es independiente de la edad de la persona. 1.4. Qu conclusin se puede construir a partir de la correlacin entre W y X?
r(W, X ) O,756 es una correlacin alta, estrecha y positiva. De acuerdo a la escala utilizada, el embarazo adolescente est muy asociado a nias menores de 18 aos.
1.5. Cul sera el perfil de las adolescentes en riesgo de embarazo adolescente? Sobre la base de las correlaciones calculadas, las nias que podran ser protagonistas de embarazo adolescente, se caracterizan por tener menos de 18 aos, educacin bsica incompleta y situacin econmica de pobreza o extrema pobreza.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
Solucin: Primero se ordenan los datos en una tabla de contingencia de 2x2, ya que ambas variables estn dadas a nivel dicotmico.
IVE anterior Nacionalidad Espaola S No Total 18 30 48 Extranjera 21 9 30 39 39 78 Total
18 9 21 30 39394830
= -0,316
Se trata de una correlacin baja, del tipo negativo, que asocia la IVE anterior con las extranjeras. La asociacin es baja pero podra llegar a ser significativa, ya que est mostrando una tendencia. Conclusin: La realizacin de una IVE por parte de una mujer, habindose realizado una anterior, est asociada en forma baja, pero definida, a la nacionalidad extranjera.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
Solucin: Sexo y estado de salud mental: correlacin de mediana a alta, indicando una estrecha asociacin lineal entre sexo y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados al sexo masculino. En conclusin, el perder el empleo afecta la salud mental preferentemente a los hombres. Estado civil y estado de salud mental: correlacin alta y negativa, indicando una estrecha asociacin lineal entre estado civil y estado de salud mental, de modo que los malos estados de salud mental aparecen asociados a los casados. En conclusin, el perder el empleo afecta la salud mental ms a los casados que a los solteros.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
18 15 12 09 06 03 00 Bueno Malo
ESTADO
4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. De las personas con Sobrepeso, 5 de cada . . . . . presentan Mal estado general de salud. 4.1.2. De los que tienen un Buen estado general de salud, el . . . . . . % tiene un peso Normal. 4.1.3. De las personas de peso Normal, solo el . . . . . .% presenta Mal estado general de salud. 4.2. Analice la correlacin entre estado general de salud y peso. Construya una conclusin.
Solucin: 4.1. Indique el % en lo que se afirma acerca de la muestra: 4.1.1. Las personas con sobrepeso son: 12 + 15 = 27. De estas, 15 presentan Mal estado general de salud. De 27 personas con sobrepeso De x personas con sobrepeso Calculando x = 9. De las personas con Sobrepeso, 5 de cada 9 presentan Mal estado general de salud.
15 presentan Mal estado general de salud. 5 presentan Mal estado general de salud.
4.1.2. Tienen un Buen estado general de salud = 30 Tiene un Buen estado general de salud y peso Normal = 18 Llevando a %:
18 100 = 60,0%. 30
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
De los que tienen un Buen estado general de salud, el 60,0% tiene un peso Normal. 4.1.3. Tienen un peso Normal = 18 + 6 = 24 Presentan Mal estado general de salud = 6. Llevando a %:
6 100 = 25,0%. 24
De las personas de peso Normal, slo un 25% presenta Mal estado general de salud.
4.2. Analice la correlacin entre estado general de salud y peso. Construya una conclusin. Reorganizando los datos en una tabla de 2x2 segn anlisis solicitado:
Estado General de Salud Bueno Malo 18 6 12 15 30 21
TOTAL 24 27 51
18 15 12 6 24 27 30 21
= 0,310
Anlisis: La correlacin entre peso y estado general de salud es positiva, baja, pero perceptible. Conclusin: El mal estado general de salud est asociado en forma baja, pero definida, al sobrepeso.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, qu % fuma? 5.1.2. De los que presentan problemas vasculares, qu % NO fuma? 5.1.3. De las mujeres, qu % presenta problemas vasculares? 5.1.4. De los hombres que presentan problemas vasculares, qu % fuma? 5.1.5. De la muestra, qu % son hombres que fuman y presenta problemas vasculares? 5.2. Realice un anlisis de correlacin entre tabaquismo y sexo y construya las conclusiones correspondientes. 5.3. Realice un anlisis de correlacin entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. 5.4. Realice un anlisis de correlacin entre sexo y problemas vasculares y construya las conclusiones correspondientes.
Solucin: 5.1. Sobre la base de los datos dados, calcule, en esta muestra: 5.1.1. De los hombres, qu % fuma? Total de hombres = 293 Total hombres que fuman = 125 Llevando a %:
5.1.2. De los que presentan problemas vasculares, qu % NO fuma? Presentan problemas vasculares = 71 Presentan problemas vasculares y no fuman = 17 Llevando a %:
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
5.1.3. De las mujeres, qu % presenta problemas vasculares? Nmero de mujeres = 240 Mujeres con problemas vasculares = 32 Llevando a %:
5.1.4. De los hombres que presentan problemas vasculares, qu % fuma? Hombres con problemas vasculares = 39 Hombres con problemas vasculares y fuman = 22 Llevando a %:
22 100 56,4% 39 El 56,4% de los hombres que presentan problemas vasculares, fuma. P
5.1.5. De la muestra, qu % son hombres que fuman y presenta problemas vasculares? Total muestra = 533 Hombres que fuman y presentan problemas vasculares = 17 Llevando a %:
5.2. Realice un anlisis de correlacin entre tabaquismo y sexo y construya las conclusiones correspondientes. Reorganizando los datos en una tabla, se tiene:
SEXO Hombres 125 168 293 Mujeres 104 136 240
= -0,0067
Anlisis: Correlacin prcticamente nula entre sexo y tabaquismo. Conclusin: En la muestra estudiada, el tabaquismo no est asociado al sexo. Hombre y mujeres fuman por igual.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
10
5.3. Realice un anlisis de correlacin entre tabaquismo y problemas vasculares y construya las conclusiones correspondientes. Reorganizacin de datos en una tabla de 2x2 segn anlisis solicitado.
PROBLEMAS VASCULARES Con problemas Sin problemas 45 184 26 278 71 462
= 0,162
Anlisis: Correlacin positiva, pero baja, despreciable. No se puede afirma la existencia de asociacin entre la presencia de problemas vasculares y el hecho de fumar. Conclusin: No se puede afirma la existencia de asociacin entre la presencia de problemas vasculares y el hecho de fumar.
5.4. Realice un anlisis de correlacin entre sexo y problemas vasculares y construya las conclusiones correspondientes. Reordenamiento de datos en una tabla de 2x2 segn anlisis solicitado.
PROBLEMAS VASCULARES Con problemas Sin problemas 39 254 32 208 71 462
= -0,00033
Anlisis: La correlacin entre sexo y problemas vasculares es prcticamente nula. Conclusin: No existe asociacin entre problemas vasculares y sexo, de modo que hombres y mujeres se ven igualmente afectados.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
11
Indique qu coeficiente de correlacin recomendara para el anlisis de correlacin entre las variables que se indican. Fundamente cada propuesta. 6.1. X1 con X 3 6.4. X 3 con X 5 6.2. X1 con X 4 6.5. X1 con X 2 6.3. X 2 con X 5
Solucin: 6.1. X1 est medida a escala binomial y X 3 a escala ordinal. Es recomendable calcular el coeficiente de correlacin de rangos, ms conocido como coeficiente de Spearman. En este caso la variable dicotmica es tratada como ordinal. 6.2. Tanto X1 como X 4 estn medidas a escala binomial. Es recomendable el coeficiente , ideal para la correlacin de variables categricas dicotmicas. 6.3. Las variables X 2 y X 5 son numricas. Es posible calcular el coeficiente de correlacin de Pearson. 6.4. La variable X 3 es ordinal, mientras de X 5 es numrica. En este caso es recomendable el coeficiente de correlacin de Spearman. La variable numrica debera reducirse a ordinal, convirtiendo sus valores a rangos.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
12
7.1. Seleccione el coeficiente de correlacin ms apropiado para realizar un anlisis de correlacin en el marco del caso. Fundamente su propuesta. 7.2. Calcule el coeficiente de correlacin de acuerdo al punto anterior. 7.3. Sobre la base de los resultados numricos, analice y construya la conclusin.
Solucin: 7.1. Seleccione el coeficiente de correlacin ms apropiado para realizar un anlisis de correlacin en el marco del caso. Fundamente su propuesta. Considerando que la variable Tiempo es numrica y que el Puntaje en la prueba es ordinal (mientras no se trate de un test estandarizado), es conveniente utilizar el coeficiente de correlacin de Spearman. 7.2. Calcule el coeficiente de correlacin de acuerdo al punto anterior. Para los efectos de clculo, se convertirn ambas variables a rangos, asignado el rango 1 al valor ms bajo, y as en forma creciente.
X = Tiempo de TV (hrs) 9 16 20 7 10 25 5 18 Y = Competencia lectora (pts) 15 11 8 18 14 7 12 10 Rg(X) 3 5 7 2 4 8 1 6 Rg(Y) 7 4 2 8 6 1 5 3
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
13
Ya calculados los rangos de cada variable, se puede proceder de dos maneras: una es calcular directamente con la calculadora el coeficiente de correlacin de Pearson de estos rangos, y dos, completar la tabla con las diferencias de los rangos y sus cuadrados. En el primer caso el coeficiente da rS = -0,857142857
Como no hay empates en los valores de la variable, para el clculo de rS se puede emplear la frmula simplificada:
rS 1 6 156 8 (8 1)
2
= 1
rS = -0,857142857 se trata de una correlacin alta y negativa. En conclusin, la competencia lectora est alta e inversamente asociada al tiempo que los estudiantes pasan mirando televisin, de modo a que a mayor tiempo de TV, menor es su competencia lectora.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
14
E = edad de la mujer al momento del embarazo M = meses de embarazo al momento del aborto Se desea establecer la correlacin entre las variables y construir una conclusin. 8.1. Fundamente el tipo de coeficiente a utilizar. 8.2. Calcule el coeficiente indicado para los propsitos deseados. 8.3. Realice un anlisis de los resultados y concluya.
Solucin: 8.1. Fundamente el tipo de coeficiente a utilizar. Ambas variables son numricas, por lo tanto es utilizable el coeficiente de correlacin de Pearson. 8.2. Calcule el coeficiente indicado para los propsitos deseados. Ingresando los valores a la calculadora, el resultado directo es: r = 0,557945788 8.3. Realice un anlisis de los resultados y concluya. Esta es una correlacin positiva, mediana, que indica que a mayor edad de la mujer, ms meses de embarazo al momento del aborto provocado. Conclusin: las mujeres de mayor edad tienden a provocarse abortos con ms meses de embarazo, las ms jvenes, con menos tiempo de embarazo.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
15
Realice un anlisis de correlacin entre las variables que se identifican y construya las conclusiones del caso: 9.1. X2 con X4 9.2. Poblacin urbana y esperanza de vida. 9.3. Ingreso per cpita y Poblacin urbana.
Solucin: 9.1. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X4)=-0,81460685. Correlacin alta y negativa. A mayor analfabetismo, menor esperanza de vida. Entonces: La poblacin de pases americanos con mayor analfabetismo tiene menor esperanza de vida. La poblacin de pases americanos con menor analfabetismo tiene mayor esperanza de vida.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
16
9.2. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X2, X5)= 0,60135272 Correlacin moderada y directa. A mayor poblacin urbana, mayor esperanza de vida. Entonces: En los pases americanos, a mayor % de poblacin urbana, mayor es la esperanza de vida de la poblacin. En los pases americanos, a menor % de poblacin urbana, menor es la esperanza de vida de la poblacin.
9.3. Se calcula el coeficiente de correlacin de Pearson. Ingresando los valores a la calculadora, resulta: r(X3, X5)= 0,15114664 Correlacin baja, casi nula, despreciable. Entonces: El ingreso per cpita no est asociado a la poblacin urbana. En los pases americanos, su ingreso per cpita es independiente del % poblacin urbana.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
17
Solucin: Por tratarse de una variable numrica y otra ordinal, se debe calcular el coeficiente de correlacin de rangos de Spearman. Se realiza una transformacin de los valores de las variables a rangos. Se comenzar asignado el valor 1 para el rango de menor categora, es decir, Muy malo = 1. Se recordar que para asignar los rangos, en casos de empates o repeticiones, se asigna a cada uno un rango igual al promedio entre los rangos. Por ejemplo, a los valores Malo, le corresponde rango 2 y 3, Por tratarse de una repeticin tomarn cada uno el rango promedio 2,5. As, se construye la siguiente tabla:
Obs 1 2 3 4 5 6 7 8 9 10 11 12 X = Evaluacin Muy bueno Bueno Bueno Ms que suficiente Ms que suficiente Suficiente Suficiente Suficiente Menos que suficiente Malo Malo Muy malo Y = Edad (aos) 21 35 20 22 44 45 37 32 29 62 55 58 Rg(X) 12 10,5 10,5 8,5 8,5 6 6 6 4 2,5 2,5 1 Rg(Y) 2 6 1 3 8 9 7 5 4 12 10 11
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
18
Con los rangos de X y de Y, es ms breve el clculo del coeficiente de correlacin de Pearson de los rangos. Usando calculadora esto da: rS -0,76466
Alta correlacin negativa. A mayor edad, peor es la evaluacin del servicio del Transantiago. Es decir, los jvenes dan una mejor evaluacin del servicio del Transantiago que los de mayor edad.
Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Estadstica Descriptiva: Clculos y anlisis de correlacin Patricio Alcano Martnez Derechos Reservados
19
Solucin: 11.1. rS (W, X) = 0,832. Valores altos de W, es decir 3 = bajo, est asociado a los valores bajos de X, es decir 1 = baja. Entonces: La alta tasa de homicidios est estrechamente asociada a altos ndices de pobreza. La baja tasa de homicidios est estrechamente asociada bajos ndices de pobreza. 11.2. rS (W, Y) = 0,586. Valores altos de W, es decir 3 = bajo, est asociado a los valores bajos de Y, es decir 1 = bajo. Entonces: El alto ndice de robos est asociado medianamente a altos ndices de pobreza. Los bajos ndices de robos estn asociados medianamente a bajos ndices de pobreza. 11.3. rS (W, Z) = 0,109. Correlacin muy baja, despreciable. Entonces: Los ataques sexuales no estn asociados a los ndices de pobreza. Los ndices de ataques sexuales son independientes de los ndices de pobreza. 11.4. rS (X, Y) = 0,683. Valores altos de X, es decir 5 = alto, estn asociado a los valores altos de Y, es decir 3 = alto. Entonces: Los altos ndices de homicidios aparecen asociados a altos ndices de robos. Los altos ndices de robos estn asociados a altos ndices de homicidios.