E l investigador debe conocer los pormenores del analisis de datos para decidir la metodologia que aplicara. Los datos se pueden analizar desde dos perspectivas, dependiendo del tipo de estudio que se ha iniciado. La primera es cuantitativa y la segunda cualitativa, cada una tiene metodologia propia y procesos diferentes para la obtencion de resultados. 1. El Analisis Cuantitativo o Estadistico La estadfstica es el procedimiento que se utiliza para clasificar, calcular, analizar y resumir datos numericos obtenidos de forma sistematica. La recopilacion de datos y el procedimiento que se utilice para procesarlos depende de la forma como se haya escogido la direccion de la investigacion, para ello son relevantes las variables y la forma como estas se miden, la intencionalidad del investigador al formular la hipotesis y lo que se pretende probar con la investigacion. De modo que la metodologia es distinta para el procesamiento de una variable por intervalos, de la que se utilice para el procesamiento de una nominal. El analisis cuantitativo se debe usar cuando se requiere describir aspectos o caracteristicas de la realidad, que se presentan con regularidad, de modo que el uso de las frecuencias o repeticion de la aparicion de las caracteristicas es esencial para el diagnostico en un elemento, pero estas caracteristicas no son tipicas de ese elemento exclusivamente, sino que lo son de la poblacion misma. Un ejemplo tfpico es el estudio del comportamiento de una enfermedad en un paciente comparado con el comportamiento de la misma enfermedad, pero en varios pacientes de la misma poblacion. 1. A. Ti pos de anal i si s est adi st i co Se distinguen tres tipos de analisis estadistico, segun el numero de variables que se analicen conjuntamente: univariado, bivariado y multivariado. Anal i si s uni var i ado El analisis univariado es el analisis basico, primario. Las caracteristicas o propiedades de las personas o cosas se deben medir una por una, caracteristica por caracteristica, aisladamente. Ejemplo: Se esta en presencia de un analisis univariado, cuando se dice que una persona pesa 95 k., independientemente de cualquier otra caracteristica. Se estara, igualmente, en presencia de una en estadistica univariada, cuando se dice que el 23% de las personas es de piel blanca y que el resto (77%) es de piel morena. Las estadfsticas basicas, como la media, la mediana, la moda, la varianza y los porcentajes, entre otros, miden solo una variable. Estas fueron hechas univariadas. Este tipo de analisis ha sido muy criticado ya que la realidad se presenta Manual pcma el Cwiaa de Jletadoi dc JnuMtiqacien 88 interconectada y relacionada. Anal i si s bi var i ado Se presenta cuando se realiza el tratamiento estadistico a dos variables de manera simultanea. Hay varias formar de realizar este procedimiento. Una de ellas es contar frecuencias dobles, es decir contar dos caracteristicas a la vez en un individuo, como: sexo y estado civil. Se hace un recuento bivariado al decir que hay 80 hombres solteros. Otro procedimiento es usar la correlacion simple para el caso de variables cuantitativas. El procedimiento es bivariado para estas, debido a que computa el producto de los desvios respecto de la media para dos variables, evaluadas sobre un mismo individuo, tal como la medida y la talla. Anal i si s mul t i var i ado Este analisis consiste en determinar las relaciones existentes entre tres o mas variables a partir del analisis bivariado. Estas relaciones pueden ser de diversos tipos: descriptivas, de establecimiento de perfiles, de separacion de grupos, de segmentation, para determinar influencias eficientes entre variables y otras. En general se las clasifica en dos grandes grupos: a. Met odos expl i cat i vos: regresion lineal, analisis discriminante, regresion logistica, modelos de respuesta probit, logic y modelos log lineales entre otros b. Met odos descr i pt i vos: analisis de conglomerados, analisis factorial, analisis de componentes principales, analisis de correspondencias simples y multiples, entre otras. Este tipo de analisis ocupa hoy el corazon de la estadistica; pero, es exigente y poco amigable en comprension matematica. Sintetiza las relaciones entre las variables estudiadas que, de otro modo, se tendrian que establecer de modo univarial o bivarial, los cuales son largos y no son exactos. Su aplicacion depende de la disposition del investigador a adoptar nuevos enfoques. 1. B. Cl ases de Anal i si s Est adi st i co Hay diferentes clases de analisis estadisticos, los principales son: 1. Estadistica inferencial 2. Estadistica descriptiva 3. Pruebas parametricas 4. Pruebas NO parametricas 5. Puntuaciones Z 6. Razones y Tasas 1. Est adi st i ca i nf erenci al : Esta se utiliza cuando se pretende que el resultado de un estudio sobre una muestra pueda ser aplicado a una generalidad o a una universalidad, que no puede ser estudiada en su totalidad por sus proporciones de amplitud. Es utilizada, regularmente, por los investigadores sociales. Manual paxa el Qum(l de Metodos de Jnve^tigacion 89 Los datos recogidos sobre la muestra se denominan estadigrafos. Estos permiten aplicar la estadistica a toda una generalidad o al universo y ya aplicados se conocen como parametros. Los parametros corresponden a estadisticas inferenciales, porque no se obtuvieron de un estudio completo de la totalidad de la generalidad o del universo, pero se aplican sobre estos. La estadistica inferencial se utiliza para realizar dos procesos: estimar parametros y probar hipotesis. Ejemplo: Se quiere saber si los choferes de Costa Rica conducen regularmente bajo los efectos del licor. El investigador toma muestras de choferes de distintas areas del pais, distintos gremios, determinados dias, etc. El resultado que arroje el punto medio de todos los datos se podria tomar como un patron generalizado de los choferes de Costa Rica, dependiendo del grado de confiabilidad de las muestras, de la siguiente manera: Muestra 1000 choferes Alajuela 950 conducen bajo los efectos del licor sabado y domingo. Heredia 940 conducen bajo los efectos del licor sabado y domingo. San Jose 980 conducen bajo los efectos del licor sabado y domingo. Limon 960 conducen bajo los efectos del licor sabado y domingo. Guanacaste 930 conducen bajo los efectos del licor sabado y domingo. Cartago 920 conducen bajo los efectos del licor sabado y domingo. Puntarenas 990 conducen bajo los efectos del licor sabado y domingo. La suma de estas cantidades dividida entre el numero de muestras produce como resultado que 952,85 choferes de cada mil conducen bajo los efectos del licor y esto se puede generalizar a Costa Rica diciendo que mas del 95% de los choferes conduce bajo los efectos del licor los sabados y domingos. Esta prueba permite la generalization, debido a que el porcentaje de posibilidad es mayor a 95% (minimo probable permitido). EJERCICIO N. 18 Elabore una estadistica inferencial. Se requiere saber si los peatones respetan las senales de transito en Costa Rica. Invente los datos y las muestras. Trabaje en hojas aparte el procedimiento y anote el resultado en los renglones siguientes: Manual pcma e Cawa de Metodos de .Investigation 90 2. Est adi st i ca descr i pt i va Consiste en describir los datos mediante puntuaciones o categorias y la frecuencia en la que ocurre un evento determinado e importante para la investigacion. Este tipo de estadistica permite obtener porcentajes con respecto a la frecuencia con la que ocurre el evento o una serie de estos que pueden ser positivos, negativos u omisos. Ejemplo: Se requiere saber el porcentaje de Instituciones del estado que cumplen con el pago de cuotas a la C C S.S. El evento es el pago y las puntuaciones serian las cantldades de instituciones que cumplen, las que no cumplen y las que no dieron informacion. El total de cantidades constituyen el 100% de los datos recogidos y la relacion de la cantidad de las que si cumplen con respecto al 100% nos proporciona el porcentaje de cumplimiento, de la siguiente manera: OBSERVACION FREC. ABSLUTA (fa) Cumplen 10 No cumplen 5 No dieron informacion 5 Total 20 Obt enci on de f r ecuenci a rel ati va: se divide por separado el total de cada rango de observation entre el total de la sumatoria de las observaciones. 20=100% 10= 50% 5= 25% OBSERVACION FREC. ABSOL. (fa) FREC. RELATIVA (fr) Cumplen 10 50% No cumplen 5 25% No dieron informacion 5 25% Total 20 100% Esto significa que el 50% de las instituciones del estado cumplen con el pago de cuotas a la C.C.S.S. Manual paui el dwvso de Metodos de J nvedtigacion 91 EJERCICIO N. 19 Elabore una estadistica descriptiva y obtenga las frecuencias relativas. Se requiere saber el porcentaje de empresas privadas que cumplen las normas de salud ocupacional. Invente los datos y las muestras. Trabaje las tablas y el procedimiento en hojas aparte, y anote el resultado en los renglones siguientes. 3. Pruebas par amet r i cas Se utilizan para relacionar dos variables las cuales son medidas en un nivel por intervalos o de razon. Se simboliza (r). Parte de las presunciones siguientes: La distribution poblacional de la variable dependiente es normal. El nivel de medicion de las variables es por intervalos o razon Dos o mas pobiaciones tienen una varianza homogenea, cuando son estudiadas. Estas poseen una dispersion similar a sus distribuciones. (Hernandez, Fernandez y Baptista, 2010). Las pruebas mas usadas son: Coeficiente de correlacion de Pearson y regresion lineal Prueba t. Prueba de contraste de la diferencia de proporciones. Analisis de varianza unidireccional. Analisis de varianza factorial. Analisis de covarianza. 4. Pruebas no par amet r i cas Estas no se basan en ninguna suposicion en cuanto a la distribucion de probabilidad a partir de la que fueron obtenidos los datos. La mayoria acepta distribuciones poblacionales no normales. Se utilizan para evaluar hipotesis acerca de la relacion entre variables. Las mas utilizadas son las siguientes: La chi cuadrada Los coeficientes de correlacion e independencia para tabulaciones cruzadas. Los coeficientes de correlacion por rangos ordenados de Spearman y Kendall. Manual pcuta el Cuma de Meloda# de 3nue^tiqacidn 92 5. Punt uaci ones Z Indican el grado y la direccion en que se aleja un valor respecto de la medi a, es . escala de medicion estandar. Se calcula de la siguiente manera: Se toma el valor del dato real, se resta al valor de la medi a y el resultado se divide entre valor de la desvi aci on est andar Ejemplo: La puntuacion de un estudiante en una prueba de universidad es de 72 (dato rei donde la media de la distribution es 78 y la desviacion estandar es 12. Procedimiento. Z = 72-78+12 = -0.50 Punto z = -0.50 EJERCICIO N. 20 Invente y anote un caso y los datos correspondientes al valor real, la media y la desviac estandar. Calcule el punto z. 6. Razones y t asas 1. Razon Es la relacion entre las frecuencias de dos categorias de datos. Se calcula dividiendc frecuencia de la categoria mayor entre la menor. Ejemplo: Categoria Frecuencia Tecnicos 120 Profesionales 30 Procedimiento 120- 30 =4 Esto significa que por cada profesional hay cuatro tecnicos. Manual paxa et Cwtaa de Jlietodao de Jnv^tiqadon EJERCICIO N. 21 Invente dos frecuencias y calcule la razon entre ellas. 2. Tasa Es la relacion entre la frecuencia absoluta de la muestra y el total posible de la poblacion de la que se toma la muestra. Se calcula de la forma siguiente: Se divide el valor de la frecuencia absoluta entre el total posible de la poblacion estudiada y el resultado se multiplica por un multiplo de 10, generalmente por 100 o por 1000. Ejemplo: Tasa= numero de personas que votaron si al referendo X 100 numero total de votantes Votantes positivos al referendo = 12000 Total de votantes = 250000 Procedimiento 12000+250000 = 0,048X100 = 4.8 Esto significa que 4.8 de cada 100 votantes votaron [si] al referendo. EJERCICIO N. 22 Invente una investigacion en la que incluya la poblacion total y la muestra, calcule la tasa y anote el resultado. Manual paw. el Cwcao de Aietodod de 3nuestigacion 94 C. Medi das de t endenci a cent r al Estan constituidas por los puntos medios de los valores de una distribution de datos y ayudan a comprenderlos dentro de una escala de medicion. Los principales son tres: media, mediana y moda. * 1. Medi a ar i t met i ca (X) Es la cantidad promedio de un grupo de datos. Se obtiene al dividir la sumatoria del total de los valores de las muestras entre la cantidad de muestras escogidas. Ejemplo: Se debe obtener la media del aprovechamiento academico de un estudiante X. Este estudiante cursa 13 materias, obtuvo nota de 95 en siete de el las y de 90 en las restantes seis. Procedimiento se suman las 13 calificaciones (1.205) y el total obtenido se divide entre 13 (92.69). La media de aprovechamiento academico o promedio del estudiante X es 92.69. EJERCICIO N. 23 Invente un caso en el que pueda calcular la media. Debe contar con 10 muestras como minimo, cada una con valores diferentes de las otras. 2. Medi ana (Me) Es el valor que se encuentra ubicado exactamente a la mitad de un grupo de datos. El orden de estos debe ser creciente, de menor a mayor. La mediana se ubica en el punto medio y hay igual cantidad de datos hacia abajo que hacia arriba, lo que corresponde al 50% de los datos para ambos lados. Esta puede ser obtenida de dos formas y los procedimientos dependen de la paridad o imparidad de los datos. Obt enci on con dat os pares: se suman los dos valores centrales y se dividen entre dos, el valor resultante constituye la mediana del total de los datos. Ejemplo: Grupo de datos: 15, 25, 40, 73, 89, 98. Valores centrales: 40+73 = 113+2 = 56.5 Mediana: 56.5 Atanual pcvta el Qxwso de Metodos de Jrwedtigaewn Obtenci on con dat os i mpares: la mediana es siempre el dato que se ubique en el centra ze la lista. Ejemplo: Grupo de datos: 13, 45, 49, 78, 95 Valor central o mediana: 49 EJERCICIO N. 24 Invente un grupo de datos par y otro impar, y calcule la mediana. 3. Moda (Mo) Esta constituida por el valor que se repite el mayor numero de veces en una lista de datos. Se utiliza para identificar la mayor frecuencia. Ejemplo: 24, 34, 25, 72, 24, 45r 24. 13 Moda: 24 EJERCICIO N.25 Invente una lista de datos en el que se repita un numero varias veces y establezca cual es la moda. Manual paxa el CwtAa de Metodai de Jnue^tigacum D. Medi das de var i abi l i dad Corresponden a los niveles de dispersion de los datos, cuanto se alejan estos de s media central de los datos. Las mas utilizadas son: desviacion media, desviacion estandar. varianza. 1. Desvi aci on medi a Es el promedio de los valores absolutos de las desviaciones o sesgos de selection, respecto 5 promedio del grupo de datos. Se obtiene de la forma siguiente: Se calcula el promedio de los valores de los datos y se resta ese promedio a cada uno ae los valores. El resultado de las operaciones se suma y se divide entre el numero total ae datos. Formula I ( X - X ) n Ejemplo: Datos: 13, 25, 46, 70 Promedio: 13+25+46+70= 154 +A =38.5 Restas 13-38.5= -25.5 25-25.5= -0.5 46-25= 21 70-25= 45 Sumatoria: -25.5+ -0.5+21+45= 40 Division: 40+4= 10 Resultado Desviacion media =10 EJERCICIO N. 26 Invente una lista de datos (al menos 8 datos distintos) y calcule la desviacion media. Realice el procedimiento y las operaciones en hojas aparte. Anote la lista y el resultado en los renglones siguientes. Manual pcuta el Cwcaa de Metodos de 3twentiqacidn 97 2. Desvi aci on est andar Mide la variabilidad de los datos u observaciones, cuanto se alejan estos, del promedio del valor central. Se obtiene de la forma siguiente: Se calcula el promedio de las cantidades de los datos, se resta el promedio a cada dato, el resultado de cada operacion se eleva al cuadrado (se multiplica por si mismo), se suman todos los resultados de las elevaciones, se divide el resultado de la suma entre el numero de datos y se calcula la raiz cuadrada del ultimo resultado. Ejemplo: Datos: 25, 37, 42, 56, 65 Promedio: 25+37+42+56+65 = 225+5 = 45 Restas: 25-45 = -20 37-45= -8 42-45= -3 56-45= 11 65-45= 20 Elevaciones: -20 x -20 = 400 -8 x -8 = 64 -3 x -3 = 9 11x 11 = 121 2 0 x 2 0 = 400 Sumatoria: 400+64+9+121+400= 994 Division: 994 + 5 = 198.8 Raiz cuadrada: 198.8 = 14.09 Resultado Desvi aci on est andar = 14.09 EJERCICIO N. 27 Formula Manual pcvia el Cwaa de Metad&i de 3mieatigacidn 98 Invente una lista de datos (al menos 8 datos distintos) y calcule la desviacion estandar. Realice el procedimiento y las operaciones en hojas aparte. Anote la lista y el resultado en los renglones siguientes. 3. Var i anza Mide la variabilidad de los datos u observaciones, cuanto se alejan estos, del promedio del valor central. Se obtiene elevando al cuadrado (se multiplica por si mismo) el resultado de la desvi aci on est andar . EJERCICIO N. 28 Tome la desviacion estandar del ejercicio 27 y calcule la varianza. E. Di st r i buci on de f r ecuenci as Constituye el ordenamiento de un conjunto de datos. Este representa cada uno de los factores que se han tenido en cuenta para hacer una estadistica, por lo general se utiliza el formato de tabl a. Pr ocedi mi ent o: Datos: 16, 10, 14, 55,17, 40 Se ordenan de menor a mayor. 10, 14, 16, 17, 40, 55 Se calcula: Rango (r) =valor maximo menos el valor minimo Clase (k) =se mutiplica 3,3 x log de cantidad de datos (N) y se suma 1. Esto corresponde al numero de filas que deberan emplearse en la tabla. Intervalo (i) = resultado del rango dividido entre el resultado de la clase. _r _ k Limite real inferior (LRI)= dato menor de la muestra escogida menos 0.5 Manual paui el Cuwa de Metadad de Jtweatigacidn 99 L mite real inferior de clase =limite real superior de la clase inmediata anterior. Limite real superior de clase (S) = limite real inferior de clase mas el intervalo Intervalo (i) = diferencia que existe entre el limite real superior menos el limite real inferior de una misma clase. Frecuencia absoluta (fa)= cantidad de datos con valor ubicado entre el limite real inferior y superior de clase, expresado en numeros naturales. Frecuencia relativa (fr) = se divide la frecuencia absoluta de la clase entre el numero de datos existente y se multiplica por 100. Punto medio (Pm) =intervalo + 2 + rango inferior de clase. Pm= _ i_ +I 2 Frecuencia absoluta mayor que (fa>) = cantidad de datos que tienen un valor mayor al rango inferior de la linea. Frecuencia absoluta menor que (fa<) = cantidad de datos que tienen un valor menor que el rango superior de la linea. Ejemplo: Datos: 10, 14, 16, 17, 40, 55 (cantidad de datos 6) Rango: 55-10 =45 Clase: 1+3,3 x (log6) =3,56 que se redondea a 4 Intervalo: 45-4 =11,25 se redondea al numero siguiente =12 LR I S fa fr Pm fa> fa< 9.5 21.5 4 66,64% 15.5 6 4 21.5 33.5 0 0 27.5 2 4 33.5 45.5 1 16,66% 39.5 2 5 45.5 57.5 1 16,66% 51.5 1 6 Las distribuciones de frecuencias pueden ser representadas de manera grafica mediante histogramas u otros tipos de figuras preestablecidas. El histograma contiene en el eje horizontal los Ifmites reales y en el vertical el tipo de frecuencia y sus valores. Ejemplo: Manual pcvta el Cwaa de Meteda^ de Jnuedligacidn 101 F. El pol i gono de f r ecuenci as Consiste en una grafica de las relaciones entre las puntuaciones y las frecuencias, se construye mediante el establecimiento de los puntos medios de cada intervalo. El punto medio se calcula de la manera siguiente: Se divide el intervalo entre 2 y se suma al valor del limite real inferior de cada clase. Ejemplo: Clase (k) 9.5 21.5 Intervalo (i) 12 Procedimiento: 12+2 = 6 + 9.5 = 15.5 Punto medio = 15.5 Datos: k= 9.5 21.5 /'= 12 Pm= 15.5 k= 21.5 33.5 / = 12 Pm= 27.7 k= 33.5 45.5 /'= 12 Pm= 39.5 k= 45.5 57.5 /'= 12 Pm= 51.5 Poligono de frecuencias Ej empl o de apl i caci on est adi st i ca: Se realiza una encuesta en la que se pregunta cual es la actitud hacia la gestion de la Fedefutbol. Las categorias que se establecen son: 1. Actitud totalmente desfavorable, 2. Actitud muy desfavorable, 3. Desfavorable, 4. Favorable, 5. Muy favorable y 6. Totalmente favorable. Se obtienen los datos siguientes: Moda 1 Mediana 1.5 Media 1.3 Desviacion estandar 0.4 Manual pcuta el Guma de MetadxM de 3mtedtiqacwn 102 Varianza 0.16 Maximo 3.0 Minimo 1.0 Rango 2.0 Moda (1) Media (1.3) Mediana (1.5) (1) (2) (3) (4) (5) (6) Rango (2) Desv. Est 0.4 La categoria que mas se repitio es 1, las opiniones promedio se ubican en 1.5; ninguna persona opino de manera favorable, no hay valores por encima del 4 y es a partir de este valor que inicia el rango favorable, el rango de desviacion es de 0.4, por lo que no altera el criterio. Esto significa que la actitud hacia la gestion de la Fedefutbol es muy desfavorable (menos de 2). G. Fl uj ogr ama Es una representacion grafica de la secuencia de actividades de un proceso muestra lo que se realiza en cada etapa, los materiales o servicios que entran y salen del proceso, las decisiones que deben ser tomadas y las personas involucradas. El flujograma utiliza un conjunto de simbolos para representar las etapas del proceso, las personas o los sectores involucrados, la secuencia de las operaciones y la circulacion de los datos y los documentos. Los simbolos mas comunes utilizados son los siguientes: Li mi t es: este simbolo se usa para identificar el inicio y el fin de un proceso: Oper aci on: representa una etapa del proceso. El nombre de la etapa y de quien la ejecuta se registran en el interior del rectangulo: Document o: simboliza al documento resultante de la operacion respectiva. En su interior se anota el nombre que corresponda: Manual pcuux el de Metodoj de 3nueatigacion 103 Deci si on: representa al punto del proceso donde se debe tomar una decision. La pregunta se escribe dentro del rombo. Dos flechas que salen del rombo muestran la direccion del proceso, en funcion de la respuesta real: Sent i do del fl uj o: significa Este se usa para entender un proceso e identificar las oportunidades de mejora de la situacion actual; disenar un nuevo proceso, incorporando las mejoras (situacion deseada); facilitar la comunicacion entre las personas involucradas en el mismo proceso y, divulgar, en forma clara y concisa, informaciones sobre procesos. EJERCICIO N. 30 Invente un procedimiento y represented en un flujograma. Anote el procedimiento en los renglones siguientes y realice el flujograma en hojas aparte. el sentido y la secuencia de las etapas del proceso: Manual pcvta el Cwtda de Metodaa de 3mieotigacidn