Medicion en Ciencias Sociales - Manual-Completo

MEDICIN EN CIENCIAS SOCIALES
INDICE
I. MEDICION EN CIENCIAS SOCIALES
1.1 Introduccin 1.2 Definiciones de Medicin 1.3 Propiedades de los Nmeros Usados en la Medicin 1.4 Postulados Bsicos de la Medicin y de sus Nmeros 1.4.1 Principio de Identidad 1.4.2 Principio de Orden 1.4.3 Principio de Aditividad 1.5 La Medicin como Indice 1.6 De los Conceptos a los Indices Empricos 1.7 Definiciones Conceptuales, Consensuales, Indicativas y Operacionales 1.8 Gua de Estudio 1.9 Autoevaluacin 1.9.1 Preguntas 1.9.2 Respuestas
II. MODELOS DE ESCALAMIENTO

2.1 Escalamiento de Estmulos 2.2 Escalamiento de Personas 2.2.1 Medidas de Muchos Reactivos 2.2.2 Modelos Deterministas 2.2.3 Modelos Probabilsticos 2.2.4 Modelo Lineal 2.3 Gua de Estudio 2.4 Autoevaluacin 2.4.1 Preguntas 2.4.2 Respuestas
III. INTRODUCCION A LOS MODELOS DE MEDICION

3.1 Teora de la Medicin del Error 3.2 Modelo Dominio Muestra 3.3 Modelo de las Pruebas Paralelas 3.4 Gua de Estudio 3.5 Autoevaluacin 3.5.1 Preguntas 3.5.2 Respuestas
IV. PRIMEROS PASOS EN LA ELABORACION DE UN INSTRUMENTO

4.1 Elaboracin de Reactivos 4.1.1 Tipos de Preguntas o Reactivos 4.1.1.1 Preguntas Abiertas 4.1.1.2 Mtodo de Caso o Historias Libres 4.1.1.3 Preguntas Dicotmicas 4.1.1.4 Listas de Chequeo 4.1.1.5 Ordenacin de Reactivos 4.1.1.6 Reactivos de Opcin Mltiple 4.1.2 Fraseo de las Preguntas o Reactivos 4.1.3 Secuencia de las Preguntas 4.2 Nmero de Reactivos y de Sujetos 4.3 Anlisis de Reactivos 4.3.1 Mtodo Correlacional 4.3.2 Grupos Contrastados 4.3.3 Forma de la Distribucin
4.4 Instrucciones, Calificacin y Opciones de Respuesta en Relacin con el Nivel de Medicin 4.4.1 Nivel de Medicin de los Reactivos Individuales 4.4.2 Nivel de Medicin del Conjunto de Reactivos 4.4.3 Instrucciones 4.5 Piloteo del Instrumento 4.6 Gua de Estudio 4.7 Autoevaluacin 4.7.1 Preguntas 4.7.2 Respuestas
V. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE REACTIVOS O ESTIMULOS

5.1 Modelos Discriminativos 5.1.1 Mtodo de Pares Comparados 5.1.1.1 Definicin del Atributo o Variable 5.1.1.2 Elaboracin de los Reactivos 5.1.1.3 Seleccin de los Jueces 5.1.1.4 Instrucciones para los Jueces 5.1.1.5 Escala Final. Instrucciones de Respuesta y Calificacin 5.1.2 Procedimientos Empricos 5.2 Estimaciones Subjetivas 5.2.1 Mtodo de Intervalos Aparentemente Iguales 5.2.1.1 Definicin del Atributo o Variable 5.2.1.2 Elaboracin de los Reactivos 5.2.1.3 Seleccin de los Jueces 5.2.1.4 Instrucciones para los Jueces 5.2.1.5 Valores Escalares y Valores Q 5.2.1.6 Seleccin de las Afirmaciones Definitivas 5.2.1.7 Aplicacin y Calificacin del Instrumento Final 5.3 Gua de Estudio 5.4 Autoevaluacin 5.4.1 Preguntas 5.4.2 Respuestas
VI. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE PERSONAS

6.1 Instrumentos con Dos Opciones de Respuesta 6.2 Instrumentos con ms de Dos Opciones de Respuesta 6.3 Valores de las Opciones de Respuesta 6.4 Rangos Sumarizados: Tcnica de Likert 6.4.1 Elaboracin de las Afirmaciones 6.4.2 Seleccin de los Jueces 6.4.3 Instrucciones para los Jueces 6.4.4 Anlisis de Reactivos 6.4.5 Escala Final. Aplicacin y Calificacin 6.4.6 Interpretacin de las Calificaciones 6.4.6.1 Transformacin a Puntajes T 6.4.6.2 Transformacin a Puntajes z 6.5 Gua de Estudio 6.6 Autoevaluacin 6.6.1 Preguntas 6.6.2 Respuestas
VII. INSTRUMENTOS HETEROGENEOS

7.1 Uso del Anlisis Factorial para la Construccin de Instrumentos 7.2 Fundamentos Bsicos del Anlisis Factorial 7.2.1 Preparacin de la Matriz de Intercorrelaciones 7.2.2 Extraccin de Factores Iniciales 7.2.3 Rotacin a Factores Terminales
7.3 Tipos de Anlisis Factorial 7.3.1 Factores Definidos 7.3.2 Factores Inferidos 7.4 Procedimiento General 7.5 Mtodos de Anlisis Factorial 7.5.1 Mtodo Alfa 7.6 Mtodos de Rotacin 7.6.1 Mtodos Ortogonales de Rotacin 7.6.2 Mtodo Oblicuo de Rotacin 7.7 Opciones Adicionales del Programa de Anlisis Factorial del SPSS 7.8 Interpretacin de Resultados 7.9 Ejemplo Numrico 7.10 Gua de Estudio 7.ll Autoevaluacin 7.11.1 Preguntas 7.11.2 Respuestas
VIII. CONFIABILIDAD DE LOS INSTRUMENTOS

8.1 Concepto de Confiabilidad 8.2 Tipos de Confiabilidad 8.2.1 Estabilidad Temporal 8.2.2 Homogeneidad o Equivalencia de Formas 8.2.3 Consistencia Interna 8.2.3.1 Mitades 8.2.3.2 Instrumentos con Dos Opciones de Respuesta 8.2.3.3 Instrumentos con Tres o Ms Opciones de Respuesta 8.3 Gua de Estudio 8.4 Autoevaluacin 8.4.1 Preguntas 8.4.2 Respuestas
IX. VALIDEZ DE LOS INSTRUMENTOS

9.1. Concepto de Validez 9.2 Tipos de Validez 9.2.1 de Face 9.2.2 de Contenido 9.2.2.1 Juicios Dicotmicos 9.2.2.2 Juicios Graduados 9.2.3 Concurrente 9.2.3.1 Criterio Externo 9.2.3.2 Grupos Contrastados 9.2.4 Predictiva 9.2.4.1 Regresin Simple 9.2.4.2 Regresin Mltiple 9.2.5 De Construccin 9.2.5.1 Correlacin con Criterios Externos, de Acuerdo a la Teora 9.2.5.2 Grupos Contrastados 9.2.5.3 Validez Factorial 9.2.5.3.1 Varianza Explicada 9.2.5.3.2 Validez Relevante 9.2.5.3.3 Estructura Factorial 9.3 Gua de Estudio 9.4 Autoevaluacin 9.4.1 Preguntas 9.4.2 Respuestas
X. PRESENTACION DEL INSTRUMENTO FINAL

10.1 Manual del Instrumento
10.1.1 Introduccin 10.1.2 Caractersticas Psicomtricas 10.1.2.1 Confiabilidad 10.1.2.2 Validez 10.1.3 Estandarizacin 10.1.3.1 Muestras de Estudio 10.1.3.2 Normas de Calificacin e Interpretacin 10.1.3.2.1. Valores Escalares 10.1.3.2.2. Puntajes Factoriales 10.1.3.2.3. Baremos 10.1.3.2.3.1 Stens 10.1.3.2.3.2. Puntajes T 10.1.3.2.3.3. Puntajes z 10.1.3.2.3.4. Otras Consideraciones 10.1.4 Aplicacin 10.2 Limitaciones y Sugerencias de Uso
I. MEDICIN EN CIENCIAS SOCIALES 1.1 Introduccin La ciencia intenta explicar y predecir fenmenos observables en trminos de algunas leyes generales. En las ciencias que han alcanzado mayores avances, tales leyes se expresan en trminos de las relaciones cuantitativas de las propiedades fundamentales de los objetos bajo medicin. Las propiedades son esencialmente los aspectos observables o caracteristicos de los ' objetos sometidos a medicin. La mayor parte de los eventos u objetos que estudian los cientficos varan en su magnitud. En los esfuerzos realizados para representar el hecho de que los eventos y objetos varan en magnitud, los cientficos utilizan los nmeros porque stos conforman un sistema entendible de conceptos que implican la misma magnitud. En otras palabras, los nmeros y las operaciones matemticas asociadas con ellos, pueden considerarse como una analoga general o modelo de las relaciones existentes entre los eventos que ocurren naturalmente. Esta generalidad se obtiene porque los mismos nmeros son utilizados para representar las magnitudes de diferentes tipos de eventos. De hecho, uno de los propsitos de manejar nmeros es el de proveer un lenguaje comn y universal para describir las magnitudes de diferentes objetos. El manejar un lenguaje numrico permite hacer distinciones finas en situaciones donde slo se puede percibir en forma general o vaga a los hechos; es decir, permite hacer distinciones muy finas de magnitudes, que de otra forma seran imposibles. O como dijo Guilford (1954), la medicin permite precisin, objetividad y descripcin comunicables que pueden manejarse fcilmente a nivel del pensamiento, ya que medir significa describir datos en trminos de nmeros. La precisin es uno de los instrumentos ms importantes que posee un investigador. La objetividad es una de las principales metas de la ciencia, y en trminos operacionales significa acuerdo interpersonal. Este acuerdo interpersonal se refiere a las observaciones de la naturaleza y a las conclusiones a las que se puede llegar. Libera de prejuicios particulares y permite la comunicacin significativa entre los individuos. La medicin en psicologa surge de dos fuentes principales: a) la tradicin psicofsica que trat de establecer la relacin que existia entre los estmulos fsicos y las sensaciones despertadas ' por stos en el hombre, para lo cual desarroll los llamados mtodos psicofsicos: el de error promedio; el de los cambios mnimos, y el de los estmulos constantes; b) la tradicin de las pruebas mentales o "tests" que tiene sus inicios a finales del siglo pasado y principios de este, con investigadores como Galton, James Mckeen Cattell, Binet, Terman, Otis, Thurstone, etc. La medicin en psicologa tiene por objeto registrar diferencias entre individuos o entre reacciones del mismo individuo en diferentes ocasiones utilizando instrumentos especiales denominados pruebas psicolgicas o "tests". 1.2 Definiciones de Medicin El concepto de medicin ha sido definido de diversas maneras. A continuacin se presentan algunas definiciones. Bertrand Russell define el "medir magnitudes como cualquier mtodo por medio del cual se establece una correspondencia nica y recproca entre todas o algunas de las magnitudes de algn tipo y todos o algunos de los nmeros, integrales racionales o reales" (Russell, 1938, p.176).
Stevens define medir como el hecho de asignar nmeros a objetos y eventos de acuerdo a ciertas reglas (Stevens, 1951, p. 22). Para Guilford (1954) y Torgerson (1967) medir significa describir datos en trminos de nmeros. Nunnally (1967) establece que medir consiste en un conjunto de reglas para asignar nmeros a objetos de manera tal que se representen cantidades de atributos. Torgerson (1967) manifiesta que la medicin de una propiedad implica asignar nmeros a los sistemas que representan esta propiedad. Para poder representar esta propiedad se debe obtener una relacin isomrfica entre ciertas caractersticas del sistema numrico y las relaciones entre las varias cantidades de la propiedad a medirse. Lo importante del procedimiento es asignar los nmeros de manera tal que reflejen esta equivalencia de formas entre las caractersticas de los nmeros y las relaciones correspondientes entre las cantidades. De esta manera, medir quiere decir introducir a las matemticas en la ciencia, aumentando as su cientificidad. Las matemticas son un lenguaje universal que cualquier ciencia o tecnologa puede usar para su conveniencia. Son tambin un sistema deductivo, un conjunto de reglas para la manipulacin de smbolos internamente consistentes que hace referencia a smbolos, no al sistema real. Los nmeros slo son un conjunto de smbolos especficos y la medicin siempre se refiere a nmeros. Por medio de la medicin se trata de averiguar qu tanto de cualquier atributo existe, y tiene como propsito el cuantificar los atributos de objetos y personas reales. Esto se logra mediante la realizacin de una operacin: es decir, hacer algo de acuerdo a un conjunto de reglas para obtener medidas. Su validez o utilidad va a depender del carcter de los datos empricos. Los cientificos desarrollan medidas estableciendo reglas para la cuantificacin de los ' atributos de objetos reales: toman prestados sistemas matemticos para examinar las relaciones internas de los datos obtenidos con un instrumento de medicin, y para relacionar diferentes medidas, unas con otras. 1.3 Propiedades de los Nmeros Usados en la Medicin De entre las propiedades que tienen los nmeros, las ms importantes para la medicin son tres: la de identidad, la de ordinalidad y la de aditividad o sumacin. Los nmeros, salvo en los casos de igualdad (principio de identidad), pueden colocarse en un orden incontrovertible a lo largo de una escala lineal (principio de ordinalidad). Aditividad o sumacin quiere decir que la operacin de sumar produce resultados internamente consistentes. Las operaciones aritmticas bsicas (suma, resta, multiplicacin y divisin) consisten en realidad de sumas o restas adicionadas o sucesivas. Cuando se mide, no necesariamente se debe satisfacer todas las propiedades de los nmeros; para ciertos casos es suficiente que se satisfaga la propiedad de orden. Cuando no se puede cumplir el principio de aditividad, los nmeros que se emplean en la medicin son de significado limitado, y no se pueden aplicar todas las operaciones aritmticas fundamentales. 1.4 Postulados Bsicos de la Medicin y de sus Nmeros
Los postulados bsicos de la medicin y de los nmeros empleados en ella son, segn Guilford (1954): 1.4.1. Principio de Identidad a)ya sea que a = b o a = b / b) si a = b, entonces b = a c) si a = b y b = c entonces a = c 1.4.2. Principio de Orden a) Si a > b, entonces b > a (asimetra) b) Si a > b y b > c, entonces a > c (transitividad) 1.4.3. Principio de Aditividad a) si a = p y b > O, entonces a + b > p (sumacin) b) a + b = b + a (el orden de los elementos no altera el resultado) c) si a = p, y b = q, entonces a + b = p + q (nmeros idnticos pueden ser substituidos por otros) orden de las combinaciones no afecta el resultado) d) (a + b) + c = a + (b + c) (el orden de las combinaciones no afecta el resultado) 1.5 La Medicin como Indice El investigador deber enfrentarse en algn momento en su trabajo con el problema de la construccin de variables; es decir, con la traduccin de los conceptos y nociones en operaciones de investigacin definidas. El trmino variable procede de las matemticas y de la fsica terica y se refiere a una medida o clasificacin sometida a determinadas reglas formales. En las ciencias sociales puede ser el resultado de la divisin de conjuntos de acuerdo con uno o varios criterios especficos: por ejemplo, sexo, nivel de educacin y, edad. La primera corresponde a una clasificacin nominal, y la segunda una clasificacin ordenada; slo la tercera es cuantitativa y del mismo tipo que las variables, utilizadas por la fsica. Las variables - que son los elementos de las ciencias sociales -- son a veces la traduccin en trminos operativos de nociones usadas corrientemente (inteligencia, costo de la vida, moral). En otros casos proceden de consideraciones tericas (introversin, integracin, cohesin). Pero, sea cual fuera su origen, son obtenidas siempre mediante la aplicacin, a los conceptos y nociones, de un mtodo definido o inmutable. Se tratar de ejemplificar las reglas generales de traduccin que permiten pasar del vocabulario de los conceptos al de las variables. Un concepto supone necesariamente una definicin rigurosa y una nocin contiene tan slo un conjunto de imgenes no sistematizadas. El primer problema, por lo tanto, consiste en transformar una nocin en concepto; es decir, en obtener una definicin mucho ms precisa. El problema consiste en distinguir las dimensiones especficas de la representacin original y en encontrar indicadores para cada una de estas dimensiones. El conjunto de este tipo de anlisis permite simplificar la connotacin del concepto primitivo, facilitando asi un acuerdo intersubjetivo acerca de su contenido. '
Evidentemente no existe ningn lmite imperativo al proceso de especificacin: toda dimensin puede dar lugar a nuevas subdivisiones. Pero es fcil intuir que un anlisis excesivamente refinado puede conducir a la especificacin de dimensiones redundantes, y en ltima instancia, a la utilizacin de indicadores que habran podido ser obtenidos directamente a partir de las nociones. Las ventajas de un anlisis dimensional previo a la seleccin de los indicadores, es que permite poner de manifiesto la existencia, en la literatura, de afirmaciones contradictorias referidas a la nocin, y muestra claramente la funcin esencial de la cuantificacin: depurar la connotacin de las nociones tomadas del lenguaje corriente, a fin de eliminar las proposiciones contradictorias. Sea cual fuere el nivel de anlisis, hay que enfrentarse en algn momento de la investigacin con el problema de la eleccin de indicadores. Aunque es cierto que es posible discutir indefinidamente acerca de la validez de una medida, la investigacin emprica proporciona un resultado que limita el alcance de tales discusiones: la constatacin de que ndices formados a partir de indicadores distintos conducen muchas veces a resultados similares (a esto se le conoce como interconfiabilidad de los ndices). La regla de la interconfiabilidad de los ndices desempea en la prctica un papel muy importante: Permite responder a la cuestin de la validez interna. Esta podra formularse como sigue: Cmo saber si se mide efectivamente lo que se pretende medir? Sin embargo, no se debe caer en el error de asimilar la significacin del concepto a la significacin del instrumento de medida (como lo hiciera Binet en 1905 al decir que "la inteligencia es lo que mide mi prueba"). Si las dimensiones son definidas con una precisin suficiente y til, los ndices elaborados deben proporcionar resultados idnticos, incluso en aquellos casos en que procedan de indicadores distintos. Debido a esto es que Guttman (1946) elabor la idea de universo de contenido, segn la cual todo conjunto finito de indicadores debe ser considerado como una muestra tomada de un conjunto infinito. Debe de aceptarse sin embargo, que la eleccin de indicadores se ve limitada por las fuentes de informacin disponibles, y por lo tanto se recomienda que antes de iniciar la eleccin de los indicadores y la construccin de los ndices, se procede a un anlisis metodolgico recapitulativo de las fuentes de informacin y de los tipos de ndices utilizados en el campo objeto de estudio. De esta manera, se debe percatar el investigador que el procedimiento de medicin de una variable, nocin o concepto no es ms que la construccin o elaboracin de un ndice constituido por un conjunto de indicadores. El investigador nunca mide al concepto, nocin o variable en s, ya que ste es tan solo una construccin hipottica; lo que hace es indicarla, sealar la magnitud en la que existen o se dan en un determinado sujeto (individuo, grupo, o sociedad) los indicadores de esa variable, nocin o concepto. 1.6 De los Conceptos a los ndices Empricos Ninguna ciencia aborda su objeto especfico en su plenitud correcta. Todas las ciencias seleccionan determinadas propiedades de su objeto e intentan establecer entre ellas relaciones recprocas. El descubrimiento de tales relaciones constituye el fin ltimo de toda investigacin cientfica. En las ciencias sociales la eleccin de las propiedades estratgicas constituye, en si misma, ' un problema esencial. Estas propiedades reciben a veces el nombre de propiedades o atributos,
pero a menudo se recurre al trmino matemtico de variable. Por su parte la atribucin de determinadas propiedades al objeto recibe el nombre de descripcin, clasificacin o medida. Se examinar en forma muy general el camino recorrido por el investigador para caracterizar al objeto de su estudio. Se ver que casi siempre hay que seguir un proceso ms o menos tpico. Este proceso que permite expresar los conceptos en trminos de ndices empricos comprende cuatro fases principales: la representacin literaria del concepto, la especificacin de las dimensiones, la eleccin de los indicadores observables, y la sntesis de los indicadores o elaboracin de ndices. La primer fase se refiere a la actividad intelectual y al anlisis de la literatura relacionada con el objeto de estudio, de manera que el investigador puede tener un primer esbozo, una construccin abstracta, una imagen. La segunda fase consiste en analizar los componentes de esta primera nocin. A estos componentes se les ha llamado aspectos o dimensiones. Dichos componentes se pueden deducir analticamente a partir del concepto general que las engloba, o empricamente a partir de la estructura de sus intercorrelaciones. Un concepto corresponde casi siempre a un conjunto complejo de fenmenos, y no a un fenmeno simple y directamente observable. Por regla general, la complejidad de los conceptos empleados en las ciencias sociales es tal que su traduccin operativa exige una pluralidad de dimensiones. La tercera fase consiste en seleccionar los indicadores de las dimensiones definidas. Uno de los principales resultados a los que se enfrenta el investigador es el hecho de que el indicador esta ' relacionado con el concepto tan slo en trminos de probabilidad y no de certeza, y debido a esto, es absolutamente necesario utilizar, en la medida de lo posible, un gran nmero de indicadores. La cuarta fase consiste en sintetizar los datos elementales obtenidos para construir un instrumento de medicin o ndice del concepto. Este ndice o instrumento de medicin podr ser monodimensional o multidimensional. En cualquier caso, requieren de la determinacin de su validez y confiabilidad. 1.7 Definiciones Conceptuales, Consensuales, Indicativas y Operacionales Como se puede observar, los pasos iniciales referidos a la representacin literaria y la especificacin de las dimensiones del concepto, es una parte delicada del proceso de elaboracin de ndices o instrumentos de medicin. Cuando se revisa la literatura referida a la variable que se habr de medir, el investigador se puede encontrar con que es posible llegar a tener una definicin conceptual, en la que se hayan aclarado sus elementos o dimensiones constitutivas, asi como sus relaciones de interdependencia. ' En ocasiones, el investigador se topa con diferentes definiciones para una variable: en este caso, podra optar por alguna de ellas y elaborarla hasta llegar a tener una definicin conceptual que satisfaga su punto de vista terico-metodolgico; o bien puede tratar de desarrollar una definicin nueva, que represente de manera adecuada el consenso, aunque sea parcial, que se d entre las diferentes definiciones revisadas. En este caso, el investigador tendra una definicin consensual; es decir, una definicin que representa o manifiesta el acuerdo encontrado entre diversos tericos.
En ocasiones el investigador puede tan solo o desea tan solo llegar a una definicin indicativa. Esta es aquella que define a la variable haciendo referencia al ndice que la mide. Por ltimo, en ocasiones el investigador puede o desea plantear definiciones operacionales. Estas, como se recordar, hacen referencia a las operaciones o conductas que realiza el sujeto ante un conjunto de situaciones estmulo estandarizados que el investigador le presenta. En la medida en que se tenga una variable o concepto ms sencillo, es ms fcil llegar a una definicin operacional. En trminos generales, los investigadores se preocupan por poder llevar a sus conceptos o variables a traducciones de operaciones de investigacin definidas. Una definicin indicativa es en ocasiones el nivel definitorio ms alto que se puede alcanzar, pero es tambin un excelente punto de partida para la elaboracin de instrumentos de medicin o ndices. 1.8 Gua de Estudio
1. Seale la importancia que tiene la medicin en las ciencias sociales. 2. Identifique las dos fuentes principales de la tradicin de la medicin en la psicologa. 3. Mencione algunas definiciones de medicin, y adopte alguna, de manera fundamentada. 4. Explique las propiedades de los nmeros usados en la medicin: identidad, ordinalidad y aditividad. 5. Explique los postulados de las propiedades numricas. 6. Seale y explique los pasos lgicos para construir ndices: nocin, concepto, variable, indicador, ndice. Explique los pasos operativos que se siguen para transformar a los conceptos en ndices: representacin iteraria, dimensiones, indicadores, ndices. 8. Distinga entre las definiciones conceptuales, consensuales, indicativas y operacionales. 1.9 Autoevaluacin 7.
1.9.1 Preguntas 1. 2. 3. 4. Qu permite hacer un lenguaje numrico? Cul es el objetivo de la medicin en las ciencias sociales? Qu es una variable? Qu permite hacer la regla de la interconfiabilidad de los ndices?
1.9.2 Respuestas 1. 2. 3. 4. Hacer distinciones finas entre los eventos Buscar diferencias entre individuos, o en el mismo individuo en diferentes ocasiones. Es la traduccin de conceptos y nociones en operaciones definidas de investigacin. Permite responder a la cuestin de la validez interna: si se mide efectivamente lo que se pretende medir.
II. MODELOS DE ESCALAMIENTO Se ha dicho que medir se refiere a asignar nmeros a objetos o eventos de acuerdo a un conjunto de reglas, para representar cantidades de atributo posedas por los objetos o eventos. Se requiere tener un plan internamente consistente para desarrollar un nuevo instrumento de medicin. A este plan se le denomina modelo de escalamiento, y lo que resulta de l es una escala o instrumento de medicin. El propsito de cualquier modelo escalar es el de generar un continuo en el que se puedan localizar personas u objetos; es decir, buscar una escala unidimensional donde poderlas colocar. Cuando se dice una escala unidimensional se refiere a que consista de un slo atributo. Cuando se habla de escalar y de mtodos escalares, por lo general se hace referencia al escalamiento de estmulos. Cuando se habla de escalar personas respecto a un atributo, por lo general se hace referencia a la medicin o construccin de pruebas. Para lograr escalas monodimensionales se requiere que los sujetos den respuesta frente a ciertos estmulos. Las respuestas que se dan pueden ser de dos tipos: juicios y sentimientos. Los juicios se van a referir a aquellas respuestas que se puede comprobar en forma emprica, si son correctas o no. Los sentimientos se referirn a las reacciones, preferencias, actitudes, opiniones, intereses del sujeto, donde por supuesto no existe una respuesta correcta, y por lo tanto no se puede comprobar su adecuacidad o correccin en forma emprica. El escalamiento de estmulos tiene que ver ms bien con respuestas de sentimiento, mientras que el escalamiento de personas por lo general, tiene que ver con respuestas de juicio. Estas respuestas pueden a su vez ser absolutas o relativas, dependiendo de la instruccin que se le haya dado al sujeto para su emisin. Tambin, dependiendo de las instrucciones se le puede pedir al sujeto que responda en forma nominal, ordinal, intervalar y de razn o proporcin. Como ejemplo de respuestas a nivel ordinal se tiene el mtodo de ordenacin por rangos; como ejemplo de respuesta intervalar se tiene el mtodo de intervalos aparentemente iguales; como ejemplo del de razn se tiene aquel en el que se le pide al sujeto que responda a las magnitudes absolutas de los estmulos. Uno de los aspectos ms importantes que se debe tomar en cuenta para la construccin de una escala de medicin es el de la especificacin del atributo a medir; esto es, qu es lo que se quiere medir, cul es la propiedad que pueden tener los objetos en diferentes cantidades y que se desea representar numricamente. Especificar un atributo significa definir la propiedad. 2.1 Escalamiento de Estmulos Entre los mtodos ms conocidos para escalar estmulos se tienen dos tipos principales: a) los modelos basados en estimaciones subjetivas, como por ejemplo el mtodo de categoras sucesivas y el de intervalos aparentemente iguales (Thurstone y Chave, 1929). b) los modelos discriminativos, como por ejemplo el mtodo de pares comparados (Thurstone, 1927 a, 1927 b).
Estos mtodos difieren en las suposiciones tericas que aceptan cada uno de los modelos, y en las instrucciones que se dan a los jueces o sujetos para emitir cierto tipo de respuestas frente a los estmulos o reactivos que componen el instrumento de medicin. 2.2 Escalamiento de Personas Entre los modelos para escalar personas se tienen los siguientes: a) medidas de muchos reactivos; b) modelos deterministas; c) modelos probabilsticos; d) el modelo lineal. Se ver cada uno de ellos brevemente (si se desea profundizar, se pueden consultar las obras de Edwards. 1957, Torgerson, 1967o Guilford, 1954). ' 2.2.1 Medidas de Muchos Reactivos En este modelo se le pide al sujeto que d una respuesta frente a un conjunto de reactivos. Se trabaja con un conjunto de reactivos con objeto de resolver el problema de la especificidad del reactivo. Esta se refiere al hecho de que cada reactivo por separado tiene una correlacin muy baja con el atributo en cuestin y presenta la tendencia a estar correlacionado con otros reactivos, por lo cual lo mejor es tener muchos reactivos. Si se contara con slo uno, ste producira respuestas que clasificaran a las personas en una de dos categoras: aprobado o reprobado, correcto o incorrecto, a favor o en contra, y se debe recordar que uno de los objetivos de la medicin es el poder categorizar a las personas en tantas categoras como sean posibles, para encontrar la mayor diferenciacin o discriminacin entre ellas. Por otro lado, si se contara nicamente con reactivos individuales, stos seran poco confiables debido al hecho de que existe considerable error de medicin en cada reactivo, mientras que cuando se tiene a un conjunto de ellos, estos errores se anulan unos a otros. 2.2.2. Modelos Deterministas En trminos generales estos modelos suponen que la probabilidad de dar una respuesta dada frente a un reactivo esta determinada por la cantidad de atributo posedo por el sujeto. La ' probabilidad de responder afirmativa o negativamente frente al reactivo cambia en forma brusca, de 0.00 a 1.00 en funcin de la cantidad de atributo posedo por el sujeto que responde al reactivo. La caracterstica operante de un reactivo de este tipo de modelos corresponde a la que se presente en la siguiente figura (Figura 2.1) Figura 2.1.Caracteristica operante de un reactivo del modelo determinista. ' Desde el punto de vista terico, cualquier dimensin o atributo puede ser considerado como una variable latente. Esto es, cualquier variable que pueda conceptualizarse como subyaciendo o produciendo cierta conducta o respuesta. La conducta o respuesta observada es considerada entonces como alguna funcin de la variable latente. La probabilidad de aceptar o responder en forma afirmativa o correcta una afirmacin o reactivo que se refiere a algn atributo se puede considerar como una funcin de una variable o atributo latente, el atributo posedo por el sujeto que responde a la afirmacin o reactivo. La graficacin de esta probabilidad en relacin con los valores supuestos o conocidos de la variable latente es lo que se llama caracterstica operante del reactivo. El anlisis de escalograma de Guttman (1944) y la escala de distancia social de Bogardus (1923) son ejemplos de modelos deterministas de escalamiento de personas.
2.2.3 Modelos Probabilsticos En este tipo de modelos la suposicin bsica indica que los instrumentos estn formados por reactivos cuyas caractersticas operantes son como la que aparece en la Figura 2.2. En este caso, se supone que a medida que aumenta la cantidad de atributo posedo por el sujeto, aumenta la probabilidad de que una afirmacin o reactivo sea endosado (o respondido en forma afirmativa o correcta); pero en este caso, el aumento de la probabilidad es gradual, y no brusco como en el anterior. Figura 2.2 Caracterstica operante de un reactivo en el modelo probabilstico. 2.2.4 Modelo Lineal Las suposiciones de este modelo son las siguientes: a) cada reactivo tiene una caracterstica operante monotnica creciente (la probabilidad de endosamiento de una afirmacin o reactivo aumenta en forma gradual a medida que aumenta la cantidad de atributo posedo por el sujeto, hasta llegar a un mximo y permanece all o sigue aumentando sin disminuir nunca); pero sin tener todos los reactivos caractersticas operantes idnticas (Figura 2.3). Figura 3. Caractersticas operantes de los reactivos a, b y c. b. La suma de las caractersticas operantes para un conjunto dado de reactivos o afirmaciones es aproximadamente lineal (Figura 2.4). Figura 2.4. Suma del conjunto de caractersticas operantes de un conjunto de reactivos (x). c. El conjunto de reactivos como totalidad tienden a medir slo el atributo en cuestin, lo que implica que la calificacin total en un conjunto particular de reactivos que sean contestados por un sujeto, resume toda la informacin acerca del atributo psicolgico inherente en las calificaciones de los reactivos por separado. Se dice que el modelo es lineal porque: a) se supone que la suma de las calificaciones de los reactivos tiene una relacin aproximadamente lineal con el atributo en cuestin; b) una simple suma de variables es una combinacin lineal de variables, y una simple suma de calificaciones de reactivos, es una combinacin lineal de esas calificaciones. Si se observa a los instrumentos de medicin en las Ciencias Sociales, se ver que en casi todos los casos, stos consisten en sumar calificaciones a lo largo de un conjunto de reactivos. El modelo lineal es aplicable tanto a los reactivos dicotmicos como a los de opcin mltiple. La esencia del modelo es que no toma muy en serio a los reactivos individuales por ser demasiado especficos y contener mucho error de medicin. Este modelo no hace suposiciones muy estrictas acerca de las caractersticas operantes que deben tener los reactivos, simplemente plantea la suposicin de que existe una relacin lineal entre la suma de estas caractersticas y el atributo subyacente que se pretende medir. 2.3 1. 2. 3. Gua de Estudio Qu es un modelo de escalamiento? Distinga los tipos de escalamiento que existen Identifique los principales mtodos de escalamiento de personas.
4. 2.4
Identifique los principales mtodos de escalamiento de estmulos. Autoevaluacin
2.4.1 Preguntas 1. 2. 3. 4. 5. 6. 7. Qu son los modelos de escalamiento? Qu tipos de escalamiento existen? Qu tipos de respuesta se pueden dar ante los estmulos o preguntas? Qu relacin existe entre el tipo de escalamiento y el tipo de respuestas? Por qu se construyen ndices o instrumentos con muchos reactivos? Cules modelos de escalamiento de estmulos existen? Qu diferencia primordial existe entre el modelo determinista y el probabilstico de escalamiento de personas?
2.4.2 Respuestas 1. 2. 3. 4. 5. 6. 7. Planes internamente consistentes para desarrollar un nuevo instrumento de medicin. Escalamiento de estmulos y escalamiento de personas. Juicios y sentimientos. El escalamiento de estmulos tiene que ver con las respuestas de sentimiento, y el escalamiento de personas con las de juicio. Para resolver el problema de la especificidad de los reactivos. Los modelos basados en estimaciones subjetivas, y los basados en juicios discriminativos. El cambio de una respuesta negativa a una afirmativa es brusco en el primero y gradual en el segundo, dependiendo de la cantidad de variable latente poseda por el Sujeto.
III. INTRODUCCION A LOS MODELOS DE MEDICIN 3.1 Teora de la Medicin del Error Se puede partir de la suposicin de que en cualquier medida que realice el hombre, se encuentra alguna cantidad de error involucrado, aunque los instrumentos de medicin sean muy precisos, como en el caso de los utilizados en las ciencias exactas, y con mucho mayor razn, en los casos de los instrumentos de medicin de las llamadas ciencias sociales o conductuales. El error de medicin puede ser de dos tipos: sistemtico y aleatorio. El error sistemtico es aquel que se comete cuando el instrumento de medicin arroja datos que subestiman o sobrestiman la cantidad real de atributo posedo por los sujetos o eventos que se estn midiendo. Si este es el caso, y las mediciones del atributo en cuestin se realizan con el mismo instrumento, el problema no es tan grave, ya que el error es constante y todos los eventos y objetos lo tienen en la misma cantidad; en este caso, an se pueden obtener diferencias entre eventos o personas (propsito de la medicin). El error aleatorio se refiere al hecho de que algunas veces se sobrestima la cantidad de atributo poseda por el evento u objeto, y otras se subestime; adems estas sobre o subestimaciones no son iguales; es decir, el error de medicin es el azar: algunas veces por encima, otras por debajo de la cantidad real, y nunca en la misma cuantia. Esto es lo que sucede con los ' instrumentos de medicin que se emplean en las ciencias sociales. Esto trae como resultado que no se pueda estar seguro si las diferencias reportadas por un instrumento en cuanto a la cantidad de atributo posedo por el evento o sujeto son reales. Aunque los errores aleatorios nunca se puedan eliminar, se hacen esfuerzos para reducirlos hasta donde sea posible. Se puede decir que un instrumento de medicin es ms confiable entre menor sea el error de medicin. La confiabilidad de un instrumento de medicin es el grado hasta el cual las medidas sean repetibles; es decir, un mismo individuo al que se le aplican diferentes instrumentos que miden el mismo atributo arroja calificaciones semejantes; o el mismo instrumento aplicado en diferentes ocasiones arroja las mismas. o por lo menos semejantes, puntuaciones o calificaciones (cantidades de atributo posedo por el sujeto). En 1904 Charles Spearman estableci los fundamentos de este modelo. Este es uno de los ms importantes en psicologa y es uno de los ms manejables. La teora se puede derivar partiendo de slo unas cuantas suposiciones acerca de la naturaleza de los datos. Se supone que cada persona tiene una "calificacin verdadera". la que obtendra si no hubiese errores de medicin. Si se aplica un instrumento de medicin en varias ocasiones al mismo sujeto, las medidas obtenidas producirn diferentes calificaciones que varian al azar, y se podran ' representar como aparece en la Figura 3.1. f: frecuencia de obtencin de las diferentes calificaciones de un mismo sujeto en distintas ocasiones. Figura 3.1 Distribucin de calificaciones de un mismo sujeto. Entre ms grande sea la dispersin de las calificaciones alrededor de la calificacin verdadera (el promedio de las calificaciones obtenidas en las diversas ocasiones), ms error tiene el instrumento de medicin. La desviacin estndar de la distribucin de calificaciones para cada
persona sera un ndice de la cantidad de error posedo por el instrumento de medicin. La desviacin estndar tpica se llama error estndar de medicin, y es un ndice de la cantidad de error involucrado en el instrumento. Supngase el procedimiento convencional de aplicar una prueba en el sentido de que se le presentan al sujeto un nmero de reactivos que tiene que contestar. Cada respuesta se califica como buena o mala. La simple suma o la suma pesada de las respuestas correctas es tomada como calificacin en la prueba. Supngase que la calificacin numrica est basada en contar uno o ms puntos por cada respuesta correcta, y cero puntos por cada respuesta incorrecta. Lo que se trata de determinar es la exactitud de la calificacin obtenida por el sujeto. De acuerdo a Gulliksen (1950), las suposiciones bsicas del modelo de la medicin del error son las siguientes: a) Xi = calificacin observada ( obtenida) de la persona i en la prueba que est siendo considerada. Ti = calificacin verdadera de la persona i en la prueba. Ei = componente de error para la misma persona. b) La calificacin observada (X) tiene dos componentes: T, que representa la habilidad o atributo real posedo por la persona; una cantidad relativamente estable de prueba a prueba, siempre y cuando las pruebas midan lo mismo. E, el componente de error, que se puede deber a: 1) factores que pueden hacer que una persona conteste en forma correcta a un reactivo cuya respuesta desconoce: 2) factores que hacen que conteste en forma incorrecta a un reactivo cuya respuesta si conoce. ' c) Xi = Ti = Ei Ei = Xi - Ti
Esta suposicin establece la relacin entre la calificacin de error y la verdadera: es la ecuacin que define lo que se quiere decir con error. Si se acepta el concepto de que existe una calificacin verdadera que es diferente de la observada, se puede decir que la diferencia entre estos dos es el error. Hasta ahora se tiene una ecuacin con las incgnitas (T) y (E), que no se puede resolver para determinar los valores T y E para la persona; si se aplicara la prueba a ms personas sera lo mismo. Pero: si se tienen las medias de muchas personas, se tendan tres distribuciones de frecuencia: una distribucin de X, una distribucin de T, y otra de E. Existen dos aproximaciones equivalentes al problema de la determinacin de estas distribuciones: La primera da una definicin de calificacin de error y se considera que T es simplemente la diferencia entre X y E. La segunda define a la calificacin verdadera (T) y se deja que la diferencia entre la X y la T se llame error. Existen, como ya se seal, dos tipos de errores: errores de azar y errores sistemticos o constantes. Si las medidas son consistentemente mayores o menores de lo que deben ser, se habla de error constante. Si existen discrepancias en las mediciones, algunas veces grandes, otras pequeas, algunas veces positivas y otras negativas, se habla de error al azar. La teora de las pruebas se refiere a la definicin y estimacin de los errores al azar.
c) Como los errores son al azar, es fcil suponer que a lo largo de un nmero suficientemente grande de casos el error promedio de este tipo sera cero, ya que al sumarlos se anularian unos a ' ' otros: Me = 0 Y entre mayor sea el nmero de casos de la distribucin, ms cerca de la verdad estara la ' suposicin. Por lo tanto, se puede definir a los errores al azar como aquellos que tienen un promedio de cero a lo largo de un gran nmero de casos. d) A medida que el nmero de casos aumenta, la correlacin entre las calificaciones verdaderas y las de error se acerca a cero, ya que las calificaciones de error varian de azar y las ' verdaderas permanecen relativamente estables: rET = 0 Esto tambin sera ms cierto entre mayor sea el nmero de casos. '
e) La correlacin entre los errores de una prueba y su forma paralela o equivalente (que miden lo mismo siendo diferentes) es: rE1E2 = 0 La correlacin entre dos conjuntos de errores al azar es de cero o se acerca a cero en la medida en que aumenta el nmero de casos. Partiendo de: Ti = Xi - Ei (3.1)
sumando cada lado de la ecuacin a lo largo de un gran nmero de casos se tiene: N Ti = i=1 tiene: N (Xi - Ei) i= 1 (3.2)
quitando los parntesis, omitiendo los subndices y los lmites (ya que todos son iguales), se T = X - E (3.3)
si se divide entre el nmero de casos para obtener la media se tiene: MT = MX - ME Pero se sabe que ME = 0, por lo que: (3.4)
MT = MX (3.5) Dentro de este modelo se define a la confiabilidad como la correlacin entre las calificaciones verdaderas y las observadas. Para obtener la correlacin entre las calificaciones verdaderas y las observadas se empieza con la ecuacin bsica de la correlacin entre calificaciones observadas y verdaderas:
rXT = XT Nsxsr Substituyendo X = T + E, se tiene rXT= (T + E) T Nsxst Quitando los parntesis, se tiene: rXT = T2 + TE Nsxst
(3.6)
(3.7)
(3.8)
Dividiendo cada uno de los trminos del numerador entre la N del denominador se tiene: rXT = st2 + rTE sT sE sX sT Como rET = 0, (3.9) queda: rXT = sT2 sX sT (3.10) (3.9)
Simplificando (3.10) dividindola entre sT, queda: rXT = sT sX (3.11)
La sT (varianza verdadera) es igual a sX rXhXg , si se substituye sT en (3.11), queda: rXT = sX rXhXg sX (3.12)
Cancelando sX en numerador y denominador, queda: rXT = rXgXh (3.13)
dnde Xg = a calificaciones observadas en la prueba g y Xh = calificaciones observadas en la prueba h (siendo g y h pruebas paralelas). Este coeficiente es aplicable a la situacin de pruebas paralelas (como arriba se indica); a la confiabilidad por mitades (g = una mitad; h = otra mitad); a la confiabilidad pares y nones (g = pares; h = nones) o la confiabilidad test-retest (g = primera, h = segunda aplicacin). En este modelo la validez queda definida como la correlacin entre las calificaciones observadas de dos instrumentos que miden lo mismo; es decir, el instrumento del investigador, y aquel otro que emplea como criterio externo. rTgTh = rXgXh (3.14)
En este caso se esta hablando de la validez concurrente. 3.2 Modelo Dominio - Muestra Este modelo considera a cualquier medida particular como compuesto por una muestra al azar de reactivos de una poblacin o dominio hipottico de reactivos referentes a un atributo dado. De hecho esto no es cierto, ya que los reactivos que componen una prueba casi nunca se muestrean al azar, sino ms bien son construidos ex profeso para la prueba lleva a predicciones bastante exactas en la prctica. El propsito de cualquier instrumento de medicin particular es el de calcular la calificacin o medida que se obtendra si se emplearan todos los reactivos del dominio. La calificacin que cualquier sujeto obtuviera si le fueran aplicados todos los reactivos del dominio, sera la calificacin ' verdadera. En la medida en que cualquier muestra de reactivos (prueba) correlacione con las calificaciones verdaderas, ser la confiabilidad de la muestra (prueba). En este modelo, el nmero de reactivos de una prueba no tiene que estar determinado, puede ser uno o muchos. El tipo de reactivo tampoco tiene importancia; es decir, puede ser abierto, dicotmico (por ejemplo: falso-verdadero) o de opcin mltiple, etc. Supngase que se parte de una matriz infinitamente grande de correlaciones conteniendo todas las intercorrelaciones entre los reactivos de un dominio. La correlacin promedio (rij) de la matriz indica el grado en el que existe algo en comn entre los reactivos del dominio. La dispersin de las correlaciones alrededor del promedio de correlaciones indica el grado en el que los reactivos varian en la posesin de ese algo (atributo que se desea medir) en comn. ' Si se supone que todos los reactivos tienen igual cantidad de atributo en comn, la correlacin promedio de cada columna de la matriz hipottica sera la misma, y stas serian iguales a la correlacin promedio de la matriz total. Es decir, si la correlacin promedio de cada reactivo contra todos los dems fuera la misma para todos ellos, stas correlaciones serian iguales a la correlacin promedio total de la matriz. La suposicin no dice que todas las correlaciones de la matriz sean iguales, sino que la suma de correlaciones, o el promedio de las mismas, de cada reactivo contra todos los dems es la misma para todos los reactivos. Aceptando la suposicin anterior, se puede computar directamente la correlacin de cualquier reactivo particular con la suma de todos los reactivos del dominio en la siguiente forma: a) si todos los reactivos se expresan como calificaciones estndar, la frmula de la correlacin del reactivo 1 con la suma de calificaciones en K reactivos es:
1z1 (z1+z2+z3+ ...zk) r1(1...k)= N 2 2 z1 1 (z1+z2+z3+...zk) N N (3.15)
b) el numerador de la frmula (3.15) se puede transformar como sigue: 1 z1(z1 +z2 +z3 + ...zk = N 1 (z12 + z1z2 + z1z3 + ... z1zk) =
N 1 (z1 + z1z2 + z1z3 +...z1zk) N

2
(3.16)
c)dividiendo los trminos dentro del parntesis de (3.16) entre N (que es equivalente a multiplicar por 1) queda: N r11 + r12 + r13 + ... r1k (3.17)
Ya se sabe que la suma de productos de desviaciones estndar entre N es equivalente a una correlacin. Ntese que en esta simplificacin de la frmula no que incluidas s1, s2, s3 y sk, ya que las calificaciones en si mismas estn expresadas en trminos de unidades Z, o sea, de desviacin ' estndar. d) Pero la correlacin de 1 vs. 1 (algo contra si mismo) es igual a la unidad, por lo que (3.17) ' queda an ms simplificada: 1 + r12 + r13 + ... + r1k (3.18)
e) Si se mantiene la suposicin que dice que la correlacin promedio de cada reactivo con los otros es la misma, y adems es igual a la correlacin promedio de la matriz, la suma de las correlaciones del reactivo 1 con el restante K - 1 reactivos (quitando al reactivo 1), sera igual a (k1)rij, simplificndose entonces (3.18) de la siguiente manera: 1 + ( k - 1 )rij (3.19)
f) Ahora bien, en el denominador de la ecuacin (3.15), el trmino de la izquierda es la desviacin estndar de un conjunto de calificaciones dadas en trminos de desviacin estndar para la variable 1, y esta desviacin es igual a la unidad, por lo que se pueda quitar de la frmula sin que sta se vea afectada. g) Tambin en el denominador de la frmula (3.15), el trmino de la derecha que se encuentra por de bajo del radical, es la varianza de la suma de K conjunto de calificaciones estndar, ya que una suma de desviaciones estndar entre N es igual a una varianza dentro de un radical. h) Se sabe que la varianza de la suma de un conjunto de K calificaciones estndar es igual a la suma de todos los elementos de la matriz de correlaciones de las calificaciones, ya que las correlaciones no son otra cosa que la expresin de la variabilidad de dos conjuntos de fenmenos (en este caso, calificaciones expresadas en unidades de desviacin estndar, para K variables). i) Existe un nmero K2 de elementos en cualquier matriz simtrica de correlaciones. De stos, k son los elementos diagonales y k-k2 son los elementos fuera de la diagonal. Como en una matriz de correlaciones los elementos de la diagonal siempre son igual a 1 ( ya que representan la correlacin de un conjunto de datos contra si mismos), la suma de los elementos diagonales es igual ' a K. En vez de sumar los elementos fuera de la diagonal, se podra obtener el mismo valor multiplicando el promedio de los elementos de la diagonal por k2 -k, ya que se dijo que los promedios de correlacin de cada columna son iguales entre si (una de las suposiciones bsicas del ' modelo). En esta forma, la segunda parte del denominador de (3.15), queda:
k + (k2 - k)rij
(3.20)
j) reuniendo ahora el numerador y el denominador de la frmula original (3.15),sta quedara: ' r1(1...k) = 1 + ( k - 1)rij k + ( k2 - k)rij (3.21)
k) quitando los parntesis de (3.21) queda: r1(1...k) = 1 + krij - rij k +k2rij -krij (3.22)
l) Si como el modelo supone, el dominio de reactivos es infinitamente grande, se puede ver que sucede en la medida en que K se acerca al infinito. El primer paso es dividir cada trmino del numerador y del denominador de (3.22) entre k. Como los elementos en el denominador se encuentran bajo un radical, esto requerir dividir cada trmino del denominador entre k2, dando por resultado: r1(1...k) = 1/k + rij - rij/k 1/k + rij - rij/k (3.23)
m) En la medida en que k se acerca al infinito, cualquier trmino dividido entre k se acerca a cero, y como solo hay dos trminos en la frmula (3.23) que no estn divididos entre k, la frmula queda: r1(1...k) = rij = rij rij (3.24)
Por lo que la correlacin del reactivo 1 con la suma de un nmero infinito de reactivos de un dominio ser igual a la raz cuadrada del promedio de correlaciones entre los reactivos del dominio. Esto se mantiene solo bajo la suposicin de que todos los reactivos tienen la misma correlacin promedio con el resto de los reactivos. En este caso la correlacin promedio del reactivo 1 con los otros reactivos ser igual rij, y la ecuacin original (3.15) se puede escribir as: r1(1...k) = rij (3.25)
dnde rij es la correlacin promedio del reactivo 1 con todos los reactivos del dominio. n) Como a medida que k se acerca al infinito, la correlacin del reactivo i con los k reactivos se acerca a la correlacin del reactivo 1 con la calificacin verdadera, se pueden usar los siguientes smbolos: r1(1...k) = r1t = rij (3.26)
La correlacin r1t de la variable 1 con la calificacin verdadera del dominio (la suma de todos los reactivos del dominio), ser igual a la raz cuadrada de la correlacin promedio del reactivo 1 con todos los dems reactivos. Por lo general los instrumentos de medicin estn compuestos por un gran nmero de reactivos. El modelo se puede extender para aplicarse a pruebas en lugar de reactivos nicos. La
matriz infinitamente grande de intercorrelaciones entre reactivos, puede pensarse que est dividida en grupos, cada uno conteniendo L reactivos. La suma de calificaciones en un grupo de reactivos constituira una prueba. Si los reactivos estuvieran muestreados al azar para componer las pruebas, las correlaciones entre las diferentes pruebas tenderan a ser las mismas o iguales. Estas colecciones de reactivos muestreados al azar se dice que constituyen pruebas paralelas al azar, ya que sus medias, desviaciones estndar y correlaciones con las calificaciones verdaderas difieren slo por azar. Si se supone que la correlacin promedio de cada prueba con la suma de todas las otras pruebas es igual para todas las pruebas, se puede empezar con la frmula (3.15) y poner las calificaciones de cada prueba completa (conjunto muestreado al azar de reactivos) en unidades de desviacin estndar (z), en vez de para reactivos individuales. Los pasos a seguir para desarrollar y simplificar la frmula seran los mismos que los vistos anteriormente, hasta llegar a: r1t = rij, dnde: (3.27)
1 = calificacin en la prueba 1 t = calificacin verdadera en el dominio rij= correlacin promedio de la prueba 1 contra todas las pruebas del dominio. Se debe recordar que las correlaciones promedio entre pruebas completas sern mayores que las correlaciones promedio entre reactivos, y que por lo tanto, la correlacin con la calificacin verdadera en este caso, ser ms alta para pruebas completas. La correlacin promedio de una prueba o un reactivo, con todas las pruebas o reactivos del domino se llama coeficiente de confiabilidad en este modelo. Este coeficiente se puede simbolizar como r11 para la variable 1, r22 para variable 2, etc. Entonces, la raz cuadrada de r11 es igual a la correlacin del reactivo o prueba 1 con las calificaciones verdaderas del dominio. Si las suposiciones hechas previamente respecto de las correlaciones entre los elementos de un dominio son correctas, la correlacin de cualquier prueba con las calificaciones verdaderas es precisamente la raz cuadrada de r11, que no es una estimacin (clculo aproximado), sino una determinacin real. Por supuesto, en la prctica no se conoce con exactitud r11, ya que no es posible generar un nmero infinitamente grande de pruebas. Consecuentemente r11, y por lo tanto r1t pueden tan solo ser estimadas en la prctica. Una estimacin de r11 se simbolizar como r11, que es el smbolo convencional del coeficiente de confiabilidad. Obviamente, r11 es una mejor estimacin de r11, cuando el primero se obtiene promediando las correlaciones de la prueba 1 con un gran nmero de pruebas del dominio. Si las pruebas se construyeran realmente seleccionando los reactivos al azar del dominio, la suposicin bsica al respecto de las correlaciones entre las prueba sera aproximadamente correcta. La correlacin promedio de la prueba 1 con un nmero de otras pruebas sera entonces una estimacin de la correlacin promedio de la prueba 1 con todas las pruebas del dominio. Lo que ocurre generalmente es que en la prctica, la prueba 1 est siendo condicionada con slo otra prueba (prueba 2) y la correlacin se simboliza como r11, que se toma como una estimacin de r11. Sin embargo, cuando slo se toma una correlacin como estimacin de un nmero infinito de correlaciones hipotticas, es adecuado preguntarse que tan eficientes son tales estimaciones. Se ha tenido cuidado en demostrar que r1t es igual a la raz cuadrada de r11, y tambin se ha demostrado cmo se estima r1t a partir de la raz cuadrada de r11 (el promedio de cualquier nmero de correlaciones entre la prueba 1 y otras pruebas del dominio, incluyendo el "promedio" de slo
una de tales correlaciones). Una vez que se ha obtenido una buena estimacin de r11, y por lo tanto una buena estimacin de r1t, se desarrollan importantes principios acerca de la medicin. Supngase que est siendo usado un mtodo preciso de estimar r11 en problemas particulares. Suponiendo entonces que r11es igual a r11, r1t, es igual a la raz cuadrada de r11. Con frecuencia se dice que las calificaciones de una prueba son calificaciones falibles, debido a que existe un cierto grado de error de medicin involucrado en ellas. En contraste, las calificaciones verdaderas son en este sentido, infalibles. Aunque r1t es la correlacin entre un variable existente y una variable hipottica, ms que una correlacin entre dos variables existentes, se puede usar en derivaciones matemticas en la misma forma en que se puede usar cualquier correlacin. Se puede visualizar un diagrama de dispersin que muestre la relacin entre las calificaciones falibles de cualquier prueba, y las calificaciones verdaderas. Este diagrama se ilustra en la Figura 3.2. Entonces la lnea de mejor ajuste para estimar las calificaciones verdaderas partiendo de las falibles, se obtendra como sigue: z't = r1t z1 = r11 z1 (3.28)
dnde: z't = estimacin de las calificaciones verdaderas desviadas. z1 = calificacin estndar de un instrumento de medicin falible. r1t = correlacin de la calificacin falible con calificaciones verdaderas. r11 = coeficiente de confiabilidad para la variable 1. Figura 6. Relacin entre las calificaciones falibles y las verdaderas: lnea de regresin y contorno de la dispersin de una relacin hipottica entre las calificaciones observadas y las verdaderas. Lo importante aqu es que r1t se puede colocar en las ecuaciones comunes de anlisis de correlacin. Es particularmente importante el darse cuenta que, como la raz cuadrada de cualquier correlacin es igual a la varianza de una variable explicada (o dividida) por la varianza de otra variable, r1t2es igual al porcentaje de varianza de calificacin verdadera explicada por un instrumento de medicin falible. Entonces, tambin se puede decir que r11 es igual al mismo porcentaje de varianza de calificacin verdadera en el instrumento falible de medicin. Este porcentaje adquiere ms significado cuando la medida falible se expresa como calificacin de desviacin o calificacin cruda, ms que como calificacin estndar. En los primeros dos casos antes mencionados, el coeficiente de confiabilidad se expresara como sigue: r11 = st2 / s12 (3.29)
dnde: s12 = varianza de la variable 1 2 st = varianza de las calificaciones verdaderas explicadas por la variable 1. Lo que esta ecuacin demuestra es que r11 es igual a la cantidad de varianza de calificacin verdadera en un instrumento de medicin ( en una medida) dividida entre la varianza real de la medida (o instrumento de medicin). 3.3 Modelo de las Pruebas Paralelas
El modelo discutido anteriormente se refiere a pruebas paralelas seleccionadas al azar, que se supone difieren en cierta cantidad de las calificaciones verdaderas en las medias, desviaciones estndar, y correlaciones, debido a los errores del azar en el muestreo de los reactivos. Se dijo que la mejor manera de estimar la confiabilidad es correlacionando una prueba con un nmero de otras pruebas del mismo dominio o poblacin de contenido. Como en la realidad esto es poco prctico, por lo general se correlaciona una prueba con slo otra prueba para obtener una estimacin de la confiabilidad. Pero de hecho existe mucha inexactitud al permitir que una correlacin represente al promedio de muchas correlaciones desconocidas. Esta situacin permite preguntarse si la correlacin entre solo dos pruebas puede ser considerada como una estimacin precisa de la confiabilidad de cualquiera de las dos. Si se supone que dos pruebas son realmente paralelas, a diferencia de suponer que lo son en base a que fueron muestreadas de una poblacin, el coeficiente de confiabilidad y medidas relacionadas se pueden derivar directamente sin necesidad de considerar la precisin de las estimaciones. Dos pruebas son paralelas si: a) tienen desviaciones estndar iguales; b) tienen la misma correlacin con un conjunto de calificaciones verdaderas; c) la varianza que en cada prueba no queda explicada por las calificaciones verdaderas se debe al azar. En algunos casos es til suponer tambin que las dos pruebas tienen medias iguales. Partiendo de lo anterior, se puede decir que las calificaciones de dos pruebas paralelas se pueden descomponer como sigue: x1 = t + e1 x2 = t + e2 (3.30)
dnde: x1 = calificacin desviada obtenida en la prueba 1 (calificacin observada) x2 = calificacin desviada obtenida en la prueba 2. t = calificaciones verdaderas en el dominio e1 = error en la prueba 1 e2 = error en la prueba 2 En realidad slo las calificaciones falibles obtenidas en las dos pruebas son las que se tienen a la mano. Por esta razn, la nica forma de aprender algo acerca de las calificaciones verdaderas y las de error, sera a travs de la correlacin de las calificaciones obtenidas en las dos pruebas. Partiendo de la tercera suposicin anteriormente mencionada se pueden deducir los siguientes principios: 1) Por definicin, los errores al azar tienden a cancelarse unos a otros, y consecuentemente se espera que la media de los errores en cada prueba sea de cero. 2) Como los errores al azar no correlacionan unos con otros, se espera que los errores de una prueba correlacionen cero con los errores de otra prueba y que los errores de cualquiera de las pruebas correlacionen cero con las calificaciones verdaderas. Con este modelo, se deducen los siguientes principios: sx1 = sx2 (3.31)
r1t = r2t rte1 = 0 y rte2 = 0 re1e2 = 0 Me1 = 0 y Me2 = 0 Como las calificaciones de error no estn correlacionadas con las calificaciones verdaderas, se sigue que: sx1 = st + se1 , y sx2 = st + se2
2 2 2 2 2 2
(3.32)
Como la varianza de las calificaciones observadas son iguales en las pruebas, y las varianzas de las calificaciones verdaderas tambin son iguales, se sigue que las varianzas de error tambin son iguales. Una forma interesante de examinar la correlacin entre dos pruebas paralelas es la siguiente: r12 = 1/N ( x1 x2) sx1 sx2 (3.33)
En virtud de que x1 y x2 pueden ser expresadas como la suma de las calificaciones de error y verdaderas, y en el denominador las dos desviaciones estndar son iguales, se puede escribir la ecuacin (3.33) como sigue: r12 = 1/N [ (t + e1)(t + e2)] = 2 sx1 = 1/N (t2 + te1 +te2 + e1e2) s12 = st2 + ste1 + ste2 + se1e2 s12 (3.34)
Y como los errores no correlaciona con las calificaciones verdaderas, y tampoco entre ellos, los tres trminos de covarianza del numerador de (3.34) desaparecen, quedando: r12 = st2 = r11 s12 (3.35)
Esto significa que la correlacin entre dos pruebas paralelas es igual a la proporcin de la varianza de calificacin verdadera explicada por la varianza de cualquiera de las pruebas. La misma proporcin se deriv del modelo dominio-muestra. Como la proporcin es la misma para ambas pruebas, sta se puede simbolizar como r11, r22, rxx ms que como r12. Se pueden utilizar diferentes mtodos para probar que la correlacin de la prueba 1 con las calificaciones verdaderas es igual a la raz cuadrada de la correlacin entre las dos formas o
pruebas paralelas. En las suposiciones y derivaciones planteadas hasta ahora en esta seccin, est implcito que cuando se separan las calificaciones verdaderas de las obtenidas (u observadas) en las dos pruebas paralelas, las calificaciones residuales en las dos pruebas correlacionan cero, ya que son calificaciones de error, y stos no estn correlacionados. En esta forma, la correlacin parcial tendra que ser cero, en cuyo caso el numerador de la correlacin parcial tendra que ser cero, como sigue: r11 - r1tr2t = 0 (3.36)
Esto significa que a las calificaciones observadas (11) se les est quitando las calificaciones verdaderas (1t y 2t), quedando nicamente las calificaciones de error. Como el modelo supone que ambas pruebas correlacionan lo mismo con las calificaciones verdaderas, la ecuacin (3.36) se pueden transformar como sigue: r11 = r1t2 r1t = r11 (3.37)
En algunas ocasiones ha surgido la pregunta respecto a la precisin de las estimaciones de la confiabilidad que se hacen a partir del modelo dominio-muestra (y el de pruebas paralelas, que es un caso especial del modelo dominio-muestra). Tales estimaciones son precisas hasta el grado en el que diferentes muestras al azar de reactivos correlacionan en igual cantidad con las calificaciones verdaderas. Si un reactivo correlacionara exactamente lo mismo con todos los reactivos del dominio, la correlacin con cualquiera de los reactivos sera una indicacin precisa de la confiabilidad. Si todos los reactivos del dominio correlacionaran exactamente lo mismo unos con otros, todos los reactivos tendran exactamente la misma correlacin con las calificaciones verdaderas, que sera igual a la raz cuadrada de la correlacin tpica. En el grado en el que las correlaciones entre los reactivos del dominio varan, existe algn error al azar relacionado con la correlacin promedio encontrada en cualquier dominio particular de reactivos. Por ejemplo, si el reactivo 1 tuviera correlaciones con otros reactivos del dominio que fluctuaran de 0.10 a 0.30, la correlacin promedio del reactivo 1 con un nmero de otros reactivos seleccionados al azar del dominio, dara una estimacin relativamente precisa de la confiabilidad del reactivo 1. Mientras que si las correlaciones fluctuaran entre -0.30 y +0.60, la correlacin promedio del reactivo 1 con los otros reactivos sera tan slo una aproximacin burda de su confiabilidad. Relacionado con la precisin de las estimaciones de la confiabilidad se encuentra el problema del doble muestreo. El que se refiere al muestreo de personas y el muestreo de reactivos. Como es imposible considerar ambos problemas en forma simultnea, se dice que la teora de la medicin es una teora de "muestras grandes". Es decir, se supone que se est empleando a un nmero suficientemente grande de individuos para asegurar que esta fuente de error sea una consideracin menor. La precisin requerida en la teora de la medicin no puede tolerar grandes dosis de error de muestreo debido a un pequeo nmero de sujetos. Consecuentemente, se supone que idealmente se emplean 30 reactivos y 10 sujetos por cada reactivo, o sea 300 sujetos, para que el error debido al muestreo de personas se reduzca al mnimo. En la teora de la medicin del error, la preocupacin se encuentra en el muestreo de reactivos. Un dominio de reactivos es de inters slo si la correlacin promedio entre ellos es positiva. Si esta correlacin es cero o cercana a cero, los reactivos como grupo no tienen nada en comn, y no tiene sentido considerarlos como midiendo un atributo unitario.
Partiendo de la suposicin de que la correlacin promedio es positiva y suficientemente ms alta que cero, el siguiente punto de inters es el de la homogeneidad de las correlaciones; se espera que stas sean relativamente homogneas. Cualquiera que sea el caso, habr una distribucin de correlaciones alrededor del valor promedio. Un modelo estadstico aproximado ayudar a evaluar la influencia de esa distribucin sobre la precisin de las estimaciones de la confiabilidad. El modelo supone que las correlaciones se distribuyen normalmente alrededor del valor promedio y que son estadsticamente independientes unas de otras. Ambas suposiciones antes anotadas, son ligeramente incorrectas. Si la correlacin promedio es positiva, la distribucin al azar de las correlaciones alrededor del promedio tiende a alejarse de la normalidad; as mismo, las correlaciones de una matriz no son completamente independientes unas de otras. Sin embargo, cuando las correlaciones son tan bajas como por lo general lo son entre los reactivos de una prueba (tpicamente fluctan entre 0.10 y 0.40), stas suposiciones se violan slo ligeramente, y por lo tanto, el modelo probablemente funcionar correctamente en la prctica Independientemente del nmero de reactivos muestreados de un dominio para constituir una prueba, la confiabilidad de la prueba est en relacin directa a la correlacin promedio de esos reactivos. Las pruebas ms largas (con mayor nmero de reactivos) tienen coeficientes de confiabilidad ms altos que las cortas; pero en ambos casos, las confiabilidades de las pruebas se deducen del promedio de las correlaciones entre sus reactivos. An cuando las pruebas tengan tan pocos como diez reactivos, las estimaciones de la confiabilidad son bastante precisas. Cuando existen tantos reactivos como aparecen en la mayora de las pruebas, el error de muestreo debido a la seleccin de reactivos es extraordinariamente pequeo. La razn de esta precisin es que a medida que aumenta el nmero de reactivos, el nmero de correlaciones entre reactivos aumenta en forma muy rpida. Por ejemplo, se dan 780 posibles correlaciones entre 40 reactivos, obtenindose aproximadamente la misma precisin para estimar la correlacin promedio que la que sera obtenida en una muestra de 780 sujetos en el estudio. Por lo tanto, en la mayora de los problemas de medicin existe muy poco error en la estimacin de la confiabilidad que pudiera atribuirse al error aleatorio en la seleccin de los reactivos. Si se tienen dos pruebas, supuestamente del mismo dominio, y stas correlacionan menos una con otra de lo predicho a partir de la correlacin promedio entre los reactivos dentro de cada prueba, la diferencia estara causada no por errores aleatorios en la seleccin de los reactivos, sino por errores de muestreo de sujetos, o por diferencias sistemticas en la forma en que se obtuvieron los reactivos para ambas pruebas. Esto indicara que las dos pruebas estn representando dominios de contenido algo diferentes. Si las suposiciones del modelo dominio-muestra se mantienen y el nmero de personas y de reactivos de la prueba son relativamente grandes, prcticamente no hay error en la estimacin de la correlacin de un conjunto de reactivos con las calificaciones verdaderas; se puede hablar entonces de "determinar" ms que de "estimar" varias estadsticas referentes a la medicin del error. 3.4 1. 2. 3. 4. 3.5 Gua de Estudio Distinguir entre el error sistemtico y el error aleatorio. Identificar los postulados bsicos del modelo de la Medicin del Error. Sealar el postulado bsico del modelo Dominio-Muestra. Distinguir las condiciones bsicas del modelo de las Pruebas Paralelas. Autoevaluacin
3.5.1 Preguntas 1. 2. 3. 4. paralelas? 5. Qu se entiende por error sistemtico y error aleatorio? Cul es la definicin de prueba o test? Cundo se dice que un instrumento es confiable en el modelo del error? Cundo se dice que un instrumento es confiable en el modelo de las pruebas Cundo se dice que un instrumento es confiable en el modelo de las pruebas paralelas?
3.5.2 Respuestas 1. Error sistemtico es el que se tiene cuando un instrumento tiende a sub o sobre estimar los puntajes de manera consistente y con la misma magnitud. El error es aleatorio, cuando el instrumento sub y sobre estima, en diferentes cantidades, de manera inconsistente. Una prueba o test es una muestra representativa de los reactivos de un dominio que indican a un atributo o variable. Cuando a las calificaciones observadas se les quita su componente de error. Cuando la correlacin entre los reactivos de la muestra se comporta como la correlacin entre los reactivos del dominio. Cuando existe correlacin entre dos pruebas paralelas que corresponden a dos muestras aleatorias del mismo tamao obtenidas del mismo dominio de reactivos.
2. 3. 4. 5.
IV. PRIMEROS PASOS EN LA ELABORACIN DE UN INSTRUMENTO La funcin que tiene una pregunta en un instrumento es la de provocar o elicitar una comunicacin particular. Se espera que la persona que responde tenga cierta informacin, o actitudes sobre el tema de nuestra investigacin, y se quiere obtenerla con la mnima distorsin posible. Supngase que la pregunta o reactivo ha sido comprendida por el respondiente tal y como es nuestra intencin, y que tiene el conocimiento, hechos, opiniones o actitudes requeridos como respuesta. La pregunta ha alertado al respondiente en una direccin particular: ha buscado en su mente y ha encontrado lo que estamos buscando. Ahora empieza el proceso de responder. La actitud o informacin puede ser clara y estar bien organizada, o puede estar difusa o vaga. Puede ser profunda o superficial, latente o muy arraigada. Lo que viene a la mente primero, lo se encuentra ms superficialmente, puede no ser una adecuada representacin de la totalidad de sus pensamientos sobre el tema. Se tiene que llevar a cabo algn proceso de hacer consciente o darse cuenta, junto con cierto grado de auto anlisis, retroalimentacin, conceptualizacin de ideas, generalizacin a partir de hechos especficos, y as sucesivamente. El respondiente est tratando de formarse un percepto de sus propias ideas. El proceso de producir este percepto puede verse afectado por los propios deseos, un deseo de agradar al entrevistador, la necesidad de ser justo con uno mismo y con los dems, y probablemente, estar acompaado por mucha confusin. Tambin juegan una parte importante los problemas de memoria y habilidad de recordar. Sin embargo, se puede decir que el respondiente tiene ya algn tipo de "visin interna" de su respuesta, aunque todava no la ha comunicado. Para hacerlo, tiene que tener una cierta habilidad para comunicarse: debe ser capaz de poner en palabras sus pensamientos en forma adecuada. Tambin debe desear comunicarse --- debe haber aceptado el papel de respondiente en la situacin de prueba, entrevista o cuestionamiento. Debe haber encontrado motivos que no slo le permitan dedicar tiempo y esfuerzo en responder, sino que en ocasiones tambin le permitan comunicar, si fuera necesario, informacin privada o tab. Sin embargo, su disponibilidad puede ser fcilmente desviada debido a diversas formas de censura interna, rapport pobre, el deseo de mantener una fachada social, y las expectativas de respuesta que la misma pregunta sugiere. En otras palabras, es bastante difcil obtener una respuesta relativamente no prejuiciada an de un respondiente deseoso, dispuesto y claro que ha entendido correctamente lo que deseamos, sin que nuestra tarea se convierta en prcticamente imposible dirigiendo esta "lnea de pensamiento" por el lado equivocado por medio de preguntas mal hechas. De alguna manera, el problema de hacer preguntas es un problema de muestreo. Se est muestreando un universo particular de contenido en la mente del respondiente. No se pretende obtener la totalidad del universo de contenido, sino solo lo suficiente para permitir obtener una idea clara de sus aspectos sobresalientes, su direccin, profundidad o intensidad generales, y quiz la presencia o ausencia de reactivos especficos. Las preguntas o reactivos debe ser adecuadas para este proceso de muestreo; deben ser imparciales; deben hacer que sea fcil que el respondiente conteste en forma completa. Esto significa primero que nada, que su contenido debe ser correcto; segundo, el lenguaje o palabras empleadas deben ser adecuadas y, tercero, el contexto, la secuencia, y las categoras de respuesta (si las hay), deben ayudar al que responde sin sesgar sus respuestas. Los objetivos bsicos en el diseo de instrumentos son: 1) obtener informacin relevante a los propsitos de la investigacin: 2) recoger esta informacin con la mxima confiabilidad y validez. Estas metas pueden denominarse respectivamente, relevancia y exactitud. Para asegurar la relevancia, el investigador debe tener muy claro el tipo de datos que requiere su estudio.
Especficamente el investigador debe explicar las razones que lo llevan a incluir cada una de las preguntas o reactivos, y no slo por qu se hace cada pregunta, sino qu se va a hacer con la informacin que sta proporcione. Esto requiere decidir de antemano ciertos aspectos de codificacin y anlisis. Es ms probable alcanzar la exactitud cuando el fraseo y secuencia de las preguntas o reactivos estn diseados para motivar al respondiente y facilitarle el recuerdo. Se obtiene la mejor cooperacin y la menor distorsin cuando el instrumento es interesante y cuando evita preguntas que son difciles de responder, que tomen mucho tiempo, que sean vergonzosas, o personalmente amenazantes. Los tipos generales de reactivos o preguntas que un investigador de las ciencias sociales emplea se pueden clasificar en tres grandes clases: a) informacin de identificacin; b) datos factuales tipo censo o antecedentes sociales; y c) reactivos o preguntas acerca del objeto de estudio. El primer tipo de preguntas o reactivos asegura que el instrumento no se pierda o se vaya a duplicar; que la informacin del instrumento pertenece a cierto caso particular y que se pueda identificar el respondiente y al encuestador o aplicador del instrumento. El segundo tipo proporciona informacin acerca del respondiente que provee las caractersticas de las muestras estudiadas, su representatividad en relacin con el universo o poblacin bajo estudio, as como aquellas variables que se pueden emplear como factores de prueba o controles estadsticos en el proceso de anlisis de datos. El tercer tipo proporciona la informacin objeto del estudio: registro de algunas variables dependientes o independientes en un estudio, o son la materia prima a partir de la cual se pretende elaborar uno o varios instrumentos (homogneos o heterogneos). Entre los reactivos ms empleados para asegurar la informacin de identificacin, se tienen los siguientes: 1. Nmero de la cdula, caso o muestra. 2. Ttulo del instrumento o cdula 3. Nombre del patrocinador 4. Nombre o direccin del sujeto o familia entrevistada (cuando no se asegura anonimato). 5. Sexo del respondiente 6. Lugar de la entrevista o aplicacin 7. Nombre o iniciales del entrevistador o aplicador 8. Fecha y hora de la entrevista o aplicacin 9. Cooperacin del respondiente Dentro del segundo tipo de reactivos, los ms empleados son los siguientes: 1. Edad del respondiente 2. Nacionalidad del respondiente 3. Estado civil 4. Nivel educativo formal alcanzado 5. Religin 6. Preferencia poltica 7. Pertenencia a sindicatos 8. Tenencia de la vivienda 9. Renta mensual pagada o que se podra obtener de la vivienda en que se habita 10. Tamao y composicin de la familia. 11. Ocupacin. 12. Lugar de trabajo
13. Ingreso familiar 14. Posesin de automviles 15. Nivel socioeconmico, etc. El tercer tipo de reactivos sern vistos con mayor amplitud en la siguiente seccin, la 4.1 4.1 Elaboracin de Reactivos Habiendo definido la o las variables desde el punto de vista conceptual, consensual, indicativa u operacional, se procede a llevar a cabo la redaccin de los reactivos. La definicin puede contemplar una o varias dimensiones, lo que determinar si se elaborar un instrumento homogneo (una sola dimensin) o heterogneo (varias dimensiones). Esta definicin pudo haber provenido de una o todas las siguientes fuentes: literatura especializada, literatura comn u ordinaria, o de los mismos sujetos que sern investigados o para los cules se elaborar el instrumento. Una vez habiendo llegado el nivel de las dimensiones, se sugiere que se escojan las preguntas o reactivos con cuidado. A continuacin presentamos algunas recomendaciones. Inclyanse slo preguntas o reactivos directamente relacionados con la variable de inters. No se incluyan preguntas si se puede obtener la informacin en forma ms exacta o efectiva de otras fuentes, a menos que se deseen como o un chequeo de la muestra o se vayan a emplear en tabulaciones cruzadas como variable control o factores de prueba. Hay que tener cuidado en la forma en que se hacen preguntas personales o aquellas que puedan avergonzar al respondiente. La informacin muy personal, se puede obtener con frecuencia, llevando hacia la pregunta deseada, por medio de una serie de preguntas impersonales preliminares. Hganse slo aquellas preguntas factuales cuyas respuestas conozcan o se espere que sean conocidas por la mayora de los informantes o respondientes. Evtense preguntas con alta probabilidad de producir respuestas inexactas. No se hagan preguntas que requieran de mucho trabajo extra por parte del respondiente. 4.1.1. Tipos de Pregunta o Reactivos Las preguntas pueden ser de diferentes tipos, dependiendo de los objetivos del estudio. Cuando se van a medir o registrar diferentes variables, y se va a hacer una escala o prueba para cada una, se pueden emplear diferentes tipos de reactivos o preguntas, siempre procurando que sean del mismo tipo para cada variable o escala. Es decir, se puede emplear tipos diferentes de preguntas para cada una de tres variables, pero todas las preguntas o reactivos de cada una de ellas es igual a lo interno: una emplea preguntas dicotmicas; otros reactivos de ordenacin y la tercera de opcin mltiple (tres opciones), el investigador deber tomar en cuenta las ventajas y limitaciones de cada uno de ellas. 4.1.1.1 Preguntas Abiertas.- Por lo general es necesario emplear preguntas abiertas en las etapas iniciales, exploratorias o piloto de un estudio, ya sea de investigacin o de elaboracin de un instrumento. Estas preguntas proporcionan gran libertad en la latitud de las respuestas del sujeto investigado o cuestionado. Slo descubriendo cules aspectos de un tema o variable son los que han producido una impresin en la gente y cules palabras son las que esta gente emplea para expresar sus reacciones, es que se puede llevar a cabo una planeacin inteligente de preguntas cerradas o categoriales. En los estudios en gran escala las preguntas abiertas producen una variedad de respuestas tal que las tareas de clasificacin y anlisis toma mucho tiempo y plantean muchas dificultades para su anlisis estadstico. Por estas razones, este tipo de preguntas se recomienda para muestra muy
pequeas o estudios piloto. A una serie de preguntas abiertas centradas alrededor de un tpico o tema se le denomina en ocasiones, "entrevista profunda o focalizada". Estas pueden tener una duracin de una hora o ms. 4.1.1.2 Mtodo de Caso o Historias Libres.- Otra manera de obtener informacin es por medio de extensas conversaciones con los respondientes. El mtodo de caso ms aplicable a la investigacin es la entrevista oral controlada en la que el investigador despus de una entrevista muy extensa escribe un resumen en el que pone nfasis en algunas afirmaciones o conductas que indican ciertas actitudes, por ejemplo. Si el investigador sigue un esqueleto de temario, puede clasificar las reacciones del respondiente en todos lo temas o preguntas del esqueleto y as, puede someterse la informacin a anlisis estadsticos; de otra manera no se podra. 4.1.1.3.Preguntas Dicotmicas.- Estas preguntas son aquellas que piden que se responda con SI o NO, de acuerdo o desacuerdo, cierto o falso, correcto o incorrecto, bueno o malo, etc. La ventaja principal de las preguntas dicotmicas es su simplicidad, toma poco tiempo el hacerlas y proporcionan respuestas muy claras que son fcilmente registradas y tabuladas. Estas preguntas son muy tiles y son ms familiares para el pblico en general, si por ejemplo, la opinin que se est investigando ha cristalizado de tal manera que el tpico se puede reducir a una proposicin especfica. Una limitacin de las preguntas dicotmicas surge del hecho de que una ligera malinterpretacin de la pregunta, cambia totalmente el sentido de la respuesta. Otra limitacin se refiere al hecho de que se est "forzando" arbitrariamente la respuesta a una de la opciones, y en ocasiones esta situacin no es un adecuado reflejo de las circunstancias reales. Sin embargo, las preguntas de respuesta dicotmica son especialmente adecuadas y convenientes para determinar posesin de conocimiento o informacin correcta. 4.1.1.4 Listas de Chequeo.- En cierto sentido, las listas de chequeo son preguntas de opcin mltiple, sin embargo presentamos a stas por separado. Este tipo de preguntas es el que se usa ms comnmente y consiste en la presentacin del problema o pregunta, seguida por una lista de tres o quince posibles respuestas de entre las cuales se le pide al respondiente que escoja una, o varias, especficamente indicadas. Como regla, este tipo de preguntas surgen despus de un piloteo previo que puede servir para determinar que tipo de respuestas se pueden esperar. Slo por medio de un piloteo previo puede el investigador asegurar que la mayora de las respuestas no van a caer en la categora de "otros" que generalmente acompaa a una lista limitada. La ventaja de las listas de chequeo es que sirve como recordatorio para aquellos respondientes que de otra manera se hubieran abstenido de dar una cierta respuesta simplemente por que no pensaron en ella en ese momento. Por otro lado, la lista de chequeo puede sugerir respuestas que el respondiente escoge por alguna extraa razn, como puede ser que es la primera o la ltima de la lista, o por que cree que es la respuesta "adecuada". Si la lista de chequeo se presenta en forma oral, se recomienda que no tenga ms de cinco opciones y de preferencia que sean menos, para que el que escucha pueda retenerla en la mente mientras escoge su respuesta. Si la lista es muy larga, o si cada reactivo es muy complicado, es mejor presentar la lista de opciones en una tarjeta que se le da al respondiente para que l mismo la lea. 4.1.1.5 Ordenacin de Reactivos.- En el formato se ordenacin de reactivos se le pide al respondiente o informante que ordene una lista de afirmaciones, palabras, frases, dibujos u otras cosas, en orden de su preferencia, dando el nmero 1 al que prefiere ms, el 2 al siguiente y as sucesivamente, hasta agotar la lista. Una de las limitaciones de esta tcnica es el hecho de que no se hace ninguna suposicin respecto al tamao de los intervalos de los diferentes nmeros empleados para ordenar los elementos de la lista. Otra limitacin es el nmero relativamente
pequeo de elementos que se pueden incluir en la lista, ya que si este fuera muy larga, el respondiente se vuelve ms descuidado en la medida en que se acerca al final de su ordenacin. Aunque se ha sugerido que una lista de tres elementos es la que da mejores resultados, el nmero ptimo vara de acuerdo al tema en cuestin. La calificacin de este tipo de reactivos puede hacerse de varias maneras: un procedimiento comn es tomar la respuesta marcada con el nmero 1 y asignarle el valor escalar del elemento escogido (vase tema V). Otro procedimiento consiste en tomar en cuenta el grado en el que las respuestas se desvan en forma significativa de un patrn de respuesta aleatorio. 4.1.1.6 Reactivos de Opcin Mltiple.- Los reactivos de opcin mltiple se presentan de tal manera que el respondiente tiene que escoger entre la varias posibles respuestas, aquella que mejor represente su opinin, creencia, o lo que sea. Este tipo de preguntas es particularmente til cuando el tema en cuestin no puede quedar bien representado por una pregunta dicotmica. En este formato, se da la oportunidad de expresin o manifestacin de todos los grados de opinin, actitud o rasgo. La dificultad estriba en elaborar preguntas que representen el rango completo del tema en cuestin. Es importante que la lista de alternativas o categoras de respuesta debe ser lo suficientemente completa para cubrir todas las posibles respuestas sobre el tema o variable. Si la lista est incompleta, existe el peligro de que el respondiente lea en alguna alternativa algo que sin estar all l considera que representa su opinin, o actitud, etc., y conteste de acuerdo, producindose as una respuesta que en realidad es falsa. Es difcil frasear afirmaciones que sean mutuamente excluyentes de tal manera que el respondiente no se sienta indeciso entre dos opciones igualmente deseables o indeseables. Es difcil tambin que el respondiente promedio mantenga en mente a todas las opciones, an cuando se entiendan y se recuerdan las alternativas. Los reactivos de opcin mltiple pueden an arrojar resultados distorsionados debido a la conocida tendencia del ser humano de escoger el punto de vista intermedio, neutral, tibio, y dar as mucho peso a las categoras intermedias de la escala. Las preguntas de opcin mltiple pueden adoptar diferentes formas. Las ms populares son las escalas de clasificacin o intensidad, que pueden emplear tres, cuatro o cinco opciones de respuesta. a) Escalas de Clasificacin de Tres Puntos. En estos casos se presenta una afirmacin y tres opciones de respuesta. Entre las palabras ms usadas en las escalas de tres puntos se tiene:
Mayor Difcil Superior S Encima del promedio Mayora Excepcionalmente bueno Acuerdo Ms que la mayora de la gente Igual Igual Igual Depende Promedio Muchos Promedio Intermedio Como toda la gente Menor Fcil Inferior No Abajo del promedio Pocos Muy pobre Desacuerdo Menos que la mayora de la gente
Las palabras particulares que se emplean para expresar los diferentes grados, dependen del fraseo de la pregunta, del tema o variable, o del juicio del que construye el instrumento. Una prctica muy comn es colocar las opciones "neutral", "indeciso", "sin opinin", "intermedio", en el centro de la escala, y los ms extremos a los lados. Como ya se seal anteriormente, la posicin intermedia debe emplearse con cautela. Si no existe una definicin o cristalizacin sobre un tema, o si las persona no han pensado respecto al
tema o tpico, se tiende a escoger como respuesta a la alternativa intermedia. En estos casos, y de preferencia cuando son ms de tres opciones de respuesta, se recomienda eliminar la opcin intermedia y dejar nicamente las extremas. b) Escalas de Clasificacin de Cuatro Puntos.- Estas escalas se construye de la misma manera que las de tres opciones, pero se proporciona la posibilidad de elegir entre cuatro puntos o grados de opinin. Algunos de los trminos, entre los muchos que se pueden emplear son:
Muchos Excelente Siempre Algunos Bueno A veces Pocos Regular Casi nunca Ninguno Malo Nunca
c) Escalas de Clasificacin de Cinco Puntos.- Las escalas de cinco puntos han sido empleadas muy frecuentemente en la medicin de actitudes. A continuacin se presentan algunas de las palabras o frases que indican diversos grados de opinin o sentimiento. La eleccin, en una instancia especfica, depende de la afirmacin o variable involucrada.
Totalmente de acuerdo Definitivamente cierto Muy alto Posiblemente muchos Todos A favor en todos los aspectos De acuerdo Probablemente cierto Arriba del promedio Aproximadamente todos La mayora A favor en la mayora de los aspectos Indeciso Dudoso Promedio La mitad Algunos Neutral En desacuerdo Probablemente falso Debajo del promedio Pocos Pocos A favor en pocos aspectos Totalmente en desacuerdo Definitivamente falso Muy bajo Prcticamente ninguno Nadie En contra de todos los aspectos
d) Escalas Grficas de Clasificacin.- La intensidad de una respuesta tambin se puede indicar sobre una lnea, en la que se han definido los dos extremos y el centro. Por ejemplo: Definitivamente apruebo + 10 Neutro Definitivamente desapruebo - 10
En este caso se le pide al respondiente que marque sobre la lnea, el lugar que mejor represente su posicin frente a la pregunta que se le est planteando. Los puntajes se determinan midiendo la distancia del centro hacia cualquiera de los extremos, con el signo adecuado o correspondiente al lado donde se encuentra la respuesta. 4.1.2 Fraseo de las Preguntas o Reactivos Se debe dar considerable atencin al fraseo de las preguntas o reactivos para asegurar la obtencin de informacin confiable y significativa. Aunque se deben tomar ciertas precauciones en el fraseo de preguntas que se refieren a los datos factuales, se requiere de ms cuidado an en la elaboracin de las preguntas de las variables, temas o tpicos de inters para el investigador. Entre los muchos aspectos que han sido estudiados por los expertos, se encuentra el hecho de que ciertas palabras tienden a colorear las respuestas, las condiciones bajo las cuales las respuestas se ven ms afectadas por la connotacin de las palabras, y las formas de las preguntas que son ms efectivas para obtener respuestas verdaderas. A continuacin se presenta una serie de sugerencias que se recomienda se tomen en cuenta para el fraseo de las preguntas o reactivos. Sugerencias 1. Usar palabras sencillas, que sean conocidas por todos los respondientes potenciales. 2. Hacer la pregunta lo ms concisa posible, no teniendo ms de 20 palabras. 3. Formular la pregunta de manera que produzca nicamente la informacin deseada;
4. Evitar cualquier pregunta o reactivo no relacionado con la variable. 5. Evitar preguntas ambiguas o que puedan ser interpretadas de diferentes maneras. 6. Evitar preguntas que sugieren la respuesta. 7. Cada reactivo o pregunta debe tener slo una idea; oraciones simples. 8. Las sintaxis debe ser sencilla y clara: sujeto, verbo y complemento. 9. No se usen nombres de personas prestigiosas (favorable o desfavorable) en el cuerpo de la pregunta o reactivo. 11. Evitar palabras "peligrosas", pegajosas, estereotipos o palabras con connotacin emocional. 12. Decidir si se va a emplear o incluir preguntas o reactivos indirectos. 13. Tener cuidado de no emplear frases que puedan afectar el prestigio del respondiente. 14. Decidir si se va a personalizar algunos de los reactivos o preguntas, o si se redactarn en tercera persona o en forma impersonal. 15. Permitir que se den todas las posibles respuestas, principalmente en las preguntas o reactivos de opcin mltiple. 16. Las alternativas de las preguntas de opcin mltiple deben ser realistas. 17. Evitar hacer preguntas referidas al pasado, pues los respondientes pueden haber olvidado o substituido la informacin. 18. Procurar no hacer preguntas de hecho a menos que sean de las factuales tipo censo, o est averiguando nivel o grado de conocimiento sobre el tema o variable de inters. 19. Emplear con cuidado o casi nunca palabras universales como "siempre" "ninguno", "nunca" (slo para definir los extremos de continuos) o aquellas como "slo", "apenas", "casi", "a veces", por que introducen ambigedad ya que significan diferentes cosas para diferentes personas. 20. Evitar usar dobles negativos, tambin producen ambigedad. 21. No usar reactivos, que sean contestados por todos o que no sean contestados por nadie. 22. Procurar cubrir el dominio o dimensin de la variable en todo el rango definido por la misma. 23. Tratar de mantener a un mnimo la cantidad de escritura que se requiere por parte de respondiente, pidiendo tan slo que: escriba Si o No; escriba un nmero, o una letra; ponga una cruz (X); subraye la respuesta que desee; circule la respuesta escogida, etc. 24. Decidir si se va a incluir algunas preguntas de chequeo, de la consistencia de las respuestas. Es decir, si va a hacer la misma pregunta fraseada de diferente manera y localizada en diferente parte del instrumento. Esto se recomienda cuando el instrumento es corto, difcilmente cuando es muy largo. 25. Evitar hacer preguntas que requieren respuestas referidas a valores o normas socialmente aceptados o deseables. 26. Evitar preguntas aparentemente irracionales, y si es necesario emplearlas, dar una pequea explicacin que justifique a la pregunta. 4.1.3 Secuencia de las Preguntas Las preguntas deben presentarse en forma lgica, si se desea evitar confusin y malas interpretaciones. Los reactivos debern agruparse de tal manera que de unos se pueda pasar a otros sin sobresalto ni brusquedad, sobre todo en los instrumentos multidimensionales o heterogneos. Es decir, las transiciones deben ser suaves y lgicas. Si se emplean preguntas generales y especficas, las primeras debern preceder a las segundas. Las preguntas iniciales debern ser interesantes y motivantes para el que responde. Si se logra interesar al sujeto, es ms probable que no se niegue a colaborar. Estas preguntas iniciales debern ser respondidas con facilidad. Las preguntas que pueden avergonzar o molestar al
respondiente deben colocarse en la parte intermedia del instrumento: ya existe suficiente confianza y an no se ha cansado de responder. 4.2 Nmero de Reactivos y de Sujetos No se puede saber de antemano la cantidad de reactivos que debern construirse cuando se elabora un nuevo instrumento; esto se sabe realmente despus de haberlos construido y sometido a un anlisis de reactivos. Si el estndar es obtener una prueba con un coeficiente de consistencia interna de 0.80, el anlisis de reactivos puede mostrar que la confiabilidad deseada se alcanza con un mnimo de 20 o un mximo de 80 reactivos. Sin embargo existen, algunas regla informales que pueden guiar la construccin de reactivos. Se ha visto que se requieren entre 20 y 30 reactivos dicotmicos para obtener una confiabilidad de consistencia interna de 0.80. Tambin se ha visto que con tan pocos, como 15 reactivos, pero de siete opciones de respuesta, se puede alcanzar una confiabilidad de 0.80. Si se sabe que los reactivos que miden una X variable tienden a tener una consistencia interna alta, el investigador inicia la construccin de su instrumento con por lo menos el doble del nmero de los reactivos que desea que tenga la prueba final. Es decir, si el instrumento final debera tener 30 reactivos, se inicia su construccin con 60. Si se sabe poco acerca de los reactivos de una clase particular, es mejor prevenir que lamentar, e iniciar el trabajo con un nmero mucho ms alto de reactivos, digamos unos 100. Debe recordarse que muchos de estos reactivos quedarn "descalificados" por el anlisis de reactivos que se lleve a cabo. Otra estrategia para decidir la cantidad de reactivos que se deben elaborar consiste en construir un nmero de reactivos menor al que se necesita; por ejemplo, construir 30 reactivos cuando se supone que sta es la cantidad que se necesitar para obtener un coeficiente de consistencia interna de 0.80; se aplican a una muestra relativamente pequea de sujetos (100 por ejemplo) y se someten a anlisis de reactivos. Si la serie total (los 30) o un subconjunto relativamente ms homogneo (digamos 15), obtienen un coeficiente de por lo menos 0.50 significa que vale la pena construir ms reactivos, aplicarlos a una muestra ms grande, y por ltimo, someterlos a un anlisis de reactivos completo. Despus de haber construido los reactivos deben aplicarse a una muestra de sujetos. Esta deber ser razonablemente representativa de los tipos de sujetos que sern estudiados con el instrumento definitivo (procedimiento de escalamiento de personas: ver captulo VII). En algunos casos, los sujetos empleados en la construccin del instrumento no requieren ser representativos de la poblacin donde aplicar, sino que requieren ser sujetos expertos en el tema o variable, por que van a fungir como jueces, siguiendo instrucciones muy precisas del procedimiento de enjuiciamiento que se requiere de ellos (procedimientos de escalamiento de reactivos: ver siguiente captulo, V). No es posible predecir con exactitud cuntos sujetos deben usarse para hacer un anlisis de reactivos. Una regla general es que sean por lo menos diez sujetos por reactivo. En algunos casos, cuando hay ms de 70 reactivos, esta regla es poco prctica, y entonces se sugiere que sean por lo menos 5 sujetos por reactivo. Es decir, si se tienen 40 reactivos, la muestra deber tener una N = 200; si son 85 reactivos, la N = 425. Al recoger los datos para hacer el anlisis de reactivos, stos debern administrarse en condiciones muy semejantes a aquellas en las que eventualmente se emplear o aplicar la prueba o instrumento; de lo contrario, no sirve. 4.3 Anlisis de Reactivos
El primer paso estadstico que se lleva a cabo al inicio de la construccin de un instrumento es el anlisis de reactivos. Existen diferentes procedimientos para realizar un anlisis de reactivos, y se ha visto que existe concordancia entre los resultados obtenidos por los diferentes mtodos. De cualquier forma, se proceder a presentar tres procedimientos generales. 4.3.1 Mtodo Correlacional a) Reactivos - Calificacin Total. El primer paso en el anlisis de reactivos es correlacionar a cada reactivo con las calificaciones totales. Si los reactivos son de opcin mltiple, el coeficiente de correlacin producto momento de Pearson es el adecuado. Si los reactivos son dicotmicos, el coeficiente de correlacin biseral -puntual es el correcto. Los coeficientes obtenidos se ordenan del ms alto al ms bajo, y se especifica cules de ellos tienen correlaciones significativas con por lo menos p = 0.05. El siguiente paso es escoger aquellos reactivos que tengan correlaciones iguales o mayores a 0.20, y con stos iniciar una prueba de consistencia interna, para ver si cumplen con la confiabilidad establecida como deseable (r = 0.80 o ms). b) Si los reactivos que se han elaborado son de dos opciones, la prueba de consistencia interna deber calcularse con el coeficiente Kuder-Richardson 20. Si los reactivos son de opcin mltiple (tres o ms opciones) el coeficiente adecuado para determinar su consistencia interna ser el Alfa de Cronbach (estos coeficientes se presentan en el Captulo VI, ms adelante). Si el conjunto de reactivos alcanza el nivel de confiabilidad deseado (r = 0.80 como mnimo), el anlisis de reactivos se da por terminado. Si este no es el caso, se agregan los siguientes cinco o diez reactivos de la lista ordenada al final. Y se repite el procedimiento anterior. Si ya se alcanz el nivel deseado, se da por terminado el anlisis. Si no, se agregan ms reactivos (siempre y cuando tengan r = 0.20 y p= 0.05) y se determina la consistencia interna; y as sucesivamente, hasta alcanzar la meta deseada. Antes de continuar, se debe recordar que si el nmero de reactivos es muy pequeo, y la muestra de sujetos tambin lo es, es probable que las correlaciones item-calificacin total obtenidas inicialmente (ya sea por medio del coeficiente PM o por el biserial-puntual), pueden estar adoleciendo de un artefacto estadstico. Este artefacto se debe al hecho de que cuando se correlaciona un reactivo con la calificacin total, de hecho tambin se est correlacionando consigo mismo, puesto que forma parte de la calificacin total. Esto significa, que estas correlaciones iniciales son espurias o mayores de lo que realmente son. Cuando estas son las circunstancias, esas correlaciones iniciales habrn de corregirse, antes de establecer su nivel de significancia, por medio de la siguiente frmula: r1(y-1) = ry1 sy - s1 ___________ s12 + sy2 - 2s1syry1 dnde: r1 = correlacin del reactivo 1 con las calificaciones totales y sy = desviacin estndar de calificaciones totales s1 = desviacin estndar del reactivo 1 (4.1)
r1(y-1) = correlacin del reactivo 1 con la suma de calificaciones de todos los reactivos, excluyendo al reactivo 1. Aunque el artefacto puede ser grande cuando el nmero de reactivos es pequeo, con el nmero de reactivos involucrados en la mayora de los anlisis (80), el artefacto resulta bastante pequeo, de manera que slo se habrn de corregir las correlaciones reactivo-calificacin total, cuando se tengan pocos reactivos (30 menos). Este problema queda resuelto si se tienen un mnimo de cinco sujetos por reactivo, idealmente, diez sujetos por reactivo. Por otro lado, si todas correlaciones reactivo-calificacin total son positivas, como siempre sucede, la nica hiptesis pertinente sera que todos los reactivos correlacionan realmente en forma positiva en la poblacin de personas que est siendo muestreada. Cuando ms del 90% de las correlaciones reactivo- calificacin total son positivas como tambin casi siempre sucede, se es conservador al rechazar aquellos reactivos cuyas correlaciones con la calificacin total no alcanza el nivel de significancia estadstica de 0.05 Qu sucede si habiendo empleado la "crema y nata" de los reactivos (los que tuvieron las correlaciones reactivo-calificacin total ms alta y que fueran estadsticamente significativas con una p=0.05) no se alcanz la confiabilidad preestablecida como deseable (r = 0.80)? Pueden existir tres razones por las cuales sea difcil o imposible lograr una prueba o instrumento homogneo. La primera es que los reactivos provengan de un dominio donde las correlaciones entre los reactivos sean uniformemente bajas, y que slo se lograra tener una prueba confiable, con un gran nmero de reactivos. La segunda razn, es que el conjunto de reactivos sea factorialmente compleja, en cuyo caso existen conglomerados de reactivos que tienen correlaciones relativamente altas entre ellos, pero muy bajas con los miembros de otros conglomerados. La tercera razn se debe a que algunos reactivos tienen correlaciones relativamente altas unos con otros, y que otros reactivos tienen correlaciones cercanas a cero con todos los reactivos. Esta condicin se puede detectar cuando se observan los valores de las correlaciones de los reactivos, ordenados de mayor a menor. De repente, la magnitud de una correlacin de un reactivo disminuye bruscamente respecto al reactivo anterior. La tercera razn es fcilmente detectable, como se seala en el prrafo anterior. Las dos primeras, no lo son tanto. De hecho, se recomienda que si no se debe a la tercera causa el hecho de no alcanzar la confiabilidad deseada, se suponga que son algunas de las dos primeras. De ser as, se recomienda que se proceda a la construccin del instrumento por medio de un anlisis factorial (vase captulo VII, ms adelante).
4.3.2 Grupos Contrastados a) Comparacin con la Prueba t.- Otro procedimiento de anlisis de reactivos consiste en averiguar si los reactivos discriminan, individualmente entre aquellos sujetos que obtienen calificaciones totales altas y los que obtienen calificaciones totales bajas. En virtud de lo anterior es que se conoce al procedimiento de anlisis de reactivos como discriminacin entre grupos contrastados. En este caso, el primer paso consiste en obtener una calificacin total para todos los sujetos, y ordenarlos de puntajes ms altos a puntajes ms bajos. A continuacin se toma el 25% superior e inferior de los sujetos y se forman los grupos de contrastacin: grupo alto y grupo bajo. Cuando los reactivos son de opcin mltiple (tres o ms opciones) y stas han sido pesadas (arbitrariamente o empricamente), de manera que el puntaje ms alto corresponde a la opcin que indica una mayor posesin del atributo que se est midiendo (ej. ms conocimiento, ms favorabilidad hacia "x" objeto psicolgico, ms tradicionalismo, etc.) y el puntaje ms bajo corresponde a aquella opcin que indica una menor posesin del atributo en cuestin (conocimiento, actitud, tradicionalismo, etc.) se procede a efectuar una prueba "t" para cada uno de los reactivos, comparando al grupo alto con grupo bajo. (El procedimiento completo se presentar en el captulo VI del presente texto ms adelante). Una vez calculadas la t para todos y cada uno de los reactivos, se ordenan de mayor a menor, y se determina el nivel de significancia para cada una. Al igual que en el primer procedimiento de anlisis de reactivos visto (seccin 4.3.1), se eliminan aquellos reactivos que obtuvieron t que no alcanzaron un nivel de significancia de por lo menos p = 0.05. A continuacin, se escogen los primeros 30 reactivos, con las t ms altas, y se procede a determinar su consistencia interna, con una alfa de Cronbach. Si stos alcanzan la confiabilidad deseada (r = 0.80 o ms), termina el anlisis; si no, se procede a agregar los 10 5 reactivos siguientes (dependiendo del nivel de confiabilidad alcanzado: si muy bajo, se agregan 10; si es cercano a 0.80, se agregan 5, y as sucesivamente, hasta alcanzar el nivel de confiabilidad deseado. b) Comparacin con Chi Cuadrada. - En la seccin anterior se emple una prueba t para comparar a los grupos contrastados. Esta prueba compara medias de las respuestas de cada reactivo entre dos grupos: el alto y el bajo. La hiptesis implcita seala que el grupo alto responder en promedio con un puntaje ms alto en cada reactivo, que el grupo bajo, quien responder en promedio con puntajes ms bajos. Se estn comparando medias de respuesta de cada reactivo. Si el investigador desea comparar distribuciones de frecuencias de respuestas, puede emplear la prueba de Chi Cuadrada en forma semejante a la anterior. Es decir, despus de haber calificado a todos los sujetos y obtenido sus calificaciones totales, se ordenan de mayor a menor, y se sacan los dos grupos extremos: grupo alto (25%) y grupo bajo (25%). Pero ahora, en vez de comparar medias, se procede a comparar distribuciones de frecuencia con la prueba Chi Cuadrada para 2 muestras independientes. El procedimiento se lleva a cabo para todos y cada uno de los reactivos.
Reactivo 1. La mujer debe llegar virgen al matrimonio

ALTO Frecuencia TA = 3 A=2 TD = 1 35 10 5 50 BAJO Frecuencia 10 10 30 50
*Frecuencia de sujetos que contestan en cada opcin y en cada grupo: alto y bajo
45 20 35 100
La frmula de la Chi Cuadrada es la siguiente: x = (O - E) ______ E

2
con gl = (r-1)(k-1)
dnde: O = frecuencia observada E = frecuencia esperada Para una explicacin ms detallada de este procedimiento, se puede consultar a Siegel (1976). De esta manera, se ordenan los reactivos de acuerdo al tamao de Chi Cuadrada, de mayor a menor. Se desechan aquellos que obtienen valores p asociados mayores a 0.05. En este caso, se debe reunir un criterio ms: la distribucin de las frecuencias deben estar "encontrados". Es decir, las frecuencias ms altas deben estar en los extremos; en el extremo superior para el grupo alto, y en el extremo inferior para el grupo bajo, as como se presentan en el ejemplo anterior. De aqu en adelante, se procede de la misma manera. Se escogen los primeros reactivos que tienen altos valores de Chi Cuadrada, niveles de significancia iguales o menores a 0.05 y distribuciones de frecuencias "encontradas" o "cruzadas", y se les efecta la prueba de consistencia interna correspondiente. Si no se alcanza la confiabilidad deseada (r = 0.80), se agregan otros reactivos, se vuelve a calcular la consistencia interna, y as sucesivamente hasta alcanzar el valor de r = 0.80. 4.3.3 Formas de la Distribucin a) Distribucin Normal de Reactivos Individuales.- En este caso, se solicita un FRECUENCIES para cada reactivo, y se procede a observar en valores de SKEWNESS y el de KURTOSIS. Se recomienda que ambos valores sean lo ms cercano a 0.0 que se pueda. Desgraciadamente no se cuenta con un criterio estadstico externo que seale qu tanto se pueden alejar en valores de Skewness y Kurtosis del 0.0 sin perder la normalidad la distribucin. Debido a esto, lo que se hace por lo general, es observar estos dos valores (Skewness y Kurtosis ) en todos los reactivos, y eliminar aquellos que se disparan. Es decir, en trminos generales, estos valores son bastante homogneos para un conjunto dado de reactivos, y as, cualquier reactivo que se aleje de los valores ms o menos semejantes de la mayora de los reactivos, quedaran eliminados. b) Otro criterio que se puede emplear para asegurar la normalidad de la distribucin de las respuestas a los reactivos individuales, es el considerar en el FRECUENCIES tambin, que ningn reactivo tenga 50% ms de las respuestas en una sola opcin de respuesta. Este criterio puede tomarse aisladamente, o en conjuncin con el antes mencionado (valores cercanos a 0.0 en Skewness y Kurtosis).
En ambos casos, se est tratando de tener reactivos que tengan una distribucin normal, vistos individualmente. 4.4 Instrucciones, Calificacin, y Opciones de Respuesta en Relacin con el Nivel de Medicin 4.4.1 Nivel de Medicin de los Reactivos Individuales.- Algunos cientficos sociales, como los socilogos por ejemplo, emplean a un slo reactivo o indicador, como ndice de algn atributo. En este caso es pertinente conocer el nivel de medicin que se est obteniendo al hacer uso de este procedimiento; es entonces pertinente sealar los niveles de medicin de los diferentes tipos de reactivos existentes. a) Preguntas abiertas: en este caso el nivel de medicin depende del anlisis de contenido que se emplee para las respuestas que la pregunta arroja. Por lo general, las respuestas que se dan a las preguntas abiertas, no son sencillas, ni cortas, ni nicas; sino que constituyen ideas complejas, varias y muy amplias. Esto significa que de entrada, no se obtiene una respuesta nica sino varias, y por lo tanto, la forma de anlisis que escoja el investigador ser la que determine el nivel de medicin. Si el investigador decide escoger nicamente la primera idea completa que presente la respuesta, puede considerarse que la medicin es nominal, si stas respuestas conforman categoras descritas y excluyentes de anlisis. Si esta nica idea completa es juzgada como representando algn grado de atributo, se est midiendo en el nivel ordinal. Si el investigador decide analizar todas las ideas completas que la pregunta abierta produce (circunstancia ms frecuente), seguir midiendo a nivel nominal si emplea categoras discretas de respuesta. Si decide colocar a lo largo de un continuo una categora (de acuerdo a la frecuencia de apariciones de la tal categora para el sujeto i), ya est midiendo a nivel ordinal. Tambin est midiendo a nivel ordinal si la suma de la frecuencia de respuesta en una categora de respuesta se ha definido como indicando una mayor cantidad de atributo. Es decir, si se coloca al sujeto i a lo largo de un continuo de menos a ms de un atributo en funcin de la frecuencia de respuesta por categora, se le est ordenando y por lo tanto se est midiendo a nivel ordinal. La misma lgica se aplica a los reactivos de tipo Mtodo de Caso o Historias Libres. b) Preguntas dicotmicas: en este caso, las respuestas son del nivel nominal. c) Listas de chequeo, ordenacin de reactivos, de opcin mltiple, y escalas de clasificacin (de cualquier nmero de opciones mayor que dos) estn midiendo a nivel ordinal. d) Escalas grficas de clasificacin: al tener un origen o punto cero, arbitrariamente establecido (al centro o en alguno de los extremos) y al registrarse distancias, est midiendo a nivel intervalar. 4.4.2 Nivel de Medicin del Conjunto de Reactivos Por lo general, los cientistas sociales emplean ndices o instrumentos constituidos por varios reactivos, de manera tal que se logre medir el atributo en cuestin de manera confiable y vlida. a) El sistema de calificacin que usualmente se emplea al inicio de la elaboracin de los instrumentos es tal, que se califica con un peso o nmero mayor a la opcin de respuesta que indica que el sujeto tiene ms del atributo: ms conocimiento; ms favorabilidad en su actitud; ms
tolerancia; ms tradicionalismo; etc. Es decir, el pesaje inicial, arbitrario de las opciones de respuesta es tal, que se concede mayor puntaje o peso, a la opcin que indica una mayor posesin del atributo que se est pretendiendo medir. b) Nivel Ordinal.- Tomando en cuenta lo sealado anteriormente (a), y considerando que por lo general se suma a lo largo del conjunto de reactivos, sean estos dicotmicos, listas de chequeo, ordenacin de reactivos, de opcin mltiple, o escalas de clasificacin, se mide a nivel ordinal ya que se postula: a mayor puntaje, mayor posesin, del atributo, en todos los casos; especialmente en escalamiento de personas. c) Nivel Intervalar.- Este nivel se alcanza con aquellos procedimientos o modelos de medicin referidos al escalamiento de estmulos, como en el modelo de pares comparados o el de intervalos aparentemente iguales. Es decir, en aquellos casos en los que un conjunto de jueces o expertos, juzgan a los reactivos a lo largo de un continuo que posee un origen o cero arbitrariamente establecido, se est midiendo a nivel intervalar. Se mide a nivel intervalar tambin cuando los puntajes crudos obtenidos por medio de un instrumento se transforman a puntajes estandarizados: z, stens y stanines. El procedimiento ms conocido de los anteriores mencionados es el de transformar a puntajes z. La frmula que se emplea es la siguiente: z = X -X s dnde:
X = puntaje crudo obtenido por el Sujeto X = promedio de los puntajes del grupo s = desviacin estndar de los puntajes del grupo En el caso de tener un conjunto relativamente grande de reactivos (20 30), de dos o ms opciones de respuesta, que permitan la aparicin de un amplio rango de calificaciones posibles (tericamente) y de que se tenga una muestra relativamente grande (N = 100 o ms) de sujetos, la distribucin de calificaciones que se obtiene se aproxima bastante a una curva normal. Si esto es as, se puede considerar que el instrumento est midiendo o nivel intervalar, y tratarlo estadsticamente como tal. Se debe recordar que se mencion con antelacin, que la elaboracin de instrumentos es un caso de muestras grandes (tanto de reactivos como de sujetos), con objeto de probalizar hasta el mximo, que los supuestos de los diversos modelos de medicin que existen, se cumplan. Debe sealarse tambin, que los supuestos generales que subyacen a la construccin de un instrumento, cuando no se han especificado explcitamente, son, en general, los siguientes: a) Modelo lineal. Se suman los efectos de los reactivos individuales. b) Modelo dominio- muestra. Los reactivos son internamente consistentes y son una muestra representativa del dominio. c) Modelo de la Teora del error. Los errores de medicin son aleatorios y por lo tanto se anulan unos a otros.
4.4.3. Instrucciones Las instrucciones que se den a los sujetos que habrn de responder a las preguntas o reactivos del instrumento que se construya deben ser muy sencillas y claras. De preferencia debern de ir seguidas de uno o varios ejemplos, que permitan asegurarse que fueron comprendidas correctamente. Por lo general, las instrucciones dicen algo as: "Lea cuidadosamente cada pregunta y escoja una (slo una) de las opciones de respuesta que aparecen inmediatamente (abajo, a la derecha, etc.) de la pregunta; y mrquela con una "X". "Ordene de acuerdo a su preferencia, las ___________________ que aparecen a continuacin. Ponga el nmero 1 al que usted ms prefiera ( o compre con ms frecuencia, o conozca ms, haya visto anunciado ms veces); el nmero 2 al siguiente; y as sucesivamente hasta agotar todos los _________________ ( o hasta ordenar x nmero de elementos)". "Lea cuidadosamente cada pregunta y escoja (dos, tres, etc.) opciones de respuesta de entre las que aparecen inmediatamente (abajo, a la derecha, etc.) de la pregunta, marcndolas con una "X", con un crculo, con un subrayado, etc. 4.5 Piloteo del Instrumento: Funciones El piloteo del instrumento consiste de dos fases. En la primera fase se aplica el instrumento inicial a unas 20 30 personas, semejantes a la muestra o poblacin para la que se desea construir el instrumento. Los objetivos de esta primera fase, son los siguientes: a) asegurar que el vocabulario y la sintaxis son las adecuadas. Es decir, que los sujetos entienden lo que se les pide que hagan y contesten. b) asegurar la correcta comprensin de las instrucciones; determinar si no se requieren prrafos introductorios (sobre todo en instrumentos que miden diversos atributos), determinar si la secuencia y la dependencia de las preguntas es correcta ( si contesta X pase a la pregunta ________________). c) cerrar preguntas abiertas, y determinar si las preguntas cerradas (con opciones) no presentan muchas respuestas en la opcin: otros d) establecer una primera aproximacin respecto al tiempo que se llevar la aplicacin del instrumento final. Se recomienda que el instrumento no tome ms de 15 a 30 minutos, si es homogneo, y no ms de 1 hora con 30 minutos si es heterogneo. e) determinar si se requiere entrenar de manera especial a los aplicadores o si es tan sencillo que cualquiera lo puede aplicar. f) averiguar si la secuencia de las preguntas (sobre todo en los instrumentos heterogneos) es la adecuada. g) detectar reactivos que son respondidos de la misma manera por todos los sujetos, o por nadie, para as eliminarlos. h) solicitar sugerencias a los sujetos a los que se les aplic el instrumento. (Ejemplo: Tiene usted algo ms que agregar?)
i) afinar y corregir el instrumento. Durante la segunda fase, se incrementa la muestra hasta tener el nmero mnimo de sujetos recomendando (5 sujetos por cada reactivo) y se tienen dos objetivos fundamentales: a) llevar a cabo el anlisis de reactivos ( empleando cualquiera de los procedimientos sealados en la seccin 4.3 o alguna combinacin de ellos). b) determinar la confiabilidad y validez del instrumento (vase captulos VI y VIII). 4.6 1. 2. 3. 4. 5. 6. 7. 8. 4.7 Gua de Estudio Seale los objetivos bsicos del diseo de un instrumento. Distinga entre reactivos de identificacin, factuales y del objeto de estudio. Ejemplique cada uno de los siguientes tipos de preguntas: historia libre, preguntas dicotmicas, lista de chequeo, ordenacin de reactivos, reactivos de opcin mltiple. Sugiera algunos criterios para la elaboracin o fraseo de las preguntas. Seale la relacin que existe entre el nmero de reactivos y el de Sujetos, en el proceso de construccin de un instrumento. Indique las funciones que tiene el llevar a cabo el anlisis de reactivos. Seale los tres tipos de anlisis de reactivos que existen. Seale las funciones de piloteo del instrumento. Autoevaluacin
4.7.1 Preguntas 1. 2. 3. 4. 5. 6. Cules son las funciones de las preguntas de identificacin, factuales y del objeto de estudio en un instrumento de medicin? Cul es la secuencia ms adecuada para los diferentes tipos de reactivos, en lo que se refiere a su generalidad-especificidad; contenido o tpico, dificultad-facilidad? Cul es el nmero mnimo e ideal por reactivo? Cul es el mtodo de anlisis de reactivos ms adecuado? Cules son las funciones principales del piloteo del instrumento? Qu caractersticas deben tener las instrucciones para los Sujetos que habrn de contestar un instrumento?
4.7.2 Respuestas 1. La funcin de las preguntas de identificacin se refiere a asegurar que en caso necesario se pueda pedir al encuestador informacin adicional sobre el encestado, que se pueda regresar a donde se encuentra el encestado y se le pida ampliacin en la informacin, o dar alguna que haya quedado incompleta, etc. La funcin de las preguntas factuales e refiere a caracterizar a la muestra de investigacin, por un lado; y por otro, que algunas de las preguntas de este tipo pueden ser utilizadas como terceras variables o factores de prueba, para elaborar el proceso de investigacin, con objeto de determinar la existencia de variables extraas, componentes, antecedentes, interventoras, distorcionadoras y supresoras.
La funcin de las preguntas relacionadas con el objeto de estudio se refiere a la posibilidad de poner a prueba alguna hiptesis, si el estudio es confirmatorio; el de averiguar algo sobre el fenmeno, si el estudio es exploratorio; el de describir el comportamiento de algn fenmeno, si el estudio era descriptivo. 2. Las preguntas se deben ordenar en una secuencia que vaya de lo ms general a lo particular, de lo fcil a lo difcil, y de lo que no causa molestia o vergenza a lo que s lo hace, en el sentido de que es necesario establecer un buen rapport con el encuestado, antes de asegurar respuestas honestas a tpicos escabrosos o probablemente molestos para l. 3. El nmero mnimo de sujetos por reactivo es de cinco por cada uno; el ideal es de diez por cada reactivo. 4. El mtodo de anlisis de reactivos ms adecuado depende de la preferencia del investigador, de sus posibilidades en cuanto a uso de programas, tiempo de mquina y costos. Para aquellos que no cuentan con un adecuado equipo de cmputo, programas y dinero, quiz el mas adecuado sea el de la distribucin de frecuencias en trminos de porcentajes de respuesta por cada opcin de respuesta de los reactivos del instrumento. Para aquellos que cuentan con todo lo necesario, quiz lo ms pertinente sea emplear alguna combinacin de los mtodos de anlisis. De cualquier manera, el investigador es el que decide, siempre de manera fundamentada. 5. Las funciones del piloteo del instrumento son de dos tipos: depurar el lenguaje, vocabulario, y parafraseo de preguntas, as como eliminar aquellas que no discriminan por un lado, y por el otro: determinar sus caractersticas psicomtricas en lo que a validez y confiabilidad se refiere. 6. Las instrucciones deben ser claras, precisas: de preferencia deben ir seguidas de ejemplos. Deben requerir el mnimo esfuerzo por parte del Sujeto, para responder al instrumento. Deben ser tantas como sea necesario, con objeto de que el respondiente sepa siempre, qu hacer.
V. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE REACTIVOS O ESTMULOS En el Captulo II se seal que entre los modelos de escalamiento de estmulos o reactivos, se encontraban principalmente los modelos subjetivos y los modelos discriminativos. Veremos a continuacin un ejemplo de cada uno de ellos. 5.1 Modelos Discriminativos Los modelos discriminativos estn basados en la ley del juicio comparativo. Esta ley se refiere a un conjunto de ecuaciones que relacionan la proporcin de veces que un estmulo dado se juzga como mayor en un atributo dado que otro estmulo, a los valores escalaraes y dispersiones discriminativas de los dos estmulos sobre el continuo psicolgico. Se toma como dado, a un conjunto de estmulos a los que el sujeto puede responder en forma diferencial respecto a algn atributo. La tarea consiste en localizar a estos estmulos a lo largo de un continuo psicolgico en forma tal que se puedan explicar las respuestas dadas por el observador. El continuo psicolgico puede considerarse como un continuo de magnitudes subjetivas o psicolgicas. Cada magnitud psicolgica est mediada por un "proceso discriminativo". As, cada proceso discriminativo tiene un valor en el continuo psicolgico. El proceso discriminativo se define como el proceso por medio del cual el organismo identifica, distingue o reacciona ante los estmulos. Debe hacerse notar que la definicin no implica absolutamente nada que tenga que ver con la naturaleza fisiolgica o experiencial del proceso. Cada estmulo, cuando presentado al observador, da origen a un proceso discriminativo. Debido a fluctuaciones momentneas del organismo, un estmulo dado no siempre excita el mismo proceso discriminativo, sino que puede excitar uno con un valor ms alto o ms bajo en el continuo psicolgico. Como resultado, en vez de tener un proceso discriminativo nico asociado siempre a un estmulo dado, se tiene a un nmero de procesos discriminativos que pueden estar asociados a l. Si se presenta el estmulo al observador un gran nmero de veces, se puede pensar en una distribucin de frecuencias de los procesos discriminativos sobre el continuo psicolgico, asociada a ese estmulo. Se postula que la distribucin de frecuencias con las que los procesos discriminativos se asocian a un estmulo dado, forman una distribucin normal sobre el continuo psicolgico. El proceso discriminativo ms frecuentemente asociado con un estmulo dado se denomina proceso modal discriminativo. El valor escalar del estmulo sobre el continuo psicolgico es tomado como el valor de su proceso modal discriminativo. Como en una distribucin normal coinciden el modo, la mediana y la media, el valor escalar del estmulo tambin puede considerarse como el valor de la media o la mediana del proceso discriminativo asociado al mismo. La desviacin estndar de la distribucin asociada con un estmulo dado se denomina dispersin discriminativa de este estmulo. Las dispersiones discriminativas, as como los valores escalares pueden ser diferentes para los diferentes estmulos. De esta manera, el modelo postula un continuo psicolgico sobre el cual los valores de los procesos discriminativos asociados a cada estmulo forman una distribucin normal. El valor escalar de cada estmulo queda definido como el valor del proceso modal asociado al mismo. As, el valor escalar del estmulo 1 es S1; el del estmulo 2 es S2, y as sucesivamente. Cada estmulo tambin, queda caracterizado por su dispersin discriminativa. Las dispersiones discriminativas de los diferentes estmulos no son necesariamente todas iguales.
El observador no puede reportar en forma directa el valor del proceso discriminativo sobre el continuo psicolgico. Por lo tanto, no se puede obtener directamente del observador, la distribucin de frecuencias asociada a un estmulo. Siempre se deber escalar a los estmulos en forma indirecta. Sin embargo, se pueden deducir ecuaciones que relacionan a los juicios de las relaciones entre los estmulos (que el observador o juez puede hacer) a los valores escalares y dispersiones de los estmulos sobre el continuo psicolgico. Se puede entonces acudir a estas ecuaciones para estimar los valores escalares y dispersiones de los estmulos. Por ltimo, se puede poner a prueba el modelo determinando la bondad de ajuste de los datos observados respecto a la teora. A un conjunto de estas ecuaciones se le conoce con el nombre de ley del juicio comparativo. Los postulados resumidos de esta ley son: 1. Cada estmulo, cuando se le presenta a un observador o juez, da origen a un proceso determinado, que tiene algn valor en el continuo psicolgico de inters. 2. Debido a fluctuaciones momentneas del organismo, un estmulo dado no siempre excita al mismo proceso discriminativo, sino puede excitar uno con un valor ms alto o ms bajo en el continuo. Cualquier estmulo presentado a un observador o juez un gran nmero de veces, generar una distribucin de frecuencias de procesos discriminativos asociados a ese estmulo. Se postula que los valores del proceso discriminativo son tales que la distribucin de frecuencia sobre el continuo es normal. De esta manera, cada estmulo se asocia con una distribucin normal del proceso discriminativo. 3. La media y la desviacin estndar asociada a un estmulo, se toman como su valor escalar y dispersin discriminativa, respectivamente. Considrense las distribuciones tericas de los procesos discriminativos para cualquiera dos estmulos j y k como se ilustra en la Figura 5.1 Se dijo que Sj y Sk corresponden a los valores escalares de los dos estmulos, y sj y sk a sus dispersiones discriminativas. Si los dos estmulos se presentaran juntos al observador o juez, cada uno excitara un proceso discriminativo: dj y dk. La diferencia entre los procesos discriminativos (dk y dj) para cualquier presentacin nica de un par de estmulos se denomina diferencia discriminativa. Si los dos estmulos fueran presentados juntos un gran nmero de veces, las diferencias discriminativas en s mismas formaran una distribucin normal sobre el continuo psicolgico. La media de esta distribucin es igual a la diferencia de los valores escalares de los dos estmulos, ya que la diferencia entre medias es igual a la media de las diferencias. De la misma manera, se sabe que la desviacin estndar de las diferencias: sdk-dj = ( sj2 + sk2 - 2rjksjsk)1/2 (5.1)
dnde rjk es la correlacin entre los valores momentneos de los procesos discriminativos asociados a los estmulos j y k. Figura 5.1 Distribuciones de los procesos discriminativos asociados con los estmulos j y k sobre el continuo psicolgico Cada vez que los estmulos se presentan a un observador o juez, se le pide que juzgue cual es ms alto o mayor en el continuo psicolgico (por ejemplo: cul es ms fuerte, ms pesado o ms bello). Se asume que el juicio "el estmulo k es mayor que el estmulo j "ocurre cuando el proceso
discriminativo del estmulo k es mayor que el del estmulo j. Es decir, cuando la diferencia discriminativa (dk - dj) es positiva. Cuando esta diferencia discriminativa es negativa, se obtendr el juicio "el estmulo j es mayor que el estmulo k". Cuando las dos distribuciones se traslapan, como sucede en la Figura 5.2, es posible que la diferencia discriminativa para cualquier ensayo particular sea negativo aunque el valor escalar Sk es mayor que el Sj. Se puede determinar la proporcin de veces que el estmulo k es juzgado mayor que el j a partir de un gran nmero de juicios. Figura 5.2 Distribucin de las diferencias discriminativas sobre el estmulo psicolgico. En la Figura 5.2 se ilustra la distribucin de las diferencias discriminativas sobre el continuo psicolgico. La porcin sombreada a la derecha del punto cero corresponde a la proporcin de veces que (dk - dj) es positiva, y por lo tanto, a la proporcin de veces que el estmulo k es juzgado mayor que el estmulo j. La parte no sombreada a la izquierda del cero corresponde a la proporcin de veces que (dk - dj) es negativa, o la proporcin de veces que el estmulo j es juzgado mayor que el estmulo k. La media de la distribucin es igual a la diferencia en los valores escalares de los dos estmulos (Sk - Sj). A partir de la proporcin terica de veces que el estmulo k es juzgado mayor que el estmulo j, se puede determinar la diferencia (Sk - Sj), a partir de una tabla de las reas bajo la curva normal unitaria. Esta diferencia se llama zjk y se mide en unidades sdk-dj, por lo que se puede escribir la ecuacin: Sk - Sj = zjksdk-dj (5.2)
Como se conoce la relacin entre la desviacin estndar de las diferencias y las dispersiones discriminativas de los dos estmulos (ecuacin 5.1), se puede escribir: Sk -Sj = zjk(sj + sk - 2rjksjsk
2 2
(5.3)
Esta ecuacin (5.3) es la forma completa de la ley del juicio comparativo, dnde Sj, Sk = valores escalares de los estmulos j y k. sj, sk= dispersiones discriminativas de los estmulos j y k. rjk = correlacin entre los pares de procesos discriminativos dj y dk zjk = desviacin normal correspondiente a la proporcin terica de veces que el estmulo k es juzgado mayor que el estmulo j. La ley del juicio comparativo no se puede resolver en su forma completa, puesto que independientemente del nmero de estmulos, siempre existirn ms valores desconocidos que conocidos. Para poder llegar a un conjunto de ecuaciones manejables, es necesario especificar restricciones adicionales. La primera se refiere a asumir que las desviaciones estndar son todas iguales. Si en general sj = sk = s, entonces se tiene, habiendo despejado la frmula (5.3) en trminos de zjk: zjk = Sk - Sj / sj2 + sk - 2rjksjsk = (Sk - Sj) / 2s2 - 2rjks2 = (Sk - Sj) / 2s2 ( 1 - rkj) (5.4)
La segunda se refiere a suponer que las intercorrelaciones son todas iguales unas a otras y entonces se puede escribir:
zjk =(Sj - Sk)/ 2s2 ( 1 - r)
(5.5)
2
De acuerdo a las suposiciones hechas hasta ahora 2s (1-r) es un valor constante para todos y cada uno de los pares de afirmaciones que se comparen y por lo tanto, se puede plantear que esa constante sea igual a la unidad, de tal manera que se puede escribir ahora: zjk = Sk - Sj 5.1.1 Mtodo de Pares Comparados (PC) La ley del juicio comparativo supone que cada estmulo ha sido comparado con todos y cada uno de los dems un gran nmero de veces. Esta ley requiere que se disponga de datos en la forma de "proporcin de veces que cualquier estmulo k es juzgado como mayor que cualquier otro estmulo j". Al mtodo directo para obtener las estimaciones empricas de estas proporciones se conoce como mtodo de pares comparados. El mtodo de pares comparados es esencialmente una generalizacin del caso de dos categoras del mtodo de los estmulos constantes de la Psicofsica. En el mtodo de los estmulos constantes, cada estmulo se compara con un estndar nico. En pares comparados, cada estmulo sirve a su vez como el estndar. Cada estmulo se compara con todos y cada uno de los dems. Por lo tanto, con n estmulos, se tienen n(n-1)/2 pares. Cada par se presenta al observador o sujeto, cuya tarea es indicar cual miembro del par parece ser mayor (ms pesado, ms brillante, ms fuerte, etc.) respecto al atributo que se va a escalar. El sujeto (observador o juez) debe designar a un miembro del par como mayor; no se permiten juicios de igualdad. En la forma comn del mtodo de pares comparados, un estmulo no se compara contra s mismo (o con un estmulo idntico); se supone que si se obtuvieran estos juicios, se obtendra como resultado proporciones de 0.50. No existe ninguna previsin explcita referida a los errores de espacio o de tiempo en la ley del juicio comparativo ni tampoco respecto a cambios en la ejecucin debido a los efectos de la fatiga o prctica, o respecto a juicios basados en parte a otros factores que aquellos relativos a las magnitudes de los procesos discriminativos. En consecuencia, es necesario controlar experimentalmente las condiciones que pudieran introducir estos efectos de sesgo. La mayora de estos factores pueden controlarse por medio de la asignacin de las posiciones relativas (espaciales o temporales) de los miembros de cada par de estmulos y el orden de presentacin de los mismos pares. Un mtodo adecuado es aleatorizar las posiciones relativas y los rdenes de presentacin. Otro mtodo eficiente es el de contrabalanceo (la mitad de las veces, un estmulo dado aparece primero en el par, la otra mitad aparece en segundo lugar). Los efectos de la prctica o la fatiga se controlan invirtiendo el orden de presentacin de los pares en la mitad de los sujetos (o ensayos). Precauciones adicionales podran ser las siguientes: a) mantener a aquellos pares que tienen un estmulo en comn, lo ms separados uno de otro en el orden de presentacin; b) arreglar los pares de tal manera que las respuestas "correctas" estn aproximadamente divididas entre el primer y el segundo miembro de los pares; c) arreglar los pares de tal manera que no exista algn patrn sistemtico detectable de respuestas "correctas"; d) arreglar los pares para que no exista una variacin sistemtica en la dificultad del juicio; e) en el caso de varias presentaciones a los mismos sujetos, variar el orden de presentacin de un ensayo al siguiente para eliminar el aprendizaje seriado o la aparicin de patrones de respuesta. 5.1.1.1 Definicin del Atributo o Variable. (5.6)
Para iniciar la construccin de un instrumento de medicin basado en la ley del juicio comparativo por medio del mtodo de pares comparados, se debe recordar que se trata de una variable homognea o monodimensional. Lo primero que deber hacerse es definir la variable o atributo, tomando en cuenta las consideraciones sealadas en los dos ltimos apartados de la seccin I. 5.1.1.2 Elaboracin de los Reactivos. El siguiente paso es el de elaborar los reactivos o indicadores de la variable o atributo. En este caso debern tomarse en cuenta las recomendaciones sealadas en el primer apartado de la seccin IV. Para este mtodo en particular, se recomienda no emplear ms de siete u ocho indicadores, ya que el procedimiento de enjuiciamiento implica realizar n(n-1)/2 comparaciones o juicios. En la medida en que se incrementa el nmero de reactivos, el nmero de comparaciones a realizar incrementa muchsimo, y la calidad de los juicios de los jueces, desmejora, ya sea por fatiga, o por aburrimiento. 5.1.1.3 Seleccin de los Jueces Los sujetos, observadores o jueces que toman parte en la construccin del instrumento, pueden ser de dos tipos: expertos, y comunes. Los primeros son individuos reconocidos como expertos en el tema, variable o atributo para el cual se va a construir el instrumento. Los segundos, son individuos que comparten las caractersticas ms importantes de los miembros de la muestra que ser objeto de estudio o a la cual se le va a aplicar el instrumento que se pretende construir. En el caso de emplear expertos como jueces, ser suficiente contar con 20 o 25 de ellos. En el caso de emplear jueces comunes se recomienda emplear entre 50 y 100. 5.1.1.4 Instrucciones para los Jueces. Una vez ordenados y arreglados los pares de reactivos, tomando en cuenta las recomendaciones del apartado 5.1.1 de esta misma seccin, se les pide a los jueces que marquen subrayando, o con una "X" cual de los miembros de cada par de afirmaciones representa una mayor cantidad del atributo en cuestin (ansiedad, dependencia, por ejemplo) o el ms favorable hacia un objeto psicolgico (en el caso de estar construyendo una escala de actitud). Se les recuerda que no pueden emitir juicios de igualdad. Se ponen ejemplos referidos a otros atributos, para asegurar que se entiendan las instrucciones. 5.1.2 Procedimientos Empricos. Habiendo presentado n(n - 1)/2 pares de afirmaciones al grupo de jueces, los datos obtenidos consisten en las frecuencias correspondientes al nmero de veces que cada estmulo (o reactivo, afirmacin, o indicador) fue juzgado como mayor (o ms favorable) que cada uno de los dems estmulos (reactivos, afirmaciones o indicadores). La Tabla 5.1 ilustra el arreglo esquemtico de las frecuencias en el que las entradas de las celdillas corresponde a la frecuencia con la que cada estmulo (reactivo, afirmacin indicador) de la columna fue juzgado como mayor (o ms favorable) que el estmulo de la hilera.
De esta manera, la entrada en la celdilla f13 significa el nmero de veces que el estmulo 1 fue juzgado como mayor ( ms favorable) que el estmulo 3, y as sucesivamente. El primer subndice siempre corresponder al estmulo de la columna, y el segundo, al estmulo de la hilera. TABLA 5.1. Representacin esquemtica de la matriz F que proporciona la frecuencia con la que el estmulo de la columna fue juzgado como mayor o ms favorable que el estmulo de la hilera. Estmulos 1 2 3 j k 1 f11 f12 f13 f1j f1k 2 f21 f22 f23 f2j f2k 3 f31 f32 f33 f3j f3k j fj1 fj1 fj3 fjj fjk k fk1 fk2 fk3 fkj fkk
Se permite que N sea el nmero total de jueces o sujetos que efectan los juicios. Aunque en la realidad no se obtienen juicios comparativos de cada estmulo contra s mismo (elementos de la diagonal de la matriz f11, f22, etc.) se supone, que de haberse llevado a cabo, las entradas en las celdillas seran iguales de N/2. Tambin se debe observar que la entrada (o dato) de la celdilla f13 es igual N - f13; en general, fji = N - fij Si cada uno de los datos (entradas) de la tabla 5.1 se divide entre N, se obtienen las entradas pij presentadas en la Tabla 5.2. Los datos en las celdillas de esta tabla sealan la proporcin de veces que el estmulo de la columna fue juzgado como mayor (o ms favorable) que el estmulo de la hilera. La frmula general para obtencin de las entradas es la siguiente: 1 pij = ----- fij N pji = 1 - pij (5.7) (5.8)
TABLA 5.2. Representacin esquemtica de la matriz P mostrando la proporcin de veces que los estmulos de la columna fueron juzgados como mayores (o ms favorables) que los de la hilera Estmulos 1 2 3 j k 1 p11 p21 p31 pjl pk1 2 3 j p12 p13 plj p22 p23 p2j p32 p33 p3j pj2 pj3 pjj pk2 pk3 pkj
k plk p2k p3k pjk pkk pij Antes de continuar con el siguiente paso, deber efectuarse una suma de pij para cada columna de la matriz p (tabla 5.2), con objeto de asegurarse que los reactivos (o estmulos) estn en el orden correcto (el ms pequeo o el menos favorable a la izquierda, y el mayor o ms favorable a la derecha). Si las sumas de las columnas van de menor a mayor los estmulos estn bien ordenados (numerados). En caso de no darse esta situacin debern reordenarse tanto las hileras como las columnas, para obtener la ordenacin adecuada. Una vez que la matriz P haya sido reordenada (casi siempre se tiene que hacer), se procede a formar los valores pij en valores expresados en unidades de desviacin estndar: zij. Esto se logra consultando una Tabla de desviaciones normales Z correspondientes a las proporciones P de una distribucin normal unitaria dicotomizada. Se busca en esta tabla, el valor Z que le corresponde a cada pij y se forma una Tabla como la 5.3. Tabla 5.3. Representacin esquemtica de la matriz Z mostrando las desviaciones normales correspondientes a las proporciones mostradas en la Tabla 5.2
Estmulos 1 2 3 j k ________________________________ 1 2 3 Z11 Z21 Z31 Zj1 Zj2 Zj3 Zk1 Zk2 Zk3
Z12 Z22 Z32 Z13 Z23 Z33
j Z1j Z2j Z3j Zjj Zkj Suma Media M+k
Debe hacerse notar, que los valores que aparecen en la columna 1, son iguales que los que aparecen en la hilera 1, pero de signo opuesto. Esto significa, que basta con obtener los valores de las columnas por encima de la diagonal, y automticamente se obtienen los de las hileras correspondientes debajo de la diagonal, que son los mismos de sus columnas correspondientes, pero con signo opuesto. En la diagonal de la matriz F (Tabla 5.1), aparecen frecuencias iguales a N/2; en la diagonal de la matriz P (Tabla 5.2), aparecen proporciones de 0.500; en la diagonal de la matriz Z (Tabla 5.3), aparecen desviaciones normales iguales a 0.000. El siguiente paso consiste en obtener el continuo psicolgico de la variable o atributo en cuestin. Para hacerlo, se procede de la siguiente manera. En la Tabla 5.3 (Matriz Z), se indica en la antepenltima hilera de la misma que habrn de sumarse las entradas de cada columna. Se debe tener en cuenta que la suma que se realiza es algebraica puesto que los valores de la matriz tienen en las diferentes celdillas, cantidades positivas y negativas Posteriormente se sacan las medias de cada columna, dividiendo la suma obtenida entre el nmero de estmulos de la columna Por ltimo, con objeto de hacer desaparecer los signos negativos asociados a las medias calculadas, y con el propsito tambin de establecer un origen o punto cero, a la izquierda del continuo, se suman a todas y cada una de las medias obtenidas, el valor de la media negativa mayor, como una constante (k). De esta manera, la primera afirmacin (estmulo o indicador) seala el origen del continuo, el cual termina con el ltimo estmulo o reactivo. El valor asociado a cada estmulo es su valor escalar; ste estaba inicialmente (antes de sumar la constante) expresado en unidades de desviacin estndar o normal. Por lo tanto una escala obtenida con este mtodo pertenece al nivel intervalar de medicin y se le puede, consecuentemente, aplicar las estadsticas apropiadas a este nivel. Se debe aclarar que en esta seccin se present el modelo del caso V de datos completos. Existen otros casos (del I al IV), y condiciones de datos incompletos. Si se desea utilizar algn otro caso, se puede consultar a Edwards (1957) y a Torgerson (1967). 5.1.1.5 Escala Final. Instrucciones de Respuesta y Calificacin. De esta manera, el instrumento queda constituido por un conjunto de seis a ocho indicadores, reactivos o afirmaciones. Cada una de ellas ocupa un lugar a lo largo del continuo psicolgico Los valores ms pequeos representan menores cantidades de atributo (o actitudes ms desfavorables o menos favorables), y los valores ms altos representan mayores cantidades de atributo. Para aplicar el instrumento final a la muestra que se va a estudiar se colocan estas afirmaciones o reactivos en una hoja de papel; en un orden aleatorio, que no corresponda al de sus valores escalares. Las instrucciones que se le dan a los sujetos de investigacin son las siguientes: "Lea cuidadosamente las siguientes frases, (oraciones o afirmaciones), y escoja de entre ellas la que mejor lo describa (mejor se aplique a usted; mejor representa su opinin, es ms caracterstica de usted; es ms comn para usted) marcndola con una "X" (subrayndola, etc.). Si no puede decidirse por una sola, escoja dos o tres como mximo. Muchas gracias". El procedimiento de calificacin puede llevarse a cabo de diversas maneras. La primera se denomina el mtodo de la media. Este mtodo consiste en obtener la media de los valores
escalares de los reactivos escogidos por los sujetos. Si slo se escogi un reactivo, el valor escalar que le corresponde es la calificacin que obtiene el sujeto. El segundo se conoce como el mtodo de la mediana. En este caso, si el nmero de afirmaciones escogidas por el sujeto fue impar, se ordenan los valores escalares de las afirmaciones y se escoge el valor que divide en dos partes iguales a la distribucin de valores escalares. Es decir, la calificacin del sujeto es la mediana de la distribucin de los valores escalares de las afirmaciones o reactivos escogidos por l. Si el nmero de afirmaciones fue par, se saca el punto medio de los valores escalares del par de afirmaciones del centro de la distribucin. Es decir, al valor escalar mayor de este par central, se le resta el valor escalar menor del otro miembro del par; esta diferencia se divide entre dos y el resultado se agrega al valor escalar menor del par central de afirmaciones, o se resta del valor escalar mayor del par central, de afirmaciones. En cualquier caso, esta es la calificacin que obtiene el sujeto. 5.2 Estimaciones Subjetivas El modelo de estimaciones subjetivas est basado en la ley del juicio categrico. Esta ley se refiere a un conjunto de ecuaciones que relacionan a los parmetros de los estmulos y los lmites de las categoras, a un conjunto de proporciones acumuladas derivadas de la proporcin de veces que cada estmulo es juzgado como encontrndose en cada categora de un conjunto de ellas, que se ordenan respecto a un atributo dado. Esta ley, al igual que la del juicio comparativo, se basa en el modelo general de enjuiciamiento de Thurstone, que se vio en la seccin 5.1. Para derivar la ley del juicio categrico, adicionamos y reemplazamos las suposiciones presentadas en la seccin 5.1 con las siguientes: 1. El continuo psicolgico del sujeto se puede dividir entre un nmero especfico de pasos o categoras ordenadas. 2. Debido a varios y diversos factores, el lmite de una categora dada, no necesariamente se localiza en un punto particular del continuo. Sino que tambin proyecta una distribucin normal de posiciones sobre el continuo. Igualmente, los diferentes lmites de las categoras pueden tener diferentes localizaciones medias y diferentes dispersiones. 3. El sujeto juzga a un estmulo dado como encontrndose por debajo de un lmite de categora dado, siempre que el valor del estmulo sobre el continuo sea menor que el del lmite de esa categora. Esencialmente lo anterior se refiere a la suposicin de que los lmites entre las categoras adyacentes se comportan igual que los estmulos. La ecuacin inicial y completa de la ley del juicio categrico es la siguiente: tg - sj = zjg(2j+2g- 2rjgjg)(5.9) dnde: m + 1 = nmero de categoras tg=localizacin media del gavo lmite de categora
g = dispersin del g lmite de categora rjg = correlacin entre posiciones momentneas del estmulo j y el lmite de la categora g. zgj = unidad de desviacin normal que corresponde a la proporcin de veces que el estmulo j es clasificado por debajo del lmite de g. Igual que en el caso de la ley del juicio comparativo, esta ley no se puede resolver en su forma completa, y por lo tanto, es tambin necesario especificar restricciones adicionales, paralelas a las planteadas en la ley del juicio comparativo. Mencionaremos a estas tan solo brevemente. La primera seala que el trmino de covarianza de la ecuacin (5.8) es constante para todos los valores de j y g; la segunda indica que g es constante para todos los valores de g y j es constante para todos los estmulos j desapareciendo, por lo tanto, el trmino de correlacin de la ecuacin (5.8) y queda entonces simplificada de la siguiente manera: tg - sj = zjgc (5.10)
avo
5.2.1 Mtodo de Intervalos Aparentemente Iguales (IAI) La ley del juicio categrico se desarroll para el caso en el que los estmulos han sido colocados dentro de categoras ordenadas respecto al atributo que est siendo investigado. En particular, supone que se conoce la proporcin de veces que cada estmulo fue clasificado por debajo de cada lmite de las categoras La forma ms comn de obtener la estimacin de estas proporciones consiste en presentar a un grupo de jueces, el conjunto de estmulos; el juez deber clasificar a cada estmulo dentro de alguna de las categoras establecidas por el investigador. En este caso, para evitar los efectos de fatiga y/o aburrimiento, se recomienda que los estmulos se contrabalanceen en cuanto a su favorabilidad o desfavorabilidad hacia el objeto psicolgico en cuestin, as como en lo que se refiere a las etiquetas adjetivales asociadas a los extremos del continuo actitudinal. Esto a su vez, evitara en la medida de lo posible, la aparicin de patrones de respuesta por parte de los jueces. 5.2.1.1 Definicin del Atributo o Variable En este caso, remitimos al lector a la seccin 5.1.1.1. de este mismo apartado. 5.2.1.2 Elaboracin de los Reactivos En este caso, tambin remitimos al lector a la seccin 5.1.1.2. Sin embargo, para este mtodo en particular, se recomienda elaborar entre 70 y 90 reactivos, siendo una mitad de los mismos favorables, en diversos grados, al objeto psicolgico, y la otra mitad, desfavorables, tambin en diversos grados, al susodicho objeto psicolgico. Debe tenerse en cuenta que por medio de este mtodo se pretende encontrar 20 o 25 reactivos, que cubran el continuo psicolgico en su totalidad, con ciertos requisitos, que se especificarn ms adelante. Es por esta razn, que se inicia la elaboracin del instrumento, con un nmero mayor de reactivos. Se debe contar con un lote lo suficientemente grande, como para permitir desechar todos aquellos reactivos que no cumplan con los requisitos estipulados por el mtodo, y que an as, se puedan conservar por lo menos 20 25 de ellos que s lo hagan.
5.2.1.3 Seleccin de los Jueces Se remite al lector a la seccin 5.1.1.3. Existe adems un procedimiento emprico a posteriori, para eliminar a los malos jueces. Como se seal anteriormente (5.2.1.2.), se inicia el trabajo de elaboracin del instrumento con 70 o 90 reactivos, que supuestamente cubren la totalidad del continuo psicolgico. Es decir, si el continuo cuenta con 11 intervalos de respuesta, el investigador elabor entre siete y nueve reactivos para cada intervalo. Si despus de que los jueces terminaron su proceso de enjuiciamiento, nos encontramos que algunos de ellos colocaron al 30% de los reactivos en un slo intervalo, se puede inferir que el juez fue descuidado en la tarea de enjuiciamiento, ya que esto implica que coloc entre 21 y 27 reactivos como localizados en un slo intervalo. Cuando este es el caso, se elimina este juez. 5.2.1.4 Instrucciones para los Jueces Las instrucciones que se dan a los jueces dentro de este mtodo son las siguientes: "Lea cuidadosamente cada una de las afirmaciones que se le presentan a continuacin y seale para cada una de ellas, la cantidad de atributo que a su juicio cada una de ellas representa tener. Es decir, si usted considera que el responder afirmativamente a la afirmacin indica que el sujeto que as respondi posee una cantidad considerable(o mucho) del atributo que se est midiendo, coloque una "X" en el intervalo extremo de la derecha, calificado con MUCHO. Si usted considera que la afirmacin no representa nada del atributo en cuestin, coloque su respuesta en el intervalo extremo de la izquierda, el calificado con NADA; por el contrario, si usted, considera que la afirmacin contiene una cantidad regular o mediana del atributo en cuestin, coloque su respuesta en el intervalo intermedio, calificado con REGULAR. Como usted puede ver, la cantidad de atributo se incrementa del intervalo intermedio al intervalo de la izquierda y al de la derecha, de la misma manera, gradual y sucesivamente. Recuerde que no le estamos pidiendo que nos indique en qu grado est usted de acuerdo con cada afirmacin, ni tampoco en qu grado posee usted aquello de lo que habla la afirmacin, o en qu grado sta representa su punto de vista, creencia, actitud, etc. Slo queremos que nos indique que tanto del atributo considera usted que la afirmacin representa o contiene". En este caso el continuo que se le presenta a los jueces consta de once intervalos; el extremo izquierdo calificado con NADA o POCO; el intermedio con REGULAR; el extremo derecho con MUCHO o TODO. Los adjetivos calificativos debern ser congruentes con el atributo que se est estudiando. Si el atributo es actitud, por ejemplo, los intervalos descritos quedan anclados por los adjetivos DESFAVORABLE, NEUTRO, FAVORABLE. Es importante hacer notar que el resto de los intervalos permanecen sin descripcin, ya que el supuesto que subyace al modelo y al proceso de enjuiciamiento, seala que las instrucciones son tales que le permiten al juez suponer el incremento o decremento gradual, sucesivo y de intervalos semejantes, a la derecha o izquierda del intervalo intermedio, respectivamente.
El continuo se presenta de la siguiente manera:

:_____:_____:_____:_____:_____:_____:_____:_____:_____:_____: ____:_____:_____:_____: NADA REGULAR MUCHO
Habiendo presentado las 70 o 90 afirmaciones al grupo de jueces, se procede a concentrar los datos en una tabla como la que se presenta a continuacin. Tabla 5.4 Representacin esquemtica de la matriz de frecuencias y proporciones acumuladas de los juicios de N jueces para K afirmaciones en el mtodo de los Intervalos Aparentemente Iguales. INTERVALOS Afirm.1 1 2 3 . . . frec. f11 f12 f13 . . Prop. p11 p12 p13 . . prop.ac. pa11 pa12 pa13 . . . . . . . . . . . . . . . . . 11 . f111 . p111 . . pa111
Afirm. 2 f23 . . . . . . . f211 frec. f21 f22 prop. p21 p22 p23 . . . . . . . p211 prop.ac. pa21 pc22 pa23 . . . . . . .pa211 Afirm. K fk2 fk3 . . . . . . . fk11 frec. fk1 prop. pk1 pk2 pk3 . . . . pk11 prop.ac. pak1 pak2 pak . . . . . . . pak111 5.2.1.5 Valores Escalares y Valores Q En este mtodo se requiere calcular dos tipos de valores, que representan al proceso modal discriminativo y la dispersin discriminativa, respectivamente; estos valores son los valores S o escalares, y los valores Q o intercuartilares. Las frmulas correspondientes son las siguientes: S = l + (0.50 - pb) i -----------pw (5.11)
dnde S = valor escalar l = lmite inferior del intervalo donde cae la mediana pb = suma de proporciones debajo del intervalo donde cae la mediana. pw = proporciones dentro del intervalo donde cae la mediana. i = la amplitud del intervalo, que se supone es = 1 Q = C75 - C25 dnde: (5.12)
Q = valor intercuartilar C25 = valor del centil 25 C75 = valor del centil 75 C75 = l + (0.75 - pb) i ----------pw dnde: (5.13)
I = lmite inferior del intervalo donde cae el centil 75 pb = suma de proporciones por debajo del intervalo donde cae el centil 75. pw = proporciones dentro del intervalo donde cae el centil 75 i = amplitud del intervalo, se supone = 1 C25 = l + (0.25 - pb) i ---------pw dnde: I = lmite inferior del intervalo donde cae el centil 25 pb = suma de proporciones debajo del intervalo donde cae el centil 25. pw = proporciones dentro del intervalo donde cae el centil 25 i = amplitud del intervalo, se supone = 1 El valor escalar representa la cantidad de atributo que tiene la afirmacin en promedio, de acuerdo a un grupo de jueces. El valor intercuartilar corresponde al rea alrededor de la media (o valor escalar) donde se percibe se encuentra la afirmacin. Este valor debe ser lo ms pequeo que sea posible; es decir, si el continuo tiene once intervalos, idneamente, el valor Q debera ser igual a 2 o menos; en la medida en que el continuo tenga menos intervalos (nueve, siete o cinco), el valor Q deber ser an menor. Se debern calcular estos dos valores para todas y cada una de las 70 o 90 afirmaciones que fueron sometidas a juicio, para poder pasar a escoger las afirmaciones definitivas que constituirn el instrumento. 5.2.1.6 Seleccin de la Afirmaciones Definitivas Una vez que se han calculado los valores escalares y los valores intercuartilares, se procede a arreglar a las afirmaciones de acuerdo a sus valores escalares, de menor a mayor. De aquellas afirmaciones que tengan valores escalares que van de 0.5 a 1.5 se escogen dos o tres, las que tengan los valores Q ms pequeos. Del grupo de afirmaciones con valores escalares de 1.5 a 2.5, se escogen nuevamente dos o tres afirmaciones, las que tengan los valores Q ms pequeos. As se continua escogiendo de cada grupo consecutivo de valores escalares aquellas que tienen los valores Q ms pequeos. Este procedimiento asegura dos requisitos que debe reunir el instrumento: a) que las afirmaciones se repartan uniformemente a lo largo de todo el continuo psicolgico, y b) que las afirmaciones no sean ambiguas (el valor Q es un indicador de ambigedad de las mismas). (5.14)
De esta manera, el instrumento queda constituido por entre 22 a 33 afirmaciones, si el continuo tena once intervalos. De cualquier manera, se recomienda que un instrumento monodimensional, como el que se obtiene en este caso, tenga entre 20 30 afirmaciones, con las cuales es muy probable que se alcance un coeficiente de confiabilidad adecuado (igual o mayor de 0.80). 5.2.1.7 Aplicacin y Calificacin del Instrumento Final El instrumento definitivo, queda constituido entonces de entre 20 30 afirmaciones. Estas se imprimen en forma aleatoria en una o dos hojas de papel. Y las instrucciones que se dan a los sujetos que habrn de ser investigados son las siguientes: "Lea cuidadosamente el siguiente conjunto de afirmaciones, y escoja de entre ellas aquellas tres o cinco que mejor representen su opinin (en de caso ser una escala de actitud); que mejor lo describa a usted (en caso de medir un atributo X), y mrquelas con una cruz al inicio de cada una de ellas (o en el parntesis al final de cada una de ellas; etc.)". En realidad lo que se le est pidiendo al sujeto es que se coloque en el mismo continuo donde se colocaron las afirmaciones mediante el proceso de enjuiciamiento. El procedimiento de calificacin es semejante al del mtodo de pares comparados, por lo que sugerimos al lector, regrese a la seccin 5.1.1.5 de este mismo captulo. 5.3 1. 2. 3. 4. 5. 6. 7. 8. 9. 5.4 Gua de Estudio Determinar lo que se entiende por proceso modal discriminativo. Sealar lo que se entiende por dispersin discriminativa. Tipo de jueces que se emplean para desarrollar el mtodo de pares comparados. Sealar los tres pasos principales que se siguen en la derivacin de los valores escalares en el mtodo de pares comparados. Ventajas y desventajas del mtodo de pares comparados. Determinacin de la bondad de los jueces empleados en el mtodo de intervalos aparentemente iguales. Indique cules son las instrucciones de los jueces del mtodo de intervalos aparentemente iguales deben seguir en el proceso de elaboracin del instrumento. Seale lo que significa el valor Q en el mtodo de intervalos aparentemente iguales. Indique cmo se seleccionan las afirmaciones definitivas de un instrumento que se elabora con el mtodo de intervalos aparentemente iguales. Autoevaluacin
5.4.1 Preguntas 1. 2. 3. 4. 5. 6. Qu es un valor escalar? Qu es el continuo psicolgico? En qu consiste el mtodo de la media de calificacin del instrumento? Qu significa el calor Q en el mtodo de intervalos aparentemente iguales? Qu caractersticas deben tener los reactivos que se incluyan en la versin final de un instrumento que se elabora de acuerdo al mtodo de intervalos aparentemente iguales?. Qu es lo que realmente es una calificacin obtenida por un Sujeto en cualquiera de los mtodos vistos en este captulo?.
7.
Qu ventajas y desventajas tienen los mtodos de pares comparados e intervalos aparentemente iguales?
5.4.2 Respuestas 1. 2. 3. Un valor escalar corresponde al proceso modal discriminativo asociado a un reactivo. El continuo psicolgico es el que se forma con base en los juicios que los jueces emitan respecto a la localizacin de cada estmulo o reactivo, respecto a otro, o respecto al lmite de una categora. El mtodo de la media de calificacin de un instrumento consiste en determinar los valores escalares de las afirmaciones escogidas por los sujetos como aquellas que mejor los describen o con las que ms de acuerdo estn, y sumarios, para despus dividir el resultado de esta suma entre el nmero de afirmaciones o reactivos escogidos por cada uno. El valor Q es un indicador de ambigedad del reactivo; por esta razn se requiere que ste valor sea pequeo. Los reactivos que se incluyan en la escala final del mtodo de intervalos aparentemente iguales son aquellos que adquiriendo valores escalares que recorran todo al continuo psicolgico, son los que tienen los valores Q ms pequeos. La calificacin que obtienen un sujeto en instrumentos desarrollados de acuerdo al mtodo de pares comparados o al mtodo de intervalos aparentemente iguales, no es ms que su colocacin sobre el mismo continuo psicolgico en el que se localizan los estmulos que constituyen el instrumento. Es decir, es la localizacin del Sujeto, en el continuo psicolgico. Las ventajas del mtodo de pares comparados son: es el modelo de medicin ms fuerte de los dos; las calificaciones que obtienen los Sujetos miden a nivel intervalar, ya que derivan de las unidades Z. Sus desventajas son: se requiere que los Sujetos sepan leer y escribir; la tarea que se le encomienda a los jueces se vuelve fatigosa, si el nmero de reactivos es muy grande; slo es adecuado para un nmero pequeo de reactivos.
4. 5. 6.
7.
Las ventajas del mtodo de intervalos aparentemente iguales son: puede emplear un gran nmero de reactivos; las tarea que se les pide a los jueces es bastante sencilla; el nivel de medicin que se alcanza es el intervalar. Sus desventajas son: como modelo de medicin no es muy fuerte los jueces pueden volverse descuidados por falta de inters; los sujetos a los que se les aplique el instrumento final deben saber leer y escribir.
VI. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE PERSONAS En esta seccin se hablar de la construccin de instrumentos homogneos por medio del procedimiento del escalamiento de personas. Se iniciar la presentacin con las pruebas constituidas por reactivos con dos opciones de respuesta, y se continuar con las constituidas por reactivos con ms de dos opciones de respuesta. Debe recordarse que en este caso se inicia la construccin del instrumento teniendo en mente los modelos de medicin revisados en las primeras secciones de este texto. Se parte de la definicin de prueba o test: es una muestra representativa de los reactivos que se encuentran en el dominio o universo o poblacin de reactivos que indican al atributo en cuestin; se toman en cuenta las principales suposiciones del modelo del error, en el sentido de que el error de medicin es aleatorio y que por lo tanto las calificaciones observadas corresponden a las verdaderas; por ltimo, se consideran como ciertas las principales suposiciones del modelo de las pruebas paralelas, en el sentido de que las medias, y las varianzas de las mismas, son iguales, y por extrapolacin, las medias y las varianzas de los reactivos que las constituyen son iguales tambin. En los mtodos de escalamiento de personas, lo que el investigador se propone, es hacer un instrumento confiable, de acuerdo a los supuestos de los Modelos de Medicin revisados en el Captulo III; este instrumento, permitir escalar, ordenar o colocar, de acuerdo a los puntajes obtenidos por los Sujetos, a unos individuos respecto a otros, de manera que dichos puntajes representen cantidades del atributo o variable que se pretende medir. Por lo tanto, el procedimiento de construccin que se sigue es el que permite determinar cundo un conjunto de reactivos ha alcanzado el nivel de confiabilidad adecuado. 6.1 Instrumentos con Dos Opciones de Respuesta Los instrumentos que tienen dos opciones de respuesta corresponden a aquellos que estn constituidos por reactivos dicotmicos, tales como los que se presentaron en el Captulo IV. Como se recordar, estos instrumentos son empleados con mucha frecuencia para el registro o medicin de variables para las cuales existen respuestas correctas e incorrectas, verdaderas y falsas, etc. En estos casos, las opciones de respuesta por lo general se califican con puntuaciones de 1 y 0, correspondiendo el 1 a la opcin correcta o verdadera, mientras que el 0 corresponde a la opcin incorrecta o falsa. En este caso, el modelo en que se basa el procedimiento de construccin del instrumento es bsicamente el de dominio-muestra. El proceso se inicia con un nmero relativamente grande de reactivos (aproximadamente tres veces el nmero final de reactivos que se desea tener, que por lo general oscila entre 20 y 30), para permitir que se pierdan algunos en el camino. Se pretende terminar con un instrumento que contenga el mnimo nmero de reactivos, que midan lo mismo (es decir, que sean consistentes internamente), y que por lo tanto sean confiables, y representen adecuadamente al dominio de reactivos del atributo en cuestin. Este conjunto de reactivos que se elaboran, siguiendo todas las recomendaciones sealadas en el Captulo IV, se aplican a una submuestra de sujetos, con caractersticas semejantes a las de la muestra del estudio de inters, y se procede a establecer su confiabilidad por medio de la frmula de Kudder-Richardson 20. Antes de aplicar la frmula a los datos obtenidos, es conveniente llevar a cabo alguno de los procedimientos de anlisis de reactivos sealados en el Captulo IV. Este procedimiento preliminar
tiene por objeto varias cuestiones: en primer lugar, deshacerse de aquellos reactivos que no discriminan en la muestra en cuestin; en segundo lugar, reducir el nmero de reactivos que se sometern al proceso de confiabilidad. Habiendo analizado los reactivos, se aplica la siguiente frmula: rkk = ___k_____ ( 1 - ___pq___) k-1 y (6.l)
dnde: k = nmero de reactivos pq = suma del producto de las proporciones correctas (p) e incorrectas (q) de cada reactivo y = varianza de la calificacin total El primer paso entonces, para determinar la confiabilidad de una prueba constituida por reactivos dicotmicos es encontrar el valor p de cada uno de ellos, que se multiplica por 1-p o sea q. Estos productos son sumados despus. El segundo paso es calcular la varianza para las calificaciones totales. Con esta informacin se substituyen los datos en la frmula y se realizan las operaciones aritmticas indicadas, determinando asi, el coeficiente de confiabilidad de consistencia ' interna del conjunto de reactivos iniciales. El coeficiente Kudder-Richardson debe alcanzar idneamente un valor de 0.85 para considerar que la prueba es confiable. Por lo general, cuando son demasiados los reactivos, difcilmente se alcanzan los valores idneos. En virtud de esto, se recomienda calcular al mismo tiempo, el coeficiente de consistencia interna reactivo-calificacin total, que para el caso de reactivos dicotmicos con valores de 1 y 0, se calcula por medio de la correlacin biserial-puntual, cuya frmula aparece a continuacin: rbp = Ms -Mu pq (6.2)
donde: Ms = calificacin promedio en la variable contnua del grupo "correcto" en la variable dicotmica Mu = calificacin promedio en la variable contnua del grupo "incorrecto" en la variable dicotmica = desviacin estndar de la variable continua para el grupo total p = proporcin de personas que caen en el grupo "correcto" en la variable dicotmica q = 1-p Es decir, al mismo tiempo se obtienen los valores de la correlacin de la calificacin total con cada reactivo. Observando cuidadosamente estos valores, se determina cules son los reactivos que obtienen valores extremos. Es decir, si el promedio de las correlaciones esta alrededor de 0.3, todos aquellos reactivos que obtengan correlaciones reactivo-calificacin total cercanas a 0.7 o mayores a este valor, se consideran extremos, y debern ser excluidos del anlisis global de reactivos. Una vez eliminados aquellos reactivos considerados como problemticos, se procede a volver a calcular el coeficiente Kudder-Richardson y lo ms probable es que ahora s se alcancen los valores recomendados. 6.2 Instrumentos con Mas de Dos Opciones de Respuesta
Los instrumentos con reactivos de ms de dos opciones de respuesta son los ms utilizados por los investigadores en ciencias sociales. Son muy comunes las escalas de actitud con reactivos de cinco opciones de respuesta; los cuestionarios con reactivos de tres opciones; etc. Para este tipo de instrumentos, se calcula la confiabilidad de consistencia interna con el coeficiente denominado alfa de Cronbach, cuya frmula se presenta a continuacin: rkk = k k-1 1si sy (6.3)
dnde: k = nmero de reactivos si = suma de las varianzas individuales de cada reactivo sy = varianza de la calificacin total La ecuacin (6.3) es una de las deducciones ms importantes de la teora de la medicin del error. En esta forma se le conoce como coeficiente alfa. La misma frmula se puede derivar del modelo de pruebas paralelas y aunque se ve diferente, corresponde al coeficiente que se emplea para calcular la confiabilidad en el modelo dominio-muestra. Todas las anteriores consideraciones convergen en la justificacin de la afirmacin que seala que el coeficiente alfa es una frmula muy importante para la teora de la confiabilidad. Representa la correlacin esperada de una prueba con una forma alternativa que contenga el mismo nmero de reactivos. La raz cuadrada del coeficiente alfa es la correlacin estimada de una prueba con las calificaciones verdaderas carentes de error, razn por la cual deber aplicarse en forma rutinaria a todas las pruebas nuevas. Al igual que en el caso de los instrumentos con reactivos de dos opciones de respuesta, el coeficiente alfa deber adquirir un valor cercano a 0.85 para que sea considerado como un instrumento confiable, desde el punto de vista psicomtrico. En este caso tambin habrn de analizarse los valores de las correlaciones reactivo-calificacin total, para determinar cul o cules son los reactivos problemticos que estn produciendo un valor alfa bajo, y as eliminarlos del instrumento. Los criterios a seguir son los mismos que en el caso anterior (valores extremos de las correlaciones reactivo-calificacin total, en relacin al valor promedio de las correlaciones obtenidas para el total de los reactivos del instrumento). En este caso el coeficiente de correlacin que se emplea para calcular las correlaciones reactivo-calificacin total, es el de Producto-Momento de Pearson; a continuacin se presenta una de las frmulas PM ms conocidas: r = ziz2 ------N 2 (6.4)
dnde: z1z2 = suma de los productos de los puntajes estandarizados de las variables 1 y N = Nmero de casos 6.3 Valores de las Opciones de Respuesta
Las opciones de respuesta de un instrumento deben adquirir valores que representen las cantidades de atributo que el individuo que lo responde tiene, al contestar en una u otra. Para establecer los valores de las opciones de respuesta existen dos procedimientos: a) pesaje emprico y b) pesaje arbitrario. Estos se presentan en la seccin 6.4.1 de este mismo captulo. 6.4 Rangos Sumarizados: Tcnica de Likert La tcnica de rangos sumarizados o clasificaciones sumadas fue desarrollada por Likert en 1932. Hasta la fecha, es una de las ms empleadas por los investigadores en ciencias sociales, ya sea en su forma original, como escala de actitudes, o tan solo el formato para desarrollar cuestionarios o escalas que midan otras variables adems de actitudes. La mayora de los instrumentos llamados de opcin mltiple, son en realidad cuestionarios que siguen el formato de los rangos sumarizados. 6.4.1 Elaboracin de las Afirmaciones En este caso, como en las tcnicas previamente presentadas, se debern elaborar las afirmaciones o reactivos tomando en cuenta las sugerencias y criterios presentados antes, para su correcto desarrollo. Es decir, una vez definido el objeto psicolgico (si se est midiendo actitud), o la variable que se pretende medir, se elaboran aproximadamente entre 60 y 80 reactivos, referidos al objeto en cuestin. En esta ocasin, se deben elaborar reactivos que indiquen una actitud favorable, o la presencia de la variable en cuestin, y tambin reactivos que indiquen una actitud desfavorable, o la ausencia o poca presencia de la variable que se pretende medir. Se debern elaborar aproximadamente la mitad de los reactivos favorables o indicativos de la presencia de la variable, y la otra mitad desfavorables al objeto psicolgico o indicativos de la ausencia de la variable estudiada. De esta manera, se tendrn reactivos positivos (favorables s son de actitud; presencia de la variable si no lo son) y reactivos negativos (desfavorables s son de actitud; de ausencia de la variable si no lo son). Estos reactivos se ordenan aleatoriamente en hojas de papel seguidas de instrucciones que sealan: Lea cuidadosamente cada una de las preguntas y diga s: a) est Ud. totalmente de acuerdo; b) de acuerdo; c) indeciso; d) en desacuerdo; e) en total desacuerdo, con lo que dice la pregunta. Se presenta cada reactivo, y a continuacin, las opciones de respuesta antes sealadas (si las afirmaciones son de actitud) o algunas otras cinco opciones, que correspondan con el contenido del reactivo, como las que se muestran en la seccin de Reactivos de Opcin Mltiple, presentado en el Captulo IV. Las opciones de respuestas adquieren valores numricos de tal manera que la opcin que representa una actitud ms favorable (si se est midiendo actitudes) o una mayor cantidad o presencia de la variable en cuestin, se le otorga el peso de 5; a la opcin que le sigue en favorabilidad o magnitud de la presencia, se le da un peso de 4; a la opcin intermedia (indeciso, regular, ni si ni no, etc.), se le da el peso de 3; a la siguiente el de 2 y a la ltima, la que seala la actitud ms desfavorable o la menor presencia o ausencia de la variable en cuestin, se le asigna el peso de 1. Lo anterior significa que las opciones de los reactivos que a grosso modo se pueden clasificar como positivos, tendrn pesos o valores numricos diferentes que los de aquellos que se pueden clasificar como negativos. Por ejemplo, si se est midiendo actitud hacia la legalizacin del
aborto, un reactivo que dijera: el aborto debe ser legal, sus opciones de respuesta seran pesadas o calificadas de la siguiente manera: totalmente de acuerdo (5); de acuerdo (4); indeciso (3); en desacuerdo (2); en total desacuerdo (1). Sin embargo, una afirmacin que dijera: el aborto debera prohibirse an para salvar la vida de la madre, sus opciones de respuesta tendran los siguientes valores: totalmente de acuerdo (1); de acuerdo (2); indeciso (3); en desacuerdo (4); en total desacuerdo (5). Si el instrumento pretendiera medir ansiedad por ejemplo, ante un reactivo que dijera: padezco de insomnio, con opciones de respuesta de a) siempre; b) casi siempre; c) regular; d) casi nunca y e) nunca, la primera valdra 5, la segunda 4, la tercera 3, la cuarta 2 y la ltima 1. Si el reactivo fuera: por lo general estoy muy tranquilo, y las opciones de respuesta fueran: a)siempre; b) casi siempre; c) regular; d) casi nunca y e) nunca, los valores correspondientes seran de 1, 2, 3, 4, y 5 respectivamente. Tambin se pueden usar valores que vayan de 0 a 4. Existe un procedimiento emprico para establecer los pesos de las opciones de respuesta. Este consiste en lo siguiente. 1.- Se aplica el instrumento inicial al grupo de Jueces (ver la siguiente seccin). 2.- Para cada reactivo o pregunta se llevan a cabo los pasos sealados en la siguiente Tabla. Tabla 6.1 Clculo Emprico del Pesaje de las Opciones de Respuesta de la Tcnica Likert (N = 200)
Total Desacuerdo 26 0.130 0.130 0.065 -1.514 0.000 0 Desacuerdo 86 0.430 0.560 0.345 -0.399 1.115 1 Indeciso 42 0.210 0.770 0.665 0.426 1.940 2 Acuerdo 26 0.130 0.900 0.835 0.974 2.488 2 Total Acuerdo 20 0.100 1.000 0.950 1.645 3.159 3
(1) f (2) p (3) pa (4) pto. pa (5) Z (6) Z + 1.514 (7) Z red.
La Tabla 6.1 dice que el reactivo fue respondido por 200 Sujetos. De stos, 26 contestaron en la primera opcin; 86 en la segunda; 42 en la tercera; 26 en la cuarta y 20 en la quinta. Estos datos aparecen en la hilera (1) f. En la hilera (2) p, aparecen los datos de la primera hilera en forma de proporciones. En la hilera (3) aparecen las proporciones acumuladas. En la hilera (4) aparecen los puntos medios de las proporciones acumuladas. En la hilera (5) aparecen las proporciones transformadas en unidades z. Para realizar esta transformacin se consulta una tabla de Desviaciones Normales correspondientes a Proporciones p de una unidad de distribucin normal dicotomizada, como la que presenta Edwards (1957). En la hilera (6), aparecen los valores a los que se les agreg el valor absoluto del negativo mayor de la hilera anterior, que en este caso fue de 1.514, con objeto de hacer desaparecer los signos algebraicos, y obtener un punto de origen o cero arbitrario. En la hilera (7), aparecen los valores de la hilera anterior, pero ahora redondeados al entero ms cercano. Los valores que se presentan en la hilera (7), son los pesos empricos que les corresponderan a las opciones de este reactivo en particular. Esto significa que el procedimiento antes descrito, se tiene que efectuar para todos y cada uno de los reactivos del instrumento inicial (60 a 80). El procedimiento es bastante laborioso, y el mismo Likert (1932) seal que si se correlacionaban los pesos arbitrariamente establecidos, con aquellos determinados en forma emprica, se obtena una correlacin igual a 0.99. Lo anterior significa, que es lo mismo hacerlo de
cualquiera de las dos manera. Por esta razn, la mayora de los investigadores opta por la determinacin arbitraria de los pesos de las opciones de respuesta. El ejemplo anterior corresponde a un reactivo positivo o favorable; si el reactivo fuera negativo o desfavorable, en los trminos anteriormente explicados, el orden de las opciones de respuesta se tendra que invertir. Es decir, la primera columna correspondiente a una opcin de respuesta sera la de En total acuerdo; la siguiente sera De acuerdo; la intermedia es la misma: indeciso; la cuarta columna dira En desacuerdo y la ltima dira En total desacuerdo. 6.4.2 Seleccin de los Jueces En esta ocasin, los jueces que habrn de responder a las afirmaciones iniciales (60 a 80), debern ser Sujetos que posean las mismas caractersticas que aquellos para los cuales se est construyendo el instrumento. En otras palabras, los Sujetos que se emplean para elaborar el instrumento, son en realidad una submuestra de la muestra de investigacin, o una muestra obtenida de la misma poblacin de donde se obtendr la muestra para el estudio final, o para la que se est elaborando el instrumento. Estos Sujetos debern saber leer y escribir. 6.4.3 Instrucciones para los Jueces En esta ocasin, las instrucciones que se les dan a los Jueces o Sujetos, son las que sealan responder de acuerdo a sus creencias o actitudes, o caractersticas. Es decir, los Sujetos slo tendrn que responder de acuerdo a lo que ellos piensan, saben, creen, sienten, o mejor los describe. La tarea a la que se someten es exactamente la misma a la que se someter la muestra bajo estudio. Se recomienda emplear aproximadamente unos 100 jueces para llevar a cabo esta aplicacin inicial. 6.4.4 Anlisis de Reactivos El objetivo que se persigue con el uso de esta tcnica, es el de contar con una escala de 20 a 25 reactivos, confiable, que pueda ser un ndice de la variable o actitud que se pretende medir. Para esto, se deber llevar a cabo un anlisis de reactivos para determinar cules son los 20 25 mejores reactivos y con ellos formar la escala o instrumento final. En este caso, la bondad de los reactivos estar dada por su poder discriminativo. Para llevar a cabo el anlisis de reactivos en este mtodo, se aplica el instrumento inicial (con 60 a 80 reactivos) a una muestra de tamao aproximado de 100. Se califican los reactivos anotando el valor de la opcin de respuesta seleccionada por los Sujetos, y se suman a travs de todos los reactivos. Dependiendo de las calificaciones totales que hayan obtenido los Sujetos, se ordena a stos de mayor a menor. Se forman dos grupos: el superior o alto y un inferior o bajo. En el primer grupo se coloca al 25% superior de los Sujetos (aquellos que obtuvieron los puntajes ms altos); en el segundo al 25% inferior de los Sujetos (los que obtuvieron los puntajes ms bajos). Se procede entonces a formar una tabla como la Tabla 6.2, que aparece a continuacin.
Tabla 6.2. Clculo de t para evaluar la diferencia en la respuesta promedio a una afirmacin positiva o favorable de actitud entre un grupo alto y un grupo bajo.
Categora de Respuesta Total Acuerdo Acuerdo Indeciso Desacuerdo Total Desacuerdo Sumas x 4 3 2 1 0 Grupo Bajo f xf 2 8 3 9 20 40 15 15 10 0 50 72 nb xb Xf 32 27 80 15 0 154 2 xb
2
x 4 3 2 1 0
Grupo Alto f xf 15 60 20 60 10 20 4 4 1 0 50 144 na xa
Xf 240 180 40 4 0 464 2 xa
En la Tabla 6.2 se observa en la primera columna a las categoras de respuesta; en la segunda, (x), el valor de las opciones de respuesta para una afirmacin dada. La tercera, (f), son las frecuencias con que fue escogida cada opcin, por los miembros del grupo bajo. La cuarta (fx) es la multiplicacin de la primera por la segunda. La quinta (fx), corresponde a la multiplicacin de la columna (x) por la (fx). Lo mismo se presenta en el grupo alto. Lo anterior se lleva a cabo con objeto de encontrar los valores que se requieren en la siguiente frmula: Xa - Xb (6.1) t = ______________________
sa2 + sb2 ____ ____ na nb
dnde: Xa = la calificacin promedio en una afirmacin dada para el grupo alto Xb = la calificacin promedio en una afirmacin dada para el grupo bajo 2 sa = la varianza de la distribucin de las respuestas del grupo alto a esa afirmacin 2 sb = la varianza de la distribucin de las respuestas del grupo bajo a esa afirmacin na = nmero de sujetos en el grupo alto nb = nmero de sujetos en el grupo bajo Si las n's de los dos grupos son iguales, la frmula se transforma en: Xa - Xb (6.2) t = ________________________________ (xa-Xa)2 + (xb-Xb)2 ________________________________ n(n-1) dnde: (xa-Xa)2 = xa2 - (xa)2 ______ n y (xb-Xb)2 = xb2 - (xb)2
______ n Los clculos de la frmula (6.2) para los datos de la Tabla 6.2, se presentan a continuacin. 72 xb 50 -- = 1.44
2
144 xa 50
2
---- = 2.88
2 2
(xb-Xb) = 154 - (72) -------50 50 = 50.32 2.88 - 1.44 t= ----------50.32 + 49.28 ------------50(50-1)
(xa-Xa) = 464-(144) _
= 49.28 = 7.13
El valor de t obtenido se busca en las tablas correspondientes (ver McGuigan, .ej.), con gl=n-1, y se determina su nivel de significancia. Si ste es 0.05 o <, se dice que la afirmacin discrimina; es decir, que es respondida en forma diferente por un grupo alto en la variable, que por un grupo bajo en la misma variable. Este procedimiento se debe llevar a cabo con todas y cada una de las 60 a 80 preguntas o reactivos que se elaboraron. Una vez que se calculan todas las t's, se ordenan de mayor a menor, estableciendo el punto de corte del nivel de significancia adecuado. Es decir, se determina el lugar de la ordenacin donde los valores de t ya no son estadsticamente significativos a una p < 0.05. De entre las afirmaciones que si discriminaron, se seleccionan aproximadamente 12 13 de las positivas o favorables y 12 13 de las negativas o desfavorables. Estas 24 26 afirmaciones, son las que conforman la escala final. 6.4.5. Escala Final. Aplicacin y Calificacin Tomando aquellas 24 26 afirmaciones que discriminaron en el procedimiento estadstico visto en la seccin anterior, se escriben en hojas, de manera aleatoria (de manera que queden revueltas las afirmaciones favorables y las desfavorables), cuidando tambin de que los continuos de respuesta (Totalmente de acuerdo a Totalmente en desacuerdo), se presenten en forma alternada. Es decir, los continuos en ocasiones inician con totalmente de acuerdo y en otras con totalmente en desacuerdo. Lo anterior se debe llevar a cabo con objeto de disminuir la posibilidad de que aparezcan patrones de respuesta (response set). Las preguntas as ordenadas, se presentan a la muestra de investigacin, con las siguientes instrucciones: Lea cuidadosamente cada una de las siguientes preguntas. Escoja de entre las opciones de respuesta, aquella que mejor exprese su opinin, mejor lo describa, etc. No deje ninguna pregunta sin contestar. Recuerde que no hay respuestas ni buenas ni malas.
De preferencia se ponen unos dos o tres ejemplos, empleando afirmaciones referidas a otras variables. Estos ejemplos se ponen contestados y se explica la razn de cada una de las respuestas de los ejemplos. La forma de calificacin es la misma que se emple para la elaboracin del instrumento. Se suman los valores de las opciones escogidas por los sujetos a lo largo de todas las preguntas. La informacin que esta calificacin proporciona es la siguiente: entre ms alto el puntaje obtenido por el Sujeto, ms de la variable tiene; o ms favorable es su actitud. Entre ms baja sea la calificacin, menos tiene de la variable o menos favorable es su actitud. 6.4.6. Interpretacin de las Calificaciones En este mtodo de elaboracin de instrumentos, se carece de un continuo psicolgico, con un origen, seccin neutral y un fin, a diferencia de lo que sucede con tcnicas como la de Intervalos Aparentemente Iguales vista anteriormente. Por esta razn, la interpretacin de las calificaciones obtenidas por los individuos que responden a un instrumento de este tipo, slo puede ser dada en trminos de ordinalidad: ms o menos que. Cuando se usa esta tcnica para elaborar una escala de actitudes, la interpretacin de las calificaciones deber hacerse tomando en cuenta las siguientes consideraciones. En primer lugar, no existe un continuo psicolgico en el sentido en el que existe en las tcnicas de intervalos aparentemente iguales, pares comparados o intervalos sucesivos. Es decir, que no hubo un grupo de jueces que estableciera con sus juicios respecto a las afirmaciones, un continuo donde se pudieran escalar stas (asignarles valores escalares a cada una de ellas). En segundo lugar, los nicos puntajes que se pueden interpretar sin ambigedad son dos: la calificacin mnima posible, y la ms alta posible. Es decir, si el instrumento final tiene 20 afirmaciones de cinco opciones de respuesta cada una, donde los pesos de las opciones van de 1 a 5, la calificacin mnima posible es de 20, y la mxima es de 80. La primera significa que la actitud del respondiente es totalmente desfavorable al objeto psicolgico, mientras que la segunda indica exactamente lo contrario: la actitud es totalmente favorable hacia el objeto psicolgico. Cualquier otro puntaje, ya no puede ser interpretado sin ambigedad. Por ejemplo, un individuo puede obtener una calificacin total de 60, de cualquiera de las siguientes maneras: a) contestando en el intervalo u opcin que vale 3 en todas las afirmaciones; b) contestando 10 afirmaciones en la opcin que vale 2, y 10 en la que vale 4; c) o contestando 10 afirmaciones en la opcin con peso de 1, y 10 en la opcin con peso de 5; d) y as sucesivamente: las posibles combinaciones de respuesta que dan como resultado una calificacin total de 60 son muchsimas, y no por ser el punto medio de la posible distribucin de calificaciones, que va de 20 a 80, se puede interpretar, por ejemplo, que el Sujeto tenga una actitud neutral hacia el objeto psicolgico. Por lo tanto, lo nico que se puede hacer es referir los puntajes del individuo a la distancia o posicin que ocupa respecto a la media de un grupo. En otras palabras, slo se puede decir si la actitud del individuo es ms o menos favorable que la actitud promedio del grupo al que pertenece. Tambin se pueden usar los puntajes de los individuos, para hacer comparaciones entre grupos, comparando sus medias, por ejemplo. Sin embargo, debe recordarse, que no se pueden interpretar puntajes individuales como indicando actitudes favorables o desfavorables. Los puntajes crudos que se obtienen de este tipo de instrumentos pueden transformarse a puntajes estandarizados o normalizados. Estos puntajes son expresiones de desviacin o distancia respecto a una media de un grupo. Este tipo de distribuciones tienen un origen arbitrariamente establecido (la media del grupo), y unidades que representan distancias respecto a ese origen. De
esta manera, los puntajes crudos se transforman a puntajes que estn midiendo a nivel intervalar, y consecuentemente, permiten que se les aplique la mayor parte de la estadstica conocida. 6.4.6.1 Transformacin a Puntajes T En virtud de lo sealado anteriormente, se puede emplear como una referencia adecuada o conveniente. La transformacin de la distribucin de puntajes de actitud , a calificaciones T. Para esto se usa la siguiente frmula: (6.3) T = 50 + 10 (X - X) s
dnde: T = una calificacin T X = la calificacin de un Sujeto dado X = el promedio de la distribucin s = la desviacin standard de la distribucin de calificaciones Al transformar los puntajes crudos a puntajes T, se pueden interpretar con facilidad, al recordar que en este caso la media es de 50 y la desviacin estndar es de 10. 6.4.6.2 Transformacin a Puntajes z Otra transformacin muy empleada tambin, es la de la z. En este caso, el procedimiento es tambin muy sencillo, y se emplea la siguiente frmula: (6.4) z = (X - X) s dnde: X = puntaje del Sujeto X = Promedio del grupo s = desviacin estandarte del grupo. En esta transformacin, los puntajes transformados pueden adquirir valores positivos (si se encuentran a la derecha del promedio), y negativos,(si se encuentran a la izquierda) . En esta distribucin de z, la media es igual a cero y la desviacin estndar es igual a la unidad. 6.5 1. 2. 3. 4. final. 5. 6. Gua de Estudios Sealar el objetivo principal de los modelos de escalamiento de personas. Distinguir cuando se aplica la frmula de Kuder-Richardson, y cundo la de Alpha de Cronbach, para la elaboracin de instrumentos para escalar personas. Sealar la relacin que existe entre el pesaje emprico y el arbitrario de las opciones de respuesta, en el mtodo de rangos sumarizados. Sealar las caractersticas que debern tener los jueces que se empleen para desarrollar un instrumento de acuerdo al mtodo de los rangos sumarizados. Determinar cmo se seleccionan las afirmaciones que formarn parte de la escala Sealar como se interpretan las calificaciones obtenidas por los sujetos, con el mtodo de rangos sumarizados.
7. 6.6
Objetivo que se desea alcanzar al transformar los puntajes crudos obtenidos por los Sujetos en el mtodo de rangos sumarizados, a puntajes T o z. Autoevaluacin
6.6.1. Preguntas 1. 2. 3. 4. 5. 6. 7 Cul es la finalidad que persigue el investigador al desarrollar instrumentos que escalen personas? Para qu se determina la correlacin de cada reactivo con la calificacin total, en los modelos que escalan personas? Cundo se usa el coeficiente biserial-puntual y cuando el producto-momento de Pearson para determinar correlaciones reactivo-calificacin total? Cundo se emplea el alpha de Cronbach y cuando el Kuder-Richardson para escalar personas? Para qu se analizan los reactivos en la tcnica de Likert? Qu caracterstica importante tienen que tener las afirmaciones o reactivos que se desarrollen para escalar personas con la tcnica de likert? Cul es el problema que se tiene con las calificaciones obtenidas por los Sujetos en un instrumento desarrollado con la tcnica de rangos sumarizados?
6.6.2 Respuestas 1. El investigador desea desarrollar un instrumento constituido por un conjunto de reactivos que sean consientes internamente. Es decir, que cumplan con los requisitos de este tipo de confiabilidad. 2. Se determinan los valores de la correlacin entre cada reactivo y la calificacin total con objeto de que si el conjunto de reactivos no adquiere una magnitud de coeficiente de consistencia interna adecuado de acuerdo lo establecido por los psicmetras, se puede iniciar inmediatamente el anlisis de estas correlaciones, para determinar cul o cules reactivos son los que estn causando el problema que impide se alcance la consistencia interna. 3. El coeficiente biserial-puntual se emplea cuando los reactivos tienen dos opciones de respuesta que se califican con 1 y o. El coeficiente producto-momento de Pearson se emplea cuando los reactivos son de opcin mltiple, de tres a ms opciones de respuesta. 4. El coeficiente de alpha de Cronbach se emplea para aquellos instrumentos que tienen reactivos de opcin mltiple; el de Kudder-Richardson, se emplea cuando los instrumentos tienen reactivos de dos opciones de respuesta, que se califican con 1 y 0. 5. Los reactivos se someten a un anlisis de su poder de discriminacin, con objeto de poder eliminar e todos aquellos reactivos que no discriminan entre un grupo alto en el atributo y otro bajo en el atributo, y as poder incluir en el instrumento final, slo a aquellos reactivos que s discriminen. 6. La mitad de las afirmaciones o reactivos que se desarrollan en la tcnica de Likert, deben ser indicadores de una alta posesin del atributo o variable que se est midiendo, mientras que la otra mitad deben ser indicadores de la no posesin o posesin muy baja del atributo o variable en cuestin. Si lo que se est midiendo son actitudes, la mitad de los reactivos tienen que ser favorables al objeto psicolgico, mientras que la otra mitad tienen que ser desfavorables. 7. Las calificaciones obtenidas por los sujetos con la tcnica de Likert no se pueden interpretar de la misma forma que las que se obtienen con otras tcnicas. Esto se debe a que en este caso se carece de un continuo psicolgico que posea un origen y un fin. En este caso slo se puede hablar de ms o menos atributo posedo por un sujeto en comparacin con otro, pero no se puede dar un juicio absoluto de que tanto atributo posee el sujeto en si mismo. Precisamente se
transforman los puntajes crudos a puntajes z y puntajes T, con objeto de poder dar juicios absolutos para los sujetos individuales.
VII. INSTRUMENTOS HETEROGENEOS 7.1 Uso del Anlisis Factorial para la Construccin de Instrumentos Cuando se pretende construir un instrumento que no es homogneo, (que mide una sola dimensin o variable simple, constituida por esa sola dimensin) se puede pensar en instrumentos heterogneos. La heterogeneidad de los instrumentos puede ser de dos tipos. Primero, se trata de una variable, compleja, constituida por varias dimensiones; segundo, se trata de diferentes variables sencillas, a las que se pretende medir con el mismo instrumento. Esta segunda circunstancia es menos comn, pero se puede dar. Por lo general, los instrumentos heterogneos derivan de la necesidad de medir variables complejas, o definidas en forma compleja. Como siempre, la definicin conceptual de la variable es la que determina el nmero de dimensiones de la misma. En ocasiones la misma variable o constructo hipottico puede ser definido de manera simple o monodimensional, o en forma compleja o multidimensional. Por ejemplo, Coopersmith (1967) define a la autoestima como el afecto favorable o desfavorable asociado al si mismo, y de esta manera la definicin es simple o ' monodimensional. En este caso se debe construir un instrumento que registre el afecto (positivo o negativo) asociado al si mismo. Vite San Pedro (1988) define a la autoestima como el resultado de ' la compleja interaccin de la evaluacin que cada individuo realiza acerca de la eficiencia con la que ejecuta los roles que le son significativos, asi como la percepcin que tiene de la evaluacin que de ' los mismos roles efecten " otros" significativos para el individuo. Esta conceptualizacin deja ver una autoestima multidimensional. En este caso, se plantea la existencia de tantas dimensiones como roles significativos tenga el individuo, multiplicadas por el nmero de "otros" significativos que tenga el sujeto. En el caso del primer ejemplo, el investigador desarrolla una escala monodimensional o instrumento homogneo, siguiendo los pasos sealados en el captulo VI. En el segundo ejemplo, el investigador puede optar por emplear el anlisis factorial para desarrollar un instrumento heterogneo. A pesar de la gran utilidad social y cientfica de las pruebas psicolgicas, debe reconocerse que hasta la fecha, se tiene evidencia bastante inadecuada respecto a lo que realmente miden stas. Las variables o dimensiones fundamentales de la habilidad humana o de la personalidad humana en general se encuentran an dentro del vasto territorio inexplorado del conocimiento, reservado para los psiclogos. Para enfrentarse a esta situacin se requiere de una aproximacin estadstica como el anlisis factorial. Si uno consultara un diccionario para buscar todos los trminos que se emplean para describir la personalidad humana, incluyendo sus habilidades, en otras palabras, los trminos que se refieren a rasgos observables, uno encontraria varios miles de ellos. La ciencia, que desea ' describir la naturaleza humana, tiene a su disposicin todos esos conceptos. Pero emplearlos todos es obrar errneamente: muchos son sinnimos, muchos se traslapan en diferente grado, otros expresan caractersticas opuestas. La ciencia, motivada siempre por la bsqueda del orden dentro del caos, por reducir a lo simple aquello que es complejo, desea saber cual es el nmero mnimo de conceptos con los que se puede ordenar y describir en forma adecuada la multiplicidad de fenmenos que caen bajo su escrutinio. Desde un punto de vista cuantitativo, se podra preguntar: cul es el menor nmero de variables o dimensiones de la personalidad que se necesitan para definirla adecuadamente?
Wundt se refiri a este problema en relacin con el sentimiento y propuso su famosa teora tridimensional. Los psiclogos existencialistas se han enfrentado al problema en relacin a los fenmenos sensoriales, y se ha llegado en general a pensar en los atributos de los colores, de los sonidos y de la experiencia. La tarea de aislar variables independientes de personalidad es an ms difcil. Los mtodos de escritorio, dominados por la lgica ms que por la observacin, llevaron a la psicologa de las facultades, actualmente inaceptable para la psicologa moderna. De la misma manera, la observacin directa tampoco ha producido un conjunto de rasgos unitarios que se acerquen de alguna manera a la aceptacin universal. Para ilustrar el problema de otra manera, de una forma ms prctica, supngase que se desea describir la personalidad de un individuo tan completamente como fuera posible, por medio de calificaciones en diferentes pruebas. Si se quisiera asegurar no omitir ningn aspecto de su personalidad, probablemente se le aplicaran varios cientos de pruebas. Se dara cuenta el investigador que muchas de ellas correlacionaron alto entre s y que por lo tanto se duplicaron los esfuerzos varias veces. Si se estudian estas intercorrelaciones se podra dar cuenta tambin que algunas pruebas representan a otro grupo de pruebas de tal manera que no se sacrifica la cobertura de todos los rasgos. Cuando alguna de estas pruebas sirve para representar a un conjunto de otras, se puede decir que se tiene un factor subyacente. Por lo tanto, la tarea de describir al individuo se reduce al hacer que una prueba haga el trabajo de varias. Cuando a ese factor se le puede dar una definicin y un significado psicolgico, no solo se tiene un nuevo y poderoso concepto para propsitos descriptivos, sino tambin para pensar acerca de la naturaleza humana. 7.2 Fundamentos Bsicos del Anlisis Factorial El anlisis factorial no es un concepto unitario, sino que depende de las alternativas que se pueden tomar en cada uno de los tres pasos principales que se siguen: a) preparacin de la matriz de intercorrelaciones; b) la extraccin de los factores iniciales (lo que habla de la posibilidad de reduccin de los datos); y c) la rotacin a una solucin terminal (que produzca factores simples e interpretables). 7.2.1 Preparacin de la Matriz de Intercorrelaciones Los pasos que se siguen para la preparacin de la matriz de intercorrelaciones son los siguientes: a) definir conceptualmente la variable para la que se quiere construir el instrumento, estableciendo las dimensiones constitutivas, derivando sus indicadores, y por ltimo, elaborando los reactivos o preguntas (teniendo cuidado de observar las indicaciones sealadas en el Captulo IV). b) este conjunto de preguntas se aplica a una muestra representativa de la poblacin, de tamano tal que cumpla con el requisito mnimo de por lo menos 5 sujetos por reactivo. c) la informacin recogida se somete a un FREQUENCIES, en el que se piden todas las estadsticas, con objeto de que aparezcan los valores de SKEWNESS y el de KURTOSIS, los cuales debern estar cercanos a cero, y asi indicar la normalidad de la distribucin de las respuestas ' de cada reactivo. Slo aquellos reactivos que presenten una distribucin normal en sus respuestas se sometern a los siguientes pasos. Es decir, slo se pueden someter a anlisis factorial, variables que presenten una distribucin normal. d) la informacin asi recogida, se somete a un anlisis que produzca medidas de asociacin ' existentes entre los reactivos (correlaciones producto- momento de Pearson).
e) Con los coeficientes de correlacin producto-momento de Pearson se elabora la matriz de intercorrelaciones. 7.2.2 Extraccin de Factores Iniciales La extraccin inicial de factores explora la posibilidad de reduccin de los datos. Es decir, determina si se puede encontrar un conjunto de nuevas variables en base a las intercorrelaciones observadas. Las nuevas variables se pueden definir de dos maneras: a) como transformaciones matemticas exactas a partir de los datos originales: a este procedimiento se le llama anlisis de componentes principales; b) como suposiciones inferenciales acerca de la estructuracin de las variables y su fuente de variacin: a este procedimiento se le conoce como anlisis factorial clsico o solucin de factores comunes. Los factores iniciales se extraen de manera que cada factor es independiente de los dems. Se debe sealar que la solucin factorial inicial, no cumple con los requisitos fundamentales del anlisis factorial que son el de la estructura simple y el desarrollo positivo. El requisito de estructura simple se refiere al hecho de que cada variable cargue alto en un factor y cerca de cero en los dems. El desarrollo positivo se refiere al hecho de que las cargas factoriales sean o tengan signo positivo. El hecho de que estos requisitos no se cumplan, hace que los factores iniciales que se obtienen sean muy difciles de interpretar, ya que muchas variables aparecen con cargas ms o menos altas en varios factores al mismo tiempo por un lado, y por el otro, aparecen una gran cantidad de cargas factoriales asociadas a signos negativos. De hecho, esta extraccin inicial slo permite responder a la interrogante de la posibilidad de reducir un conjunto de datos, a un nmero menor de variables o factores que expliquen la mayor cantidad de varianza posible, originalmente contenida en la matriz de intercorrelaciones. En virtud de lo anteriormente expuesto y con objeto de poder interpretar los resultados obtenidos, asi como ' poder cumplir en la medida de lo posible con los criterios de estructura simple y desarrollo positivo, se procede a pasar a la tercera etapa del anlisis: la rotacin. 7.2.3 Rotacin a Factores Terminales La configuracin exacta de la estructura factorial no es nica. Una solucin factorial puede transformarse en otra sin violar las suposiciones bsicas. Existen muchas formas estadsticas equivalentes de definir las dimensiones subyacentes del mismo conjunto de datos. Algunas soluciones son ms parsimoniosas y simples, otras ms informativas. Cada una dice algo ligeramente diferente acerca de la estructura de los datos. Cada investigador escoge la que ms le conviene de acuerdo a sus fines tericos y/o prcticos. Las opciones ms importantes son: la ortogonal, donde se supone independencia (no correlacin) entre los factores extrados; y la oblicua, que supone correlacin entre los factores. 7.3 Tipos de Anlisis Factorial 7.3.1 Factores Definidos
El mtodo de los componentes principales transforma a un conjunto de variables a un nuevo conjunto de variables compuestas o componentes principales que son independientes entre si, o sea, son ortogonales. Cuando se opta por este tipo de solucin, no se requiere hacer ninguna suposicin acerca de la estructura subyacente de las variables. El investigador tan slo se pregunta: Cul es la mejor combinacin lineal de variables que explica la mayor cantidad de varianza en los datos como conjunto, que cualquier otra? De esta manera, el primer componente principal es el mejor resumen de la combinacin lineal exhibida en los datos; el segundo componente es el segundo mejor que sigue, obtenido del residual despus de haber extrado al primero, y asi sucesivamente, hasta agotar ' la cantidad de varianza total existente. El segundo componente es independiente (ortogonal) del primero; explica varianza no explicada por el primero, y asi con los componentes sucesivos. El modelo se puede expresar como ' sigue: Zj = aj1 F1 + aj2 F2 + . . . . + ajn Fn dnde cada una de las n observadas se describe linealmente en trmino de los componentes nuevos no correlacionados F1 , F2 ,Fn. De esta manera, los primeros m componentes, muchos menos que las n variables originales, explican la mayor parte de la varianza de los datos. 7.3.2. Factores Inferidos El anlisis factorial clsico supone que las correlaciones observadas resultan de una regularidad subyacente en los datos. Supone que la variabilidad observada est influida por diferentes determinantes, algunos compartidos con otras variables del conjunto, y otros no compartidos con ninguna otra. A los determinantes compartidos se les llama comunes y a los idiosincrsicos se les llama factores nicos. La parte nica de una variable no contribuye a la relacin entre las variables; las correlaciones son resultado de los factores comunes; stos explican todas las relaciones observadas y son menores en nmero que las variables originales. Este modelo se puede expresar como sigue: Zj = aj1 F1 + aj2 F2 +. . . + ajm Fm + djuj dnde: Zj = variable j en forma estandarizada Fi = factores hipotticos uj = factoru nico para la variable j ' aji= coeficiente estandarizado de regresion multiple de la variable j en el factor i (carga ' ' factorial) dj = coeficiente de regresin estandarizado para la variable j en el factor nico j Este modelo tiene adems las siguientes suposiciones: 1. la correlacin entre los factores comunes y los nicos es igual a cero: r(Fj,Ui) = 0 2. La correlacin entre los factores nicos es igual a cero:
r(Uj,Uk) = 0 3. El factor nico u es independiente (ortogonal) de todos los factores comunes y de los factores nicos asociados a otras variables, por lo tanto, si hay correlacin entre dos variables, sta se debe a los factores comunes. 4. Al complemento de la varaianza nica (u), se le llama comunalidad (h ): 1 - u = h La comunalidad se estima a partir de los datos. El que se usen factores definidos o inferidos depende de que se suponga la existencia de varianza nica. Otra consideracin se refiere a si el estudio que se lleva a cabo es exploratorio o confirmatorio. En caso de ser exploratorio se recomienda que el anlisis sea de componentes principales; si el estudio fuera confirmatorio, se recomienda emplear el modelo de factores comunes. 7.4 Procedimiento General Un anlisis factorial completo proporciona las siguientes seis matrices: a) una matriz de correlaciones de las variables analizadas b) cargas factoriales iniciales c) pesos para estimar las variables a partir de los factores (factor pattern matrix-matriz del patrn factorial). Esta matriz contiene los pesos o coeficientes de regresin de los factores comunes y por lo tanto seala la composicin de una variable en trminos de los factores hipotticos. d) pesos para estimar factores a partir de las variables (factor estimate-estimacin de factores; o factor score coefficient matrix-matriz de coeficientes de calificaciones factoriales). Esta matriz proporciona un medio de estimar puntajes factoriales a partir de variables observadas. Es decir, son los pesos o coeficientes de regresin que se emplean para estimar las calificaciones factoriales a partir de las variables observadas expresadas en unidades o puntajes z. e) correlacin entre los factores y las variables o cargas factoriales (factor structure matrix-matriz de la estructura factorial). Esta matriz est constituida por los coeficientes de correlacin (o cargas factoriales) entre cada variable y cada factor. Esta es la matriz que se emplea para interpretar (nombrar) a los factores extrados u obtenidos. Cuando se emplea un mtodo ortogonal de rotacin, la matriz de patrn factorial y la matriz de la estructura factorial, son iguales por lo que aparece nicamente la segunda. Cuando el procedimiento de rotacin que se emplea es el oblicuo, aparecen ambas, con sus nombres respectivos.
f) matriz de intercorrelaciones de los factores terminales. Esta matriz slo se obtiene cuando la solucin terminal tuvo una rotacin oblicua. Est constituida por las intercorrelaciones de las dimensiones (o factores) subyacentes, y puede servir para anlisis factoriales de un orden ms alto (someter a anlisis factorial los puntajes que los sujetos obtienen en los factores extrados en el primer nivel o primer paso). Las variables pueden introducirse por medio de los puntajes crudos que los sujetos obtuvieron en cada uno de ellas, o por medio de una matriz cuadrada de correlaciones (igual nmero de columnas, k y de hileras, r). Someter a anlisis factorial a un conjunto de variables significa, en el nivel ms general, expresar a una variable como la combinacin lineal de ciertas variables (factores) independientes, ya sea definidos o inferidos. La importancia de los factores est dada primero, por el valor eigen que obtiene cada uno de los factores extrados. Este es la raz de la ecuacin (polinomio) que explica la matriz de varianza reducida (la que se trabaja a partir de la extraccion de los factores iniciales). Un segundo aspecto ' que habla de la importancia de los factores es el porcentaje de varianza, en la matriz reducida, que cada factor explica; asi, son ms importantes aquellos factores que tienen un valor eigen y un ' porcentaje de varianza explicada mayores. 7.5 Mtodos de Anlisis Factorial El SPSS (Paquete Estadstico para las Ciencias Sociales) cuenta con diferentes mtodos de anlisis factorial. Entre los ms usados se tienen cuatro: a) el mtodo de componentes principales sin iteracin (PA1); b) el mtodo de componentes principales con iteracin (PA2); c) factorizacin cannica de RAO (RAO); y d) el mtodo Alfa (ALPHA). Para ver con ms detalle los tres primeros mtodos, recomiendo se consulte el documento Diseos Multivariados de Investigacin en Ciencias Sociales (Reidl de Aguilar, 1989). En esta ocasin, se ver solamente el mtodo Alfa, que es el indicado para la elaboracin de instrumentos. 7.5.1 Mtodo Alfa Este mtodo es del tipo del anlisis factorial clsico o de factores comunes y nicos. En este mtodo se parte del supuesto de que las variables incluidas en el anlisis se consideran una muestra representativa del universo o poblacin de variables (indicadores o reactivos). En este sentido, este mtodo se deriva del modelo dominio-muestra de medicin (ver captulo III) en ciencias sociales, y se recomienda por lo tanto, para ser empleado especficamente cuando el objetivo primordial del estudio es el de construir un instrumento, y no el de reducir a un nmero menor un conjunto dado de datos. La razn por la cual recibe el nombre de Alfa, es que uno de los objetivos primordiales del anlisis es calcular o extraer factores que sean consistentes internamente (ver captulo VI). La prueba de consistencia interna a la que se hace referencia en este procedimiento es la del Coeficiente Alpha de Cronbach. Se recordar que este coeficiente se aplica a instrumentos cuyos reactivos tienen ms de dos opciones de respuesta. De esta manera, los factores obtenidos por medio de este mtodo, al ser sometidos los reactivos constituyentes a un anlisis de
confiabilidad empleando el coeficiente alpha, se obtendrn valores que sealan la existencia de consistencia interna entre ellos. Las siguientes recomendaciones son particularmente importantes si se desea emplear este mtodo de anlisis factorial; sin embargo, tambin son adecuadas para cuando se emplea alguno de los otros mtodos existentes. En primer lugar, procrese no emplear ms de 100 variables o reactivos referidos a una variable o concepto complejo. Esto se debe a que aunque el SPSS cuenta con la posibilidad de manejar un nmero mayor a 100 variables en un anlisis factorial, en la medida en que se incremente el nmero de variables ms all de 100, el valor que la determinante de la matriz original de intercorrelaciones puede adquirir, puede ser tal que impida invertirla. Esto significa que no podr producir una matriz de coeficientes de calificaciones factoriales (Factor Score Coefficient Matrix). Esto, a su vez, significa que el investigador deber emplear la matriz de la estructura factorial (Factor Structure Matrix) como coeficientes de calificaciones factoriales, lo que implica que sus factores terminales debern quedar constituidos por variables o reactivos con cargas factoriales mnimas, de valor absoluto de 0.40 y mayores. Otra razn que subyace a esta recomendacin, es el incremento del tiempo de mquina y de espacio de trabajo requerido por la computadora. En segundo lugar, se recomienda tener una muestra cuya N sea por lo menos de 5 veces el nmero de reactivos que contenga el instrumento inicial. Es decir, el tamao mnimo de la muestra deber de ser: N = 5K, dnde, k = nmero de reactivos. Lo ideal es que N = 10K. Esta recomendacin se dirige particularmente a la situacin en la que el investigador tiene como objetivo especfico y primordial, la elaboracin de un instrumento. Se debe recordar que los diseos correlacionales multivariados son diseos de muestras grandes, con objeto de anular resultados espreos, producto del artefacto del proceso de computacin. En tercer lugar, se recomienda que todos los reactivos o variables sean de opcin mltiple, en alguna de sus acepciones, para garantizar la distribucin normal de las respuestas dadas a ellos. Es decir, por ningn motivo debern los reactivos o variables ser dicotmicos; las opciones de respuesta deben ser por lo menos tres; hasta cinco o siete; de preferencia cuatro o cinco. Entre los tipos de reactivos de opcin mltiple se tienen, por ejemplo: tres o ms opciones de respuesta excluyentes; ordenar o clasificar a lo largo de un continuo de tres a siete intervalos, donde se definen los intervalos extremos y el intermedio. Las escalas de preferencia, las de grados de acuerdo, las de frecuencias de ocurrencia, etc., son, siempre y cuando tengan ms de dos posibilidades de respuesta, variedades de reactivos de opcin mltiple. Por ltimo, si no se puede tener un nmero menor de cien variables para ser sometidas a anlisis, se recomienda llevar a cabo anlisis factoriales parcializados. Los criterios que determinan cmo se pueden dividir las variables para ser sometidas a anlisis factorial son, principalmente dos: un criterio cualitativo y otro cuantitativo. El primero hace referencia a la fundamentacin terica que subyace a la elaboracin de los reactivos oi dices de las variables. Es decir, se someten a anlisis ' factorial a aquellos reactivos que se supone estn midiendo o la misma variable o la misma dimensin de una variable dada. El segundo criterio, el cuantitativo, puede cubrirse o cumplirse de dos maneras: a) analizando una matriz de intercorrelaciones inicial que contenga todas las variables o reactivos del estudio; b) sometiendo a la matriz inicial de intercorrelaciones a un anlisis de conglomerados, como por ejemplo aplicando el coeficiente de pertenencia. En el primer caso, el anlisis consiste en agrupar las variables por sus magnitudes de correlacin. Formar un grupo con aquellas que tengan las correlaciones ms altas entre si; un '
segundo grupo con las que sigan, y asi sucesivamente, formando cuantos grupos sea necesario o ' pertinente. Puede ser, por ejemplo, dos: en un grupo todas aquellas variables que tengan correlaciones entre si que excedan un cierto valor establecido por el investigador, y un segundo ' grupo con aquellas variables que no excedan el valor estipulado. En el segundo caso, se somete a toda la matriz de intercorrelaciones a un anlisis de pertenencia, y entonces, se someten a factorizacin los diferentes conjunto de variables que pertenecieron a los diversos conglomerados detectados en la matriz. En realidad, el primer caso es una forma no muy estricta, "a ojo de buen cubero", de hacer lo que se hace en el segundo caso, de manera matemticamente ms formal. 7.6 Mtodos de Rotacin Se mencion anteriormente (seccin de rotacin a factores terminales) que las opciones de solucin terminal ms importantes eran la ortogonal y la oblicua. En esta seccin se hablar un poco ms de cada una de ellas. 7.6.1 Mtodos Ortogonales de Rotacin Entre los mtodos ortogonales de rotacin, que suponen independencia (ausencia de correlacin) entre los factores terminales, se tienen tres: a) QUARTIMAX ; b) VARIMAX ; y c) EQUIMAX. El investigador seleccionar el que ms convenga a sus objetivos, tomando en cuenta lo que se presenta a continuacin. El mtodo QUARTIMAX tiene por objeto rotar los ejes de los factores para maximizar el principio de la estructura simple. Es decir, asegurar que una variable cargue alto en un factor, y cero o cerca de cero en los dems. Este mtodo es recomendable cuando las caractersticas mismas de los reactivos probabilizan la pertenencia exclusiva y por tanto excluyente, en un factor respecto a los dems. Se recomienda para estudios confirmatorios, es decir, aquellos que se realizan para poner a prueba hiptesis. El mtodo VARIMAX produce soluciones factoriales que maximizan la cantidad de varianza explicada. Es el que se emplea ms comnmente y se recomienda en estudios exploratorios y cuyo objetivo primordial sea el de la reduccin de los datos. El mtodo EQUIMAX es en realidad una combinacin de los dos primeros; es decir, busca obtener factores que maximicen la varianza explicada, y que al mismo tiempo, queden constituidos por variables o reactivos que carguen alto en un factor y cero, o cerca de cero, en los dems. Las soluciones terminales rotadas que producen estos tres mtodos difieren entre s. Sin embargo, dentro de cada uno de ellos, la solucin obtenida es la ptima. Es decir, cada uno de ellos produce la mejor solucin factorial matemticamente posible. Esta situacin permite al investigador, por ejemplo, comparar soluciones cuando se tienen el mismo conjunto de reactivos y diferentes muestras; o diferentes conjuntos de reactivos (o variables) y la misma muestra, para escoger aquella que mejor se conforme a sus hiptesis, o al conocimiento acumulado en esa rea particular de inters. Le permite tambin, detectar la estabilidad de la estructura factorial, o falta de la misma, en muestras diferentes en el tiempo o espacio. En cualquier caso, el investigador est seguro, por lo menos, de que las soluciones encontradas son las ptimas desde el punto de vista matemtico. 7.6.2. Mtodo Oblicuo de Rotacin
Se recordar que este mtodo se emplea cuando no se supone independencia entre los factores; sino por el contrario, se supone la existencia de una correlacin entre los factores obtenidos. El grado de relacin u oblicuidad de los ejes de referencia esta determinado por el ngulo ' que estos formen entre s. Es conveniente repetir aqu que una correlacin se puede representar en forma grfica. Esta representacin se hace con un sistema de coordenadas. Cuando stas son perpendiculares entre s, el ngulo que separa a la ordenada de la abscisa es de 90 grados. El coseno de un ngulo recto es igual a cero. Por esto, se dice que los ejes de referencia ortogonales o perpendiculares representan una correlacin de cero, o sea, absoluta independencia entre los ejes. Cuando se habla de relacin o dependencia entre los factores, se refiere uno a la oblicuidad grfica entre los ejes de referencia. Cuando el ngulo que se forma entre dos lneas es igual a cero grados, el coseno de ese ngulo es de 1.00 (valor mximo que puede alcanzar una correlacin), y conforme el ngulo se va acercando a 90 grados, el coseno de ese ngulo (o correlacin) va siendo menor, hasta llegar a cero. La oblicuidad de los ejes de referencia, que son los que determinan los valores de las cargas factoriales de las variables o reactivos que constituyen a los diferentes factores, queda establecida por delta. Cuando el valor de delta es positivo, menor o igual a 1.00, se supone que los factores estn extremadamente correlacionados y los ejes de referencia son muy oblicuos entre s. Si el valor de delta es igual a cero, los ejes son bastante oblicuos; ste es el valor de default que tiene el programa del SPSS. Si el valor de delta va de -0.5 a -5, se supone una oblicuidad menor. Cuando adquiere un valor menor a -5, los ejes son casi ortogonales; o sea, que se supone la casi independencia entre los factores. El investigador puede determinar el grado de oblicuidad (o correlacin) que supone entre sus factores, dependiendo de la literatura sobre el tema investigado, estableciendo un valor para delta. El problema de esta aproximacin es el hecho de que no existen soluciones ptimas o nicas. Existen tantas soluciones como oblicuidades establezca el investigador. Debido a esto, se recomienda que el investigador decida de antemano, el grado de relacin que supone existe entre los factores que se extraern, y en base a esto, escoja por medio del valor delta, la oblicuidad o relacin que supone tienen los factores. Si no se est seguro de que tan correlacionados puedan estar los factores obtenidos, es recomendable solicitar dos o tres soluciones que correspondan a diferentes grados de oblicuidad, para que el investigador seleccione a posteriori, aquella que mejor concuerde, ya sea con sus hiptesis, o con el conocimiento acumulado en esa rea de estudio. En cualquier caso, es ms difcil establecer comparaciones entre los hallazgos obtenidos en diferentes ocasiones o con diferentes muestras para el mismo conjunto de reactivos o variables, pues las soluciones sern diferentes dependiendo del grado de relacin que haya escogido el investigador como el adecuado en cada ocasin.
7.7 Opciones Adicionales del Programa de Anlisis Factorial del SPSS Entre las opciones adicionales al mnimo requerido para interpretar los resultados de la aplicacin de un anlisis factorial a un conjunto de datos, las ms empleadas por los investigadores, y por lo tanto las que se recomiendan, dependiendo de los objetivos del estudio, se presentan a continuacin. Es pertinente solicitar siempre medias y desviaciones estndar para cada una de las variables que se someten a anlisis. Esto proporciona informacin sobre los puntajes crudos obtenidos por los sujetos en las diferentes variables. En ocasiones pueden ayudar a la interpretacin de los factores obtenidos. Se recomienda tambin solicitar que se imprima la matriz de coeficientes de calificaciones factoriales (Factor Score Coefficient Matrix). Las razones para esto son: en primer lugar, si el objetivo del estudio era la elaboracin de un instrumento, el instrumento final deber poder ser empleado por otros investigadores en forma directa (sin tener que realizar otro anlisis factorial a partir de las n variables o reactivos iniciales) y deber permitir la obtencin de calificaciones factoriales para los sujetos. En segundo lugar, si el objetivo del estudio era simplemente la reduccin de un nmero amplio de variables en una etapa exploratoria o preliminar, el investigador deber poder contar con un sistema de calificacin factorial del nmero reducido de variables de inters en la muestra final de su investigacin. El investigador puede solicitar al programa que le genere e imprima calificaciones factoriales de los sujetos empleados como muestra para la reduccin de variables o la elaboracin del instrumento, pues puede tener inters en poner a prueba hiptesis ulteriores referidas a los factores obtenidos, o puede desear elaborar baremos para la poblacin para la cual esta construyendo el ' instrumento. Para esto solicita FACSCORE. Es decir, las calificaciones que los sujetos obtuvieron en los factores extrados, pueden constituir un nuevo conjunto de datos que se sometern a otro anlisis estadstico, con fines ya sea exploratorios, descriptivos o confirmatorios. Cuando el estudio tiene como principal objetivo someter a prueba alguna hiptesis (como por ' ejemplo: la autoestima est constituida por tales factores, y asi se quiere medir), el investigador puede modificar los siguientes parmetros, dependiendo de sus hiptesis especificas: a) NFACTORS, que seala cuantos factores debern extraerse del espacio reducido de variabilidad; b) MINIEIGEN, que seala el valor eigen mnimo que el investigador desea tengan los factores que se obtengan; c) ITERATE, que seala cuantas iteraciones habrn de llevarse a cabo: esta situacin es comn cuando los datos no alcanzan la convergencia (diferencia de 0.001 entre los clculos sucesivos de la estimacin de la comunalidad en el mtodo PA2) con las 25 iteraciones que da por default el programa; d) STOPFAC cuando se desee se detenga el proceso de extraccin de factores en aquella iteracin en la que la comunalidad (h) varie de una estimacin a la sucesiva en ' una cantidad diferente a 0.001 (valor de default). 7.8 Interpretacin de Resultados A continuacin llevaremos al lector a lo largo de un listado de computadora, resultado de un anlisis factorial efectuado con un conjunto de datos obtenidos durante 1981/2, para una evaluacin de los profesores, el programa y el sistema de enseanza empleado en la impetracin de la materia de Psicologa Social Introductoria. Las variables que se sometieron a anlisis factorial fueron doce que se referan al profesor: cubri el programa, claro, organizado, flexible, responsable, puntual, cumplido, emplea ejemplos
adecuados, seala objetivos de la exposicin, sistemtico, integra la informacin, y relaciona conceptos. Para el programa, las ocho variables que se referan al mismo eran: da una visin general del rea, cubre puntos esenciales, proporciona informacin actualizada, tiene secuencia pedaggica, es interesante. Respecto al sistema de enseanza empleado por el profesor, se averigu si permitia la aplicacin del conocimiento a situaciones prcticas, si era creativo, ' entretenido, si estaba sistematizado, si lograba retencin del conocimiento, si requera ms horas de estudio que los dems, y si era reforzante: un total de siete variables. El instrumento consistia de escalas bipolares, un extremo definido como se menciona en el ' prrafo anterior, y el extremo contrario, con lo opuesto a lo sealado arriba. Se dispona de siete intervalos u opciones de respuesta, tipo diferencial semntico. El instrumento fue aplicado a 262 alumnos que cursaban el sexto semestre de la Carrera de Psicologa, en ese entonces. Se vern los resultados de un anlisis factorial tipo ALPHA, con rotacin oblicua (con una delta = 0.00, valor de default del programa del paquete estadstico del SPSS. En primer lugar aparecen los nombres de las variables incluidas en el anlisis factorial. Inmediatamente a continuacin, aparecen las mismas variables, pero cada una de ellas con la media que la muestra obtuvo, as como su desviacin standard. Tambin se seala el nmero de casos incluidos en el anlisis. Como siguientes resultados, aparece una matriz de intercorrelaciones, que muestra las correlaciones existentes entre todas las variables. Al final de la matriz de intercorrelaciones aparece el valor de la determinante de la matriz. Este seala la posibilidad de continuar el anlisis; de ser esto as, significa que la matriz se podr invertir y continuar con el procedimiento que lleva a la extraccin de los factores iniciales. A continuacin se presenta la comunalidad estimada para cada una de las variables incluidas en el anlisis, y la extraccin inicial de los factores. Se observa que se obtienen tantos factores como variables se introducen en el anlisis. Sin embargo, tambin se observa, en la columna de los Valores Eigen, que cinco de ellos (los primeros), adquieren un valor eigen adecuado, o sea, mayor a la unidad. Tambin se puede ver que cada uno de estos factores iniciales explican cierta cantidad de varianza, y por ltimo se indica, en la columna de porcentaje acumulado, el porcentaje de varianza acumulada que explican los primeros cinco factores. En este caso es de 64.6%. Estos datos sealan nicamente, que existe la posibilidad de reducir el nmero original de variables (23) a un nmero menor: cinco. Inmediatamente despus se presenta la matriz factorial de los factores extrados inicialmente. Esta matriz ser ahora la que represente el espacio reducido de variabilidad que se emplear para continuar el anlisis de los datos. Como se puede observar, en el primer factor se encuentran cargando, con pesos factoriales superiores a 0.40, 21 de las 23 variables incluidas. En el segundo, cuatro variables; en el tercero una; en el cuarto ninguna, y en el quinto, una variable. Esta matriz inicial, no est cumpliendo con ninguno de los tres criterios que se deben reunir para una solucin factorial adecuada, y que son: a) el de estructura simple; b) el de desarrollo positivo; c) facilidad de interpretacin. El primer criterio significa que las variables que carguen alto en un factor, no lo hagan en otro; el segundo significa que las cargas factoriales deben ser positivas; el tercero no necesita explicacin. En el caso de esta matriz, no se cumple ninguno de los tres criterios antes mencionados. Las cuatro variables que cargan alto en el factor dos, tambin lo hacen en el factor uno; hay muchas cargas factoriales en la matriz que tienen signos negativos; por ltimo, si se est partiendo de la idea de que se estn
midiendo tres cosas: el profesor, el programa y el sistema de enseanza, el hecho de que tantas variables carguen en el factor uno, es difcilmente interpretable. Por otro lado, esta es la matriz inicial de extraccin de factores, que tiene como principal propsito determinar si la matriz inicial de correlaciones es susceptible de reducirse a una matriz ms pequea. Los datos de este estudio si se pueden reducir lo que se obtiene es una matriz de cinco columnas (factores iniciales) y de 23 hileras (las variables originales). El hecho de que no se cumpla con los criterios arriba sealados, se debe tambin al hecho de que en los procedimientos de anlisis factorial, el primer paso en la reduccin de variables se hace empleando el mtodo de componentes principales, que extrae un primer factor general, aquel que explica la mayor cantidad de varianza de la matriz inicial de intercorrelaciones. Esta primera solucin es matemticamente perfecta; sin embargo, carece de sentido terico, puesto que no ha sido llevada a cabo la rotacin, que tiene por objeto principal, hacer lo posible para que se cumplan los criterios arriba sealados. Por lo tanto, el siguiente paso es rotar los ejes. En esta ocasin se solicit una rotacin oblicua, con valor de delta = 0.00. La razn por la cual se solicit este tipo de rotacin fue que se penso que las caractersticas del profesor, deberan estar relacionadas con la forma en que da clase y si cumple o no el programa de la materia. En otras palabras, los tres aspectos estn relacionados entre si. De esta manera, los datos que aparecen despus de la matriz inicial de factores, informan de la estimacin de la comunalidad de las variables despus de haber sido rotados los ejes. Esta comunalidad estimada despus de la rotacin es muy importante, para efectos de calcular la validez relevante (Guilford, 1954) de los factores encontrados. Se hablara de este tema en el siguiente captulo. Tambin se presentan los valores eigen de los factores extrados despus de la rotacin. Como puede observarse, los dos primeros factores obtienen valores eigen muy altos, mientras que los tres ltimos los obtienen ms pequeos. As mismo, la cantidad de varianza del espacio reducido que cada factor explica , es mucho muy alta para el primer factor (70.4%); un poco ms pequea para el segundo factor (12.9%). Cada uno de los restantes factores, explica paulatinamente una menor cantidad de varianza. Los cinco factores obtenidos explican el 100% de la varianza acumulada del espacio de variabilidad reducido de las variables en estudio. Inmediatamente a continuacin, aparecen los criterios de las cargas oblicuas mnimas empleados en la iteracin. Como se puede observar, en la iteracin 13, aparece un valor cuyas tres unidades despus del punto decimal, ya no sufren modificaciones en iteraciones posteriores (de la 14 a la 16). Comprobndose as, que se requirieron 13 iteraciones para estabilizar las estimaciones de la comunalidad de las variables que se colocaron en la diagonal de la matriz de correlaciones para extraer los factores terminales. A continuacin aparece el patrn factorial, que es una matriz rectangular que contiene en las columnas, la cantidad de cada uno de los fatores que tiene cada variable. Es decir. La primera hilera de valores, corresponden a la indicacin que seala cunto de cada factor tiene la variable cubripro. Estos valores son semejantes a los coeficientes de regresin, y se interpretan de la misma manera. Sin embargo, esta no es la matriz que sirve para interpretar los factores obtenidos. Slo seala, cunto de cada factor tiene cada variable. La siguiente, es una pequea matriz cuadrada, que seala las correlaciones existentes entre los factores obtenidos. Como se puede ver, los factores que ms correlacionan entre s, son el 1 con el 4 (-0.57806); el 2 con el 4 (-0.46905), y por ltimo, el 1 con el 3 (-0.38191). Todas las
correlaciones son negativas, lo que significa que a ms de uno, menos del otro. Parece que son en realidad factores complementarios entre s. Esta matriz de correlaciones slo aparece en el listado de datos cuando el mtodo de rotacin empleado fue el oblicuo, y proporciona informacin referida a que tan correcta era la suposicin de la existencia de una relacin entre los factores que se suponan se encontraban subyacentes en las variables estudiadas. Como puede verse, los tres valores de las correlaciones antes sealadas, son: primero, estadsticamente significativos, con una p asociada <0.01; y segundo, de magnitud moderada pero interesante. Esta matriz confirma o no la suposicin previa de relacin entre los factores. En este caso, la suposicin fue confirmada. La siguiente, es la matriz de la estructura factorial. Esta es la matriz que se emplea para interpretar los factores obtenidos. Se sabe que hay cinco factores, todos con valores eigen mayores a la unidad, y todos explicando alguna parte ms o menos importante de varianza. Sin embargo, tambin se sabe que el factor 4 correlaciona de manera no despreciable, con los factores 1 y 2; y que el factor 3 correlaciona, de la misma manera, con el 1. Por lo tanto, se procede a la interpretacin, de los primeros tres factores, ya que el cuarto, parece ser el inverso del primero, y el quinto, contiene una sola carga > a 0.40. Como se puede ver, en el primer factor cargan, con valores superiores a 0.40, las siguientes variables: el profesor es claro, ejemplifica en forma adecuada, seala objetivos de exposicin, es sistemtico, integra el conocimiento y relaciona conceptos; el programa da una visin general del rea, cubre los puntos esenciales, proporciona informacin actualizada, tiene secuencia pedaggica y es interesante; el sistema de enseanza permite aplicar el conocimiento a situaciones prcticas, es creativo, entretenido, est sistematizado, permite la retencin de la informacin, requiere ms horas de estudio que otros, y es reforzante. Aparentemente, este es un gran factor, muy general, que involucra a toda la situacin de enseanza: el profesor y sus caractersticas, el programa de la materia y el sistema de enseanza empleado. Si se deseara, este factor podra ser el nico que se conservara, ya que explica, l slo, el 70.4% de la varianza, y esto es bueno. Se podra interpretar (o llamar) como SITUACION DE ENSEANZA. Si se optara por tener un factor "puro" que no se repitiera en los dems, se podran dejar slo las variables relacionadas con el sistema de enseanza, e interpretarlo (o llamarlo) SISTEMA DE ENSEANZA. Desde otra perspectiva, el investigador puede preferir trabajar con factores "puros", y optar por considerar a los siguientes factores obtenidos. Es decir, puede optar por trabajar con un nmero mayor de factores "puros", y por lo tanto, continuar analizando los siguientes dos factores, por ejemplo. En el factor 2 cargan con pesos > 0.40, las siguientes variables: el profesor es claro, organizado, responsable, puntual, cumplido, ejemplifica en forma adecuada, es sistemtico, y establece relaciones entre conceptos; el sistema de enseanza es entretenido y est sistematizado. Este factor, excluyendo las dos ltimas variables, se refiere especficamente a caractersticas del profesor, y as se podra emplear. Se interpretara (es decir, se nombrara) como CARACTERISTICAS DEL PROFESOR. El tercer factor obtenido, est constituido por las siguientes variables: el profesor cubri el programa de la materia y seala los objetivos de la exposicin; el programa da una visin general del rea, cubre los puntos esenciales, contiene informacin actualizada, tiene secuencia pedaggica y es interesante. Este factor, quitando las variables correspondientes al profesor (las dos primeras), sera un factor "puro", referido al programa de la materia, por lo cual se podra llamar (o interpretar como) PROGRAMA O CONTENIDO DE LA MATERIA. El cuarto factor est constituido por casi las mismas variables que el primero, pero todas ellas con cargas de signo negativo. Este factor puede considerarse el inverso del primero. En la medida
que sera redundante permanecer con l, se puede desechar, pues proporcionara la misma informacin que el primero, pero a la inversa. Por ltimo, el quinto factor slo contiene una variable con una carga > a 0.40: el profesor es flexible. Como de acuerdo a Harman (1976), para que un factor pueda ser considerado como tal debe incluir, por lo menos tres variables con carga factorial alta, y como este no es el caso, este factor queda automticamente descartado. De acuerdo a los resultados de este anlisis, parece que se obtuvieron: o un factor general, SITUACIN DE ENSEANZA, o tres factores "puros": SISTEMA DE ENSEANZA, CARACTERISTICAS DEL PROFESOR, y PROGRAMA O CONTENIDO DE LA MATERIA. La ltima matriz de resultados es la llamada matriz de coeficientes de calificacin factorial. Esta matriz es la que sirve para obtener calificaciones factoriales en los Sujetos a los que se les aplicara este instrumento. En lugar de obtener una calificacin para cada variable, se obtendra una sola calificacin factorial (si se opta por el nico factor general) o tres calificaciones factoriales, cada una correspondiente a cada uno de los tres factores "puros" obtenidos. El procedimiento para obtener los puntajes factoriales, consiste en transformar los puntajes crudos obtenidos por los Sujetos en cada una de las variables que constituyen un factor, en puntajes z, y multiplicarlos por los coeficientes que les corresponden en cada factor, realizando una suma algebraica de los resultados multiplicados. El total de esta suma, corresponde al puntaje factorial del Sujeto en ese factor. Los coeficientes factoriales se presentan en esa ltima matriz del ejemplo numrico. 7.9 Ejemplo Numrico Lista de variables Cubripro (El profesor cubri el programa de la materia) Claro (es claro en su exposicin) Organiz (es organizado) Flex (es flexible) Respon (es responsable) Puntual Cumpli (es cumplido) Ejeadecu (ejemplifica en forma adecuada) Senobex (seala el objetivo de su exposicin) Sisteco (es sistemtico) Intgro (integra la informacin al conocimiento existente) Relcepto (relaciona conceptos) Vigrare (El programa se da una visin general del rea) Cuptesen (cubre puntos esenciales) Infact (la informacin es actualizada) Secpeda (tiene secuencia pedaggica) Intest (es interesante) Alcopra (El sistema de enseanza permite la aplicacin del conocimiento a situaciones prcticas) Creativo Entredo (es entretenido)
Sistedo (est sistematizado) Lograret (permite la retencin del conocimiento) Mashre (requiere de ms horas de estudio) Reforza (es reforzante)
Variables Incluidas en el Estudio

VARIABLE Cubripro Claro Organiz Flex Respon Puntual Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza MEDIAS 5.4695 5.8626 5.7137 5.8053 6.0033 5.8053 6.0038 5.8511 5.1985 5.4924 6.1412 5.8511 5.5344 5.6221 5.1031 5.2824 5.5267 5.2710 5.1298 5.3397 5.4237 5.5191 4.7557 5.2405 DESV. STANDARD 1.9251 1.0487 1.3036 1.3377 1.2821 1.4895 1.3490 1.5076 1.8107 1.5231 1.3359 1.3634 1.6012 1.3863 1.5977 1.5049 1.8145 1.7351 1.7459 1.7560 1.3785 1.3609 1.7313 1.5948 N 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262 262
Coeficientes de Correlacin Se presentan los datos de la Matriz Simtrica en forma colapsada con objeto de no ocupar tanto espacio.
Cubripro Cubripro 1.00000 Claro Organiz Flex Respon Puntual Cumplio 0.29585 Ejeadecu 0.13639 Claro 0.15923 1.00000 Organiz 0.21712 0.47278 1.00000 Flex 0.17547 0.31132 0.28870 1.00000 0.28490 0.33514 Respon 0.18090 0.51333 0.56691 0.46287 1.00000 0.55160 0.44830 Puntual 0.05203 0.22809 0.36386 0.26357 0.40969 1.00000 0.57430 0.25492
0.45805 0.62678
0.50172 0.35840
Cubripro Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza 0.24577 0.21487 0.06053 0.19751 0.15198 0.28782 0.25951 0.32039 0.18670 0.07074 0.20979 0.20426 0.19619 0.15524 0.06673 0.12532
Claro 0.48858 0.43110 0.43780 0.61265 0.38616 0.38581 0.43152 0.49080 0.47510 0.33638 0.48478 0.45820 0.49362 0.44747 0.21356 0.46424
Organiz 0.38939 0.43597 0.17071 0.31222 0.22408 0.26006 0.22394 0.30698 0.27942 0.25464 0.30762 0.35397 0.40036 0.28708 0.08094 0.26176
Flex 0.20266 0.14876 0.31989 0.34116 0.28843 0.27835 0.22992 0.22534 0.32652 0.21099 0.36027 0.32348 0.18617 0.21776 0.16632 0.28781
Respon 0.27366 0.40715 0.34196 0.45404 0.24536 0.27891 0.28413 0.23774 0.34336 0.21311 0.38149 0.36704 0.42399 0.38754 0.10054 0.34996
Puntual 0.19764 0.37510 0.28729 0.31583 0.17390 0.19618 0.17268 0.15110 0.25639 0.17467 0.14677 0.31103 0.34447 0.20691 0.06172 0.28106
Cumplio Ejeadecu Senobex Sisteco Intgro Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza 1.00000 0.42227 1.00000 0.29615 0.53722 1.00000 0.45779 0.47256 0.49375 1.00000 0.31273 0.24813 0.27192 0.38707 0.35221 0.27407 0.32600 0.44149 0.54443 0.38454 0.19253 0.41164
Relcepto 0.44191 0.66581 0.52106 0.55387 0.59217 1.00000 0.46829 0.37959 0.43799 0.52660 0.50726 0.35884 0.50871 0.53490 0.45565 0.53117 0.19391 0.47464
0.22931 0.40999 0.43347 0.46847 1.00000 0.35505 0.18616 0.24807 0.27549 0.37858 0.30245 0.38308 0.46784 0.25867 0.39998 0.19057 0.48754
0.20480 0.26915 0.19714 0.29576 0.29814 0.24017 0.23729 0.34719 0.47711 0.33908 0.08570 0.29519
0.42828 0.44780 0.50747 0.48977 0.55541 0.42853 0.52558 0.56482 0.47109 0.61484 0.25758 0.55197
0.37163 0.35970 0.39951 0.51507 0.40305 0.38649 0.41966 0.42941 0.38064 0.41982 0.25630 0.40932
Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza
Vigrare 1.00000
Cuptesen 0.51591 1.00000
Infact 0.57147 0.61446 1.00000
Secpeda 0.51112 0.59312 0.58702 1.00000 0.46575 0.47101 0.46661 0.50059 0.26186 0.47605
Intest 0.66893 0.53333 0.58123 0.55146 1.00000 0.50081 0.52083 0.43737 0.56844 0.21308 0.59026
0.44655 0.41485 0.30348 0.48057 0.22969 0.55563
0.47624 0.38189 0.39886 0.49225 0.28226 0.50396
0.55560 0.44635 0.37674 0.51804 0.29447 0.52856
Alcopra 0.51171 0.44254 0.44737 0.41958 0.52403 1.00000 0.55623 0.52299 0.49805 0.65250 0.37158 0.65481
Creativo Entredo Creativo 1.00000 0.71417 Entredo 1.00000 Sistedo Lograret Mashre Creativo Entredo Reforza Cubripro Claro Organiz Flex Respon Puntual Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra 0.20979 0.48478 0.30762 0.36027 0.38149 0.14677 0.23729 0.52558 0.41966 0.32600 0.38308 0.50871 0.44655 0.47624 0.55560 0.46575 0.50081 0.55623 0.20426 0.45820 0.35397 0.32348 0.36704 0.31106 0.34719 0.56482 0.42941 0.44149 0.46784 0.53490 0.41485 0.38189 0.44635 0.47101 0.52088 0.52299
Sistedo 0.52151 0.58137 1.00000
Lograret 0.55204 0.52716 0.58079 1.00000
Mashre 0.39331 0.30466 0.20888 0.22801 1.00000
Reforza 0.60520 0.63153 0.53905 0.68192 0.34465 Reforza 1.00000 0.12532 0.46424 0.26176 0.28781 0.34996 0.28106 0.29519 0.55197 0.40932 0.41164 0.48754 0.47464 0.55563 0.50396 0.52856 0.47605 0.59026 0.65481
Sistedo 0.19619 0.49362 0.40036 0.18617 0.42399 0.34447 0.47711 0.47109 0.38064 0.54443 0.25867 0.45565 0.39348 0.39886 0.37674 0.46661 0.43737 0.49805
Lograret Mashre 0.15524 0.44747 0.28708 0.21776 0.38754 0.20691 0.33908 0.61484 0.41982 0.38454 0.39998 0.53117 0.48057 0.49225 0.51804 0.50059 0.56844 0.65250 0.06623 0.21356 0.08094 0.16632 0.10054 0.06172 0.08570 0.25758 0.25630 0.19253 0.19057 0.19391 0.22969 0.28226 0.29447 0.26186 0.21308 0.37158
Determinante de la Matriz de Correlacin: 0.0000008(.76729617D-06)
Extraccin Inicial de Factores

Variables Cubripro Claro Organiz Flex Respon Puntual Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza Comunalidad Estimada 0.26234 0.60245 0.50207 0.35291 0.57259 0.45807 0.58886 0.65748 0.49235 0.55541 0.55723 0.67056 0.56308 0.53239 0.58656 0.58552 0.60746 0.60430 0.66634 0.66407 0.60749 0.67127 0.24488 0.67377 Factor Valor Eigen 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 9.95867 2.09219 1.28735 1.10993 1.06624 0.96803 0.83236 0.77401 0.63917 0.56751 0.53665 0.49609 0.46448 0.43458 0.36945 0.35744 0.34225 0.31578 0.28462 0.27217 0.24038 0.22581 0.19454 0.17032 Porcentaje de Varianza 41.5 8.7 5.4 4.6 4.4 4.0 3.5 3.2 2.7 2.4 2.2 2.1 1.9 1.8 1.5 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 Porcentaje Acumulado 41.5 50.2 55.6 60.2 64.6 68.7 72.1 75.4 78.0 80.4 82.6 84.7 86.6 88.4 90.0 91.5 92.9 94.2 95.4 96.5 97.5 98.5 99.3 100.0
La Convergencia requiri 13 iteraciones.
Matriz Inicial de Factores Usando Alpha

Variables Cubripro Claro Organiz Flex Respon Puntual Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza Factor 1 0.29230 0.69302 0.51210 0.44821 0.58111 0.39641 0.55585 0.73033 0.63557 0.61499 0.55630 0.74404 0.63813 0.64452 0.67466 0.69722 0.71896 0.65687 0.73422 0.73873 0.68923 0.72570 0.35367 0.76577 Factor 2 0.07562 0.14645 0.41757 0.15899 0.48089 0.40620 0.58870 0.01447 0.01042 0.29385 0.07299 0.12642 -0.24828 -0.23832 -0.30689 -0.18721 -0.17041 -0.34935 -0.23248 -0.05270 0.10377 -0.16047 -0.20503 -0.23852 Factor 3 -0.35501 0.02689 -0.13164 -0.00777 0.01451 0.11381 -0.13411 0.10226 -0.04435 0.09228 0.40789 0.13072 -0.04418 -0.33897 -0.24396 -0.33483 -0.04007 0.19005 0.06002 0.14996 0.02540 0.09991 0.05433 0.23183 Factor 4 -0.05919 -0.13741 0.06157 0.26125 0.21238 0.16824 0.12984 -0.12124 -0.33498 -0.29620 -0.22130 -0.29051 0.05064 0.13901 0.03702 -0.19481 0.07238 0.22112 0.10093 0.04281 0.05265 0.04364 0.02979 0.14449 Factor 5 -0.01610 -0.09295 0.07382 -0.41539 -0.15501 0.07263 0.17331 -0.06714 0.00655 0.19654 -0.24644 -0.17937 -0.08172 -0.02207 -0.06507 0.02552 -0.08259 0.24465 -0.04392 0.05714 0.37282 0.15536 0.00627 0.10099
EXTRACCION FINAL DE FACTORES

Variables Cubripro Claro Organiz Flex Respon Puntual Cumplio Ejeadecu Senobex Sisteco Intgro Relcepto Vigrare Cuptesen Infact Secpeda Intest Alcopra Creativo Entredo Sistedo Lograret Mashre Reforza Comunalidad 0.22103 0.52997 0.46315 0.46622 0.63852 0.36871 0.72031 0.59292 0.51829 0.59955 0.50090 0.70325 0.48006 0.60471 0.61446 0.67185 0.55961 0.60836 0.60887 0.57609 0.62833 0.58843 0.17100 0.72810 Factor 1 2 3 4 5 Valor Eigen 16.90624 3.09706 1.67751 1.20051 1.11994 Porcentaje Porcentaje de Varianza Acumulado 70.4 12.9 7.0 5.0 4.7 70.4 83.3 90.3 95.3 100.0
Rotacin para las Cargas Directas Oblcuas Mnimas

Delta: 0.00 Iteracin 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Criterio Dirobl 9.604620 8.854873 6.848895 5.404501 4.742260 4.432165 4.327395 4.285476 4.266867 4.258130 4.253802 4.251567 4.250385 4.249757 4.249426 4.249253 4.249164
7.10 1. 2. 3. 4. 5. 6. 7. 8. 7.11
Gua de Estudio Determinar cundo una variable es compleja. Sealar los principales objetivos del anlisis factorial. Distinguir entre factores inferidos y definidos. Sealar el objetivo de la rotacin a factores terminales. Indique los requisitos que debe cumplir una solucin factorial adecuada. Distinguir entre los mtodos oblicuos y los ortogonales de rotacin Sealar en qu consiste interpretar un factor. Sealar la diferencia que existe entre la matriz del patrn factorial y la matriz de la estructura factorial. Autoevaluacin
7.11.1 Preguntas 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Qu caracterstica muy importante tienen que tener las variables que se sometan a anlisis factorial? Qu caracterstica tienen que tener los reactivos que se incluyan en un anlisis factorial? A qu preguntas responden los factores definidos y los inferidos en anlisis factorial? Cules son los indicadores de la bondad de los factores obtenidos? Cundo se utiliza un mtodo de rotacin ortogonal y cundo uno oblicuo? Qu significa interpretar un factor? Qu ventaja tiene el mtodo alpha de extraccin de factor3es, para el desarrollo de instrumentos heterogneos? Cul es el tamao mnimo que debe tener una muestra para ser empleada en el desarrollo de un instrumento heterogneo por medio del anlisis factorial? Cul de los tres mtodos de rotacin ortogonal existentes es el mejor? Cules son los requisitos que debe cumplir una solucin factorial adecuada?
7.11.2 Respuestas
1. Las variables que se someten a anlisis factorial, tienen que distribuirse en forma normal en la poblacin 2. Los reactivos que se incluyen en un anlisis factorial deben ser de opcin mltiple; de preferencia de cinco opciones. 3. Los factores definidos responden a la pregunta sobre la posibilidad de reduccin del nmero de variables a un nmero menor; los inferiores responden a la pregunta que se refiere a la estructura subyacente que determina las intercorrelaciones observadas entre los reactivos incluidos. 4. Los factores obtenidos se califican en cuanto a su bondad, empleando la siguiente informacin: a) cantidad de varianza explicada por el factor (entre ms grande, mejor); b) valor eigen obtenido por el factor (siempre mayor que la unidad, y entre ms grande, mejor), c) orden de aparicin: los que aparecen primero son mejores que los que aparecen despus. 5. El mtodo de rotacin ortogonal se emplea cuando el investigador supone independencia (no correlacin entre los factores que va a obtener; el oblicuo supone dependencia (o correlacin) entre los factores que va a obtener. 6. Interpretar un factor significa darle un nombre. El nombre se le da en virtud de lo que tienen en comn las variables que cargan alto en ese factor. 7. El mtodo alpha de extraccin de factores tiene la ventaja de extraer factores que son consistentes internamente. Es decir, los factores quedan constituidos por variables consistentes entre s; esto obvia la necesidad de determinar la confiabilidad de consistencia interna de los factores obtenidos. 8. El tamao mnimo que debe tener la muestra que se emplee para desarrollar instrumentos por medio del mtodo alpha de extraccin de factores es de 5 sujetos por reactivo que se incluya: idneamente debera tener 10 sujetos por reactivo. 9. Ninguno de los tres mtodos de rotacin ortogonal existentes es mejor que otro. La eleccin que hace el investigador de alguno de ellos, dependen de sus objetivos, y de la medida en que desea se cumplan los requisitos que debe tener una solucin factorial adecuada. 10. Los requisitos que debe cumplir una solucin factorial adecuada son los siguientes: a) desarrollo positivo (que la mayora de las cargas tengan signo positivo; b) estructura simple (que las variables que carguen alto en un factor, carguen bajo o cero en los dems)
VIII. CONFIABILIDAD DE LOS INSTRUMENTOS 8.1 Concepto de Confiabilidad En las ciencias sociales, as como en todas aquellas ciencias donde se utilicen instrumentos para llevar a cabo mediciones, una de las preocupaciones ms importantes que tienen los cientficos, es la de que sus instrumentos de medicin sean confiables. En general, por confiabilidad se entiende el hecho de poder "confiar" en que las mediciones realizadas sean correctas. Que las magnitudes de aquellos aspectos medidos, sean de confiar. Es decir, que si se vuelve a medir esos mismos aspectos, se obtendrn magnitudes, si no idnticas, por lo menos si semejantes. En otras palabras: se dice que la confiabilidad de un instrumento se refleja en el que el mismo instrumento empleado en dos o ms ocasiones para medir los mismos atributos de los mismos objetos o Sujetos, arroja magnitudes iguales. La confiabilidad tiene que ver con el error de medicin. Como ya se seal al principio de este texto, todos los instrumentos estn acompaados de error; se establece que este error puede ser de dos tipos: aleatorio y sistemtico. Del aleatorio da cuenta la teora del error de medicin presentado en el Captulo III. El sistemtico es el error que se tiene que determinar de manera emprica. Es decir: se tiene que determinar en forma emprica, para cada instrumento de medicin que se elabore o emplee, la cantidad de error sistemtico que ste contiene. La cantidad de error que contenga no debe sobrepasar de cierta magnitud, para poder decir que el instrumento es confiable. La mayora de los investigadores han optado por aceptar como confiables, a los instrumentos que tengan 15% o menos de error sistemtico. En otras palabras, se dice que un instrumento es confiable si su coeficiente arroja un valor de 0.85 o ms. Un instrumento perfectamente confiable tendra un coeficiente de confiabilidad de 1.00. En la prctica, esto nunca es as, mucho menos en ciencias sociales. 8.2 Tipos de Confiabilidad Existen diferentes tipos de confiabilidad que dependen del tiempo en que se hacen las mediciones, de los instrumentos que se emplean y del comportamiento interno de los mismos. A continuacin se presentan cada una de ellas, as como el procedimiento emprico que se efecta para calcularla: los procedimientos estadsticos que se emplean para determinar sus ndices o coeficientes. 8.2.1 Estabilidad Temporal. Se dice que un instrumento tiene estabilidad temporal cuando al emplearlo en dos ocasiones diferentes, con los mismos Sujetos, arroja resultados semejantes. Es decir, si se mide la inteligencia a un grupo de individuos, por ejemplo hoy, y se les vuelve a medir maana, se deberan obtener resultados semejantes o muy parecidos. Si hoy un Sujeto tiene un coeficiente intelectual de 100, maana, al volverle a medir inteligencia empleando el mismo instrumento, debera obtener una calificacin muy semejante a la del da anterior. Si esto sucede, se dice que el instrumento tiene estabilidad temporal. El procedimiento que se emplea para determinar la estabilidad temporal de un instrumento, es el de aplicarlo en dos ocasiones, a los mismos Sujetos, bajo las mismas circunstancias y con las mismas instrucciones, es decir, en forma estandarizada, y obtener la correlacin de los puntajes obtenidos por los Sujetos en ambas aplicaciones. A este procedimiento se le conoce como test-retest.
El coeficiente de correlacin que se emplea depende del nivel de medicin del instrumento: si es nominal, se emplea el Coeficiente C de Contingencia (ver Siegel, 1976); si es ordinal, se puede emplear el coeficiente de correlacin de rangos de Spearman (ver Siegel, 1976); si es intervalar, se puede emplear el coeficiente de correlacin Producto-Momento de Pearson (ver Downie y Heath). Este tipo de confiabilidad es especialmente importante para aquellos instrumentos que miden variables que sufren cambio en el tiempo, debido a una manipulacin experimental o al desarrollo o maduracin del individuo. Por ejemplo, ser importante para aquellos instrumentos que miden actitudes, en programas de cambio actitudinal, donde se debe determinar que el cambio observado en la actitud entre la pre y la post medicin se debi a la manipulacin experimental y no a que el instrumento carece de estabilidad temporal. Es tambin importante cuando se mide una variable en diferentes ocasiones, en las que se espera que esta se modifique como resultado del paso del tiempo, y no que los cambios que se observen se deban a falta de confiabilidad del instrumento. 8.2.2 Homogeneidad de Varianza o Equivalencia de Formas En los casos en que se debe medir una variable en dos ocasiones, pero se corre el riesgo de que el Sujeto recuerde las respuestas de la primera ocasin y esto influya en las respuestas que de en la segunda ocasin; o en aquellos casos en los que el responder en la primera ocasin puede producir fatiga y sta afectar las respuestas de la segunda, se requiere tener formas equivalentes del instrumento. Es decir, dos instrumentos diferentes, pero que midan la misma variable. A estas formas equivalentes se les llama pruebas paralelas. En el captulo III, donde se presenta el Modelo de las Pruebas Paralelas, se establecen las caractersticas estadsticas que stos deben tener para ser consideradas como tales. Para establecer el coeficiente de equivalencia, se aplican las formas paralelas o equivalentes del instrumento, cada una en una ocasin, o el mismo da, uno primero y otro despus, al mismo grupo de Sujetos, en forma estandarizada, y se correlacionan los resultados obtenidos en los dos instrumentos. Los coeficientes de correlacin que se empleen dependen del nivel de medicin que posean los instrumentos, al igual que en la seccin anterior. 8.2.3 Consistencia Interna Este tipo de confiabilidad se refiere al comportamiento del instrumento a su interior, Es decir, al comportamiento de la estructura interna del mismo. En otras palabras, al comportamiento, en trminos de variabilidad, que tienen los reactivos o afirmaciones que los constituyen, respecto a ellos mismos, considerados por separado o en conjunto. Dicho de otra manera, con este tipo de confiabilidad se establece el grado o nivel de consistencia interna de los reactivos que lo constituyen. Es decir, si se portan igual o no, en cuanto a la forma en que varan, entre ellos mismos. La lgica subyacente seala que si se portan igual, unos a otros, miden lo mismo, de la misma manera; o sea, que son consistentes entre s Dependiendo de la forma en que se determina la consistencia interna del instrumento, este tipo de confiabilidad se subdivide a su vez, en diferentes subtipos. A continuacin cada uno de ellos.
8.2.3.1 Mitades El procedimiento de mitades para establecer la consistencia interna de un instrumento consiste en dividir al mismo en dos partes: la primera y la segunda mitad (si los reactivos tienen el mismo grado de dificultad), y calcular la correlacin entre la calificacin obtenida en la primera mitad, con aquella obtenida en la segunda. Este coeficiente establece la consistencia existente entre ambas partes del instrumento. Si los reactivos que constituyen el instrumento tienen un nivel creciente de dificultad, o se contestan contra reloj (son pruebas de velocidad), las mitades se establecen de otra manera. Se forman dos grupos de reactivos, en uno de ellos se coloca a los reactivos pares y en el otro a los nones. A este procedimiento se le conoce como pares y nones. Se determina entonces la calificacin que los sujetos obtienen en cada una de estas dos mitades, y se calcula la correlacin existente entre ellas. 8.2.3.2 Instrumentos Con Dos Opciones de Respuesta Cuando los instrumentos tienen reactivos, afirmaciones o preguntas que se contestan en una de dos opciones de respuesta, y una de ellas tiene asignado un valor o peso de 0 y la otra de 1, la consistencia interna de los mismos, se establecen por medio del coeficiente de Kudder-Richardson, cuya frmula se presenta a continuacin: (8.1) rkk = k k-1 ( 1 - pq) sy2
dnde: rkk = coeficiente de correlacin entre reactivos k = nmero de reactivos pq = suma del producto de la proporcin de Sujetos que contest en la opcin 1 por la proporcin de sujetos que contest en la opcin 0, para todos los reactivos de la prueba sy2 = varianza de la calificacin total de la prueba Si la magnitud del coeficiente obtenido con la frmula (K-R) no alcanza a ser de 0.85 o mayor, se procede entonces a determinar los valores de las correlaciones existentes entre cada reactivo y la calificacin total de los reactivos. La razn de esto se debe a que alguno o algunos de los reactivos no son consistentes entre s, y esta es la causa por la que no se alcanz el valor deseado del coeficiente. Se debe encontrar ese o esos reactivos. A este procedimiento de consistencia interna se le conoce como el anlisis correlacin item-test. El objetivo del mismo es el de encontrar aquel o aquellos reactivos que no estn correlacionando de manera semejante a la mayora, con la calificacin total. Una vez detectado(s) aquel(los) reactivo(s) que est(n) causando problema, se elimina(n) del instrumento, y se vuelve a calcular el coeficiente de Kudder-Richardson. Lo ms probable es que en esta segunda ocasin, se encuentre un coeficiente de 0.85 o mayor. El coeficiente de correlacin que se emplea para determinar la correlacin entre el reactivo y la calificacin total, es el biserial-puntual. Se puede consultar a Downie y Heath () para ver su desarrollo y aplicacin en un conjunto de datos.
8.2.3.3. Instrumentos Con Tres o Ms Opciones de Respuesta Cuando los instrumentos tienen reactivos con tres o ms opciones de respuesta, la consistencia interna se calcula con el coeficiente alfa de Cronbach, que se present en el Captulo IV. Por esta razn no se le ver aqu. Si el coeficiente obtenido con el alfa de Cronbach no adquiere una magnitud de 0.85 o ms, se deber proceder a calcular las correlaciones reactivo-calificacin total. Pero en este caso, se deber emplear el coeficiente de correlacin Producto-Momento de Pearson. Una vez detectados el o los reactivos que estn causando el problema, se quitan de la prueba y se vuelve a calcular el alfa de Cronbach. En ocasiones, los reactivos problema son muy fciles de detectar, ya que adquieren valores de correlacin marcadamente diferentes que la mayora. Cuando este no es el caso, un procedimiento conveniente de seguir, es el siguiente: comptese el valor promedio de las correlaciones de todos los reactivos que constituyen el instrumento, prueba o escala; comptese la desviacin estndar de la distribucin de correlaciones; elimnense los reactivos que tengan valores de correlacin reactivo-calificacin total, que caigan por fuera de dos desviaciones estndar a la derecha o a la izquierda de la media. Vulvase a calcular el alfa de Cronbach. Si an as no se alcanza un valor adecuado, elimnense, si el nmero de reactivos lo permite, los valores de correlacin ms all de una desviacin estndar a la derecha o izquierda de la media. Por lo general, no ser necesario llegar a este tercer paso. Casi siempre, se alcanzan coeficientes adecuados, con la primera eliminacin de reactivos problemticos. La confiabilidad de consistencia interna se calcula de preferencia cuando se va a elaborar un instrumento que se emplear en una sola ocasin. Como se puede observar, los coeficientes de confiabilidad estn ntimamente relacionados con los modelos de medicin presentados en el captulo III. La confiabilidad de estabilidad temporal deriva de la teora de la medicin del error. La confiabilidad de equivalencia de formas, deriva del modelo de las pruebas paralelas. La confiabilidad de consistencia interna, en cualquiera de sus versiones, deriva del modelo dominio-muestra. En realidad, cuando se elaboran instrumentos para escalar personas, lo que se hace es buscar construir un instrumento que tenga la confiabilidad adecuada al objetivo de la investigacin que pretende llevar a cabo el investigador. Cuando se elabora un instrumento, no es requisito indispensable calcularle todos los tipos de confiabilidad. En realidad el investigador le calcula aquella que el instrumento necesita tener dados los objetivos de su investigacin. Por lo general el procedimiento es como sigue: el instrumento se elabor para un programa de cambio actitudinal, deber entonces de calculrsele la confiabilidad de estabilidad temporal y la de equivalencia de formas. En otra ocasin, otro investigador lo desea para otros fines: una aplicacin en un estudio de campo, y entonces determina alguna de las diversas consistencias internas. Sin embargo, siempre que se publiquen los resultados, deber sealarse cul tipo de confiabilidad se estableci, cul fue su magnitud y si fue estadsticamente significativa. Tambin deber sealarse si se eliminaron algunos reactivos, cules y porqu. Por ltimo, no debe olvidarse nunca, describir las caractersticas ms importantes de la muestra empleada para la determinacin de la(s) confiabilidad(es). 8.3 Gua de Estudio
1. 2. 3. 8.4
Comprender el concepto de confiabilidad. Distinguir los diferentes tipos de confiabilidad. Indicar los diferentes procedimientos empricos para establecer los diferentes tipos de confiabilidad. Autoevaluacin
8.4.1 Preguntas 1. 2. 3. Qu se entiende por confiabilidad? Qu procedimiento se sigue para determinar los siguientes tipos de confiabilidad: a) estabilidad temporal; b) equivalencia de formas; c) consistencia interna? Cundo es adecuado determinar cada tipo de confiabilidad?
8.4.2 Respuestas 1. Confiabilidad significa medir sin errar; obtener en dos ocasiones que se aplica el mismo instrumento al mismo sujeto, puntuaciones semejantes. 2. Para determinar la estabilidad temporal de un instrumento se sigue el procedimiento de test-retest correlacionado el resultado de ambas aplicaciones. Para determinar la consistencia interna, se pueden establecer las correlaciones entre la primera y la segunda parte; entre los reactivos pares y los nones; entre los reactivos y las calificaciones totales, y emplear los coeficientes de Kudder-Richardson y el de Alpha de Cronbach. 3. La confiabilidad de estabilidad temporal es adecuada para instrumentos que midan variables que se espere se modifiquen con el transcurso del tiempo o con base en el efecto de una intervencin experimental; la confiabilidad de equivalencia de formas es la necesaria para hacer evaluaciones de variables que se modifican en un diseo antes-despus; la confiabilidad de consistencia interna se debe calcular para aquellos instrumentos que se emplearn tan slo una vez, como por ejemplo en investigaciones de campo, con propsitos muy especficos. Si el objetivo de la investigacin o estudio es el de construir especficamente un instrumento, se debern calcular todas ellas.
IX. VALIDEZ DE LOS INSTRUMENTOS 9.1 Concepto de Validez Se dice que un instrumento es vlido, cuando mide lo que pretende medir. Si se construy para medir inteligencia, y la mide, es vlido; si se elabor para medir actitudes, y las mide, es vlido, etc. Aunque su definicin es absolutamente sencilla, alcanzarla es uno de los problemas ms difciles. As como existen diversos tipos de confiabilidad, tambin existen diferentes tipos de validez. A continuacin presentaremos cada uno, y la manera de determinarlos. 9.2 Tipos de Validez La validez puede ser de diferentes tipos dependiendo de la forma en que se construye el instrumento, o de los objetivos del investigador. A continuacin se presentan los diversos tipos de validez. 9.2.1 De Face La llamada validez de face, es aquella que se dice tiene un instrumento que parece medir lo que pretende. Por ejemplo: se dice que la prueba es de historia, por que tiene preguntas sobre datos histricos; se dice que es de aritmtica, por que tiene problemas aritmticos. Para ciertas variables, esto es fcil y obvio de determinar. Pero para otras ya no. Sobre todo para variables como las que estudian los cientficos sociales. 9.2.2 De Contenido La validez de contenido se puede confundir con la primera. De hecho es muy parecida a la primera, pero aqu, son expertos los que dicen si el contenido de un instrumento mide lo que pretende. El procedimiento para determinar si este contenido es vlido es el que se conoce como acuerdo interjueces. Los jueces que se emplean para determinar que tan de acuerdo estn en que el contenido (los reactivos, afirmaciones o preguntas) de un instrumento miden lo que pretenden medir, son de dos tipos: expertos, o jueces especialmente entrenados para llevar a cabo los juicios. Se incluyen adems, clculos estadsticos para determinar si el grado de acuerdo alcanzado se debe a que efectivamente hay acuerdo entre ellos o si este se debe a un efecto aleatorio. Este acuerdo entre jueces puede ser de dos tipos: el que se obtiene por medio de juicios dicotmicos, y el que se obtiene por medio de juicios graduados. 9.2.2.1 Juicios Dicotmicos Cuando se emplea el procedimiento de juicios dicotmicos para establecer la validez de contenido de un instrumento, se busca a un pequeo grupo de jueces "expertos", a quienes se les ensean las preguntas o reactivos de la prueba, y se les pide que digan para cada uno de ellos si pertenecen o no al universo de contenido de la variable que se pretende medir. El grado de acuerdo entre los jueces debe ser de por lo menos de 85% para cada reactivo de los que constituyen la prueba. En ocasiones, los investigadores reportan un promedio del 85% de acuerdo entre los jueces, y tambin se considera como adecuado. Sin embargo, debe recordarse, que en el caso de reportar un promedio de acuerdo entre los reactivos de la prueba, esto significa que para algunos reactivos pudo haber un acuerdo mayor de 85%, pero para otros, el acuerdo individual de algunos reactivos pudo haber sido menor al 85%, y esto deber tomarse en cuenta.
9.2.2.2 Juicios Graduados Cuando se pretende establecer la validez de contenido por medio de juicios graduados, simplemente se est elaborando el instrumento de acuerdo a los modelos de escalamiento de estmulos. Es decir, se pueden emplear los mtodos de intervalos aparentemente iguales o el de pares comparados o intervalos sucesivos, para elaborar el instrumento. En este caso, se debern seguir los procedimientos establecidos y sealados para esos mtodos, y se obtendr al final, un instrumento con validez de contenido. (Vase el Captulo V). Es necesario sealar, sin embargo, que este tipo de validez no es el ms adecuado, ni el ms recomendable. Suele ser necesario, pero no suficiente. Cuando se opta por el, se debe considerar que en realidad es tan slo un paso en el proceso de la elaboracin del instrumento. Cabe indicar tambin, que el procedimiento de juicios graduados, es superior al de juicios dicotmicos, y que de preferencia no se debe emplear este ltimo. 9.2.3 Concurrente La validez concurrente es aquella que hace referencia al hecho de que el instrumento se comporta de manera semejante que otro que mide la misma variable, o que permite discriminar entre grupos extremos de la misma. Los procedimientos para determinarla empricamente son: a) por medio de un criterio externo, y b) por medio de grupos contrastados. 9.2.3.1 Criterio Externo Un criterio externo con el cual se correlacionan los resultados obtenidos por los Sujetos en el instrumento que se est tratando de validar puede ser de diferentes tipos: a) el juicio de expertos, quienes valoran a los mismos individuos que respondieron al instrumento, en aquella variable que se pretende medir; y b) otro instrumento, previamente validado, que mide la susodicha variable, que se aplica a los mismos individuos que respondieron al instrumento que se est validando. En ambos casos, se calculan las correlaciones de los puntajes obtenidos por los Sujetos de acuerdo a los expertos o en el otro instrumento, y los que obtuvieron en el instrumento que se est sometiendo al proceso de validacin. 9.2.3.2 Grupos Contrastados Cuando se emplea este procedimiento para establecer la validez concurrente del instrumento, lo que se hace es buscar Sujetos que punten alto y bajo en la variable medida, y comparar los resultados promedio obtenidos por los dos grupos (alto y bajo). Estos grupos alto y bajo se pueden obtener de dos maneras: a) escogiendo de entre la muestra de construccin del instrumento al 25% de los Sujetos con puntajes ms altos y al otro 25% de Sujetos con los puntajes ms bajos. Este procedimiento corresponde al mtodo de escalamiento de personas por medio de la tcnica Likert (Vase el Captulo VI). Debe aclararse, que en este caso, lo que se compara por medio de la prueba t de Student, es el promedio de las calificaciones totales obtenidas por los individuos que contestaron el instrumento, y no los puntajes parciales de cada uno de los reactivos, como se hace en la tcnica Likert. Sin embargo, el razonamiento subyacente es el mismo: si el instrumento mide lo que se pretende, ste debera ser respondido en forma diferente por un grupo que posee esa variable en gran cantidad que por otro que la posee en menor magnitud.
b) escogiendo personas de grupos conocidos como poseedores de la variable en cantidad mnima y mxima. Por ejemplo, si se est elaborando una escala de actitudes hacia el liberalismo, se buscarn Sujetos pertenecientes a grupos liberales (partidos de izquierda) y a grupos conservadores (partidos de derecha). Se espera, que al comparar las respuestas promedio de estos dos grupos, se obtengan diferencias estadsticamente significativas. En este caso, se aplica una prueba estadstica adecuada, para valorar las diferencias entre los grupos; sta deber arrojar resultados estadsticamente significativos, a una probabilidad igual o menor a 0.05. Este tipo de validez es especialmente pertinente para aquellos estudios cuyo principal propsito es el de diagnstico, ya sea a nivel individual o grupal. 9.2.4 Predictiva La validez predictiva se refiere a la capacidad que tiene el instrumento para predecir al futuro. Se requiere este tipo de validez, principalmente, cuando se pretende seleccionar personas, de acuerdo a un criterio, o grupo de ellos, para ocupar o desempear, alguna actividad, ya sea laboral, o educativa. Es decir, cuando se desea escoger a los individuos ms aptos, o los ms adecuados, se mide una o ms variables, y a partir de ella(s) se predice el desempeo de estos Sujetos en el futuro. Este tipo de validez es primordial en los programas de seleccin de personal, y de alumnos, por ejemplo. Existen dos procedimientos (que en realidad son uno y el mismo) para determinar este tipo de validez, que dependen del nmero de variables predictoras que se empleen. Si slo se emplea una (lo menos probable, ya que se sabe que el comportamiento es multicausal), se usa el procedimiento de regresin simple; si se emplean muchas variables predictoras se emplea el procedimiento de regresin mltiple (que es una extensin de la primera). 9.2.4.1 Regresin Simple Los procedimientos para determinar la validez predictiva de los instrumentos, en general toman mucho tiempo. Esto se debe a que se tiene que permitir el paso del tiempo para medir la variable que se pretende predecir y poder entonces incluirla en un anlisis de regresin. Un procedimiento comn sera por ejemplo, el siguiente caso. Supngase que se desea predecir el rendimiento acadmico a partir del nivel intelectual. Esto significara que el investigador desea saber, a partir de las calificaciones obtenidas en una prueba de Inteligencia, la calidad o magnitud del rendimiento acadmico de los Sujetos. Esta situacin requiere que el instrumento que mide inteligencia tenga validez predictiva. Para determinar la validez predictiva del instrumento, se tendran que seguir los siguientes pasos: 1 se aplica el instrumento que mide inteligencia a todos los alumnos que se inscriben en el ciclo escolar x. 2 se espera a que los alumnos cursen el ciclo escolar, y obtengan sus evaluaciones del rendimiento escolar (por lo general son las calificaciones obtenidas en los cursos). 3 se promedian las calificaciones obtenidas. 4 se realiza un anlisis de regresin simple, con la variable promedio de calificaciones como dependiente y el puntaje en inteligencia como independiente. Una vez efectuado el anlisis, el investigador se fija en los siguientes datos: a) el coeficiente de determinacin (R): ste debe ser alto; de preferencia del 60% en adelante. Este coeficiente indica la cantidad de varianza de las calificaciones que queda explicada
por la inteligencia. Es decir, la medida en que la inteligencia afecta, influye o est relacionado con las calificaciones escolares. b) error estndar de medicin: ste debe ser pequeo: de preferencia menor a l.0. Este indica la cantidad de error que existe en la prediccin de las calificaciones tomando como predictor a la inteligencia. c) la f obtenida en la regresin debe ser estadsticamente significativa: de preferencia con una p asociada de 0.05 menor d) el coeficiente de regresin (B) de la variable predictora (inteligencia) debe tener asociada una f con una p 0.05. Si se obtiene todo lo sealado arriba, se dice que la confiabilidad del instrumento es igual al coeficiente de determinacin (R). El valor adecuado de este coeficiente, deber ser 0.80 o mayor. Sin embargo, valores menores --siempre y cuando se cumpla con los dems criterios --b) a d)], son adecuados. 9.2.4.2 Regresin Mltiple El anlisis de regresin mltiple se emplea para establecer la validez predictiva de varios predictores o variables, respecto a otra variable que se sucede en el futuro. La lgica expuesta anteriormente vale para esta situacin. Como es de esperarse, los coeficientes de determinacin (R) en este caso, adquieren valores ms altos; el error de medicin es menor, la f de la regresin tiende a ser estadsticamente significativa. Los valores de los coeficientes de regresin B, pueden adquirir f's asociadas estadsticamente significativas o no. Cuando la f asociada al coeficiente de regresin tiene significancia estadstica, quiere decir que esa variable es buena predictora de la que se pretende predecir. Una ventaja de este procedimiento es que se pueden descartar aquellas variables que resultan no ser buenas predictoras, y se puede entonces conservar, slo aquellas que si fueron buenas predictoras. En este caso, como en el anterior, tambin tiene que transcurrir el tiempo, entre la medicin de las variables predictoras, y la de la que se desea predecir, para poder llevar a cabo el anlisis de regresin. Un ejemplo adecuado sera el siguiente. Supngase que se desea predecir la desercin escolar entre alumnos universitarios. Supngase que el investigador cree que entre las posibles causas de la desercin escolar se encuentran las siguientes: nivel socioeconmico, motivacin, expectativas de la carrera, trabajar algunas horas al da, estado civil, nivel intelectual, promedio obtenido en ciclos escolares anteriores, ndice de reprobacin, lejana del hogar respecto al centro de estudios,, para mencionar tan slo algunas. El investigador tendra que medir estas variables cuando el alumno solicita ingresar a la Universidad. Tendra que recolectar informacin respecto a la cantidad de tiempo que los alumnos han abandonado la escuela (en trminos del nmero de semestres, por ejemplo), y esperar a que se cumpliera el ciclo escolar completo (el de la carrera). Una vez que sucediera esto, tendra todos los datos necesarios para incluir en el anlisis de regresin. Los resultados le indicaran, en primer lugar, que tanto del fenmeno de desercin escolar queda explicado por estas variables, considerando el valor del coeficiente de determinacin (R), y al mismo tiempo la validez predictiva de las variables predictoras.
En segundo lugar, cules de las variables realmente son buenas predictoras del fenmeno, y cules se pueden descartar. Con esta informacin, el investigador podra pedirle a los nuevos aspirantes, que respondieran a los instrumentos que miden estas variables predictoras, y dependiendo de los valores obtenidos por ellos, mediante la ecuacin de regresin correspondiente, podra predecir, con poco error, la probabilidad que los aspirantes tienen de desertar. Algunos autores recomiendan realizar anlisis de correlacin, en lugar de regresin. Es pertinente entonces aclarar, que el anlisis de regresin permite predecir casos individuales, ya que la ecuacin obtenida es una funcin matemtica, que seala los valores que cada una de las variables predictoras deben tener para producir cambios en la variable que se est prediciendo. Las correlaciones slo permiten predicciones gruesas, a nivel de promedios, y no de casos individuales. Por lo tanto, aunque el procedimiento es costoso, en trminos del tiempo que tiene que transcurrir para poderlo efectuar, el beneficio posterior es mucho mayor que el obtenido con cualquier otro. 9.2.5 De Construccin La validez de construccin es en realidad la verdadera validez. Es decir, es la que determina de manera especfica si el instrumento mide lo que pretende. Como se seal anteriormente, lo que se desea medir, por lo general, es un constructo hipottico, que deriva de una teora, y permite as definirlo conceptualmente. Los procedimientos que se siguen para determinar la validez de construccin responden a preguntas como las siguientes: a) cundo se mide este constructo o variable, y se relaciona con otros, es esta relacin la que predice la teora? b) discrimina el instrumento entre dos grupos que se supone difieren en forma extrema en la cantidad de variable poseda que se pretende medir? c) la estructura interna de la prueba, refleja fielmente la estructura interna del concepto o constructo? Dicho de otra manera, la validez de construccin es la que determina si se est midiendo el constructo o variable que se pretende medir. Si los puntajes obtenidos en el instrumento se comportan como dice la teora de donde procede, si se relaciona con aquellas variables con las que debera, y adems lo hace en la forma predicha por la teora, y por ltimo, si refleja la estructura dimensional del concepto, en cuanto a su contenido, nmero y forma, el instrumento tiene validez de construccin, y mide realmente, lo que pretende medir. Este tipo de validez es la ms importante y adecuada, y se recomienda establecerla cuando el objetivo principal de la investigacin es la elaboracin del instrumento que mide el constructo; tambin es recomendable establecerla si el instrumento se va a emplear en una sola ocasin y fue elaborado ad hoc, como medio de poner a prueba la existencia de relaciones entre variables, o hiptesis derivadas de alguna teora. A continuacin se presentan los procedimientos seguidos para determinar la validez de construccin. El investigador puede seguir todos o alguno de ellos. Los dos primeros son muy sencillos y el tercero es ms complejo. 9.2.5.1 Correlacin con Criterios Externos de Acuerdo a la Teora El primer procedimiento se refiere al hecho de correlacionar los puntajes obtenidos por lo Sujetos en el instrumento, con los que esos mismos Sujetos obtienen en otros instrumentos previamente validados, que miden otros constructos o variables, y observar entonces, si las correlaciones obtenidas son de la magnitud y direccin predicha por la teora. Por ejemplo, si se pretende medir agresin, y se tienen puntajes de los Sujetos en otros instrumentos, como por ejemplo uno que midiera frustracin, y otro que midiera autoritarismo, se podran esperar relaciones como las siguientes, de acuerdo a algunas teoras de la agresin: una relacin alta y positiva entre
agresin y frustracin; una relacin positiva, pero no tan alta, entre agresin y autoritarismo. En este caso, un primer requisito sera el que los coeficientes de correlacin calculados, fueran estadsticamente significativos, con un nivel de significancia de 0.05 o menor; que tuvieran el signo adecuado (positivo o negativo), y por ltimo, que tuvieran la magnitud predicha. Si se cumplieran todos estos requisitos, se podra estar ms seguro de haber alcanzado la validez de construccin en el instrumento en cuestin. 9.2.5.2 Grupos Contrastados En este caso se siguen los mismos pasos que los sealados para determinar la validez concurrente por medio de grupos contrastados, presentada ms arriba. Algunos autores como Nunnally (1967), consideran que la validez concurrente de grupos contrastados es en realidad validez de construccin, pues con ella se determina, si el instrumento es sensible al hecho de que un grupo posee grandes cantidades del atributo que se est midiendo, mientras que el otro no. En otras palabras, si el instrumento es respondido de manera diferencial por los dos grupos que supuestamente son diferentes, el instrumento, al reflejar esa diferencia, est midiendo el constructo que pretende medir. Otros autores, como Guilford (1954), Anastasi (), y Cronbach (), no consideran a la validez concurrente por grupos contrastados como validez de construccin. 9.2.5.3 Validez Factorial La validez factorial es el procedimiento ms empleado para establecer la validez de construccin de los instrumentos. Como se seal en el Captulo VII, el anlisis factorial o de factores, es una tcnica que permite construir instrumentos heterogneos, que responden a las necesidades de construcciones hipotticas muy complejas. Entre los resultados que se obtienen de la realizacin de un anlisis factorial, algunos de ellos sirven para determinar la validez de construccin de los instrumentos elaborados con esta tcnica. A continuacin se presentan los resultados que permiten hacerlo. 9.2.5.3.1 Varianza Explicada Para autores como Kerlinger (), la cantidad de varianza explicada acumulada por los factores extrados en el anlisis factorial, es un indicador de la validez de construccin. En este caso, la varianza explicada acumulada deber alcanzar valores de 70% o ms, para considerar que el instrumento es adecuado desde el punto de vista de su validez de construccin. Debe recordarse que la varianza explicada acumulada es en realidad la que corresponde a la varianza explicada de la matriz reducida de la matriz de intercorrelaciones. Es por esta razn que se exige un porcentaje tan alto para considerar vlido al instrumento.
9.2.5.3.2 Validez Relevante Autores como Guilford (1954), llaman validez relevante, al promedio de la raz cuadrada de las comunalidades de los reactivos que constituyen a un factor. Esto significa que se obtienen valideces relevantes individuales para cada uno de los factores extrados. Sin embargo, los valores de estas valideces, tambin debern alcanzar magnitudes de 0.75 y ms. El procedimiento para calcularlas es muy sencillo. Primero se determinan cules son los reactivos que constituyen a cada factor. Se encuentra en el listado de resultados, la comunalidad estimada despus de la rotacin, que corresponda a los reactivos de cada factor. Se le saca raz cuadrada a esta comunalidad, se suman todos los resultados, y se divide esta magnitud entre el nmero de reactivos del factor. Esto constituye, la validez relevante del factor. Tambin aqu se exige que los datos alcancen magnitudes de 0.80 y mayores. 9.5.3.3 Estructura Factorial La validez que se refiere a la estructura factorial es principalmente importante en aquellos instrumentos que se construyen para medir conceptos o constructos hipotticos complejos. Esta validez se refiere al hecho de determinar si el constructo o concepto complejo queda bien representado en cuanto a las dimensiones que lo constituyen, en el instrumento que pretende medirlo. Es decir, si el concepto alude a diferentes dimensiones, stas debern estar representadas en el instrumento; tanto en cantidad, como en calidad. Por ejemplo, supngase que se define a la Autoestima desde el punto de vista conceptual como: la percepcin que tiene una persona acerca de la bondad con la que ejecuta los roles psicolgicamente significativos para ella, as como la percepcin que esta misma persona tiene de la manera en que otros significativos perciben que ella ejecuta esos mismos roles. En otras palabras, si el Sujeto es mujer, podra decirse que su autoestima est determinada por la forma en que ella cree que ejecuta sus papeles de esposa, madre, hija, ama de casa y profesionista, as como por la forma en que ella cree que personas importantes para ella (por ejemplo: el esposo, sus padres, sus hijos, y sus jefes) piensan que ejecuta esos mismos papeles. La combinacin pesada de estas creencias, es la que determina la autoestima de la mujer. En otras palabras. de los roles o papeles que ella desempea, algunos son, para ella, ms importantes; as como tambin, de las personas importantes para ella, algunas lo son ms que otras. La combinacin de estas percepciones, con sus relativas importancias, es la que determina la forma en que ella se autoestime. Los resultados de un anlisis factorial debern representar en forma adecuada a cada una de las percepciones significativas para las mujeres, por ejemplo, as como sus importancias relativas. En este ejemplo hipottico, donde se podra plantear la hiptesis de que para las mujeres adultas, los papeles importantes de su vida son el ser madres, esposas y profesionistas, y los otros significativos podran ser el esposo, los hijos y los jefes, se esperara que se encontraran seis factores, cada uno de ellos correspondiendo a lo antes sealado. De la misma manera, si se estableciera que el orden de importancia de los papeles es: madre, la percepcin que de ella como tal tienen sus hijos; esposa, la percepcin que de ella como tal tiene el esposo, la profesin y la percepcin que de ella como profesionista tienen sus jefes, la importancia relativa de los factores (cantidad de varianza explicada de cada uno de ellos) tambin debera quedar de manifiesto en los resultados. Si sucede lo anterior, se dice que el instrumento tiene validez de construccin, de acuerdo a su estructura factorial.
Cuando se opta por la determinacin de la validez de construccin factorial, por lo general se exige que se cubran los tres requisitos sealados arriba. Es decir, que tenga validez en cuanto a la varianza explicada, en cuanto a la validez relevante, y en cuanto a la estructura factorial. Por ltimo, se pondr un ejemplo de la validez factorial, empleando los resultados del ejemplo presentado en el Captulo VII. Desde el punto de vista de la varianza explicada, se observa que el Factor 1 explica el 70.4% de la varianza; el Factor 2, el 12.9% de la varianza; y el Factor 3, el 7.0%. De esta manera, la varianza acumulada explicada por los tres factores es de 90.3%. Desde el punto de vista de la varianza factorial explicada, el instrumento es vlido, si se desea conservar a los tres factores. Si se deseara conservar tan slo al primero, aunque de manera no "pura", el instrumento tambin sera vlido desde este punto de vista, ya que la cantidad de varianza explicada por este nico factor es de 70.4%, que aunque no alcanza el valor de 75% acumulado, es definitivamente un factor importante por la cantidad de varianza que explica. Considrese que se opta por la opcin de tomar a los tres primeros factores, eliminando del primer factor aquellas variables que cargan con pesos altos en los otros dos. De esta manera, el primer factor se referira al sistema de enseanza, y quedara constituidos por las siguientes variables: permite la aplicacin del conocimiento a situaciones prcticas, es creativo, entretenido, est sistematizado, permite retener el conocimiento, y es reforzante. Si ahora sacamos la raz cuadrada de las comunalidades que corresponden a estas variables, obtenemos lo siguiente: Comunalidades 0.69836 0.60887 0.57609 0.62833 0.58843 0.72810 0.8356793 0.7803012 0.8479325 0.7926726 0.7670071 0.8532857
= 4.9120094/6 = 0.8186682 La validez relevante del primer factor es de 0.8186682, (0.82) la cual es bastante adecuada. Para el segundo factor, siguiendo los mismos procedimientos, la validez relevante es de 0.75; mientras que para el tercer factor es de 0.76. En general, la validez relevante es adecuada y aceptable. Por lo que se refiere a la estructura factorial, se puede observar que se encontraron tres factores, que representan en forma adecuada a los tres elementos del sistema de enseanza aprendizaje que se pretendan evaluar: el sistema de enseanza, el profesor, y el contenido del programa. En este caso no se estableci cul de los tres era ms importante, por lo que no interesa el orden de aparicin de los factores. Entonces, desde el punto de vista de la estructura factorial, se puede decir que el instrumento tiene validez de construccin.
Tomando en cuenta las tres maneras de establecer la validez de constructo del instrumento de este ejemplo, se puede concluir que este instrumento es vlido para evaluar al profesor, al programa de una materia y al sistema de enseanza seguido por el profesor. 9.3 1. 2. 3. 4. 9.4 Gua de Estudio Sealar lo que se entiende por validez. Distinguir los diferentes tipos de validez que existen. Sealar cuando es adecuada cada uno de los tipos de validez Indicar los procedimientos empricos que se siguen para determinar cada tipo de validez. Autoevaluacin
9.4.1. Preguntas 1. 2. 3. Qu se entiende por validez? Qu se entiende por validez concurrente, predictiva y de construccin? Qu se entiende por validez concurrente, predictiva y de construccin?
9.4.2 Respuesta 1. Un instrumento vlido, mide lo que pretende medir. 2. La validez concurrente es la que tienen un instrumento cuyas calificaciones correlacionan alto con las calificaciones de otro que mide lo mismo, que hayan sido aplicados a los mismos sujetos. La validez predictiva es la que tienen un instrumento que permite predecir al futuro, con poco error. La validez de construccin es la que tiene un instrumento que se comporta como la teora de la que deriva, indica. 3. La validez concurrente se recomienda para aquellos instrumentos que servirn para diagnosticar; la predictiva, para los que tienen que predecir; y la de construccin, para aquellos que se emplean en una slo ocasin. Se deben determinar todos los tipos de validez, si el objetivo del estudio es especficamente desarrollar el instrumento en cuestin.
X. PRESENTACIN DEL INSTRUMENTO FINAL Una vez terminados todos los clculos necesarios para establecer las caractersticas psicomtricas y los procedimientos de calificacin e interpretacin de las calificaciones del instrumento, se procede a reportarlo, a ponerlo a la disposicin de la comunidad cientfica, para que sta pueda utilizarlo. 10.1 Manual del Instrumento El manual del instrumento es el documento que incluye toda la informacin importante que se requiere para la correcta utilizacin de un instrumento de medicin. La informacin se presenta de manera ordenada, para facilitar su consulta. A continuacin se propone la organizacin de la informacin que debe contener un manual de este tipo. En este documento se presenta tambin, en un Anexo, el instrumento en su versin final, as como sus versiones iniciales y parciales. 10.1.1 Introduccin En la seccin de Introduccin, se informa a la comunidad cientfica, el marco terico conceptual que sirviera de base para la definicin y elaboracin del instrumento que se presenta. Cuando se dice el marco conceptual, no necesariamente quiere significarse que se debe haber partido de una teora en especial; pudo haber sido necesario tomar aspectos de dos o ms concepciones tericas, para satisfacer las exigencias conceptuales del investigador. As mismo, se pudo haber iniciado la definicin conceptual del constructo a medir, a partir de datos empricos, recolectados para tal efecto. Es decir, un investigador puede recorrer uno de los siguientes tres caminos, con objeto de definir conceptualmente, la variable o constructo que pretende medir. Primero, puede tomar como punto de partida una teora que satisfaga sus exigencias conceptuales. Por ejemplo, la teora multidimensional de la inteligencia de Guilford (). Segundo, pudo haber recurrido a dos o tres posturas tericas, por pensar que ninguna de ellas por s sola era suficiente, y considerar que era ms enriquecedor emplear dos o ms de ellas. Por ejemplo, para medir autoestima pudo haberse basado en la teora actitudinal de Coopersmith ( ) y la de los roles de Rokeach ( ). Tercero, pudo haber partido de lo que la poblacin a la que se iba a medir, entenda por el concepto o variable. En este caso se le pregunta, en forma abierta, a una pequea muestra de la poblacin para la cual se elaborar el instrumento, qu es lo que ella entiende por el concepto o variable. Por ejemplo, si se desea medir autoconcepto, se le puede preguntar a una pequea muestra de Sujetos, que indiquen de qu manera se describiran a ellos mismos. En seguida se llevara a cabo un anlisis de contenido de la informacin as recabada, para determinar la existencia de una o varias dimensiones, y a partir de ellas, iniciar la elaboracin de los reactivos que mejor representaran a esas dimensiones. Como el procedimiento empleado por el autor del instrumento pudo haber sido cualquiera de los sealados arriba, es conveniente que se indique, en la introduccin, cul de ellos se sigui, y las razones que lo guiaron a hacerlo as y no de otra manera. Es decir, en la Introduccin, habr de sealarse el marco conceptual que haya guiado al autor, as como la fundamentacin razonada del por qu de su eleccin, y del por qu de la eliminacin de cualquier otra posible aproximacin, si es que existe.
En otras palabras, en esta seccin, se fundamenta y se discute tericamente, la adopcin del marco de referencia que gui al investigador en el proceso de construccin del instrumento que est presentando. 10.1.2 Caractersticas Psicomtricas En esta seccin, el investigador presenta los datos correspondientes a la confiabilidad y la validez del instrumento. 10.1.2.1 Confiabilidad El autor del instrumento seala cul o cules de los tipos de confiabilidad se le determinaron al instrumento, as como las razones que las justificaron. Se reportan entonces, los coeficientes de confiabilidad obtenidos, as como sus probabilidades asociadas. Si en el proceso de obtencin de la confiabilidad se tuvieron que eliminar reactivos, se sealan cuntos y cules, as como las razones que llevaron a su eliminacin. Se indican aqu tambin, las principales caractersticas de las muestras que se emplearon para determinar las confiabilidades, as como sus tamaos, y la forma en que fueron extradas de la poblacin. 10.1.2.2 Validez En esta seccin se presenta la informacin concerniente a los tipos de validez que se determinaron para el instrumento, las razones que justificaron su determinacin, las magnitudes de sus coeficientes, sus probabilidades asociadas, el tamao de las muestras empleadas para determinarlas, as como sus principales caractersticas. 10.1.3 Estandarizacin El proceso de estandarizacin se refiere a los pasos seguidos para desarrollar las normas de calificacin del instrumento, una vez que se han determinado su confiabilidad y validez. Estas normas de calificacin o baremos son las tablas que permiten transformar los puntajes crudos en estandarizados, as como interpretar, darle significado cualitativo en trminos del marco de referencia conceptual, a los puntajes obtenidos por los Sujetos a los que se les aplique el instrumento. Esta seccin consta de dos subsecciones, que se presentan a continuacin. 10.1.3.1 Muestras de Estudio En este apartado, se debern describir, de la manera ms amplia y cuidadosa que se pueda, las caractersticas de las muestras que se emplearon para determinar las normas de calificacin o baremos. As mismo, deben sealarse los tamaos de las muestras, y los procedimientos que se sugirieron para su extraccin. Esta informacin es sumamente importante para el futuro usuario del instrumento. Con ella podr decidir si el instrumento se adecua a las caractersticas de la poblacin que desea estudiar o investigar. Por ejemplo, si el instrumento es uno que mide actitudes hacia el supervisor, y fue desarrollado con una muestra de obreros automotrices, y el investigador lo desea emplear para jornaleros agrcolas, es probable que no sea el ms adecuado, ya que pueden existir caractersticas fundamentalmente diferentes entre estos dos tipos de trabajadores. Otro ejemplo sera el caso de una escala de autoestima desarrollada para nios, la cual difcilmente se podra emplear para adultos.
En otras palabras, la informacin contenida en este apartado le permite al investigador decidir, si el instrumento es el adecuado para sus propsitos de investigacin, y as evitar cometer el error de emplearlo de manera indiscriminada; su empleo indiscriminado, puede atentar contra la confiabilidad y la validez del instrumento. As mismo, el empleo de un instrumento inadecuado, no permite al investigador obtener una interpretacin fidedigna ni correcta de los puntajes obtenidos por los Sujetos estudiados por l. 10.1.3.2. Normas de Calificacin e Interpretacin En esta seccin se presenta la informacin correspondiente a la manera de calificar el instrumento, as como la forma de interpretar los puntajes obtenidos por los Sujetos. 10.1.3.2.1 Valores Escalares Si el instrumento fue desarrollado por medio de un modelo de escalamiento de estmulos, donde se obtienen valores escalares para los reactivos, como por ejemplo con el mtodo de Intervalos Aparentemente Iguales, el de Pares Comparados, el de Intervalos Sucesivos, etc. En este caso, se debe incluir la informacin respecto a los valores escalares de los reactivos que constituyeron el instrumento final, as como sus valores Q o sus desviaciones estndar. La calificacin que obtienen los Sujetos se refiere a la media o mediana de los valores escalares de las afirmaciones escogidas por ellos; en el captulo V se presenta de manera detallada, el procedimiento de calificacin. Se recordar tambin, que en el caso de estos mtodos, se tiene un continuo psicolgico que permite hacer una interpretacin cualitativa de los resultados obtenidos por los respondientes (vase el Captulo V). 10.1.3.2.2. Puntajes Factoriales Cuando se seleccion el mtodo del anlisis factorial para la elaboracin del instrumento, el instrumento final estar constituido por factores, y cada uno de ellos por un conjunto dado de reactivos. Estos conjuntos de reactivos se habrn de calificar de manera que se obtengan puntajes factoriales para los Sujetos que los respondan. Para obtener puntajes factoriales se recurre a la Matriz de Puntajes Factoriales, que deber presentarse en forma simplificada en el manual. Por forma simplificada se quiere decir que slo se presentan los coeficientes factoriales de los reactivos que constituyen a cada factor ,as como las medias y desviaciones estndar de cada reactivo. En el manual tambin habr de indicarse la manera de obtener las calificaciones factoriales. El procedimiento que se sigue es el de transformar los puntajes crudos obtenidos por los Sujetos, en puntajes z, y multiplicarlos por los coeficientes factoriales que les correspondan, llevando a cabo una suma algebraica de estos productos, a lo largo de todos los reactivos de cada factor. Las calificaciones as obtenidas, estn en unidades z, y corresponden entonces a una escala intervalar, con una media de 0, y una desviacin estndar de 1. Si el puntaje factorial es positivo, significa que el individuo tiene ms del factor; si el puntaje es negativo, tiene menos del factor. 10.1.3.2.3 Baremos Se conoce como Baremos a las tablas que acompaan a los instrumentos, con objeto de transformar los puntajes '"crudos" a otro tipo de puntaje, que al mismo tiempo que seala la
magnitud de la posesin del atributo por el Sujeto, permite interpretar esa magnitud al respecto de la poblacin en general. Existen diferentes tipos de transformaciones que se han empleado para elaborar estas tablas o baremos. A continuacin se presentan algunos ejemplos de las ms conocidas y utilizadas. Tambin se explica la manera de construirlas y de utilizarlas. 10.1.3.2.3.1 Stens Los stens son transformaciones que se hacen de los puntajes "crudos" a diez intervalos de unidades de desviacin estndar, y de all su nombre. El procedimiento para construir la tabla correspondiente es el siguiente. Se calcula la media del grupo para la variable en cuestin; se calcula la desviacin estndar; las dos primeras desviaciones a la derecha y a la izquierda, se dividen en dos, y se deja a las terceras desviaciones, a la derecha y la izquierda, como estaban al inicio. A continuacin se presenta lo anteriormente sealado, en forma esquemtica: Desviacin Estndar -3 a -2 a -1.5 -1 a -0.5 0.00 +0.5 +1 a +1.5 +2 a -2 -1.5 a -1 -0.5 a 0.00 a +0.5 a +1 +1.5 a +2 +3 Sten 1 2 3 4 5 6 7 8 9 10
10.1.3.2.3.2 Puntajes T El procedimiento para transformar puntajes "crudos" a puntajes T fue presentado y explicado en el captulo VI, y por esta razn, slo se menciona. 10.1.3.2.3.3. Puntajes Z El procedimiento de transformacin de puntajes "crudos" a puntajes z, es muy sencillo. Consiste en desviar cada puntaje "crudo" de la media del grupo y dividirlo entre la desviacin estndar. De esta manera, se transforma la calificacin a unidades que pueden ser interpretadas basndose en la distribucin normal, que seala a una media de 0 y una desviacin estndar de 1. 10.1.3.2.3.4. Otras Consideraciones Es pertinente incluir en el manual, baremos para las diferentes edades o sexos, si la investigacin previa ha establecido que existen diferencias en los puntajes obtenidos por individuos de diferente edad o sexo.
Es importante sealar que si por alguna razn, las muestras empleadas para la determinacin de los baremos, no corresponden en sus caractersticas importantes a aquella en la que se va a utilizar el instrumento, ser ms conveniente elaborar unos baremos nuevos, especficos para esta muestra, y hacrselo saber al autor del instrumento. 10.1.4. Aplicacin En esta seccin se habr de sealar si la aplicacin del instrumento es individual o puede hacerse en forma colectiva. Deben incluirse las instrucciones que habrn de darse a los Sujetos que respondern al instrumento; as como los ejemplos pertinentes, en caso de ser necesario. En otras palabras, en esta seccin se incluyen las instrucciones estandarizadas que habrn de emplearse en la aplicacin, as como indicaciones de la forma de aplicacin: individual o colectiva. 10.2 Limitaciones y Sugerencias de Uso En este apartado se deben sealar las limitaciones que tiene el instrumento. Por ejemplo: slo se puede emplear con personas alfabetas; slo se puede aplicar en forma individual; etc. Tambin se debern establecer en esta seccin, recomendaciones respecto al poder de generalizacin que tienen los datos recabados con el instrumento; los cuidados que debern tenerse en virtud de que los coeficientes de algunos de los tipos de confiabilidad o de validez son limtrofes (son adecuados, pero no ptimos en trminos de la magnitud alcanzada). En esta seccin tambin pueden hacerse sugerencias respecto al uso del instrumento, ya sea en cuanto al tipo de muestras para las que es adecuado, o en cuanto al tipo de variables que valdra la pena relacionar con la que mide el instrumento desarrollado por el autor. Tambin es conveniente resear en esta seccin, los usos y resultados que se han obtenido con el instrumento, invitando a los futuros usuarios, a hacerle llegar al autor de la prueba, los resultados del uso de la misma, en investigaciones posteriores. En virtud de lo anterior, se recomienda al autor del instrumento, indique con toda claridad la institucin de afiliacin, as como su direccin o manera de establecer contacto con l.
REFERENCIAS Anastasi, A. (1961). Psychological Testing. Nueva York: The MacMillan Company. Biddle, B.J. y Thomas, E.J. (Eds.) (1966). Role Theory: Concepts and Research. Nueva York: Wiley. Binet, A. y Simon, T. (1918). La Medida del desarrollo de la Inteligencia. Madrid: Sucesores de Hernando. Bogardus, E.S. (1923). Social Psychology. Cuarta Edicin. Coopersmith, S. (1967). The Antecedents of Self-Esteem. San Francisco: Freemanans Co. Cronbach, L.J. (1951). Coefficient Alpha and the internal structure of tests. Psychometrika, 16, 297-334. Cronbach, L.J. (1960). Essentials of Psychological Testing. Nueva York: Harper and Row. Downie, N.M. y Heath, R.W. (1971). Mtodos Estadsticos Aplicados. Nueva York: Harper and Row. Edwards, A.L.(1957). Techniques Appleton-Century-Crofts. of Attitude Scale Construction Nueva York:
Guilford, J.P.(1954).Psychometric Methods. Nueva York: McGraw Hill Book Company. Guilford, J.P. (1976). The Nature of Human Intelligence. Nueva York: McGraw Hill. Gulliksen, H.(1950). Theory of Mental Tests. Nueva York: John Wiley and Son. Guttman, L. (1944). A basis for scaling qualitative data. American Sociological Review,9, 139-150. Harman, H.H. (1976). Modern Factor Analysis. Chicago: The University of Chicago Press. Kerlinger, F.N.(1975). Interamericana. Investigacin del Comportamiento. Mxico: Nueva Editorial
Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psychology.140. Mc Guigan, F.J.(1975). Psicologa Experimental, Mxico: Editorial Trillas. Nunnally,J. (1967). Psychometric Theory. Nueva York: McGraw Hill Book Company. Russell, B.(1938).The Principles of Mathematics. Segunda Edicin. Nueva York: Norton. Siegel,S. (1976). Estadstica No Paramtrica Aplicada a las Ciencias de la Conducta. Mxico: Editorial Trillas.
Spearman, C. (1904). The proof and measurement of association between two things.American Journal of Psychology,15,72-101. Stevens, S.S, (1951). Mathematics, Measurement and Psychophysics En: S.S.Stevens (Ed.): Handbook of Experimental Psychology. Nueva York: Wiley. Thurstone, L.L. (1927a). A law of comparative judgement. Psychological Review, 34,273-286. Thurstone, L.L. (1927b). A law of categorical judgement. Psychological Review, 34, 287-293. Thurstone, L.L. y Chave, E.J. (1929). The Measurement of Attitude. Chicago: University of Chicago Press. Torgerson, W.S. (1967). Theory and Methods of Scaling. Nueva York: John Wiley and Sons, Inc. Vite San Pedro.

Medicion en Ciencias Sociales - Manual-Completo

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Medicion en Ciencias Sociales - Manual-Completo

Uploaded by

Copyright:

Available Formats

MEDICIN EN CIENCIAS SOCIALES

II. MODELOS DE ESCALAMIENTO

III. INTRODUCCION A LOS MODELOS DE MEDICION

IV. PRIMEROS PASOS EN LA ELABORACION DE UN INSTRUMENTO

V. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE REACTIVOS O ESTIMULOS

VI. INSTRUMENTOS HOMOGENEOS: ESCALAMIENTO DE PERSONAS

VII. INSTRUMENTOS HETEROGENEOS

VIII. CONFIABILIDAD DE LOS INSTRUMENTOS

IX. VALIDEZ DE LOS INSTRUMENTOS

X. PRESENTACION DEL INSTRUMENTO FINAL

Identifique los principales mtodos de escalamiento de estmulos. Autoevaluacin

Simplificando (3.10) dividindola entre sT, queda: rXT = sT sX (3.11)

Cancelando sX en numerador y denominador, queda: rXT = rXgXh (3.13)

N 1 (z1 + z1z2 + z1z3 +...z1zk) N

Reactivo 1. La mujer debe llegar virgen al matrimonio

La frmula de la Chi Cuadrada es la siguiente: x = (O - E) ______ E

zjk =(Sj - Sk)/ 2s2 ( 1 - r)

Z12 Z22 Z32 Z13 Z23 Z33

j Z1j Z2j Z3j Zjj Zkj Suma Media M+k

El continuo se presenta de la siguiente manera:

Grupo Alto f xf 15 60 20 60 10 20 4 4 1 0 50 144 na xa

Xf 240 180 40 4 0 464 2 xa

sa2 + sb2 ____ ____ na nb

Variables Incluidas en el Estudio

Cuptesen 0.51591 1.00000

Infact 0.57147 0.61446 1.00000

0.44655 0.41485 0.30348 0.48057 0.22969 0.55563

0.47624 0.38189 0.39886 0.49225 0.28226 0.50396

0.55560 0.44635 0.37674 0.51804 0.29447 0.52856

Sistedo 0.52151 0.58137 1.00000

Lograret 0.55204 0.52716 0.58079 1.00000

Mashre 0.39331 0.30466 0.20888 0.22801 1.00000

Determinante de la Matriz de Correlacin: 0.0000008(.76729617D-06)

Extraccin Inicial de Factores

La Convergencia requiri 13 iteraciones.

Matriz Inicial de Factores Usando Alpha

EXTRACCION FINAL DE FACTORES

Rotacin para las Cargas Directas Oblcuas Mnimas

You might also like

sa2 + sb2 na nb