You are on page 1of 16

CRITERIOS TCNICOS PARA EL

DESARROLLO Y USO DE INSTRUMENTOS


DE EVALUACIN EDUCATIVA, 2014-2015
Instituto Nacional para la Evaluacin de la Educacin

NDICE

05 1.Antecedentes
06

2.Definicin de trminos

08

3.Introduccin

09

4.Planeacin del instrumento de evaluacin

4.1 Conformacin de lo cuerpos colegiados de especialistas

4.2 Definicin del propsito y usos del instrumento de evaluacin

4.3 Definicin del objeto de medida del instrumento de evaluacin

4.4 Elaboracin de las especificaciones

11

5.Elaboracin del instrumento de evaluacin

5.1 Elaboracin de tareas evaluativas o reactivos

5.2 Prueba piloto de las tareas evaluativas o reactivos

12

6.Aplicacin o administracin del instrumento

13

7.Procesamiento y anlisis de resultados del instrumento

14

8.Difusin y uso de los resultados

15

9.Informe tcnico del instrumento

a Junta de Gobierno del Instituto Nacional para la Evaluacin de la Educacin (INEE), con fundamento en lo dispuesto en la fraccin IX del artculo 3o. de la Constitucin Poltica de los Estados Unidos Mexicanos; artculos 10,
11, 12, 13, 14, 15 fracciones III y VI, 17 fracciones I a la V, 26, 27 fracciones VII, X, XIII, 29, 38 fracciones VI, IX, X y XXI,
47, 49, 57 y 59 de la Ley del Instituto Nacional para la Evaluacin de la Educacin; as como los Lineamientos iniciales
especficos para llevar a cabo la evaluacin del ingreso al Servicio Profesional Docente en Educacin Bsica y Educacin Media Superior y lineamientos iniciales especficos para llevar a cabo la evaluacin para la promocin a cargos
con funciones de Direccin (Directores) en Educacin Media Superior, para el ciclo escolar 2014-2015, LINEE-02-2014,
publicados en el Diario Oficial de la Federacin de fecha 6 de marzo de 2014, emite los siguientes Criterios Tcnicos
para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015 (en adelante Criterios Tcnicos).

1. Antecedentes
La reforma constitucional en materia de educacin, estableci en la fraccin IX del artculo 3o. la creacin del Instituto Nacional para la Evaluacin de la Educacin, como un organismo constitucional autnomo que tiene por
objeto coordinar el Sistema Nacional de Evaluacin Educativa (SNEE), con la atribucin de evaluar la calidad, el
desempeo y los resultados del Sistema Educativo Nacional (SEN) en educacin preescolar, primaria, secundaria
y media superior.
De conformidad con los preceptos legales antes invocados, la Junta de Gobierno del Instituto disear y expedir
los lineamientos generales de evaluacin educativa a los que se sujetarn las Autoridades Educativas en su conjunto para llevar a cabo las funciones de evaluacin. Asimismo, conforme a lo establecido en el artculo 26 de la Ley
del Instituto Nacional para la Evaluacin de la Educacin, el Instituto, en el ejercicio de sus atribuciones, se regir
por los principios y criterios tcnicos de objetividad, validez y confiabilidad, segn se establece en el artculo mencionado, as como en el diverso 29 del mismo ordenamiento, el Instituto tambin deber actualizar peridicamente
los Criterios Tcnicos, los lineamientos y conceptos que establezca en materia de evaluacin de la educacin. Para
ello, la Junta de Gobierno del INEE determinar la periodicidad para su revisin y tomar en cuenta los avances
cientficos y tcnicos en materia de educacin y de evaluacin.
Los Criterios Tcnicos servirn de apoyo para cumplir con lo establecido en la fraccin XIII del artculo 27 de la Ley
del Instituto Nacional para la Evaluacin de la Educacin, en lo referente a asesorar y, en su caso, supervisar el diseo y aplicacin de instrumentos de medicin para las evaluaciones de los componentes, procesos o resultados del
SEN que realicen las Autoridades Educativas, en el marco de sus atribuciones y competencias.
Conforme a lo establecido en las fracciones X y XXI del artculo 38 de la Ley del Instituto Nacional para la Evaluacin
de la Educacin, la Junta de Gobierno del Instituto aprobar los proyectos de medicin y evaluacin que correspondan a componentes, procesos o resultados del SEN, en el mbito de su competencia. Las autoridades educativas
federales, locales, municipales y organismos descentralizados, o las organizaciones e instituciones pblicas o privadas interesadas en el desarrollo de instrumentos de evaluacin, debern considerar los presentes Criterios Tcnicos
para asegurar su calidad tcnica. Para este efecto, el Instituto revisar y, en su caso, har por escrito observaciones
a los instrumentos; para ello recurrir a la documentacin y sistematizacin de evidencias sobre su diseo, construccin y uso.
El propsito de los Criterios Tcnicos es el de proveer referentes para valorar la calidad de los instrumentos de evaluacin, de las prcticas evaluativas y de los usos de las evaluaciones. Aunque la valoracin de la calidad de los instrumentos de evaluacin educativa y de su aplicacin y usos dependen en gran medida del juicio de profesionales,
los Criterios Tcnicos proveen un marco de referencia que asegure sean considerados los aspectos ms importantes
de la evaluacin educativa. En general, los Criterios Tcnicos buscan propiciar que, dentro de los lmites posibles, la

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

informacin tcnica relevante de las evaluaciones sea visible, de tal manera que aquellos involucrados en la toma
de decisiones de poltica educativa estn bien informados sobre los alcances y limitaciones de los resultados que
arrojan los instrumentos de evaluacin educativa en el pas.
Para la integracin de los presentes Criterios Tcnicos se consideraron distintos aspectos de los estndares de
calidad tcnica para los instrumentos de evaluacin propuestos por organismos de evaluacin educativa internacionales y nacionales, como la European Commission (EC); el Grupo de Evaluacin de las Naciones Unidas (UNEG,
por sus siglas en ingls); el Comit para el Desarrollo de Estndares de Pruebas Educativas y Psicolgicas de la
American Educational Research Association (AERA), la American Psychological Association (APA) y el National
Council on Measurement in Education (NCME); el Joint Committee on Testing Practices (JCTP), el Educational Testing Service (ETS), el Centro Nacional de Evaluacin para la Educacin Superior (Ceneval) y el Instituto Nacional
para la Evaluacin de la Educacin (INEE).
Especialmente se retoman el enfoque y la lgica de los Estndares para los instrumentos de evaluacin educativos
y psicolgicos1 y el enfoque unitario de la validez2. En dichos enfoques, se proveen los fundamentos tericos y
las orientaciones que deben tomarse en cuenta para la obtencin de evidencias de calidad tcnica y validez de los
resultados de las evaluaciones, tanto educativas como psicolgicas.

2. Definicin de trminos
Para los efectos de los presentes criterios, se emplean las siguientes definiciones:
I.
Aplicadores: Personas fsicas con la funcin de auxiliar en la aplicacin de los instrumentos de evaluacin.
II.
Alto impacto: Se indica cuando los resultados del instrumento tienen consecuencias importantes para las
personas o las instituciones; por ejemplo, en los procesos de admisin o certificacin.
III.
Confiabilidad: Cualidad de las mediciones obtenidas con un instrumento, que se caracterizan por ser
consistentes y estables cuando este se aplica en distintas ocasiones.
IV.
Constructo: Elaboracin terica formulada para explicar un proceso social, psicolgico o educativo y
cuya adecuada descripcin permite que sea susceptible de ser observable o medible.
V.
Criterio de evaluacin: Indicador de un valor aceptable sobre el cual se puede establecer o fundamentar
un juicio del valor sobre el desempeo de una persona.
VI.
Desempeo: Es el resultado obtenido por la persona evaluada con un instrumento de evaluacin educativa.
VII. Dominio: Conjunto de conocimientos, habilidades, destrezas, actitudes u otros atributos que tienen las
siguientes propiedades: lmites, extensin y definicin. Tambin se puede aplicar a contenidos,
procedimientos u objetos.
1 American Educational Research Association (AERA), American Psychological Association (APA) y National Council on Measurement
in Education (NCM). (1999). Standards for educational and psychological testing. Washington, D.C.: American Educational Research
Association.
2 Messick, S. (1989). Validity. En R.L. Linn (Ed.), Educational measurement (3a. ed., pp 13-104). Nueva York: American Council on
Education/MacMillan.

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

VIII. Educacin bsica: Tipo de educacin que comprende los niveles de preescolar, primaria y secundaria en
todas sus modalidades, incluyendo la educacin indgena, la especial y la que se imparte en los centros de
educacin bsica para adultos.
IX.
Educacin media superior: Tipo de educacin que comprende el nivel de bachillerato, los dems niveles
equivalentes a ste, as como la educacin profesional que no requiere bachillerato o sus equivalentes.
X.
Especificaciones de tareas evaluativas o reactivos: Descripcin detallada de las caractersticas relevantes
que se espera tengan los sujetos al sustentar el instrumento de evaluacin y que es posible observar
a travs de las tareas evaluativas o los reactivos. Tienen el papel de guiar a los comits acadmicos
en la elaboracin y validacin de las tareas evaluativas o los reactivos y que estos cuenten con los
elementos necesarios para construirlos alineados al objeto de medida o constructo que se desea evaluar a
travs del instrumento.
XI.
Estndar: Principio de valor o calidad en la conduccin y uso de los procedimientos de evaluacin y que
son acordados por expertos en evaluacin.
XII. Estndar de desempeo: Es un criterio conceptual que delimita el marco interpretativo de las puntuaciones
obtenidas en un instrumento de evaluacin y que refiere a lo que la persona evaluada es capaz de hacer en
trminos de conocimientos, destrezas o habilidades en el contexto del instrumento.
XIII. Evaluacin: Accin de emitir juicios de valor que resultan de comparar los resultados de una medicin u
observacin con un referente previamente establecido.
XIV. Instrumento de evaluacin: Tcnicas de medicin y recoleccin de datos que suelen tener distintos formatos,
atendiendo a la naturaleza de la evaluacin, por ejemplo, instrumentos de seleccin de respuesta, instrumentos
de respuesta construida, cuestionarios, observaciones, portafolios, entre otros.
XV. Jueceo: Mtodo en el cual se utiliza la opinin de expertos (denominados jueces) para determinar,
entre otras cosas, la pertinencia de la validez de las tareas evaluativas o los reactivos respecto a un
dominio; el establecimiento de estndares o puntos de corte; as como la calificacin de reactivos de
respuesta construida.
XVI. Medicin: Proceso de asignacin de valores numricos a atributos de las personas, objetos o eventos de
acuerdo con reglas especficas que permitan que sus propiedades puedan ser representadas
cuantitativamente.
XVII. Muestra: Subconjunto de la poblacin de inters que refleja las variables medidas en una distribucin
semejante a las de la poblacin.
XVIII. Objeto de medida: Conjunto de caractersticas o atributos que se miden en el instrumento de evaluacin.
XIX. Prueba piloto de las tareas evaluativas o los reactivos: Recoleccin preliminar de datos sobre los elementos
de un nuevo instrumento de evaluacin a fin de valorar su funcionamiento en una poblacin especfica para
realizar ajustes orientados a su mejora y a su posterior aplicacin.
XX. Protocolo de aplicacin estandarizado: Procedimiento para la conduccin de la aplicacin de un instrumento
de medicin acorde a reglas especficas y detalladas que garanticen que las condiciones de evaluacin sean
las mismas para todos los examinados.

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

XXI. Punto de corte: En instrumentos de evaluacin con referencia a un estndar de desempeo, es la puntuacin
mnima o criterio a alcanzar o superar para considerar que el nivel de desempeo de una persona cumple con
lo esperado y distinguirlo de otro que no.
XXII. Instrumento de evaluacin referido a un criterio: Instrumento que permite comparar el desempeo de
las personas evaluadas con un estndar pre-establecido.
XXIII. Reactivo: Unidad bsica de medida de un instrumento de evaluacin que consiste en una pregunta o
instruccin que requiere una respuesta del sujeto.
XXIV. Rbrica: Herramienta que integra los criterios a partir de los cuales se califica una tarea evaluativa.
XXV. Sesgo: Error en la medicin de un atributo (por ejemplo, conocimiento o habilidad), debido a una variable
no controlada, como las diferencias culturales o lingsticas de las personas evaluadas.
XXVI. Tarea evaluativa: Unidad bsica de medida de un instrumento de evaluacin que consiste en la ejecucin
de una actividad que es susceptible de ser observada.
XXVII. Validez: Juicio valorativo integrador sobre el grado en que los fundamentos tericos y las evidencias
empricas apoyan la interpretacin de las puntuaciones de los instrumentos de evaluacin.

3. Introduccin
Los Criterios Tcnicos que se presentan a continuacin suponen que un buen instrumento de evaluacin es el producto de una aplicacin cuidadosa y coherente de principios establecidos para el diseo, elaboracin y revisin de
instrumentos de evaluacin. Estos principios refieren a un proceso de carcter secuencial en el que los productos
de una fase se convierten en los insumos de la siguiente.
Las fases del proceso de desarrollo de un instrumento de evaluacin que se consideran para la exposicin de
estos Criterios Tcnicos son seis: 1) planeacin del instrumento de evaluacin, 2) elaboracin del instrumento
de evaluacin, 3) aplicacin o administracin del instrumento, 4) procesamiento y anlisis de resultados del instrumento, 5) difusin y uso de los resultados y 6) informe tcnico del instrumento. Para cada una de estas fases
se contemplan diversas acciones de verificacin documental que permitirn cotejar el nivel de cumplimiento de
los criterios tcnicos expuestos.
Estos Criterios Tcnicos son aplicables a instrumentos de evaluacin educativa destinados a medir atributos de
personas, ya sean de seleccin de respuesta (como los instrumentos de opcin mltiple), de respuesta construida
(como los ensayos), o de desempeo (como el desarrollo de un plan de clase o una exposicin en el aula), y cualquiera que sea su forma de administracin (en lpiz y papel o dispositivos electrnicos).

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

4. Planeacin del instrumento de evaluacin


Esta fase incluye las siguientes acciones: Conformacin de los cuerpos colegiados de especialistas; definicin del
propsito y usos del instrumento de evaluacin; definicin del objeto de medida del instrumento de evaluacin y
elaboracin de las especificaciones.
4.1 Conformacin de los cuerpos colegiados de especialistas
4.1.1 Una vez que se concibe la idea de desarrollar un instrumento de evaluacin, debern integrarse los cuerpos
colegiados de especialistas que participarn realizando diversas tareas en las distintas fases del desarrollo del instrumento. El principio que debe guiar la integracin de estos cuerpos colegiados es el de contar con expertos del
campo o dominio a evaluar. Para su integracin, deber tenerse en cuenta la funcin especfica que cada uno de
ellos cumplir en las distintas fases del proceso de desarrollo del instrumento. Los integrantes de estos cuerpos
colegiados debern estar debidamente capacitados para las tareas especficas que habrn de realizar a lo largo del
proceso del desarrollo del instrumento de evaluacin. Algunos especialistas podrn participar en ms de un comit
con la finalidad de dar coherencia y continuidad al trabajo, y a los productos que se generen en cada fase.
4.1.2 El Consejo Tcnico ser la instancia responsable de definir los siguientes aspectos del instrumento: a) propsitos; b) usos que se darn a sus resultados; c) poblacin a la que se dirige; d) usuarios de la informacin que derive
de su aplicacin y e) tipo de instrumento y modalidad de administracin. Asimismo, vigilar que las distintas actividades realizadas por los comits de especialistas, en los que se apoya para el desarrollo del instrumento, estn
debidamente alineadas a estos aspectos.
4.1.3 Debern constituirse al menos cuatro comits de especialistas que apoyen al Consejo Tcnico para la realizacin de distintas tareas durante el proceso de desarrollo del instrumento de evaluacin: a) el Comit Acadmico, cuya funcin ser seleccionar, delimitar conceptualmente y justificar el objeto de medida o contenido del
instrumento de evaluacin; b) el Comit de Especificaciones, que tendr como funcin precisar y operacionalizar
el objeto de medida del instrumento de evaluacin; c) el Comit de Elaboracin de Tareas Evaluativas o Reactivos,
cuyo propsito es elaborar las tareas evaluativas o los reactivos, a partir de las especificaciones previamente desarrolladas por el Comit de Especificaciones y d) el Comit de Validacin, que tendr como funcin verificar que
las tareas evaluativas o los reactivos del instrumento estn debidamente alineados con las especificaciones que
operacionalizan el objeto de medida del instrumento, as como cuidar que las tareas evaluativas o los reactivos no
presenten errores de contenido y se redacten en un lenguaje apropiado para la poblacin evaluada.
4.1.4 Estos cinco cuerpos colegiados (Consejo Tcnico, Comit Acadmico, Comit de Especificaciones, Comit
de Elaboracin de Tareas Evaluativas o Reactivos, Comit de Validacin) debern ser coordinados por la instancia
(dependencia o institucin) responsable del desarrollo del instrumento de evaluacin. Dicha instancia tendr como
funcin: a) guiar, integrar y coordinar los trabajos de cada uno de los distintos cuerpos colegiados que participarn
a lo largo del proceso de evaluacin; b) capacitar a los integrantes de estos cuerpos colegiados para que realicen
adecuadamente sus funciones; c) realizar distintos mtodos de aseguramiento de la calidad mtrica del instrumento y d) elaborar el informe tcnico del instrumento de evaluacin.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar la fecha de instalacin de cada uno de estos cuerpos colegiados, as como el nombre, la
formacin acadmica, la ocupacin y la institucin de procedencia de cada uno de sus integrantes. Asimismo, debern
mostrarse los materiales que se utilizaron para la capacitacin de estos cuerpos colegiados.

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

4.2 Definicin del propsito y usos del instrumento de evaluacin


4.2.1 Debe definirse, de manera clara y concisa, lo que se pretende medir con el instrumento de evaluacin, esto es
el propsito con el que se desarrolla, as como los usos e interpretaciones que se darn a sus resultados. Este paso
es indispensable porque dirige todas las decisiones subsiguientes para el desarrollo del instrumento. Para cada uso
que se le d a los resultados del instrumento debern aportarse evidencias suficientes de que este uso es vlido,
especialmente para las evaluaciones de alto impacto, donde las consecuencias de los resultados son importantes
para las personas o las instituciones.
Junto con el propsito y los usos de los resultados del instrumento, debe definirse tambien la poblacin objetivo, el
tipo de instrumento y la modalidad en que se administrar, as como quines sern los usuarios de la informacin
y si los resultados de las evaluaciones tendrn algn tipo de consecuencia, ya sea para la escuela, los directivos, los
profesores o los alumnos.
Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar la ficha tcnica del instrumento de evaluacin en la que se especifiquen los siguientes aspectos:
propsito y poblacin objetivo; uso y alcance de sus resultados; tipo de instrumento, impacto o consecuencias de sus
resultados; as como la modalidad y condiciones de administracin o aplicacin.
4.3 Definicin del objeto de medida del instrumento de evaluacin
4.3.1 Toda evaluacin deber contar con un marco terico que justifique los trminos en los que el objeto de medida se aborda en el instrumento de evaluacin. En el caso de los instrumentos de evaluacin alineados al currculo,
debern contar con un marco explicativo que deje claro la manera en cmo el contenido del instrumento es una
muestra significativa del currculo por evaluar. Por su parte, las evaluaciones basadas en rasgos o atributos psicolgicos (tales como habilidad intelectual, competencia o aptitud) debern presentar un marco de la teora sustantiva
dado por la investigacin existente en el campo correspondiente.
4.3.2 La manera como se aborda el objeto de medida en el instrumento de evaluacin, debe establecerse fundamentalmente con base en el propsito y el marco terico del instrumento de evaluacin. Los criterios que se sigan
para seleccionar los aspectos o elementos que lo constituyen debern ser explcitos y garantizar que se trata de
aspectos o temas relevantes (importantes y significativos para el propsito de la evaluacin), pertinentes (congruentes con los propsitos y alcances de la evaluacin) representativos (que constituyen una muestra significativa
de los aspectos cruciales del objeto de medida) y viables para ser evaluados a travs del instrumento.
4.3.3 El contenido especfico del instrumento deber consignarse en una tabla de especificaciones en la que, por
un lado, se ordenen jerrquicamente los aspectos o elementos a medir (por ejemplo, reas, subreas y temas) y,
por el otro, el sistema de clasificacin de estos elementos o aspectos (por ejemplo, para el caso de la evaluacin
del aprendizaje, se podra utilizar la clasificacin cognoscitiva de la versin modificada de la taxonoma de Bloom o
la de Gagn). Para cada uno de los niveles jerrquicos considerados en la tabla, deber especificarse el nmero de
tareas evaluativas o reactivos considerados para su evaluacin.
4.3.4 El grupo de especialistas que integran el Comit Acadmico deber aprobar el marco terico o explicativo del
objeto de medida, la definicin conceptual del mismo y la tabla de especificaciones del instrumento.

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin

deber documentar el marco terico y la definicin conceptual del objeto de medida del instrumento, as como los

procedimientos empleados para seleccionar los contenidos especficos y para determinar la distribucin del nmero
de tareas evaluativas o reactivos en cada nivel jerrquico del instrumento. Asimismo, deber contarse con el

documento donde se detalle la taxonoma utilizada para clasificar los contenidos especficos del instrumento.

10

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

4.4 Elaboracin de las especificaciones


4.4.1 La fase de elaboracin de especificaciones forma parte del proceso de delimitacin del objeto de medida y
tiene como finalidad precisar, en trminos observables, los aspectos especficos que lo constituyen (conocimientos,
habilidades, competencias, actitudes o aptitudes). Las especificaciones son el principal insumo para la elaboracin
de las tareas evaluativas o los reactivos que conformarn el instrumento de evaluacin.
4.4.2 Las especificaciones debern elaborarse cuidando que contengan, al menos, los siguientes aspectos: a) una
definicin de la accin observable del sujeto como evidencia de que presenta el rasgo o atributo medido o domina
el contenido evaluado, b) una descripcin de las condiciones especficas bajo las cuales se espera que esta accin
se realice en el contexto de la evaluacin y c) una tarea evaluativa o reactivo que ejemplifique cmo se concreta la
medicin de lo que se establece en la especificacin.

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin

deber contar con las especificaciones elaboradas para cada aspecto del contenido del instrumento, firmadas
por los especialistas participantes.

5. Elaboracin del instrumento de evaluacin


Esta fase incluye las siguientes acciones: a) la elaboracin de las tareas evaluativas o los reactivos y b) el pilotaje de
las tareas evaluativas o los reactivos.
5.1 Elaboracin de tareas evaluativas o reactivos
5.1.1 Las tareas evaluativas o los reactivos son unidades bsicas de observacin que permiten hacer inferencias sobre la presencia del atributo medido o el nivel de desempeo alcanzado en el contenido especfico del instrumento
de evaluacin. Su elaboracin debe realizarse en estricto apego a las especificaciones diseadas para cada aspecto
del contenido del instrumento.
5.1.2 Debe cuidarse que el vocabulario empleado sea pertinente para la poblacin a la cual est dirigido el instrumento, as como que su redacin no produzca sesgo (diferencias artificiales e injustas) en las respuestas de los evaluados
por cuestiones culturales, lingsticas, religiosas, socioeconmicas, de gnero o caractersticas del contexto.
5.1.3 Mediante un proceso de jueceo en el que participen los especialistas del Comit de Validacin, debe verificarse que tareas evaluativas o los reactivos elaborados midan los aspectos que se pretenden medir con el
instrumento, que no presenten errores de contenido y de sesgo, y se redacten en un lenguaje apropiado para la
poblacin evaluada.

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar la evidencia de que todas las tareas evaluativas o reactivos utilizados en el instrumento
fueron aprobados por el comit de validacin (por ejemplo, actas de validacin).
5.2 Prueba piloto de las tareas evaluativas o reactivos
5.2.1 Una vez validadas las tareas evaluativas o los reactivos por el Comit de Validacin, debern someterse a
prueba con grupos de participantes que tengan las caractersticas ms cercanas posibles a la poblacin a la cual
est destinado el instrumento, a fin de poder detectar fallas en su desarrollo o tener estimaciones preliminares de
sus cualidades mtricas.

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

11

5.2.2 En caso de que sea imposible realizar una prueba piloto antes de su aplicacin final, deber incluirse un nmero mayor de tareas evaluativas o reactivos a los establecidos en la tabla de especificaciones del instrumento, para
que con base en los resultados se puedan identificar las tareas evaluativas o reactivos con mejor calidad mtrica
para ser utilizados en la calificacin.
5.2.3 En todos los casos se realizar el anlisis de dificultad y discriminacin de las tareas evaluativas o los reactivos
sometidos a prueba; adicionalmente, para los reactivos de opcin mltiple tambin se analizar el comportamiento de sus distractores. Esta informacin servir para identificar y eliminar aquellas tareas evaluativas o reactivos
que no alcancen los ndices de calidad tcnica requerida para este tipo de instrumentos.
5.2.4 En el caso de instrumentos de evaluacin que requieren de jueceo para la calificacin de las tareas evaluativas
o reactivos (por ejemplo, cuando se incluyen preguntas de respuesta construida que utilizan rbricas), adems del
anlisis de dificultad y discriminacin, debern definirse y documentarse tanto el procedimiento de jueceo como la
concordancia entre las valoraciones de los jueces.

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar los resultados del anlisis de las tareas evaluativas o reactivos probados, as como los

protocolos de lectura y calificacin utilizados.

6. Aplicacin o administracin del instrumento


De la poblacin evaluada
6.1 Uno de los aspectos cruciales que debe cuidarse es la administracin del instrumento a las personas evaluadas,
vigilando que las acciones involucradas permitan que stas lo hagan bajo las mismas condiciones de tiempo, supervisin y apoyos materiales.
6.2 Con al menos un mes de antelacin, deber proporcionarse informacin a las personas evaluadas sobre los siguientes aspectos: a) caractersticas y contenido del instrumento; b) uso que se dar a los resultados; c) lugar, hora
y duracin de la aplicacin del instrumento; d) materiales de apoyo que requerir para resolver el instrumento y e)
requisitos que deber cumplir para tener acceso al lugar de la aplicacin del instrumento (por ejemplo, la presentacin
de una identificacin oficial).
6.3 Las instrucciones y los materiales presentados a la poblacin evaluada debern ser lo suficientemente claros y
detallados para que puedan responder el instrumento de evaluacin. Cuando se utilicen formas no habituales para
registrar las respuestas (por ejemplo, aplicaciones por computadora), deber permitirse la realizacin de prcticas
previas a las personas que respondern el instrumento de evaluacin.

De los aplicadores
6.4 Para la administracin del instrumento, deber desarrollarse un manual del aplicador en el que se establezcan,
con toda claridad, las caractersticas de los materiales que manejar (por ejemplo, cuadernillo del instrumento,
hojas de respuesta, formatos de registro de incidencias, material de apoyo, etctera), las posibles contingencias
que pudieran ocurrir en el transcurso de la aplicacin y las acciones que deber tomar para enfrentarlas adecuadamente, as como los lmites y responsabilidades de los actores involucrados en la situacin de aplicacin.

12

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

6.5 El personal responsable de la aplicacin del instrumento de evaluacin deber estar previamente capacitado para realizar dicha tarea. Asimimismo, deber presentar condiciones de imparcialidad, asegurando que no
participen como aplicadores las personas que tengan algn conflicto de intereses que puedan llegar a afectar los
resultados de la evaluacin (por ejemplo, familiares o amigos de las personas evaluadas).
6.6 Los aplicadores debern estar presentes con suficiente antelacin (al menos dos horas antes) en el lugar en el
que se realizar la aplicacin del instrumento, a fin de garantizar que se cumpla con todos los requerimientos fsicos
y materiales indispensables para llevar a cabo adecuadamente el proceso de evaluacin.
6.7 Una vez iniciada la administracin del instrumento, el aplicador verificar que las personas por evaluar hayan
comprendido cabalmente las instrucciones del instrumento y, en su caso, atender aquellas dudas que estn dentro
de su marco de competencia y en los trminos establecidos en el manual del aplicador.

Del resguardo de los materiales y la aplicacin


6.8 Los procedimientos para resguardar todos los materiales y productos que deriven del proceso de evaluacin
debern contar con medidas de seguridad que salvaguarden su confidencialidad y el buen estado de los mismos,
especialmente en las evaluaciones de alto impacto para los alumnos, docentes o instituciones.
6.9 Los materiales y productos del proceso de evaluacin, debern quedar bajo el resguardo de las autoridades competentes, quienes debern cuidar su posterior envo al rea responsable del anlisis del instrumento de evaluacin.
6.10 La aplicacin del instrumento de evaluacin se efectuar en espacios que renan las condiciones adecuadas
de comodidad, higiene, iluminacin y ventilacin, as como aquellas especficas que se deban atender dada la naturaleza de la evaluacin y donde exista el mnimo posible de distracciones.

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar los materiales utilizados para informar a las personas por evaluar sobre las caractersticas
y contenidos del instrumento de evaluacin, as como de las particularidades de su aplicacin. Asimismo, deber
contar con el manual del aplicador y con el documento donde se detallen los protocolos de aplicacin y resguardo
de los materiales.

7. Procesamiento y anlisis de resultados del instrumento


7.1 Uno de los aspectos fundamentales que debe llevarse a cabo antes de emitir cualquier resultado de un proceso
de evaluacin es el anlisis psicomtrico del instrumento con el objetivo de verificar que cuenta con la calidad tcnica necesaria para proporcionar resultados confiables, acordes con el objetivo de la evaluacin.
7.2 Las tcnicas empleadas para el anlisis del instrumento dependern de su naturaleza, diseo de la muestra o
tamao de la poblacin, as como de los objetivos especficos para el cual fue diseado. Sin embargo, en todos los
casos, se debern aportar datos sobre la dificultad y discriminacin de sus reactivos o tareas evaluativas, as como
sobre los indicadores de consistencia interna o estabilidad del instrumento y de validez de la interpretacin de sus
resultados.
7.3 Los procesos anteriores debern permitir identificar las tareas evaluativas o los reactivos que contribuyen a la
calidad mtrica del instrumento y slo estos deben incorporarse para la calificacin de las personas evaluadas, a fin
de estimar con mayor precisin su desempeo. Este procedimiento debe permitir, al mismo tiempo, corroborar las
claves de las respuestas correctas.

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

13

7.4 Deber realizarse el proceso de calificacin con base en protocolos estandarizados que incorporen los algoritmos y reglas de calificacin, considerando que deben ser claras para el pblico usuario del instrumento y que se
correspondan con el propsito de la evaluacin.
7.5 Cuando se incluyan procesos de jueceo en la calificacin de un instrumento de respuesta construida, se documentarn con claridad los procedimientos y criterios que utilizarn los jueces en la calificacin de las respuestas.
Tambin se proporcionar evidencia del grado de acuerdo entre las puntuaciones dadas por los jueces a fin de que
la calificacin obtenida sea un resultado imparcial y objetivo de la medicin.
7.6 Para los instrumentos de evaluacin en los que se requiera determinar un punto de corte para establecer estndares de desempeo, el Comit Acadmico deber ser capacitado especficamente para ejercer su mejor juicio
profesional y poder identificar cul es la puntuacin requerida para que la persona evaluada alcance un determinado nivel o estndar de desempeo.3

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin

deber documentar los protocolos, algoritmos y reglas de calificacin, as como la manera correcta de interpretar

los resultados. En los casos que se utilicen puntos de corte para definir niveles de desempeo, deber documentarse
la racionalidad del proceso y las caractersticas de los juicios emitidos por los expertos, as como la evidencia de la
idoneidad de su experiencia profesional y formacin acadmica que sustenten la validez de los niveles establecidos.
Asimismo, deber documentarse los materiales utilizados para la capacitacin.

8. Difusin y uso de los resultados


8.1 La informacin de los resultados que se haga pblica deber incluir descripciones breves del propsito y las
caractersticas del instrumento, precisando lo que pretende medir, las interpretaciones, conclusiones y decisiones
que pueden basarse en sus resultados, as como cualquier informacin que ayude a evitar interpretaciones y usos
inapropiados de los resultados.
8.2 Las organizaciones que conserven resultados de instrumentos de evaluacin de individuos, debern tener lineamientos explcitos en cuanto al tiempo que conservarn los resultados, su disponibilidad pblica y su uso a lo
largo del tiempo. Lo anterior deber cumplir con lo establecido en la Constitucin Poltica de los Estados Unidos
Mexicanos y leyes secundarias correspondientes, en lo referente a la proteccin de datos personales.
8.3 El reporte de resultados de la evaluacin deber ser consistente con el propsito, el objeto de medida y la tabla
de especificaciones del instrumento de evaluacin. En los casos de los instrumentos de evaluacin referidos a un
criterio, las etiquetas que identifiquen los estndares o niveles de desempeo, debern ser consistentes con la descripcin de lo que se espera sea capaz de hacer la persona evaluada para ser clasificada en cada categora de logro.
Deber evitarse el uso de etiquetas estigmatizantes.

3 Para el caso del Servicio Profesional Docente, le corresponde definir este aspecto al INEE, de conformidad con lo establecido en el
numeral I del Artculo 9 de los Lineamientos iniciales especficos para llevar a cabo la evaluacin del ingreso al Servicio Profesional
Docente en Educacin bsica y Educacin media superior y lineamientos iniciales especficos para llevar a cabo la evaluacin para la
promocin a cargos con funciones de Direccin (Directores) en Educacin media superior, para el ciclo escolar 2014-2015.

14

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

8.4 Ninguna decisin que tenga consecuencias importantes sobre los individuos o instituciones, se basar nicamente en los resultados de solo un instrumento de evaluacin, por lo cual, debern considerarse otras fuentes
confiables de informacin que incrementen la validez de las decisiones que se tomen (por ejemplo, en los procesos
de ingreso o admisin, la experiencia previa, el promedio escolar, cartas de recomendacin o entrevistas).

Accin para la verificacin documental. La instancia responsable del desarrollo del instrumento de evaluacin
deber documentar los formatos utilizados para reportar los resultados del instrumento, as como la racionalidad

en la que se bas su diseo.

9. Informe tcnico del instrumento


9.1 La integracin de las evidencias de las fases del proceso de desarrollo del instrumento de evaluacin hasta aqu
expuestos (planeacin del instrumento de evaluacin; elaboracin del instrumento de evaluacin; aplicacin o administracin del instrumento; procesamiento y anlisis de resultados del instrumento, as como la difusin y uso de
los resultados) es fundamental para el uso e interpretacin vlidos de las puntuaciones o calificaciones obtenidas.
Es por ello que, como parte final de todo este proceso, la instancia responsable del desarrollo del instrumento de
evaluacin deber elaborar el informe tcnico correspondiente.
9.2 Dicho informe deber resumir los aspectos sustantivos documentados de cada una de las fases del proceso de
desarrollo de un instrumento de evaluacin y que han quedado sealados en los nueve apartados denominados
Accin para la verificacin documental en cada caso. Adems deber contener recomendaciones para mejorar la
calidad tcnica del instrumento de evaluacin.

Mxico, D.F., a los diez das del mes de abril de dos mil catorce.- As lo
aprob la Junta de Gobierno del Instituto Nacional para la Evaluacin de
la Educacin en la Quinta Sesin Extraordinaria, celebrada el diez de abril
de dos mil catorce. Acuerdo nmero SEAJG/5-14/01.O2,R.- La Consejera
Presidenta, Sylvia Irene Schmelkes del Valle.- Rbrica.- Los Consejeros:
Eduardo Backhoff Escudero, Teresa Bracho Gonzlez, Gilberto Ramn
Guevara Niebla, Margarita Mara Zorrilla Fierro.- Rbricas

Criterios Tcnicos para el Desarrollo y Uso de Instrumentos de Evaluacin Educativa, 2014-2015

15

You might also like