Professional Documents
Culture Documents
Sinopsis: Mtodos
de Recoleccin y
Anlisis de Datos en la
Evaluacin de Impacto
Greet Peersman
1.
Uno Elegir y aplicar bien los mtodos de recoleccin y anlisis de datos es esencial en todos los tipos
de evaluaciones. Esta sntesis presenta una visin general de las cuestiones relacionadas con la
eleccin y uso de mtodos para las evaluaciones de impacto, es decir, las evaluaciones que
proporcionan informacin sobre los efectos a largo plazo previstos y no previstos producidos por los
programas o polticas.
Las evaluaciones de impacto deben ir ms all de la simple evaluacin de la magnitud de los efectos
(el impacto medio) para determinar con quin y de qu forma ha tenido xito un programa o poltica.
Se deben examinar por anticipado los factores que contribuyen al xito y la forma de analizar y
sintetizar los datos para responder a las preguntas clave de evaluacin especficas, puesto que la
recoleccin de datos debe orientarse a la combinacin de pruebas empricas necesarias para tomar
decisiones adecuadas sobre el programa o poltica. En otras palabras, durante la fase de
planificacin de la evaluacin se debe especificar el marco analtico: la metodologa para analizar el
significado de los datos examinando patrones de manera sistemtica y transparente. El marco
contiene la forma en que el anlisis de datos abordar los supuestos formulados en la teora del
cambio del programa sobre cmo se cree que el programa producir los resultados previstos (vase
la Sntesis n.o 2 (Teora del cambio)). En una verdadera evaluacin con mtodos mixtos, esto implica
utilizar mtodos de anlisis numricos y textuales adecuados y triangular mltiples fuentes de datos y
perspectivas para maximizar la fiabilidad de las constataciones de la evaluacin.
Puntos principales
1. Los mtodos de recoleccin y anlisis de datos deben elegirse en funcin de las preguntas
clave de evaluacin y los recursos disponibles de la evaluacin.
2. Las evaluaciones de impacto deben aprovechar al mximo los datos existentes y subsanar
las carencias con nuevos datos.
3. Los mtodos de recoleccin y anlisis de datos deben elegirse de forma que se
complementen entre s los puntos fuertes y dbiles.
2.
PLANIFICACIN DE LA RECOLECCIN Y EL
ANLISIS DE DATOS
La Sntesis n.o 1 (Sinopsis de la evaluacin de impacto) cubre la necesidad de distintos enfoques de evaluacin de las
polticas en vez de programas.
Pgina 2
Encuesta de
participantes
del programa
Registros de
proyectos
Observacin
de la
ejecucin del
programa
PCE 2 En qu medida se
cumplieron los objetivos del
programa?
Entrevistas a
informantes
clave
White, Howard, A contribution to current debates in impact evaluation, Evaluation, 16(2), 2010, pgs. 153164.
Pgina 3
Qu podra incluir?
Ejemplos
Recuperacin de
documentos y datos
existentes
Documentos de poltica
formales, planes e informes de
ejecucin
Estadsticas oficiales
El perfil poltico,
socioeconmico o sanitario del
pas o el lugar especfico
donde se ejecut el programa
Entrevistas4 a informantes
clave, personas, grupos,
grupos dirigidos de discusin,
tcnicas de proyeccin
Cuestionarios o encuestas a
travs de correo electrnico,
sitios web, cara a cara, datos
mviles
Recoleccin de datos
de personas o grupos
Puede encontrarse ms informacin sobre cada una de ellos y una lista ms exhaustiva de opciones de
recoleccin/cotejo de datos en Collect and/or Retrieve Data en el sitio web BetterEvaluation, en
http://betterevaluation.org/plan/describe/collect_retrieve_data.
Votacin por puntos: recabar niveles de acuerdo sobre declaraciones escritas entre un gran nmero de personas.
Clasificacin de tarjetas: da una idea de cmo las personas categorizan y clasifican distintos fenmenos. Calendarios
estacionales: visualizar patrones de variaciones a lo largo de determinados periodos de tiempo. Tcnicas de proyeccin:
dar pie a entrevistas (por ejemplo, utilizando fotolenguaje; los participantes seleccionan una o dos imgenes de un
conjunto y las utilizan para ilustrar sus comentarios sobre algo). Vivencias: por ejemplo vivencias personales para dar una
idea de cmo viven la vida las personas.
Pgina 4
Observacin
Medicin fsica
Estructurada o no estructurada
Observaciones de las
actividades del programa y las
interacciones con los
participantes
De participantes o no
participantes
Participativa o no participativa
Mediciones biofsicas
Informacin geogrfica
si los mtodos se utilizarn de forma secuencial (los datos de una fuente sirven de base para la
recoleccin de datos de otra fuente) o simultnea (se utiliza la triangulacin para comparar
informacin de distintas fuentes independientes);
si el diseo ser de un solo nivel (por ejemplo, los hogares) o de mltiples niveles (por ejemplo,
un programa nacional que requiere la descripcin y el anlisis de los vnculos entre los distintos
niveles).
Las preguntas descriptivas requieren mtodos de anlisis de datos que incluyan datos
cuantitativos y cualitativos.
Las preguntas causales requieren un diseo de investigacin que aborde la atribucin (si los
cambios observados se deben o no a la intervencin o a factores externos) y la contribucin
Bamberger, Michael, Introduction to Mixed Methods in Impact Evaluation, Guidance Note No. 3, InterAction,
Washington, D.C., agosto de 2012. Vase http://www.interaction.org/impact-evaluation-notes.
Ibd.
Pgina 5
Las preguntas evaluativas requieren estrategias de sntesis que apliquen los criterios
evaluativos a los datos para responder a las preguntas clave de evaluacin (vase la Sntesis
n.o 3 (Criterios de evaluacin)). Definir por anticipado los factores de xito construyendo
rbricas evaluativas especficas (estndares o niveles de desempeo del programa o poltica)
sienta la base sobre la cual puede combinarse sistemticamente la informacin recabada para
tomar decisiones con base emprica transparentes sobre el valor del programa o poltica
(tambin llamado razonamiento evaluativo, vase la Sntesis n.o 4 (Razonamiento
evaluativo)).
Si bien la evaluacin de impacto tiene por objeto analizar los resultados a largo plazo de un programa
o poltica, los responsables de tomar decisiones suelen necesitar informacin ms puntual y, por lo
tanto, deben recopilar tambin datos sobre los resultados a corto plazo. Por ejemplo, es bien sabido
que los resultados de las intervenciones en materia de educacin solo aparecen despus de un
periodo de tiempo prolongado. En el caso de la iniciativa de escuelas amigas de la infancia en
Moldava, su evaluacin solo capt los resultados a corto plazo (como la mayor participacin de los
estudiantes en el aprendizaje a travs de mtodos de enseanza interactivos y participativos 8), que
fueron medidos durante la intervencin o poco despus de su finalizacin, y supuso que estos
predecan los efectos a largo plazo.
Sin embargo, determinar simplemente que se ha producido un cambio midiendo indicadores
clave no indica por qu ha ocurrido. Tambin se necesita informacin sobre las actividades
especficas que se llevaron a cabo y sobre el contexto en el que se llevaron a cabo. Como se ha
sealado anteriormente, es esencial una teora del cambio explcita para el programa o poltica a fin
de determinar qu mediciones deben recabarse, adems de que orienta sobre los aspectos de la
ejecucin del programa y su contexto en los que debe centrarse la recoleccin de datos. Si se
especifica el marco de anlisis de datos al inicio, se incorporan claramente las necesidades
concretas de recoleccin de datos (datos primarios o nuevos que deben recopilarse) y cotejo de
datos (datos secundarios o existentes), reflejando tambin cmo se analizarn los datos para
responder a las preguntas clave de evaluacin y realizar ajustes evaluativos. Las necesidades de
datos y los mtodos de recoleccin y anlisis de datos vinculados a cada una de las preguntas clave
de evaluacin deben describirse en el plan de evaluacin junto con las especificaciones de cmo,
dnde, cundo y de quin se recolectarn datos, con referencia a la estrategia de muestreo de la
poblacin objeto de estudio, los lugares o los periodos de tiempo.
Velea, Simona y CReDO (Centro de Recursos de Derechos Humanos), Child-Friendly Schools, External Evaluation
Report of the Child-Friendly School Initiative (20072011), Republic of Moldova, Ministerio de Educacin de la Repblica
de Moldova/UNICEF, 2012. Vase http://www.unicef.org/moldova/CFS_EN_PRINT.pdf.
Pgina 6
3.
Una buena gestin de datos implica desarrollar procesos eficaces para la recoleccin y el registro
sistemticos de datos, el almacenamiento seguro de los datos, la depuracin de datos, la
transferencia de los datos (por ejemplo, entre distintos tipos de programas informticos utilizados
para el anlisis), la presentacin eficaz de los datos y la accesibilidad de los datos para su
verificacin y utilizacin por terceros.
Los aspectos de calidad de los datos que se mencionan comnmente son:
Integridad: los datos estn protegidos de sesgos o manipulaciones deliberados por motivos
polticos o personales.
Una definicin ms especfica de las mediciones cuantitativas sera: una medicin se considera vlida si es exacta y
precisa. La exactitud se define como la desviacin del valor verdadero y la precisin como la dispersin. En otras
palabras, la exactitud se refiere a cunto se acerca la medicin tomada al valor (verdadero) real; la precisin es el grado
en el que las mediciones repetidas en condiciones invariables muestran los mismos resultados.
Pgina 7
4.
Pgina 8
Riesgo de introducir
sesgos
Probabilstico: Utilizar
mtodos aleatorios o cuasi
aleatorios para seleccionar la
muestra y utilizar
posteriormente la
extrapolabilidad estadstica
para extraer conclusiones
sobre esa poblacin.
Confirmar y rechazar
Caso crtico
Muestreo de variacin mxima
Valor atpico
Muestreo de bola de nieve
Basado en teoras
Caso tpico
De conveniencia: Estas
opciones de muestreo utilizan a
individuos que estn
disponibles o casos a medida
que ocurren.
Fcilmente disponible
Voluntarios
Las distintas formas de muestreo introducirn distintos tipos de sesgo al evaluar los resultados de un
programa o poltica. Como tal, es importante describir claramente los puntos fuertes y dbiles de la
estrategia de muestreo utilizada y tenerlos en cuenta, si es posible, en el anlisis de datos o describir
cmo afectan a las conclusiones extradas sobre el programa o poltica sometidos a prueba.
Aunque se han mencionado tres grupos de opciones de muestreo, es mejor evitar el muestreo de
conveniencia, puesto que no permite una extrapolabilidad adecuada de las constataciones (es decir,
realizar estimaciones sobre el total de la poblacin a partir de las constataciones de la muestra
estudiada). En el muestreo probabilstico, todas las unidades tienen la misma posibilidad o una
posibilidad conocida de ser seleccionadas, lo que aumenta la probabilidad de que la informacin
recabada sobre la muestra sea representativa de toda la poblacin de inters, especialmente si se
cumplen las condiciones sobre el tamao de la muestra (vase la Sntesis n.o 7 (Ensayos controlados
aleatorios)). El muestreo probabilstico permite una extrapolabilidad estadstica en la que se da un
cierto margen de error (normalmente, entre un 5% y un 10%) que define el nivel de riesgo aceptable
de equivocacin sobre los resultados del programa. El muestreo intencional no se basa en la
representacin o la aleatoriedad, y se utiliza para seleccionar aquellas unidades de las que se puede
aprender mucho sobre las cuestiones que son importantes para la evaluacin (como los informantes
Pgina 9
5.
Al igual que con la recoleccin de datos, garantizar la calidad en el anlisis de datos forma parte de
una buena gestin de datos. En esta seccin se examinan con ms detalle algunas cuestiones
especialmente pertinentes.
Cada fuente de datos tiene sus puntos fuertes y sus limitaciones, todos los cuales deben describirse
explcitamente (en trminos de calidad de los datos, vase ms adelante) y entenderse claramente a
fin de asegurar que las fuentes se utilicen e interpreten de manera adecuada (vase la seccin 7).
Por este motivo, si se integran intencionadamente distintos mtodos de recoleccin de datos o se
triangulan distintas fuentes de datos para responder a las preguntas clave de evaluacin se
conseguir superar las carencias inherentes a cada fuente de datos de manera individual. Un
enfoque de mtodos mixtos tambin mejora la fiabilidad de las constataciones cuando la informacin
de distintas fuentes de datos converge (coincide en la direccin de las constataciones) y pueden
profundizar el entendimiento de un programa o poltica, sus efectos y su contexto. Aunque la
combinacin de mtodos puede realizarse post hoc (es decir, despus de haber recopilado los
datos), es recomendable, y con frecuencia mucho ms fcil, hacerlo al inicio (es decir, durante la
planificacin de la evaluacin), para que la recoleccin de datos pueda orientarse especficamente a
garantizar la disponibilidad de una combinacin adecuada de pruebas empricas justo en el momento
de responder a las preguntas clave de evaluacin. En el cuadro 4 se recogen los propsitos
principales de la combinacin de fuentes de datos.
10
Pgina 10
Examinar
Explicar
Triangular (confirmar
o rechazar)
Analizar los datos para resumirlos y buscar patrones es una parte importante de toda evaluacin. Las
estrategias de anlisis de datos y la forma de sintetizar los datos deben definirse en la fase de diseo
de la evaluacin, adecuarse al tipo de preguntas clave de evaluacin y describirse ntegramente en el
plan de evaluacin.
En el caso de las preguntas clave de evaluacin descriptivas, existe toda una serie de opciones de
anlisis (vase el cuadro 5). Las opciones pueden agruparse principalmente en dos categoras:
opciones para datos cuantitativos (nmeros) y opciones para datos cualitativos (por ejemplo, texto).
Anlisis textual
Analizar palabras, orales o escritas, incluidas respuestas a cuestionarios, entrevistas y
documentos. Algunas opciones son:
En el caso de las preguntas clave de evaluacin causales, bsicamente hay tres enfoques de anlisis
de la atribucin causal: 1) enfoques contrafcticos; 2) coherencia de las pruebas empricas con la
relacin causal; y 3) descarte de alternativas (vase el cuadro 6). Lo ideal es combinar estos
enfoques para determinar la causalidad (vase la Sntesis n.o 6 (Sinopsis: Estrategias de atribucin
causal)).
En el caso de las preguntas clave de evaluacin, deben aplicarse rbricas evaluativas especficas a
los criterios de evaluacin empleados (como los criterios del CAD de la OCDE) para sintetizar las
pruebas empricas y emitir juicios sobre el valor del programa o poltica (vase la Sntesis n. o 4
(Razonamiento evaluativo)).
Coherencia de las
pruebas empricas con la
relacin causal
Descarte de alternativas
explicativas
Pgina 12
6.
Cuestiones ticas
Todas las evaluaciones deben seguir las directrices ticas de evaluacin12 del Grupo de Evaluacin
de las Naciones Unidas (UNEG), a las que se adhiere UNICEF. Estas directrices establecen tanto un
cdigo de conducta para evaluadores como obligaciones ticas para los participantes en la
evaluacin en relacin con la recoleccin y el almacenamiento de datos (vase asimismo la Sntesis
n.o 1 (Sinopsis de la evaluacin de impacto)). Estas incluyen: respeto de la dignidad y la diversidad;
derechos; confidencialidad; y prevencin del dao. Estas obligaciones deben cumplirse
explcitamente en el diseo de la evaluacin y durante todo el proceso de evaluacin (vase el sitio
web Ethical Research Involving Children)13.
En la mayora de los casos, la aprobacin oficial de la forma de recoleccin, gestin y uso de los
datos en la evaluacin requerir una junta de examen institucional. El objetivo es asegurar que estas
prcticas cumplan las obligaciones ticas para todos aquellos de quienes se recaban datos.
La evaluacin de la iniciativa de escuelas amigas de la infancia en Moldava14 brind algunos buenos
ejemplos de estrategias para abordar las cuestiones ticas durante la recoleccin y anlisis de datos:
Durante la fase preparatoria, se consult a las partes interesadas (UNICEF y los asociados en
la ejecucin) y posteriormente se pusieron a prueba las herramientas de recoleccin de datos
en un pequeo grupo de profesores, nios y padres que participaron voluntariamente tras
recibir informacin sobre el proceso de prueba. Esto se hizo para detectar cualquier cosa que
pudiese interpretarse que podra causar molestia, crear situaciones raras o afectar a los
derechos de los participantes.
Durante la fase de recoleccin de datos, se asegur a los encuestados que todos los datos se
trataran de forma confidencial y que se utilizaran exclusivamente para fines de evaluacin.
11
Para obtener ms informacin sobre los mtodos especficos de visualizacin de datos, vase Visualise Data, sitio web
de BetterEvaluation, http://betterevaluation.org/plan/describe/visualize_data.
12
Grupo de Evaluacin de las Naciones Unidas, Ethical Guidelines for Evaluation, UNEG, Nueva York, 2007.
13
El sitio web www.childethics.com es un depsito de informacin con base emprica, recursos y enlaces a artculos de
revistas compilado por el proyecto Ethical Research Involving Children para orientar y mejorar la investigacin con nios y
proporcionar una plataforma de reflexin crtica y dilogo.
14
Velea, Simona y CReDO (Centro de Recursos de Derechos Humanos), Child-Friendly Schools, External Evaluation
Report of the Child-Friendly School Initiative (20072011), Republic of Moldova, Ministerio de Educacin de la Repblica
de Moldova/UNICEF, 2012.
Pgina 13
Durante las entrevistas, las interacciones entre los propios participantes y entre los
participantes y los evaluadores se basaron en el respeto mutuo y la confianza.
Los datos de los cuestionarios se sometieron a tratamiento estadstico y los datos cualitativos
se revisaron en su conjunto, sin ninguna informacin personal. (Sin embargo, se realizaron
observaciones especficas sobre determinadas escuelas identificadas).
Limitaciones prcticas
Algunas limitaciones prcticas comunes en la recoleccin de datos pueden ser:
Los informantes clave, los participantes y las ubicaciones pertinentes pueden no estar
disponibles/localizables si:
o
no hay informacin completa sobre las ubicaciones del programa o los participantes;
Las fuentes de datos pertinentes existentes (como los indicadores de los informes de avances
de los asociados en la ejecucin; los datos de encuestas) son limitadas en cuanto a tiempo
(por ejemplo, no hay base de referencia o series temporales disponibles), o contenido (por
ejemplo, faltan indicadores importantes) o calidad (hay seria preocupacin respecto a la
calidad de los datos).
A menudo existe informacin escasa sobre la calidad de los servicios prestados por los
distintos ejecutores en el caso de un programa a gran escala.
Pgina 14
7.
incluir y valorar a todos los alumnos, con independencia de su etnia, estatus social,
discapacidad, religin o gnero;
garantizar que se ensee a los alumnos cmo aprender y que lo que aprendan sea relevante
para su vida cotidiana, integrando en la clase las experiencias de aprendizaje positivas que
estos adquieran fuera de la escuela;
cultivar una buena comunicacin con los padres y fomentar su participacin en la educacin
del nio.
15
Velea, Simona y CReDO (Centro de Recursos de Derechos Humanos), Child-Friendly Schools, External Evaluation
Report of the Child-Friendly School Initiative (20072011), Republic of Moldova, Ministerio de Educacin de la Repblica
de Moldova/UNICEF, 2012, pgs. 4748.
Pgina 15
Pgina 16
8.
Un posible problema en la recoleccin y anlisis de datos puede referirse a una mala eleccin de los
mtodos as como a una mala aplicacin de los mtodos. A continuacin se presentan algunos
ejemplos.
Pgina 18
9.
Bamberger, Michael, Introduction to Mixed Methods in Impact Evaluation, Guidance Note No. 3,
InterAction, Washington, D.C., agosto de 2012. Vase http://www.interaction.org/impact-evaluationnotes.
BetterEvaluation, Analyze Data, sitio web de BetterEvaluation,
http://betterevaluation.org/plan/describe/look_for_patterns.
BetterEvaluation, Collect and/or Retrieve Data, sitio web de BetterEvaluation,
http://betterevaluation.org/plan/describe/collect_retrieve_data.
BetterEvaluation, Combine Qualitative and Quantitative Data, sitio web de BetterEvaluation,
http://betterevaluation.org/plan/describe/combining_qualitative_and_quantitative_data.
BetterEvaluation, Manage Data, sitio web de BetterEvaluation,
http://betterevaluation.org/plan/describe/manage_data.
Evergreen, Stephanie, D.H., Presenting Data Effectively, Communicating Your Findings for Maximum
Impact, Sage, Thousand Oaks, 2013.
Measure Evaluation, Data Quality Assurance, sitio web de Measure Evaluation,
http://www.cpc.unc.edu/measure/tools/monitoring-evaluation-systems/data-quality-assurancetools/data-quality-assurance-tools.
Patton, Michael Quinn, Qualitative Research & Evaluation Methods, tercera edicin, Sage, Thousand
Oaks, 2001.
Perrin, Burt, Linking Monitoring and Evaluation to Impact Evaluation, Guidance Note No. 2,
InterAction, Washington, D.C., abril de 2012. Vase http://www.interaction.org/document/guidancenote-2-linking-monitoring-and-evaluation-impact-evaluation.
Pgina 19
GLOSARIO
Actividad
Datos de referencia
Depuracin de datos
Error de muestreo
Evaluacin participativa
Impacto
Indicador
Informante clave
Insumo
16
CAD-OCDE, Glosario de los principales trminos sobre evaluacin y gestin basada en resultados, OCDE, Pars, 2010. Vase
http://www.oecd.org/development/peer-reviews/2754804.pdf.
Pgina i
Metaevaluacin
Muestreo de variacin
mxima
Muestreo estratificado
Muestreo secuencial
Producto
Pgina ii
Revisin realista
Revisin sistemtica
Valor atpico
Pgina iii