You are on page 1of 6

1- Investiga y analiza que significa la validez y confiabilidad de una prueba o

Test estadísticamente.
Validez de los test

Los Test son válidos en la medida en que miden lo que deben medir. Podemos
distinguir entre la validez aparente y la validez comprobada:

Validez aparente: hace referencia al grado en que el test parece que mide lo que
quiere medir.

Validez comprobada: es la que ha sido verificada de alguna forma empírica o


experimental. La validez comprobada es empírica o teórica.

Validez empírica: es empírica cuando se ha comprobado de modo práctico. Por


ejemplo, un test para seleccionar conductores es válido si distingue a los buenos
de los malos conductores, a pesar de no saber exactamente por qué lo consigue.

Validez teórica: refleja el grado en que se ha comprobado con argumentos


científicos que el test mide la propiedad o rasgo que intenta medir.

Por ejemplo, un test de inteligencia tendrá validez teórica cuando exista una
prueba de ello que se apoye en una verificación lógica y experimental.

La validez aparente: Un test tiene validez aparente si parece que mide lo que
intenta medir. No es una validez suficiente, aunque a menudo es necesaria.
Muchas veces, conviene que el test les parezca válido a los sujetos que han de
contestarlo. En otras ocasiones, es fundamental que el test no parezca que mide
lo que mide. Éste es el primer requisito de la validez efectiva. Para conseguir ésta
no es suficiente con que el test parezca válido, es preciso que se compruebe que
lo es.

La validez comprobada: La validez efectiva es la validez comprobada. Existen


muchos modos de comprobar la validez unos son empíricos y otros lógico-
experimentales.
La validez empírica o de criterio: Un test tiene validez empírica si se ha
comprobado que sirve para alguna finalidad práctica. Por ejemplo, un test es
válido para seleccionar conductores si distingue los diferentes grados de pericia en
la conducción.

La validez empírica también se denomina validez de criterio, y para comprobarla,


se debe definir un criterio externo de validez. En el ejemplo comentado el criterio
externo es la pericia en la conducción. El coeficiente de validez del test es la
correlación entre el test y el criterio. Si los mejores en el test son los que conducen
mejor, el test tendrá un alto coeficiente de validez respecto a ese criterio, y
tendremos un test empíricamente válido para seleccionar conductores.

Esta validez es científicamente ciega, porque no sabemos en qué se basa la


validez del test. El test es válido para seleccionar conductores, no sabemos por
qué. La validez empírica puede clasificarse en:

Validez prospectiva o predictiva o de pronóstico: Es la que se comprueba


mediante la correlación entre el test y un criterio medido ulteriormente. Por
ejemplo, si tenemos muchos aspirantes a pilotos y queremos seleccionar a los que
tengan más probabilidad de convertirse, pasados los estudios y prácticas, en
buenos pilotos. Podemos aplicarles ciertos test que aprecien los requisitos de ser
buen piloto, y admitir a todos los aspirantes. Después de los estudios y las
prácticas oportunas, mediremos a los sujetos en el criterio que garantice ser un
buen piloto. Si los Test contestados por los sujetos en el momento de la admisión
tienen una alta correlación con la pericia como piloto, medida después del
aprendizaje, a lo mejor años después, se puede afirmar que estos tests tienen alta
validez prospectiva. Esta validez se ha llamado validez prospectiva, predictiva y de
pronóstico, ya que permite pronosticar o predecir convenientemente los resultados
de los sujetos en el criterio, sirve para seleccionar a los aspirantes que con más
probabilidad van a ser buenos pilotos.

Validez inspectora o concomitante o concurrente: Generalmente resulta


demasiado costoso someter a prueba la validez predictiva; suele estar fuera de las
posibilidades prácticas del psicólogo. Por ello, con frecuencia se recurre al método
de la validez inspectora, concomitante o concurrente. Es igual que el
procedimiento anterior pero los test y el criterio se miden en el mismo periodo
concomitante o concurrentemente. Por ejemplo, se escoge una muestra oportuna
de pilotos, se les aplica los test oportunos y se les mide en el criterio de pericia. El
coeficiente de validez concomitante será la correlación entre los test y el criterio.
Nos informa hasta qué punto los buenos y los malos en el test son, en este
momento, buenos y malos en el criterio. No nos garantiza que los aspirantes con
mejores resultados en los test después sean los mejores pilotos.

Validez retrospectiva: Es la correlación entre los test, aplicados en cierto


momento, y un criterio que se midió anteriormente, a lo mejor, años antes. Su
finalidad es pronosticar un criterio pasado, para averiguar desde el presente los
factores y las condiciones que en el pasado influyeron en los sujetos, y que
explican algunas de las características actuales de los sujetos.

La validez teórica: Un test tiene validez teórica si mide lo que pretende medir.

La cuantía en que lo mide está señalada por argumentos lógicos y experimentales


que equivalen a su relación con un criterio interno. Existen diversos tipos de
validez teórica, y son los siguientes

Validez de contenido o maestral: Principalmente, hace referencia a test de


rendimiento, conocimientos o competencia profesional. Por ejemplo, un test de
ortografía es válido si su contenido es apropiado. Para comprobar esta validez se
examinará el campo de la ortografía y se constatará que los ítems que componen
el test son una muestra imparcial y suficiente de este campo. Este tipo de validez
no puede concretarse en ningún tipo de correlación. Expresa la relación entre el
test y el criterio interno formado por la materia a que se refiere el test. La relación
será más alta a medida que esté mejor representada toda la materia por el test.
Esta validez se consigue a medida que hay garantías de que se han definido
claramente los diversos aspectos de un cierto campo de conocimientos o
destrezas que el test intenta medir. Criticar la validez maestral de un test implica
mostrar que no representa adecuadamente el campo a que se refiere.

Validez de constructo o conceptual: Consiste en comprobar, según la


metodología de la investigación científica, que el test mide la variable a que se
refiere. Se persigue garantizar científicamente que la variable que el test intenta
medir es una variable aceptable, cuyo concepto presenta suficiente consistencia
lógica dentro del sistema teórico de la psicología y se apoya en suficientes
comprobaciones experimentales que lo verifican. Por ejemplo, antes de ofrecer un
test válido para medir la inteligencia, habrá que aclarar qué es esa inteligencia que
el test intenta medir.

Validez factorial: Se produce cuando se correlacionan distintos test con un rasgo


determinado y después se someten a una relación factorial.

Validez congruente: Si medimos distintas variables con test del mismo tipo, los
test que hacen referencia a una variable han de guardar entre sí correlaciones
más altas que las que tienen con los test de otras variables.

Validez discriminativa: Si medimos distintas variables con test del mismo tipo, y
la misma variable con test de distinto tipo, estos test de distinto tipo que hacen
referencia a la misma variable han de tener entre sí correlaciones más altas que
los test del mismo tipo que hacen referencia a distintas variables.

Validez estructural: Es el grado en que el test mide una elaboración o un rasgo


teórico. Cualquier dato que dé algo de información sobre la naturaleza del rasgo
que estamos considerando y de las condiciones que afectan a su desarrollo y
manifestaciones tiene utilidad para este tipo de validez.

Fiabilidad estadística.

La fiabilidad estadística es necesaria para garantizar la validez y precisión


del análisis estadístico.
Se relaciona con la capacidad de reproducir los resultados tantas veces como sea
necesario. Esto es esencial, ya que genera confianza en el análisis estadístico y
en los resultados obtenidos.

Por ejemplo, supongamos que estás estudiando el efecto de un nuevo


medicamento en la presión arterial en ratones. Quieres hacer una serie de
pruebas y si los resultados son positivos para controlar la presión arterial, es
posible que también quieras probarlo en seres humanos.

Se considera que la fiabilidad estadística es baja si mides determinado nivel de


control en un punto y un valor totalmente diferente cuando repites el experimento
en otro momento.

Sin embargo, si la fiabilidad es baja significa que el experimento que has realizado
es difícil de ser reproducido con resultados similares y entonces la validez del
experimento disminuye. Esto significa que la gente no confiará en la capacidad del
medicamento en base a los resultados estadísticos que has obtenido.

En muchos casos, puedes mejorar la fiabilidad incorporando más pruebas y más


sujetos. En pocas palabras, la fiabilidad es una medida de la consistencia.

La fiabilidad puede ser medida y cuantificada con una cantidad de métodos.

Tomemos el ejemplo anterior, donde se utiliza un medicamento para disminuir la


presión arterial en ratones. Dependiendo de diversas condiciones iníciales, se
obtiene la siguiente tabla con el porcentaje de reducción en el nivel de la presión
arterial en dos pruebas (Advertencia: éste es sólo un ejemplo ilustrativo - no se ha
realizado ninguna prueba).

Tiempo después de la inyección Prueba 1 Prueba 2

1 min 5,86 5,89

2 min 6,35 6,41


3 min 7,12 6,95

4 min 9,18 9,01

5 min 12,36 12,13

6 min 14,26 14,93

7 min 16,96 15,89

Idealmente, las dos pruebas hubieran producido los mismos valores, en cuyo caso
la fiabilidad estadística sería del 100%. Sin embargo, esto no sucede en la práctica
y los resultados se muestran en la siguiente tabla. La línea de puntos indica el
valor ideal donde coinciden los valores de la Prueba 1 y la Prueba 2.

You might also like