Professional Documents
Culture Documents
CUKIER 2013: 37). Pero existan ciertos lmites, como una copia
fotogrfica analgica. A cierta distancia, se ve muy bien, pero cuando
se mira ms de cerca, se vuelve borrosa (MAYER-SCHNBERGE;
CUKIER 2013: 39). Y es que las preguntas que dan forma a un
muestreo son sus propios lmites. Big Data puede relegar esto al
pasado, hacer que la muestra sea el todo mismo. Una probabilidad
absoluta avalada por el peso de trabajar con todos los datos
posibles que puede dar respuestas de cierto valor.
En 2006, Google se lanz a traducir [] En lugar de pginas de texto
bien traducidas en dos idiomas, utiliz un conjunto de datos ms
basto, pero tambin mucho ms confuso: todo el contenido global de
internet (MAYER-SCHNBERGE; CUKIER 2013: 55). La idea era usar la
probabilidad para extraer correlaciones de esta enorme base de datos
y obtener un traductor. Y el resultado fue revelador: ni mejores
algoritmos, ni el aumento de la calidad de la muestra, llegan a los
buenos resultados obtenidos de aumentar el campo ingentemente.
As, cuando se trabajan datos masivos, los errores o inexactitudes de
la muestra se diluyen parcialmente. Ms que aspirar a erradicar todo
atisbo de inexactitud a un coste cada vez ms elevado, calculamos
con la confusin en mente (MAYER-SCHNBERGE; CUKIER 2013: 58).
En medicina, se pueden comparar todas las secuencias genmicas
disponibles con el historial completo de las mismas personas. Las
redes sociales pueden mostrar qu tipologa de persona es ms
favorable a una marca. Una empresa de coches puede recoger todos
los datos sobre un modelo y descubrir los quilmetros a los que
acostumbra a fallar una pieza defectuosa. O un ayuntamiento podra
relacionar el uso del metro con el tiempo, la poca del ao o las
noticias del da anterior. Siempre desde la bsqueda de correlaciones,
no partiendo de una hiptesis. Como avanzamos al inicio: algunas
correlaciones pueden ser tan complejas que debemos obviar su
razn. Y es que en el mundo de la probabilidad, ni hace falta una
pregunta concreta, ni tiene porque importar la razn de la respuesta.
Un choque directo con nuestra concepcin cientfica del universo.
Slo falta hablar de uno de los aspectos subyacentes ms
importantes que la estadstica permite trabajar: los futuribles. Las
encuestas a pie de urna tienen un crdito relativo. Pero la oportunidad
de trabajar con muestras tan contundentes, permite aplicar la
probabilidad sobre eventos futuros. Como hacen los hombres del
tiempo desde hace aos. Pero en cualquier rea. Y debemos estar
alerta, porqu es posible que a ms exactitud, ms credibilidad
obtenga un resultado estadstico.