You are on page 1of 3

¿Cuál es la información necesaria para identificar

“personalmente” a un individuo?
El Sr. X vive en el codigo postal 34270 y nacio el 31 de Julio de 1945.
Estos datos fueron incluídos en un registro medico “anonimo” que se hizo público. Pareciera que el Sr.
X es bastante anonimo ¿verdad?.
No si fueras Latanya Sweeney, profesora de ciencias computacionales en la universidad de Carnegie
Mellon, quien en 1997 demostro que esta información era suficiente para encontrar la identidad del Sr.
X – William Weld, el gobernador de Massachussetts a mediados de 1990.
Genero, Codigo postal y año de nacimiento daban la ilusión de anonimato, pero la Profesora Sweeney
fue capaz de identificar al gobernador por dos razones. Primero, cada uno de estos detalles de un
individuo (o cualquier otro tipo de detalle que pareciera no ser relevante) independientemente estrecha
la población, tanto que en combinación (genero, codigo postal y cumpleaños) era único para el 87% de
la población estadounidense. Si usted vive en Estados Unidos, hay un 87% de probabilidad que usted
no comparta estos tres atributos con ningun otro residente estadounidense. Segundo, puede haber
fuentes de datos particulares (Sweeney uso el registro electoral de Massachusetts) que permite a las
personas hacer busquedas exhaustivas para encontrar más información de las personas a partir de lo
que ya sabe – incluyendo identificadores tradicionales como son nombre y dirección. En un sentido
muy concreto, información “anonima” o “meramente demografica” sobre las personas no puede existir.
(Y websites que solicitan información “anonima” y trivial a sus usuarios sobre ellos mismos, pudiera
usarla para hacer un perfil unica de este, o incluso buscar a ese individuo en particular en otras bases de
datos.)
Muchas leyes, reglas y debates contemporarias sobre la privacidad se centran en la noción
“información identificable personalmente” (PII por sus siglas en inglés). El concepto del PII es usado
en varios regímenes legales y muchas políticas de privacidad en organizaciónes; generalmente
información que identifica a una persona en particular es considerada mucho más sensitiva que
información que no. Por ejemplo,
• Las leyes federales de privacidad usan “Información identificable personalmente” (sobre un
suscriptor) como la base de la categoría de información protegida llamada “Customer
Propietary Network Information”.
• Regulaciónes de salubridad sobre privacidad usan el PII como la base del “Protected Health
Information”
• Leyes federales de privacidad financierar , la directiva Europea de la protección de la
información y leyes estatales, entre otros, todos usan conceptos similares;
Y en cada caso, los datos “personalmente identificables”, o “individualmente identificables” pueden
recibir protecciones dramaticamente altas bajo estas leyes.
Pero la investigación por la Prof. Sweeney y otros expertos han demostrado que sorprendentemente
muchas caracterízticas, incluyendo aquellas que aparentan ser inocuas, neutrales, o “comunes”, pueden
potencialmente identificar a un individuo. Leyes de privacidad, principalmente basadas en la noción de
identificabilidad, ha sido en gran medida no actualizada con la realidad tecnica.
Una publicación cientifíca reciente por Paul Ohm, “Broken Promises of Privacy: Responding to the
Surprising Failure of Anonymization”, provee de una profunda introducción y perspectiva al tema. La
publicación del Profesor Ohm es una lectura importante a cualquiera interesado en saber más sobre
privacidad personal, debido a que muestra como los resultados de desanonimización alcanzados por
investigadores como Latanya Sweeney y Arvind Narayan seriamente afectan los supuestos de la
privacidad actuales. En particular, la distinción binaria entre “Información Personalmente
Identificable” e “Información NO Personalmente identificable”, cada vez es más difícil de sostener.
Nuestra percepción de que cierta información es anónima, es frecuentemen equivocada. Dadas las
correctas circunstancias y analísis, casi cualquier información puede usarse para identificar a un
individuo; información sobre personas es más identificable de lo que se asumía era, y a largo plazo, el
solo hecho de clasificar ciertos datos como “PII” y “NO PII” es cuestionable.
Inferencia estadística y un uso inteligente de bases de datos ha resultado en ejemplos impresionantes de
desanonimización de datos supuestamente anonimos, el tipo de datos que las organizaciones han
considerado tradicionalmente como no PII. Ademas de combinaciónes de datos demograficos, algunas
de las cosas que pueden hacerte unicamente identificable incluye tus terminos de busqueda en internet;
tus habitos de compra; tus preferencias y opiniones sobre musica, libros, peliculas; y hasta la estructura
social de tus redes sociales – en un sentido puramente abstracto, aunque a este se le trucanran las
identidades de tus amigos y contactos. Desanonimización es efectiva, y es dramaticamente más sencilla
de lo que sugiere nuestra intuición. Dadas todas las variables que nos pueden distinguir, somos mucho
más diferentes unos de otros de lo que se podría expectar, y hay más fuentes de datos que podrían
reducir a quien exactamente refiere cada registro.
Muchas de estas publicaciones fueron pensadas como una prueba de concepto: mustraron que las
personas podían ser identificados por estos tipos da dtos, no que todos podrían ser identificados. El
registro medico de todos no fue tan facil de reducir como el del gobernador Weld. Y la investigación
de Narayan y Shmatikov solo identifico efectivamente a dos usuarios de Netflix a partir de sus
calificaciones a las peliculas – No todos los usuarios que publicaros sus calificaciones de peliculas. Sin
embargo, muchos de estos estudios deliberadamente no usaron todos los datos disponibles sobre los
individuos, debido a que su objetivo es mostrar la efectividad de tecnicas matematicas, no violar la
privacidad de los individuos. Ataques en el mundo real usaróan mucha más información disponible
simultaneamente para encontrar las identidades de los individuos. Como Bruce Schneier ha observado,
dichos ataques solo mejoran con el tiempo; no se hacen peores.
Ohm asegura que es mucho más apropiado pensar en la identificabilidad como un continuo. La noción
de “anonimo” o datos “sanados” es entonces problematica; los investigadores continuamente se
comparten, o incluso publican sets de datos que asignan numeros a los individuos. Incluso ya ha habido
problemas con esta practica, por ejemplo cuando AOL público registros de busqueda “Anonimos” que
resulto se usaron para identificar a algunos individuos a partir exclusivamente del contenido de sus
busquedas.
Esperamos que “Broken Promises of Privacy” motive a las personas que trabajan con datos personales
a que piensen más críticamente sobre la retención y las practicas de compartir dicha información y que
tan efectivo son las técnicas de anonimización o pseudoanonimización que estos estan usando. Tambien
esperamos que este encuentre una audiencia mucho más amplia y se comience una discusión más
profunda entre investigadores, tecnológistas y abogados sobre que debería significar “Protección de la
privacidad” en esta era de desanonimización.
http://www.eff.org/deeplinks/2009/09/what-information-personally-identifiable

Seguimiento de la conducta en Linea


¿Quíen sabe que es lo que estás haciendo mientras navegas por la internet?
Nuevas tecnologías han creado muchas maneras inesperadas para las corporaciones para seguir tu
actividad en línea sin tu conocimiento. Muchas redes de publicidad son capaces de secretamente
monitorearte a través de multiples sitios de internet y construir detallados perfiles sobre tu conducta e
intereses.
Las nuevas amenazas incluyen “super-cookies” como los “Local Shared Objects” de Adobe y “User
Data Persistence” de Microsoft. Estos incluyen sistemas para compartir datos semi-legales entre los
proveedores de internet y centros de datos como Phorm y NebuAd. E incluyen paginas de navegación
social que permiten a anunciantes accedes a mucha información de conducta del usuario.
EFF esta trabajando con jueces y legisladores para cerrar estos “loopholes” que permiten ubicar
inescrupulosamente a los usuarios.
https://www.eff.org/issues/online-behavioral-tracking

Los Navegadores pueden dejar una marca única en la web


Por jeremy Kirk, PC World

La EFF ha creado una herramienta en lina que detalla la riqueza de la información que un navegador
revela, y que ha generado recientemente preocupaciones de seguridad entre los usuarios.

La herramienta Panopticlick toma solo unos segundos para revelar toda la información que el
navegador revela cuándo visita un sitio web, como son el sistema operativo, las versiones de los plug-
ins, fuentes en el sistema, tamaño del monitor e incluso colores y resolución de este.

https://www.eff.org/press/mentions/2010/1/29-0

You might also like