Intercambio y minería de datos

mano toca la tableta, el intercambio de todo tipo de datos

Indice de contenido

¿Qué es la minería de datos?

Es probable que haya oído sobre Big Data y la minería de datos en las noticias de los últimos tiempos. La minería de datos es la búsqueda de patrones y relaciones en grandes colecciones de datos, llamadas a menudo Big Data. Siempre se han analizado los datos en busca de patrones, pero las computadoras han logrado que la recolección, almacenamiento y análisis de datos sean mucho más eficientes y comunes. A través del proceso de inferencia automática, se utilizan estos patrones para hallar tendencias, llegar a conclusiones y a veces hasta predecir patrones a futuro.

La minería de datos suele utilizarse de modos que son beneficiosos para todos. En la atención médica ayuda a identificar brotes de enfermedades. Por ejemplo, en Ruanda, un investigador de Harvard usó minería de datos para dar un seguimiento a los patrones de movimiento de las personas y compararlos con las estadísticas de salud. Descubrió que los patrones de movimiento cambiaron dos semanas antes de un brote de cólera y, como resultado, logró inferir cuándo habría un brote. Los gobiernos también emplean la minería de datos para optimizar el flujo de tráfico, las empresas la usan para analizar patrones de compra de sus clientes y las agencias de la ley la usan para resolver delitos.

Aunque vincular datos con otros datos aumenta su valor, también genera preocupaciones en cuanto a la privacidad. Las instituciones de atención médica, agencias civiles y otras organizaciones que sólo quieren estudiar los patrones suelen tomar medidas para que la información sea anónima. Como mínimo, generalmente eliminan la información de identificación personal (PII en inglés), como nombres y números del seguro social que se pueden usar para identificar a una persona específica. Sin embargo, incluso las características no distintivas por sí mismas, como la edad o el estado civil, pueden unirse a otra PII para identificar a la persona con esa combinación única de características. En algunos casos las agencias podrían usan métodos de computación más elaborados para ocultar la identidad. Estas estrategias suelen basarse en asignar a una persona a una categoría general que abarca a más gente, como decir que alguien se encuentra en el rango de 20 a 29 años de edad, en lugar de decir que tiene 27 años. Sin embargo, estas técnicas no son infalibles y muchas agencias no las usan en absoluto.

Compartir datos y el modelo de negocios de Internet

Cada vez que hace un negocio o utiliza un servicio, comparte su información. Las empresas extraen esta información para determinar quiénes son sus clientes y qué compran, y a menudo comparten además información sobre los clientes con terceros publicistas o la venden a corredores de datos. Las empresas que ofrecen servicios gratuitos en línea obtienen la mayor parte de sus ganancias vendiendo espacios publicitarios e información de los usuarios.

En general, la ley no restringe a las empresas en cuanto a vender o compartir su información. California y otros estados han implementado algunas restricciones recientemente, pero con frecuencia no queda claro qué ley se aplica a cada caso en particular. La mayoría de las empresas y organizaciones comparten su información por defecto, a menos que usted opta por no ("opt out" en inglés), (y a veces la comparten de todas maneras) por lo que es mejor que asuma que lo hacen. Por lo general, la política de privacidad de una organización informa cómo podría llegar a usar su información, pero no hay garantías de que la cumplan, y las políticas de privacidad están sujetas a cambios sin aviso. Tampoco puede asumir que una empresa no compartirá su información simplemente porque tengan una buena reputación o un buen servicio al cliente.

Sus datos son un bien valioso

Los agregadores de datos, conocidos también como corredores de datos, se especializan en averiguar todo lo posible sobre los consumidores. Hay pocos límites en lo que los corredores de datos pueden hacer con esta esta información, aunque por lo general no lo hacen todo a disposición del público de forma gratuita. Los corredores de datos combinan información de empresas con las que hace negocios, información de seguimiento en línea y archivos públicos de sitios web del gobierno para crear un perfil de consumidor con una ID única, que a su vez pueden vender a una empresa de publicidad. Estos perfiles podrían estar vinculados a su nombre o no, pero incluso los perfiles “anónimos” compilados por corredores de datos probablemente tengan suficiente información como para identificarlo en forma singular.

Cuantos más publicistas sepan sobre usted, mejor podrán predecir su comportamiento futuro. En un ejemplo notorio, Target infirió mediante minería de datos que era probable que las mujeres que compraban lociones sin perfume estuvieran embarazadas y comenzó a enviarles publicidad de productos de bebé. En particular, los corredores de datos y servicios de publicidad en línea han construido un negocio de millones de dólares registrando cada vez que usted compra algo o navega en línea. Usan el seguimiento en línea para obtener información de sitios de medios sociales, sitios de compras y sitios de noticias y entretenimiento, y luego extraen la información en busca de patrones que indiquen sus intereses. Los publicistas pueden exhibir avisos de acuerdo con sus intereses, según lo indica su comportamiento en Internet (y fuera de Internet).

Construya su juego de herramientas