LegalToday

Por y para profesionales del Derecho

Portal jurídico de Aranzadi, por y para profesionales del Derecho

19/03/2024. 03:10:22

LegalToday

Por y para profesionales del Derecho

Blog ECIJA 2.0

¿Qué es el big data y por qué debe interesarme si soy abogado?

Abogada de ECIJA

Big Data

1.- Concepto de big data

Si hace tan solo unos años se hablaba de la revolución que ha provocado internet, hoy en día nos encontramos ante un nuevo fenómeno, el big data. El big data es el conjunto de tecnologías que permiten analizar, a través del uso extenso de algoritmos, cantidades masivas de datos provenientes de fuentes dispares, con el objetivo de crear valor.

De este modo, a partir del tratamiento de cantidades masivas de información, algo hasta ahora imposible, podemos comprender cosas antes desconocidas cuando solo analizábamos cantidades pequeñas de información, y permite descubrir o inferir hechos y tendencias ocultas en las bases de datos. Por ejemplo, en descubrir los patrones de comportamiento de tus clientes para crear publicidad dirigida, predecir las ventas del próximo mes de cada categoría de productos, o descubrir relaciones entre los efectos secundarios de un medicamento y la raza de la persona.

Uno de los ejemplos más conocidos de uso de big data se produjo en la cadena de supermercados Walmart, que recogía datos sobre las compras de sus clientes para posteriormente analizarlos y comprender mejor sus hábitos de consumo. Con los datos obtenidos, Walmart comenzó a realizar predicciones sobre las ventas que obtendrían en diversos escenarios, por ejemplo, durante las alarmas por huracán. Sus análisis descubrieron que el producto más vendido antes de un huracán es cerveza, y que las alarmas de huracán disparan las ventas de los dulces «Pop Tarts» siete veces por encima del nivel normal de ventas. Con este nuevo conocimiento, el supermercado puede tomar decisiones mejor fundadas antes de que arrecie un huracán, y gestionar mejor sus inventarios o promociones para incrementar las ventas.

2.- Los retos jurídicos del big data

Así, queda patente que las oportunidades que genera el big data son enormes. Sin embargo, el también supone un desafío para diferentes cuerpos normativos, tales como la protección de datos, la prohibición de la discriminación, la responsabilidad civil, el derecho de la competencia o los derechos de propiedad intelectual, entre otros. En este sentido, uno de los retos más importantes se encuentra en los riesgos que este análisis masivo de datos crea sobre nuestra privacidad y datos personales.

La normativa de protección de datos se encuentra enmarcada en España por la LOPD y su Reglamento de desarrollo, aunque esta normativa ha sido actualizada mediante el Reglamento General de Protección de Datos (RGPD) del Parlamento Europeo y del Consejo, que será de aplicación a partir de mayo de 2018.

La pregunta que surge es ¿se encuentra esta normativa en disposición de hacer frente a los retos que plantea el big data?

Las normas sobre protección de datos se aplican cuando la información hace que las personas físicas sean identificadas o identificables. A sensu contrario, cuando los datos son hechos anónimos utilizando técnicas de anonimización, los datos ya no se consideran de carácter personal y sus derechos están protegidos, de modo que no es necesario aplicar el cuerpo jurídico de la protección de datos. Además de las técnicas de anonimización, las normas prevén llevar a cabo lo que se conoce como disociación de los datos para crear datos "pseudónimos" una categoría de datos que, sin ser anónimos, tienen más garantías para la privacidad que los datos puramente personales.

El big data amenaza la normativa de protección de datos, debido a diversos motivos:

  • La anonimización muestra limitaciones en entornos big data. Tradicionalmente, la anonimización se presentaba como la mejor solución para tratar los datos protegiendo la privacidad de los sujetos. No obstante, en los últimos años se han dado numerosos casos de re-identificación de bases de datos que habían sido anonimizadas.
    • Cada vez se hace más sencillo re-identificar a los sujetos, gracias a que el big data permite cruzar datos procedentes de fuentes muy diversas, que pueden contener datos personales parciales sobre una persona, o incluso identificarnos a través de datos que antes eran considerados no personales, como las puntuaciones que un usuario otorga a una película en portales de internet.

      Esto supone volver al debate de base de qué datos son personales y cuáles no   personales.

  • Los principios de «minimización de datos» y de «limitación de los fines» no se cumplen en la práctica. El principio de minimización de datos se contrapone contra la misma lógica del big data. Los nuevos modelos analíticos se basan precisamente en el estudio de cantidades masivas de datos sin los cuales no podría extraerse el conocimiento que nos permite el big data.
    • Además, el big data se basa precisamente en reutilizar datos que fueron obtenidos para una primera finalidad, otorgándole una nueva finalidad. Es de hecho, en este aspecto donde     reside la mayor fuente de beneficios del big data.

  • La normativa confía demasiado en el consentimiento informado del individuo para recopilar y tratar sus datos de carácter personal. De hecho, esta cuestión no es nueva, aunque se agudiza ya que el papel del consentimiento se refuerza con el nuevo RGPD.
    • Esto puede suponer un problema, dada la experiencia de que la gran mayoría de los individuos no lee las políticas de privacidad antes de prestar su consentimiento; y aquéllos que lo hacen no las comprenden. Así, otorgar el consentimiento en el entorno digital en el que surgen la mayor parte de los datos utilizados en los sistemas big data es, en muchas ocasiones, un ejercicio vacío.

  • El big data aumenta el riesgo relacionado con la toma de decisiones de forma automática. Esto hace que decisiones trascendentales para nuestra vida, tales como calcular nuestro riesgo crediticio para otorgarnos o denegarnos un préstamo, o nuestro perfil sanitario utilizado por una empresa de seguros médicos queden sujetas a algoritmos ejecutados de forma automática.

El problema surge cuando los datos que son analizados por medio de los algoritmos no son precisos o veraces, pero los individuos no son conscientes de que están siendo utilizados para tomar decisiones que les afectan.

La solución a estas limitaciones no radica, como algunos se han dado a defender, en limitar el uso de las tecnologías y ralentizar la innovación, sino en hacer un uso ético y legal del mismo. Utilizando un sencillo símil no se trata de prohibir la pólvora, sino de prohibir sus usos nocivos.

Valora este contenido.

Puntuación:

Sé el primero en puntuar este contenido.