La gran mayoría de personas lleva años utilizando tarjetas de fidelización en supermercados y franquicias. En principio no hay más que ventajas, ya que permiten acumular puntos canjeables y beneficiarse de ofertas y promociones. Pero muy pocas personas son conscientes que incluso ese gesto tan cotidiano constituye ya de por sí una forma de minería de datos.
Cuando se habla de data mining parece estar aludiéndose a un fenómeno muy reciente, que sólo se hubiera manifestado relevante con la supercomputación, y el manejo del último trend, el Big Data. Pero en realidad no hacen falta grandes costes para explotar información cruzada, y el data mining lleva años entre nosotros.
La mayoría de la población quizás no se haya parado a pensar que el solo hecho de comprar alimento para lactantes o productos nutracéuticos para fijación del calcio óseo en un supermercado reiteradamente con una tarjeta cliente ya es claramente un input que puede connotar un estadio vital determinado, como la franja de edad. El cruce con otros pequeños hábitos de consumo adicionales arrojará la expectativa de endeudamiento y clase social. Nuestras preferencias de ocio, tendencia política y otras muchas presunciones de una plausibilidad insospechada pueden ser extrapoladas a través de registros absolutamente banales, si se los considerase aisladamente. Pero he aquí la magia de la informática: del registro banal, insignificante e inexpresivo se pasa hacia la elaboración del retrato robot de personalidad, gracias al cruce y segmentación de datos. De hecho la verdadera magia en último término tampoco está en la aparición de la informática como tal, sino en el hecho de que usarla de forma indiscriminada se rige por un esquema de precios marginal.
Hace 50 años la computación de válvulas también estaba preparada para llevar a cabo esos cálculos. Pero en la época en que una capacidad de computación menor que la que hoy en día permite un simple portátil ocupaba naves enteras, y el funcionamiento de los equipos en las universidades hacía disminuir la intensidad del alumbrado público circundante, el coste por transacción para elaborar esa información era inasumible. Hoy en día existe la situación contraria. Existe un acelerado coste marginal para la capacidad de cálculo, y ello, ya modernamente y situados en pleno 2013 en adelante, ha provocado el trend del Big Data. El Big Data vendría a ser para el Data Mining lo que la Web 2.0 representó para la Web inmediatamente anterior. Es decir, sin implicar ningún cambio rupturista ni transgresor de una situación precedente, ni basarse en la irrupción de una tecnología realmente nueva respecto del Web 1.0, la Web 2.0 simplemente fue la constatación de que efectivamente internet había cuajado en la sociedad, nos dimos cuenta que el mundo ya no volvería a ser como antes, que internet había venido para quedarse, y que el estadio evolutivo en que el homo sapiens incorpora de forma insustituible un instrumento para cubrir las necesidades sociales, humanas y económicas más básicas quizás hará que los académicos del futuro tomen este estadio como punto de inflexión para explicar el devenir de la historia. Pues bien, el Big Data es parte de lo mismo.
El fenómeno mediático del Big Data simplemente es constatar que la minería 1.0 que ya se venía llevando a cabo modestamente hasta ahora bajo nombres como Business intelligence, tiene un coste marginal, y los registros de tarjetas de fidelización y tarjetas de crédito puede ser cruzada con capas de geolocalización por GPS del terminal móvil, actividad en redes sociales y navegación por internet, inputs biométricos y ambientales, hábitos de actividad física, y un sinfín de parámetros más. Quizás en vistas de este fenómeno, aquellos que criticaban a la LORTAD del año 92 e incluso a la propia LOPD ya en el año 1999 como poseedoras de un talante exageradamente hipergarantista y desmedido al establecer deberes de notificación de ficheros separadamente por cada entidad societaria, pese a compartir accionariado o integrarse en un único grupo de empresas vean ahora preclaridad y lógica anticipación en el sentido de dichas disposiciones. Es de hecho encomiable que una ley tan temprana como la LORTAD promulgada en 1992 fuera capaz de anticiparse y prever con tanta exactitud visionaria el devenir de los hechos.
Situados a 2013, se comprueba que efectivamente, esos temores eran fundados, el coste de la computación es exponencialmente decreciente, y nuestra libertad informática depende más que nunca de los límites normativos. Asimismo, los instrumentos para obtener datos personales son cada vez más numerosos y exactos. Se habla ya de computación del QUANTIFIED SELF para todas aquellas apps y sensores que permiten registrar ritmos circadianos del individuo, niveles de glucosa en sangre, pulso sanguíneo, grado de oxigenación, niveles atencionales, agudez auditiva y visual, biorritmos. La tecnología llega incluso a la ropa y al tejido inteligente, que no tardarán en hacerse ubicuos.
Así pues, la antigua LORTAD, ya en el año 1992 afirmaba en su famosa exposición de motivos que el objeto de la privacidad es prevenir que las técnicas de computación hacen que trazas que aisladamente consideradas pueden carecer de significación intrínseca, coherentemente enlazadas entre sí, arrojan como precipitado un retrato de la personalidad del individuo que éste tiene derecho a mantener reservado (Sic.)".
De ahí lo desafortunado de las posturas que tan mal entienden el derecho a la privacidad, cuando ciertas personas creen que les es indiferente este derecho, "porque no tienen nada que ocultar". Un pensamiento de este tipo refleja un entendimiento muy pobre del derecho a la privacidad. No se trata de que queramos o no queramos ser exhibicionistas. Se trata de que la automatización de datos produce un efecto irreversible que puede tener efectos discriminatorios sobre nosotros de los que ni siquiera seamos conscientes.