Las más grandes empresas del mundo han puesto sus ojos y manos en lo que llaman Big Data (BD) y Business Analytics (BA). En palabras simples Big Data es la manera de lidiar con los inmensos volúmenes de información variada que se producen a velocidad vertiginosa alrededor de actividades realizadas sobre internet. Como los lenguajes de computación no podían procesar correctamente esta situación, Google debió inventar nueva tecnología que luego otros dedujeron parcialmente y convirtieron en herramientas abiertas para el BD. Basta saber que Facebook tiene 1.500 millones de usuarios que suben en línea nuevas fotos y mensajes que se almacenan por años, para comprender que los equipos y el software que maneja esa red social nada tienen que ver con los de una empresa que no maneje volúmenes masivos en línea. Desde pasajes hasta zapatos se compran ahora en plataformas tecnológicas de BD.

Business Analytics (BA), en cambio, es el arte de descubrir y utilizar patrones y relaciones escondidas en los datos de una empresa. Por ejemplo: que hay segmentos en que los que compran el ítem A compran también el B con una probabilidad 50% mayor; o que si las respuestas a 5 preguntas caen en ciertos rangos, entonces el cliente será probablemente un buen pagador. O que si tal combinación de eventos sucede con un cliente por suscripción, entonces la probabilidad de que el próximo mes abandone es 35% más alta, etcétera. Jerárquicamente el primer nivel de la automatización es la data, el segundo es la información y el tercero es el conocimiento, que es el objeto del BA. Las funcionalidades de Facebook, Amazon o Linked In evolucionan constantemente gracias a equipos de “Data Scientists” que monitorean la actividad, descubren patrones y los usan en beneficio del producto y la empresa. La revista Harvard Business Review se refirió al Data Scientist como “The sexiest job of the century”. Mi celular entiende la manera como escribo mis mensajes y me ayuda a escribir nuevos textos usando patrones anteriores que los detecta de una: a la segunda vez que escribí “il”, ya me presentó todo mi apellido. Hay cámaras que solo toman la foto cuando están sonriendo, y así, en muchas otras cosas, la detección de patrones se irá perfeccionando en forma sorprendente, gracias a técnicas del BA tales como machine learning.

Pero nada de esto se hace sin Data, materia prima del BA. Por eso, el alcalde de Nueva York ha optado por hacer públicas 760 Bases de Datos de la ciudad con todo tipo de significado, y sobre ese mar abierto de datos se construyen ya muchas aplicaciones y se descubren significados de utilidad social.

En Ecuador, la corrupción disminuiría con una política total de Open Data en el sector público. Por ejemplo, publicando todo cheque que se gire, o los nombres y cédulas de los burócratas junto con los de sus parientes con los que la ley prohíbe contrataciones. Hasta hace poco laboraba en el Gobierno un burócrata que viajaba a Europa en primera clase y tenía medio árbol genealógico en el sector público. Con una base de datos abierta se lo habría podido detectar rápidamente. Las universidades podrían aportar análisis y soluciones actuariales gratuitas si tuvieran acceso a la base de afiliados al IESS. La Data pública debe ser pública, por transparencia y por buscar la inteligencia social. (O)