Las empresas siempre han manejado gran cantidad de datos: de clientes, de transacciones, de sus empleados, de la competencia, y muchos otros; pero con la creciente digitalización de los procesos y sistemas, esas cantidades han desbordado hasta crear verdaderas montañas de datos; adicionalmente los datos llegan a gran velocidad, y a veces hay que manejarlos en tiempo real. Es lo que se ha dado en llamar big data. No es de extrañar que se requiera de herramientas nuevas, adecuadas para el manejo y aprovechamiento de los datos masivos. Es precisamente ese manejo el propósito de la llamada inteligencia de negocios (BI).

La Inteligencia de Negocios, de una u otra forma, ha existido aun antes de que el consultor Howard Dresner, hacia los finales de los 80s, acuñara el acrónimo “BI” (Business Intelligence). Son las herramientas computacionales las que han evolucionado, simplificando y popularizando la aplicación de técnicas analíticas y de visualización para poner frente a nosotros lo que yace en la montaña de datos. Las ya vetustas hojas Excel son herramientas de BI (claro que un vendedor de software de BI se va a escandalizar con esa frase, pero no olvidemos que son vendedores). Es que las tendencias nunca son tan drásticamente novedosas como a menudo se las pretende presentar.

En todos estos años de creciente digitalización se ha venido desarrollando una serie de conceptos y tecnologías para el manejo de los datos. BI lo que ha hecho es aprovechar a todas ellas. Demos un breve recorrido.

Por supuesto lo primero es reunir los datos, captarlos, e inmediatamente guardarlos en lugar seguro y de forma integrada y permanente (aunque modificable), eso es data warehousing. Tradicionalmente ese warehouse reside en un mainframe; ahora la tendencia es migrar a la nube. La tecnología predominante para implementar el almacén de datos es la base de datos relacional (tablas de información), pero pensemos más bien en el data warehouse como una abstracción: una representación de datos depurados, confiables, que un ejecutivo puede usar para basar sus decisiones. Las nuevas exigencias y posibilidades técnicas han forzado a re-inventar el almacén de datos para hacer frente a la abundancia de datos no estructurados los cuales no encajan fácilmente en una base de datos tradicional.

La tecnología para sacar el máximo de información de las montañas de datos es lo que llamamos minería de datos. Desde finales de los 60s se trata de hurgar en los datos, buscando posibles relaciones, correlaciones, patrones que se repiten, posibles cadenas de causa-efecto, patrones que permitan predicciones.  La minería de datos es extensivamente usada en tiendas como supermercados para decidir cuándo poner ciertos productos en oferta o a precio full. Igualmente se usa para extraer información de los patrones que pueden seguir las acciones en la bolsa de valores.

Los datos “crudos”, tal como los captamos y almacenamos, no siempre están en la mejor forma para análisis posteriores; es común que requieran de pre-procesamiento. El más obvio es la “limpieza” de datos: eliminar valores fuera de rango, eliminar combinaciones imposibles, valores faltantes, valores repetidos. También es común requerir normalización (para minimizar redundancia y dependencias), uso de sistemas de unidades consistentes, filtrado, transformación de formatos, eliminación de ruido, muestreo (extraer un subconjunto o muestra representativa para no trabajar con toda la base de datos) y otros. Para integrar datos provenientes de diferentes fuentes se requiere un proceso de extracción, transformación y carga, referido como ETL. Ello es parte del pre-procesamiento.

Con la visualización se trata de hacer todo lo que se pueda para que la gente entienda la información extraída de los datos. Tendencias, correlaciones, patrones, cadenas causa-efecto, todo eso puede reconocerse con facilidad una vez que es puesto gráficamente. Hoy día disponemos de recursos que van más allá de los gráficos, histogramas, barras, tortas y demás diagramas comunes en las hojas de cálculo. Los antiguos nomogramas y ábacos han sido reemplazados por dashboards interactivos, que permiten incluso “perforar” en los datos, para hacer consultas y análisis sobre la marcha. Los dashboards pueden desplegarse en diferentes plataformas: PCs, dispositivos móviles, desde la web, desde la nube. Con los nuevos e ingeniosos recursos infográficos aún las relaciones más complejas afloran de la montaña de datos y son captadas de un vistazo. En realidad, la potencia pictórica, no debe sorprendernos, a fin de cuentas ese recurso se ha usado desde la prehistoria, y quizá ha precedido todas las otras formas de lenguaje.

El software actual para Inteligencia de Negocios se apoya en todas las técnicas mencionadas y ofrece una interfaz gráfica muy amigable para que el usuario escoja las variables y dimensiones que quiere analizar y el tipo de visualización deseado. Una tendencia que vale la pena destacar es la simplificación que se logra al automatizar casi todos los procesos subyacentes, dejando al usuario final sólo la necesaria libertad de escoger el análisis deseado, y aún allí el software puede ofrecer recomendaciones, como por ejemplo el tipo de gráfico que se adaptará mejor a la situación planteada.

La integración de las fuentes de datos y la facilidad y flexibilidad de su manejo ha llevado a lo que se denomina auto-servicio de BI, donde prácticamente ya no se necesita el auxilio técnico del departamento de IT para crear los reportes y analíticas más adecuados. Cualquier departamento, a partir de las fuentes de datos integradas por el software de BI, puede crear sus propias combinaciones y representaciones, descubriendo muchas veces sorprendentes nuevas perspectivas para comprender lo que está pasando en la empresa. Esta accesibilidad a una fuente integrada de datos Incrementa la comunicación interdepartamental.

Cambiar un reporte, agregar una nueva dimensión, no requiere reprogramación alguna, se logra simplemente seleccionando elementos y arrastrándolos en las hojas de trabajo; ya no se depende de reportes estándar que debían solicitarse a los diferentes departamentos (con su respectivo tiempo de espera), se habla ahora de reportes ad hoc, cuya estructura se define en el momento, y cuya preparación ocurre en tiempo real.

Más allá del análisis descriptivo, las herramientas de minería de datos, inmersas en el software de BI, permiten análisis prospectivo (indicando posibilidades de que una tendencia o patrón observado se mantenga o cambie en el futuro) y prescriptivo (recomendando acciones a seguir, apoyando la toma de decisiones). Características adicionales son los sistemas de alertas y notificaciones en tiempo real (en el momento en que ocurran cambios significativos en los datos que llegan al sistema).

Este alto grado de automatización permite que la compañía dedique más tiempo en  atender y trabajar con los clientes, y menos en preocuparse de la estructuración de los datos y la preparación de reportes.

En definitiva la tecnología de BI transforma los datos almacenados, provenientes de diferentes fuentes y tipos de archivos, en información orientada a propósitos específicos, y esta información en conocimiento que jugará un gran papel en los planes y estrategias de la empresa. Es más, dada la agilidad e inmediatez para producir reportes, cruzar informaciones, agrupar información diversa en un solo cuadro, analizar y comparar diferentes escenarios al mismo tiempo, nos asiste también en la toma de decisiones tácticas o de corto plazo y aun de tipo operativo, y nos brinda mayor capacidad de respuesta ante imprevistos.

El conocimiento adquirido a través de los sistemas de BI puede retroalimentarse. De hecho estos software suelen incluir algoritmos de machine learning (transformación del comportamiento de un programa en base a “experiencia” o corridas anteriores; es un aprendizaje a través de ejemplos, un método inductivo de adquisición de conocimiento).

Los sistemas de información tradicionales se dirigían exclusivamente a las áreas económica y financiera, con el advenimiento de BI se cubre todas las áreas de la empresa: comercial, marketing, RRHH, logística, calidad, etc. La empresa como un todo pasa a ser un ente muy dinámico, acumulando conocimiento que nos prepara para el ambiente cambiante y altamente competitivo de nuestra época.

Tamizar los datos, procesarlos hasta convertirlos de masa amorfa en información útil para la toma de decisiones, es ahora una necesidad, y puede ser la mayor ventaja competitiva de una empresa. Hoy día hay suficiente conciencia sobre la necesidad de manejar adecuadamente los datos como para posicionar la BI como prioridad ante los gerentes y todas las personas involucradas en la toma de decisiones para el pleno desarrollo de la empresa. Hemos hablado de “business”, pero las técnicas de BI se aplican a cualquier situación donde se maneje big data, no necesariamente en negocios.

La palabra “inteligencia” se ha usado con insistencia en muchos  desarrollos tecnológicos, sacándola del lugar en donde realmente pertenece que es en la biología. Pero no nos engañemos, no hay magia. Podemos usar la ciencia y la tecnología para averiguar cuáles son las respuestas; pero sigue siendo un arte averiguar cuáles son las preguntas relevantes. Ese arte está reservado a la verdadera inteligencia: la humana.