Grow Data

Durante los últimos años la transformación digital ha llevado a las organizaciones a mejorar su análisis empresarial y la minería de datos, para ello se han desarrollados nuevos recursos como lo son la inteligencia artificial (IA) y el Machine Learning, que han permitido ampliar la capacidad, velocidad y automatización de los procesos de Gobierno de datos. 

A estas soluciones se suman los Data Warehouse. Estos concentran y almacenan de forma estructurada toda la información obtenida a partir de las múltiples fuentes de datos en la organización, permitiendo así una rápida integración con las herramientas de minería de datos, análisis y reportes (dashboards). Es esencial para realizar procesos de analítica y toma de decisiones, en especial para los proyectos de Bussines Intelligence (BI) de cualquier empresa y aplican un procesamiento tipo OLAP (OnLine Analytical Processing) lo cual implica que los datos que, aunque no están disponibles en tiempo real, pueden ser analizados de forma rápida y masiva sin interrumpir los procesos del usuario.

Anteriormente, los data warehouse concentraban su funcionalidad en extraer datos de otras fuentes, limpiar, preparar la información, cargar y mantener los datos en una base de datos relacional (relational database), aplicando una implementación on-premises, a menudo en un mainframe central. 

Hoy en día, un Data warehouse puede estar alojado en un dispositivo dedicado o en la nube y agregar capacidades de análisis, junto con herramientas de visualización y presentación de datos. Lo cual enriquece los reportes debido a la diversidad de las fuentes. Así, en lugar de tener información proveniente únicamente de una fuente como por ejemplo lo es el marketing, tendremos información proveniente de producción, marketing, ventas, business partners y muchas fuentes más, haciendo posible la detección de patrones, tendencias e insights que nos ayuden a tomar mejores decisiones de negocio

La diversidad del origen o los formatos de los datos depende de cada organización. Es posible encontrar fuentes de datos de CRMs (Customer Relationship Management), ERPs (Enterprise Resource Planning), archivos en formato CSV, Bases deDatos OLTP, datos provenientes de la web (Web Scrapping), o muchos más, que mediante un proceso de ETL, se llevan a una estructura como el data warehouse para su posterior análisis.

Estas soluciones le otorgan a los expertos de datos una perspectiva más amplia para tomar decisiones (por ejemplo, total deventas a través del tiempo), dado que está diseñado con una finalidad analítica, adquiriendo una velocidad hasta 1.000 veces más rápida que una base de datos convencional.

La estructura principal que se encuentra en un Data Warehouse es aquella cuyos datos mantienen su formato bruto (RAW) junto con sus metadatos (datos que describen otros datos), los cuales están listos para ser explorados y analizados con técnicas de Data Mining.

La siguiente estructura que se manejan son los datos procesados. Los cuales previamente se les han aplicado técnicas de limpieza y están diseñados para diferentes grupos de la organización, como el área de inteligencia de negocios, donde las estructuras de datos tienen una relación de dimensiones y tablas de hechos

Deja un comentario

Abrir chat