3. Almacenamiento de datos
Datawarehouses
Un datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información proveniente de distintas fuentes, para luego procesarla permitiendo su análisis desde múltiples perspectivas y métricas.
Las principales aportaciones de nuestros datawarehouses son:
- Proporcionar una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
- Facilitar la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
- Proporcionar la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
- Simplificar dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
- Suponen una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.
Datamarts
Un datamart se puede entender cómo un subconjunto de un datawarehouse, esto es, una base de datos departamental especializada en el almacenamiento de datos de un área de negocio específica. Se caracteriza por disponer de una estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicha área de negocio. Normalmente un datamart se alimenta a partir de los datos de un datawarehouse.
Existen 2 tipos de datamarts: OLAP y OLTP.
OLTP - On-Line Transactional Processing
Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones que pueden involucrar operaciones de inserción, modificación y borrado de datos. El proceso transaccional es típico de las bases de datos operacionales.
El acceso a los datos está optimizado para tareas frecuentes de lectura y escritura,como por ejemplo la enorme cantidad de transacciones que tienen que soportar diariamente las BD de bancos o hipermercados.
Los datos se estructuran según el nivel aplicación (programa de gestión a medida, ERP o CRM implantado, sistema de información departamental...)
El historial de datos suele limitarse a los datos actuales o recientes.
OLAP - On-Line Analytical Processing
Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil cómo por ejemplo: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc.
El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones.
Los datos se estructuran según las áreas de negocio, y los formatos de los datos están integrados de manera uniforme en toda la organización.
El historial de datos es a largo plazo, normalmente de dos a cinco años.
Las principales aportaciones de nuestros datamarts son:
- Poco volumen de datos.
- Consultas rápidas y sencillas.
- Validación directa de la información.
- Facilidad para la historización de los datos.