Introducción
Un
almacén de datos según Inmon (Inmon 02, Imhoff & Galemmo 03), es una
colección de datos integrada, no volátil y variable en el tiempo, que ayuda a
la toma de decisiones en la entidad en la que se utiliza. Se trata de un historial
completo de la organización, más allá de la información transaccional y
operacional, almacenado en una base de datos diseñada para favorecer el
análisis y la divulgación eficiente de datos (especialmente con herramientas OLAP,
de procesamiento analítico en línea).
Por otra parte
Kimball (Kimball 98) la define como “una copia de los datos transaccionales estructurados
específicamente para consultas y análisis”
Metodologías de Desarrollo
Existen
muchas metodologías de diseño y construcción de DW. Cada fabricante de software
de inteligencia de negocios busca imponer una metodología con sus productos. Sin
embargo, se imponen entre la mayoría dos metodologías, la de Kimball y la de
Inmon.
Para comprender
la diferencia entre estas dos metodologías, debemos explicar la noción de Data
mart. Un Data mart (Kimball et al 98) es un repositorio de información, similar
a un DW, pero orientado a un área o departamento específico de la organización
(por ejemplo Compras, Ventas, RRHH, etc.), a diferencia del DW que cubre toda
la organización.
Desde el
punto de vista arquitectónico, la mayor diferencia entre los dos autores es el sentido
de la construcción del DW, esto es comenzando por los Data marts o ascendente
(Bottom-up, Kimball) o comenzando con todo el DW desde el principio, o
descendente (Top-Down, Inmon).
Por otra
parte, la metodología de Inmon se basa en conceptos bien conocidos del diseño
de basesde datos relacionales (Inmon 02, Imhoff & Galemmo 03); la metodología
para la construcción de un sistema de este tipo es la habitual para construir
un sistema de información, utilizando las herramientas habituales, al contrario
de la de Kimball, que se basa en un modelado dimensional (no normalizado) (Kimball
et al 98, 08).
La metodología de Kimball
La
metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio
(Business Dimensional Lifecycle) (Kimball et al 98, 08, Mundy &
Thornthwaite 06).
Este
ciclo de vida del proyecto de DW, está basado en cuatro principios básicos:
1)
Centrarse en el negocio: Hay que concentrarse en la
identificación de los requerimientos del negocio y su valor asociado, y usar estos
esfuerzos para desarrollar relaciones sólidas con el negocio, agudizando el
análisis del mismo y la competencia consultiva de los implementadores.
2)
Construir una infraestructura de información
adecuada: Diseñar una
base de información única, integrada, fácil de usar, de alto rendimiento donde
se reflejará la amplia gama de requerimientos de negocio identificados en la
empresa.
3)
Realizar entregas en incrementos significativos: crear el almacén de datos (DW)
en incrementos entregables en plazos de 6 a 12 meses. Hay que usar el valor de negocio
de cada elemento identificado para determinar el orden de aplicación de los incrementos.
En esto la metodología se parece a las metodologías ágiles de construcción de
software.
4) Ofrecer la solución completa: proporcionar todos los elementos necesarios para
entregar valor a los usuarios de negocios. Para comenzar, esto significa tener
un almacén de datos sólido, bien diseñado, con calidad probada, y accesible. También
se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes
y análisis avanzado, capacitación, soporte, sitio web y documentación.
La construcción
de una solución de DW/BI (Datawarehouse/Business Intelligence) es sumamente
compleja, y Kimball nos propone una metodología que nos ayuda a simplificar esa
complejidad. Las tareas de esta metodología (ciclo de vida) se muestran en la siguiente
figura.
De la figura, podemos
observar que hay que resaltar el rol central de la tarea de definición de requerimientos.
Los requerimientos del
negocio son el soporte inicial de las tareas subsiguientes. También tiene
influencia en el plan de proyecto (nótese la doble fecha entre la caja de
definición de requerimientos y la de planificación). En segundo lugar podemos
ver tres rutas o carriles que se enfocan en tres diferentes áreas:
I.
Tecnología
(Camino Superior). Implica tareas relacionadas con software específico, por
ejemplo, Microsoft SQL Analysis Services.
II.
Datos
(Camino del medio).En la misma diseñaremos e implementaremos el modelo dimensional,
y desarrollaremos el subsistema de Extracción,
Transformación y Carga (Extract, Transformation, and Load - ETL) para
cargar el DW.
III.
Aplicaciones
de Inteligencia de Negocios (Camino Inferior).En esta ruta se
encuentran tareas en las que diseñamos y desarrollamos las aplicaciones de
negocios para los usuarios finales.
Planificación
En este proceso se
determina el propósito del proyecto de DW/BI, sus objetivos específicos y el
alcance del mismo, los principales riesgos y una aproximación inicial a las
necesidades de información.
Esta tarea incluye las
siguientes acciones típicas de un plan de proyecto:
·
Definir el alcance (entender los requerimientos del
negocio).
·
Identificar las tareas
·
Programar las tareas
·
Planificar el uso de los recursos.
·
Asignar la carga de trabajo a los recursos
·
Elaboración de un documento final que representa un
plan del proyecto.
Además se definen las
pautas generales de la gestión del proyecto
Gestión del Proyecto
Es una disciplina continua
en el proyecto. Su propósito es el de mantener el proyecto encauzado a través
de las siguientes actividades:
·
Monitoreo del estado de los procesos y actividades.
·
Rastreo de problemas
·
Desarrollo de un plan de comunicación comprensiva
que direccione la empresa y las áreas de TI hacia los objetivos definidos.
Definición de Requerimientos del Negocio
Esta fase busca lograr
que el equipo de desarrollo entienda los requerimientos y necesidades de la
organización. Establece los cimientos para todas las demás actividades del
ciclo de vida. Para ello se entrevista minuciosamente a los usuarios, llevando
un detallado registro de lo conversado.
Carril Superior: Tecnología
Arquitectura Técnica
Crea un framework para el
Sistema DW/BI. Se enfoca en crear un plan para la arquitectura de la aplicación
considerando los requerimientos del negocio, la plataforma tecnológica y las
directivas técnicas estratégicas.
Selección de Productos e Implantación
Uso del plan de
arquitectura técnica para identificar los componentes necesarios para la
realización del proyecto. Luego se procede a seleccionar, instalar y probar los
productos.