domingo, 26 de enero de 2014

Ciclo de Vida de Kimball





Introducción

Un almacén de datos según Inmon (Inmon 02, Imhoff & Galemmo 03), es una colección de datos integrada, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata de un historial completo de la organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente con herramientas OLAP, de procesamiento analítico en línea).

Por otra parte Kimball (Kimball 98) la define como “una copia de los datos transaccionales estructurados específicamente para consultas y análisis”

Metodologías de Desarrollo

Existen muchas metodologías de diseño y construcción de DW. Cada fabricante de software de inteligencia de negocios busca imponer una metodología con sus productos. Sin embargo, se imponen entre la mayoría dos metodologías, la de Kimball y la de Inmon.

Para comprender la diferencia entre estas dos metodologías, debemos explicar la noción de Data mart. Un Data mart (Kimball et al 98) es un repositorio de información, similar a un DW, pero orientado a un área o departamento específico de la organización (por ejemplo Compras, Ventas, RRHH, etc.), a diferencia del DW que cubre toda la organización.

Desde el punto de vista arquitectónico, la mayor diferencia entre los dos autores es el sentido de la construcción del DW, esto es comenzando por los Data marts o ascendente (Bottom-up, Kimball) o comenzando con todo el DW desde el principio, o descendente (Top-Down, Inmon).

Por otra parte, la metodología de Inmon se basa en conceptos bien conocidos del diseño de basesde datos relacionales (Inmon 02, Imhoff & Galemmo 03); la metodología para la construcción de un sistema de este tipo es la habitual para construir un sistema de información, utilizando las herramientas habituales, al contrario de la de Kimball, que se basa en un modelado dimensional (no normalizado) (Kimball et al 98, 08).


La metodología de Kimball

La metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle) (Kimball et al 98, 08, Mundy & Thornthwaite 06).

Este ciclo de vida del proyecto de DW, está basado en cuatro principios básicos:

1)  Centrarse en el negocio: Hay que concentrarse en la identificación de los requerimientos del negocio y su valor asociado, y usar estos esfuerzos para desarrollar relaciones sólidas con el negocio, agudizando el análisis del mismo y la competencia consultiva de los implementadores.

2)  Construir una infraestructura de información adecuada: Diseñar una base de información única, integrada, fácil de usar, de alto rendimiento donde se reflejará la amplia gama de requerimientos de negocio identificados en la empresa.

3)  Realizar entregas en incrementos significativos: crear el almacén de datos (DW) en incrementos entregables en plazos de 6 a 12 meses. Hay que usar el valor de negocio de cada elemento identificado para determinar el orden de aplicación de los incrementos. En esto la metodología se parece a las metodologías ágiles de construcción de software.

4)  Ofrecer la solución completa: proporcionar todos los elementos necesarios para entregar valor a los usuarios de negocios. Para comenzar, esto significa tener un almacén de datos sólido, bien diseñado, con calidad probada, y accesible. También se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio web y documentación.

La construcción de una solución de DW/BI (Datawarehouse/Business Intelligence) es sumamente compleja, y Kimball nos propone una metodología que nos ayuda a simplificar esa complejidad. Las tareas de esta metodología (ciclo de vida) se muestran en la siguiente figura.


 


De la figura, podemos observar que hay que resaltar el rol central de la tarea de definición de requerimientos.
Los requerimientos del negocio son el soporte inicial de las tareas subsiguientes. También tiene influencia en el plan de proyecto (nótese la doble fecha entre la caja de definición de requerimientos y la de planificación). En segundo lugar podemos ver tres rutas o carriles que se enfocan en tres diferentes áreas:

    I.        Tecnología (Camino Superior). Implica tareas relacionadas con software específico, por ejemplo, Microsoft SQL Analysis Services.
  II.        Datos (Camino del medio).En la misma diseñaremos e implementaremos el modelo dimensional, y desarrollaremos el subsistema de Extracción,  Transformación y Carga (Extract, Transformation, and Load - ETL) para cargar el DW.
III.        Aplicaciones de Inteligencia de Negocios (Camino Inferior).En esta ruta se encuentran tareas en las que diseñamos y desarrollamos las aplicaciones de negocios para los usuarios finales.

Planificación
En este proceso se determina el propósito del proyecto de DW/BI, sus objetivos específicos y el alcance del mismo, los principales riesgos y una aproximación inicial a las necesidades de información.
Esta tarea incluye las siguientes acciones típicas de un plan de proyecto:
·       Definir el alcance (entender los requerimientos del negocio).
·       Identificar las tareas
·       Programar las tareas
·       Planificar el uso de los recursos.
·       Asignar la carga de trabajo a los recursos
·       Elaboración de un documento final que representa un plan del proyecto.

Además se definen las pautas generales de la gestión del proyecto

Gestión del Proyecto
Es una disciplina continua en el proyecto. Su propósito es el de mantener el proyecto encauzado a través de las siguientes actividades:
·       Monitoreo del estado de los procesos y actividades.
·       Rastreo de problemas
·       Desarrollo de un plan de comunicación comprensiva que direccione la empresa y las áreas de TI hacia los objetivos definidos.

Definición de Requerimientos del Negocio

Esta fase busca lograr que el equipo de desarrollo entienda los requerimientos y necesidades de la organización. Establece los cimientos para todas las demás actividades del ciclo de vida. Para ello se entrevista minuciosamente a los usuarios, llevando un detallado registro de lo conversado.

Carril Superior: Tecnología
Arquitectura Técnica
Crea un framework para el Sistema DW/BI. Se enfoca en crear un plan para la arquitectura de la aplicación considerando los requerimientos del negocio, la plataforma tecnológica y las directivas técnicas estratégicas.

Selección de Productos e Implantación
Uso del plan de arquitectura técnica para identificar los componentes necesarios para la realización del proyecto. Luego se procede a seleccionar, instalar y probar los productos.