miércoles, 8 de septiembre de 2010

La importancia de la Agregación de Datos en el Reporting (Introducción)

De todos es sabido, que una de las finalidades cuando se define un DataWarehouse es llegar a crear un Modelo Multidimensional, de fácil consulta, que de respuestas a las incógnitas del proceso de negocio, partiendo de BBDD Relacionales en las que habrá que simular este comportamiento con los ya conocidos conceptos de cubos multidimensionales, tablas de Hechos, tablas de Detalle, Dimensiones, Indicadores…etc.

En la mayoría de las ocasiones los procesos de ETLs que nutren el DataWarehose se encargan eficientemente de realizar las agregaciones de datos numéricos (indicadores) a los niveles necesarios (dimensiones) que serán estudiados. El problema radica cuando trasladamos esto a la parte de generación de Reporting.

Es importante recordar que cuando utilicemos herramientas de generación de informes que dependan de un modelo multidimensional, los objetos de tipo indicador habrá que crearlos definiendo que función de agregación proyectaran sobre el informe de tal manera que los valores devueltos en función de las dimensiones asociadas en la generación de la consulta infieran en una cláusula GROUP BY.

De esta forma liberaremos de trabajo a la BBDD para no leerse filas innecesarias, agruparemos la información para poder realizar drill-down drill-up (navegación entre dimensiones) podremos usar correctamente las cross-table y nos aseguraremos de no realizar falsas agrupaciones en el reporting.

Una reflexión : hay gente que piensa que si ya se han usado funciones de agregación a la hora de cargar el DW, no son necesarias a la hora de generar las SQLs para la consulta de la información. Los datos ya están agregados…..

Próximamente hablaremos de conceptos como Modelo Multidimensional, ETL, Tablas de Hechos y Detalle….

Saludos donde quiera que estéis.

miércoles, 25 de agosto de 2010

" ¿Es Data Warehouse todo lo reluce?..."

Hola a todos,
esta es la primera Editorial de inauguración de este Blog se llama "¿Es Data Warehouse todo lo reluce?".

"Desde hace ya unos diez años que me dedico a este mundo, como Técnico...todavía no me considero Consultor, me falta mucho que aprender y compartir pero estamos en ello. Durante este tiempo he pasado por muchas empresas, he realizo bastantes diseños "multidimensionales" y mucho reporting y en casi todas hay una máxima, el enfoque de desarrollo que se le da al Data WareHouse dista algo de su esencia, es decir modelos multidimensionales realmente eficaces y que determinen espacios dimensionales dinamicos que se relacionen entre si combinandose con las unidades de medida sin "falsas restricciones".
Podemos tener las mejores herramientas de Análisis y Reporting, si no tenemos un buen Modelo Multidimensional, no tendremos nada....bueno nada no, tendremos muchos quebraderos de cabeza.
Realizar un buen Modelo Multidimensional que se extienda como una tela de araña es la base....parece que se nos ha olvidado o quizás no lo sabíamos.
Todo lo que reluce no es un Data Warehouse."