Ticout Outsourcing Center

Explotemos la Tecnología

Ticout Outsourcing Center - Explotemos la Tecnología

Una visión general de los Datawarehouse

1. Introducción

Podríamos llegar a decir que la función de un Datawarehouse, es hacer más felices a los usuarios de negocio al darles las respuestas a las preguntas que ellos tienen. Aunque los problemas pueden empezar cuando, el usuario tiene preguntas como Puedo tener algunos datos sobre usuarios que satisfagan estas condiciones? Que quiere decir algunos datos? Que tipo de respuesta se espera obtener del sistema?

 

2. Porque no hacer las consultas en un sistema transaccional

Las principales razones son:

  • Rendimiento consultas de análisis en estos sistemas es muy pobre.
  • Consultas de análisis pueden ralentizar todo el sistema de producción.
  • Se aumenta las posibilidades de fallida.
  • Los datos suelen estar fragmentados.
  • Pueden aparecer violaciones de seguridad.

 

3. Del Sistema Transaccional al Decisional

Visto el punto anterior, esta claro que los sistemas transaccionales no son los más óptimos para consultas de análisis, se necesita bases de datos especiales. La carga de estas BD se tiene que realizar con los datos que realmente se quieren analizar.

Para que el Datawarehouse funcione de forma óptima, los datos a cargar tienen que ser tratados previamente, en muchos casos. Gracias a los nuevos sistemas decisionales, el proceso de implementación de un Datamart o Datawarehouse es una tarea mucho más fácil de desarrollar, acortando tiempos, de forma que ya no es una tecnología exclusivamente para las empresas grandes.

 

4. Herramientas ETL

ETL son las siglas de Extract Transform and Load. Nos ayudaran en la transformación de los datos, limpieza de datos y su carga en el Datawarehouse. Hay muchas herramientas de diferentes fabricantes, a veces a efectos de rendimiento puede interesar implementar nuestras ETL, usando SQL y lenguajes de programación como Java, C++, Perl, Python…

 

5. Como afrontar su construcción

Si los usuarios de negocio tienen claro lo que quieren, facilita mucho el trabajo a los técnicos del Datawarehouse, ya que ya saben que arquitectura puede ser la más propicia para responder a las preguntas de los usuarios de negocio. Sabrán escoger las tablas y campos que formarán parte del Datawarehouse, crear las tablas de hechos y dimensiones y cargas incrementales perfectas. Aunque normalmente, y para desgracia de los técnicos, esto no se suele dar, entonces el desarrollo del Datawarehouse suele darse sobre la marcha, habiendo modificaciones constantemente de su arquitectura, reproduciendo prácticamente todo el sistema transaccional en el, averiguando el significado de algunas columnas, limpiando los datos…

La mejor forma de trabajar en ambos casos, es presentar pequeñas maquetas incrementales al cliente, de esta forma se es consciente de los avances y el camino que se está siguiendo.

 

6. Monitorización de todos los procesos implicados

La monitorización, ayudará a saber en que estado se encuentran cada uno de los procesos que intervienen, desde la ETL al propio Datawarehouse. Sabiendo en todo momento si alguno de los elementos ha fallado y en tal caso tomar las acciones oportunas. En caso de error, es muy importante que se pueda detallar cuanta más información mejor, de esta forma será más fácil solucionar.