miércoles, 14 de octubre de 2015

INTRODUCCION A LA TECNOLOGIA OLAP

En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.

Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región, producto, canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas en dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos. Aunque en ocasiones se utilizan indistintamente, los términos almacén de datos y proceso analítico en línea (OLAP, Online Analytical Processing) se aplican a diferentes componentes de sistemas conocidos como sistemas de ayuda a la toma de decisiones o sistemas de inteligencia empresarial. Los componentes de estos tipos de sistemas incluyen bases de datos y aplicaciones que proporcionan las herramientas que necesitan los analistas para tomar decisiones en relación con el soporte técnico de la organización. Un almacén de datos es una base de datos que contiene la información que, normalmente, representa el historial empresarial de una organización.

Estos datos históricos se utilizan para realizar análisis que apoyen las decisiones empresariales a diferentes niveles, desde el diseño estratégico a la evaluación del rendimiento de una unidad determinada de la organización. Los datos contenidos en un almacén de datos se encuentran organizados para permitir el análisis más que para procesar transacciones en tiempo real como ocurre en los sistemas de proceso de transacciones en línea (OLTP, Online Transaction Processing).  La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades. Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para dar apoyo al analista en tiempo real.  Cabe indicar que la Tecnología OLAP tiene como base el proceso de transacciones en línea (OLTP). A continuación veremos una breve definición del concepto OLTP y sus diferencias marcadas con la tecnología OLAP que desarrollaremos en el curso. 

TECNOLOGIA OLTP 

En muchas ocasiones, un almacén de datos se utiliza como el fundamento de un sistema de ayuda para la toma de decisiones. Los almacenes de datos se han diseñado para superar algunos de los problemas que una organización encuentra cuando intenta realizar un análisis estratégico mediante la misma base de datos que utiliza para realizar el proceso de transacciones en línea (OLTP). 
Normalmente, los sistemas OLTP: 
• Admiten el acceso simultáneo de muchos usuarios que agregan y modifican datos. 
• Representan el estado, en cambio constante, de una organización, pero no guardan su historial. 
• Contienen grandes cantidades de datos, incluidos los datos extensivos utilizados para comprobar transacciones.
• Tienen estructuras complejas. 
• Se ajustan para dar respuesta a la actividad transaccional. 
• Proporcionan la infraestructura tecnológica necesaria para admitir las operaciones diarias de la empresa.  A continuación se enumeran algunas de las dificultades que se suelen encontrar al utilizar bases de datos OLTP para realizar análisis en línea:  
• Los analistas carecen de la experiencia técnica necesaria para crear consultas "ad hoc" contra la compleja estructura de datos.
• Las consultas analíticas que resumen grandes volúmenes de datos afectan negativamente a la capacidad del sistema para responder a las transacciones en línea. 
• El rendimiento del sistema cuando está respondiendo a consultas analíticas complejas puede ser lento o impredecible, lo que causa un servicio poco eficiente a los usuarios del proceso analítico en línea. • Los datos que se modifican con frecuencia interfieren en la coherencia de la información analítica. 
• La seguridad se complica cuando se combina el análisis en línea con el proceso de transacciones en línea.  El almacén de datos proporciona una de las claves para resolver estos problemas al organizar los datos para analizarlos. Los almacenes de datos:  
• Pueden combinar datos de orígenes heterogéneos en una única estructura homogénea. 
• Organizan los datos en estructuras simplificadas buscando la eficiencia de las consultas analíticas más que del proceso de transacciones. 
• Contienen datos transformados que son válidos, coherentes, consolidados y con el formato adecuado para realizar el análisis. 
• Proporcionan datos estables que representan el historial de la empresa.
• Se actualizan periódicamente con datos adicionales, no con transacciones frecuentes. 
• Simplifican los requisitos de seguridad. 
• Proporcionan una base de datos organizada para OLAP, no para OLTP. Un puesto de datos es un formato especial de almacén de datos que suele contener un subconjunto de datos de la empresa orientado a un tema determinado y apropiado para una función empresarial específica.

TECNOLOGIA OLAP

Mientras que los almacenes y puestos de datos son los almacenes donde se analizan los datos, el Proceso analítico en línea (OLAP) es la tecnología que permite a las aplicaciones de cliente el acceso eficiente a estos datos. OLAP proporciona muchas ventajas a los usuarios que realizan análisis, por ejemplo: 
 • Un modelo de datos intuitivo y multidimensional que facilita la selección, recorrido y exploración de los datos.
 • Un lenguaje analítico de consulta que proporciona la capacidad de explorar las complejas relaciones existentes entre los datos empresariales. 
• Un precálculo de los datos consultados con más frecuencia que permite una rápida respuesta a las consultas ad hoc. 
Una de las herramientas que incluyen el procesamiento analítico en línea (OLAP) y la minería de datos más utilizadas es  Microsoft SQL Server Analysis Services, el contenido del curso se desarrollará usando esta herramienta, a continuación estudiaremos los conceptos principales de esta tecnología.
  

No hay comentarios:

Publicar un comentario