DATOS GENERALES
Cb-00-005 BASE DE DATOS PARA EL SOPORTE DE DECISIONES
(3-0-8. Requisito: Haber aprobado Cb00861. 6 LSC)
No hay equivalencia
SISTEMA ITESM
Cb-00-005 BASE DE DATOS PARA EL SOPORTE DE DECISIONES
TEMARIO GENERAL
- Introducción a las bases de datos corporativas
- Base de datos distribuidas.
- Multibase de datos.
- Data Warehouse (Bodega de Datos).
- Base de datos Multidimensionales y Herramientas OLAP.
- Minería de datos.
- Productos comerciales.
OBJETIVO GENERAL DE LA MATERIA.
Conocer la tecnología y herramientas emergentes para la construcción de bases de datos corporativas profundizando y aplicando conceptos avanzados sobre multibase de datos. Conocer y aplicar la metodología para construcción y operación de Data Warehouses, apoyándose en la tecnología de base de datos multidimensionales y minería de datos.
TEMAS Y SUBTEMAS DEL CURSO
- INTRODUCCION A LAS BASE DE DATOS CORPORATIVAS.
- Que se entiende por una base de datos corporativa.
- Importancia de las bases de datos corporativas.
- Tecnología asociada a las bases de datos corporativas.
- Base de datos distribuidas.
- Multibase de datos.
- Data Warehouse: Multibase de datos y minería de datos.
- BASE DE DATOS DISTRIBUIDAS.
- Conceptos básicos de SBDD.
- Diseño de base de datos distribuidas.
- Objetivos del diseño distribuido de datos.
- Diseño de fragmentación horizontal y vertical.
- Asignación de fragmentos o archivos no replicados (enfoque de optimización combinatoria).
- Asignación replicada.
- Procesamiento de consultas distribuidas.
- Problemas con consultas distribuidas.
- Objetivos en el procesamiento de consultas distribuidas: Optimización.
- Descomposición de la consulta global.
- Localización de datos distribuidos.
- Optimización global de la consulta.
- Optimización local de la consulta.
- Procesamiento en paralelo.
- Transacciones distribuidas.
- Concepto y propiedades de transacción distribuida.
- Tipos de fallas en transacciones distribuidas.
- Protocolo de commit en 2 fases.
- Recuperación de transacciones distribuidas.
- Control de concurrencia para transacciones distribuidas.
- Fundamentos para el control de concurrencia distribuido.
- Control de concurrencia basado en bloqueo.
- Deadlock distribuido:detección, prevención y recuperación.
- Control de concurrencia basada en estampas de tiempo.
- MULTIBASE DE DATOS.
- Definición de multibase de datos.
- Problemas debido a la heterogenidad.
- Construcción de un modelo de datos en común.
- Translación de esquemas.
- Integración de esquemas.
- Esquema global.
- Problemas en el procesamiento de querys en multibase de datos.
- Manejo de transacciones en ambientes multibase de datos.
- DATA WAREHOUSE (BODEGA DE DATOS).
- Definición de Data Warehouse (DW).
- Importancia de los DW.
- Arquitectura de un DW.
- Estrategias de implementación de un DW.
- Gateways.
- DW virtuales.
- DW corporativos.
- Data Marts.
- Metodología para la construcción de un DW.
- Justificación.
- Análisis.
- Diseño.
- Prototipo.
- Construcción.
- Operación de un DW
- Selección y extracción de datos.
- Almacenamiento de los datos extraídos
- Análisis de los datos.
- Manejo de los datos en DW.
- Por medio de un Manejador de Base de Datos Relacional (RDBMS).
- Por medio de un Manejador de Base de Datos Multidimensional (MDD).
- Análisis de los datos.
- Herramientas de Procesamiento Analítico En Línea (OLAP).
- Herramientas de Procesamiento Analítico En Línea Relacional (ROLAP).
- Minería de datos.
- Metadatos del DW.
- Herramientas necesarias en la construcción de DW.
- Administración de un DW.
- BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.
- Arquitectura de una base de datos multidimensional.
- Concepto de datos dimensionales.
- Modelado de datos multidimensional.
- OLAP como herramienta de análisis multidimensional.
- Características o reglase para herramientas OLAP.
- Formación y Manipulación del Hipercubo.
- Resultados del análisis OLAP para apoyo a la toma de decisiones.
- MINERIA DE DATOS.
- Que es minería de datos.
- Minería de datos VS herramientas tradicionales de consulta de b.d (SQL).
- Concepto de Aprendizaje y conocimiento.
- Tipos de conocimiento en DW.
- Conocimiento a la vista.
- Conocimiento multidimensional.
- Conocimiento oculto.
- Conocimiento profundo.
- El proceso de descubrir conocimiento.
- Selección de datos.
- Limpiando o filtrando datos.
- Enriqueciendo los datos.
- Transformando datos.
- Minando los datos.
- Reporte de resultados.
- Técnicas para el minado de datos.
- Herramientas tradicionales de b.d. para consulta.
- Técnicas estadísticas.
- Visualización.
- Arboles de decisión
- Redes neuronales.
- Algoritmos genéticos.
- PRODUCTOS COMERCIALES.
- Base de datos distribuidas.
- Multibase de datos.
- Data warehouse.
- MDD y herramientas OLAP.
- Minería de datos.
OBJETIVOS ESPECIFICOS DE APRENDIZAJE POR TEMAS
TEMA 1.- INTRODUCCION A LAS BASES DE DATOS COORPORATIVAS.
- Entender la problemática actual de las empresas referente a las necesidades de información corporativa.
- Entender el concepto de bases de datos corporativas.
- Conocer las tecnologías que apoyen la solución del problema de información corporativa.
TEMA 2.- BASE DE DATOS DISTRIBUIDAS.
- Repasar los conceptos básicos de BDD vistos en el curso de Base de Datos.
- Entender en que consiste el diseño de una BDD.
- Comprender los objetivos que se persiguen al tener un buen diseño de BDD.
- Diseñar bases de datos distribuidas considerando los factores de fragmentación de datos y ubicación de los mismos.
- Comprender que involucra el procesamiento de consultas en una BDD.
- Comprender la problemática con consultas distribuidas.
- Conocer los objetivos que se pretenden al optimizar una consulta distribuida.
- Conocer la forma de optimizar consultas distribuidas y locales.
- Entender lo que es procesamiento en paralelo para consultas.
- Conocer las propiedades de una transacción distribuida.
- Conocer los tipos de falla que pueden ocurrir en una BDD.
- Conocer y entender el protocolo de commit en dos fases.
- Entender como se recupera de una falla en una BDD.
- Comprender en que consiste el control de concurrencia en una BDD.
- Comprender el control de concurrencia distribuido por medio de candados.
- Entender el problema de deadlock y las formas en que se puede tratar este problema.
- Comprender el control de concurrencia distribuido por medio de estampas de tiempo.
TEMA 3.- MULTIBASE DE DATOS.
- Definir un sistema multibase de datos.
- Saber la equivalencia entre BDD heterogéneas y Multibase de datos.
- Entender la problemática de los sistemas multibase de datos.
- Saber como construir un modelo de datos común para todos las BDD en el sistema heterogéneo.
- Conocer los problemas relacionados a consultas, manejo de transacciones y concurrencia en un ambiente multibase de datos.
TEMA 4.- DATA WAREHOUSE (DW)
- Definir el concepto de DW.
- Saber la importancia de los DW.
- Conocer la arquitectura de un DW.
- Conocer la metodología para construcción de un DW.
- Conocer la diferentes estrategias para construir un DW.
- Saber como trabaja y se opera un DW.
- Conocer las diferentes opciones que se tienen para manejar los datos del DW.
- Saber las particularidades de un MDD.
- Diferenciar ente procesamiento OLTP y OLAP.
- Entender en que consiste la minería de datos.
- Conocer la importancia de los metadatos.
- Conocer las herramientas necesarias para el desarrollo de un DW.
- Conocer las actividades básicas relacionadas a la administración de un DW.
TEMA 5.- BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.
- Entender en que consisten las bases de datos multidimensionales (BDMD).
- Entender la arquitectura de una BDMD.
- Conocer los componentes de un Manejador de BDMD.
- Entender y modelar BDMD.
- Conocer las características que debe tener un herramienta OLAP.
- Entender como manipular el Hipercubo de una modelo de una BDMD.
- Entender como se puede analizar los datos para la toma de decisiones.
TEMA 6.- MINERIA DE DATOS.
- Entender el proceso de minado de datos.
- Diferenciar los beneficios de minería de datos VS SQL.
- Comprender la importancia de obtener conocimiento del DW por medio de la minería de datos.
- Comprender el proceso de descubrir conocimiento en el DW.
- Comprender las técnicas utilizadas en el minado de datos, tales como: técnicas estadísticas, árboles de decisión, redes neuronales y algoritmos genéticos.
TEMA 7.- PRODUCTOS COMERCIALES.
7.1 Investigar los productos comerciales existentes para implementación de base de datos distribuidas, multibase de datos, data warehouse, base de datos multidimensionales, OLAP y minería de datos.
METODOLOGIA SUGERIDA Y ACTIVIDADES DE APRENDIZAJE
1.- Desarrollar tareas que ejerciten el conocimiento adquirido.
2.- Investigar información actual de los temas vistos en clase a través de libros, artículos, simposiums, Internet, revistas, conferencias, experiencia con expertos y consultores, etc.
3.- Desarrollo de proyectos con la finalidad de ejercitar y obtener experiencias en la implementación de componentes de una base de datos corporativa.
TIEMPO ESTIMADO POR TEMA
Tema Hrs.
1.- Introducción a las bases de datos corporativas 2
2.- Base de datos distribuidas 7
3.- Multibase de datos. 3
4.- Data warehouse 12
5.- Bases de datos multidimensionales y herramientas OLAP. 9
6.- Minería de datos. 9
7.- Productos comerciales. 3
8.- 3 Exámenes parciales. 3
Total = 48 Hrs.
POLITICAS DE EVALUACION SUGERIDAS
1.- Tareas ------------------------- 15 %
2.- Proyectos (2) ----------------- 35 %
3.- Exámenes parciales (3) ----- 30 %
4.- Examen final ---------------- 20 %
--------
100%
BIBLIOGRAFIA
Bibliografía
Actualizada
1.- Distributed Databases: Principles & Systems.
Stefano Ceri and Giuseppe Pelagatti.
McGraw Hill.
2.- Distributed Database Systems.
David Bell and Jane Grinsom.
Addison Wesley.
3.- Principles of Distributed Databases Systems.
M. Tamer Ozsu and Patrick Valduriez.
Prentice Hall.
4.- Building the Data Warehouse.
W. H. Inmon.
John Wiley & Sons.
2a Edit.
5.- Managing the Data Warehouse.
W. H. Inmon, J.D. Welch, Katherine L. Glassey.
John Wiley & Sons.
6.- Strategic Database Technology: Management for the year 2000
Alan R. Simon.
Morgan Kaufmann Publishers, Inc.
7.- Data Mining.
Pieter Adriaans & Dolf Zantinge.
Addison Wesley.
8.- Data Mining Solutions.
Christopher Westphal & Teresa Blaxton.
John Wiley & Sons.
- Data Warehousing, Data Mining, & OLAP
Alex Berson
Stephen J. Smith
McGraw Hill