SISTEMA ITESM
ITESM-CCM
PROGRAMA DE ESTUDIOS
DE LA MATERIA
Cb-95-018. BASES DE DATOS CORPORATIVAS
TEMARIO GENERAL
I.- Introducción a las bases de datos corporativas
II.- Base de datos distribuidas.
III.- Multibase de datos.
IV.- Data Warehouse (Bodega de Datos).
V.- Base de datos Multidimensionales y Herramientas OLAP.
VI.- Minería de datos.
VII.- Productos comerciales
OBJETIVO GENERAL DE LA MATERIA.
1.- Conocer la tecnología y herramientas emergentes para la construcción
de bases de datos corporativas.
2.- Profundizar y aplicar conceptos avanzados sobre base de datos distribuidas
y multibase de datos.
3.- Conocer y aplicar la metodología para construcción y operación
de Data Warehouses, apoyándose en la tecnología de base de datos
multidimensionales y minería de datos.
TEMAS Y SUBTEMAS DEL CURSO
- INTRODUCCION A LAS BASE DE DATOS CORPORATIVAS.
- Que se entiende por una base
de datos corporativa.
- Importancia de las bases de datos corporativas.
- Tecnología asociada a las bases de datos corporativas.
- Base de datos distribuidas.
- Multibase de datos.
- Data Warehouse: Multibase de datos y minería de datos.
- BASE DE DATOS DISTRIBUIDAS.
- Repaso de conceptos básicos de SBDD.
- Diseño de base de datos distribuidas.
- Objetivos del diseño distribuido de datos.
- Diseño de fragmentación horizontal y vertical.
- Asignación de fragmentos o archivos no replicados (enfoque de
optimización combinatoria).
- Asignación replicada.
- Procesamiento de consultas distribuidas.
- Problemas con consultas distribuidas.
- Objetivos en el procesamiento de consultas distribuidas: Optimización.
- Descomposición de la consulta global.
- Localización de datos distribuidos.
- Optimización global de la consulta.
- Optimización local de la consulta.
- Procesamiento en paralelo.
- Transacciones distribuidas.
- Concepto y propiedades de transacción distribuida.
- Tipos de fallas en transacciones distribuidas.
- Protocolo de commit en 2 fases.
- Recuperación de transacciones distribuidas.
- Control de concurrencia para transacciones distribuidas.
- Fundamentos para el control de concurrencia distribuido.
- Control de concurrencia basado en bloqueo.
- Deadlock distribuido:detección, prevención y recuperación.
- Control de concurrencia basada en estampas de tiempo.
- MULTIBASE DE DATOS.
- Definición de multibase de datos.
- Problemas debido a la heterogenidad.
- Construcción de un modelo de datos en común.
- Translación de esquemas.
- Integración de esquemas.
- Esquema global.
- Problemas en el procesamiento de querys en multibase de datos.
- Manejo de transacciones en ambientes multibase de datos.
- DATA WAREHOUSE (BODEGA DE DATOS).
- Definición de Data Warehouse (DW).
- Importancia de los DW.
- Arquitectura de un DW.
- Estrategias de implementación de un DW.
- Gateways.
- DW virtuales.
- DW corporativos.
- Data Marts.
- Metodología para la construcción de un DW.
- Justificación.
- Análisis.
- Diseño.
- Prototipo.
- Construcción.
- Operación de un DW
- Selección y extracción de datos.
- Almacenamiento de los datos extraídos
- Análisis de los datos.
- Manejo de los datos en DW.
- Por medio de un Manejador de Base de Datos Relacional (RDBMS).
- Por medio de un Manejador de Base de Datos Multidimensional (MDD).
- Análisis de los datos.
- Herramientas de Procesamiento Analítico En Línea (OLAP).
- Herramientas de Procesamiento Analítico En Línea Relacional
(ROLAP).
- Minería de datos.
- Metadatos del DW.
- Herramientas necesarias en la construcción de DW.
- Administración de un DW.
- BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.
- Arquitectura de una base de datos multidimensional.
- Concepto de datos dimensionales.
- Modelado de datos multidimensional.
- OLAP como herramienta de análisis multidimensional.
- Características o reglase para herramientas OLAP.
- Formación y Manipulación del Hipercubo.
- Resultados del análisis OLAP para apoyo a la toma de decisiones.
- MINERIA DE DATOS.
- Que es minería de datos.
- Minería de datos VS herramientas tradicionales de consulta de b.d
(SQL).
- Concepto de Aprendizaje y conocimiento.
- Tipos de conocimiento en DW.
- Conocimiento a la vista.
- Conocimiento multidimensional.
- Conocimiento oculto.
- Conocimiento profundo.
- El proceso de descubrir conocimiento.
- Selección de datos.
- Limpiando o filtrando datos.
- Enriqueciendo los datos.
- Transformando datos.
- Minando los datos.
- Reporte de resultados.
- Técnicas para el minado de datos.
- Herramientas tradicionales de b.d. para consulta.
- Técnicas estadísticas.
- Visualización.
- Arboles de decisión
- Redes neuronales.
- Algoritmos genéticos.
- PRODUCTOS COMERCIALES.
- Base de datos distribuidas.
- Multibase de datos.
- Data warehouse.
- MDD y herramientas OLAP.
- Minería de datos.
OBJETIVOS ESPECIFICOS DE APRENDIZAJE POR TEMAS
TEMA 1.- INTRODUCCION A LAS BASES DE DATOS COORPORATIVAS.
- Entender la problemática actual de las empresas referente a las
necesidades de información corporativa.
- Entender el concepto de bases de datos corporativas.
- Conocer las tecnologías que apoyen la solución del problema
de información corporativa.
TEMA 2.- BASE DE DATOS DISTRIBUIDAS.
- Repasar los conceptos
básicos de BDD vistos en el curso de Base de Datos.
- Entender en que consiste el diseño de una BDD.
- Comprender los objetivos que se persiguen al tener un buen diseño
de BDD.
- Diseñar bases de datos distribuidas considerando los factores de
fragmentación de datos y ubicación de los mismos.
- Comprender que involucra el procesamiento de consultas en una BDD.
- Comprender la problemática con consultas distribuidas.
- Conocer los objetivos que se pretenden al optimizar una consulta distribuida.
- Conocer la forma de optimizar consultas distribuidas y locales.
- Entender lo que es procesamiento en paralelo para consultas.
- Conocer las propiedades de una transacción distribuida.
- Conocer los tipos de falla que pueden ocurrir en una BDD.
- Conocer y entender el protocolo de commit en dos fases.
- Entender como se recupera de una falla en una BDD.
- Comprender en que consiste el control de concurrencia en una BDD.
- Comprender el control de concurrencia distribuido por medio de candados.
- Entender el problema de deadlock y las formas en que se puede tratar este
problema.
- Comprender el control de concurrencia distribuido por medio de estampas
de tiempo.
TEMA 3.- MULTIBASE DE DATOS.
- Definir un sistema multibase de datos.
- Saber la equivalencia entre BDD heterogéneas y Multibase de datos.
- Entender la problemática de los sistemas multibase de datos.
- Saber como construir un modelo de datos común para todos las BDD
en el sistema heterogéneo.
- Conocer los problemas relacionados a consultas, manejo de transacciones
y concurrencia en un ambiente multibase de datos.
TEMA 4.- DATA WAREHOUSE (DW)
- Definir el concepto de DW.
- Saber la importancia de los DW.
- Conocer la arquitectura de un DW.
- Conocer la metodología para construcción de un DW.
- Conocer la diferentes estrategias para construir un DW.
- Saber como trabaja y se opera un DW.
- Conocer las diferentes opciones que se tienen para manejar los datos del
DW.
- Saber las particularidades de un MDD.
- Diferenciar ente procesamiento OLTP y OLAP.
- Entender en que consiste la minería de datos.
- Conocer la importancia de los metadatos.
- Conocer las herramientas necesarias para el desarrollo de un DW.
- Conocer las actividades básicas relacionadas a la administración
de un DW.
TEMA 5.- BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.
- Entender en que consisten las bases de datos multidimensionales
(BDMD).
- Entender la arquitectura de una BDMD.
- Conocer los componentes de un Manejador de BDMD.
- Entender y modelar BDMD.
- Conocer las características que debe tener un herramienta OLAP.
- Entender como manipular el Hipercubo de una modelo de una BDMD.
- Entender como se puede analizar los datos para la toma de decisiones.
TEMA 6.- MINERIA DE DATOS.
- Entender el proceso de minado de datos.
- Diferenciar los beneficios de minería de datos VS SQL.
- Comprender la importancia de obtener conocimiento del DW por medio de
la minería de datos.
- Comprender el proceso de descubrir conocimiento en el DW.
- Comprender las técnicas utilizadas en el minado de datos, tales
como: técnicas estadísticas, árboles de decisión,
redes neuronales y algoritmos genéticos.
TEMA 7.- PRODUCTOS COMERCIALES.
7.1 Investigar los productos comerciales existentes para implementación
de base de datos distribuidas, multibase de datos, data warehouse, base de datos
multidimensionales, OLAP y minería de datos.
METODOLOGIA
SUGERIDA Y ACTIVIDADES DE APRENDIZAJE
1.- Desarrollar
tareas que ejerciten el conocimiento adquirido.
2.- Investigar información actual de los temas vistos en clase a través
de libros, artículos, simposiums, Internet, revistas, conferencias, experiencia
con expertos y consultores, etc.
3.- Desarrollo de proyectos con la finalidad de ejercitar y obtener experiencias
en la implementación de componentes de una base de datos corporativa.
TIEMPO ESTIMADO POR TEMA
Tema |
Hrs. |
1.- Introducción a las bases de datos corporativas |
2 |
2.- Base de datos distribuidas |
12 |
3.- Multibase de datos. |
4 |
4.- Data warehouse |
12 |
5.- Bases de datos multidimensionales y herramientas OLAP. |
6 |
6.- Minería de datos. |
6 |
7.- Productos comerciales. |
3 |
8.- 3 Exámenes parciales. |
3 |
Total = 48
Hrs.
POLITICAS DE EVALUACION
SUGERIDAS
1.- Tareas ------------------------- 15 %
2.- Proyectos (2) ----------------- 35 %
3.- Exámenes parciales (3) ----- 30 %
4.- Examen final ---------------- 20 %
--------
100%
BIBLIOGRAFIA
1.- Distributed Databases: Principles & Systems.
Stefano Ceri and Giuseppe Pelagatti.
McGraw Hill.
2.- Distributed Database Systems. David Bell and Jane Grinsom. Addison Wesley.
3.- Principles of Distributed Databases Systems. M. Tamer Ozsu and Patrick
Valduriez. Prentice Hall.
4.- Building the Data Warehouse. W. H. Inmon. John Wiley & Sons.
2a Edit.
5.- Managing the Data Warehouse. W. H. Inmon, J.D. Welch, Katherine L.
Glassey. John Wiley & Sons.
6.- Strategic Database Technology: Management for the year 2000. Alan
R. Simon. Morgan Kaufmann Publishers, Inc.
7.- Data Mining. Pieter Adriaans & Dolf Zantinge. Addison Wesley.
8.- Data Mining Solutions. Christopher Westphal & Teresa Blaxton.
John Wiley & Sons.