SISTEMA ITESM

ITESM-CCM

PROGRAMA DE ESTUDIOS DE LA MATERIA
Cb-95-018. BASES DE DATOS CORPORATIVAS
 

TEMARIO GENERAL
I.- Introducción a las bases de datos corporativas
II.- Base de datos distribuidas.
III.- Multibase de datos.
IV.- Data Warehouse (Bodega de Datos).
V.- Base de datos Multidimensionales y Herramientas OLAP.
VI.- Minería de datos.
VII.- Productos comerciales
 

OBJETIVO GENERAL DE LA MATERIA.
1.- Conocer la tecnología y herramientas emergentes para la construcción de bases de datos corporativas.
2.- Profundizar y aplicar conceptos avanzados sobre base de datos distribuidas y multibase de datos.
3.- Conocer y aplicar la metodología para construcción y operación de Data Warehouses, apoyándose en la tecnología de base de datos multidimensionales y minería de datos.
 

TEMAS Y SUBTEMAS DEL CURSO


  1. INTRODUCCION A LAS BASE DE DATOS CORPORATIVAS.
    1. Que se entiende por una base de datos corporativa.

    2. Importancia de las bases de datos corporativas.

    3. Tecnología asociada a las bases de datos corporativas.

      1. Base de datos distribuidas.

      2. Multibase de datos.

      3. Data Warehouse: Multibase de datos y minería de datos.


     
  2. BASE DE DATOS DISTRIBUIDAS.

    1. Repaso de conceptos básicos de SBDD.

    2. Diseño de base de datos distribuidas.

      1. Objetivos del diseño distribuido de datos.

      2. Diseño de fragmentación horizontal y vertical.

      3. Asignación de fragmentos o archivos no replicados (enfoque de optimización combinatoria).

      4. Asignación replicada.

    3. Procesamiento de consultas distribuidas.

      1. Problemas con consultas distribuidas.

      2. Objetivos en el procesamiento de consultas distribuidas: Optimización.

      3. Descomposición de la consulta global.

      4. Localización de datos distribuidos.

      5. Optimización global de la consulta.

      6. Optimización local de la consulta.

      7. Procesamiento en paralelo.

    4. Transacciones distribuidas.

      1. Concepto y propiedades de transacción distribuida.

      2. Tipos de fallas en transacciones distribuidas.

      3. Protocolo de commit en 2 fases.

      4. Recuperación de transacciones distribuidas.

    5. Control de concurrencia para transacciones distribuidas.

      1. Fundamentos para el control de concurrencia distribuido.

      2. Control de concurrencia basado en bloqueo.

      3. Deadlock distribuido:detección, prevención y recuperación.

      4. Control de concurrencia basada en estampas de tiempo.


     
  3. MULTIBASE DE DATOS.

    1. Definición de multibase de datos.

    2. Problemas debido a la heterogenidad.

    3. Construcción de un modelo de datos en común.

      1. Translación de esquemas.

      2. Integración de esquemas.

      3. Esquema global.

    4. Problemas en el procesamiento de querys en multibase de datos.

    5. Manejo de transacciones en ambientes multibase de datos.


     
  4. DATA WAREHOUSE (BODEGA DE DATOS).

    1. Definición de Data Warehouse (DW).

    2. Importancia de los DW.

    3. Arquitectura de un DW.

    4. Estrategias de implementación de un DW.

      1. Gateways.

      2. DW virtuales.

      3. DW corporativos.

      4. Data Marts.

    5. Metodología para la construcción de un DW.

      1. Justificación.

      2. Análisis.

      3. Diseño.

      4. Prototipo.

      5. Construcción.

    6. Operación de un DW

      1. Selección y extracción de datos.

      2. Almacenamiento de los datos extraídos

      3. Análisis de los datos.

    7. Manejo de los datos en DW.

      1. Por medio de un Manejador de Base de Datos Relacional (RDBMS).

      2. Por medio de un Manejador de Base de Datos Multidimensional (MDD).

    8. Análisis de los datos.

      1. Herramientas de Procesamiento Analítico En Línea (OLAP).

      2. Herramientas de Procesamiento Analítico En Línea Relacional (ROLAP).

      3. Minería de datos.

    9. Metadatos del DW.

    10. Herramientas necesarias en la construcción de DW.

    11. Administración de un DW.


     
  5. BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.

    1. Arquitectura de una base de datos multidimensional.

    2. Concepto de datos dimensionales.

    3. Modelado de datos multidimensional.

    4. OLAP como herramienta de análisis multidimensional.

      1. Características o reglase para herramientas OLAP.

      2. Formación y Manipulación del Hipercubo.

    5. Resultados del análisis OLAP para apoyo a la toma de decisiones.


     
  6. MINERIA DE DATOS.

    1. Que es minería de datos.

    2. Minería de datos VS herramientas tradicionales de consulta de b.d (SQL).

    3. Concepto de Aprendizaje y conocimiento.

    4. Tipos de conocimiento en DW.

      1. Conocimiento a la vista.

      2. Conocimiento multidimensional.

      3. Conocimiento oculto.

      4. Conocimiento profundo.

    5. El proceso de descubrir conocimiento.

      1. Selección de datos.

      2. Limpiando o filtrando datos.

      3. Enriqueciendo los datos.

      4. Transformando datos.

      5. Minando los datos.

      6. Reporte de resultados.

    6. Técnicas para el minado de datos.

      1. Herramientas tradicionales de b.d. para consulta.

      2. Técnicas estadísticas.

      3. Visualización.

      4. Arboles de decisión

      5. Redes neuronales.

      6. Algoritmos genéticos.


  7. PRODUCTOS COMERCIALES.

    1. Base de datos distribuidas.

    2. Multibase de datos.

    3. Data warehouse.

    4. MDD y herramientas OLAP.

    5. Minería de datos.


 
 

OBJETIVOS ESPECIFICOS DE APRENDIZAJE POR TEMAS


TEMA 1.- INTRODUCCION A LAS BASES DE DATOS COORPORATIVAS.


    1. Entender la problemática actual de las empresas referente a las necesidades de información corporativa.

    2. Entender el concepto de bases de datos corporativas.

    3. Conocer las tecnologías que apoyen la solución del problema de información corporativa.


 
TEMA 2.- BASE DE DATOS DISTRIBUIDAS.
    1. Repasar los conceptos básicos de BDD vistos en el curso de Base de Datos.

    2. Entender en que consiste el diseño de una BDD.

    3. Comprender los objetivos que se persiguen al tener un buen diseño de BDD.

    4. Diseñar bases de datos distribuidas considerando los factores de fragmentación de datos y ubicación de los mismos.

    5. Comprender que involucra el procesamiento de consultas en una BDD.

    6. Comprender la problemática con consultas distribuidas.

    7. Conocer los objetivos que se pretenden al optimizar una consulta distribuida.

    8. Conocer la forma de optimizar consultas distribuidas y locales.

    9. Entender lo que es procesamiento en paralelo para consultas.

    10. Conocer las propiedades de una transacción distribuida.

    11. Conocer los tipos de falla que pueden ocurrir en una BDD.

    12. Conocer y entender el protocolo de commit en dos fases.

    13. Entender como se recupera de una falla en una BDD.

    14. Comprender en que consiste el control de concurrencia en una BDD.

    15. Comprender el control de concurrencia distribuido por medio de candados.

    16. Entender el problema de deadlock y las formas en que se puede tratar este problema.

    17. Comprender el control de concurrencia distribuido por medio de estampas de tiempo.


 
TEMA 3.- MULTIBASE DE DATOS.

    1. Definir un sistema multibase de datos.

    2. Saber la equivalencia entre BDD heterogéneas y Multibase de datos.

    3. Entender la problemática de los sistemas multibase de datos.

    4. Saber como construir un modelo de datos común para todos las BDD en el sistema heterogéneo.

    5. Conocer los problemas relacionados a consultas, manejo de transacciones y concurrencia en un ambiente multibase de datos.


 
TEMA 4.- DATA WAREHOUSE (DW)

    1. Definir el concepto de DW.

    2. Saber la importancia de los DW.

    3. Conocer la arquitectura de un DW.

    4. Conocer la metodología para construcción de un DW.

    5. Conocer la diferentes estrategias para construir un DW.

    6. Saber como trabaja y se opera un DW.

    7. Conocer las diferentes opciones que se tienen para manejar los datos del DW.

    8. Saber las particularidades de un MDD.

    9. Diferenciar ente procesamiento OLTP y OLAP.

    10. Entender en que consiste la minería de datos.

    11. Conocer la importancia de los metadatos.

    12. Conocer las herramientas necesarias para el desarrollo de un DW.

    13. Conocer las actividades básicas relacionadas a la administración de un DW.


 
TEMA 5.- BASE DE DATOS MULTIDIMENSIONALES Y HERRAMIENTAS OLAP.

    1. Entender en que consisten las bases de datos multidimensionales (BDMD).

    2. Entender la arquitectura de una BDMD.

    3. Conocer los componentes de un Manejador de BDMD.

    4. Entender y modelar BDMD.

    5. Conocer las características que debe tener un herramienta OLAP.

    6. Entender como manipular el Hipercubo de una modelo de una BDMD.

    7. Entender como se puede analizar los datos para la toma de decisiones.


 
TEMA 6.- MINERIA DE DATOS.

    1. Entender el proceso de minado de datos.

    2. Diferenciar los beneficios de minería de datos VS SQL.

    3. Comprender la importancia de obtener conocimiento del DW por medio de la minería de datos.

    4. Comprender el proceso de descubrir conocimiento en el DW.

    5. Comprender las técnicas utilizadas en el minado de datos, tales como: técnicas estadísticas, árboles de decisión, redes neuronales y algoritmos genéticos.


 
TEMA 7.- PRODUCTOS COMERCIALES.

7.1 Investigar los productos comerciales existentes para implementación de base de datos distribuidas, multibase de datos, data warehouse, base de datos multidimensionales, OLAP y minería de datos.

METODOLOGIA SUGERIDA Y ACTIVIDADES DE APRENDIZAJE


1.- Desarrollar tareas que ejerciten el conocimiento adquirido.
2.- Investigar información actual de los temas vistos en clase a través de libros, artículos, simposiums, Internet, revistas, conferencias, experiencia con expertos y consultores, etc.
3.- Desarrollo de proyectos con la finalidad de ejercitar y obtener experiencias en la implementación de componentes de una base de datos corporativa.


 

TIEMPO ESTIMADO POR TEMA

Tema

Hrs.


1.- Introducción a las bases de datos corporativas

2


2.- Base de datos distribuidas

12


3.- Multibase de datos.

4


4.- Data warehouse

12


5.- Bases de datos multidimensionales y herramientas OLAP.

6


6.- Minería de datos.

6


7.- Productos comerciales.

3


8.- 3 Exámenes parciales.

3

Total = 48 Hrs.

 

 

POLITICAS DE EVALUACION SUGERIDAS


1.- Tareas ------------------------- 15 %
2.- Proyectos (2) ----------------- 35 %
3.- Exámenes parciales (3) ----- 30 %
4.- Examen final ---------------- 20 %
--------
100%

 

BIBLIOGRAFIA
1.- Distributed Databases: Principles & Systems.
Stefano Ceri and Giuseppe Pelagatti.
McGraw Hill.
2.- Distributed Database Systems. David Bell and Jane Grinsom. Addison Wesley.
3.- Principles of Distributed Databases Systems. M. Tamer Ozsu and Patrick Valduriez. Prentice Hall.
4.- Building the Data Warehouse. W. H. Inmon. John Wiley & Sons. 2a Edit.
5.- Managing the Data Warehouse. W. H. Inmon, J.D. Welch, Katherine L. Glassey. John Wiley & Sons.
6.- Strategic Database Technology: Management for the year 2000. Alan R. Simon. Morgan Kaufmann Publishers, Inc.
7.- Data Mining. Pieter Adriaans & Dolf Zantinge. Addison Wesley.
8.- Data Mining Solutions. Christopher Westphal & Teresa Blaxton. John Wiley & Sons.