OBJETIVO DEL CURSO

El alumno identificará y utilizará los conceptos dentro del Proceso de descubrimiento de conocimiento de datos para la implementación y mejora de algoritmos de deduplicacion de registros y su relación con calidad, minería y manejo de datos.

PROGRAMA GENERAL DEL CURSO

1. Calidad de datos
2. Algoritmos de De-duplicacion de datos
3. Introducción a Manejo de Datos Maestros
4. Introducción a Bases de datos en memoria


BIBLIOGRAFIA

Christen, Peter, Data Matching






PROYECTO



Especificacion de proyecto de calidad de datos



PRESENTACIONES



BD heterogeneas

Multidimensionales,Multimedia,Bases de Datos Federadas/Multibasesdedatos

Integracion de Informacion

Multibases de datos

BD en Memoria

Calidad de Datos

Introducccion a Calidad de Datos

Calidad de Datos 1

Calidad de Datos 2

Pasos en un proyecto de calidad de datos

Tutorial Talend Data Quality

ISO 25012

ISO 12207


Algoritmos de Deduplicación de datos

Introducción al Proceso KDD

Proceso KDD

KDD-2

Introduccion a Data Matching

Preprocesamiento de datos

Métodos de indexado

Métodos de Comparación

Métodos de Clasificación

Métodos de Evaluación de clasificacion de registros



Manejo de Datos Maestros



Introducción a MDM

Visión Adecuada de MDM IBM

Marco Teórico MDM

MDM Informática

Estrategias Comerciales MDM

Arquitectura MDM

Retos en Uso Efectivo Técnicas IBM

Arquitectura MDM Referencia IBM





PRACTICAS



Practica instalacion Talend Open Studio DQ

Practica 1 TOS DQ

Info para Practica 1 TOS DQ

Practica 2 TOS DQ

Info para Practica 2 TOS DQ

Práctica 0 instalacion Data Preparation

Práctica 1 Data Preparation

Informacion para Práctica 1 Data Preparation

Práctica 2 Data Preparation

Práctica de instalacion Talend MDM

Práctica 1

Práctica 2

Práctica 4

Práctica 5



This page was last updated on August 2019 by © Maria del Pilar Angeles