OBJETIVOS DEL CURSO
1. El alumno comprenderá las etapas del proceso de descubrimiento de conocimiento a partir de los datos.
2. El alumno comprenderá la necesidad de preprocesamiento y análisis de diversas fuentes de datos provenientes de textos, bases de datos, redes sociales y bitácoras.
4. El estudiante conocerá las técnicas y herramientas más comunes para el análisis descriptivo y análisis predictivo
4. El estudiante utilizará el marco de trabajo Hadoop para la integración materializada de los datos.
5. El estudiante comprenderá la utilización de bases de datos en memoria para un análisis más rápido de datos.
PROGRAMA GENERAL DEL CURSO
1. KDD: Proceso de descubrimiento de conocimiento en datos
2. Selección, extracción, transformación y limpieza
3. Minería de datos
4. Introducción a Big Data
5. Introducción a Hadoop
6. Implementación Big Data en Plataforma Hortonworks, Ambari, Sqoop, Flume, Pig, Hive, HCatalog, Yarn, Oozie.
BIBLIOGRAFIA
PRACTICAS
PRACTICAS HADOOP
VM para Prácticas Ambari
Práctica 1 Ambari
Opcional: Práctica 2 Ambari
Opcional: Práctica 3 Ambari
Opcional: Práctica 4 Ambari
PRACTICAS SQOOP
Práctica 1 Sqoop
Práctica 2 Sqoop
PRACTICAS MAPREDUCE
Práctica 1 Entendiendo MapReduce
PRACTICAS PIG
Práctica 1 PIG
Práctica 2 PIG
Práctica 3 PIG
Práctica 4 PIG
Práctica 5 PIG
PRACTICAS HIVE
Práctica 1 Hive
Práctica 2 Hive
Práctica 3 Hive
Práctica 4 Hive
PRACTICAS HCatalog
Práctica 1 HCatalog
PRACTICAS YARN
Práctica 1 Yarn
PRACTICAS OOZIE
Práctica 1 Oozie
PRESENTACIONES
Introducción a KDD
Introducción a Minería de datos
Minería de datos
Introducción a Big Data
Introducción a Hadoop
Introducción a Hortonworks y Ambari
Sqoop y MapReduce
Pig y Hive
Pig y Hive con HCatalog
Pig y Hive 2da. parte
Pig y Hive con Yarn
Pig y Hive con Oozie
Pig y Hive con Streaming
Análisis con Mahout
PROYECTOS
Especificaciones proyecto big data
This page was last updated on January 2019 by © Maria del Pilar Angeles