Syllabus

DED-2004 BIG DATA

DR. JOSE MANUEL LIRA TURRIZA

jmlira@itescam.edu.mx

Semestre Horas Teoría Horas Práctica Créditos Clasificación
7 2 3 5 Ingeniería Aplicada

Prerrequisitos
  • Instalar y configurar redes de área local y redes inalámbricas.
  • Dominar herramientas ETL.
  • Codificar aplicaciones en Lenguaje Java
  • Operar sistemas operativos, principalmente la familia LINUX.
  • Utilizar técnicas de modelado para la solución de problemas.
  • Comprender los conceptos de las bases de datos.
  • Construye modelos de bases de datos.
  • Dominar el lenguaje de SQL.
  • Diseñar, crear y administrar esquemas de bases de datos relacionales bajo estándares.
  • Conocer distintas plataformas y SGBD.
  • Aplicar las actividades que involucra cada una de las etapas del ciclo de vida de un proyecto de software.
  • Analizar, diseñar, desarrollar e implementar un proyecto de software.
  • Conocer e identificar modelos de arquitecturas de cómputo.
  • Identificar y aplicar conceptos fundamentales de las telecomunicaciones, para aplicarlo a redes computacionales.
  • Seleccionar, conocer y usar adecuadamente los diferentes sistemas operativos para lograr un uso más eficiente así ́como diferenciar y aplicar las técnicas de manejo de recursos para el diseño, organización, utilización y optimización de los sistemas operativos.
  • Conocer y saber usar técnicas y/o herramientas de administración de los sistemas operativos para la optimización de recursos existentes.
  • Aplicar un lenguaje orientado a objetos para la solución de problemas.
  • Crear y manipula bases de datos utilizando distintos Gestores de Bases de Datos considerando elementos de integridad y seguridad para el tratamiento de la información en distintas plataformas.

Competencias Atributos de Ingeniería
Comprender la importancia de Big Data, así como sus características y arquitectura.   Reconocer la necesidad permanente de conocimiento adicional y tener la habilidad para localizar, evaluar, integrar y aplicar este conocimiento adecuadamente
Diseñar, implementar y manipular bases de datos NoSQL.   Aplicar, analizar y sintetizar procesos de diseño de ingeniería que resulten en proyectos que cumplen las necesidades específicas
Utilizar herramientas para procesar y reducir en paralelo grandes volúmenes de datos, principalmente las proporcionadas por el ecosistema Hadoop.   Desarrollar y conducir una experimentación adecuada; analizar e interpretar datos y utilizar el juicio ingenieril para establecer conclusiones
Utilizar herramientas para analizar y obtener conocimiento significativo que sea relevante para toma de decisiones en un ambiente corporativo.   Desarrollar y conducir una experimentación adecuada; analizar e interpretar datos y utilizar el juicio ingenieril para establecer conclusiones
Entender el proceso de almacenar y recuperar Grandes Datos en la nube.   Reconocer la necesidad permanente de conocimiento adicional y tener la habilidad para localizar, evaluar, integrar y aplicar este conocimiento adecuadamente
Desarrolla un proyecto de aplicación de analítica de Big Data.   Aplicar, analizar y sintetizar procesos de diseño de ingeniería que resulten en proyectos que cumplen las necesidades específicas

Normatividad
  1. Cumplir con todos los trabajos marcados en clases y extra clases.
  2. Los trabajos documentales, programas o tareas de forma extemporánea tendrán una penalización sobre el puntaje asignado.
  3. Participar en el salón de clases cuando se le requiera.
  4. Tener el mínimo de asistencias requerido por la subdirección académica (80%)
  5. Tener un comportamiento de disciplina dentro del salón de clases.
  6. Estar a más tardar 15 min. después de la entrada establecida en su horario, después de lo cual se considera como inasistencia
  7. Cumplir con 100% de las prácticas.

Materiales
  1. Material Syllabus.
  2. USB.
  3. Material adicional, en caso de que el docente lo indique.
  4. Libreta.
  5. Lápiz, goma de borrar y lapicero.

Bibliografía disponible en el Itescam
Título
Autor
Editorial
Edición/Año
Ejemplares

Parámetros de Examen
PARCIAL 1 De la actividad 1.1.1 a la actividad 3.1.4
PARCIAL 2 De la actividad 4.1.1 a la actividad 6.1.3

Contenido (Unidad / Competencia / Actividad / Material de Aprendizaje)
1. Introducción a Big Data
          1.1. Comprender la importancia de Big Data, así como sus características y arquitectura.
                   1.1.1. Investigar conceptos relacionados al tema en internet, libros y artículos
                           Luis Joyanes Aguilar. Definición y características de Big Data. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 1 Pag 1- 3
                           Manual de Prácticas de Big Data (4072956 bytes)
                          
                   1.1.2. Acceder foros de discusión sobre uso, tendencias y convergencia de la tecnología
                           Luis Joyanes Aguilar. Retos en el procesamiento de Big Data. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 1
                          
                   1.1.3. Identificar los tipos de datos estructurados, no estructurados y semi estructurados, elaborar un mapa mental
                           Luis Joyanes Aguilar. Tipos de Datos. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 1 Pag 3 - 5
                          
                   1.1.4. Investigar plataformas comerciales de Big Data y sus características
                           Luis Joyanes Aguilar. Plataformas Comerciales. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Página 245 Apéndice B
                           Luis Joyanes Aguilar. Plataformas. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 7 Pag 158
                           Luis Joyanes Aguilar. Analítica de Big Data en las organizaciones. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 5 Pag 85- 90
                           Luis Joyanes Aguilar. Arquitectura de los Big Data. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 7 Pag 153 - 154
                           Luis Joyanes Aguilar. Fuentes de Big Data. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 2
                           Luis Joyanes Aguilar. Componentes de un Sistema Big Data. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 7 Página 158-159
                          
2. Bases de datos NoSQL
          2.2. Diseñar, implementar y manipular bases de datos NoSQL.
                   2.2.1. Realizar un cuadro comparativo sobre SQL y NoSQL
                           Luis Joyanes Aguilar. SQL vs NoSQL. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8 Página 185
                           Luis Joyanes Aguilar. Características de Bases de datos NoSQL. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8
                          
                   2.2.2. Investigar los diferentes tipos de NoSQL
                           Luis Joyanes Aguilar. Bases de datos NoSQL Orientadas a documentos. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8 Página 191-193
                           Luis Joyanes Aguilar. Bases de datos NoSQL clave-valor. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8 Página 186-188
                           Luis Joyanes Aguilar. Bases de datos NoSQL orientada a columnas (Big Table). Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8 Página 189-191
                           Luis Joyanes Aguilar. Bases de datos NoSQL orientada a grafos. Big Data. Análisis de Grandes Volúmenes de Datos en Organizaciones Primera Edición, Editorial Alfaomega, México 2013 Capitulo 8 Página 188-189
                          
                   2.2.3. Desarrollo de consultas a bases de datos NoSQL
                           Lenguajes para el acceso a bases de datos NoSQL (399959 bytes)
                          
3. Integración y Procesamiento de Datos Distribuidos y en Paralelo
          3.1. Utilizar herramientas para procesar y reducir en paralelo grandes volúmenes de datos, principalmente las proporcionadas por el ecosistema Hadoop.
                   3.1.1. Instalar las herramientas de desarrollo
                          
                   3.1.2. Investigar los temas en internet, libros y manuales
                          
                   3.1.3. Desarrollar pequeñas aplicaciones para la automatización de procesamiento y reducción de datos
                          
                   3.1.4. Revisar avance en el desarrollo del proyecto final integrador
                          
4. Analítica de Big Data
          4.1. Utilizar herramientas para analizar y obtener conocimiento significativo que sea relevante para toma de decisiones en un ambiente corporativo.
                   4.1.1. Instalar las herramientas de desarrollo
                          
                   4.1.2. Investigación bibliográfica e internet de los temas de la unidad
                           Ciencia de Datos (494765 bytes)
                           Minería de Datos (433350 bytes)
                           Minería de Datos Guía (2274038 bytes)
                          
                   4.1.3. Realizar prácticas que utilicen herramientas actuales para analítica de datos
                          
                   4.1.4. Instalación y uso de software herramientas de analítica de datos
                          
                   4.1.5. Desarrollar prácticas que implementen la analítica de Big Data, generando reporte de resultados
                          
5. Big Data en la Nube
          5.1. Entender el proceso de almacenar y recuperar Grandes Datos en la nube.
                   5.1.1. Investigar los temas en internet, libros, artículos, tesis o manuales
                          
                   5.1.2. Realizar una tabla comparativa de los diferentes proveedores de Big Data en la nube
                          
                   5.1.3. Utilizar herramientas para almacenar y recuperar datos en la nube
                          
6. Proyecto de aplicación
          6.1. Desarrolla un proyecto de aplicación de analítica de Big Data.
                   6.1.1. Definir el proyecto de aplicación a realizar
                          
                   6.1.2. Desarrollar el proyecto
                          
                   6.1.3. Presentar el proyecto final
                          

Prácticas de Laboratorio (20232024P)
Fecha
Hora
Grupo
Aula
Práctica
Descripción

Cronogramas (20232024P)
Grupo Actividad Fecha Carrera

Temas para Segunda Reevaluación