Saltar a contenido

Inteligencia Artificial y Big Data

Apuntes sin actualizar

Estos apuntes pertenecen al curso 21/22 y, por lo tanto, ya no se actualizan.

Puedes acceder a la última versión en https://aitor-medrano.github.io/iabd/.

Apuntes realizados para el curso de especialista de Inteligencia Artificial y Big Data impartido en el IES Severo Ochoa de Elche. El curriculum viene fijado por el Real Decreto 279/2021.

En este sitio web podrás consultar los apuntes y ejercicios trabajados durante el curso.

Despliega el menú de la izquierda para consultar los materiales.

Bloque Cloud Computing y Arquitecturas Big Data

Resultados de aprendizaje

  1. Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
  2. Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.

Planificación

Sesión Fecha Duración (h)
1.- Cloud Computing Lunes 15 Nov 1p + 2o
2.- Amazon Web Services Lunes 22 Nov 1p + 2o
3.- Computación en la nube Lunes 29 Nov 1p + 2o
4.- Almacenamiento en la nube Lunes 13 Dic 1p + 2o
5.- Datos en la nube Lunes 10 Ene 1p + 2o
6.- Arquitecturas Big Data Lunes 17 Ene 1p + 2o

Bloque Ingesta de Datos

Resultados de aprendizaje

Módulo Sistemas de Big Data:

  1. Aplica técnicas de análisis de datos que integran, procesan y analizan la información, adaptando e implementando sistemas que las utilicen.

Módulo de Big Data Aplicado:

  1. Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
  2. Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.
  3. Genera mecanismos de integridad de los datos, comprobando su mantenimiento en los sistemas de ficheros distribuidos y valorando la sobrecarga que conlleva en el tratamiento de los datos.
  4. Valida las técnicas de Big Data para transformar una gran cantidad de datos en información significativa, facilitando la toma de decisiones de negocios

Planificación

Sesión Fecha Duración (h)
1.- Ingesta de datos. ETL Lunes 24 Ene 1p + 2o
2.- Pentaho Data Integration Lunes 31 Ene 1p + 2o
3.- Nifi Lunes 28 Feb 1p + 2o
4.- Nifi Avanzado Lunes 7 Mar 1p + 2o
5.- Ingesta en AWS mediante Python Lunes 7 Feb 1p + 2o

Bloque Big Data Aplicado

Resultados de aprendizaje

Módulo de Big Data Aplicado:

  1. Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
  2. Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.
  3. Genera mecanismos de integridad de los datos, comprobando su mantenimiento en los sistemas de ficheros distribuidos y valorando la sobrecarga que conlleva en el tratamiento de los datos.
  4. Realiza el seguimiento de la monitorización de un sistema, asegurando la fiabilidad y estabilidad de los servicios que se proveen.

Planificación

Sesión Fecha Duración (h)
1.- Hadoop Miércoles 9 Feb 2p + 3o
2.- HDFS Miércoles 2 Mar 2p + 3o
3.- Sqoop y Flume Miércoles 9 Mar 2p + 3o
4.- Hive Miércoles 16 Mar 2p + 3o
5.- Kafka Miércoles 23 Mar 2p + 3o

Bloque Analítica de Datos

Resultados de aprendizaje

Módulo Sistemas de Big Data:

  1. Aplica técnicas de análisis de datos que integran, procesan y analizan la información, adaptando e implementando sistemas que las utilicen.
  2. Gestiona y almacena datos facilitando la búsqueda de respuestas en grandes conjuntos de datos.

Módulo de Big Data Aplicado:

  1. Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
  2. Valida las técnicas de Big Data para transformar una gran cantidad de datos en información significativa, facilitando la toma de decisiones de negocios

Planificación

Sesión Fecha Duración (h)
1.- Spark. RDD Miércoles 30 Mar / Miércoles 6 Abr 4p + 6o
2.- Spark DataFrames / SQL Miércoles 27 Abr 4p + 6o
3.- Spark Streaming Miércoles 11 May / Miércoles 18 May 4p + 6o