Saltar a contenido

Analítica de datos mediante Spark

Resultados de aprendizaje

  • RA5074.1 Aplica técnicas de análisis de datos que integran, procesan y analizan la información, adaptando e implementando sistemas que las utilicen.
  • RA5074.3 Gestiona y almacena datos facilitando la búsqueda de respuestas en grandes conjuntos de datos.
  • RA5075.1 Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
  • RA5075.2 Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.
  • RA5075.3 Genera mecanismos de integridad de los datos, comprobando su mantenimiento en los sistemas de ficheros distribuidos y valorando la sobrecarga que conlleva en el tratamiento de los datos.

Planificación (28h)

Sesión Fecha Duración (h)
56.- Spark Miércoles 11 Ene 1p + 1o
62.- Spark RDD Miércoles 11 Ene
Miércoles 18 Ene
3p + 3o
64.- Spark DataFrames API Lunes 23 Ene 2p + 2o
67.- Agregaciones con DataFrames Miércoles 25 Ene 2p + 2o
69.- Spark JDBC, Spark Catalog y Delta Lake Lunes 30 Ene 2p + 2o
105.- Spark Streaming I Lunes 27 Mar 2p + 2o
106.- Spark Streaming II Miércoles 29 Mar 2p + 2o