Analítica de datos mediante Spark¶
Resultados de aprendizaje¶
- RA5074.1 Aplica técnicas de análisis de datos que integran, procesan y analizan la información, adaptando e implementando sistemas que las utilicen.
- RA5074.3 Gestiona y almacena datos facilitando la búsqueda de respuestas en grandes conjuntos de datos.
- RA5075.1 Gestiona soluciones a problemas propuestos, utilizando sistemas de almacenamiento y herramientas asociadas al centro de datos.
- RA5075.2 Gestiona sistemas de almacenamiento y el amplio ecosistema alrededor de ellos facilitando el procesamiento de grandes cantidades de datos sin fallos y de forma rápida.
- RA5075.3 Genera mecanismos de integridad de los datos, comprobando su mantenimiento en los sistemas de ficheros distribuidos y valorando la sobrecarga que conlleva en el tratamiento de los datos.
Planificación (28h)¶
Sesión | Fecha | Duración (h) |
---|---|---|
56.- Spark | Miércoles 11 Ene | 1p + 1o |
62.- Spark RDD | Miércoles 11 Ene Miércoles 18 Ene |
3p + 3o |
64.- Spark DataFrames API | Lunes 23 Ene | 2p + 2o |
67.- Agregaciones con DataFrames | Miércoles 25 Ene | 2p + 2o |
69.- Spark JDBC, Spark Catalog y Delta Lake | Lunes 30 Ene | 2p + 2o |
105.- Spark Streaming I | Lunes 27 Mar | 2p + 2o |
106.- Spark Streaming II | Miércoles 29 Mar | 2p + 2o |