Tags¶
Los tags más empleados en los apuntes son:
AWS¶
- AWS Athena
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Gestión de datos documentales mediante DynamoDB en AWS.
- Servicios de computación en la nube mediante EC2.
- AWS Elastic Map Reduce
- AWS Glue
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Arquitecturas cloud
Apache Nifi¶
- Apache Kafka Avanzado.
- Apache Nifi. Flujos de datos y ETL/ELT en Streaming.
- Apache Nifi Avanzado. Grupos, funnels y plantillas.
Arquitecturas¶
BDA RA1¶
- AWS Glue
- Apache Kafka. Elementos y ejemplos con Python.
- Apache Kafka Avanzado.
- Arquitecturas Big Data - Kappa y Lambda.
- Introducción al Big Data
- Ingesta de datos. Pipeline de datos y ETL.
- Formatos de datos en Big Data
- Pentaho Data Integration. ETL mediante Spoon.
- Framework de agregación en MongoDB
- Modelado de datos NoSQL
- MongoDB
- Agregaciones, joins y uso de funciones con Spark DataFrames / SQL
- Analítica de datos con Spark DataFrames / SQL
BDA RA2¶
- AWS Athena
- Gestión de datos documentales mediante DynamoDB en AWS.
- AWS Elastic Map Reduce
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Hadoop y su ecosistema.
- MongoDB
- Almacenamiento de datos. Sistemas NoSQL.
- Replicación y particionado (sharding) en MongoDB.
- Analítica de datos con Spark Streaming
BDA RA3¶
BDA RA4¶
- Hadoop y su ecosistema.
- HDFS, acceso y gestión desde el terminal y Python.
- Rendimiento en MongoDB.
- Analítica de datos con Spark
- Analítica de datos con Spark Streaming
Cloud¶
- AWS Athena
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Gestión de datos documentales mediante DynamoDB en AWS.
- Servicios de computación en la nube mediante EC2.
- AWS Elastic Map Reduce
- AWS Glue
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Arquitecturas cloud
- MongoDB
Data Engineering¶
- Introducción al Big Data
- Ingeniería de datos
- Ingesta de datos. Pipeline de datos y ETL.
- Faker - generando datos sintéticos
- Formatos de datos en Big Data
- Pentaho Data Integration. ETL mediante Spoon.
Databricks¶
Hadoop¶
- Flume. Herramienta de ingesta en streaming de datos en y desde Hadoop.
- Hadoop y su ecosistema.
- HDFS, acceso y gestión desde el terminal y Python.
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
- Sqoop. Herramienta de ingesta de datos batch en y desde Hadoop.
Hive¶
- AWS Athena
- AWS Elastic Map Reduce
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
HuggingFace¶
- Tratamiento de audio con Hugging Face
- Tratamiento de audio desde Python
- Cargando datasets en HuggingFace
- Prototipado con Gradio
- Hugging Face
- Aprovechando el conocimiento
Kafka¶
MIA RA1¶
MongoDB¶
- Framework de agregación en MongoDB
- Modelado de datos NoSQL
- MongoDB
- PyMongo
- Rendimiento en MongoDB.
- Replicación y particionado (sharding) en MongoDB.
- Series temporales con MongoDB
NoSQL¶
- Gestión de datos documentales mediante DynamoDB en AWS.
- Modelado de datos NoSQL
- MongoDB
- Almacenamiento de datos. Sistemas NoSQL.
PIA RA3¶
- Tratamiento de audio con Hugging Face
- Tratamiento de audio desde Python
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Servicios de computación en la nube mediante EC2.
- Ingeniería de datos
- Prototipado con Gradio
- Hugging Face
- Analítica de datos con Spark
SBD RA1¶
- Spark JDBC y Spark Catalog.
- Delta Lake.
- Spark Streaming Avanzado
- Spark RDDs
- Analítica de datos con Spark Streaming
SBD RA3¶
- Flume. Herramienta de ingesta en streaming de datos en y desde Hadoop.
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
- Sqoop. Herramienta de ingesta de datos batch en y desde Hadoop.
Spark¶
- Agregaciones, joins y uso de funciones con Spark DataFrames / SQL
- Spark JDBC y Spark Catalog.
- Analítica de datos con Spark DataFrames / SQL
- Delta Lake.
- Spark Streaming Avanzado
- Spark RDDs
- Analítica de datos con Spark
- Analítica de datos con Spark Streaming