Tags¶
Los tags más empleados en los apuntes son:
AWS¶
- AWS Athena
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Gestión de datos documentales mediante DynamoDB en AWS.
- Servicios de computación en la nube mediante EC2.
- AWS Elastic Map Reduce
- AWS Glue
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Arquitecturas cloud
Arquitecturas¶
Audio¶
BDA RA1¶
- AWS Glue
- Arquitecturas Big Data - Kappa y Lambda.
- Introducción al Big Data
- Ingesta de datos. Pipeline de datos y ETL.
- Formatos de datos en Big Data
- Pentaho Data Integration. ETL mediante Spoon.
- Framework de agregación en MongoDB
- Modelado de datos NoSQL
- MongoDB
- Agregaciones, joins y uso de funciones con Spark DataFrames / SQL
- Analítica de datos con Spark DataFrames / SQL
BDA RA2¶
- Gestión de datos documentales mediante DynamoDB en AWS.
- Servicios de computación en la nube mediante EC2.
- AWS Elastic Map Reduce
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Hadoop y su ecosistema.
- MongoDB
- Almacenamiento de datos. Sistemas NoSQL.
- Replicación y particionado (sharding) en MongoDB.
- Analítica de datos con Spark Streaming
BDA RA3¶
BDA RA4¶
- Hadoop y su ecosistema.
- HDFS, acceso y gestión desde el terminal y Python.
- Rendimiento en MongoDB.
- Analítica de datos con Spark
- Analítica de datos con Spark Streaming
Cloud¶
- AWS Athena
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Gestión de datos documentales mediante DynamoDB en AWS.
- Servicios de computación en la nube mediante EC2.
- AWS Elastic Map Reduce
- AWS Glue
- Funciones serverless mediante AWS Lambda.
- Gestión de datos relacionales con RDS en AWS.
- Almacenamiento en la nube AWS. EBS, S3 y EFS.
- Arquitecturas cloud
- MongoDB
Data Engineering¶
- Introducción al Big Data
- Ingeniería de datos
- Ingesta de datos. Pipeline de datos y ETL.
- Faker - generando datos sintéticos
- Formatos de datos en Big Data
- Pentaho Data Integration. ETL mediante Spoon.
Databricks¶
Hadoop¶
- Flume. Herramienta de ingesta en streaming de datos en y desde Hadoop.
- Hadoop y su ecosistema.
- HDFS, acceso y gestión desde el terminal y Python.
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
- Sqoop. Herramienta de ingesta de datos batch en y desde Hadoop.
Hive¶
- AWS Athena
- AWS Elastic Map Reduce
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
HuggingFace¶
Kafka¶
MongoDB¶
- Framework de agregación en MongoDB
- Modelado de datos NoSQL
- MongoDB
- PyMongo
- Rendimiento en MongoDB.
- Replicación y particionado (sharding) en MongoDB.
- Series temporales con MongoDB
NoSQL¶
- Gestión de datos documentales mediante DynamoDB en AWS.
- Modelado de datos NoSQL
- MongoDB
- Almacenamiento de datos. Sistemas NoSQL.
PIA RA1¶
PIA RA3¶
- AWS Athena
- Amazon Web Services. Servicios, redes, seguridad. AWS CLI y Cloudshell.
- Cloud computing / computación en la nube.
- Ingeniería de datos
- Analítica de datos con Spark
SAA RA2¶
SBD RA1¶
- Spark JDBC y Spark Catalog.
- Delta Lake.
- Spark Streaming Avanzado
- Spark RDDs
- Analítica de datos con Spark Streaming
SBD RA3¶
- Flume. Herramienta de ingesta en streaming de datos en y desde Hadoop.
- Apache Hive. Acceso a HDFS con un interfaz similar a tablas relacionales mediante SQL.
- Apache Hive II. Particionado y buckets de datos. De Flume a Hive.
- Sqoop. Herramienta de ingesta de datos batch en y desde Hadoop.
Spark¶
- Agregaciones, joins y uso de funciones con Spark DataFrames / SQL
- Spark JDBC y Spark Catalog.
- Analítica de datos con Spark DataFrames / SQL
- Delta Lake.
- Spark Streaming Avanzado
- Spark ML
- Spark RDDs
- Analítica de datos con Spark
- Analítica de datos con Spark Streaming