Building Batch Data Pipelines on GCP en Español
Offered By: Google Cloud via Coursera
Course Description
Overview
Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de datos sin servidores en Dataflow. Los estudiantes obtienen experiencia práctica en la compilación de componentes de canalizaciones de datos en Google Cloud con Qwiklabs.
Syllabus
- Introducción
- En este módulo, presentamos el curso y el temario
- Module 1: Introducción a la compilación de canalizaciones de datos por lotes
- En este módulo, se revisan los diferentes métodos de carga de datos: EL, ELT y ETL, y cuándo corresponde usarlos
- Module 2: Ejecución de Spark en Dataproc
- En este módulo, se muestra cómo ejecutar Hadoop en Dataproc, usar Cloud Storage y optimizar tus trabajos de Dataproc.
- Module 3: Procesamiento de datos sin servidores con Dataflow
- En este módulo, se aborda el uso de Dataflow para compilar tus canalizaciones de procesamiento de datos
- Module 4: Administra canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- En este módulo, se muestra como administrar canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- Module 5: Resumen del curso
- Resumen del curso
Taught by
Google Cloud Training
Tags
Related Courses
SAP Business Warehouse powered by SAP HANASAP Learning Relational Database Support for Data Warehouses
University of Colorado System via Coursera Data Warehouse Concepts, Design, and Data Integration
University of Colorado System via Coursera Business Intelligence Concepts, Tools, and Applications
University of Colorado System via Coursera Design and Build a Data Warehouse for Business Intelligence Implementation
University of Colorado System via Coursera