Building Batch Data Pipelines on GCP en Español
Offered By: Google Cloud via Coursera
Course Description
Overview
Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de datos sin servidores en Dataflow. Los estudiantes obtienen experiencia práctica en la compilación de componentes de canalizaciones de datos en Google Cloud con Qwiklabs.
Syllabus
- Introducción
- En este módulo, presentamos el curso y el temario
- Module 1: Introducción a la compilación de canalizaciones de datos por lotes
- En este módulo, se revisan los diferentes métodos de carga de datos: EL, ELT y ETL, y cuándo corresponde usarlos
- Module 2: Ejecución de Spark en Dataproc
- En este módulo, se muestra cómo ejecutar Hadoop en Dataproc, usar Cloud Storage y optimizar tus trabajos de Dataproc.
- Module 3: Procesamiento de datos sin servidores con Dataflow
- En este módulo, se aborda el uso de Dataflow para compilar tus canalizaciones de procesamiento de datos
- Module 4: Administra canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- En este módulo, se muestra como administrar canalizaciones de datos con Cloud Data Fusion y Cloud Composer
- Module 5: Resumen del curso
- Resumen del curso
Taught by
Google Cloud Training
Tags
Related Courses
Serverless Data Analysis with Google BigQuery and Cloud Dataflow en FrançaisGoogle Cloud via Coursera Feature Engineering 日本語版
Google Cloud via Coursera Feature Engineering en Français
Google Cloud via Coursera Industrial IoT on Google Cloud
Google Cloud via Coursera Serverless Data Analysis with Google BigQuery and Cloud Dataflow
Google Cloud via Coursera