Building Batch Data Pipelines on GCP em Português Brasileiro
Offered By: Google Cloud via Coursera
Course Description
Overview
Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
Syllabus
- Introdução
- Neste módulo, vamos apresentar o curso e a programação.
- Introdução à criação de pipelines de dados em lote
- Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
- Como executar o Spark no Dataproc
- Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
- Processamento de dados sem servidor com o Dataflow
- Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.
- Gerenciamento de pipelines de dados com o Cloud Data Fusion e o Cloud Composer
- Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
- Resumo do curso
- Resumo do curso
Taught by
Google Cloud Training
Tags
Related Courses
Hands-On with DataflowA Cloud Guru Building Batch Data Pipelines on Google Cloud
Google Cloud via Coursera Building Batch Data Pipelines on GCP en Español
Google Cloud via Coursera Building Batch Data Pipelines on GCP en Français
Google Cloud via Coursera Building Batch Data Pipelines on GCP 日本語版
Google Cloud via Coursera