Building Batch Data Pipelines on GCP em Português Brasileiro
Offered By: Google Cloud via Coursera
Course Description
Overview
Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
Syllabus
- Introdução
- Neste módulo, vamos apresentar o curso e a programação.
- Introdução à criação de pipelines de dados em lote
- Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
- Como executar o Spark no Dataproc
- Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
- Processamento de dados sem servidor com o Dataflow
- Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.
- Gerenciamento de pipelines de dados com o Cloud Data Fusion e o Cloud Composer
- Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
- Resumo do curso
- Resumo do curso
Taught by
Google Cloud Training
Tags
Related Courses
Interprofessional Healthcare InformaticsUniversity of Minnesota via Coursera Data Science at Scale - Capstone Project
University of Washington via Coursera Implementing ETL with SQL Server Integration Services
Microsoft via edX Introduzione a R
University of Modena and Reggio Emilia via EduOpen Практики работы с данными средствами Power Query и Power Pivot
Saint Petersburg State University via Coursera