Building Batch Data Pipelines on GCP em Português Brasileiro

Offered By: Google Cloud via Coursera

Course Description

Overview

Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.

Syllabus

Introdução

Neste módulo, vamos apresentar o curso e a programação.

Introdução à criação de pipelines de dados em lote

Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.

Como executar o Spark no Dataproc

Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.

Processamento de dados sem servidor com o Dataflow

Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.

Gerenciamento de pipelines de dados com o Cloud Data Fusion e o Cloud Composer

Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.

Resumo do curso

Resumo do curso

Taught by

Google Cloud Training

Building Batch Data Pipelines on GCP em Português Brasileiro

Tags

Course Description

Overview

Syllabus

Taught by

Tags

Related Courses

Building Batch Data Pipelines on GCP em Português Brasileiro

Tags

Course Description

Overview

Syllabus

Taught by

Tags

Related Courses

Login to Continue