Building Batch Data Pipelines on GCP en Français
Offered By: Google Cloud via Coursera
Course Description
Overview
Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours indique quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il présente également plusieurs technologies Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.
Syllabus
- Introduction
- Dans ce module, nous vous présentons le cours et son déroulement.
- Présentation de la création de pipelines de données par lot
- Ce module passe en revue différentes méthodes de chargement de données (EL, ELT et ETL) et vous indique quand les utiliser.
- Exécuter Spark sur Dataproc
- Ce module vous apprend à exécuter Hadoop sur Dataproc, à exploiter Cloud Storage et à optimiser vos jobs Dataproc.
- Traitement des données sans serveur avec Dataflow
- Ce module vous explique comment utiliser Dataflow pour créer vos pipelines de traitement de données.
- Gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer
- Ce module vous montre comment gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
- Résumé du cours
- Résumé du cours
- Ressources du cours
- Liens PDF vers tous les modules
Taught by
Google Cloud Training
Tags
Related Courses
Building Batch Data Pipelines on GCP auf DeutschGoogle Cloud via Coursera Mastering Azure Data Factory: From Basics to Advanced Level
Udemy Data Science de A a Z - Extraçao e Exibição dos Dados
Udemy Building Batch Data Processing Solutions in Microsoft Azure
Pluralsight Implementing a Data Warehouse SQL Server 2019
LinkedIn Learning