Leveraging Unstructured Data with Cloud Dataproc on Google Cloud Platform en Français
Offered By: Google Cloud via Coursera
Course Description
Overview
Ce cours intensif, d'une durée d'une semaine, se base sur de précédents cours de la spécialisation Data Engineering on Google Cloud Platform. À travers un ensemble de conférences vidéo, de démonstrations et d'ateliers pratiques, vous allez apprendre à créer et à gérer des clusters informatiques pour exécuter des tâches Hadoop, Spark, Pig et Hive sur Google Cloud Platform.Vous apprendrez également à accéder à diverses options de stockage dans le cloud à partir de leurs clusters de calcul et à intégrer les fonctionnalités de machine learning de Google à leurs programmes d'analyse.
Lors des ateliers pratiques, vous allez créer et gérer des clusters Dataproc via la console Web et la CLI, et vous utiliserez les clusters pour exécuter des tâches Spark et Pig. Vous créerez ensuite des notebooks iPython qui s'intègrent à BigQuery et à l'espace de stockage, et vous utiliserez Spark. Enfin, vous intégrerez les API de machine learning à votre analyse de données.
Prérequis
• Avoir suivi la formation Google Cloud Platform Big Data & Machine Learning Fundamentals (ou disposer d'une expérience équivalente)
• Disposer de quelques notions de Python
Lors des ateliers pratiques, vous allez créer et gérer des clusters Dataproc via la console Web et la CLI, et vous utiliserez les clusters pour exécuter des tâches Spark et Pig. Vous créerez ensuite des notebooks iPython qui s'intègrent à BigQuery et à l'espace de stockage, et vous utiliserez Spark. Enfin, vous intégrerez les API de machine learning à votre analyse de données.
Prérequis
• Avoir suivi la formation Google Cloud Platform Big Data & Machine Learning Fundamentals (ou disposer d'une expérience équivalente)
• Disposer de quelques notions de Python
Syllabus
Module 1 : Présentation de Cloud Dataproc
Module 2 : Exécuter des tâches Dataproc
Module 3 : Tirer parti de GCP
Module 4 : Analyser des données non structurées
Module 2 : Exécuter des tâches Dataproc
Module 3 : Tirer parti de GCP
Module 4 : Analyser des données non structurées
Taught by
Google Cloud Training
Tags
Related Courses
Web Intelligence and Big DataIndian Institute of Technology Delhi via Coursera Big Data for Better Performance
Open2Study Big Data and Education
Columbia University via edX Big Data Analytics in Healthcare
Georgia Institute of Technology via Udacity Data Mining with Weka
University of Waikato via Independent