Analisar e preparar dados com o Amazon SageMaker Data Wrangler e o Amazon EMR (Português (Brasil)) | Lab - Analyze and Prepare Data with Amazon SageMaker Data Wrangler and Amazon EMR (Portuguese (Brazil))
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Save Big on Coursera Plus. 7,000+ courses at $160 off. Limited Time Only!
Neste laboratório, você aprenderá a visualizar, preparar dados e transformar um conjunto de dados no SageMaker Data Wrangler. Você também usará o S3 e o SageMaker Studio para interagir com o Apache Hive usando o Apache Spark.
Objetivos
- Entender os métodos eficazes de visualização de dados
- Explorar métodos para limpeza e transformação de dados e para processar valores ausentes, valores discrepantes, dados duplicados etc.
- Saber como ingerir e transformar dados no Amazon Sagemaker Data Wrangler
- Experimentar como transformar dados usando o Spark no Amazon EMR
Pré-requisitos
- Navegação básica do Console de Gerenciamento da AWS.
- Compreensão dos conceitos de banco de dados, MySQL e disponibilidade do banco de dados.
Descrição
- Tarefa 1: Importar, visualizar e realizar uma análise preliminar dos dados com o SageMaker Data Wrangler
- Tarefa 2: Analisar e visualizar os dados
- Tarefa 3: Realizar transformações de dados e exportar os conjuntos de dados
- Tarefa 4: Configurar o ambiente
- Tarefa 5: Conectar-se a um cluster do EMR
- Tarefa 6: Explorar e consultar dados do kernel SparkMagic PySpark
Tags
Related Courses
Big Data EssentialsA Cloud Guru Big Data
University of Adelaide via edX Advanced Data Science with IBM
IBM via Coursera Amazon EMR Getting Started (Indonesian)
Amazon Web Services via AWS Skill Builder Analysing Unstructured Data using MongoDB and PySpark
Coursera Project Network via Coursera