YoVDO

Lab - Analyze and Prepare Data with Amazon SageMaker Data Wrangler and Amazon EMR (Japanese)

Offered By: Amazon Web Services via AWS Skill Builder

Tags

Data Analysis Courses Data Visualization Courses Apache Spark Courses Apache Hive Courses Data Cleaning Courses Amazon EMR Courses Data Transformation Courses

Course Description

Overview

Save Big on Coursera Plus. 7,000+ courses at $160 off. Limited Time Only!

このラボでは、SageMaker Data Wrangler でデータを可視化して準備し、データセットを変換する方法を学習します。また、S3 と SageMaker Studio を使用して Apache Spark で Apache Hive を操作します。

目標

  • データを可視化するための効果的な方法を理解する。
  • データをクリーニングおよび変換する手法と、欠損値、外れ値、重複データなどを処理する方法を確認する。
  • データを Amazon Sagemaker Data Wrangler に取り込んで、変換する方法を学習する。
  • Amazon EMR で Spark を使用してデータを変換する方法を試す。

前提条件

  • AWS マネジメントコンソールの基本的な操作を行うことができる。
  • データベースの概念、MySQL、データベースの可用性について理解している。

概要

  • タスク 1: SageMaker Data Wrangler を使用してデータのインポート、可視化、予備分析を行う
  • タスク 2: データを分析し可視化する
  • タスク 3: データ変換を実行してデータセットをエクスポートする
  • タスク 4: 環境を設定する
  • タスク 5: EMR クラスターに接続する
  • タスク 6: SparkMagic PySpark カーネルでデータを探索し、クエリを実行する

Tags

Related Courses

Social Network Analysis
University of Michigan via Coursera
Intro to Algorithms
Udacity
Data Analysis
Johns Hopkins University via Coursera
Computing for Data Analysis
Johns Hopkins University via Coursera
Health in Numbers: Quantitative Methods in Clinical & Public Health Research
Harvard University via edX