AWS ML Engineer Associate 1.3 Validate Data and Prepare for Modeling (Simplified Chinese)
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Save Big on Coursera Plus. 7,000+ courses at $160 off. Limited Time Only!
本课程内容涉及机器学习 (ML) 生命周期中数据准备阶段的部分内容。在本课程中,您将学习数据验证的各种策略,涵盖偏差缓解及数据安全保障等领域的策略。此外,您还将查看一些可以帮助您进行数据验证的 Amazon Web Services (AWS) 服务,包括 AWS Glue DataBrew 和 AWS Glue 数据质量。您还将了解数据准备与配置的最后步骤,例如数据集分割、洗牌、扩增以及配置以加载到模型训练资源中。
- 课程级别:300
- 时长:45 分钟
注意:本课程具有本地化的注释/字幕。 旁白保留英语。要显示字幕,请单击播放器右下角的 CC 按钮。
课程内容
- 在线资料
- 演示
- 专业知识考核问题
- 课程评估
课程目标
- 解释确保数据完整性的重要性。
- 识别基础的预训练偏差指标。
- 描述解决数据集中类别不平衡的策略。
- 描述用于验证数据质量的关键 AWS 服务。
- 使用 AWS 工具识别和减少数据中偏差的来源。
- 描述使用 AWS 服务加密数据的技术。
- 识别合规性要求的影响。
- 描述分割、洗牌和增强数据集的价值和技术。
- 识别模型训练中使用的数据格式。
- 识别用于模型训练数据配置的 AWS 工具和服务。
- 描述如何配置数据以将其加载到模型训练资源中。
培训对象
- 云架构师
- 机器学习工程师
推荐技能
- 至少具备 1 年使用 Amazon SageMaker 及其他 AWS 服务从事机器学习工程工作的经验。
- 至少具备 1 年担任后端软件开发人员、DevOps 开发人员、数据工程师或数据科学家等相关职位的经验。
- 对 Python 等编程语言有基本的了解。
- AWS ML Engineer Associate 学习计划的前几门课程。
课程大纲
- 第 1 部分:简介
- 第 1 课:如何学习本课程
- 第 2 课:课程概述
- 第 3 课:数据验证基础知识
- 第 2 部分:验证数据
- 第 4 课:解决类别不平衡
- 第 5 课:用于数据验证和偏差缓解的 AWS 工具和服务
- 第 6 课:使用 Amazon SageMaker Clarify 识别和缓解偏差
- 第 7 课:数据安全性与合规性
- 第 3 部分:数据准备的最后步骤
- 第 8 课:数据集分割、洗牌和扩增
- 第 9 课:为模型训练配置数据
- 第 4 部分:总结
- 第 10 课:课程总结
- 第 11 课:测验
- 第 12 课:联系我们
Tags
Related Courses
Accounting Data AnalyticsUniversity of Illinois at Urbana-Champaign via Coursera Data Preparation (Import and Cleaning) for Python
A Cloud Guru DP-100 Part 1 - Preparation
A Cloud Guru Introduction to MLOps on Azure
A Cloud Guru Продвинутые методы машинного обучения
Higher School of Economics via Coursera