大数据分析师(第一期)
Offered By: XuetangX
Course Description
Overview
课程描述
14周掌握Python语言·数据分析工作流·行业实训
Syllabus
课程章节
Python基础(赠送内容_先修_木木老师)
关于计算机,你必须了解的几个小知识
学习Python的准备工作:软件下载与环境配置
为什么要选择Python:初识Python
让计算机输出你想要说的话:输出与输入、变量
1.0 == 1.0吗:数据类型与转换
让计算机去判断:条件语句
记录同学们的名字信息:列表
建立名字和成绩信息的对应关系:字典
认识其他数据结构:元祖、集合
让计算机重复执行:循环语句
实现单一功能的代码块:函数
程序“叒”报错了o(╥﹏╥)o:异常处理与报错解决办法
程序设计里的对象:面向对象的程序设计
将信息录入到文件里去:文件、CSV模块
数据获取(网络爬虫)_杨亚老师
HTML基础
学习爬虫,你不得不了解的json
Requests
分布式爬虫:Scrapy
国内外的一些开放数据源
数据清洗_杨亚老师
缺失值处理
异常值处理
数据归一化
数据连续属性离散化
数据计算和分析_杨亚老师
重要的工具包:numpy
重要的工具包:pandas
数据特征分析
数学建模
scipy模块
数据可视化_杨亚老师
初识matplotlib包
直方图
线图
散点图
饼图
做一个3D图表
Pyecharts:基于地图的数据可视化
专题直播:词云?大数据风?如何利用第三方库做图表
行业实训01:抓取网站房源信息并进行可视化分析
大数据平台_杨亚老师
初识pyspark
大数据平台环境配置:安装pyspark、hadoop
pyspark编程
Pyspark的常用公共类
RDD的基本操作
行业实训02:利用pyspark进行网站海量日志分析
初探自然语言处理_杨亚老师
Jieba
Wordcloud
行业实训03:聊天机器人
专题直播:(选题由学员发起)
机器学习_杨亚老师
初识机器学习
监督学习与非监督学习
回归与分类
数据预处理与特征工程
模型评估
Tensorflow
Keras
行业实训04:手写数字识别
专题直播:(选题由学员发起)
行业实训强化第一周
行业实训05:电力系统用电量预测(能源)
行业实训06:电影广告精准营销(电子商务)
行业实训07:金融风控评分卡模型应用(金融)
行业实训强化第二周
行业实训08:基于社交网络评论的民众情感分析预测(社会科学)
行业实训09:雾霾环境大数据分析(环境科学)
行业实训10:奔驰快速检测项目(工业制造)
展开
Taught by
杨亚 and 木木
Related Courses
Artificial Intelligence for RoboticsStanford University via Udacity Intro to Computer Science
University of Virginia via Udacity Design of Computer Programs
Stanford University via Udacity Web Development
Udacity Programming Languages
University of Virginia via Udacity