大数据分析师(第一期)
Offered By: XuetangX
Course Description
Overview
课程描述
14周掌握Python语言·数据分析工作流·行业实训
Syllabus
课程章节
Python基础(赠送内容_先修_木木老师)
关于计算机,你必须了解的几个小知识
学习Python的准备工作:软件下载与环境配置
为什么要选择Python:初识Python
让计算机输出你想要说的话:输出与输入、变量
1.0 == 1.0吗:数据类型与转换
让计算机去判断:条件语句
记录同学们的名字信息:列表
建立名字和成绩信息的对应关系:字典
认识其他数据结构:元祖、集合
让计算机重复执行:循环语句
实现单一功能的代码块:函数
程序“叒”报错了o(╥﹏╥)o:异常处理与报错解决办法
程序设计里的对象:面向对象的程序设计
将信息录入到文件里去:文件、CSV模块
数据获取(网络爬虫)_杨亚老师
HTML基础
学习爬虫,你不得不了解的json
Requests
分布式爬虫:Scrapy
国内外的一些开放数据源
数据清洗_杨亚老师
缺失值处理
异常值处理
数据归一化
数据连续属性离散化
数据计算和分析_杨亚老师
重要的工具包:numpy
重要的工具包:pandas
数据特征分析
数学建模
scipy模块
数据可视化_杨亚老师
初识matplotlib包
直方图
线图
散点图
饼图
做一个3D图表
Pyecharts:基于地图的数据可视化
专题直播:词云?大数据风?如何利用第三方库做图表
行业实训01:抓取网站房源信息并进行可视化分析
大数据平台_杨亚老师
初识pyspark
大数据平台环境配置:安装pyspark、hadoop
pyspark编程
Pyspark的常用公共类
RDD的基本操作
行业实训02:利用pyspark进行网站海量日志分析
初探自然语言处理_杨亚老师
Jieba
Wordcloud
行业实训03:聊天机器人
专题直播:(选题由学员发起)
机器学习_杨亚老师
初识机器学习
监督学习与非监督学习
回归与分类
数据预处理与特征工程
模型评估
Tensorflow
Keras
行业实训04:手写数字识别
专题直播:(选题由学员发起)
行业实训强化第一周
行业实训05:电力系统用电量预测(能源)
行业实训06:电影广告精准营销(电子商务)
行业实训07:金融风控评分卡模型应用(金融)
行业实训强化第二周
行业实训08:基于社交网络评论的民众情感分析预测(社会科学)
行业实训09:雾霾环境大数据分析(环境科学)
行业实训10:奔驰快速检测项目(工业制造)
展开
Taught by
杨亚 and 木木
Related Courses
Computational Investing, Part IGeorgia Institute of Technology via Coursera Введение в машинное обучение
Higher School of Economics via Coursera Математика и Python для анализа данных
Moscow Institute of Physics and Technology via Coursera Introduction to Python for Data Science
Microsoft via edX Using Python for Research
Harvard University via edX