大数据分析师(第一期)

Go to class
Write Review

Free Online Course: 大数据分析师(第一期) provided by XuetangX is a comprehensive online course, which lasts for 6-8 hours a week. The course is taught in Chinese and is free of charge. Upon completion of the course, you can receive an e-certificate from XuetangX. 大数据分析师(第一期) is taught by 杨亚 and 木木.

Overview
  • 课程描述

    14周掌握Python语言·数据分析工作流·行业实训

Syllabus
  • 课程章节 Python基础(赠送内容_先修_木木老师) 关于计算机,你必须了解的几个小知识 学习Python的准备工作:软件下载与环境配置 为什么要选择Python:初识Pytho 让计算机输出你想要说的话:输出与输入、变量 1.0 == 1.0吗:数据类型与转换 让计算机去判断:条件语句 记录同学们的名字信息:列表 建立名字和成绩信息的对应关系:字典 认识其他数据结构:元祖、集合 让计算机重复执行:循环语句 实现单一功能的代码块:函数 程序“叒”报错了o(╥﹏╥)o:异常处理与报错解决办法 程序设计里的对象:面向对象的程序设计 将信息录入到文件里去:文件、CSV模块 数据获取(网络爬虫)_杨亚老师 HTML基础 学习爬虫,你不得不了解的jso Requests 分布式爬虫:Scrapy 国内外的一些开放数据源 数据清洗_杨亚老师 缺失值处理 异常值处理 数据归一化 数据连续属性离散化 数据计算和分析_杨亚老师 重要的工具包:numpy 重要的工具包:pandas 数据特征分析 数学建模 scipy模块 数据可视化_杨亚老师 初识matplotlib包 直方图 线图 散点图 饼图 做一个3D图表 Pyecharts:基于地图的数据可视化 专题直播:词云?大数据风?如何利用第三方库做图表 行业实训01:抓取网站房源信息并进行可视化分析 大数据平台_杨亚老师 初识pyspark 大数据平台环境配置:安装pyspark、hadoop pyspark编程 Pyspark的常用公共类 RDD的基本操作 行业实训02:利用pyspark进行网站海量日志分析 初探自然语言处理_杨亚老师 Jieba Wordcloud 行业实训03:聊天机器人 专题直播:(选题由学员发起) 机器学习_杨亚老师 初识机器学习 监督学习与非监督学习 回归与分类 数据预处理与特征工程 模型评估 Tensorflow Keras 行业实训04:手写数字识别 专题直播:(选题由学员发起) 行业实训强化第一周 行业实训05:电力系统用电量预测(能源) 行业实训06:电影广告精准营销(电子商务) 行业实训07:金融风控评分卡模型应用(金融) 行业实训强化第二周 行业实训08:基于社交网络评论的民众情感分析预测(社会科学) 行业实训09:雾霾环境大数据分析(环境科学) 行业实训10:奔驰快速检测项目(工业制造)   展开