百道网
 您现在的位置:Fun书 > 数据分析与大数据实践
数据分析与大数据实践


数据分析与大数据实践

作  者:白玥 主编

出 版 社:华东师范大学出版社

出版时间:2020年05月

定  价:56.00

I S B N :9787576000894

所属分类: 教育学习  >  教材  >  研究生/本科/专科教材    

标  签:

[查看微博评论]

分享到:

TOP内容简介

       该书和配套的《数据分析与大数据实践实验指导》一起,独树一帜地设计了主要内容,用轻量、便捷的方式,让读者学习和探索大数据的存储、加工、分析、挖掘、预测和展示的完整过程。
  《数据分析与大数据实践》第一章介绍了大数据的基本概念,同时在尽量回避复杂公式的基础上,介绍了与大数据密切相关的信息论和统计学中的重要的概念,包括信息的度量和信息熵、信息的编码、信息的有效性和等价性、信息的冗余和压缩,以及信息的相关性、贝叶斯公式等。
  第二章介绍用网络爬虫获取网络数据的方法。
  第三章介绍大数据加工的基本流程:数据清洗、数据转换、数据脱敏、数据集成、数据集合和数据归约。
  第四章介绍用Excel和Tableau进行数据处理、时间序列分析、回归分析和聚类分析等技术。
  第五章介绍利用Excel、Power BI和Tableau等数据分析和可视化领域中处于领头羊位置的三大软件进行数据分析和可视化的方法。
  第六章介绍了数据安全的概念和发布数据可视化结果的方案。
  第七章,我们特邀了富有教学和工程经验的Tableau公司的高级顾问撰写了精彩的数据分析和可视化综合实战案例。
  该书适合高等学校文、史、哲、法、教等文科专业,以及金融、统计、管理类商科专业学生,作为计算机应用课程的教材使用;也可以供各类社会计算机应用人员由浅入深、逐层递进地掌握数据分析和大数据应用的高级技巧;也可供准备参加数据分析与管理类计算机等级考试人员作为参考书使用。

TOP目录

第1章 大数据与信息论简介
本章概要
学习目标
1.1 大数据基本概念
1.1.1 大数据的定义
1.1.2 大数据的特点
1.1.3 大数据的研究目标
1.2 大数据支撑技术简介
1.2.1 统计学简介
1.2.2 机器学习简介
1.2.3 数据可视化简介
1.2.4 大数据分析与计算工具
1.2.5 数据资源简介
1.3 信息论简介
1.3.1 信息的度量和信息熵
1.3.2 信息的编码
1.3.3 信息的有效性和哈夫曼编码
1.3.4 信息的冗余和压缩
1.3.5 信息的相关性
1.3.6 贝叶斯公式与因果关系
1.4 综合练习
1.4.1 选择题
1.4.2 填空题
1.4.3 综合实践

第2章 数据获取
本章概要
学习目标
2.1 数据获取概述
2.1.1 数据获取的来源
2.1.2 数据获取的方法
2.1.3 数据源和数据集
2.2 常用数据集的获取
2.2.1 常用的数据集
2.2.2 使用Python的sklearn提供的数据集
2.2.3 使用R语言提供的数据集
2.3 网页信息爬取
2.3.1 网络爬虫概述
2.3.2 HTTP基本原理
2.3.3 网页的基本结构
2.3.4 Python相关库
2.3.5 使用requests和re爬取猫眼电影TOP 100榜单
2.3.6 使用requests和bs4爬取豆瓣电影TOP 250榜单
2.4 综合练习
2.4.1 选择题
2.4.2 填空题
2.4.3 简答题
2.4.4 实践题

第3章 数据加工
本章概要
学习目标
3.1 基础知识
3.1.1 数据源文件格式
3.1.2 数据类型
3.1.3 数据预处理
3.2 数据清洗
3.2.1 为什么要数据清洗
3.2.2 数据清洗类型与方法
3.2.3 基于工具的数据清洗
3.3 数据转换
3.3.1 数据转换的目的
3.3.2 数据转换的方法
3.3.3 基于工具的快速转换
3.4 数据脱敏
3.4.1 数据的敏感信息
3.4.2 保护数据的方法
3.4.3 基于工具实现数据脱敏
3.5 数据集成
3.5.1 数据集成的基本类型
3.5.2 数据集成的难点
3.5.3 简单数据集成的实现
3.6 数据归约
……
第4章 数据分析基础
第5章 数据可视化
第6章 数据安全与可视化数据共享
第7章 数据分析与可视化综合实践

TOP书摘

TOP 其它信息

页  数:321

开  本:16开

正文语种:中文

加载页面用时:40.9871