百道网
 您现在的位置:Fun书 > 从0到1——Python数据分析
从0到1——Python数据分析


从0到1——Python数据分析

作  者:莫振杰

出 版 社:人民邮电出版社

出版时间:2022年05月

定  价:89.90

I S B N :9787115585868

所属分类: 专业科技  >  计算机/网络  >  程序设计    

标  签:

[查看微博评论]

分享到:

TOP内容简介

作者根据自己多年的前后端开发经验,站在完全零基础读者的角度,详尽介绍了Pytho数据分析的基础知识,以及大量的开发技巧,全书围绕着“数据分析三剑客(NumPy、Pandas、Matplotlib)”进行细致的介绍。这三款工具的知识点非常多,本书尽量系统细致地介绍最精华的知识点,以便为读者构建一个完善的知识体系,并且为后续的工作打下坚实的基础。 每一章后面的实战题以及练习题,经过精心设计,可以锻炼读者的数据分析实战能力,对于巩固基础以及锻炼技术是非常有帮助的。

TOP作者简介

莫振杰,毕业于暨南大学信科院计算机科学与技术专业,从事前后端开发4年多,开发过绿叶学习网、广州智能工程研究会网站、大量在线应用工具及其他各种类型网站,著有多本编程书且销量过万, 现为绿叶学习网的站长,该网站用于分享其在前后端开发中的一些经验,其制作的前后端开发在线教程在互联网引起广泛关注,每一个教程广受网友称赞与推崇。

TOP目录

目 录
前言 xvii
第 一部分 NumPy篇
第 1章 数据分析概述\t3
1.1 数据分析简介\t3
1.1.1  数据科学是什么?\t3
1.1.2 数据分析是什么?\t4
1.1.3 应该学些什么?\t4
1.2  课程介绍\t6
1.2.1 课程说明\t6
1.2.2 常见问题\t6
1.3 使用 VSCode\t7
1.3.1 安装 VSCode\t7
1.3.2 安装插件\t8
1.3.3 运行代码\t9
第 2章 NumPy基础\t11
2.1 NumPy是什么?\t11
2.2 创建数组\t12
2.2.1 基本方法\t12
2.2.2 随机数组\t18
2.2.3 数组与列表的区别\t21
2.3 数组属性\t22
2.4 元素操作\t24
2.4.1 访问元素\t25
2.4.2 修改元素\t26
2.4.3 添加元素\t26
2.4.4 删除元素\t28
2.4.5 切片\t29
2.5 数组操作\t31
2.5.1 修改形状\t31
2.5.2 修改维度\t33
2.5.3 翻转数组\t34
2.5.4 数组去重\t34
2.5.5 合并数组\t35
2.5.6 分割数组\t37
2.6 各种运算\t39
2.6.1 基本运算\t39
2.6.2 比较运算\t41
2.6.3 标量运算\t42
2.6.4 数学函数\t43
2.6.5 统计函数\t45
2.7 遍历数组\t53
2.8 大小排序\t55
2.9 本章练习\t57
第3章 NumPy进阶\t58
3.1 浅拷贝和深拷贝\t58
3.1.1 浅拷贝\t58
3.1.2 深拷贝\t59
3.2 axis的值\t60
3.3 广播机制\t61
3.3.1 维数不同\t61
3.3.2 维数相同\t63
3.3.3 标量运算\t64
3.4 读写文件\t65
3.4.1 读取文件\t65
3.4.2 写入文件\t66
3.5 矩阵简介\t67
3.5.1 全0矩阵\t68
3.5.2 全1矩阵\t69
3.5.3 单位矩阵\t69
3.5.4 随机矩阵\t70
3.6 本章练习\t71
第二部分 Pandas篇
第4章 Pandas简介\t75
4.1 Pandas是什么?\t75
4.2 Series\t76
4.2.1 创建Series\t76
4.2.2 Series的属性\t78
4.2.3 获取某行的值\t78
4.2.4 深入了解\t79
4.3 DataFrame\t79
4.3.1 创建DataFrame\t79
4.3.2 DataFrame的属性\t83
4.3.3 深入了解\t86
4.4 DataFrame的数据操作\t88
4.4.1 访问数据\t88
4.4.2 修改数据\t95
4.4.3 添加数据\t96
4.4.4 删除数据\t98
4.5 遍历行列\t101
4.5.1 遍历行\t101
4.5.2 遍历列\t102
4.6 深入了解\t103
4.7 本章练习\t105
第5章 获取数据\t107
5.1 数据分析流程\t107
5.2 读写数据简介\t108
5.3 读写JSON\t109
5.3.1 JSON简介\t109
5.3.2 读取JSON\t110
5.3.3 写入JSON\t111
5.4 读写CSV\t113
5.4.1 CSV简介\t113
5.4.2 读取CSV\t114
5.4.3 写入CSV\t116
5.5 读写Excel\t117
5.5.1 Excel简介\t117
5.5.2 读取Excel\t118
5.5.3 写入Excel\t119
5.6 读写HTML\t120
5.7 深入文件读取\t122
5.7.1 分块读取\t122
5.7.2 只读取一部分\t124
5.8 读取数据库\t125
5.8.1 安装MySQL\t125
5.8.2 安装Navicat for MySQL\t129
5.8.3 读取MySQL\t134
5.9 本章练习\t136
第6章 筛选数据\t137
6.1 筛选数据简介\t137
6.2 获取行、列:loc[]、iloc[]和df[]\t138
6.2.1 获取行\t138
6.2.2 获取列\t139
6.3 重新索引:reindex()\t141
6.3.1 语法简介\t141
6.3.2 深入了解\t143
6.4 获取首尾数据:head()和tail()\t145
6.5 随机抽样:sample()\t147
6.6 逻辑比较\t149
6.6.1 语法简介\t149
6.6.2 深入了解\t152
6.7 过滤操作\t155
6.7.1 query()\t155
6.7.2 filter()\t157
6.8 模式匹配\t159
6.9 本章练习\t162
第7章 处理数据\t164
7.1 处理数据简介\t164
7.2 操作行名和列名\t165
7.2.1 设置某一列为行名\t165
7.2.2 重置行名\t166
7.2.3 修改行名和列名\t168
7.3 类型转换\t171
7.3.1 针对DataFrame\t171
7.3.2 针对某一列\t174
7.4 行列转置:T\t175
7.5 大小排序:sort_values()\t176
7.6 数据排名:rank()\t179
7.7 数据替换:replace()\t181
7.8 数据移动:shift()\t183
7.9 数据清洗\t185
7.9.1 缺失值\t186
7.9.2 重复值\t192
7.9.3 异常值\t196
7.10 数据合并\t197
7.10.1 轴向合并:concat()\t198
7.10.2 主键合并:merge()\t203
7.10.3 行列连接:join()\t207
7.10.4 纵向合并:append()\t208
7.11 字符串处理\t209
7.11.1 获取长度:len()\t210
7.11.2 统计次数:count()\t211
7.11.3 去除空格:strip()\t212
7.11.4 替换字符串:replace()\t213
7.11.5 分割字符串:split()\t214
7.11.6 重复字符串:repeat()\t215
7.11.7 连接列:cat()\t216
7.11.8 大小写转换\t219
7.11.9 判断类型\t220
7.11.10 判断包含\t221
7.12 自定义函数\t222
7.12.1 map()\t222
7.12.2 apply()\t224
7.12.3 applymap()\t226
7.13 实战题:处理天气数据\t227
7.14 实战题:拆分数据\t229
7.15 本章练习\t230
第8章 分析数据\t232
8.1 分析数据简介\t232
8.2 基本统计函数\t232
8.2.1 求和:sum()\t233
8.2.2 统计个数:count()\t235
8.2.3 求最值:max()与min()\t236
8.2.4 求中位数:median()\t238
8.2.5 求众数:mode()\t239
8.2.6 求平均数:mean()\t240
8.2.7 求方差:var()\t241
8.2.8 求标准差:std()\t242
8.2.9 求分位数:quantile()\t243
8.3 其他统计函数\t244
8.3.1 统计取值种类\t244
8.3.2 统计取值个数\t245
8.3.3 求变化百分比\t246
8.3.4 求最值的行名\t247
8.4 整体情况\t247
8.4.1 describe()\t248
8.4.2 info()\t248
8.5 聚合函数:agg()\t249
8.6 数据分组\t252
8.6.1 基本语法\t252
8.6.2 统计分析\t256
8.7 实战题:求平均寿命\t258
8.8 本章练习\t259
第9章 时间序列\t260
9.1 时间序列概述\t260
9.1.1 时间序列简介\t260
9.1.2 转换类型\t261
9.1.3 获取日期\t264
9.1.4 索引与切片\t266
9.2 重采样:resample()\t268
9.2.1 降采样\t268
9.2.2 升采样\t271
9.3 移动计算:rolling()\t273
9.4 分组器:Grouper()\t274
9.5 实战题:求每个月的销量总和\t276
9.6 本章练习\t277
第 10章 高级技术\t279
10.1 透视表\t279
10.1.1 透视表简介\t279
10.1.2 统计函数\t281
10.2 交叉表\t282
10.3 层次化索引\t284
10.3.1 层次化索引简介\t284
10.3.2 常用操作\t286
10.4 离散化处理\t292
10.4.1 离散化简介\t292
10.4.2 常用参数\t293
10.5 哑变量处理\t296
10.6 实战题:创建透视表\t298
10.7 本章练习\t299
第 11章 其他操作\t300
11.1 广播机制\t300
11.2 索引对象\t301
11.3 inplace参数\t304
11.4 缺失值\t306
11.5 实战题:统计每一列的缺失值个数\t307
11.6 本章练习\t308
第三部分 Matplotlib篇
第 12章 基础图表\t313
12.1 Matplotlib简介\t313
12.2 基本绘图(折线图)\t315
12.2.1 基本语法\t315
12.2.2 定义样式\t317
12.3 通用设置\t325
12.3.1 画布样式\t325
12.3.2 定义标题\t326
12.3.3 定义图例\t330
12.3.4 刻度标签\t332
12.3.5 刻度范围\t335
12.3.6 网格线\t338
12.3.7 参考线\t340
12.3.8 参考区域\t343
12.3.9 注释文本(有指向)\t345
12.3.10 注释文本(无指向)\t347
12.4 通用样式\t350
12.5 散点图\t350
12.5.1 基本语法\t350
12.5.2 定义样式\t352
12.5.3 气泡图\t354
12.6 柱形图\t356
12.6.1 基本语法\t356
12.6.2 高级柱形图\t358
12.6.3 条形图\t361
12.7 直方图\t362
12.7.1 基本语法\t362
12.7.2 定义样式\t364
12.8 饼状图\t366
12.8.1 基本语法\t366
12.8.2 定义样式\t367
12.8.3 圆环图\t372
12.9 实战题:绘制气温折线图\t373
12.10 实战题:浏览器所占市场份额柱形图\t375
第 13章 高级图表\t378
13.1 高级图表简介\t378
13.2 箱线图\t378
13.2.1 基本语法\t378
13.2.2 样式定义\t381
13.3 面积图\t387
13.3.1 基本语法\t387
13.3.2 高级面积图\t388
13.4 棉棒图\t389
13.4.1 基本语法\t389
13.4.2 定义样式\t390
13.5 热力图\t393
13.5.1 基本语法\t393
13.5.2 定义样式\t394
13.6 子图表\t395
13.6.1 基本语法\t395
13.6.2 实际案例\t398
13.7 实战题:使用箱线图查找异常值\t399
13.8 实战题:绘制每月销量的棉棒图\t401
第四部分 工具篇
第 14章 Jupyter Notebook\t407
14.1 Jupyter Notebook简介\t407
14.2 Jupyter Notebook的使用\t408
14.2.1 安装Anaconda\t409
14.2.2 运行Jupyter Notebook\t409
14.3 应用场景\t411
14.4 常用技巧\t414
14.4.1 问号查询\t414
14.4.2 输出多个变量\t415
14.4.3 读取文件\t417
第五部分 附录
附录A 读写文件(Pandas)\t422
附录B 统计函数(Pandas)\t423
附录C 绘图函数(Matplotlib)424

TOP书摘

TOP 其它信息

页  数:436

开  本:16开

正文语种:中文

加载页面用时:1002.4343