作 者:Indra,den,Bakker
译 者:程国建
出 版 社:机械工业出版社
丛 书:深度学习系列
出版时间:2018年06月
定 价:79.00
I S B N :9787111598725
所属分类: 专业科技 > 计算机/网络 > 程序设计  
标 签:
本书以自上而下和自下而上的方法来展示针对不同领域实际问题的深度学习解决方案,包括图像识别、自然语言处理、时间序列预测和机器人操纵等。还讨论了采用诸如TensorFlow、PyTorch、Keras和CNTK等流行的深度学习开源框架用于实际问题的解决方案及其优缺点。本书内容包括:用于深度学习的编程环境、GPU计算和云端解决方案;前馈神经网络与卷积神经网络;循环与递归神经网络;强化学习与生成对抗网络;深度学习用于计算机视觉、自然语言处理、语音识别、视频分析、时间序列预测、结构化数据分析以及游戏智能体(Agents)和机器人操控等。后讨论了深度学习的超参数选择和神经网络的内在结构以及预训练模型的使用技巧等。
Indra den Bakker是一位经验丰富的深度学习工程师和培训师。他是23insights平台的创始人,这是NVIDIA所属孵化项目计划的一部分,这是一个机器学习构建解决方案的初创型计划,可以改变世界上重要的行业。在开放课程平台Udacity,他指导了在深度学习和相关领域攻读微学位(Nanodegree)的学生,他还负责审查学生的实习项目。Indra拥有计算智能背景,并在创建23insights平台之前作为IPG Mediabrands的品牌代理以及Screen6的数据科学家若干年。
程国建,博士,教授,西安培华学院智能科学与信息工程学院(中兴电信学院)院长。1990年12月获中国石油大学(华东)计算机应用专业工学学士学位;1994年6月获西安电子科技大学计算机与人工智能专业工学硕士学位;1997年9月至2001年12月留学德国图宾根大学,获理学博士学位(Dr.rer.nat.)。2002年3月至2003年8月在戴姆勒集团(Daimler AG,奔驰汽车公司)从事汽车嵌入式软件产品线构造、车载多媒体互连架构(Telematics)等方面的研究工作。2004年9月回国任教,2008年底破格晋升教授职称,2009年7月荣获“陕西省优秀留学回国人员”荣誉称号,2010年12月赴美国西弗吉尼亚大学石油工程系进行访学活动。近几年主持并完成十余项科研项目,包括国家自然科学基金项目2项,指导研究生50余名,在相关学术研究领域及国际会议发表文章150余篇,其中核心期刊70余篇,三大检索(SCI/ISTP/EI)论文50余篇,出版专(译)著十余部。主要科研领域及研究方向包括:计算智能、机器学习、模式识别、图像处理、智能数字油田、商业智能、大数据与智慧城市等。
译者序
原书前言
第 1章 编程环境、GPU计算、云解决方案和深度学习框架 //1
1.1 简介 //1
1.2 搭建一个深度学习环境 //2
1.3 在 AWS上启动实例 //2
1.4 在 GCP上启动实例 //3
1.5 安装 CUDA和 cuDNN //4
1.6 安装 Anaconda和库文件 //6
1.7 连接服务器上的 Jupyter Notebooks //7
1.8 用 TensorFlow构建最先进的即用模型 //8
1.9 直观地用 Keras建立网络 //10
1.10 使用 PyTorch的 RNN动态计算图 //12
1.11 用 CNTK实现高性能模型 //14
1.12 使用 MXNet构建高效的模型 //15
1.13 使用简单、高效的 Gluon编码定义网络 //17
第 2章 前馈神经网络 //19
2.1 简介 //19
2.2 理解感知器 //19
2.3 实现一个单层神经网络 //23
2.4 构建一个多层神经网络 //27
2.5 开始使用激活函数 //30
2.6 关于隐层和隐层神经元的实验 //35
2.7 实现一个自动编码器 //38
2.8 调整损失函数 //41
2.9 测试不同的优化器 //44
2.10 使用正则化技术提高泛化能力 //47
2.11 添加 Dropout以防止过拟合 //51
第 3章 卷积神经网络 //56
3.1 简介 //56
3.2 开始使用滤波器和参数共享 //56
3.3 应用层合并技术 //60
3.4 使用批量标准化进行优化 //62
3.5 理解填充和步长 //66
3.6 试验不同类型的初始化 //72
3.7 实现卷积自动编码器 //76
3.8 将一维 CNN应用于文本 //79
第 4章 递归神经网络 //81
4.1 简介 //81
4.2 实现一个简单的 RNN //82
4.3 添加 LSTM //84
4.4 使用 GRU //86
4.5 实现双向 RNN //89
4.6 字符级文本生成 //91
第 5章 强化学习 //95
5.1 简介 //95
5.2 实现策略梯度 //95
5.3 实现深度Q学习算法 //102
第 6章 生成对抗网络 //109
6.1 简介 //109 6.2 了解 GAN //109
6.3 实现 DCGAN //112
6.4 使用 SRGAN来提高图像分辨率 //117
第 7章 计算机视觉 //125
7.1 简介 //125
7.2 利用计算机视觉技术增广图像 //125
7.3 图像中的目标分类 //130
7.4 目标在图像中的本地化 //134
7.5 实时检测框架 //139
7.6 用 U-net将图像分类 //139
7.7 语义分割与场景理解 //143
7.8 寻找人脸面部关键点 //147
7.9 人脸识别 //151
7.10 将样式转换为图像 //157
第 8章 自然语言处理 //162
8.1 简介 //162
8.2 情绪分析 //162
8.3 句子翻译 //165
8.4 文本摘要 //169
第 9章 语音识别和视频分析 //174
9.1 简介 //174
9.2 从零开始实现语音识别流程 //174
9.3 使用语音识别技术辨别讲话人 //177
9.4 使用深度学习理解视频 //181
第 10章 时间序列和结构化数据 //185
10.1 简介 //185
10.2 使用神经网络预测股票价格 //185
10.3 预测共享单车需求 //189
10.4 使用浅层神经网络进行二元分类 //192
第 11章 游戏智能体和机器人 //194
11.1 简介 //194
11.2 通过端到端学习来驾驶汽车 //194
11.3 通过深度强化学习来玩游戏 //199
11.4 用 GA优化超参数 //205
第 12章 超参数选择、调优和神经网络学习 //211
12.1 简介 //211
12.2 用 TensorBoard和 Keras可视化训练过程 //211
12.3 使用批量和小批量工作 //215
12.4 使用网格搜索调整参数 //219
12.5 学习率和学习率调度 //221
12.6 比较优化器 //224
12.7 确定网络的深度 //227
12.8 添加 Dropout以防止过拟合 //227
12.9 通过数据增广使模型更加鲁棒 //232
12.10 利用 TTA来提高精度 //234
第 13章 网络内部构造 //235
13.1 简介 //235
13.2 用 TensorBoard可视化训练过程 //235
13.3 用 TensorBoard可视化网络结构 //239
13.4 分析网络权重等 //239
13.5 冻结层 //244
13.6 存储网络结构并训练权重 //246
第 14章 预训练模型 //250
14.1 简介 //250
14.2 使用 GoogLeNet/Inception进行大规模视觉识别 //250
14.3 用 ResNet提取瓶颈特征 //252
14.4 对新类别使用预训练的 VGG模型 //253
14.5 用 Xception细调 //256
......
页 数:260
开 本:16开