深度学习:基于Keras的Python实践,由电子工业出版社在2018-06-01月出版发行,本书编译以及作者信息为: 魏贞原 著,这是第1次发行, 国际标准书号为:9787121341472,品牌为博文视点, 这本书采用平装开本为16开,纸张采为胶版纸,全书共有244页,字数万8字,值得推荐。
此书内容摘要
《深度学习:基于Keras的Python实践》本书系统讲解了深度学习的基本知识,以及使用深度学习解决实际问题,详细介绍了如何构建及优化模型,并针对不同的问题给出不同的解决方案,通过不同的例子展示了在具体项目中的应用和实践经验,是一本非常好的深度学习的入门和实践书籍。
《深度学习:基于Keras的Python实践》以实践为导向,使用Keras 作为编程框架,强调简单、快速地上手建立模型,解决实际项目问题。读者可以通过学习本书,迅速上手实践深度学习,并利用深度学习解决实际问题。
《深度学习:基于Keras的Python实践》非常适合于项目经理,有意从事机器学习开发的程序员,以及高校在读相关专业的学生。
关于此书作者
魏贞原,IBM 高级项目经理,数据分析团队Leader,主要负责银行客户的复杂系统开发。同时是IBMCIC量子计算COE团队的Python 领域专家(Subject Matter Expert),负责量子计算应用的探索工作,对机器学习和深度学习有深入的研究,精通于运用机器学习来解决数据的问题。并运营“知之Python”公众号,定期分享 Python 在机器学习和深度学习的实践知识。
编辑们的推荐
适读人群 :本书非常适合于项目经理,有意从事机器学习开发的程序员,以及高校在读相关专业的学生。
本书将介绍一种与传统方式不同的学习深度学习的方式;
主要介绍Keras在Python中生成并评估深度学习的模型 ;
本书具有端到端的例子,适合实践,能够快速上手,代码复现容易。
深度学习:基于Keras的Python实践图书的目录
第一部分 初识
1 初识深度学习/2
1.1 Python的深度学习/2
1.2 软件环境和基本要求/3
1.2.1 Python和SciPy/3
1.2.2 机器学习/3
1.2.3 深度学习/4
1.3 阅读本书的收获/4
1.4 本书说明/4
1.5 本书中的代码/5
2 深度学习生态圈/6
2.1 CNTK/6
2.1.1 安装CNTK/7
2.1.2 CNTK的简单例子/8
2.2 TensorFlow/8
2.2.1 TensorFlow介绍/8
2.2.2 安装TensorFlow/9
2.2.3 TensorFlow的简单例子/9
2.3 Keras/10
2.3.1 Keras简介/11
2.3.2 Keras安装/11
2.3.3 配置Keras的后端/11
2.3.4 使用Keras构建深度学习模型/12
2.4 云端GPUs计算/13
第二部分 多层感知器
3 第一个多层感知器实例:印第安人糖尿病诊断/16
3.1 概述/16
3.2 Pima Indians数据集/17
3.3 导入数据/18
3.4 定义模型/19
3.5 编译模型/20
3.6 训练模型/21
3.7 评估模型/21
3.8 汇总代码/22
4 多层感知器速成/24
4.1 多层感知器/24
4.2 神经元/25
4.2.1 神经元权重/25
4.2.2 激活函数/26
4.3 神经网络/27
4.3.1 输入层(可视层)/28
4.3.2 隐藏层/28
4.3.3 输出层/28
4.4 训练神经网络/29
4.4.1 准备数据/29
4.4.2 随机梯度下降算法/30
4.4.3 权重更新/30
4.4.4 预测新数据/31
5 评估深度学习模型/33
5.1 深度学习模型和评估/33
5.2 自动评估/34
5.3 手动评估/36
5.3.1 手动分离数据集并评估/36
5.3.2 k折交叉验证/37
6 在Keras中使用Scikit-Learn/40
6.1 使用交叉验证评估模型/41
6.2 深度学习模型调参/42
7 多分类实例:鸢尾花分类/49
7.1 问题分析/49
7.2 导入数据/50
7.3 定义神经网络模型/50
7.4 评估模型/52
7.5 汇总代码/52
8 回归问题实例:波士顿房价预测/54
8.1 问题描述/54
8.2 构建基准模型/55
8.3 数据预处理/57
8.4 调参隐藏层和神经元/58
9 二分类实例:银行营销分类/61
9.1 问题描述/61
9.2 数据导入与预处理/62
9.3 构建基准模型/64
9.4 数据格式化/66
9.5 调参网络拓扑图/66
10 多层感知器进阶/68
10.1 JSON序列化模型/68
10.2 YAML序列化模型/74
10.3 模型增量更新/78
10.4 神经网络的检查点/81
10.4.1 检查点跟踪神经网络模型/82
10.4.2 自动保存最优模型/84
10.4.3 从检查点导入模型/86
10.5 模型训练过程可视化/87
11 Dropout与学习率衰减92
11.1 神经网络中的Dropout/92
11.2 在Keras中使用Dropout/93
11.2.1 输入层使用Dropout/94
11.2.2 在隐藏层使用Dropout/95
11.2.3 Dropout的使用技巧/97
11.3 学习率衰减/97
11.3.1 学习率线性衰减/98
11.3.2 学习率指数衰减/100
11.3.3 学习率衰减的使用技巧/103
第三部分 卷积神经网络
12 卷积神经网络速成/106
12.1 卷积层/108
12.1.1 滤波器/108
12.1.2 特征图/109
12.2 池化层/109
12.3 全连接层/109
12.4 卷积神经网络案例/110
13 手写数字识别/112
13.1 问题描述/112
13.2 导入数据/113
13.3 多层感知器模型/114
13.4 简单卷积神经网络/117
13.5 复杂卷积神经网络/120
14 Keras中的图像增强/124
14.1 Keras中的图像增强API/124
14.2 增强前的图像/125
14.3 特征标准化/126
14.4 ZCA白化/128
14.5 随机旋转、移动、剪切和反转图像/129
14.6 保存增强后的图像/132
15 图像识别实例:CIFAR-10分类/134
15.1 问题描述/134
15.2 导入数据/135
15.3 简单卷积神经网络/136
15.4 大型卷积神经网络/140
15.5 改进模型/145
16 情感分析实例:IMDB影评情感分析/152
16.1 问题描述/152
16.2 导入数据/153
16.3 词嵌入/154
16.4 多层感知器模型/155
16.5 卷积神经网络/157
第四部分 循环神经网络
17 循环神经网络速成/162
17.1 处理序列问题的神经网络/163
17.2 循环神经网络/164
17.3 长短期记忆网络/165
18 多层感知器的时间序列预测:国际旅行人数预测/167
18.1 问题描述/167
18.2 导入数据/168
18.3 多层感知器/169
18.4 使用窗口方法的多层感知器/172
19 LSTM时间序列问题预测:国际旅行人数预测177
19.1 LSTM处理回归问题/177
19.2 使用窗口方法的LSTM回归/181
19.3 使用时间步长的LSTM回归/185
19.4 LSTM的批次间记忆/188
19.5 堆叠LSTM的批次间记忆/192
20 序列分类:IMDB影评分类/197
20.1 问题描述/197
20.2 简单LSTM/197
20.3 使用Dropout改进过拟合/199
20.4 混合使用LSTM和CNN/201
21 多变量时间序列预测:PM2.5预报/203
21.1 问题描述/203
21.2 数据导入与准备/204
21.3 构建数据集/206
21.4 简单LSTM/207
22 文本生成实例:爱丽丝梦游仙境/211
22.1 问题描述/211
22.2 导入数据/212
22.3 分词与向量化/212
22.4 词云/213
22.5 简单LSTM/215
22.6 生成文本/219
附录A 深度学习的基本概念/223
A.1 神经网络基础/223
A.2 卷积神经网络/227
A.3 循环神经网络/229
部分内容试读
序言
2017年12月底的上海湿冷依旧,收到贞原《深度学习:基于Keras的Python实践》的初稿,心里升起一股暖意。人工智能(AI)在2017年可谓家喻户晓,智能医疗、智能金融及无人驾驶变得不再遥远,而其背后的深度学习尤为功不可没,机器学习(ML)是一种实现人工智能的方法,深度学习(DL)则是一种实现机器学习的技术。
国务院于2017年7月出台了《新一代人工智能发展规划》,首次从国家战略的角度阐述对人工智能在产业、技术应用层面的发展展望,并提出了明确的时间表和线路图,规划提到:
前瞻布局新一代人工智能重大科技项目。
到2030年,中国人工智能产业竞争力达到国际领先水平。
人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
作为相关领域的从业者,深感任重道远,作为国家未来的发展方向,AI技术对于经济发展、产业转型和科技进步起着至关重要的作用,这里就不得不提“事情很多,人不够用了”,准确来讲应该是人工智能领域方面的专才不够用,据相关部门2017年的统计,此缺口应该在百万级以上。
配合国家发展战略,个别省份已经陆续将人工智能相关学习纳入中小学教育,而提到机器学习、深度学习,又不得不提Python,希望读者可以借鉴贞原的这本书为自己在人工智能的相关职业发展上打开一扇新的大门。
汤志阳(汤米)
IBM中国 副合伙人
IBM客户创新中心 认知及数据团队负责人
前言
深度学习是目前人工智能领域中炙手可热的一种机器学习技术。所谓人工智能是指通过机器模拟人类所特有的“看,听,说,想,学”等智能的技术。关于人工智能的研究起源于1956年,在美国的达特茅斯学院,著名的计算机家约翰.麦卡锡,及克劳德.艾尔伍德.香农等众多的家,齐聚一堂,各抒己见,共同探讨如何开发“智能机器”,在这次会议中提出了人工智能的概念,这也标志着人工智能的诞生。从人工智能的诞生,到深度学习的火热,人工智能也跌宕起伏经历了几个阶段,深度学习的发展一定会给产业和社会带来翻天覆地的变化。
人工智能的首次热潮是,1957年美国心理学家弗兰克?罗森布莱特在参照人脑的神经回路的基础上构建了最原始的信息处理系统,这一系统被称为神经网络。罗森布莱特将自己开发的神经网络系统命名为“感知器”。感知器实现了初级模型的识别功能,如区分三角形和四边形,并将其分类。然而,神经网络的研究很快遇到了瓶颈,美国AI家马文?李?明斯基运用数学理论证明了“感知器甚至不能理解异或运算”。这一发现使神经网络的研究热潮迅速冷却。
20世纪60~70年代,研究员投身于“符号处理型AI”的研究,又称“规则库AI”。“规则库AI”是直接模拟人类智能行为的一种研究。20世纪80年代前半期,全世界范围内投入了大量的资金用于“规则库AI”的研究,所开发的系统称为专家系统。然而,因为现实生活的时间充斥着大量的例外和各种细微的差距,最终几乎没有一个专家系统能够物尽其用。从20世纪80年代末期开始,AI研发进入一段很长时间的低迷期,被称为“AI的冬天”。
在AI黯然退场的这段时间里,一种全新理念的AI研究悄然萌芽,这就是将“统计与概率推理理论”引入AI系统。在这种全新的AI理念中,不得不提贝叶斯定理,这是用来描述两种概率之间转换关系的一则定理。1990年之后,全球的Internet有了发展,大量的数据被收集,这让概率式AI的发展如虎添翼。另外,概率式AI也存在问题和局限性,首先,概率式AI不能真正地理解事物。其次,概率式AI的性能有限。
为了解决概率式AI的问题与局限,新一代的AI技术走入了人们的视野,这就是“深度神经网络”,又叫作“深度学习”,原本衰退的神经网络技术浴火重生。早期的神经网络的感知器只有两层,即信息的输入层和输出层。而现在的神经网络则是多层结构,在输入层和输出层之间还存在多层重叠的隐藏层。
目前,深度学习被广泛地应用在图像识别、自然语言处理、自动驾驶等领域,并取得了很高的成就。同时,随着物联网技术的发展,大量的数据被收集,为深度学习提供了丰富的数据,对深度学习模型的建立提供了数据基础。有了充分的数据做基础,利用深度学习技术就能演绎出更聪明的算法。在这一次AI技术的浪潮中,大量的数据为深度学习提供了材料,使深度学习得以迅速发展。对深度学习的掌握也是每一个AI开发者必需的技能。希望本书能为读者开启通往深度学习的大门。
关于此书评价
深度学习是目前很热的领域之一。迅速上手想必是每个想跨入深度学习开发行列的人关心的问题。本书面向对深度学习算法有一定了解的人群,全面讲解了如何利用 Python 建立、评估并且改善模型。本书中有别于传统书籍的编排方式,循序渐进,对所有知识点均提供了大量的实例,中间穿插了简洁的理论知识介绍,娓娓道来,让读者在实践中迅速上手,达到事半功倍的效果,是掌握 Deep Learning 的必读之作。
—— 张亮,副合伙人,IBM 客户创新中心银行事业部负责人
Watson 是 IBM 在认知计算系统领域内的杰出代表,IBM 在机器学习、深度学习等领域有丰富的理论和实践。本书作者结合 IBM 的先进实践和中国国内热度较高的开源产品,一步一步浅显易懂地讲解如何学习和掌握 Google 的 TensorFlow、微软的 CNTK 和著名 Python 类库 Keras。本书介绍了如何使用阿里云的 GPU 云服务来加速大型深度学习模型的训练,为了让读者可以边读边练,作者把源代码放到了 GitHub 上,方便查阅。详细地介绍了卷积神经网络(CNN)和循环神经网络(RNN)等理论,并通过手写数字识别、图像识别、情感分析、时间序列预测、影评序列分类、多变量时间序列预测等深度学习热点应用方向,对理论知识进行了详细的介绍和实践应用说明。
本书条理清晰,理论和实践相结合,非常值得阅读。
—— 王德会,IBM 副合伙人,IBM 客户创新中心对日保险事业部负责人
书摘内容
激活函数是加权输入与神经元输出的简单映射。它被称为激活函数,是因为它控制神经元激活的阈值和输出信号的强度。历史上最简单的激活函数是临界值判定,如输入总和高于阈值(如0.5),则神经元将输出值1.0,否则将输出值0.0。
激活函数通常有以下一些性质。
非线性:当激活函数是非线性的时候,一个两层的神经网络就可以基本逼近所有的函数了。但是,如果激活函数是恒等激活函数时(f(x)=x),就不满足这个特性,假如多层感知器使用的是恒等激活函数,那么整个网络和单层神经网络是等价的。
可微性:当优化方法是基于梯度优化时,这个性质是必需的。
单调性:当激活函数是单调函数时,单层网络能够保证是凸函数。
f(x)≈x:当激活函数满足这个性质时,如果参数的初始化为很小的随机值,那么神经网络的训练将会很高效;如果不满足这个性质,那么就需要很用心地去设置初始值。
输出值的范围:当激活函数的输出值的范围有限的时候,基于梯度的优化方法会更加稳定,因为特征的表示受有限权值的影响更显著;当激活函数的输出值的范围无限的时候,模型的训练会更加高效,不过在这种情况下,一般需要更小的学习率。
既然激活函数具有这些特征,那么如何选择激活函数呢?传统上使用非线性激活函数。这允许网络以更复杂的方式组合输入,从而可以构建功能更丰富的模型。使用类似逻辑函数的非线性函数也称为sigmoid函数,它以s形分布输出0和1之间的值。双曲正切函数也称为tanh,它在-1到+1范围内输出相同的分布。最近,线性整流函数(ReLU)已被证明可以提供更好的结果,相比于sigmoid函数和tanh函数,ReLU只需要一个阈值就可以得到激活值,而不用去算一大堆复杂的运算。当然,ReLU也有缺点,就是训练的时候很“脆弱”,并且很容易失去作用。举个例子,一个非常大的梯度流过一个ReLU神经元,更新参数之后,这个神经元再也不会对任何数据有激活现象。如果这个情况发生了,那么这个神经元的梯度就永远都是0。
……
深度学习:基于Keras的Python实践最新最全的试读、书评、目录、简介信息由Python中文网整理提供。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试