描述
开 本: 32开纸 张: 纯质纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787521705461
1. 这是一本技术“小白”和技术“大咖”都爱读的机器学习指南。谷歌前工程专家、机器学习极客肖恩•格里什的重磅作品。
2. “深度神经网络”是新一波人工智能热潮的推动引擎。围绕这一前沿工具展开的对话,推动着自动驾驶汽车、网飞的推荐算法、AlphaGo,甚至会打DOTA游戏的人工智能的发展,任何想要参与这一时代对话的人都应该读读这本书。
3. 作者用通俗的类比和鼓舞人心的故事,厘清了许多神秘而前卫的新概念:感知算法、强化学习、卷积神经网络、深度语音识别、图片识别等。掌握这些概念,你才能更好地判断,哪些关于人工智能的言论值得相信,哪些说得天花乱坠的谬论应该被抛弃,这本书将助力你的AI创业与投资之路。
4. 微软CTO凯文•斯科特亲笔作序、谷歌工程总监雷•库兹韦尔、美国人工智能协会院士佩德罗•多明戈斯、谷歌研究科学家凯文•墨菲、微软亚洲研究院副院长潘天佑、驭势科技CEO吴甘沙鼎力推荐!
任何足够先进的技术初看都与魔法无异。
自动驾驶汽车已经在很多国家上路,网飞的算法能主动预测你喜欢的电影,DeepMind的计算机程序通关了雅达利游戏,AlphaGo在古老的围棋领域攻克了人类智能的防线。
这一切是如何发生的?智能机器究竟如何思考?
在这本书中,作者用几乎人人都能读懂的语言展示了人工智能领域的前沿成果,深入解读了感知算法、强化学习、智能体、卷积神经网络、深度语音识别、图片识别等科技巨头纷纷拥抱的概念,正是它们让当今的机器如此智能。
DARPA和ImageNet的挑战赛给未来播撒了怎样的种子?
网飞的电影推荐为什么如此准确?
人工智能怎么打DOTA?
AlphaGo除了下围棋还会做别的吗?
神经网络如何做到能听、能说、能记忆?
我们为什么要不断制造能复制人类智力和行为的机器?
这本书将为你打开机器学习与神经网络的黑匣子,让你看懂“魔法”背后的机制。关于自动驾驶汽车、网飞算法、会玩游戏的人工智能以及AlphaGo,这本书几乎囊括了你想知道的一切。
推荐序 IX
前言 XIII
1 自动机的秘密
长笛演奏者 003
今天的自动机 005
钟摆的摆动007
这本书中的自动机 008
2 自动驾驶汽车:挑战不可能
沙漠中的百万美元竞赛 015
如何打造自动驾驶汽车 017
规划路径 021
路径搜索 022
导航025
无人车挑战赛的获胜者 028
一场失败的比赛 031
3 保持在车道内行驶:自动驾驶汽车的感知
第二次无人车挑战赛 035
自动驾驶汽车中的机器学习 037
斯坦利的架构 038
避开障碍物 040
寻找道路的边缘 043
开眼看路 045
路径规划 047
斯坦利大脑的各个部分如何相互交流 049
4 在十字路口避让:自动驾驶汽车的大脑
城市挑战赛 055
感知抽象 057
比赛 059
老板的高层次推理层 061
攻克交通堵塞 068
三层架构 071
对自动驾驶汽车看到的物体进行分类 076
自动驾驶汽车是复杂的系统 077
自动驾驶汽车的轨迹 078
5 网飞和推荐引擎的挑战
百万美元大奖 083
竞争者 084
如何训练分类器 085
比赛的目标 089
庞大的评分矩阵 091
矩阵分解 096
第一年结束 102
6 团队融合:网飞奖的赢家
缩小竞争者之间的差距 107
第一年末 108
随时间变化的预测 111
过度拟合 114
模型混合 115
第二年 119
最后一年 120
赛后 124
7 用奖励教导计算机
DeepMind玩雅达利游戏 129
强化学习 132
教导智能体 134
为智能体编写程序 36
智能体如何观察环境 140
经验金块 141
用强化学习玩雅达利游戏 148
8 如何用神经网络攻克雅达利游戏
神经信息处理系统 153
近似,而非完美 153
用作数学函数的神经网络 155
雅达利游戏神经网络的结构 161
深入研究神经网络 170
9 人工神经网络的世界观
人工智能的奥秘 175
国际象棋自动机“土耳其人” 177
神经网络中的误导 179
识别图像中的物体 180
过度拟合 183
ImageNet 185
卷积神经网络 188
为什么是“深度”网络? 194
数据瓶颈 197
10 深入了解深度神经网络的内部秘密
计算机生成图片 203
压缩函数 204
ReLU激活函数 207
机器人之梦 211
11 能听、能说、能记忆的神经网络
对机器而言,“理解”意味着什么? 221
深度语音识别 222
循环神经网络 223
为图像生成字幕 230
长短时记忆网络 233
对抗数据 235
12 理解自然语言
宣传噱头还是人工智能研究的福音? 239
IBM的沃森 240
攻克《危险边缘》所遇到的挑战 241
浩如烟海的知识 242
《危险边缘》挑战赛的诞生 245
DeepQA 247
问题分析 249
“沃森”如何解读句子 252
13 挖掘《危险边缘》的最佳答案
地下室基准 261
生成候选答案 263
查找答案 266
轻量级过滤器 269
证据检索 270
评分 274
汇总和排名 277
调整“沃森” 281
重新审视DeepQA 282
沃森有智能吗? 283
14 用蛮力搜索找到好策略
通过搜索玩游戏 289
数独 290
树的大小 294
分支因子 297
游戏中的不确定性 297
克劳德•香农与信息论 302
评价函数 303
“深蓝” 308
加入IBM 310
搜索与神经网络 311
西洋双陆棋程序 313
搜索的局限 315
15 职业水平的围棋
计算机围棋 319
围棋 321
通过抽样走子来建立直觉 324
神之一手 330
蒙特卡洛树搜索 333
单臂老虎机 337
AlphaGo是否需要如此复杂 339
AlphaGo的局限 341
16 实时人工智能与《星际争霸》
构建更好的游戏机器人 345
《星际争霸》与人工智能 346
简化游戏 348
实用《星际争霸》机器人 351
OpenAI与《DOTA 2》 354
《星际争霸》机器人的未来 357
17 50年后或更遥远的未来
人工智能起起伏伏的发展过程 363
如何复制这本书中的成功 364
数据的普遍使用 368
下一步去向何方 369
致谢 373
注释 375
推荐序
10多年前,我遇见了肖恩。当时我在谷歌领导团队,负责开发为谷歌的搜索广告业务提供支持的许多大型机器学习系统。肖恩是我们小组里最顶尖的工程师之一,当时他正在研究机器学习前沿领域的一系列具有挑战性的问题。我们一起工作以来,体现在统计机器学习技术中的各类人工智能已经从相对难以触及的神秘技术、研究人员和高科技公司的专属领域,发展成为日益平易近人的、卓有成效的工具和技术,值得每一位软件开发人员使用。
目前机器学习领域取得的快速进展,在一定程度上是由以下因素推动的:数据爆炸,高性能计算机体系结构的复兴,云提供商竞相为开发人员和研究人员构建可扩展的人工智能平台,人们将实时智能嵌入移动设备、汽车、其他消费电子产品和日益普遍的连接到云端的计算设备的热潮。这种快速进步中包括一些惊世骇俗的成就,机器在许多狭窄的领域已经接近于或超过了人类的能力,例如在图像中标记物体、识别语音、玩策略游戏以及翻译语言,但我们仍处于这些技术发展的初期,摆在我们面前的是长达几十年的创新和发现之旅。
对开发人员和研究人员而言,理解机器学习的工作原理是一个明智的职业选择。目前,全球的科技巨头公司对这些技术的专业知识都有很高的需求。微软、亚马逊、谷歌、苹果、百度等许多公司都提供应用程序接口、工具包和云计算基础设施,将机器学习的开发工作交给全世界数以千万计的开发人员。未来几年,随着越来越多的应用程序包含智能功能,大多数开发人员都需要掌握一些机器学习技术。这正是这本书的宝贵价值所在。
这本书诞生自肖恩对了解现代机器学习成功之路的渴望。在用清晰易懂的方式描述这些系统的本质时,肖恩利用10多年的行业和学术经验解决了机器学习带来的一些最棘手的问题。鉴于机器学习系统能够复制某些方面的人类智能,等到某个突破点临近,原本由人类特有的创造诗意词句的能力或许也会被机器复制。肖恩对这些技术严谨实用的描述反映了他在科研战壕中的岁月,不时令人感到痛苦的反复试验让战壕中的人们了解到,机器学习并不是魔法。如果你知道如何应用它,了解它的局限所在,它就是强有力的前沿工具;如果你不知道,它就几乎一文不值。
肖恩通过列举现实世界的例子,回避不必要的术语,使现代机器学习的概念变得通俗易懂。这本书假设读者在机器学习或计算机科学领域的知识相对较少,因此对更广泛的受众而言非常友好。鉴于当前围绕机器学习和人工智能的对话颇为活跃,并且这些技术可能对我们的未来产生影响,任何想要参与这场对话的人都应该尽可能地学习。由于市场上缺乏对机器学习通俗易懂的专业介绍,这本书将成为引导你理解底层技术的理想方法,它可以帮助你更好地判断哪些言论值得相信,哪些说得天花乱坠的谬论应该被抛弃。
微软CTO(首席技术官)
凯文•斯科特(Kevin Scott)
鉴于当前围绕机器学习和人工智能的对话颇为活跃,并且这些技术可能对我们的未来产生影响,任何想要参与这场对话的人都应该尽可能地学习。这本书可以帮助你更好地判断哪些言论值得相信,哪些说得天花乱坠的谬论应该被抛弃。
凯文•斯科特(Kevin Scott)
微软CTO,计算机科学家
在当今人工智能的发展背景下,这本书令人愉快且充满洞见,作者用几乎任何人都能读懂的语言厘清了许多复杂而重要的概念。
雷•库兹韦尔(Ray Kurzweil)
未来学家,奇点大学创始人,谷歌工程总监
如果你对时下一些人工智能应用——从AlphaGo到自动驾驶汽车——取得的阶段性成功感到好奇,这本迷人的书就很适合你阅读。
佩德罗•多明戈斯(Pedro Domingos)
美国人工智能协会院士,《终极算法》作者
在过去10年中,深度神经网络取得了突破性的进展。从微软亚洲研究院在ImageNet图像识别挑战赛中使用的ResNet(残差网络),到DeepMind的AlphaGo围棋算法,它们都依赖于深度神经网络的发展与完善。可以说,深度神经网络就是这一波人工智能研究与设计的推动引擎。这本书用通俗的语言和鼓舞人心的故事,向我们阐释了这些智能机器究竟是如何感知与思考的,并描绘了我们终将和这些智能体共处的未来。
潘天佑博士
微软亚洲研究院副院长
初中时我看《变形金刚》,萌生出一种极强的冲动——用硬纸板把一个三维的、能变形的“汽车人”复现出来。可惜,限于当时的知识结构和时间缺口,我始终不得要领。如今,人工智能和机器学习一如当年的“汽车人”,我相信更多的人有类似我当初的冲动,可惜大多数人看不懂“西瓜书”和“花书”,谢诺夫斯基的《深度学习》虽然易懂,却不是从一个系统整体去看“汽车人”的。这本书恰好弥补了这一缺憾,它既有可读性又有系统性,读来酣畅淋漓,令人豁然开朗。
吴甘沙
驭势科技联合创始人、CEO
长笛演奏者
1737年,在工业革命的黎明时分,法国的机械天才雅克•德•沃康松(Jacques de Vaucanson)完成了一件杰作:一尊可以像真人一样用长笛演奏音乐的塑像。只见这尊真人大小的塑像把真实的长笛举到嘴边,接着便用它的机械肺把空气送入乐器,吹出一个个音符。通过移动嘴唇,调整吹气的力度,控制手指精确地在长笛孔上移动,塑像可以吹出一系列音符,组成一首完整的乐曲,“其吹奏过程就像人类乐手的演奏一样完美”。沃康松并不满足于塑像只会用长笛演奏一首乐曲,于是赋予了塑像演奏12首不同乐曲的能力。
对公众而言,像长笛演奏者这样的装置他们并非第一次见,但是这个装置很特别。他们把这种机器称为自动机,而且爱不释手。摆弄这类装置已经成为整个欧洲富裕阶层的一种爱好。有一段时间,沃康松向一小部分观众收取相当于一周薪水的费用,让他们观看他那奇怪的装置。它那自然的运动和复杂的行为对当时的人们来说完全属于未知的领域。最终,沃康松在欧洲的其他地区巡回展出了长笛演奏者和其他几台自动机。
长笛演奏者是如何工作的?它是黑魔法吗?在那10年以前,一位教会官员曾下令捣毁了沃康松的一个工作坊,因为他认为这是亵渎神灵,所以沃康松肯定不会再做任何看起来太像魔法的事情。它是骗局吗?就在长笛演奏者诞生之前的几年,一台看似能演奏大键琴的自动乐器曾让法国国王路易十五颇为着迷。国王坚持要了解这台装置的工作原理,最终却发现它只是个傀儡,里面藏着一个5岁的小女孩。沃康松敏锐地意识到了这一点,热切地向观众展示长笛演奏者的内部机制。它的动作流畅自然,当沃康松展示它的内部机制时,它显然只是在遵循编码到其机械内脏中的一系列指令。
沃康松为了进一步证明其发明的合理性,向法国科学院展示了这台自动机,并提交了一篇题为《自动长笛演奏者的机理》的论文。在论文中,沃康松精确地阐释了这台神奇机器的工作原理。塑像由木头和硬纸板制成,被漆成大理石的样子,包裹着皮革的指尖与长笛孔形成密封。自动机的机械驱动器由两根旋转轴组成。为了让塑像吹气,其中一根轴给三组风箱打气,产生低、中、高三档不同压力的气流。这三股气流合在一起形成一个人工气管,被送入塑像的口中。装置的另一根轴慢慢地转动一个表面带有小螺柱的圆筒。当圆筒旋转时,这些小螺柱会压在15根由弹簧承载的杠杆上。通过链条和线缆,这些杠杆可以驱动自动机的各个部分。一些杠杆控制着手指和嘴唇的运动。剩下的杠杆决定了低、中、高三档压力中的哪一档气流应该吹进长笛以及装置的舌头应该选择占据哪个位置来改变气流。通过将小螺柱放置在旋转圆筒上的适当位置,沃康松可以对塑像进行编码,从而让它演奏出他想要的任何乐曲。虽然有些复杂,但它不过是一个巨大的音乐盒。法国科学院接受了他的论文,并做了精彩的评论。
沃康松的杰作只是那个世纪的发明家几十年来开发的许多自动机之一。自动机之所以受欢迎,正是因为它看起来是完全自主的,而且它似乎复制了人类的智能。长笛演奏者和其他类似的自动机是工业革命中的人工智能先驱:在几十年的时间里,随着各类材料和各种新发明的出现,自动机得以成为可能,当时的技术专家和业余爱好者在他们独特的探索中使用自动机来复制我们的身体和思想。
今天的自动机
时间快进到今天。在现实生活中,自动驾驶汽车日夜穿梭于硅谷的各个城市。我们用提供奖励的方法训练计算机程序玩雅达利游戏,最终使程序的游戏水平远远超过人类玩家,就像训练一只狗坐下或打滚儿一样。在《危险边缘》(Jeopardy!)比赛节目中,一个计算机程序成功击败了两位世界冠军。我们开发出了在古老的围棋中战胜最优秀的人类棋手的计算机程序。与此同时,这些突破背后的人工智能正在以令人叹为观止的速度发展,甚至对这个领域的专家而言也是如此。
最后这一点怎么夸张也不为过。参加《危险边缘》比赛的“沃森”开发团队表示,在他们着手开发这个系统之前,创建出能够击败世界顶尖玩家的程序还不可能。许多专家认为,创建出具备一定棋力的计算机围棋程序需要再过10年,AlphaGo(阿尔法围棋)证明了这是错误的,这个程序被训练了几个月,随后战胜了世界围棋冠军李世石。20个月后,AlphaGo的创建者开发了程序的另一个版本,它仅用三天就自学了人类数千年积累的围棋知识,以100比0的成绩击败了上一个版本,然而它只使用了上一个版本10%的计算能力。这在一定程度上要归功于人工神经网络的进步,人工神经网络是AlphaGo的技术基础,也是过去10年的研究热点。现在这些人工神经网络不仅会玩游戏,还能够识别照片中的图像、识别口语语音,其水平可以与人类媲美。
随着这些突破不断登上新闻头条,它们也自然而然地激发了我们的好奇心:它们是如何工作的?正如18世纪的欧洲人对长笛演奏者和当时的其他自动机感到疑惑一样,当我们谈论这些新型自动机时,那个问题总是隐藏在表面之下,悬而未决。
幸运的是,与沃康松向法国科学院提交论文的方式如出一辙,这些最新进展的创造者详细记录了构建智能计算机程序的方法。这些技术细节分布在许多不同的地方,在本书中,我试图把这些细节组织起来,用简单的术语说明智能机器是如何思考的。
与里面藏着5岁小女孩的冒牌自动机不同,你将在本书中看到的突破是真实的科学进步。虽然它们看起来像魔法,但是与法国科学院审查长笛演奏者一样,学术界对这些突破都进行了仔细的审查。它们同长笛演奏者一样,也是自动机的例子。自动机就是自动运行的机器。它看上去总是像人或动物一样自主运行,似乎可以独立思考。但根据定义,自动机是遵循程序的。这些程序是预先设定的指令序列,就像沃康松为让长笛演奏者演奏音乐而开发的程序一样。
正如我们将要看到的,事实证明,技术专家在过去的几个世纪里没有太大变化。他们仍然在设计自动机并给它们编程,以此复制人类的思想和身体,他们有时仍然会造出冒牌自动机。唯一的区别是,技术专家已经把工具升级为计算机和运行在计算机上的软件,它们是21世纪的杠杆、齿轮和发动机。
评论
还没有评论。