描述
开 本: 32开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302530428
★《机器学习》作者周志华教授、中科院陆汝钤院士、中科院王飞跃教授、复旦大学严锋教授联合推荐。
★从开脑到烧脑的科普:有诗、有歌、有画、有乡愁,不乏幽默的人工智能科普。
★霍金说过,科普书每多一个数学公式,书的销量将减少一半。
★这本书没公式。
智能是什么?二十一世纪以来,人工智能有了飞速发展,在各行各业如互联网、安防、多媒体等都有了广泛且有效的应用。但这是否意味着人类就能制造超越人类自身的智能体呢?作者在科普性地介绍了人工智能前沿进展的同时,着重从犯错的角度,浅显易懂地剖析了智能体在视、听、语言等方面存在的各种错觉和犯错。并指出,理解我们很少关注的犯错,才有利于智能体的研究和发展。 书中从分析生物人的感知功能谈起,以生动的例子介绍了人的视觉、听觉、触觉和体觉的解剖学知识及其基本原理。之后又进入人的感情世界,从人的情感、回忆、梦境,一直谈到灵感和错觉。在这个过程中,作者又适时讨论计算机在处理人的感知世界时会遇到的麻烦及处理原则,还不忘介绍一下讨论对象的数学背景。高斯、黎曼、莱布尼茨、庞加莱、爱因斯坦、图灵等大师级人物的名字频频出现。作者不费力地游弋于生命、计算机、数学、物理等几大学科之间,让读者经历一次目不暇接的跨学科科学旅游。再加上一个个有趣的故事,还有诗,画,歌,甚至还有乡愁!这样的科普,很新鲜、很解惑,又易于接受。
目录
简单视觉错觉?/?1
1 视觉倒像 / 2
2 颠倒的视界 / 7
3 看不见的萨摩耶 / 13
4 看得见的斑点狗 18
5 火星人脸的阴影 / 23
6 外国的月亮比较圆 / 32
复杂视觉错觉?/?39
7 眼中的黎曼流形与距离错觉 / 40
8 由粗到细、大范围优先的视觉 / 53
9 抽象的颜色与高层认知 / 61
10 自举的视觉与智能 / 70
11 主观时间与运动错觉 79
听觉、体感和语言?/?89
12 听觉错觉与语音、歌唱的智能分析 / 90
13 视听错觉与无限音阶中的拓扑 / 101
14 我思故我在? / 114
15 可塑与多义 / 122
梦、顿悟与情感?/?133
16 庄周梦蝶与梦境学习 / 134
17 灵光一闪与认知错觉 / 144
18 情感与回忆错觉 / 153
群体智能?/?161
19 群体的情感共鸣:AI 写歌,抓不住回忆 / 162
20 群体智能与错觉 / 169
总结?/?181
21 平衡:机器 vs 智能 / 182
附录?/?201
附录一:深度学习,你就是那位 116 岁的长寿老奶奶!?/?200
附录二:童话(同化)世界的人工智能?/?205
参考文献 / 209
图片来源 / 229
前言
“军平,我觉得你不妨用科普的形式把你的观点写出来!”
看完我写的技术报告,我的博士生导师王珏研究员对我说道。
1?萌芽
那是 2006 年 11 月,我博士已毕业 3 年。小朋友刚 2 岁,每天抱着她闲逛,看着她日渐成长,痛并快乐着。她虽尚不能流畅交流,但我相信,多跟她说些话,她总能潜移默化吸收一些,也许对她今后的智力发育会有大的帮助。出于天生的好奇心重,我也顺便观察着她的智力发育变化,比如发错音的问题、颜色辨识困难的现象,诸如此类。那段时间,我对人的认知心理也有些兴趣,顺便看了点皮亚杰的《儿童发展心理学》、华生的《行为主义》等心理学方面的书籍。有一阵子,经常为自己在智能发育方面的一些奇思怪想激动不已。为了能方便总结,我向陆汝钤老师申请了去北京的中科院数学所访问 2 个月。陆老师很快就答应了,并将中科院计算所他的办公室借给我使用。在那里,我完成了图 0.1 所示的技术报告,还见到了就在隔壁房间办公,我一直很仰慕的人工智能老前辈史忠植老师。偶尔也会去隔壁办公室,跟当时正在用传统机器学习和计算机视觉方法在人脸识别领域奋斗着的山世光,以及在生物信息学领域钻研着的贺思敏闲聊。
我把技术报告给陆老师看后,他说还不够深入。王珏老师也说,缺乏实验在计算机领域是站不住脚的。如果只是想表达自己的观点,不如用科普的形式写出来,就像厦门大学的集禅宗、古琴、机器作曲于一身的周昌乐教授写的《无心的机器》那样。
仔细想了想,感觉工作确实也不是太完整,不如放一放,再多积累点,多看看世界,也许会更丰满。
2?修身
时间过得飞快。2007 年 9 月,我去加州大学圣迭戈分校访问了半年,旁听了不少课程和报告,如提出 Adaboost 算法的约法夫?弗洛德(Yoav Freund)的“机器学习”课,也听到杰弗里?希尔顿(Geoffrey Hinton)介绍他 2006 年发表在 Science(《科学》)上,在深度玻尔兹曼机方面的研究进展。不过当时,大家多还处在对“深度学习”将信将疑的阶段,毕竟第二波人工智能的低潮把大家打击坏了。回国后,我继续做我的博士研究方向——基于流形学习的降维研究。我们小组针对高维数据降维后如何做统一的客观评估提出了一套准则,也基于代数拓扑中的持续同调思想,构造了主单纯复形的监督学习算法。在远距离身份识别这一块,基于人可以根据人的走路轮廓而不需要对图像进行细粒度的分析就能识别行人这一特点,提出了基于时间不变的步态模板的行人识别算法。
这期间,我也为人工智能两个主流会议做了些服务性工作,包括给2013 年在北京举行的“人工智能国际会议”(IJCAI)做学生志愿者主席,以及 2014 年在北京举行的“机器学习国际会议”(ICML)做当地组委会成员。2013 年 11 月的第一个周末,我和西安电子科技大学高新波教授承办了“第十一届中国机器学习及其应用研讨会”。该会议 2002 年始于复旦,由陆汝钤老师发起,2005 年转至南京大学,在王珏老师、周志华教授的推动下,成为国内机器学习领域最负盛名的研讨会。通过参加这些会议,我对人工智能的认识也深入了一些。
2014 年 8 月—2015 年 8 月再次赴美国访问,并被宾夕法尼亚州立大学聘为研究助理(Research Associate),在信息科学技术学院王则 (James Z. Wang) 教授的指导下做些机器学习和气象预测等相关的研究。临行前,特地去拜见了我的博士导师,他又给我讲了一些他对人工智能发展近况的思考,并给我建议了一些值得关注的方向。而我到美国后,也利用这一年的时间,安安静静地思考了人工智能的发展与不足。
回国后,发现深度学习已经如火如荼,不跟进几乎很难在预测性能上占得优势。在发现单块显卡处理能力的问题后,我们便开始陆续购入了更多的 GPU(图形处理器)显卡,来帮助增加计算能力,目前已经有了 22块像样的显卡。对我来说,与以往最明显的区别,就是发论文的成本高了,这让人多少有些心痛。以前一支粉笔、一块黑板、一个仿真程序可能解决的事,现在靠大数据、GPU、硬盘存储系统,一篇论文的成本可能接近 10万元。更何况,还经常会碰到参数调了半天,算法不收敛的状况。
2017 年 5 月左右,应邀去西安参加了两次郑南宁老师主持的人工智能的相关研讨会,并参与筹备中国自动化学会混合智能专委会。7 月,国务院发布了《新一代人工智能规划》,其中谈到了人机回路。8 月,混合智能专委会成立,西安交通大学薛建儒老师任主任,我很荣幸当选为副主任之一。同年,我们开通了专委会的微信公众号。
3?科普
2018 年上半年,机缘巧合在《科技日报》上写了篇关于对抗生成网的访谈报道。想着要给大众读,趣味性就得加强一点。所以,我在报道中讲了两个小故事,一是奥地利小说家斯蒂芬?茨威格写于 1941 年的小说《象棋的故事》里,一个囚犯在监狱里自己跟自己下国际象棋的故事,另一个是金庸的《射雕英雄传》里周伯通被困桃花岛后的双手互搏。虽然内容与对抗生成网的目的有一定的出入,但这两个故事都比较形象地讲述了同一个模型里存在对抗的事实。后来从阅读量来看,反响还不错。
于是感觉自己可以尝试写点科普文章。刚巧专委会也需要对微信公众号进行宣传,而我又一直对论文成本上升太快、经费有点撑不住耿耿于怀。某天在“追寻长寿之道”时突然发觉个体和统计的差异如此明显,觉得这个道理似乎能解释深度学习的优异和不稳定性,便给专委会微信公众号连续写了两篇文章,《深度学习,你就是那个 116 岁的长寿老奶奶》和《童话 ( 同化 ) 世界的人工智能》,科普深度学习之现状以及对现在产业和学术界带来的同化效应。在文章的最后,我留了个尾巴,我认为现在的研究尚不能完全解开智能的谜团。也许,答案要从犯错中去寻找。
这两篇文章的反响也是出奇的大,我便跟我博士导师的好朋友、对我有很大帮助的中国科学院自动化所的王飞跃老师在微信上说了这件事。开心之余,他建议我不妨写个科普系列。
要写科普系列,我想起了 2000—2003 年在北京读博士期间经常逛北京大学校区二手书摊时偶得的一本科普书《哥德尔,艾舍尔,巴赫——集异璧之大成》。王珏老师告诉我这是本好书,要好好看看。然后跟我讲了译者之一、严勇的导师、北京大学马希文教授(也是周昌乐的导师)的一些轶事,比如精通六国语言,对此书在信达雅的翻译处理方面赞叹不已。2016年,陆汝钤老师来复旦时又给我补充了一些对马希文教授的回忆。再说说这本书,它在美国一直是本科普畅销书。不过,不足在于,这本书第一版发行的时间是 1979 年,正处在人工智能第一波的寒冬中,对于 1979 年以后的人工智能的进展、观点变更没有涉及。其次,书还是太厚了。真心有兴趣把这本书细细读完的,十有八九是与人工智能相关的科研工作者或从业人员。另一本是 2015 年我在美国买的畅销图画书,克莱夫?吉福德 (Clive Gifford) 撰写的 Eye Benders: The Science of Seeing and Believing (《眼睛弯管:看和相信的科学》),书中讲了不少视觉错觉的例子,但并没有从人工智能的角度去做深入分析。
所以,我想结合两本书的一些背景知识,再加上我 2006 年以来对智能结构发育的一些认识和再认识,以及近年来对人工智能的许多更新理念来撰写。
而在写作手法上,我希望能做到专业和引人入胜。俗话说,科学家上报纸,就会少一圈朋友;科学家上电视,就没有朋友了。所以,写的内容我都反复斟酌过,确保逻辑通畅、无漏洞,防止没朋友。但人不是神,总有可能会出错。如果仍有遗漏和问题,后面我会做个勘误表。而关于如何引人入胜,我采用了与我所读过的科普书不太一样的风格,即小故事加严
肃科普的形式,偶尔会穿插几个科学笑话,当然还要有点中国特色,这个风格基本贯穿了全书。
不过,万事开头难。虽然每一节要写的基本路线我都清楚,但怎么开头都挺头痛的。所以,我想了一些办法。比如跑跑步、遛遛狗,期望缓解之余还能释放点多巴胺来启发一下,一有好的点子就赶紧记下。当然,还得有充足的时间投入。所以,在完成这个系列的过程中,我把很多朋友的讲座邀请、登门讨论都无情地拒绝了。没办法,有时候创作和研究都需要一个人有不间断的独立思考时间。这应该就是做科研要有的狂热吧。另外,有的时候短时间高强度的集中思考,确实能促进思维、帮助人更深入细致地思索问题的可能答案。虽然这段时间平均每天睡眠约 5 个半小时,确实很累,每当想放弃时,我就会想起美国作家罗伯特?卡尼格尔写的《知无涯者:拉马努金传》中描述过的印度数学家拉马努金追求数学真理的过程,就会想起因玻尔兹曼方程和朗道阻尼的工作而于 2010 年获得“数学界的诺贝尔奖”——菲尔兹奖、主攻最优输运理论的塞德里克?维拉尼 (Cédric Villani) 在其书《一个定理的诞生:我与菲尔茨奖的一千个日夜》中提到的坚持和努力。也会想起近代著名学者王国维在《人间词话》中提及的古今成大事业、大学问者必经之三重境界:
1. 昨夜西风凋碧树。独上高楼,望尽天涯路。——北宋晏殊《蝶恋花?槛菊愁烟兰泣露》
2. 衣带渐宽终不悔,为伊消得人憔悴。——北宋柳永《蝶恋花?伫倚危楼风细细》
3. 众里寻他千百度。蓦然回首,那人却在,灯火阑珊处。——南宋辛弃疾《青玉案?元夕》
总之,写这个系列对我来说,是物超所值的,因为在科普的同时,我也在其中总结了不少我对人工智能诸多问题的观点和探讨,希望能给那些对人工智能感兴趣的人有所启发。
最后感谢中国自动化学会混合智能专委会薛建儒主任、陈德旺副主任、王晓师妹对本科普系列在微信公众号传播的大力支持,感谢科学网连续 20余次推荐本科普系列文章至科学网头条,也感谢众多微信公众号如中国工程院院刊、中国自动化学会等的推荐。这些支持,让更多对人工智能感兴趣的人了解了这个科普系列的工作。另外,我也衷心感谢很多朋友在本书撰写中提出的宝贵意见,尤其是与我一同从 2002 年“第一届中国机器学习及其应用研讨会”出道的、北京交通大学的于剑教授对本书一些概念的讨论。感谢家人和我的学生们的理解和默默支持。没有他们在生活和科研上的顺畅配合,我也不可能有多余的时间来写这个科普系列。也感谢国家自然科学基金(资助号:61673118)、上海市“脑与类脑智能基础转化应用研究”市级科技重大专项资助(项目编号:NO.2018SHZDZX01)和张江实验室对本书的支持。
仅以此书献给我的博士导师:王珏研究员
张军平
写于 2018 年 12 月 24 日
视觉倒像1
基于人工智能设计的机器会犯错,其错误要么是因为用来学习的数据
量太少,无法涵盖解决问题所需要的数据或样本空间;要么是由于训练太
过精细,导致没办法对新来的未知样本或数据形成有效预测,俗称为过拟
合;要么是基于人工智能设计的模型本身能力低,结果对样本的刻画能力
不足;要么是硬件条件受限,无法完成相关任务。不管哪种错误,总是多
少能找到原因的。
而智能体尤其是人类的犯错,却有很多缺乏明晰的解释。人类会在很
多方面犯错,产生错误的判断,视觉上、听觉上、距离上、认知上、情绪上,
甚至人类发育的基础,即基因上,都存在犯错。为什么这样一种错误频出
的智能体,却能凌驾于其他生命之上成为地球的主宰呢?这些犯错到底有
什么用呢?了解这些犯错,说不定能从中找出一些有用的线索,来重新思
考人工智能的发展方向。
我们不妨先从人类在视觉上的犯错表现聊起。这种犯错常被称为光学
错觉(optical illusion)。
先从光学成像说起,第一个还没得到完全认识,却又是最基本的,是
视觉倒像问题。小孔成像原理(图1.1)告诉我们,要观测的目标通过瞳孔
的凸透镜原理映射至视网膜上,是一个标准的倒像。如果是机器,则可以
简单视觉错觉
3
通过光学变换还原成正常的影像。而智能体似乎并没有光学变换的能力,
从视网膜获得的视觉信息,会经过视神经送往大脑。人类的视网膜上位于
中间位置(俗称中央凹,fovea)的视锥细胞(cone cells)和周边的视杆细
胞(rod cells)主要承担感受光强、颜色和运动状态的功能,似乎没有自动
翻转的能力。
光线瞳孔
视网膜
中心凹
盲点
视神经
图1.1 眼睛的小孔成像原理
假如没有自动翻转成正常影像而倒着看世界会如何呢?金庸先生的武侠
书《射雕英雄传》谈到过。西毒欧阳锋为了学习从黄蓉那儿弄来的假“九阴
真经”,居然凭自己的深厚功底,将全身经脉颠倒移位,逆练“九阴‘假’经”。
结果走火入魔,变成手当足、足当手来倒立走路。武林中人都以为他从此废
掉了。可没曾想,经过一段时间后,他似乎已经习惯这种颠倒的世界,而且
功力精进,练成了一套新的武功,并在第二次华山论剑中夺得天下第一。
当然,这只是小说中的虚构。但从历史来看,还真有科学家做过这样
的尝试。1897年,美国心理学家乔治·斯特拉顿(George Stratton)发表
了《视网膜没有逆转视觉》的论文[1]。在论文中,他详细介绍了关于视网
膜倒像的实验(图1.2)。他给自己戴了一副凸透镜,并把其中一只眼
睛完全遮住。在前四天,本已被凸透镜纠正过来的正像,他看到的却始终
是倒的。结果,以平时经验去拿东西都很失败和别扭。
评论
还没有评论。