描述
开 本: 16开纸 张: 轻型纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787571003012
△硬核数学家、凯瑟琳·理查兹奖得主 *力作
《科克斯书评》《出版商周刊》《金融时报》《卫报》重点关注!
△那些看似高深莫测的算法黑箱,任何人都能在这里读懂
△解码谷歌、脸书、推特、亚马逊等科技巨头的智能生活操控术,看社交网站和App如何定义你的个性、影响你的行为
△破除AI神话,重塑你对人工智能时代的认知思维
这是一个“算法世界”:建立在数据之上的算法指导社会的运行、决定我们能在网上看到什么;它更是自动驾驶、智能管家、未来医疗以至智慧城市的基石。如果我们不了解算法如何使用数据,就无法知道人工智能将如何改变我们的生活。通过采访谷歌和剑桥分析公司的数据专家、亲自模拟高科技巨头的算法模型,萨普特带我们直击智能产品背后的秘密、思考数字科技给社会带来的风险。
我们对科技和互联网的日益依赖,使数据研究者能够收集与我们有关的数据,比如买过哪些东西、对哪些话题感兴趣等。借助这些数据,他们能够窥视我们的日常、预测我们的行为,并建立起试图控制我们生活的算法。这些算法从*冷静、理性的角度分析我们的性格、影响我们的选择,并放大了社会偏见和歧视的威力。
通过探讨*前沿的人工智能技术,本书还揭露了一个惊人事实:人工智能必须以大数据和算法为基础,我们的生活可能永远无法出现真正的超级AI。
部分
算法在监视我们
互联网对个人数据了什么?/1
算法不停地旋转和降维你的数据集,直到它能读懂你、透视你。它使脸书能用点“赞”情况预测你的性格,从表情、照片甚至你与屏幕的互动来评价你的精神状态。算法的高维理解完胜你对自己的了解,但它们并不具备完美的预测能力和公平公正的态度。
1 第 1 章|数学不仅大煞风景,还会败坏道德?
1 谷歌人:统计数据越多越好
5 “伯明翰 ISIS”:数学杀伤性武器引发的血案
9 第 2 章|算法无处不在,我们却对它一无所知
9 黑箱操控—互联网巨头不想说的事
11 给重定向广告加点“噪音”
13 算法也会歧视人
16 第 3 章|你以为自己了解朋友?脸书比你更懂他们
17 社交网络的黑箱世界
20 主成分分析法:15个帖子就能让他人读懂我们的生活
25 第 4 章|脸书比你更了解你的人格和行为
26 你点的“赞”在暴露你的智商
28 你的情绪已被脸书编号
33 第 5 章|剑桥分析公司如何玩转总统选举
34 人格决定选票
37 为政治操控每一种情感
40 算法告诉共和党,该去星巴克拉选票
44 脸书很了解你,但它未必能预测你的行为
49 第 6 章|要算法毫无偏见?不可能!
50 定义偏见是道数学难题
54 相同的误报率和相同的漏报率不可兼得
58 只有悖论,没有公平
61 第 7 章|数据炼金术士
62 算法不知道的事情
66 精准广告:互联网公司滥用了私人信息吗?
68 人肉预测与模型预测,谁更胜一筹?
第二部分
算法想控制我们
网络能否影响情绪和行为?/73
脸书过滤我们的消息流,推特过滤我们的时间轴,谷歌过滤我们的搜索结果。我们越是点击某类信息,这些“过滤器”算法就越是推送相关内容。由此形成的回声室和气泡是否真如媒体所说,让我们只看到自己想看的东西,以至我们的行为也受控于它们?
75 第 8 章|预测竞选结果的模型是怎么“炼”成的?
76 选举结果只有两种,但概率世界并非如此
82 群众的智慧 = 超级预言家
88 不考虑市场的模型不是好算法
93 第 9 章|互联网本质:“大家也喜欢”
94 亚马逊推荐:“私人定制”的秘密
98 另一个世界的音乐排行榜
101 让“链接果汁”流动起来
104 羊群效应:读者似乎永远不长记性
107 第 10 章|人气竞赛
108 时事造人,算法造 YouTube 网红
112 被谷歌学术“劫持”的科学家
118 美国陌陌 App 的速配秘诀
122 第 11 章|过滤气泡在翻腾
122 脸书、谷歌、推特在误导我们?
127 一次点击,次次点击
131 为什么阴谋论者比科学家更淡定?
135 其实,负面信息很难左右你的情绪
141 第 12 章|网络回声室:互联网时代的信息闭塞?
142 社交媒体的气泡并非密不透风
145 推特上,你和反对者只隔六个人
150 第 13 章|谁在看假新闻?
150 曼德拉效应
155 特朗普是天选之人?
160 虚假报道本身就写于气泡之中
第三部分
人工智能的未来
算法越来越像人类了吗?/165
既没有人类的规则手册,也没有专门的搜索算法,阿尔法狗 – 零通过无数局自我对弈成为围棋大师。这是否预示着,算法自行发明智能机器并系统迭代自身的奇点已经临近?为何埃隆·马斯克等精英都愿意相信,超级人工智能将带来世界末日?
166 第 14 章|“学”出来的性别歧视
167 算法决策:对付人类偏见的办法
169 谷歌搜索如何理解我们的语言 ?
176 无监督学习把算法变成“坏学生”
183 第 15 章|计算机作家
184 一个智能作家的诞生
188 如何训练神经网络成为托尔斯泰?
192 苹果 Siri 与神经网络聊天机器人
199 第 16 章|智能超级玩家
200 从游戏白痴到游戏天才,算法仅需自学数周
203 卷积神经网,卷积出奇迹
205 神经网络能够识别人脸,却无法规划全局
209 阿尔法狗 – 零:强人工智能离我们只有十年?
213 第 17 章|细菌大脑
214 世界末日与超级电脑
218 人工智能 PK 微生物智慧
223 胃肠道细菌的“智能”为何让聪明人如临大敌?
228 第 18 章|回到现实吧
228 “埃隆·马斯克是个白痴”
231 推特的好友推荐让我们活得更美好
《科克斯书评》(Kirkus Reviews)
本书独具特色……对互联网数据操控的分析颇具洞察力和趣味性,对现在的流行观点抱有怀疑态度。
《出版商周刊》(Publishers Weekly)
一本给人启迪的书。
《金融时报》(Financial Times)
萨普特的专业分析和质疑观点因本书中的趣味案例而不再枯燥乏味,这些案例包括寻找街头艺术家班克西,以及训练神经网络玩《太空入侵者》游戏。
《科技新时代》(Popular Science)
本书传递了非常重要的讯息。
《卫报》(The Guardian)
萨普特对操纵我们数字生活的庞大系统进行了深入的思考,抽丝剥茧地解开了这些系统背后的数学秘密,清晰地向我们展示了这些看起来十分高级的运算,这些运算控制着系统输出的结果,同时也制约着这些系统本身。
约翰·默多克(John Burn–Murdoch)
英国《金融时报》数据新闻记者
当数以百万计的人慢慢意识到自己落入了陷阱,正在将数字生活的信息交给科技巨头时,萨普特通过采访算法研究领域的内部人士,结合引人入胜的亲自演示,向读者揭示了数据“炼金术士”们试图说服和预测我们的方法,并为我们验证算法是否真的像他们吹嘘的那样无所不能。
蒂曼德拉·哈克尼斯(Timandra Harkness)
《大数据》(Big Data) 作者
你一定听说过有些算法能够操控你的生活,所以你很可能想要知道两件事:算法是如何操控你的生活的?对于这种操控,我们到底应不应该担心?萨普特以坦诚的态度和大多数人未曾接触的深度知识回答了这两个问题。
凯特·耶茨(Kit Yates)
英国巴斯大学数学科学系高级讲师
这是一本关于数学在现实世界中如何应用的一流作品,写得十分引人入胜。每一章都讲述了一个回味无穷的故事,而萨普特热情和诙谐的风格也表明,数学家不仅仅是一台把咖啡变成定理的机器。
第 1 章|数学不仅大煞风景,还会败坏道德?
2016 年 3 月,三位来自伦敦的研究员和一位来自美国得克萨斯州的犯罪学家在《空间科学》 (Journal of Spatial Science) 期刊上发表了一篇论文。文章以枯燥、学究的方式呈现研究方法,但论文本身并不深奥和抽象。文章标题开宗明义:“寻找班克西 (Banksy)—地理侧写(Geographic Profling) 解开现代艺术之谜”。也就是通过数学来追踪世界上负盛名的涂鸦艺术家。
谷歌人:统计数据越多越好
研究人员首先通过班克西的网站来找到他街头作品的位置。之后他们系统地造访班克西的所有画作,包括出现在伦敦和他家乡布里斯托的涂鸦,并用 GPS 记录下它们的位置。采集到这些数据后,研究人员绘制了一个热图。假定班克西通常在家附近进行创作,那么热图上色调更亮的区域就表示班克西很有可能曾在此生活。
伦敦的地理侧写图上热的点离一个人的女友曾经的住址仅 500 米,以前有人推测这个人可能就是班克西。而在布里斯托热点图上,颜色亮的地方同样是这个人曾经的住处和他效力过的足球队的球场附近。文章因此推断,符合地理侧写特征的这个人极有可能就是班克西。
刚读到这篇文章时,我的感受和看到同行做出一些成绩时的大多数学者一样五味杂陈,既觉得有趣,又感到嫉妒。这项研究是对数学的聪明应用。这正是我孜孜以求的应用数学 :充分发挥想象力,然后合理运用数学方法。真希望做这项研究的是我本人。
但接着读下去的时候,我开始有些不舒服了。我喜欢班克西,在我的咖啡桌上就放着一本他的涂鸦作品集,书中还有他的俏皮话语录。我还曾徜徉于伦敦的街头巷尾,寻觅他的墙上涂鸦。曾经有个视频展示的是他意义非凡的艺术作品在纽约中央公园货摊上无人问津的情景,我不禁对此开怀大笑。他在约旦河西岸(The West Bank)和法国加来(Calais)移民营的作品,让我对自己享有的特权深感不安,提醒我身在福中要知福。我无须某些情感冷漠的学者用算法告诉我班克西是谁。他之所以成为我们眼中的班克西,是因为他会在夜晚悄悄地潜入我们的街区,然后在天亮前留下艺术作品,揭示我们社会的虚伪,正所谓“事后拂衣去,深藏功与名”。
数学在摧毁艺术。冷冰冰的逻辑统计在伦敦街头追踪穿着套头衫的自由斗士,这是荒谬的。寻找班克西应该是警察和小报记者的活儿,不应该是拥有自由思想的学者们该做的。他们自作聪明,以为自己是谁?当读到这片关于班克西的文章时,我的作品《足球数学》(Soccermatics)快要出版了。我写这本与足球相关的书,目的是带领读者在这项奇妙的运动中开启一场数学之旅。通过这本书,我想说明一点 :足球场上的结构和各种阵法里都隐藏着数学的影子。
《足球数学》出版之后,媒体对它满怀兴趣,每天都要求我接受采访。大多数情况下,记者们和我一样为足球里蕴藏的数学奥秘而着迷,但也不断向我抛出一个不那么容易回答的问题。记者们告诉我,读者很想知道我是否认为足球中蕴含的数学夺去了这项运动的激情。
“当然没有!”我有些愤怒地回答。我解释,足球这项博大精深的运动有足够的空间让逻辑思维和激情并行不悖。
但是通过数学找出班克西难道就没有夺走他艺术作品的一丝神秘感吗?可笑的是,我也将数学用在了足球上面。或许我对足球的所做的和那些空间统计学家加诸在街头涂鸦上的事情没有丝毫差别。
2016 年 5 月底,谷歌邀请我到他们的伦敦总部,做一个关于足球里蕴藏着的数学奥秘的演讲。演讲是由《足球数学》的编辑丽贝卡安排的,我们都很想参观一下谷歌的研究部门。
谷歌果然没有让我们失望。他们的办公室非常好找,就坐落在白金汉宫街上,大堂里耸立着高大的乐高模型,冰箱里塞满了保健饮料和超能食品。他们称自己为“谷歌人”,显而易见,他们对自己的办公环境非常满意。
我向一些谷歌人询问公司目前的情况。此前我就听说过自动驾驶汽车、谷歌眼镜、隐形眼镜、送货上门的无人机,以及向我们的身体注射纳米颗粒来检测疾病的传闻,我想知道有关它们的更多信息。但是谷歌人戒备心很强。谷歌的创新活动曾经因为采纳了一些过于疯狂的创意而招致批评,后续的公关活动还不太成功。在这之后,公司政策规定员工不能再向外界过多透露公司的情况。当时谷歌的高级技术项目负责人是雷吉娜·杜根(Regina Dugan),此前她在美国国防部高级研究计划局(Defense Advanced Research Projects Agency, DARPA)担任同样的职务。她在谷歌推行“适度知情”(need to know)的信息共享原则。研究部门目前由许多小组组成,每个小组负责各自的项目,并在小组内部共享想法和数据。
一名谷歌人禁不住我们连番的追问,终于愿意和我们聊起一个项目。据他了解,谷歌正通过 DeepMind ① 来对肾衰竭进行医疗诊断。他们计划利用机器学习来发现医生漏诊的肾脏疾病的模式。 DeepMind 是谷歌的一个研究部门,它已经让一台计算机成为了世界上好的围棋选手,并开发了一种算法来精通《太空入侵者》(Space Invaders)等老式街机游戏的玩法。现在,它可通过检索英国国民医疗服务系统(National Health Service,NHS)的病人诊断记录,找出疾病发生的模式。未来, DeepMind 将成为医生的智能计算助手。
和我次读到那篇关于班克西的文章时一样,我再次觉得五味杂陈,既嫉妒谷歌人又渴望自己成为他们当中的一员,利用算法发现疾病、改善医疗保健。想象一下,如果你能借助你所擅长的技能,通过自己获得的财力和数据来执行这样的项目以拯救生命,那将是一件多么了不起的事情。
但丽贝卡不是那么激动,她说 :“我不确定是否希望谷歌拥有我的一切医疗数据。想到他们可能将这些医疗数据和我的其他个人数据一起结合使用,我就忧心忡忡。”
她的反应让我再度陷入思考。如今关涉健康和生活方式的数据库正在以前所未有的速度积累数据。谷歌过去一直遵守严格的数据保护原则,但泄密的风险始终存在。为了更加全面地了解我们以及我们生病的原因,未来的社会可能会要求我们将使用谷歌的搜索记录和我们的社交媒体及健康数据关联起来。
在我演讲之前,我们没有太多时间来讨论被数据所驱动的医学研究有何利弊。而当我一打开足球的话匣子,我很快就忘记了整件事情。谷歌的员工们对我的演讲很感兴趣,并且提了不少问题 :、的摄影跟踪技术是什么?通过不断地改善策略,机器学习能够取代足球经理吗?另外他们还提了一些关于数据采集和机器人足球的技术问题。
谷歌人没有问我是否认为数据剥夺了足球运动的灵魂。依我看,他们高兴还来不及。只要让球员佩戴 24 小时的健康和营养监控设备,他们就能更全面了解球员的身体状况。对于谷歌人来说,他们获得的数据越多越好。
“伯明翰 ISIS”:数学杀伤性武器引发的血案
我和谷歌人有一些共同之处,正如我和研究班克西的统计学家有一些共同之处一样。在电脑上查询国民医疗服务系统的病人数据库,或者通过空间统计学追踪罪犯,当然很酷。不论是在伦敦、柏林、纽约,还是在加利福尼亚、斯德哥尔摩,上海或东京,都有和我们一样的数学极客在收集和处理数据。
我们设计算法来识别面孔、理解语言、了解我们的音乐品味 ;我们创建个人助理和聊天机器人来帮你排除电脑故障;我们预测选举和比赛结果 ;我们帮助单身人士找到理想伴侣,或帮助他们对现有的潜在交往对象一一筛选 ;我们尝试在脸书和推特(Twitter)上给你推送与你为密切相关的新闻 ;我们确保你找到的假日去处和廉价航班。我们的目的就是通过数据和算法让生活变得更美好。
但事实真的如此简单吗?数学家正在让世界变得更加美好吗?我对空间统计学家解密班克西的反应,足球记者对我《足球数学》一书中数学算法模型的反应,以及丽贝卡对谷歌使用医疗数据库的反应,并非不正常或多虑。相反,这些反应非常自然。算法的使用无处不在,它帮我们更好地认识这个世界。但如果这意味着算法要剥夺我们所爱的东西并且夺走我们的道德品质,我们是否还愿意更透彻地认识这个世界?我们开发的算法真是社会需要的吗?还是只为一小部分数学极客以及他们效力的跨国公司服务?当我们开发出日渐完美的人工智能(AI)后,是否存在算法接管这个世界并且主宰我们命运的风险?现实世界和数学间的相互作用从来都不是非黑即白的。所有人,包括我在内,有时都会对数学产生一种误解,认为它是解决所有问题的钥匙。应用数学家职业性地以“数学建模循环”来看待世界。现实生活中的消费者给我们抛出一个他们想要解决的问题,这个循环就开始了。不管是找到班克西还是设计一个在线搜索引擎,我们都会拿起自己的数学工具箱,打开电脑,编写代码,找到解决方案。我们运行算法,并将其结果提供给客户。接着他们给我们反馈,然后循环继续。
这种转动把手、模型循环的简单方式将数学家从现实世界中抽离,使谷歌人超然物外。在带有休闲玩具和室内运动场的办公楼里工作,谷歌和脸书里绝顶聪明的员工容易产生幻觉,认为一切问题尽在他们的掌控之中。象牙塔和外界的完美隔绝意味着我们的理论不会被现实挑战。这是大错特错的。现实世界存在实际问题,为这些问题提供实际解决方案是我们义不容辞的责任。除了计算,每一个现实问题都有其复杂的方面。在 2016 年 5 月参观谷歌之后的几个月里,欧洲和美国的时局充满了不确定性,而我也在报纸上见到了关于数学另外一面的报道 :谷歌搜索引擎提供带种族偏见的搜索建议 ;推特上的机器人账号传播虚假新闻 ;斯蒂芬·霍金(Stephen Hawking)担忧人工智能的潜在危害 ;极右翼分子(保守主义者)在算法建立的过滤气泡① 里结党聚集 ;脸书分析我们的个性并用于锁定目标选民。关于算法给我们带来危险的报道接二连三、层出不穷。当统计模型对英国脱欧和美国总统选举的预测失败后,人们甚至开始质疑数学家的预测能力。
一夜之间,媒体对数学的报道的话题全变了,足球、爱情、婚礼、涂鸦及其他有趣的主题被性别歧视、仇恨、反乌托邦、民意调查的尴尬结果所取代。
重读那篇关于班克西的科学论文时,我读得更加仔细,并且发现文章几乎没有提供关于班克西身份的新证据。研究人员绘制了 140 件艺术作品的确切位置,但他们只调查了一个怀疑对象的地址。英国著名小报《每日邮报》(Daily Mail)在 8 年前就已经判定这个怀疑对象就是班克西本人。《每日邮报》判断,我们的涂鸦艺术家来自郊区的一个中产家庭,而非一位如我们所愿的来自工薪阶层的英雄。
文章的作者之一,史蒂夫·勒库默(Steve Le Comber)在接受 BBC采访时坦陈他们重点关注《每日邮报》怀疑对象的原因。他说 :“很快我们就发现,靠谱的怀疑对象显而易见只有一个,而且大家都知道是谁。如果你搜索一下班克西和怀疑对象名字,你会得到大约 43 500 条搜索结果。”
在数学家着手此项研究很久之前,网络上就已经盛传班克西的真实身份。这次研究人员所做的只是将数字与这一信息联系起来,但未能真正说清楚这些数字的含义。这些科学家只验证了一个案例的一个怀疑对象。文章介绍了研究方法,但缺乏太多证据证实这些方法确实有效。可是媒体不关心研究的局限性。《每日邮报》一篇没有凭据的传闻成了一个严肃的新闻话题,《卫报》(The Guardian)、《经济学人》(The Economist)、 BBC 竞相报道。数学使传闻合理化,而且让人们相信可以通过算法来找到罪犯。
让我们将场景切换到法庭,设想一下,班克西不是因为他广受大众喜爱的街头艺术遭到指控,而是作为一个在伯明翰街道墙上绘制伊斯兰国恐怖组织宣传画的穆斯林被人控告。继续想象一下,警方在做了一点背景调查后,发现嫌疑人从伊斯兰堡搬到伯明翰后,涂鸦才开始涌现。但他们不能在法庭上采用这一调查结果,因为它不是证据。那么现在警方可以怎么做呢?很简单,他们可以叫数学家来帮忙。运用算法,警方的统计专家预测穆斯林班克西有 65.2% 的可能性就住在某栋屋子里,接着反恐特别行动队破门而入。一周之后,穆斯林班克西就会根据预防恐怖主义方案遭到软禁。
按照史蒂夫及其同事在他们的文章中提出的对研究结果的使用方法,上述情景的发生并非遥不可及。他们写道,寻找班克西“证明了以前的想法是可行的——对涉及恐怖主义的轻微行为(比如涂鸦)进行分析,可以帮助我们锁定恐怖分子基地,将恐怖行动扼杀在摇篮之中”。数学武器一朝在手,穆斯林班克西被指控、定罪。过去在间接证据里都非常弱的统计数据现在却成了强有力的实证。
然而,潘多拉的盒子这才刚刚打开。在成功找出穆斯林班克西后,私营企业会争先恐后地与警方签订合同,为其提供基于统计数据的建议。在获得首个合同后,谷歌会将警方的全部记录输入“DeepMind”(深度思维),以便找出潜在的恐怖分子。若干年后,政府将在公众的支持下引进“常识”措施,把我们的网页搜索数据和谷歌的警方记录数据库进行整合,“人工智能警官”就能够这样被创造出来。它们会通过我们的搜索和浏览数据推断我们的动机和未来行为。每个“人工智能警官”会配备一个行动小组,以便他们在深夜对潜在的恐怖分子发起突袭。这种黑暗的数学未来正以骇人的速度接近你我。
在展开长篇大论之前,我们就已经察觉到数学不仅会大煞风景,还会侵蚀我们的道德品质。它在给花边小报的流言蜚语提供合法性,它在诬告伯明翰公民进行恐怖活动,它还在帮助大量不负责任的公司积累海量的数据,建立超级大脑,监视我们的行为。这些问题到底有多严重?这些场景到底有多现实?为了找出答案,除了应用我掌握的方法之外,我别无选择。这个方法就是审视数据,统计数据,并且进行数学运算。
评论
还没有评论。