描述
开 本: 16开纸 张: 轻型纸包 装: 软精装是否套装: 否国际标准书号ISBN: 9787521705072
建构因果关系科学体系,在整个科学界掀起一场“因果革命”
从对“相关关系并不意味着因果关系”这一科学系统经典断论的反叛开始,掀起一场声势浩大的“因果革命”,为科学界提供了一套全新的方法论——因果关系模型,应用覆盖范围从统计学、社会学、经济学到流行病学、心理学、基因学,再到生态学、地质学、气象学,当然还有计算机科学和人工智能科学。作者从因果关系的视角重新阐述了人类认知和科学文明的发展史。
引领人工智能的未来发展,让强人工智能的实现成为可能
借助因果关系理论颠覆人工智能与机器学习的理论范式,从发现关联、解析大数据的神经网络和深度学习,跃升至揭示关联与数据背后的深层逻辑的因果关系模型,赋予人工智能以真正的人类智慧甚至道德意识,让人工智能与人类能在彼此合作的基础上打造一个更好的未来世界。
既是AI领域**、前沿的理论建构作品,也是融合历史叙事与人文关怀的大众科普读物
从“**次认知革命”人类进化出想象力说起,对因果思维的发展历程娓娓道来,以深入浅出的话语阐述了动摇人工智能乃至整个科学界的方法论根基的新思想,引发了学界内外的广泛讨论,得到了《思想,快与慢》作者、诺贝尔经济学奖得主丹尼尔·卡内曼,“互联网之父”文特·瑟夫,《**算法》作者佩德罗·多明戈斯、中科大机器人实验室负责人陈小平、《变量》作者何帆等众多国内外**思想大师的推荐。
在本书中,人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果关系革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。
而因果关系科学真正重要的应用则体现在人工智能领域。作者在本书中回答的核心问题是:如何让智能机器像人一样思考?换言之,“强人工智能”可以实现吗?借助因果关系之梯的三个层级逐步深入地揭示因果推理的本质,并据此构建出相应的自动化处理工具和数学分析范式,作者给出了一个肯定的答案。作者认为,今天为我们所熟知的大部分机器学习技术,都建基于相关关系,而非因果关系。要实现强人工智能,乃至将智能机器转变为具有道德意识的有机体,我们就必须让机器学会问“为什么”,也就是要让机器学会因果推理,理解因果关系。或许,这正是我们能对准备接管我们未来生活的智能机器所做的*有意义的工作
推荐序
前言
导 言:思维胜于数据
第一章:因果关系之梯
第二章:从海盗到豚鼠:因果推断的起源
第三章:从证据到因:当贝叶斯牧师遇见福尔摩斯先生
第四章:混杂和去混杂:或者,消灭潜伏变量
第五章:烟雾缭绕的争论:消除迷雾,澄清事实
第六章:大量的悖论!
第七章:超越调整:征服干预之峰
第八章:反事实:挖掘关于假如的世界
第九章:中介:寻找隐藏的作用机制
第十章:大数据,人工智能和大问题
致谢
参考文献
前言
大约20年前,在为我的书《因果论》(Causality, 2000)作序时,我发表了一句颇为很大胆的定论,以致朋友们都劝我低调行事。“因果论经历了一次重大转变,”我写道,“从一个笼罩着神秘色彩的概念转变为一个具有明确语义和逻辑基础的数学对象。悖论和争议得以解决,模棱两可的概念得以阐明,那些依赖于因果信息、长期被认为是形而上的或无法解决的实际问题,现在已经可以借助初等数学加以解决了。简言之,因果论已经完成了数学化。”
如今读到这段话,我自觉当时还是有些短视了。我所描述的“转变”被证明是一场改变了诸多科学理念的“革命”,现在,很多人称之为“因果革命”,而它在学术圈激起的波澜正蔓延至教育和应用领域。我相信,眼下是向更多读者分享它的大好时机。
我在这本书中力图完成一个三位一体的使命:首先,用非数学的语言阐述因果革命的知识内涵,说明它将怎样影响我们的生活和未来。其次,分享在解决重要的因果问题时,我们的科学家前辈走过的英勇征程,无论成败,这些故事都值得讲述。
最后,回溯因果革命在人工智能领域的发源地,目的是向你介绍如何开发出用我们的母语——因果语言进行交流的机器人。新一代机器人应该能够向我们解释事情为何发生,为何以它们选择某种方式做出反应,以及大自然为何以这样而非那样的方式运作。一个更雄心勃勃的目标是,它们也应该能够让我们进一步认识人类自身:我们的思维为什么以这样的方式运行,以及理性思考原因和结果、信任和遗憾、目的和责任究竟意味着什么。
在我书写各种公式时,我很清楚我的读者是谁。但是当我为大众写作时,情况就不一样了——对我来说这是一次全新的冒险。这种新的体验很奇特,但它可以说是我生命中令我收获最大的一场自我教育之旅。我需要用读者的语言组织思路,猜测读者的背景、可能提出的问题和给出的反应,这让我比我在写作此书之前对所有那些公式的探索都更能加深我对因果论的理解。
为此,我将永远感激你,我的读者。我希望你能与我一样迫不及待地去寻求答案。
“你是否曾经对相关关系和因果关系的问题感到疑惑?这部内容精彩的著作对此问题给出了一个富有启发性的答案,且读来妙趣横生。”
——丹尼尔·卡尼曼,诺贝尔经济学奖得主,《思考,快与慢》作者
“在过去的30年间,珀尔所取得的成就为人工智能领域的进步提供了理论基础……他重新定义了‘思维机器’这一术语。”
——温顿·瑟夫,“互联网之父”之一,谷歌副总裁兼首席互联网专家,2004年图灵奖获得者
“如果因果关系不等于相关关系,那它是什么?感谢朱迪亚·珀尔划时代的研究成果,我们现在对这一问题有了精确的答案。如果你想要理解世界的运行方式,那么这本引入入胜、充满阅读乐趣的著作就是一个很好的起点。”
——佩德罗·多明戈斯,华盛顿大学计算机科学教授,《终极算法》作者
“朱迪亚·珀尔一直是人工智能革命的心脏和灵魂,更广义地说,他是计算机科学革命的心脏和灵魂。”
——埃里克·霍维茨,微软研究实验室主任兼常务董事
“如果把一个学科的疆域比喻为一个不规则多边形,那么多边形的所有顶点就定义了这个学科的边界。这本书的内容代表人工智能学科在因果推理方面的一个‘顶点’。突破性创新必然发生在所有‘顶点’划定的学科边界之外,而‘热点’则往往在边界之内。不了解‘顶点’,就难以展开突破性创新。”
——陈小平,中国科学技术大学机器人实验室主任
“尤瓦尔·赫拉利在《人类简史》中指出,人类进化史上的*次认知革命以发展出“想象不存在的事物”的能力为标志,《为什么》一书则更进一步提出,正是在这一能力的基础之上,人类发展出了因果思维。从原始部落组织狩猎行动,到孟德尔的基因遗传特征分析,从吸烟是否致癌的争辩到强人工智能是否可能实现的大讨论,无一不需要因果思维的指引。”
——罗振宇,得到App创始人
“真正的人工智能必须拥有什么能力?珀尔认为,要实现人工智能,就必须让机器具备因果推断能力。珀尔只手推动了人工智能领域的因果革命,面向大众读者推出《为什么》一书,这是一部关于人工智能与因果推断的科普之作,也是一部哲学与科学交相辉映之作。珀尔将技术与思想融为一体,系统阐述了因果关系之梯的三个层级。毫无疑问,该书将和《自私的基因》一样成为我们这个时代的经典之作。”
——梅剑华,山西大学哲学社会学院教授,现代外国哲学学会理事
“人类本能地想要寻找事物之间的因果关系,却长久地陷于迷雾之中。珀尔的《为什么》和卡尼曼的《思考,快与慢》一样,也是石破天惊、开辟鸿蒙的巨作,这本书介绍了新兴的因果推断科学,直达人工智能学科的前沿。阅读这本书,不仅能拓宽你的思维广度,而且能增加你的思维维度。”
——–何帆,上海交通大学安泰经济与管理学院教授,《变量》作者
“颇具启发性……珀尔教授在《为什么》一书中将其对于发现因果关系这一新科学的喜悦以及对于他的学生和同事所做工作的自豪感完全体现了出来……这本书不仅为广大读者们上了关于科学思想发展史的宝贵一课,也为相关领域的从业人士提供了判断大数据是否能够给出有效解释的概念性工具。”
——《纽约时报》
“因果关系是科学界和医学界争论*激烈、*难证明的命题之一。这本书将引领你真正开始思考因果关系,因为它适用于解决我们当今时代的诸多问题,包括吸烟究竟是否会导致癌症,胆固醇水平与心脏病的关系,等等。两位作者细致入微地讲述了这些案例的来龙去脉,实在精彩。”
——“科学星期五”,权威科学媒体
“‘相关关系不等于因果关系。’这一科学禁令已经为社会带来了严重的不良后果……朱迪亚·珀尔提出了一个革命性的数学解决方案……生物学、医学、社会科学和人工智能领域都因此获得了长足的发展。”
——《自然》杂志
思维胜于数据
每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。
—— 奥古斯都·德·摩根(1864)
本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。
这门新科学并没有一个时髦的名字,和我的许多同事一样,我简单地称之为“因果推断”。它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?
因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。
但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。
这门新科学解决了以下这些看似简单明了的问题:
一种特定的疗法在预防某类疾病方面的成效如何?
是新税法的颁布还是层出不穷的广告推销活动导致了销售额的增长?
由肥胖引发的医疗保健成本增长的总体占比为何?
雇用记录可否证明雇主实施了涉及性别歧视的招聘政策?
我打算辞掉工作。我究竟该不该这么做?
这些问题的共同点在于它们都与因果关系有关,我们可以通过诸如“预防”、“导致”、“由……引发”、“证明”和“该不该”这样的词语轻易识别出它们。这些词在日常生活用语中很常见,我们的社会也一直在不断提出这样的问题并寻求答案。然而,就在不久之前,我们甚至还无法在科学的范围内找到途径明确地表述这些问题,更别说回答它们了。
到目前为止,因果推断对人类最重要的贡献就是让这个科学盲点变成了历史。这门新科学催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。以数学形式表达因果关系的能力让我们得以开发出许多强大的、条理化的方法,将我们的知识与数据结合起来,并最终回答出如上述那5个涉及因果关系的问题。
过去的25年,我有幸成为参与了这一科学发展进程中的一员。在公众的视野之外,我曾目睹过它在学生宿舍和研究实验室中崭露头角,也曾听到过在严肃的科学会议中它的突破性进展所引发的共鸣。眼下,随着我们进入强人工智能(AI)时代,越来越多的人开始鼓吹大数据和深度学习 的无尽可能性,这使我越发感觉到,向读者展示这门新科学正在进行的大胆探索,其对于数据科学以及人类在21世纪的生活所可能造成的诸多影响是恰逢其时且激动人心的。
我知道,当听到我把这些成就描述为一门“新科学”时,你可能会心存疑虑。你甚至可能会问,为什么科学家没有在更早的时间就开始这样做?比如在古罗马诗人维吉尔首次宣称“幸运儿乃是能理解众事原委之人”(公元前29年)的时候,或者,在现代统计学的奠基人弗朗西斯·高尔顿(Francis Galton)和卡尔·皮尔逊(Karl Pearson)首次发现人口统计数据可以揭示一些科学问题的答案的时候。在这些关键性的时间节点上,他们很遗憾地与因果关系失之交臂,这背后的曲折故事我将在本书的有关因果推断的历史渊源的章节中一一道来。在我看来,阻碍因果推断这一科学产生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。
为了说明这一鸿沟的深度,不妨设想一下科学家在尝试表达一些明显的因果关系时所面临的困难——举个例子,气压计读数 B 可以用来表示实际的大气压 P。我们可以轻而易举地用方程式来表示这种关系,B=kP,其中 k 是某个比例常数。如今,代数规则能让我们以多种形式书写这个方程,例如,P=B/k,k=B/P,或者 B-kP=0。它们意义相同,即如果知道方程中的三个量中的任意两个,那么第三个量即是确定的。字母 k、B 或 P 三者中的任意一个在数学上都没有凌驾于其他两个之上的特权。那么,我们怎样才能表达这个确凿无疑的事实,即,是大气压导致了气压计读书的变化,而不是反过来呢?倘若连这一事实都无法表达,我们又怎能奢望去表达其他许多无法用数学公式来表达的因果推断,例如鸡打鸣不会导致太阳升起?
我的大学教授们就没能做到这件事,也从没有为此抱怨过。我敢打赌,你们的教授中也没人研究过这个问题。现在,我们已经明白原因为何了:他们从未见识过一种关于因果的数学语言,也从未发现到它的好处。这种语言的发展被好几代科学家所漠视,其实质是科学的一种衰败。众所周知,按动开关按钮会导致一盏灯的打开或关闭,夏日午后的闷热空气会促使当地冰淇淋店的销售额增加。那么,为什么科学家们没有像用公式表达光学、力学或几何学的基本法则那样,用公式去捕捉这些显而易见的事实?为什么他们容忍这些事实在原始的直觉中凝滞,而不去运用那些促使其他科学分支走向繁荣和成熟的数学工具呢?
答案部分在于,科学工具的开发是为了满足科学需要。正因为开关、冰淇淋和气压计这类问题我们处理起来驾轻就熟,所以用特殊的数学工具来解决它们的意愿始终不够强烈。但随着人类求知欲的不断增强,,以及社会现实开始要求人们讨论在复杂的法律、商业、医疗和决策情境中出现的因果问题,我们终于发现我们缺少一门成熟的科学所应提供的用于回答这些问题的工具和原理。
这种迟来的觉醒在科学中并不少见。例如,直到大约400年前,人们还满足于以本能来应对日常生活中的不确定性,从过马路到冒险打一架都包括在内。后来,赌徒们发明了复杂的赌博游戏,他们得以通过精心的设计来欺骗我们做出糟糕的选择。直到这时,布莱斯·帕斯卡(Blaise Pascal, 1654)、皮埃尔·德·费马(Pierre de Fermat, 1654)和克里斯蒂安·惠更斯(Christiaan Huygens, 1657)这样的数学家才发现有必要建立一门今天我们称之为概率论的数学科学分支。同样,只有当保险机构开始要求准确估算人寿年金保险的时候,爱德蒙·哈雷(Edmond Halley, 1693)和亚伯拉罕·棣莫弗(Abraham de Moivre, 1725)这样的数学家才开始关注死亡率统计数据,并据此计算人的预期寿命。与此相似,正是天文学家对天体运动精确预测的要求促使雅格布·伯努利(Jacob Bernoulli)、皮埃尔–西蒙·拉普拉斯(Pierre-Simon Laplace)和卡尔·弗里德里希·高斯(Carl Friedrich Gauss)建立了误差理论,让我们得以从噪声中提取信号。这些方法和理论都是今天统计学得以建立的基础。
具有讽刺意味的是,对因果关系理论的需求是在统计学产生的那一刻浮出水面的。事实上,现代统计学的创立正源自因果问题——高尔顿和皮尔逊提出了一个关于遗传的因果问题,并独具匠心地尝试用跨代数据来解答它。遗憾的是,这一努力失败了,他们没有停下来去问为什么,反而声称这些问题是禁区,转而去发展另一项刚刚兴起、不涉及因果关系的事业——统计学。
这是科学史上的一个关键时刻。给因果问题配备一套专属语言的机会眼看就要被成功捕捉并转化为现实,却被白白浪费掉了。在接下来的几年里,这些问题被宣布为“非科学”,被迫转入地下。尽管遗传学家休厄尔·赖特(Sewall Wright, 1889-1988)为此做出了艰苦卓绝的努力,但因果词汇仍然被科学界禁用了半个多世纪的时间。我们知道,禁止言论就意味着禁止了思想,同时也扼杀了与此相关的原则、方法和工具。
读者不必是科学家就能见证这一禁律的存在。在《统计学101》中,每个学生都会很快学会念叨“相关关系不等于因果关系”这句话。此话的确颇有道理!鸡打鸣与日出高度相关,但它显然不是日出的原因。
遗憾的是,统计学盲目迷恋这种常识性的观察结论。它告诉我们,相关关系不等于因果关系,但并没有告诉我们因果关系是什么。在统计学教科书的索引里查找“因果”这个词是徒劳的。统计学不允许学生们 说 X 是 Y 的原因,他们只能说 X 与 Y“相关”或“关联”。
这一禁律也潜移默化地让人们认同处理因果问题的数学工具毫无用武之地这一结论,与此同时,统计学唯一关注的就是如何总结数据,而不关注如何解释数据。一个了不起的例外是20世纪20年代由遗传学家休厄尔·赖特发明的路径分析(path analysis),它是本书所集中讨论和使用的关键方法的直接原型。然而,统计学及其相关学科严重低估了路径分析,使其在萌芽状态历经了数十年的压制。直至20世纪80年代,这个迈向因果推断科学的第一步仍然是科学界唯一的一步。统计学的其他分支,以及那些依赖统计学工具的学科仍然停留在禁令时代,错误地相信所有科学问题的答案都藏于数据之中,有待巧妙的数据挖掘手段揭示出来。
今天,这种以数据为中心的观念仍然阴魂不散。我们生活在一个相信大数据能够解决所有问题的时代。大学中“数据科学”方面的课程激增,在涉足“数据经济”的公司中,“数据科学家”享有极高的工作待遇。然而,我希望本书最终能说服你相信这一点:数据远非万能。数据可以告诉你服药的病人比不服药的病人康复得更快,却不能告诉你原因何在。也许,那些服药的人选择吃这种药只是因为他们支付得起,即使不服用这种药,他们照样能恢复得这么快。
在科学和商业领域,仅凭数据不足以解决问题的情况一再发生。尽管或多或少地意识到了其局限所在,但多数热衷于大数据的人仍然选择盲目地继续追捧以数据为中心的问题解决方式,仿佛我们仍活在因果禁令时代。
正如我刚才所说的,早过去30年里,情况发生了戏剧性的变化。如今,感谢那些设计精巧的因果模型,当代科学家得以着手解决那些一度被认为是不可能解决的甚至是超出了科学探索范围的问题。例如,仅在100年前,人们还认为“吸烟是否危害健康”这一问题是非科学的。仅仅是在研究论文中提及“因”或“果”这样的词都会在任何稍有名气的统计期刊上引发强烈的反对。
甚至就在20年前,询问一个统计学家诸如“是阿司匹林治愈了我的头痛吗”这样的问题,就会被视为相当于是在问他是否相信巫术。引用我的一位备受尊敬的同事的话,讨论这种问题“与其说是科学探索,不如说是鸡尾酒会上的八卦闲谈”。但今天,流行病学家、社会科学家、计算机科学家以及一些开明的经济学家和统计学家开始频繁地提出这样的问题,并能够借助具有高度精确性的数学工具作答。对我来说,这种改变就是一场革命。我斗胆称之为因果革命,是因为这场科学剧变真正接纳了我们人类理解因果知识的认知天赋,而不再将其拒之科学大门之外。
因果革命不是在真空中产生的;它背后有有数学工具上的发展作为支撑,这种数学工具最恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答出一些有关因果关系的最棘手的问题。能向公众展示这一演算法实在令我兴奋不已,这不仅是因为它拥有跌宕起伏的发展史,更是因为我真心期待未来某天它能在某些人那里发挥出超越我的想象的潜力……也许就出自本书读者之手。
因果关系演算法由两种语言组成:其一为因果图(causal diagrams),用以表达我们已知的事物,其二为类似代数的符号语言,用以表达我们想知道的事物。因果图是由简单的点和箭头组成的图,它们能被用于概括现有的某些科学知识。点代表了我们目标量,我们称之为“变量”,箭头代表这些变量之间已知或疑似存在的因果关系,即哪个变量“听从于”哪个变量。这些因果图非常容易绘制、理解和使用,读者将在书中看到许多此类因果图的示例。这么说吧,如果你会使用基于单向街道地图的导航系统,你就一定可以理解因果图,继而也就可以独自解决本书导言中提出的那些关于因果关系的问题。
虽然因果图是本书选择使用的主要工具,也是我过去35年的研究主题,但它并不是唯一可用的因果模型。有些科学家(比如计量经济学家)喜欢使用数学方程;另一些研究者(比如计量经济学家)则更倾向于借助一组假设来描述问题,这些假设表象化地概括了因果图的关系结构。但不管使用哪种语言,因果模型都应该该描述,哪怕是定性地描述数据的生成过程,换句话说就是那些在环境中控制并塑造数据生成的因果力量。
与图表式的“知识语言”并存的还有一种符号式的“问题语言”,它被用于表达我们想要回答的问题。例如,如果我们感兴趣的是药物(D)对病人生存期(L)的影响,那么我们的问题可以用符号写成:P(L|do(D))。换句话说,如果一个身体状况具有足够代表性的病人服用了这种药,那么他在 L 年内存活的概率(P)是多少?这句话所描述的就是被流行病学家称为干预(intervention)或处理(treatment)的概念,其对应于我们在临床试验中所测量的内容。在许多情况下,我们可能还希望对 P(L│do(D) ) 和 P(L|do(“”not-“” D))进行比较,后者描述的是拒绝接受相应处理(服药)的病人,也称“对照组”病人。其中,do-算子表明了我们正在进行主动干预而非被动观察,这一概念是经典统计学不可能涉及的。
在这里,我们必须调用一个干预算子 do(D) 来确保观察到的病人存活期 L 的变化能完全归因于药物本身,而没有混杂其他影响寿命长短的因素。如果我们不进行干预,而是让病人自己决定是否服用该药物,那么其他因素就可能会影响病人的决定,而服药与否两组病人的存活期差异也将不再能够被仅仅归因于药物。例如,假设只有疾病发展到末期的病人服用了这种药。那么这些人的情况显然不同于那些不服药的病人,两组的比较结果实际上反映的是其疾病的严重程度,而非药物的影响。相比之下,迫使患者服用药物或不服用药物,而不考虑其先决条件如何,则可以去除两组病人之间原有的差异,提供有效的比较结果。
在数学上,我们把自愿服药的患者中生存期 L 的观测频率记作 P(L|D),这就是统计学教科书中常用的条件概率。这个公式表示生存期 L 的概率(P)是以观察到病人服用药物 D 为条件的。注意 P(L|D) 与 P(L|do(D)) 完全不同。观察到(seeing)和进行干预(doing)有本质的区别,它解释了为什么我们不认为气压计读数下降是风暴来临的原因。观察到气压计读数下降意味着风暴来临的概率增加了,但人为迫使气压计读数下降对风暴来临的概率并不会产生影响。
对观察和干预的混淆成为悖论之源,对此本书将展开详细的讨论。缺少 P(L|do(D)),而完全由P(L|D) 统治的世界将是十分荒诞的。在这个世界中,病人不去就诊就能减少人们患重病的概率,城市解雇消防员就能减少火灾的发生;医生会向男性患者和女性患者推荐药物,但不向性别保密的患者推荐药物,诸如此类的例子还有很多。而令人难以置信的是,就在不到30年前,科学就是在这样一个不存在 do算子的世界里运行的。
因果革命最重要的成果之一就是解释了如何在不实际实施干预的情况下预测干预的效果。如果我们没有首先定义 do算子以便可以提出正确的问题,其次设计出一种在不需要真正实施干预行动的条件下模拟干预行动的方法,那么我们就永远不可能取得这一成就。
当我们感兴趣的科学问题涉及回顾性的思考时,我们通常会诉诸于另一种类型的表达形式,这种表达形式是因果推断科学所有独有的,我们称之为反事实(counterfactual)。例如,假设乔在服用了药物 D 一个月后死亡,那么我们现在关注的问题就是这种药物是否导致了他的死亡。为了回答这个问题,我们需要想象这样一种情况:如果乔在即将服药时改变了主意,他现在会活着吗?
再重复一遍,经典统计学只关注总结数据,因此它甚至无法提供一种语言用以提出上面那个问题。因果推断则不仅提供了一种表达符号,更重要的是,它还提供了一种解决方案。这使得我们在预测干预效果时,在多数情况下能够借助一种算法来模拟人类的回顾性思考,通过将我们对观测世界的了解输入算法系统,其将输出有关反事实世界的答案。可以说,这种“反事实的算法化”正是因果革命另一项宝贵的成果。
反事实推理涉及假设分析(what-ifs),这可能会使一些读者质疑其科学性。事实上,经验观察永远无法证实或反驳这些问题的答案。然而,人类的心智一直在对哪些事可能发生或哪些事可能已经发生做出极可靠的、可重复的判断。例如,我们都明白,即使某天早晨公鸡没有打鸣,太阳也会照常升起。这一共识源于这样一种事实:反事实并非异想天开之物,而是反映了现实世界运行模式的特有结构。共享同一因果模型的两个人也将共享所有的反事实判断。
反事实是道德行为和科学思想的基石。回溯自己过去的行为以及设想其他可能情景的能力是自由意志和社会责任的基础。反事实的算法化使“思维机器”(thinking machine)有可能习得这种人类特有的能力,并掌握这种目前仍为人类所独有的思考世界的方式。
在上段提到“思维机器”这个词是我有意而为的。我是以一名浸淫人工智能领域多年的计算机科学家的身份涉足这门新科学的,我的研究背景使我在进行因果推断方面的研究时能够使用一种该领域的大多数研究同仁所并不具备的视角。首先,在人工智能的世界里,只有当你能够教会机器人理解某个课题时,你才算真正理解了它。这就是为何你会在本书中看到我反复强调符号、语言、词汇和语法。我痴迷于这样的思考:是否可以用一种业已存在的语言来表达某个论断,以及我们如何判断一个论断是否与其他一些论断是相一致的。我们可以看到,仅仅是遵循科学语言的语法进行话语实践就能让我们掌握大量的知识,这实在令人惊喜。我对语言的强调也源于一个坚定的信念,即语言会塑造我们的思想。你无法回答一个你提不出来的问题,你也不能提出一个你词语用来描述的问题。作为一名哲学和计算机科学的学生,我之所以被因果推断吸引,最关键的因素就是渴望获得那种目睹一门被边缘化的科学语言促使一门科学从诞生走向成熟这一整个过程所带来的兴奋感。
我在机器学习方面的背景也给了我研究因果关系的另一个动力。20世纪80年代末,我意识到智能机器缺乏对因果关系的理解,这也许是妨碍它们发展出相当于人类水平的智能的最大障碍。在本书的最后一章,我将回到我的老本行,带领大家一起探索因果革命对人工智能的影响。我坚信强人工智能是一个可实现的目标,也是一个完全无须恐惧的目标,因为我们在实现它的过程中纳入了因果关系。因果推理模块将使智能机器有能力反思它们的错误,找到其软件程序中的弱点,让它像一个道德实体那样思考和行动,并自然地与人类交流它们自己的选择和意图。
评论
还没有评论。