描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787500176800
引言
世界上唯一的新鲜事就是不为人知的历史。
——哈里·杜鲁门(Hany Truman),大卫·麦卡洛克引用
我们生活在为数据“海洋”(有人称之为“大数据”)所包围的岛屿上。这些“海洋”中有着各类“物种”,是我们可以观察到的现象。想法、假设、解释和图形也在数据的“海洋”中漫游,它们可以澄清“水域”,也可以让不受支持的“物种”消亡。这些“生物”靠直观的解释和科学的证明才能茁壮成长。时代不断发展,新的图形物种也随之出现,而这是由数据“海洋”中“渔民”的新问题和内在洞察力所引发。
无论我们是否意识到这一点,数据几乎都是我们生活中每个领域的一部分。作为个人,健身追踪器和血糖仪可以让我们监测自己的健康状况。我们可以用网上银行仪表板查看我们的支出模式并跟踪财务目标。作为社会的一员,我们读到了美国加州爆发野火或极端天气事件的报道,并想知道这些仅仅是异常现象,还是气候变化的确凿证据。2018 年的一项研究称,即使每天喝一杯酒也会增加健康风险。关于绿茶降低胆固醇、维生素 C 缓解普通感冒、大麻缓解慢性疼痛,以及(可悲的是)儿童疫苗接种的健康益处或风险的问题,均存在相当大的争议。但所有这些例子意味着什么呢?正如一件流行 T 恤的宣言:“我们被数据淹没,却渴望知识。”
这些插图实际上反映的是理解一些系统性的东西或一项主张的证据强度。如果我不参加晨跑或吃卡卡圈坊 A 的甜甜圈,我的血糖会升高多少?近年来,是加州确实发生了更多的野火,还是世界范围内发生了更多的极端天气事件?与完全戒酒相比,像其他人一直所建议的那样,每天喝一两杯葡萄酒,到底会增加多少健康风险?
对这类问题,证据可以用文字、数字或图片来呈现,而且我们可以尝试使用这些来评估主张或论点的力度。科学研究的目的是收集有关某个主题的信息,将其转化为我们可以视为证据的某种标准形式,并推理得出结论或解释。图形通常是实现这一目标的最有力手段,这是因为它为所呈现的事实提供了可视化框架。它可以回答“与什么相比”这一重要(尽管往往含蓄)的问题。它可以传达一种对主张有效性证据的不确定感。然而,它也使观众能够更深入地思考所提出的问题,并对结论提出质疑。图表可以为问题提供直观的答案,而图形显示可以沟通和说服。
正如我们在本书中所阐述的,图形和图表在理解复杂现象、发现规律和解释方面往往发挥了重要作用。要真正了解可视化框架的影响,我们不仅要看当代的例子,还必须了解它是如何改变科学和社会的。我们必须要追根溯源。
悠久的历史
本书讲述了一段悠久的历史,广泛概述了今天如此普遍的数据可视化方法,是如何、在何处以及为什么被构思和发展的。你可以将其视为对这段历史的一次导览,专注于社会和科学问题,以及一种不断发展的图形语言,它为发现和交流提供了洞见。
本书的写作过程也很漫长。它始于 1962 年 10 月,当时我们都是伦斯勒理工学院的本科生。后来,我们成了数学专业的学生、室友和朋友。然后我们又在同一所大学(普林斯顿大学)攻读研究生学位,都获得了美国教育考试服务中心的心理测量学奖学金支持。在研究生院,我们接触了普林斯顿大学著名的博学家约翰·图基(John Tukey)。当时,他是统计学领域的革新学者,其理念是数据分析的目的是洞察,而不仅仅是数字,这种洞察更多的是通过画图,而不是证明定理或推导方程,让人们看到意想不到的事物。
事实证明,图基的指导很重要,也很有先见之明,这是因为我们发现,我们研究的任何实质性主题,我们理解和交流收集到的证据的能力,几乎总是涉及以某种图形格式查看数据。我们的研究使我们两个人,都为数据可视化方法的使用和发展的各个方面所吸引。这种兴趣涵盖了在科学探索、解释、交流和推理方面的应用,以及创造阐明问题的新方法,以便更好地理解问题。
值得注意的是,对我们两个人来说,对图解法的研究使我们不断回顾历史,以获得更深入和更透彻的理解。今天看来司空见惯的事情,很多都有着深刻的历史根源。我们也花了很长时间研究、合作和写作,这些都为本书提供了信息,并促成了本书的出版。最初的尝试是1976年由魏纳负责的美国国家科学基金会(National Science Foundation,简称 NSF)“图形社会报告项目”(Graphic Social Reporting Project)。
该项目的任务之一是召集一组国际学者,这些学者致力于使用图形来交流定量现象,并创建一个社交网络来促进信息共享。项目因此召开了几次会议,也出版了相当多的学术文章,例如,贝尼格和罗宾1978 年的图形历史,以及贝尔坦(Bertin)标志性的 1973 年版《图形符号学》(Semiologie Graphique 的英译本)。一旦以英文重新出版,贝尔坦的思想传播得更广,并且对很多其他学者的工作有用,其中最突出的是,爱德华·塔夫特(Edward Tufte)写出具有变革意义的书籍。数据可视化作为一个研究领域,开始流行起来。
第二项关键事件是弗兰德利(Friendly)的“里程碑项目”(Mile-stones Project)。它已经从 20 世纪 90 年代中期开始大幅修订,现在才在网站(http://www.datavis.ca/milestones/)上出现。在那个时候,有关现代数据可视化事件、思想和技术的以往历史记录很零散,分散在很多领域。“里程碑项目”一开始只是试图将这些不同的贡献整理成一份汇总清单,按时间顺序排列,其中包括代表性的图片、原始来源的引用,以及指向进一步讨论的链接。这是一个关于数据可视化历史“一站式购物”的来源。现在,它包含了近 300 个重要里程碑事件的交互式、可缩放时间表,近 400 张图片和 350 个原始来源的参考,以及相关重要人物生卒年月、所在地等信息。
在数据库中整理这段历史的一个愉快但出乎意料的结果,是产生了这样一种想法,即统计和图解法可以用来探索、研究和描述数据可视化本身历史中的历史问题和疑问。这种方法可以称为统计史学。“里程碑项目”数据库中的每个项目都按日期、位置和内容属性(主题领域、发展形式)进行标记,因此,可以将该历史记录视为数据。
例如,图 0.1 显示了按欧洲大陆分类的 245 个里程碑事件的频率分布。我们立即会注意到,大多数早期的创新都发生在欧洲,而1900年以后的大部分创新都发生在北美。曲线的起伏反映了一些值得解释的全球历史趋势,标记的时间段提供了我们认为是推动数据可视化进展的主要主题框架。
概述
“里程碑项目”中记录的最早事件,是一张有着 8000 年历史的加泰罗尼亚小镇地图,靠近现在的土耳其城市科尼亚。可视化的史前史甚至可以追溯到更久远的时期,但是,如图 0.1 所示,大多数关键创新仅发生在过去400 年中,并在过去100 年间呈指数增长。
本书的核心问题是“数字的图形描述是如何产生的”,更重要的是“为什么”。是什么促成了今天常见图形和图表的关键创新?是什么样的环境或科学问题,使可视化描述比单纯的文字和数字更有用?最后,这些图形发明在理解自然和社会现象,以及传达这种理解方面有何不同?
纵观“里程碑项目”所描述的历史,我们可以清楚地发现,这些关键创新大多与重大的科学和社会问题有关:水手如何在海上准确导航?我们如何才能理解犯罪或贫困的普遍程度与诸如识字率等因素之间可能的因果关系?我们铁路和运河的客运和货运情况如何,哪里需要更多的运力?这些问题说明了我们对图 0.1 的时间段给出的描述性标签。
但是,数据可视化兴起的故事要比那些令人头疼的问题更加精彩。诸如此类的问题为数据可视化历史的很多图形发明,提供了背景和动机,但它们并没有完全回答“为什么”这个问题。过去 400年的主要创新与我们称之为“视觉思维”的认知革命相结合,即一些问题及其解决方案可以直接视觉显示,而不是靠文字或数字表格来传达。使爱因斯坦更出名的,是用文字和方程式表达的物理理论,他在他的陈述中谈到了这种视觉感受:“如果我不能描绘它,我就无法理解它。”
我们在本书讲述的历史,可以从科学史和图像传播史上一些关键问题的故事中得到例证,但它是作为对这段历史中一些主角的欣赏而讲述的,对他们来说,视觉洞察力至关重要。但这引出了一个更大的问题,即这种视觉思维本身是如何发展的。我们在最初的章节中为此提供了一些背景,但基本的想法是,这必然会伴随着“经验思维”的兴起,这种观点认为,通过收集相关数据比应用最好的抽象或理论思维,更能解决很多科学问题。
重新审视
我们在本书中描述的历史图表,是使用当时流行的数据、方法、技术和理解所创建的。我们可以通过尝试从现代视角重新分析,来更好地理解知识、科学和图形问题。
在这个过程中,我们可能会沮丧地发现,我们今天拥有的软件工具很难精确重现重要历史图表及其故事的基本思想或艺术美感。在这段历史中,我们主角们手工绘制的图表、专题地图和统计图常常表明,简单的笔比任何软件工具都要强大。
即使我们尽心尽力,有时也只能产生对原作的苍白模仿。换句话说,我们无法通过重新分析或重新绘制图表,来促进对问题的理解。结果之一是,我们学会了欣赏前辈们深思熟虑、技艺精湛的作品,折服于他们对钢笔画或铜版雕刻的挑战。另一个结果是,我们可以从现代的成功和失败中,学会理解历史问题的背景,以及为呈现这些问题而绘制的图表。
我们把这些尝试称为“重新审视”,可能是从一个新的角度来看。我们不打算仅仅试图通过“现在”这一特殊“眼镜”来看过去。相反,我们希望阐明数据可视化发展中具有里程碑意义的优点和缺点,或是能在历史背景下更好地理解数据可视化。一个小例子说明了这一点:在第4 章中,我们展示了约翰·斯诺(John Snow)如何为霍乱作为一种起源于英国伦敦宽街(Broad Street)水井的介水传染病,提出了更具说服力的生动论点。
年表与主题
这里需要对本书的结构稍加解释。在大多数非虚构类叙事中,按年表或主题叙述往往各有千秋,而年表通常是赢家。毕竟按时间顺序的叙述十分自然地从一个时刻线性地移动到另一个时刻,而分散在不同时代的主题有时需要按更大的主题进行汇总。因此,年表通常占主导地位,至少从叙事被记录在纸莎草卷轴上以来就一直如此。
在这本书中,年表占主导地位,但我们试图合理运用它,我们担心如果不这样做,读者会对主题茫然不知所措,仿佛下一个例子“在遥远的某个外国海岸”。认识论、科学发现、社会改革、技术和视觉感知等伟大主题随着时间而变化,但并不同步。因此,我们的大部分叙述都是围绕特定时间的关键问题和个人(我们的图形主角)进行的,他们的视觉洞察力和创新,促进了数据可视化和科学的进步。
以下是本书的概要。
第 1 章“刚开始的时候……”概述了较大问题和主题,为本书提供了背景。我们考虑了数字数据和论证证据与图形之间的关系,然后描述了数字视觉呈现的一些史前历史和可视化本身的早期兴起。故事延续到 16 世纪前后哲学和科学中经验思维的兴起,以及与之相伴随的用数字视觉呈现来传达定量现象的显著发展。
在此基础上,我们探讨了 17 世纪一个基本而又棘手的问题:海上经度的确定。在第 2 章“第一个图表是正确的”中,我们介绍了迈克尔·弗洛伦特·范·朗格伦(Michael Florent van Langren)是如何想到制作从托莱多到罗马的经度距离历史测定图。这张图可以说是历史上第一张统计数据图表。
在第 3 章“数据的诞生”中,我们追溯了数据在 19 世纪初左右,图解法最初兴起时的作用。我们把注意力集中在这个故事的一个重要参与者身上:安德烈 – 米歇尔·盖里(André-Michel Guerry,1802—1866 年)。他用“大量数据”和图解法促成了现代社会科学的发明。
不久之后,英国开始进行类似的广泛数据收集,但这是在处理社会福利、贫困、公共卫生和卫生设施的背景下进行的。在第 4 章“人口统计”中,我们看到了两位数据可视化的新主角,威廉·法尔(William Farr, 1807—1883 年)和约翰·斯诺,他们独立工作,试图了解几次霍乱流行的原因,以及如何减缓这种疾病的流行。
第 5 章“大爆炸”详细介绍了在 19 世纪初,几乎所有现代形式的数据图表(如饼图、时间序列折线图和条形图)是如何被发明的。
这些关键的发展都要归功于威廉·普莱费尔(William Playfair),一个“狡猾”的苏格兰人。他可以称得上是现代图解法之父,不过将他的贡献视为数据图形的大爆炸有点言过其实。
在统计图形的所有现代形式中,散点图可以被认为是整个统计图形历史中最通用且最有效的发明。由于它并非威廉·普莱费尔的发明,因此这一点也值得注意。第 6 章“散点图的起源和发展”讨论了为什么普莱费尔无法思考这些事情,并将散点图的发明追溯到著名天文学家约翰·弗里德里希·威廉·赫歇尔(John F. W. Herschel, 1792—1871年)。散点图在弗朗西斯·高尔顿(Francis Galton, 1822—1911 年)关于性状遗传力的研究中发挥了重要作用。高尔顿的工作通过统计图表可视化,成为相关和回归统计思想的来源,因此也是大多数现代统计方法的来源。
在 19 世纪下半叶,对图解法的热情逐渐高涨,统计、数据收集和技术方面的各种发展结合在一起,产生了一场数据图形的“完美风暴”。其结果是,在那个各技术水平完全比不上今天的时期,产生了在细致程度和广度上无与伦比的作品,且在今天都很难被复制。在第7章中,我们认为,正如本章标题所暗示的那样,这一时期值得被誉为“统计图形的黄金时代”。
第 8 章“逃离平地(二维到三维)”讨论了创建数据显示的挑战。视觉呈现必须在二维表面——纸或屏幕上产生。然而,在最坏的情况下,这些方式往往会产生误导;在最好的情况下,这些方式呈现的内容不完整。在二维平面上表示多维现象,过去是,现在仍然是图形显示的最大挑战。我们在本章中讨论并说明在现有限制范围内,用于交流多维现象的一些方法。
第 9 章“将时间和空间可视化”探讨了数据可视化近代史上的两个一般主题。首先,图解法已经变得越来越具有动态性和交互性,能够通过动画显示随时间的变化,并且静态图像已扩展到观众可以直接操作、缩放或查询的图像。其次,人们继续“逃离平地”,以各种新方法来理解更多维的数据。
图形因能够以紧凑的方式准确地呈现现象,同时提供其情境而受到赞誉。如果这就是它们所做的一切,那么它们在科学史上的地位将十分明确并迅速隐去。而有了合适的数据和正确的设计,它们也能传达情感。的确,在某些情况下,图表会带来一种情感上的影响,可以与诗歌相提并论。在第 10 章“如诗般的图形”中,我们想象民权活动家威廉·爱德华·伯格哈特·杜波伊斯(W. E. B. DuBois)和被推崇的图形设计师查尔斯·约瑟夫·米纳德(Charles Joseph Minard,1781—1870 年)合作,描绘了 600 万非裔美国人逃离后邦联时代南方的种族主义和恐怖活动,前往北方工业区的大迁徙。这种想象中的合作提供了生动的例子,说明我们如何从历史研究中获益,以帮助解决未来的问题。
最后,“更多信息”一章为那些希望更深入了解某个主题的读者列出了其他资源。
本书必然省略了一些丰富我们故事的材料,但也注重事实。此外,出版规定也限制了插图的数量。作为部分补偿,我们创建了一个相关网站(http://HistDataVis.datavis.ca),其中包含所有彩色图像、一些更广泛的讨论,以及这段历史中一些戏剧性人物的传记笔记。令人高兴的是,我们可以继续通过相关主题的其他文章来保持这个主题的活跃。
因此,本书带领各位读者以更宏大的视角来考虑数据可视化的历史——一段从最早的视觉铭文开始,发展到可以用图形和图表理解社会和科学问题的旅程——正如哈里·杜鲁门在开篇所言。在这一发展过程中,很多创新被遗忘或不被重视。下面,就让我们一起去膜拜那些对视觉思维和图像传播发展必不可少的贡献。
评论
还没有评论。