描述
开 本: 16开纸 张: 纯质纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787521720730
《怪诞行为学》作者丹·艾瑞里 力荐
线上数据与线下行为如何重构身份仍同
为什么脸谱网上的点赞情况可以预测一个人的性取向,
甚至可以预测一个人的智商?
为什么容貌姣好的女子获得的面试机会比普通人多?
为什么有些人对你的讨厌反而促使其他人更喜欢你?
这本书充满了关于我们自身的秘密,我们爱谁,我们渴望什么,为什么我们会点赞,我们如何改变彼此的思维和生活……
为你揭露数据背后的真相,看清真实的自己。
看互联网时代数据如何叙事。
为什么脸谱网上的点赞情况可以预测一个人的性取向,
甚至可以预测一个人的智商?
为什么容貌姣好的女子获得的面试机会比普通人多?
为什么有些人对你的讨厌反而促使其他人更喜欢你?
那些我们意识不到的数据信息滚滚而来,告诉我们是如何奋斗、如何恋爱、如何变老的,以及我们是谁,我们正在如何变化。
大数据时代,即使无人观察,但哪怕一个微小的网络动作也能揭示出我们的行为方式。
数百年来,我们只能依靠民意调查或者小型实验去研究人类社交行为。今天,一种新的研究方法成为了现实,那就是大数据观察。
随着我们的生活越来越多地依赖网络,我们终于可以直观地了解自己的生活,通过分析社交网络上的大数据,作者向我们展示了人们在公开场合以及私下场合的自我表达方式以及社交方式。本书为我们审视自我提供了一条新路径,让数学具有了人性化特征,并演绎出了我们这个时代的方方面面。
前言
第一部分 我们因何而聚
第一章 伍德森法则
第二章 出丑效应
第三章 “作家”的世界
第四章 社交图谱
第五章 “约会大冒险”:虽败犹荣
第二部分 我们的隔阂从何而来
第六章 混淆变量
第七章 被神化的美貌
第八章 隐秘的选择
第九章 愤怒的时代
第三部分 影响身份认同的因素
第十章 你是谁?
第十一章 你坠入爱河了吗?
第十二章 了解自己所处的位置
第十三章 个人品牌
第十四章 蛛丝马迹
后记
关于本书数据的说明
注释
致谢
研究人类行为有点像探索一个丛林,错综复杂,困难重重,很容易迷路。但鲁德尔是一个完美的向导,为我们揭示了人类的基本面貌,让我们了解了自己究竟是什么样子。大数据从来没有这般有趣过。
——丹·艾瑞里 《怪诞行为学》作者
这本书充满了关于我们自身的秘密,生动有趣,揭示了我们爱谁,我们渴望什么,为什么我们会点赞,以及我们如何改变了彼此的思维和生活。这些事情往往都是我们在不知不觉的情况下完成的。鲁德尔用大数据阐释人类文化,让人读起来津津有味。更有趣的是,你会发现你和其他人一样,这些大数据揭示的现象也适用于你。
——简·麦戈尼格尔 《游戏改变世界》作者
一本关于大数据的书竟然能让人读起来产生一种羞愧的快感,真是闻所未闻,但鲁德尔做到了。这本书非常精彩,几乎让人偷窥到了我们真正的样子和需求。
——史蒂夫·斯托加茨 康奈尔大学传授,《X的奇幻之旅》作者
这本书探讨了种族、爱情、性爱等重要的问题,妙趣横生,见解深刻。难道我们真的是数据揭示的那个样子吗?请立即读一读这本书吧,看看你是否能回答这个问题。
——埃洛·莫里斯 《所信即所见》作者
大数据就像3D电影,而我们却没有3D眼镜,你明明知道大数据的背后隐藏着很多东西,但你却无从得知。我们应该感到非常幸运的是,鲁德尔是一位技术娴熟(而且非常有趣)的解读者,帮助我们解读大数据背后的故事。这本书充满了很多深刻的见解,用大数据揭示了很多令我们感到惊讶的真相。
——迈克尔·诺顿 哈佛大学商学院教授
前言
到目前为止,你肯定听过很多关于大数据的事情,比如,大数据潜力巨大,会引发不利的后果,会颠覆很多领域的固有模式,并为人类开创诸多新模式,人们一直非常热衷于关注大数据的网站,等等。提起大数据,你可能感觉头晕目眩,就像头部被什么撞击了一下似的,所以,我在这里不炒作或报道大数据引发的各种现象或后果,但我阐述的所有内容都是围绕着大数据本身展开的。在本书中,我为读者呈现了自己搜集的大量真实数据。我之所以能够获取并分析这些数据,是因为我交了好运,付出了大量劳动,并努力说服用户,其中运气的成分是比较大的。
我是交友网站OkCupid 的创始人之一。经过我们长达10 年的艰辛努力,它已经成为世界上最大的交友网站之一。该网站是我和三个朋友一起创办的。我们都是数学系毕业的。这个网站之所以能成功,在很大程度上是因为我们能运用数学思维来解决约会问题。在历史上,爱情问题往往是一些所谓情感“专家”的专属领域,而我们却能运用数学算法对爱情问题开展严谨的分析。我们这个网站的工作原理并不复杂,只需要通过一些严谨的算法来模拟两个人相互了解的过程就足够了。我们的方法引发了广泛的共鸣,2014 年,就有1000 万人通过这个网站去结交朋友。
我非常清楚,很多网站(和网站的创始人)为了说明自己多么受欢迎,往往喜欢抛出一大堆数据,而毫无疑问的是,大多数有思想的人已经逐渐学会了忽略这些数据。他们所说的数百万这、数十亿那,带着一连串零的数字令人眼花缭乱,但这些基本上是为了往自己脸上贴金而自吹自擂。与谷歌、Facebook(脸谱网)、Twitter(推特)和其他网站相比,OkCupid 远远算不上家喻户晓的网站,如果你和你的朋友们已经结婚很多年了,而且婚后一直过着幸福的生活,那么你们可能从来没有听说过我们这个网站。很多人可能从来没有用过这个网站,而且不屑于参与一些初创网站的用户体验调查,因此,关于如何清楚地为这些人描述我们这个网站,我着实费了一番苦心。我会通过非常通俗易懂、富有感情的方式来描述。现在,每天大约3 万对男女在OkCupid 网站的帮助下进行第一次约会;大约3000 对男女在约会后会建立长期的恋爱关系;之后,其中200 对情侣会走进婚姻的殿堂,而且很多人会生宝宝;今天,有些夫妻的孩子已经长大了,被父母逼着穿鞋的时候都会噘起小嘴表达不满了。如果没有我们的网站,这些小家伙儿们可能不会出生。
我丝毫没有自以为是地认为我们一切都做得非常完美。可以说,虽然我和朋友们创办的网站让我感到非常自豪,但说实话,我并不在意你是不是我们的会员,是不是要在我们的网站注册一个账户,我本人以及其他创始人也都没有过在线约会的经历。如果我们的网站不适合你,我也能理解。请相信这一点。我最不喜欢做的事情之一就是像一个传教士那样向他人宣扬技术带来的福音,我在这里也不会秀出一连串令人眼花缭乱的数据来抢夺他人的宝贵地盘。我现在仍然在订阅报纸杂志,比如《纽约时报》周末版,在Twitter 上发布信息时,我会感到尴尬和局促不安。我不会劝你增加或减少对互联网或社交媒体的使用、尊重或信任。你完全可以坚持你对网络世界的固有看法。但通过这本书的描述,我真心希望能说服你做一件事:反思自我。这就是我写这本书的真正目的。OkCupid 网站只是我实现这个目的的一个方式。
自2009 年以来,我一直领导着OkCupid网站的数据分析团队,我的工作内容是分析我们的用户创建的数据。创办网站的所有工作几乎都是我那三个合伙人完成的,我这些年来只是摆弄林林总总的数据。我所做的工作中,有些有助于我们经营网站,比如,了解男性和女性对性与美的不同看法,对于交友网站的运营具有至关重要的作用。但我的许多分析结果只是有趣,并没有什么直接的用途。很多时候,我们虽然能够通过分析统计数据发现一些事实,但我们却无法采取什么措施来改变这些事实。比如,通过数据分析,我发现苏格兰著名独立摇滚乐队——贝尔和塞巴斯蒂安乐队(Belle & Sebastian)是世界上最阳光的乐队。再比如,在晚宴上拍照时,使用快照功能会让人看起来比实际年龄老7岁,除非让嘴做出“哈”的形状。我们在数据分析过程中发现的现象基本上都属于这一类,虽然比较有趣,却无直接用途。我们偶尔会把分析结论发布出去,但这些结论似乎显得无足轻重,也没有引起大量关注。然而,当我们分析了足够多的数据后,一些大趋势就会变得明朗起来,就像很多小图案拼接起来就会变成一个明显的大图案。我发现这个工作一个比较好的地方就在于可以直接通过观察来分析一些禁忌性问题,比如种族问题。也就是说,我不必按照社会科学领域内的传统做法去请求人们回答某些设计好的问题,也不用设计什么小型实验,而是直接分析用户在网站上创建的数据就可以了。通过这些数据,我就能看到现实中发生的事情。比如,我可以通过我的交友网站来观察10万名白人男子和10万名黑人女子的私人交往情况。这些数据就在我们的服务器里,这是一个令人无法抗拒的良好机遇。
随着我持续不断地进行数据挖掘和分析工作,发现也越来越多。于是,我开了一个博客,名为OkTrends,与世界分享我的发现。我所知道的永远比我分享的多。后来,我整理了一下博客中的内容,并在此基础上做了重要改进,于是本书便出炉了。为了写这本书,我引用的数据源远不止于OkCupid网站的数据。事实上,当代大部分重要的在线数据源都成了我的搜索目标,而且我掌握的关于人际交往的数据更加深入广泛。在这本书中,丰富翔实的数据不仅披露了网站用户的习惯,还揭示了一系列具有普遍性的行为模式。
我们OkCupid网站是依靠广告收入支撑的。作为这个网站的创始人,我可以肯定地说,数据有利于提高销售业绩。网站的每个页面都能捕捉到用户的体验。用户点击的每一个位置、输入的每一条信息,甚至在一个页面上停留的时间,都是用户体验的表现。根据这些,不难看清用户的喜好以及如何满足他们。这简直太棒了!但当我看到某个用户为其朋友们提供关于身体喷雾的最新消息时,我不会利用这个机会向他推销身体喷雾。虽然我能接触到这些用户创建的数据,知道用户喜欢点击什么、输入什么以及在某个页面上停留多久,但我不会利用这些数据去做生意。长期以来,大数据主要服务于监控与赚钱这两个目标,而在过去的三年里,我却努力利用大数据实现第三个目标,即反思人类的故事。
Facebook可能知道你是M&M巧克力的粉丝,然后给你推送与这种巧克力有关的促销信息。如果你和男朋友分手后搬到了得克萨斯州,在Facebook上分享了很多与前男友的合照,并开始了新的约会,那么Facebook就能掌握得一清二楚。如果你在谷歌上输入一些寻找汽车的信息,谷歌会根据你的搜索记录揣测你的心理,为你推荐一些品牌和车型。比如,如果谷歌知道你是一位倾向于追求刺激、B型血、25~34岁的男性,那么谷歌可能会自动为你推荐斯巴鲁汽车。
与此同时,谷歌也知道你是否是同性恋、是否生气、是否孤独、是否存在种族主义思想或者是否正在为母亲的癌症而忧心如焚。Twitter、Reddit(热迪网)、Tumblr(汤博乐)、Instagram(一款图片分享应用程序)等首先属于企业,具有企业的属性,但与此同时,它们具有“人口统计学家”的属性,而且它们统计的广度、深度及重要程度都是史无前例的。现在,大数据能够呈现出我们是如何奋斗、如何恋爱、如何变老、我们是谁以及我们正在如何变化的。对于这些,人们几乎是意识不到的。我们需要做的只是观察。在大数据时代,虽然我们觉得没有人观察自己,但哪怕一个微小的动作也能揭示出我们的行为方式。下面我将详细讲一讲我都观察到了什么。再重复一遍,我绝不会利用大数据搞推销。
本书讲述的内容虽然与人有关,但仅仅从宏观视角出发,概括性地分析了规模庞大的数据,几乎没有具体提到任何人的名字。本书运用了大量的图表,也几乎没有涉及人名。现在的大众科学在解释问题时存在“以小见大”的倾向,即利用一些微小而古怪的事物作为透镜来阐释大事件,结果充斥着陈词滥调。比如,认为一个萝卜折射了世界历史,一条鱼引发了一场战争,一个手电筒照射棱镜便能让卧室的墙壁上呈现出美丽的彩虹,等等。我阐述问题的方向与此相反,或者说是“以大见小”的。我拥有的大数据以万亿字节计算,这些数据都是关于人们行为、思想和言语的,是过滤了很多小事情之后得出来的。这些事情包括你的朋友圈谈及你的婚姻是否稳定的言论、亚洲人(以及白人、黑人和拉丁美洲人)最不愿意用哪种方式来描述自己、同性恋者都在哪些地方秘密聚会、人们的写作习惯在过去10年发生了哪些变化。我们这样做的目标就是促使人们在了解自我的过程中,减少对叙事方式的依赖,更加重视数字的重要性,或者说,我们要形成“数字也是叙事方式”的思维方式。
这种方法是从漫长而艰苦的统计工作中总结出来的。这本书凝聚了我与合伙人多年的努力。一个交友网站必须让不同的人会聚到一起。要做到这一点,必须了解人们存在哪些欲望、哪些习惯以及厌恶什么。所以,你必须搜集海量的详细数据,并努力将其转化为具有普遍适用性的人类行为理论。每天同这些纷繁复杂的数据打交道,绝对不同于筹备一场婚礼或者编辑某个报纸的版面。在这些数据中,我了解到的是整个人类的一般情况,而不是一两个人的具体情况。你了解人类之后,对人类的爱便油然而生。
因此,所有网站,也就是所有数据科学家,必须用计算机能够读懂的语言来客观地描述人类行为。然而,对于非数字类的事情,用数学算法来处理并不是非常奏效。因此,如果你想让计算机明白一个想法,必须尽己所能地将其转化为数位。网站和应用程序面临的挑战就是如何分割连续性的人类行为,将其分割为一个个小片段,再收集起来装进一个个小桶里面,同时又不让别人注意到这个过程。也就是说,Facebook、Reddit等网络社区将人类的友谊、爱情分割成服务器能够理解的片段。在数字化的同时,他们还要尽可能地把网页界面做得贴近现实,让用户觉得你所提供的信息代表了真实生活。互联网会给人造成一种微妙的错觉。你可以想象一下,一个胡萝卜被切成一截一截的,整整齐齐地摆放在砧板上,看起来仍然像一个完整的胡萝卜,其实这只是一种错觉。人类行为的连续性与数据库的间断性之间的矛盾是网站运行过程中面临的一个复杂挑战,而我讲述的内容恰恰就是关于这个方面的故事。新技术的诞生为我们通过数字化方式分析人类欲望和友谊提供了一个新机遇。我们可以利用一些确凿的数据来分析持久存在的难解之谜,也可以分析人类之前认为无法量化的活动,从而对这些活动获得一定程度的了解。技术发展得越来越好,对人类生活的影响也日益广泛,人类对技术的理解呈现出了令人惊讶的提升态势。我在后文会举例说明这一点,但我必须首先说明一点:我们OkCupid网站真的不打算把“分析无法分析之事”作为自己的宣传噱头。
在互联网上,排名随处可见。Reddit为用户提供了“顶”或“踩”的选项,亚马逊网站可以发表客户评论,甚至Facebook也为用户提供了点“赞”选项。这些网站之所以让用户投出自己的一票,表达自己的看法,是因为它们将这些动态的、个性化的事物转化为它们能够理解和利用的事物。交友网站之所以让人们互评,就是因为一旦人们表达了自己对他人的第一印象,比如“他的眼睛很漂亮”,“哦,他很可爱,但我不喜欢他的红色头发”,“噢,太难看了”,等等,网站就会按照满分为5分将这些评价转变为一些简单的数字,比如5、3、1等。网站收集了数足够多的评价之后,就了解了一个人给他人留下的第一印象是什么。如果将所有个人评论综合到一起去分析,就能以小见大,揭示出一些大趋势,从而清楚地看到人们如何做出对他人的评价意见。
对于这些人与人之间的相互评价,你需要做的最基本的事情就是计数,也就是统计一下多少人得了1分、多少人得了2分、多少人得了3分等,以此类推,然后对你的统计结果进行对比分析。我曾经统计了男性对女性的坦率评价(这些人都不是同性恋者)。根据统计结果,我绘制了这幅柱状图(见图0—1):
这个简单的图形是根据OkCupid的5 100万名用户的偏好绘制出来的。从本质上讲,它体现了男性对女性美貌的偏好,糅合了所有的小故事(即成千上万名男性对女性的看法)与所有的逸闻趣事,最后形成了一个直接明了的图形。通过这种全新的方式来看个体,就像从太空看地球上的人一样,不会看到细节,但你会从中看到一些自己觉得熟悉的东西。
评论
还没有评论。