描述
开 本: 16开纸 张: 纯质纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787508692739
1. 大数据先锋思想家、阿里巴巴集团前副总裁、《大数据》《数据之巅》作者涂子沛,再攀“数据高峰”,预览人类“数文明”。林毅夫、孟庆国作序,罗振宇、吴晓波、万维钢、田溯宁、毛光烈、吴甘沙联袂推荐!
2. 从互联网、物联网到数联网,大数据催生的商业应用在不断更新迭代;
从人工智能、城市大脑到单粒度治理,大数据在推动国家治理现代化;
从量数到据数,从德治、法治到数治,大数据2.0时代已经到来;
“数文明”是理解过去与现在的一条捷径,是连接历史与未来的文明“金线”。
3. “通常有关前沿科技思想的书都是美国人写给美国人的——这本是中国人写给中国人的。书中有先进的思想和鲜明的中国素材。涂子沛不但有高超的研究水平和一手的亲身经历,而且他掌握了科学写作的艺术:书中每一页都能引人入胜。”
——万维钢,科学作家,“得到”App《精英日课》专栏作者
从量数、据数、普适记录、人脸识别、以图搜车,到雾计算、城市大脑、单粒度治理、无匿名社会、量子思维……作为中国研究大数据的权威专家,作者在《数文明》一书中,以大数据为核心元素,抽丝剥茧,深入地阐述了这个大数据时代的文明社会——一个全新的数文明时代。
将大数据与人类文明融合在一起,这本书提供给我们的不仅是一种全新的叙事结构,它还将突破你的认知边界和思维极限,给你提供一个应对这个世界的全新的认知方法论。
《数文明》一书从三个层面鞭辟入里地描绘了互联网时代的一种全新文明形态:人类的数据文明——它将是互联网的下半场;商业世界的数据文明——商业世界将迎来重塑和再造;以及个人世界的数据文明——我们该如何从不完整的个体跨跃到高能个体。不论在哪个层面,数文明对人类的颠覆和重构都将是影响深远的。
可以说,《数文明》重构的不仅仅是我们的认知逻辑,还有身处这个数文明时代的生存逻辑——不仅包括每一个国家、每一种社会、每一家企业,还有每一个个体。
推荐序一 / 林毅夫 // V
推荐序二 / 孟庆国 // VII
前言 从幼稚到成熟:我们这个时代的数据革命 // IX
1. 数据平权:新商业文明的冲击和原罪 //
001
心理入侵:大数据“读心术”诞生了 // 004
价格操控:大数据“杀熟”和算法合谋 // 013
数惧的深层:人工智能三宗罪 // 020
新经济到底新在哪里:智能商业 // 027
金矿如何形成:个人数据的价值困境 // 031
数权:互联网原罪浮出水面 // 037
2. 无匿名追踪:
天网的隐喻 // 045
要是此案在中国,早破了 // 048
三体:天网的真正维度 // 053
互联网要向天网学习什么 // 058
雾计算:人工智能的竞技主场 // 063
以图搜车:追踪亿万车辆之轨迹 // 066
硬盘和眼药水为什么同时脱销 // 072
3. 人脸和人工智能 // 083
照片开路:构建身份社会 // 086
起步硅谷:几何时代的徘徊 // 089
机器能否学习:人工智能之争 // 093
“不明觉厉”:深度学习的崛起 // 097
数据田径场:政府怎样推动商业创新 // 107
历史的意外:“9·11”事件如何拯救失败 // 111
无匿名社会:动态识别的前景 // 115
4.高清晰社会:单粒度治理和笼中人险境 //
123
数纹:迈入高清晰社会 // 126
模糊社会的困境 // 132
超级档案的产生:单粒度治理 // 136
抑制侥幸:中国古代的治国经验 // 144
高能个体:人人皆持剑,又皆为剑下人 // 148
数据即证据:无侥幸天下 // 151
5. 数力:普适记录如何“掰弯”人性 //
161
唐宗宋祖的烦恼 // 165
爱迪生拓宽记录的疆域 // 172
尼克松之困:白宫录音小史 // 176
特朗普的录音风波 // 183
视频直播为什么低效 // 187
普适记录:上帝的终极武器 // 189
6. 数文明:社会、商业和个人如何被记录赋能
// 199
一个新的发展视角:记录 // 202
历史上中国文明领跑与掉队的原因 // 207
三本书在三个大陆的三种命运 // 213
十计九记:商业文明的进步密码 // 219
电梯里的羞辱 // 225
全面记录全面计算:开创数文明时代 // 229
7. 数据新政:建设现代国家的治理体系 //
239
数基:创新和本土难题 // 241
数联网:数据维度上的整体性政府 // 248
城市大脑:新时代的南京长江大桥 // 256
仅此一次:“多跑一次”如何升级 // 262
开放摄像头:天网的未来 // 266
对数据和算法的现代治理 // 273
8. 人工智能的边界、风险和未来 // 281
一切皆可预测:拉普拉斯之妖 // 284
量子思维:不确定的现实 // 287
人是城市中的粒子:测不准 // 290
数据相对论:普适记录的极限 // 294
表情分析:人工智能的边界 // 300
转型智能社会:怀揣瓷器花瓶,进入花花世界 // 310
结 语 第四次浪潮:我们如何再次领先 // 319
后 记 野路无人自还 // 329
大事记 // 335
索 引 // 343
前言 从幼稚到成熟:我们这个时代的数据革命
一个新的数据划分方法
随着大数据的兴起,“言必称数据”逐渐成了我们这个时代一个显著的特征,但问题是,此数据非彼数据。
今天,所有“记录”的结果,甚至包括文字,都被统称为数据。这其中暗含的逻辑是,数据作为一个概念,它的内涵扩大了。传统意义上的数据是人类对事物进行测量的结果,是作为“量”而存在的数据,可以称为“量数”;今天的照片、视频、音频不是源于测量而是源于对周围环境的记录,是作为一种证据、根据而存在的,可以称为“据数”。
量数和据数,两者原本风马牛不相及,但在今天这个时代,它们又有了一个共同的特点—以“比特”为单位进行存储。关于大数据的定义,我主张用这样一个等式较为简洁地表示:
大数据 = 传统的量数 现代的据数
(量数源于测量,如气温28℃)
(据数源于记录,如一张照片)
量数虽然比据数更接近“数”,但从历史上看,据数的出现要早于量数。人类早期对自身活动的记录,即“史”,就是早期的据数,也可以说,据数是历史的影子。量数则是在记录的实践中慢慢产生的,特别是针对天空、星体、山川等外物的记录,它们追求精确,于是我们逐渐延伸出测量的工具和行为。一切科学都源于测量,量数是否充沛,决定了科学的种子何时萌芽,决定了科学是否发达,也可以说,量数是科学的母亲,其核心要义是精确。
在16世纪前后,人类开启了大航海时代,量数出现了一个高峰。随着航海仪器的普及,欧洲对土地测量、建筑设计、矿山开采、人口统计的需求也应运而生。人类发现,定性描述不足以解决问题,只有更加精确的测量和计算,才能够满足科学和管理的需要,这引发了历史上次数据爆炸:量数爆炸。
这也是人类历史上个数据的春天。
进入20世纪后,由于计算机、互联网和智能手机的普及,据数开始爆炸,相较于16世纪的量数爆炸,据数爆炸的规模更大。今天大数据的主体,从体量上来看,毫无疑问是据数,即对人类活动及周边环境越来越多的记录,或称“普适记录”。互联网平台记录的,大部分是据数。
和今天的普适记录相比,过去5 000年的文明看似浩如烟海,但其实相当有限,史书虽然一本比一本厚,但大部分都聚焦在为数不多的帝王将相身上,关于普通百姓的个体性记录,在全世界各个国家都少之又少。随着普适记录的兴起,这种情况正在迅速改变,未来不仅有国家史、社会史、行业史,还会有数量惊人的“个人史”。可供历史学家研究的资料,将会像雪球一样越滚越大,其规模将前所未有。
量数对于中国的巨大意义,自不待言,黄仁宇的“数目字管理”在20世纪曾经开启过一场讨论,我的前两本书《大数据》《数据之巅》关注的是量数,尤其是《数据之巅》,它延续了黄先生的讨论,而本书更侧重据数。
一场还没有完成的革命
今天的“大数据之热”,热的其实是据数,和精确的量数几乎没有任何关系。
“据数之热”并不奇怪,它源于互联网带来的变革和它已经展现出来的巨大的财富效应,形形色色的手机应用给了每一个人更加直观的感受,不管是电商、社交还是自媒体,哪一个不是跟记录之据数有关呢?
几乎人类的一切行为,今天都可能、可以被记录,并被转化为据数。如果说量数的核心要义是“精确”,那据数的关键就在于“清晰”地留据。
因为智能手机的普及,据数已经无处不在,但我们大部分人对据数的理解是肤浅的,迄今为止,以据数为中心的大数据讨论主要停留在以下三个层面。
一是精准营销,即互联网广告业。和传统的广告业相比,今天的互联网和智能手机通过记录消费者不断产生的数据,可以向终端用户推送个性化的广告,这大大提高了行业效率。这是大数据革命在商业领域的起源。这也是目前互联网企业,无论是中国的BAT(百度、阿里巴巴、腾讯),还是美国的谷歌、Facebook(脸谱网)、亚马逊主要的赢利途径。
二是商业和社会信用,其主体是金融机构。除了精准营销,这是利用大数据赚钱的第二个法门,也是我们看到诸多互联网企业陆续进入金融领域的原因。其商业模式是,通过消费者的消费记录评估消费者的信用,从后续的金融服务中赢利。例如阿里巴巴旗下的“芝麻信用”和腾讯旗下的“微粒贷”,它们在给消费者打“信用分”的基础上,向单个消费者提供贷款等金融服务。
这两种商业模式,都需要通过数据监控消费者在互联网上的一举一动,消费者个体因此成为被观察、被分析、被监测的对象,这就带出了第三个层面的问题—隐私。这两种商业模式的副作用是,我们几乎每天都能听到数据泄露的新闻,时不时还会看到因为它而导致的悲剧。
近,我的一个朋友告诉我,今日头条向他推送泳衣和泳镜的广告,明显是知道他近去游泳了,他琢磨了一下,发现可能的原因,是他在下水之前把智能手表调节到了泳池模式。
毫无疑问,今日头条打通了这款智能手表的数据。大众对这种商业模式有一种矛盾的心理:一方面,我们感到权利受到了侵犯,没有得到尊重,被出卖了,社会舆论也往往会把它简单地放在公平的背景下进行考量,一边倒地反对这种商业模式;另一方面,也许我们真的需要一副泳镜,不想拒绝这种便利和高效。
这两种商业模式之所以可行,是因为它们以据数为基础掌握了消费者的动态,据数的商业和管理价值正是本书论述的重点,但为了行文方便,本书大部分时候仍使用了“数据”一词,因此本书的“数据”二字实为指代“据数”一义。
这就是大众眼中的大数据,前两者为商业利润而生,而隐私问题屡屡成为社会公共话题。可是,这三个层面仅仅揭开了冰山的一角,难道大数据就是养了几家大公司,方便了公众生活,改善了信用评级体系,让生活更美好或者多了点麻烦这么简单?
我认为远不止于此。
在商业层面,大数据还在进一步深化变革,它所催生的互联网应用仍在不断更新迭代。当大数据完全发挥出它的潜力时,其形态将是全自动商业,或称智能商业,商业文明将会被重塑和再造,本书将对此进行阐述。
据数的商业化应用带动了大数据的兴起,但商业只是故事的一个边角,革命是社会化的,未来我们还会看到智能制造业,它所依靠的还是数据,数据引发的变化还在向社会治理和个人生活领域全面拓进,它涉及社会生活的方方面面,将会推动整个社会进入文明新状态,改变社会的全貌。一个新的故事正在世界范围内浮现。我们必须抛开细枝末节,看到那些更深刻的、方向性的东西。数据的力量正在重塑整个社会甚至人类的天性。
我称之为“数文明”,这是本书的主题。
这本《数文明》为大数据先锋思想家涂子沛所著的第三本力作,分享了他对大数据给人类、社会和文明的各个层面可能带来的机遇和挑战的探索和思考,纵横历史、文字隽永、深入浅出、信息量大、涉及面广,读之获益甚多,难以释卷。
——林毅夫
北京大学新结构经济学研究院院长
世界银行原高级副行长、首席经济学家
《数文明》是一本应时力作,这本书提出了很多富有启发性的概念,体现出涂子沛先生对数据文明的深邃思考和敏锐洞察。作者纵横古今,关联西东,许多观点和内容富有思想性,引用的案例生动鲜活,可读可鉴性很强,阅读时让人几乎不愿跳过任何细节。
——孟庆国
清华大学公共管理学院教授
清华大学国家治理研究院执行院长
知识的力量有三个层级,我将其概括为知识获取、知识转化、知识赋能。从涂子沛先生的个人经历以及他对大数据的研究、布道和推动中,我也看到了这三个层级。我相信这本新书不仅可以启迪思想,还将为读者在大数据时代获得个人成功赋能。
——罗振宇
“得到”App创始人
大数据驱动了澎湃的商业创新,但数据之光也在新商业文明的晨曦中投下了阴影,在这本新书中,子沛从数据的角度回顾了商业文明的过去,检视了新型智能商业模式中潜伏的凶险,并将发源于商业的数据革命推及社会治理的广度和人类文明的高度,给人启发,入木十分。
——吴晓波
知名财经作家
这是一本深刻阐述人类记录之文明史、系统描述大数据未来发展前景的好书。
——毛光烈
浙江省智能制造专家委员会主任
人工智能专家委员会副主任
这是涂子沛数据三部曲的第三部。相较于《数据之巅》,《数文明》把大数据从国家治理的层面上升到了人类文明的高度。中国传统的理论认为国家治理既需要德治,也需要法治。子沛在这本书中提出了“数治”的理念,数据将重塑人性、文明和天下。这本书聚焦对未来大格局的思考,闪耀着诸多智慧的亮光。
——田溯宁
中国宽带资本基金董事长
这本书创造了一个大数据的新话语体系,从据数、数惧和数权,到数纹、数力和数体,再到数基、数明和数治,涂子沛先生用好看的故事、严谨的逻辑和富有人性的哲理编织出了一个新文明的愿景——数文明。作者四年磨一剑,用“野路无人自还”的孤独,换得了大众数智的开启。
——吴甘沙
驭势科技联合创始人、CEO
后记 野路无人自还
这是继《大数据》《数据之巅》之后,我关于数据的第三本书。和前两本书相比,我尝试引入一些变化。
一是视角变了,前两本书都是在留美期间写的,更多的是从世界看中国,本书提笔之时,我已经回国工作三年,做过了企业高管,也开启了自主创业,已接上国内地气,这本书是我立足中国的变化,对当下发展趋势和改革方向的思考。
二是在读了 8 年多的英文书之后,我开始重新翻阅中文书,特别是历史经典,我希望从传统的中国智慧中获得启发,希望不仅用中国的语言,还要用中国的智慧阐述现代的问题,并提出解决方案。
例如写到量子力学时,陶渊明这两句诗跳入了我的眼帘:“人生无根蒂,飘如陌上尘。分散逐风转,此已非常身。”这是《杂诗十二首》首的开头。靖节先生的大意是:人生在世就像漂泊在路上的尘粒一样,四处分散、随风飘转,此身历尽艰难,已非原来的我了。这启发我想到,现代人就是城市中的粒子,他们像粒子一样互相作用,人类社会更适用量子力学,人也像微观世界的粒子一样“测不准”。
又如写到人脸识别时,我追溯了中国古代画工的历史。西晋文学家傅咸(239—294)曾经专门作《画像赋》,他概括说,贵族之所以要画像,是“惟年命之遒短,速流光之有经,疾没世而不称,贵立身而扬名”,即其根本目的是对抗遗忘、存名后世。也就是说,早的绘画也源于和文字几乎一样的目的:记录。这在东方和西方是一样的。
说记录是人性的需要,其实也不为过。
本书的第三个变化,是需要面向未来,回答诸多前沿的问题。例如,由于深度学习的提出,近 5 年人工智能取得了巨大进步,但人工智能是不是还会出现新的方法?深度学习是向数据学习,智能是用数据喂出来的,如果有一天,机器能够向书本学习,它会不会更接近于人?又如,人类的驾驶员会出交通事故,医生可以有、也肯定有误诊,为什么我们就不能允许自动驾驶出事故,不能接受人工智能有误诊呢?再如,人工智能的发展是不是也有边界?人类拥有一些无法言说的隐性知识,它们很难被规则化、语言化,用文字、数据都无法有效表达,这也是为什么医生年纪越大越值钱,因为隐性的知识只跟时间、年龄和经验的积累有关,它们难以言表,因此也难以传承。那问题便是,在数文明之外,未来又会不会出现新的文明形态?
在算法、机器智能大幅跃进,向人类逼近的同时,人类的生活却越来越程式化,在向机器靠拢。20 世纪 30 年代,喜剧大师卓别林曾经创作《摩登时代》,塑造了一个因为在流水线上整天重复拧螺丝钉而异化的工人形象。大部分人没有意识到的是,手机也是一台设备,它也有流水线,软件就是它的流水线,但这条流水线在云端,是不可见的。如果说工业社会的异化只影响了流水线上的工人,那数据社会的异化正在波及几乎每一个人。今天,无论是在机场地铁、街头路口,还是办公室、客厅、卧室,我们无时无刻不在看手机,而且也在重复一两个动作:滑屏和点击。
就人的本性而言,我赞同人工智能先驱明斯基的看法,大部分人在大部分时候就是一台机器。因此,人工智能只要达到人类的“平均智能”,就可以在很多场合代替很多人,而人工智能超越“平均人”仅仅是时间的问题。
但人工智能是否能为普通人所用呢?例如,把芯片植入我们的大脑,让我们可以快速调取各种各样的信息,人类就可以像机器人“沃森”一样回答各种各样的问题,那“平均人”的水平是不是会大幅提升,变成“增强人”?这种方法会奏效吗?人类的创造力会不会因此增强?
此外,算法正在把很多事情都变成数据进行匹配,算法的普及减少了整个社会的随机性,生活更经济了,但是不是更美好了,我们也不得而知。再如,整个社会因为数据而形成了一个强关联的系统,但这个系统又存在大量的漏洞,智能社会是更脆弱还是更稳健?
这些都是在人类现有的知识边界凸现的新问题,本书就是在尝试回答这些问题。
很多个深夜,我一人在书房徘徊,或独坐在电脑面前,一遍遍校正自己的逻辑和基点,这时候,我的脑海中会反复回响起南唐李煜的一首词:“心事数茎白发,生涯一片青山。空山有雪相待,野路无人自还。”
这首词描摹的是一个在雪山和野外徘徊的独行人,字词之间透着一股冷寂和无奈。我写作期间,突然意识到这个古代的独行人就是今天的一个创新者,这种冷寂无奈就是人类的创新之苦。创新就是要向边界和边缘突进,那里大雪满山,也可能是空山,你徒手攀登,可能空手而回;那里是无人区,你必须在无人区思考、徘徊、拓进,这种冷寂和孤独是常人难以忍受的,只要是人,在无人区就待不久,因为寂寥和寒冷,我们只能半路折返回来,所谓“野路无人自还”。
但这不要紧,一个人只要向前突破一点点,就是对人类文明的贡献。文明的进步从来都是这样产生的。
回答新的问题,就是创新,这是我撰写本书深的感受。
我的启发是,现实中的创新者,一定要善于用语言和行动不断突破周边物理世界和人际关系的边界。
我的另一个感受是,求人学、求文学可以借鉴中国古代的智慧,
但若是求科学、求逻辑、求批判、求精确,那我认为,寄望于大部分中国的书就是缘木求鱼。换句话说,从中国过去的智慧里找不到现代社会的答案。科学技术正在重塑天下,人还是那个人,但世界已经不是那个世界了。今天的现代化,要着力于“数治”,中国的传统智慧提供不了答案,这也正是我写作本书的原因。
相较于前两本书,本书的写作还有一个困难。我从阿里巴巴离职之后,萌生了一个想法,希望创建一家优秀的数据科技咨询公司,本书的写作,是在诸多商业项目中见缝插针完成的。人和机器之间的另外一个共同点,就是人脑需要“预热”,有很多次我无奈地发现,预热的时间竟比写作的时间还要长,在商业项目和写作之间穿梭,我常感愧疚,因为两件事可能都没有做好。
本书后能够完成,有赖家人和朋友的支持。
我首先要感谢太太的理解、儿女的信任。其次要感谢雄安新区的陈刚书记、广州市人大的陈建华主任以及时任浙江省人大常委会副主任的毛光烈先生,他们关注大数据在中国的发展,对我的思考研究鼓励有加。我还要感谢南京市发改委的沈剑荣主任、何军副主任,苏州工业园区的许文清局长、段晴毅局长,2017 年,我承担了为南京市新型智慧城市做规划、为苏州工业园区设计城市大脑两个项目,这两个项目帮助我了解了中国个别发达城市的智慧城市建设实况,本书中不少案例都来自南京和苏州的调查和实践。
我要特别感谢涂新辉先生,从 2012 年我们因书相识,结缘已经 6 年,他在事业发展上给了我诸多提点,帮助我应对人情世故中的“不测风云”,可谓用“心”陪伴,在这个过程中,我发现了人生的新方向、新滋味和新追求,得一挚友,何其幸哉。
我要感谢公司的各位合伙人、同事以及业界专家,高路通读过初稿,提出了不少修改补充意见,葛育民、胡晓萌协助我收集、整理了大量的素材,我还要感谢中信出版集团前沿社蒋永军社长和张英洁编辑,他们为本书的面世做了许多细致的准备工作。
我后要感谢锦天城律师事务所、大成律师事务所,它们优秀的律师团队为我处理了大量的法律事务,我才能专心致志、心无旁骛。
手机和微信的普及,已经极大地改变了人们的阅读习惯。在本书的写作中,蒋永军社长曾经多次提醒我,千万不要大段地议论,这既费力又不讨好。于是,我希望这本书,是一场对话。虽然是我在讲,
你在听,但你可以随时合上书本,来我的微信公众号上提问,不管你在哪里,只要有网络,你我的距离,就是一个二维码这么近。我们的交流,也将成为数据,数据会记录这温馨一刻,这也是数文明发展的真实记录。
是的,数据和人工智能将会重塑天下,人性的温馨却不会改变,
这就是世界的变与不变。
涂子沛
2018 年 7 月 6 日
评论
还没有评论。