描述
开 本: 32开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787508663814
1、大数据、智能革命、人工智能、机械智能领域科普作品,易于理解,有态度,有温度。
2、雷军、罗振宇、涂子沛、李善友、邬贺铨院士联袂推荐。
3、罗辑思维8小时售罄首印图书。
4、百万册畅销书作者作吴军博士备受期待作品。
5、吴军博士,计算机科学家,并做过Google、腾讯等世界知名公司的高管,作品兼具学术的前瞻性与文本的可读性。
6、社会变革已到拐点,首次进入人们的思维领域,加入浪潮成为控制世界的前2%的人,徘徊不前则一定会被淘汰。
大数据和人工智能迅猛发展,对社会和商业的影响日益深刻,从学术界到企业界,智能化浪潮的来临,已经成为共识。可以比肩于大航海时期和工业革命的此次变革浪潮,必然会对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代:大数据与智能革命重新定义未来》中指出,首先,我们在过去被认为非常难以解决的问题,会因为大数据和机器智能的使用而迎刃而解,比如解决癌症个性化治疗的难题。同时,大数据和机器智能还会彻底改变未来时代的商业模式,很多传统的行业都将采用智能技术实现升级换代,同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。
另一方面,智能化也会对整个社会带来巨大的冲击,尤其是在智能革命的初期。因此,在智能时代开始的时候,我们需要未雨绸缪,力争做控制世界的2%人,而不是被智能化浪潮淘汰。
序
一 大数据与机器智能催生智能时代 邬贺铨
序
二 智能时代,未来已来 李善友
前
言 人类的胜利
章
数据—人类建造文明的基石
如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力的话,那么数据将成为下一次技术革命和社会变革的核心动力。
现象、数据、信息和知识
数据的作用:文明的基石
相关性:使用数据的钥匙
统计学:点石成金的魔棒
数学模型:数据驱动方法的基础
第二章
大数据和机器智能
在有大数据之前,计算机并不擅长于解决需要人类智能的问题,但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一轮技术革命——智能革命。
什么是机器智能
鸟飞派:人工智能1.0
另辟蹊径:统计 数据
数据创造奇迹:量变到质变
大数据的特征
变智能问题为数据问题
第三章
思维的革命
在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
思维方式决定科学成就:从欧几里得、托勒密到牛顿
工业革命,机械思维的结果
世界的不确定性
熵—一种新的世界观
大数据的本质
从因果关系到强相关关系
数据公司Google
第四章
大数据与商业
在未来我们可以看到,大数据和机器智能的工具就如同水和电这样的资源,由专门的公司提供给全社会使用。
从大数据中找规律
巨大的商业利好:相关性、时效性和个性化的重要性
大数据商业的共同点—尽在数据流中
把控每一个细节
重新认识穷举法—完备性带来的结果
从历史经验看大数据的作用
技术改变商业模式
加( )大数据缔造新产业
第五章
大数据和智能革命的技术挑战
大数据的数据量大、维度多、数据完备等特点,使得它从收集开始,到存储和处理,再到应用,都与过去的数据方法有很大的不同。因此,使用好大数据也需要在技术和工程上采用与过去不同的方法。
技术的拐点
数据收集:看似简单的难题
数据存储的压力和数据表示的难题
并行计算和实时处理:并非增加机器那么简单
数据挖掘:机器智能的关键
数据安全的技术
保护隐私:靠大数据长期挣钱的必要条件
第六章
未来智能化产业
现有产业 机器智能=新产业,未来的农业、制造业、体育业、医疗、律师,甚至编辑记者行业都将迎来崭新形态,新产业将取代旧产业满足人类的个性化需求,大数据将导致我们整个社会的升级和变迁。
未来的农业
未来的体育
未来的制造业
未来的医疗
未来的律师业
未来的记者和编辑
第七章
智能革命和未来社会
在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只有两条:要么加入智能浪潮,成为前2%的人,要么观望徘徊,被淘汰。
智能化社会
精细化的社会
无隐私的社会
机器抢掉人的饭碗
争当2%的人
后 记
参考文献
2016年是机器智能历史上一个具有纪念意义的年份,它是一个时代的结束,也是新时代的开端。这一年距离1956年麦卡锡、明斯基、罗切斯特和香农等人提出人工智能的概念正好过去了六十年,按照中国的习惯正好过去了一个甲子。而当年在达特茅斯学院提出这个概念的10位科学家中后一位科学家明斯基也在这一年的年初离开了人世,这或许标志着人类在机器智能领域阶段的努力落下来帷幕。就在明斯基去世后的两个月,Google的围棋计算机AlphaGo在同世界著名选手李世石的对局中,以4:1取得了压倒性的胜利,成为个战胜围棋世界冠军的机器人,它的意义要远远超过1997年IBM深蓝战胜卡斯帕罗夫,因为从难度上讲,围棋比国家象棋要难6-9个数量级。这件事不仅是人类在机器智能领域取得的又一个里程碑式胜利,而且标准这一个新的时代—-智能时代的开始。
从计算机发展的角度看,智能机器在所有棋类战胜人类其实只是一个时间问题,因为机器运算能力的提升是指数增长的,而人类智力能够做到线性增长就不错了。因此一定存在一个时间点——在所有的棋类比赛中都会超过人。在1997年IBM的深蓝战胜卡斯帕罗夫之后,围棋不仅是后一个计算机尚未超越人类的主要棋类,而且还担负了上千年东方文化的蕴含,即棋道。虽然大部分人相信计算机终可以在围棋上超越人类,但是总是觉得那还是几年后的事情。就在AlphaGo和李世石比赛之前,李世石本人认为前者的水平和他差出一到两个子,也就是说,即使他让先也能5:0获胜。中国围棋界的泰斗聂卫平也认为今天的计算机是不可能战胜人类的冠军的。就连曾经在Google工作过的IT行业老兵李开复博士也不相信AlphaGo能赢。这并非李开复等人对今天机器智能的发展状况不够了解,而是因为下围棋是一件太难的事情。2015年年底,AlphaGo仅仅赢了樊麾二段而已,离九段还差得远呢。但是大家忘记的一件事情,那就是AlphaGo水平的提高并不需要人那么长的时间,事实上在Google内部,大家在开赛前已经知道AlphaGo的水平并在九段之下。
2016年3月9日,AlphaGo和李世石之间的世纪大战开始了。AlphaGo在盘出人意料地轻松获胜。当然,大部分人在赞誉AlphaGo水平的同时,依然认为这可能是李世石在试探计算机而已,毕竟那是五盘的比赛,用一盘棋试探毫不了解的对手未尝不是明智之举。但是当AlphaGo在第二盘获得连胜并且下出了很多人类想不到的好棋后,对机器智能持怀疑态度的聂卫平等人,都对它产生了致敬。在AlphaGo获得第三盘胜利之后,很多超一流的棋手都渴望和它一比,希望以此检验自己的水平,并且能够提高技艺。虽然李世石在第四盘抓住AlphaGo的一个失误打了一个漂亮的翻身仗,但是AlphaGo在后一盘稳稳地控制着局面,直到胜利。可以讲在那一次人机大战之后,围棋界对机器智能从怀疑变成了顶礼膜拜,大家都意识到,按照AlphaGo在过去几个月里的进步速度,只要Google愿意继续投入科研,很快人类所有的围棋高手都无法和它过招了。
计算机之所以能战胜人类的,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。在数据方面,AlphaGo在训练时使用了几十万盘围棋高手之间对弈的数据,这是它获得所谓的“智能”的原因。在计算方面,AlphaGo采用了上万台服务器训练它下棋的模型,并且让不同版本的AlphaGo相互对弈了上千万盘,这才保证了它能做到“算无遗策”。具体到下棋的策略,AlphaGo里面有两个关键的技术:把棋盘上当前的状态变成一个获胜概率的数学模型,这个模型里面没有任何人工的规则,而是完全靠前面所说的数据训练出来的。第二个关键技术是启发式搜索算法—-蒙特卡洛数搜索算法(Monte Carlo Tree Search),它能将搜索的空间限制在非常有限的范围内,保证计算机能够快速找到好的下法。虽然AlphaGo的训练使用了上万台服务器,但是它在和李世石对弈时仅仅用了几十台服务器(1000多个内核以及一百多个GPU)。相比国际象棋,围棋的搜索空间要大
倍,AlphaGo的计算能力相比深蓝,其实并没有这么多倍的提高,它靠得是好的搜索算法,能够准确地聚焦搜索空间,因此能够在很短的时间里算出行棋步骤的。由此可见,下围棋这个看似智能型的问题,从本质上讲,是一个大数据和算法的问题。
当然,Google开发AlphaGo的终目的,并非要证明计算机下棋比人强,而是要开发一种机器学习的工具,让计算机能够解决智能型的问题。AlphaGo和李世石对弈,实际上是对当今机器智能水平的一个测试。从樊麾到李世石,实际上是用他们的专才在帮助Google测试当今机器智能的发展水平。在人机对弈的第四盘李世石反败为胜的过程中,他无意中发现了AlphaGo的一个缺陷。因此,Google的成功里面也有李世石等棋手的功劳。从这个角度讲AlphaGo的胜利标志着人类在机器智能方面达到了一个崭新的水平,因此它是人类的胜利。
AlphaGo无论是在训练模型时,还是在下棋是所采用的算法都是几十年前大家就已经知道的机器学习和博弈树搜索算法,Google所做的工作是让这些算法能够在上万台甚至上百万台服务器上并行运行,这就使得计算机解决智能问题的能力有了本质的提高。这些算法并非是专门针对下棋而设计的,很多已经在其它智能应用的领域(比如语音识别、机器翻译、图像识别和大数据医疗)获得了成功。AlphaGo成功的意义不仅在于它标志着机器智能的水平达到了一个新的台阶,还在于计算机可以解决更多的智能问题。今天,计算机已经开始完成很多过去必须用人的智力才能够完成的任务,比如医疗诊断,阅读和处理文件,自动回答问题,书写新闻稿和驾驶汽车等等。可以讲,AlphaGo的获胜,宣告了机器智能时代的到来。
AlphaGo的获胜让一些不了解机器智能的人开始杞人忧天,担心机器在未来能够控制人类。这种担心是不必要的,因为AlphaGo的灵魂是计算机科学家为它编写的程序。机器不会控制人类,但是制造智能机器的人可以。而科技在人类进步中总是扮演着活跃革命的角色,它的发展是无法阻止的,我们能做的是面对现实,抓住智能革命的机遇,而不是回避它、否定它和阻止它。未来的社会,属于那些具有创意的人,包括计算机科学家,而不属于掌握某种技能做重复性工作的人。
在AlphaGo取得人机大战胜利之际,我们出版这本书,希望能让大家更多地了解大数据的本质、它的作用、它和机器智能的关系、机器智能的原理和发展过程,以及它们二者对未来产业和社会的影响。本书一共分为七章,分别介绍了数据的作用,大数据的本身,机器智能的原理及其发展过程,大数据思维的核心及其重要性,大数据和机器智能与商业的关系,它们对社会正反两个方面的巨大影响。书中的核心内容来自我在研习社和一些大学商学院讲课的讲义,但是考虑到大家读书和听课毕竟有很大的区别,因此在将讲义改写成书的时候,我在书中增加了大量的案例和历史背景介绍,以方便大家能够系统地了解大数据和机器智能的来龙去脉,以及我们对未来进行分析的依据。
从信息时代到智能时代,吴军博士的书描绘了人类这关键一跃将是如何壮阔瑰丽。过去科技带来的人类能力的延展基本是物理性的,远的有纺织机代替手工作坊、汽车代替马车,近的有GPS实现全球定位,通信+智能终端实现实时资讯传输、交互等。但大数据技术和智能革命带领的人类社会跃迁,将是*次进入了真正思维领域,人类的分析、判断、决策思维的效率将实现爆炸式提升。我们的商业行为理论、产业架构、商业模式和组织管理模型都发生天翻地覆的变化。
吴军博士为我们提供了一个独特视角,揭示了人类历史拐点的伟大时机之下,我们所面临的历史机遇与危机挑战,对每个企业家而言都是宝贵的启发。
——雷军
小米创办人,董事长兼CEO;金山软件董事长;天使投资人
曾经,我们要学习如何操纵机器,掌握机器的语言,向机器靠拢;今天,机器在向人靠拢,试图理解人类、用我们的语言与我们对话。这就是“智能时代”,这个时代的基础是数据,可谓“无数据、不智能”。吴军先生这本书将智能时代的诸多要素娓娓道来,读下来如林中散步,在不知不觉中带领我们去到远方、登上高处,饱览领会了这个新时代的版图和全线的风景。
——涂子沛
著名大数据专家,著有《大数据》《数据之巅》
综观全书,这是一部近代科技的历史书,也是一部科普书,也可以说是一部指导创新的教科书。由于大数据的应用必然会渗透到所有的领域,因此本书不仅值得IT行业科技人员一读,对关注信息化应用的其他行业的科技人员和管理人员来说也必定开卷有益。
——邬贺铨
中国工程院院士
《智能时代》这本书展现了吴军博士的真知灼见和前瞻思维,这些都来自于他在大数据和机器智能领域的多年*线实践经验。全书对大数据与智能革命带来的思维革命、技术上的挑战,以及机器智能如何改变人类社会,都做了全面的讲解。与其他一些写机器智能的书不同,这本书与作者之前的几本书一样,维持了作者对科学生动而易于理解的、有温度感的一贯的表述方式。
—— 混沌大学创始人
智能时代,未来已来。
未来的农业、制造业、体育、医疗、律师,甚至编辑记者行业等将迎来怎样的崭新形态?你会被失业吗?
01 未来的体育
烂球队勇士崛起之谜
在2015-2016年的NBA(美国职业篮球联赛)赛季,位于硅谷地区的金州勇士队(Golden State Warriors)创造了NBA历史上常规赛获胜率的纪录,在全部82场比赛中获胜73场。而在一年前,该队获得了NBA总冠军。
但事实上,勇士队曾长期以来一直是NBA里的一支“鱼腩球队”。在2009年,金州勇士队还是NBA里烂的球队之一,那一年它的成绩排名倒数第二,当然勇士队也不可能有什么球星和大牌教练。因此该队能取得这样的成绩,实在是一个奇迹,而它创造奇迹的方式在体育史上恐怕是独一无二的。
金州勇士队的成功并非砸钱的结果,而是因为它处在一个特别的地区—硅谷。
硅谷地区有两种人不缺,即风险投资人和工程师,勇士队的奇迹从很大程度上讲是靠他们创造的,前者善于看到其他人还没有发现的投资潜力,然后把它经营成值钱的实业;后者善于利用技术创造奇迹。
勇士队的成功就是他们合作的结果。6年前勇士队的比赛成绩跌到了谷底,因此价值较低,一些风险投资人决定将这支不值钱的球队买下来好好经营,让它成为美国体育界耀眼的明星。
这个计划看上去有点疯狂,不过投资人有自己的考虑,他们有秘密武器,那就是能够应用大数据的工程师。终,投资人花了4.5亿美元这个相对较低的价格完成了对勇士队的收购。
在收购完成后,投资人为球队委派了新的管理层:没有任何执教NBA经验的史蒂夫•科尔,因突出的投篮优势被委任为教练。科尔在执掌勇士队之后,坚持用数据说话,而不是凭经验。
他根据背后团队对历年来NBA比赛的统计,发现有效的进攻是眼花缭乱的传球和准确的投篮,而不是彰显个人能力的突破和扣篮。在这个思想的指导下,勇士队队员苦练神投技,全队在一个赛季中投进1 000个三分球,又创造了一项NBA纪录。
这其中,亮眼的新打法是尽可能地从24英尺(大约7.3米)外的三分线投篮,这样可以得3分。正是因为不再按照篮球传统的战术作战,勇士队卖掉了那些价钱高却效率低的明星,而着重培养自己看中的新人。
这位新人叫斯蒂芬•库里(Stephen Curry),三分球的神投手。在2014~2015年赛季中,库里的神投让勇士队夺得了40多年来的个总冠军,他自己也成为当年的有价值球员(MVP)。到了2015~2016赛季,库里投进了403个三分球,创造了NBA历史上的纪录,打破了由雷•阿伦所保持的个人单赛季269记三分命中数的纪录。
除了利用数据制定战略,勇士队还利用实时数据及时调整比赛中的战术。早在2012年,勇士队的总裁兼COO(首席运营官)里克•威尔茨(Rick Weltz)就在一次大数据会议(TUCON 2012)上介绍了该球队应用大数据的成果。根据威尔茨的介绍,大数据可以帮助球队改进精细到两个人配合的细节。正是靠高科技,勇士队才得以在短短6年里从倒数第二名登顶NBA的总冠军。
鉴于勇士队的战术和成绩给NBA带来的巨大冲击,奥巴马在白宫专门接见了勇士队,并且讲道:“(这)看起来正在打破这项运动的格局,这似乎是不公平的比赛。”篮球界的人士则认为,勇士队是NBA里的Google。
02 未来的农业
沙漠之国以色列凭什么成为“欧洲的厨房”?
2005年,Google一些好事者学着以色列人的做法,在总部门前开辟了很小的一片蔬菜种植园,试图重现以色列人在过去几十年里在农业上取得的成就。几年试验下来,证明以色列人的做法是可以复制的。那么以色列人是怎么做的呢?
事实上,以色列的自然环境十分恶劣,绝大部分土地为沙漠,可耕种面积不到国土面积的五分之一,而且土层是世所罕见的贫瘠,更要命的是水资源严重匮乏。然而,就是在这样一片生存条件恶劣之地,以色列人创造了令人咂舌的奇迹,许多农产品的单产量领先于世界先进水平。
他们的奶牛单产奶量居世界,平均每头年产奶10 500公斤,每只鸡年均产蛋280个,棉花单产居世界之首,亩产近1 000斤……由于单产高,以色列居然成为农产品出口大国,每年向欧洲出口大量的蔬菜和水果,有“欧洲的厨房”之称。
以色列取得这样的成就,其根本原因是靠科技兴农,那他们是如何在农业中节省水资源的?
作为严重缺水的国度,以色列人发明了滴灌技术——装有滴头的管线直接将水和肥料送达植物的根系,大大节约了水和肥料。所有灌溉方式都采用计算机进行自动化控制,灌溉系统中有传感器,能通过检测植物茎果的直径变化和地下湿度,来决定对植物的灌溉量,这样可以节省人力和水资源。由于有大量的传感器在采集数据,这种自动滴灌系统可以对用水量和产量的关系进行学习,改进灌溉量。
自“二战”后立国以来,以色列的农业生产增长了十多倍,而每亩地的用水量仍保持不变。靠着农业高科技,以色列给传统的农业带来了质的革命,“二战”前是一片荒漠的内盖夫地区(以色列所在地),现在已经出现大片绿洲了。
03 未来的制造业
特斯拉神秘的机器人工厂全曝光
在美国,特斯拉汽车公司已经尝试全部使用机器人来装配汽车,这不仅使得工厂雇用工人的数量大幅度减少,而且还让出厂的汽车性能和质量更稳定。
美国“二战”后的汽车行业有上百万装配工人,但是现在只剩下当年的一个零头。而新的汽车公司比如特斯拉,已开始尽可能地使用机器人取代装配工人。硅谷东部的弗利芒特市(Fremont)有特斯拉的汽车装配厂。在该厂的门口每天都有几个人举着骷髅抗议,停下来一问,才知道特斯拉根本不从汽车工会招装配工人,甚至很少招生产线上的工人,因此汽车工会天天跑去抗议。
抗议归抗议,特斯拉就是不雇生产线上的工人,外界也拿它没有办法。事实上,在过去的5年里,特斯拉员工数量增长非常快,不过它所雇的都是IT人员,以至于它更像是一个IT公司而非汽车公司。那么大家可能有一个疑问,特斯拉的汽车是怎么制造出来的呢?答案很简单,尽可能地使用机器人。
机器人取代人类从事制造业的另一个巨大优势在于,产品很容易按照个性化定制。在大工业时代,机器所解决的是确定性问题,因此,一旦一个产品设计出来,它就是确定的,按照事先确定的设计复制,成本是很低的。但是,如果哪个顾客想要根据自己的需求订购一款特定的产品,那么成本是很高的。而在机器人取代生产线上的装配工人的智能制造时代,只要通过设定产品参数,机器人就可以根据用户需求制造出个性化的产品,其成本不会比大规模生产高多少。
特斯拉很少雇用原来汽车行业的人员,除了降低成本外,还有一个更深层次的原因—它一直把自己定位成一个IT公司,而不是汽车公司。汽车其实就是承载着特斯拉IT技术的平台,特斯拉内部将汽车看成是一个巨大的智能终端,通过这个智能终端,特斯拉把它的各种技术服务提供给大家,同时也参与到消费者的日常生活中。
04 未来的医疗
人类能否长生不老?
手术机器人
今天,世界上有代表性的做手术的机器人就是达•芬奇手术系统。达•芬奇手术系统分为两部分:手术室的手术台和医生可以在远程控制的终端。手术台是一个有三个机械手臂的机器人,它负责对病人进行手术,每一个机械手臂的灵活性都远远超过人,而且带有摄像机可以进入人体内手术,因此不仅手术的创口非常小,而且能够实施一些人类医生很难完成的手术。在控制终端上,计算机可以通过几台摄像机拍摄的二维图像还原出人体内的高清晰度的三维图像,以便监控整个手术过程。医生也可以在远程对手术的过程进行人工干预。
达•芬奇手术系统的主要发明人之一,约翰•霍普金斯大学的拉塞尔•泰勒(Russell Taylor)教授是我的朋友和师长,因此我有幸亲身体验操作该机器人。他为我在手术台上设置的是一个仿制的人脑,我在远程用手术刀虚拟切割时,手的感觉和切割真实的组织是一样的。目前全世界共装配了3 000多台达•芬奇机器人,完成了300万例手术。
机器医生
自然语言处理专家和医生们让计算机理解人的语言,然后让它能够根据化验结果和病人的描述来诊断简单的疾病。
IBM公司从20世纪70年开始就致力于机器智能的研究,并且在工业界一直处于领先地位。IBM开发的沃特森(Watson)智能系统可以理解自然语言,分析各种数据和医学影像,帮助疾病诊断和医疗信息的管理。
在一些医学领域,比如肿瘤科,它能够非常准确地给医生提供诊断的建议和帮助。目前,如果不引入医师的干预,仅仅靠计算机通过阅读病例、倾听病人的描述和分析化验结果进行疾病诊断,它也能达到中等医生水平。
个性化抗癌药品
2013年Google宣布成立独资的IT医疗公司Calico,并且聘请了世界知名的生物系统专家阿瑟•李文森博士担任CEO。李文森博士曾经是世界上的生物制药公司基因泰克的CEO,在接受Google任命时,他依然担任着基因泰克的董事会主席以及当时全球市值的公司—苹果公司的董事会主席,可谓整个工业界有权势的人物之一。
人类在抗癌研究方面投入的资金比阿波罗登月或者语音识别要多得多,但至今依然难以根治癌症。因为癌细胞基因的突变和人有关,而且可能一再突变,因此要想彻底解决问题,就需要针对不同的患者设计特定的抗癌药,而且要根据患者癌细胞每一次新的变化研制新药。
因此,李文森博士认为,只要这个研制速度能够赶得上癌细胞的变化,那么,即使不能彻底杀死所有的癌细胞,患者仍可以长期和癌症共存。为解决这个问题,李文森博士认为这要依靠的IT技术,尤其是大数据。
根据基因泰克的科学家解释,我们已知的各种可能导致肿瘤的基因错误不过在万这个数量级,而已知的癌症不过在百这个数量级。也就是说,即使考虑到所有可能的恶性基因复制错误和各种癌症的组合,不过是几百万到上千万种,这个数量级在IT领域是非常小的,但是在医学领域则近乎无穷大。
如果能利用大数据技术,在这不超过几千万种组合中找到各种真正导致癌变的组合,并且对这样每一种组合都找到相应的药物,那么对于所有人可能的病变都能够治疗。针对不同人的不同病变,只要从药品库中选一种药即可,比如对患者约翰,他原本是使用第1203号药品,如果发生新的病变,经过检查确认后,改用256号药品即可,这样并不需要每一次重新研制药品。如此一来,便可以控制癌症了。
李文森博士所倡导的为每一个患者设计个性化特效药的思路,如今已被制药行业和医学界普遍认可。在美国著名的加州大学旧金山分校医学院里,阿图尔•巴特(Atul Butte)教授建立起医学大数据中心,专门从事利用大数据寻找个性化药品的研究工作。
根据该中心的陈斌副教授介绍,美国只有1/7左右的临床证明有效的药品终能够走完FDA(食品药品监督管理局)全部审批流程并终上市。剩下来的6/7的药品,虽然在小范围内使用时对一些病人确实有很好的疗效,但是在使用到大量患者身上时,平均的效果并不显著,因此终被FDA否决。
该中心通过研究发现,其中不少药其实对特定的人群有效,现在的关键是找到那些特定的人群,让那些研制过程中被淘汰的所谓“废药”经过改造后能够重新被利用。在未来,可能一种疾病会有不同的药品医治,而不同的人会有不同的特效药。
人类是否可以长生不老?
据麻省理工学院理学院院长迈克尔•斯普瑟(Michael Sipser)博士介绍,在过去的10年里,美国癌症、艾滋病、心脏病和中风的死亡率都在下降,下降的幅度在20%~40%左右,但是阿尔茨海默症导致的死亡率却上升了40%。
在李文森博士看来,延长人的寿命关键是要找到衰老基因。至于怎么找,则需要使用大数据,而Google的特长是善于处理大数据,因此这便促成了李文森博士和Google共同创建大数据医疗保健公司Calico一事。
当然,Google也明白,光靠自己一家的力量是无法解决如何防止衰老这一难题的,为了便于全球科学家们一同努力来解决这个难题,Google和斯坦福大学医学院以及杜克大学医学院一起,将建立一个标准的人类医疗数据库,这个数据库中包括5 000人全部的生理和医疗信息。三家参与方希望该数据库能成为全球科学家们做研究和发表科研成果的基准(Baseline)数据库。
除了Google之外,更多的IT公司和IT人士开始涉足医疗领域。事实上,由加州大学圣迭戈分校教授约翰•克雷格•温特(John Craig Venter)等人创办的人类长寿(Home Longevity)公司在这方面甚至走到了Google的前面,该公司于2013年成立,今天已经开始为一些大的制药厂提供与基因技术有关的服务了。
05 未来的律师业
相当多的人会失业
大数据对司法领域的另一个重大影响在于机器智能会逐渐取代律师做一些案例分析工作,这使得诉讼的成本有可能大幅度下降。
今天,一些公司利用自然语言处理和信息检索技术,发明了让计算机阅读和分析法律文献的软件,可以取代很多人工。位于硅谷帕罗奥图市的Blackstone Discovery(黑石发现)公司发明了一种处理法律文件的自然语言处理软件,使得律师的效率可以提高500倍,而打官司的成本可以下降99%,这意味着未来将有相当多的律师(尤其是初级水平的律师)可能失去工作。事实上这件事情在美国已经发生,新毕业的法学院学生找到正式工作的时间比以前长了很多。
06未来的记者和编辑
计算机重新定义行业
今天计算机写作的本领到底有多大?我们可以把写作从简单到复杂分为下面5个层次:
1. 书写完整的句子。
2. 组织几个句子构成符合逻辑的段落。
3. 给予特定格式,或者写作模板,能够清晰传递信息,
表达意思。
4. 能够不限定格式地写作内容,达到一般人平均水平。
5. 能够达到专业记者、作家和学者水平。
在组织构造问题答案时,计算机已经达到了第二层次。实际上目前计算机的写作水平比这个层次还高一点,它能够完成结构比较清晰、格式固定的新闻稿,因此基本上达到了第三个层次的要求。
今天美国很多媒体的财经新闻,尤其是对公司财报的评述,其实已经是计算机产生的了。比如IBM公司发布了去年四季度的财报,计算机会先“读”一遍该公司财报的内容,然后提取出主要的信息,比如该季度的收入、利润,与华尔街预期的对比,人员情况,市场份额,等等;然后计算机可以写一篇关于IBM业绩的新闻稿,当然后在发表前多少还是经过了人工的一些润色处理。
计算机是如何写作的?实际上它的写作方式和我们人在学习外语时造句的方法完全不同。它不是根据语法和所要表达的意思编句子,而是从大量文本语料中学习写作。我们常用“熟读唐诗三百首,不会作诗也会吟”说明背诵过去的范文对写作的帮助,而计算机的长处恰恰在于它能够背,而且能够快速读非常多的样本并背下来。
计算机写财经评论其实是根据以前很多报纸上多年积累的财经类的文章,训练出各类财经文章的模板,然后每次根据从财报中读出的信息,合成一篇文章。当然,这样合成的文章读起来未免生硬,因此计算机还要用一种被称为语言模型的概率模型,将文字构造成优美的句子,再用另一个语言模型将句子组合成段落。这些模型也是从以往的数据中训练出来的。
计算机写作大大提高了新闻行业的效率,但是同时也让记者和编辑这类工作正在萎缩。或许再过若干年,我们在编辑部里看到的景象不再是一批伏案工作的编辑,而是一台台计算机,这个行业也就被重新定义了。
评论
还没有评论。