描述
开 本: 16开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787121362088
本书是《从0到1》的美国版权商2019年全新重磅作品,智能语音入选《麻省理工科技评论》2019年全球十大突破性技术,本书为你解密苹果、亚马逊、谷歌、Facebook、微软等科技巨头的智能语音布局与商业角逐,决胜未来的智能语音核心技术、商业思维和未来趋势。《连线》主编尼古拉斯·汤普森、Siri创始人汤姆·格鲁伯、传奇预言家雷·库兹韦尔、科大讯飞创始人刘庆峰等大咖联袂力荐。
我们正在进入语音科技时代,我们的衣食住行都将发生巨变,对着智能音箱说,我想买一件T恤,它就会为你推荐甚至帮你下单;在餐厅,服务员已经变成了机器人助手,想约一顿火锅直接打电话给它就行;在家里,电视、音箱等声控中心可以听懂你的指令,在你起床之前为你打开窗帘,煮上一杯咖啡……
你我生活常见的,用键盘或在面板上写信息、在网上搜寻资料、用遥控器换台……这些都已成为历史。未来是语音操控的时代,所有的科技大腕如谷歌、 苹果、脸书、微软、亚马逊、科大讯飞等都已经初步展示这一新科技平台。未来的连结不再是空间,而是对话!本书诉说这一重大改变的过去与未来。
全书分四个部分来讲述:*部分“竞争”,讲述智能语音时代的竞争之战和范式转换,解密苹果、亚马逊、谷歌、脸书、微软等科技巨头的智能语音布局与商业角逐;第二部分“创新”,讲述智能语音的技术探索和创新之路,探索了语音人工智能的技术突破、个性设计和交谈能力;第三部分“革命”,讲述智能语音的革命之路,探索了语音人工智能的情感陪伴、超级智能、隐私风险和虚拟永生。第四部分“*后的计算机”,预测了智能语音的未来,并探讨了它将如何*终改变世界。
在本书中,你会了解到 :
科幻电影中出现的场景,贝佐斯和扎克伯格等科技大佬们如何把它们变成现实的?
乔布斯为什么要收购Siri公司?乔布斯为何从来没有这样执着地每天都给某个人打电话?
贝佐斯是个科幻迷,亚马逊布局智能语音领域竟然与《星际迷航》有关?
贝佐斯团队是如何秘密研发虚拟语音助理的?
Siri之父是何许人也?作为智能语音领域的“吃螃蟹者”,Siri是如何进行商业化的?
人工智能可以让人们跟逝者“对话”?
为什么说电子商务可能是在智能语音领域*的盈利模式?
机器计算、神经网络技术、深度学习技术等*技术的突破口在哪里?
智能语音行业的商业模式是怎样的?
语音助理的个性是如何设计的?
智能语音的核心技术是什么?
智能语音行业的未来盈利模式是怎样的?
智能语音将如何改变世界和未来?
……
第一部分 竞争
CHAPTER01 范式转移 / 002
CHAPTER02 语音助理 / 019
CHAPTER03 科技巨头 / 052
第二部分 创新
CHAPTER04 探索之旅 / 086
CHAPTER05 技术突破 / 116
CHAPTER06 个性设计 / 156
CHAPTER07 交谈能力 / 188
第三部分 革命
CHAPTER08 陪伴功能 / 226
CHAPTER09 超级智能 / 268
CHAPTER10 隐私风险 / 302
CHAPTER11 虚拟永生 / 342
后记 最后的计算机 / 379
智能语音,开启万物互联时代的大门,让AI闪耀人性光芒
一位被诊断为患有晚期肺癌的父亲,在生命末期,为孩子留下了91970个单词的口述。孩子打造了一台爸爸机器人,让父亲在声音的世界里“永生”—— 这个孩子就是本书的作者。
这个令人动容的故事让我们感受到语音的温度和科技的温暖。
在中国,科技也在创造着这样的温暖。2018年年初,在全球首部利用人工智能配音的纪录片《创新中国》中,我们合成了中央电视台已故配音大师李易的声音,用技术向艺术致敬。在首映式上,李易老师的弟子们集体起立、热泪盈眶。
语音,是人类呱呱坠地后最早使用的沟通方式,也是现代人际交流最基本的方式,更是未来人机交互最重要的方式。人工智能跌宕起伏发展60多年,智能语音是发展到今天最为成熟、也是最重要的板块之一。“最近的一次范式转移正在进行中。” 作者在书中提到,这次转移正是关于智能语音的。
语音,开启万物互联时代的大门。
在互联网发展的下半场,我们将进入万物互联的新时代。随着越来越多的设备在无屏、移动、远场状态下被使用,作为人类最自然、最便捷的沟通方式,语音将会成为所有设备至关重要的入口。未来,我们将迎来以语音交互为主、键盘触摸为辅的全新的人机交互时代,人和机器之间的沟通,可能完全是基于自然语言的,你不需要去学习如何使用机器,只要对机器说出你的需求即可。
比如在导航软件中,你能听到各种明星的合成声音,可以用他们的声音为你指路;在电视上,你能看到虚拟主播播报的多语种新闻,与真人相比不仅相似度高,而且24小时无休;在居家生活中,你能通过语音控制音乐、灯光、温度,实现智慧家居;甚至在医院里、社区里,你能用语音调动机器人帮你办理事项,节省时间……人工智能已经在为我们的日常生活服务,智能生活的大门正缓缓打开。
语音,让时代更具人性温度。
智能语音是通向万物互联时代的必经之路,它的存在让交互方式拥有无限的可能,也让这个时代更具人性的温度。
20世纪90年代,我在就读于中国科学技术大学时被选进人机语音通信实验室,研究“如何让机器像人一样开口说话”。那时,团队的一个梦想是研发一台能自动翻译的电话,即使交流时语言不通,通过人工智能技术也能让我们无障碍地交流;20多年后的今天,我们自主研发的翻译机已经支持中文与50种语言的实时翻译,每个月总共为全球提供超过 5000 万次服务。智能语音让被地域、文化等因素隔离的人们也能无障碍地沟通。
此外,我们通过技术在听障和视障人群间搭起沟通的桥梁,让听障群体通过语音识别技术“看得见”声音,让视障群体通过语音合成技术“听得见”文字。2017年我们发布了“三生有幸”公益计划,目前已有几十万残障人士受益。语音转写、语音朗读为他们获取信息带来了极大便捷。我们希望,随着语音技术的使用与发展,未来每个人都将因AI而能。
语音,在万物互联时代技术门槛将会更高。
在以语音为主、键盘触摸为辅的万物互联时代,人们对语音交互提出了更高的技术期待与需求。今天,虽然在安静、发音标准的情况下,中文的语音识别准确率已经可以达到98%,英文的语音识别准确率可以达到95%,但在有方言、噪音、口音和远场的情况下,距离语音识别高准确率或许还有很长一段路要走。
以2018国际语音识别比赛CHiME-5为例,它是世界上最权威的语音识别比赛,考察在噪声和远场环境下的语音识别效果。但是让人意想不到的是,比赛主办方用最新的算法和深度学习模型做了参考系统,在测试中语音识别错误率竟高达81.14%,可以说是“史上最难语音识别任务”。科大讯飞虽然在这次比赛中取得全部四个项目的第一名,将错误率降低了35个百分点,但是距离高准确率仍有不小的差距。可以看到,在万物互联时代,语音识别技术还有非常大的提升空间,语音识别的门槛不是降低了,而是提高了。
20年前,我和实验室的同学们一同创立科大讯飞,就是认定了智能语音巨大的潜力和广阔的前景,它会让人机信息沟通无障碍。今天,看到这本《智能语音时代》,我非常高兴。作者对语音技术的发展趋势有着深刻洞察,从Siri诞生到谷歌助理、亚历克莎的规模化应用,以翔实的资料、细致的文笔讲述智能语音时代的到来及其可能带来的影响。这本书不仅是对智能语音的科普,更让读者对智能语音未来的发展有了更多的了解。
“他山之石,可以攻玉。”人工智能正在成为全球化发展的关键力量,中国的语音技术和产业也必将在其中发挥更大力量。相信本书的出版,会让更多人重新认识神秘且熟悉的语音世界,让我们一起携手,让世界聆听我们的声音,让沟通从AI开始。
刘庆峰
科大讯飞董事长
随着人工智能、5G技术的日渐普及,人类正在步入智能语音时代,包括智能语音在内的新技术将会切实改变了人们的生活。本书深入探讨了全球智能语音领域的现状和未来,通俗易懂,是一部难得的扎实的科普作品。他山之石,可以攻玉。相信本书能为我国的智能语音产业的发展提供更多的启迪。
——工业和信息化部信息化和软件服务业司副司长 董大健
语音可以说是人机交互*重要的方式。《智能语音时代》娓娓道来现在与未来智能语音将会给人们带来的改变,值得一提的是本书对产业的观察鞭辟入里、又拥有极高的可读性。
——科大讯飞轮值总裁、消费者BG总裁 胡郁
语音技术重塑了人机关系,《智能语音时代》对此展开了令人激动的描述。弗拉霍斯对语音技术如何改变世界进行了精彩呈现,他是一位非常优秀的作者。书中的每一页都会给你新的视角和观点,你会忍不住翻阅下去。相信本书会引爆世界!
——《连线》杂志主编 尼古拉斯·汤普森( Nicholas Thompson)
语音人工智能是一次技术的范式转移。从全景宏观世界到对我们每个人生活的直接影响,弗拉霍斯把所有这一切展现得十分生动。这是一本有深度的、有趣的巨作。
——Siri联合创造者 汤姆·格鲁伯 (Tom Gruber)
弗拉霍斯的这本书把我们日常生活越来越离不开的语音技术讲得很透彻。在本书中,他为读者呈现了智能语音的未来。
——《奇点临近》作者、科学家、未来学家 雷·库兹韦尔(Ray Kurzwell)
裂变的“接力棒”已经从智能手机传给了智能语音,弗拉霍斯把这次平台转换精彩地呈现出来。
——畅销书作家 斯高特·加罗威(Scott Galloway)
每十年左右,人与技术的互动方式就会有一个根本性的转变。数十亿美元的财富会“恭候”那些定义了新的时代范式的公司,而落伍者将破产倒闭。在计算机的大型机时代,IBM是主宰者;微软公司是桌面时代的王者;谷歌公司靠搜索引领了互联网时代;苹果公司和脸书公司则在移动互联网时代一飞冲天。
最近的一次范式转移正在进行中。
最新的平台之战已经打响。
最新的技术颠覆正在发生,无论是其规模还是其重要性,都可能是世人前所未见的。
我们正在迈入智能语音时代。
语音正在变成影响现实的通用遥控器,成为几乎能控制任何一种技术装置的手段。语音能够让我们指挥各种数字产品助理——“行政助理”“门房”“主妇”“管家”“顾问”“保姆”“图书管理员”“演艺人员”等。语音打破了世界上一些最有价值的公司的商业模式,为新的应用创造了机会。语音把对人工智能的控制权交给了用户。很久之前科幻作品就预言过这样的关系模式,在这样的关系模式中,拟人化的人工智能成为我们的“助手”“看门人”“预言者”“朋友”。
智能语音时代的到来是人类历史的转折,因为运用语音是我们人类这个物种的特质——这一能力把我们和其他物种区分开来。人类的内部意识的中心不在肺部的空气里,也不在血管里的血液中,而是在大脑的语言区里。语言调整着我们的关系,它能塑造思想、表达感受、沟通需求;它能发起变革、挽救生命、激起爱恨情仇;它把我们所知道的一切记录下来。
得益于最近出现的一系列突破,教计算机用自然语言说话的浪漫构想在现实世界中有了市场——这个领域被称为智能语音领域。随着按照摩尔定律能够预测到的计算能力以指数级提升,一系列进展开始出现。手机崛起——事实上我们随时携带着的是一台强大的袖珍计算机,它是语音技术发展的重要推动者。
机器学习使得计算机能通过分析数据就能获得能力——这非常关键,能够让开发者一举克服那些已经纠缠了几十年的问题。而云计算是一个决定性的(但经常被忽略的)因素。语音技术需要巨大的算力支撑。尝试把所有的算力都在手机上实现十分困难,并且其代价极高。在如今的云时代,只要简单地加上一个麦克风和一个Wi-Fi芯片,任何装置都能实现语音驱动。从浴室的水龙头到孩子玩的布娃娃,任何装置都能利用分布在全球的几千台计算机所提供的计算能力。
以上述所有这些进展为后盾,语音正在引领着“环境智能”的实现,它最终可能会让我们现在手中的这些智能手机过时。到目前为止,计算机还是计算机,是我们能放在案头或拿在手里的一件独立性装置。但是当大部分技术设备都能放在很远的地方而不需要放在现场,可以用声音而不是笨重的外围设备来实现控制时,那么这些设备的重要性就降低了。正如谷歌公司的首席执行官桑德尔·皮蔡在致股东的一封信中所言:“未来将要迈出的一大步是,‘装置’这个概念本身就要消亡。”有了语音助力,计算机将变成一个无处不在的‘存在’。数字智能也将无处不在,正如我们呼吸的空气一样。
语音也解决了一个已经困扰人类几千年的大问题。人类的发明总是要求我们去适应它们。无论是飞机、吉他、割草机还是电子游戏,我们都不得不去学习那些不够自然的命令和动作,以便让这些装置听我们指挥——我们来决定按哪个按钮,滑动哪根操纵杆,转动哪个轮子,踩哪块踏板。
在计算机上,我们需要弯着手指在键盘上的一堆字母键、数字键和符号键之间游走——当标准的计算机键盘在1867年获得专利时,这可是一项高科技,当然现在已经不是了。当手持鼠标滑来滑去时,我们可以通过点击进行操作。在智能手机上,我们的操作是敲击、滑动、缩放。于是,我们坐着或者站着不动,脊梁弯曲、眼睛发涩,成了屏幕的“俘虏”。
然而运用语音,计算机最终能以我们的方式工作。它们正在学习人类偏爱的沟通方式:运用语言进行沟通。当运用得好时,语音的优势非常明显,以至于你几乎难以感觉到它也是一层介质。人类知道如何说话,因为我们终其一生都在说话。
在智能语音时代,台式计算机和智能手机不会消失,这就像喷气式飞机没有把汽车淘汰一样。语音技术会和其他新兴技术整合到一起,例如增强现实技术。但是在使用很多应用程序时,人们会抛弃键盘和触摸屏,而选择更自然、更让人自在的语音界面。计算机将随我们起舞,而不是让我们趋奉它们。
这只是时间问题。
评论
还没有评论。