描述
开 本: 128开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787300277387
语音科技——下一个颠覆者,通向人工智能时代的一把秘钥
未来10年,语音科技会成为*决定性的主题之一。人机对话能力将迎来变革性进展,语音也将成为*主要的人机互动方式。语音科技在商业上的应用,将会引领我们进入一个奇异的新世界,而我们不需要任何训练就可以完美适应。
通过语音搜索、购物、下单;
向语音助手倾诉烦恼并得到贴心的安慰;
成功时得到语音助手*真诚的祝贺;
系统可以听令行事,我们不必在键盘或触摸屏一点点输入文字;
…………
这些场景离我们并不遥远。语音界面能解放双手,用声音识别彻底改变产品搜索、购物体验,使虚拟伴侣变成现实……
语音技术也是实现人工智能的基石,它在不断地变化升级。随着语音的采集、识别、合成技术越来越先进,语音界面带给我们的未来将远远超乎想象,它将打通通往人工智能未来的又一扇大门。
语音技术的进步使科幻电影中人机对话的场景正在逐渐走进现实生活。我们生活中用到的智能手机、电脑、音箱以及汽车等很多设备和工具都已经配备了语音界面,我们经常在商场里看到的导购机器人或者玩具机器人,也支持人机对话,支持用户语音搜索或者下达指令。
语音界面看似简单,但其开发却蕴含着很多我们意想不到的问题和困难。《语音界面冲击》这本书将带领我们全面了解:
语音界面的历史;
语音界面的现状及未来;
语音界面的功能、优势和特点;
需要使用何种技术才能实现语音界面;
语音界面面临的课题和问题;
实现“语音交互”以及人机对话面临哪些障碍;
语音界面的商业用途;
…………
语音界面的商用前景也令人憧憬。语音经济的规模将会超过移动应用。据预测,仅仅在美国和英国,语音电商的规模就将从2018年的20亿美元增长至2022年的400亿美元。语音技术创业公司的数量和融资规模也在飞速上升。未来,我们将看到人机互动的另一种无限可能。
第 1 章 语音界面的现状和未来
时代在语言中流转 / 002
哆啦 A 梦的神奇道具成为现实 / 003
语音免触成为快捷方式 / 004
Chatbot 已经开始实际应用 / 005
语音界面变身“传话游戏” / 006
不能和平时一样说话 / 007
留言电话登记的表达问题 / 007
AI 技术助力语音交互的进化 / 008
第 2 章 语音界面的历史
早期语音交互系统“VOYAGER” / 010
2011 年 iPhone 开始支持“Siri” / 011
物理 UI-CUI-GUI- 手势 UI- 语音 UI / 012
AI 和语音——剪不断的关系 / 013
智能音箱和仿生机器人的出现 / 014
语音界面走进银行和零售店 / 015
小结 / 015
第 3 章 语音界面的特点与优势
减少文字输入时间 / 019
方便快捷(减少步骤)/ 020
免触操作(同时操作)/ 022
操作姿势自由 / 023
支持附加条件指令 / 023
支持模糊表达 / 024
创造人机对话价值体验 / 025
支持反映感情和心理状况 / 026
受文化和语言差异的影响 / 027
符合人类认知水平的媒介 / 028
第 4 章 支持语音界面的商品
语音界面的六个基本功能 / 032
除六大基本功能外的其他功能 / 034
智能音箱 / 039
Alexa Skill 扩展 Echo 功能 / 043
AI 机器人 / 047
支持语音辨认功能的智能家电 / 053
游戏机 / 055
其他 / 060
小结 / 0613
第 5 章 语音界面技术
采音信号处理 / 065
语音识别 / 067
语义理解 / 069
对话应答 / 对话生成 / 073
语音合成 / 077
小结 / 078
第 6 章 语音界面面临的问题
语音界面是一场传话游戏 / 082
何时说?说什么?怎么说? / 084
不明现状的问题 / 086
尚不准确的语音识别 / 088
说话也费力 / 089
语音操作手法单一 / 090
唤醒词太俗气 / 092
不自然的自然表达问题 / 095
对发声环境的依赖 / 099
发声前间隔过长 / 100
语音输入无法处理中断和取消 / 101
小结 / 104
第 7 章 语音助手 / 机器人语音界面“对话”
“会话”和“对话”的区别 / 109
任务型和非任务型 / 1114
语音界面冲击
所谓聊天 / 113
会话的分类 / 116
报告型会话较多的原因 / 118
谈话内容无聊的原因 / 121
自然对话(谈话)必要的六大要素 / 123
会话方案 / 130
对话表现 / 132
交互作用分析 / 142
违和感:儿童角色口出术语 / 145
语音界面和对话中的语言文化差异 / 145
恐怖谷现象与对话 / 149
小结 / 151
第 8 章 语音界面商业势力图
语音识别技术开发企业 / 154
语音合成技术开发企业 / 157
语音界面解决方案供应企业 / 158
小结 / 163
第 9 章 语音界面的未来
语音界面尚在起步阶段 / 166
语音商业的未来 / 166
对话商业未来 / 172
面向自然对话时代 / 174
小结 / 175
引言
“来一首工作时的咖啡厅背景音乐吧!”
(音乐开始播放)我手中端着刚煮好的咖啡,坐在书房的椅子上,边听着背景音乐边敲着键盘,这就是我最近的工作状态。当工作电话打进来时,我只需要说一句“停止播放”,音乐便戛然而止。这宛如科幻电影般的场景,已经在现实中出现了。
与其他界面截然不同的语音界面
我以前在索尼公司的研发部门从事用户界面(user interface, UI) 和 用 户 体 验 设 计(user experience design,UXDesign)的开发工作。 2013 年,我才正式开始开发支持语音界面的产品。刚一进入这个领域,我便觉察到它和其他界面完全不同。
操控电视需要用遥控器,操作电脑需要用键盘鼠标,操控手机要用手指点击,这些都是一般操作。这些传统界面与语音界面看似相同,实则有相当大的差异。如果把它当作鼠标和点击界面的延伸,那你便会感到它其实比较难用。
智能音箱蔚然成风
2017 年,支持语音界面的智能音箱开始逐渐进入市场。我们每天都被类似“光影世界照进现实”或“人工智能,让生活更精彩”之类的宣传语包围着,应该有很多人是抱着“虽然不太懂,但看着挺有意思”的心态尝鲜购买此类智能音箱吧?我周围也有人觉得“既然支持人工智能,估计能派上大用场”,于是就购买了一台。
虽然智能音箱销售异常火爆,但也有人把刚买不久的音箱束之高阁。他们为什么会这么做呢?我认为其中一个原因就是,许多人抱着“智能音箱是新时代的智能家电”这样先入为主的观念,在不了解语音界面是何种界面的情况下就盲目购买。还有一部分人是对宣传内容充满期待,而当实际买到产品后却感觉“和宣传的有点差距”。类似这样的呼声,顺着 SNS(社交网络服务)一点点地蔓延开来。
不仅是智能音箱,支持语音界面的对话机器人也面临着同样的问题。“在店里演示的时候,那个机器人能说会道的,怎么放到家里就一句话都不说了呢!”有过这样经历的人,应该不止一两个吧?
语音界面的长短板
这样一来,支持语音界面的产品,说不定一时间便成了明日黄花。这可真是暴殄天物了!因为语音界面有着很多其他界面不具备的优势。如今我们需要搞清楚的是语音界面的长板在哪里,而短板又在哪里,以及开发者需要考虑什么。在此基础上,我们才能重新拾起对智能音箱或者对话机器人的期待,才会推动社会走向便捷,人们的生活才会丰富多彩。我正是想到这一点,才下决心写这本书的。
我相信以下这几类人,读了本书后必定会得到启发:
● 我想知道为什么自己家的智能音箱老是领会不了我的指令;
● 我想知道智能音箱和机器人的发展现状和前景;
● 我想知道关于语音界面的整体知识;
● 我期待通过语音界面就能和机器人进行交流,但我不知道应该如何改良;
● 我想开发语音用户界面和语音 UX 设计。
评论
还没有评论。