描述
开 本: 16开纸 张: 轻型纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121325557
产品特色
编辑推荐
1.这是一本由设计专家呈现自己17年经验的语音界面设计经典!!
2.这是由阿里资深设计师倾情翻译的语音界面设计经典!!
3.这是*国际UED负责人傅利民、Designaffairs合伙人小猴科技创始人兼CEO刘力丹、同济大学设计创意学院副院长孙效华、物灵科技CEO前百度少帅顾嘉唯倾情作序力荐的语音界面设计经典!!
2.这是由阿里资深设计师倾情翻译的语音界面设计经典!!
3.这是*国际UED负责人傅利民、Designaffairs合伙人小猴科技创始人兼CEO刘力丹、同济大学设计创意学院副院长孙效华、物灵科技CEO前百度少帅顾嘉唯倾情作序力荐的语音界面设计经典!!
内容简介
本书是一本由拥有17年从业经验的资深语音用户界面设计(VUI)系统设计专家Cathy Pearl撰写的语音设计经典,从VUI系统简史开始讲述,包括了语音用户界面设计的基本原则,VUI系统设计中必不可少的人物模型设计,还包括一些语音用户界面设计的进阶知识,如语音识别技术,自然语言理解、情感分析、数据收集和文本语音转换策略等,另外还介绍了语音界面用户测试的知识,以及VUI在投入实际使用后需要注意的地方,特别提到了包括家庭助理设备和可穿戴设备等如何设计VUI系统。
目 录
第1 章 导语 ………………………………………………….1
1.1 语音用户界面(VUI)简史 ……………………………………..1
1.2 对话式用户界面 ……………………………………………………..7
1.3 VUI 设计师是什么 ………………………………………………..11
1.4 聊天机器人 …………………………………………………………..11
1.5 本章小结 ……………………………………………………………..14
第2 章 语音用户界面基本设计原则 …………………..17
2.1 移动设备与 IVR 系统设计 ……………………………………..17
2.2 对话式设计 …………………………………………………………..21
2.3 设定用户期望 ……………………………………………………….25
2.4 设计工具 ……………………………………………………………..28
2.5 确认策略 ……………………………………………………………..32
2.6 命令—控制模式和对话模式 ……………………………………41
2.7 对话式标识 …………………………………………………………..50
2.8 异常处理 ……………………………………………………………..52
2.9 不要责怪用户 ………………………………………………………60
2.10 新手和专家用户 ………………………………………………….61
2.11 持续跟踪上下文 ………………………………………………….63
2.12 帮助和其他通用部分 ……………………………………………68
2.13 延迟 …………………………………………………………………..72
2.14 消除歧义 ……………………………………………………………74
2.15 设计文档 ……………………………………………………………76
2.16 无障碍设计 …………………………………………………………78
2.17 本章小结 ……………………………………………………………88
第3 章 人物模型、虚拟形象、演员和视频游戏 ……91
3.1 人物模型 ……………………………………………………………..92
3.2 我的VUI 应该做成可视化的吗 ……………………………….98
3.3 使用虚拟角色时不该做什么 ……………………………………99
3.4 使用虚拟角色(或预先录制的视频)时该怎么做 ……103
3.5 我什么时候该在VUI 中使用视频 …………………………. 111
3.6 视觉VUI——实践 ………………………………………..113
3.7 视觉反馈(无虚拟角色) ………………………………………124
3.8 选择一个声音 ……………………………………………………..128
3.9 虚拟角色的优点 ………………………………………………….128
3.10 虚拟角色的缺点 ………………………………………………..132
3.11 本章小结 …………………………………………………………..136
第4 章 语音识别技术 …………………………………..139
4.1 选择语音识别引擎 ………………………………………………139
4.2 语音打断 ……………………………………………………………141
4.3 N-Best 列表 ………………………………………………………..156
4.4 语音识别的挑战 ………………………………………………….158
4.5 数据隐私 ……………………………………………………………165
4.6 本章小结 ……………………………………………………………166
第5 章 语音用户界面设计进阶 ………………………167
5.1 不同类型的语音输入 ……………………………………………169
5.2 消除歧义 ……………………………………………………………175
5.3 处理否定 ……………………………………………………………182
5.4 捕获意图和对象 ………………………………………………….183
5.5 对话管理 ……………………………………………………………184
5.6 不要晾着用户不管 ………………………………………………187
5.7 VUI 要显示识别到的信息吗 …………………………………188
5.8 情感分析和情绪检测 ……………………………………………190
5.9 文本转语音和预录语音 ………………………………………..193
5.10 说话者确认 ……………………………………………………….197
5.11 “唤醒”词 …………………………………………………………199
5.12 语境 …………………………………………………………………200
5.13 高级多模态交互 ………………………………………………..201
5.14 自助数据集 ……………………………………………………….202
5.15 高级自然语言理解(NLU) …………………………………204
5.16 本章小结 ………………………………………………………….209
第6 章 语音用户界面的用户测试 ……………………211
6.1 VUI 用户测试的特殊考虑因素 ………………………………211
6.2 用户及用例背景研究 ……………………………………………212
6.3 为真实用户设计研究方案 …………………………………….214
6.4 早期测试 ……………………………………………………………226
6.5 可用性测试 …………………………………………………………233
6.6 衡量测试结果 ……………………………………………………..239
6.7 下一步计划 …………………………………………………………240
6.8 测试汽车、硬件设备和机器人的VUI 系统 …………….241
6.9 本章小结 ……………………………………………………………244
第7 章 完成VUI 后,下一步该做什么 ……………..247
7.1 预发布测试 …………………………………………………………248
7.2 效果评估 ……………………………………………………………252
7.3 日志 …………………………………………………………………..264
7.4 转录 …………………………………………………………………..266
7.5 发布阶段 ……………………………………………………………268
7.6 调研 …………………………………………………………………..269
7.7 分析 …………………………………………………………………..270
7.8 工具 …………………………………………………………………..275
7.9 本章小结 ……………………………………………………………278
第8 章 带语音功能的设备和汽车 ……………………279
8.1 设备 …………………………………………………………………..279
8.2 汽车和无人驾驶车辆 ……………………………………………295
8.3 本章小结 ……………………………………………………………308
后记 ………………………………………………………….309
附录 书中提到的产品 …………………………………..311
1.1 语音用户界面(VUI)简史 ……………………………………..1
1.2 对话式用户界面 ……………………………………………………..7
1.3 VUI 设计师是什么 ………………………………………………..11
1.4 聊天机器人 …………………………………………………………..11
1.5 本章小结 ……………………………………………………………..14
第2 章 语音用户界面基本设计原则 …………………..17
2.1 移动设备与 IVR 系统设计 ……………………………………..17
2.2 对话式设计 …………………………………………………………..21
2.3 设定用户期望 ……………………………………………………….25
2.4 设计工具 ……………………………………………………………..28
2.5 确认策略 ……………………………………………………………..32
2.6 命令—控制模式和对话模式 ……………………………………41
2.7 对话式标识 …………………………………………………………..50
2.8 异常处理 ……………………………………………………………..52
2.9 不要责怪用户 ………………………………………………………60
2.10 新手和专家用户 ………………………………………………….61
2.11 持续跟踪上下文 ………………………………………………….63
2.12 帮助和其他通用部分 ……………………………………………68
2.13 延迟 …………………………………………………………………..72
2.14 消除歧义 ……………………………………………………………74
2.15 设计文档 ……………………………………………………………76
2.16 无障碍设计 …………………………………………………………78
2.17 本章小结 ……………………………………………………………88
第3 章 人物模型、虚拟形象、演员和视频游戏 ……91
3.1 人物模型 ……………………………………………………………..92
3.2 我的VUI 应该做成可视化的吗 ……………………………….98
3.3 使用虚拟角色时不该做什么 ……………………………………99
3.4 使用虚拟角色(或预先录制的视频)时该怎么做 ……103
3.5 我什么时候该在VUI 中使用视频 …………………………. 111
3.6 视觉VUI——实践 ………………………………………..113
3.7 视觉反馈(无虚拟角色) ………………………………………124
3.8 选择一个声音 ……………………………………………………..128
3.9 虚拟角色的优点 ………………………………………………….128
3.10 虚拟角色的缺点 ………………………………………………..132
3.11 本章小结 …………………………………………………………..136
第4 章 语音识别技术 …………………………………..139
4.1 选择语音识别引擎 ………………………………………………139
4.2 语音打断 ……………………………………………………………141
4.3 N-Best 列表 ………………………………………………………..156
4.4 语音识别的挑战 ………………………………………………….158
4.5 数据隐私 ……………………………………………………………165
4.6 本章小结 ……………………………………………………………166
第5 章 语音用户界面设计进阶 ………………………167
5.1 不同类型的语音输入 ……………………………………………169
5.2 消除歧义 ……………………………………………………………175
5.3 处理否定 ……………………………………………………………182
5.4 捕获意图和对象 ………………………………………………….183
5.5 对话管理 ……………………………………………………………184
5.6 不要晾着用户不管 ………………………………………………187
5.7 VUI 要显示识别到的信息吗 …………………………………188
5.8 情感分析和情绪检测 ……………………………………………190
5.9 文本转语音和预录语音 ………………………………………..193
5.10 说话者确认 ……………………………………………………….197
5.11 “唤醒”词 …………………………………………………………199
5.12 语境 …………………………………………………………………200
5.13 高级多模态交互 ………………………………………………..201
5.14 自助数据集 ……………………………………………………….202
5.15 高级自然语言理解(NLU) …………………………………204
5.16 本章小结 ………………………………………………………….209
第6 章 语音用户界面的用户测试 ……………………211
6.1 VUI 用户测试的特殊考虑因素 ………………………………211
6.2 用户及用例背景研究 ……………………………………………212
6.3 为真实用户设计研究方案 …………………………………….214
6.4 早期测试 ……………………………………………………………226
6.5 可用性测试 …………………………………………………………233
6.6 衡量测试结果 ……………………………………………………..239
6.7 下一步计划 …………………………………………………………240
6.8 测试汽车、硬件设备和机器人的VUI 系统 …………….241
6.9 本章小结 ……………………………………………………………244
第7 章 完成VUI 后,下一步该做什么 ……………..247
7.1 预发布测试 …………………………………………………………248
7.2 效果评估 ……………………………………………………………252
7.3 日志 …………………………………………………………………..264
7.4 转录 …………………………………………………………………..266
7.5 发布阶段 ……………………………………………………………268
7.6 调研 …………………………………………………………………..269
7.7 分析 …………………………………………………………………..270
7.8 工具 …………………………………………………………………..275
7.9 本章小结 ……………………………………………………………278
第8 章 带语音功能的设备和汽车 ……………………279
8.1 设备 …………………………………………………………………..279
8.2 汽车和无人驾驶车辆 ……………………………………………295
8.3 本章小结 ……………………………………………………………308
后记 ………………………………………………………….309
附录 书中提到的产品 …………………………………..311
前 言
推荐序一
我在用半语音、半打字的模式写下这段文字时,联想到语音用户界面的发展与互联网技术的发展非常类似。
在互联网时代来临之前,用户界面是以Windows 为主的GUI,当用户需要工作、娱乐和游戏的时候,就购买相应的软件,安装后才可以使用。当时大部分的设计和研究方法都集中在独立程序上。大概在1998 年,拨号上网时代结束,Web 浏览器在功能上的完善让大家的眼光开始关注到互联网上,那时Amazon 刚刚有了百万用户,WebVan 和Pets.com 正在蓬勃发展( 这两款应用目前均已消失)。各种产品开始转向互联网,因为Web 浏览器可以穿透各个程序,方便地把各种各样的内容和功能都呈现在前端页面上。之后,互联网给整个IT 行业带来了深刻的变化,独立程序渐渐消失,取而代之的是在浏览器界面中的应用。
到了移动互联网的时代,一轮新的程序开发又开始了。App 像雨后春笋一样涌现出来,满足用户在娱乐、游戏、工作等各个方面的需求,由于移动屏幕尺寸和网络速度的限制,单单使用一个简单的移动浏览器不能解决所有的问题。
语音和当年的浏览器一样,是一个可以穿透所有程序、解决用户所有问题的方法。当需要叫车服务的时候,我并不在乎是哪个软件在叫车,好的情况是语音发出后,通过各个应用的比较,找出一个的路线,并且符合我使用习惯的叫车方案。
语音是人类古老和自然的交互方式,在人工智能发展到可以部分理解语音的时候,语音时代开启了。语音除了在娱乐、游戏、工作上有广泛应用,还会广泛应用在IoT 上。越来越多的设计师的工作会涉及语音界面设计。这本书的作者Pearl 把自己17 年的工作经验总结出来,介绍了语音界面的设计原则、语音识别技术、自然语言理解、语音用户研究方法,以及语音在设备上的应用。
理论和实践相结合,非常实用!
这本书是天猫精灵设计团队的参考书之一,在使用过程中发现这本书非常有用,因此我们的设计师一行花时间把整本书翻译成中文分享给大家。
Paul Fu
Sr . Director, User Experience, Alibaba Group
推荐序二
一行嘱我为他翻译的书写序,还没有看过是什么,我便欣然同意了。一行曾是我的学生。学生时代的一行就成熟得不像他的年龄。在初期时我对他说,“小心技术过于成熟而落入俗套。”事实证明我是错的。一行的特点是冷静并特立独行。每次问他问题,他先是沉默,想好后可以很缜密地回答,往往挑不出什么漏洞。基于这样的经验,之后的合作我便选择完全地相信他。所以我想一行精心挑选翻译的书籍,一定不会差。
一行陆续给我寄了原稿和翻译稿,我读后有一些感想:
交互方式正从单纯的视觉、硬件交互转化为多感官综合的交互。每一次技术的变革都带来交互上的巨大挑战。“与机器像和人一样对话”,VUI 不是一次升级,而是一个完全不同的新世界。这个世界正在来临,但又还有很多未知;这个全新的体验正呼之欲出,等待人们去定义。
VUI 感性层面的需求比视觉交互和硬件交互更为复杂。除了合理的逻辑之外,场景、对话的上下文关联、角色的设定、语境的感知等都对用户体验起到了重要的作用。VUI 像是给机器赋予一个新的性格。在这个领域也将产生不同的人才需求。近遇见Dyson 的设计师,他称自己为工程师,并解释他自己也不知道自己是什么样的定义,只知道伴随了产品整个的研发流程。在VUI领域,同时需要被打破的职业界限,需要更多元的职业类型介入去共同定义。他们可能是设计师,是开发者,是语言学家,是心理学家,是剧作家,等等。
近我买了Amazon Echo, 女儿每天早上向Echo 问好。Echo 没有屏幕,环转的灯光非常友好地展示了拟人化的倾听。我意识到VUI 已经来了,它很聪明,但是又还很鲁莽;它让人兴奋,但又时时给人带来与机器对话的挫败感受。哪怕产品很智能,一个不好的VUI 就像是一个聪明人无法倾听和表达一样无奈。在这个技术与设计并行发展的进程中,VUI 还处在一个很早期的状态,会有很多令人困扰的问题:怎样的设计流程可以支持这个新的领域?VUI 和屏幕交互是什么样的关系?什么样的场景为适合?机器需要有什么样的性格? 如何管理用户的期望值?如何弥补对话中带来的挫败体验? 交互过程中的情感感受将会怎样?……
VUI 领域还没有太多的经验可以参考,设计教育界也还没有做好足够的应对,而这是一本来得如此及时的、难得的、实用的工具书。
一行告诉我,书的内容只是一个开始,希望读者通过此书能开启一个全新的思考。
刘力丹
designaffairs 合伙人、小猴科技创始人兼CEO
推荐序三
从软件工程转到工业设计专业,现在又在从事交互设计的工作,王一行一直是一个在自己喜欢的方向上执着钻研、追求完美的学生和设计师。当以往的学霸和红点得主来找我为他的译著写序时,我很是欣喜。非常钦佩一行哥(同学中的昵称)在阿里繁忙的工作之余还能挤出时间来学习新知识,并有心布道语音交互界面设计这一交互设计的新成员。
作为一种自然人机交互方式,语音交互由来以久,近年来更是被运用到了越来越多的产品之中,如从手机到智能产品、智能家居,从机器人到车载HMI。然而对语音交互的设计方法、流程,以及对其特有的设计问题的研究却非常匮乏。15 年前在IBM T.J.Watson 参与基于对话的语音交互系统的研究与应用实践,到现在进行多模态车载HMI 的设计中,我大都是把语音交互作为交互系统中的一个重要元素加以运用。本书将语音交互作为一个与视觉交互界面(GUI)并列的界面类型,对其设计进行系统地分析、研究与实践指导,视角新颖,为对语音交互设计的深入研究打开了一片天地。相信一行精准到位的翻译可以将大家完美地带入这一交互设计的新领地。
孙效华
博士、教授、博士研究生导师
同济大学设计创意学院副院长,交互设计方向负责人
数字创意中心负责人
推荐序四
当很多人正在热议AI 究竟是会帮助人类还是毁灭人类的时候,人工智能的浪潮正在悄然颠覆着我们生活的一点一滴。而基于CUI(Conversational User Interface,对话式用户界面)的智能产品,就好像是冲在AI 浪潮前沿的浪花,将隐藏其身下的算法和数据幻化成能“直接拍打在用户皮肤上”的体验。作为一个新生的领域,VUI(Voice User Interface,语音用户交互界面)对于用户体验设计提出了更多语言学、情感塑造、逻辑搭建等方面的新要求,于是这样一本专业、全面的VUI 设计指南的出现,就更显得弥足珍贵。
我在时间就和我的团队一起精读了英文原版,受益匪浅,相信中文译本的出版一定会帮助更多的共同前行的伙伴,受邀作序,备感荣幸。
就在我敲下这些文字的时候,大多数行业从业者都激进地把人工智能在人类历史上的重要性堪比、甚至远超过工业革命,很多人正担忧人工智能即将陆续取代一些职业并改造我们的社会化分工。我认为有一点是毫无疑问的,这是一个不可避免的智能时代,作为新生产工具的AI,除了在限定技术边界的垂直行业应用领域,各行各业都有机会被AI 力收割“low hanging fruits”来迅速提升各类生产效率,将对人类文明和产业变革产生重大影响。
回顾过去,机械设备的出现为人类带来了提升效能的工具,互联网的出现,将效能再次提升,而伴随着AI 的出现,效能将进一步大规模提升。不可避免地说,在智能时代,大量重复性工作的人力工种肯定不复存在,还有很多具有结构化知识的经验性工作也会被机器智能所取代,甚至未来是创造性工作,但是更多的是通过为人赋能的方式,减轻社会劳动者和服务业的压力,将会重新进行一轮人类社会化分工。
在互联网时代,“连接”是核心关键词,如果C 不能满足A 和B的完整需求,那互联网有机会让A 通过连接,跨过B 和C 直接找到D,但如果在一些场景和行业内B/C/D 是稀缺性资源,那么这个情况在互联网时代就很难得到解决,AI 的出现将有机会扭转这种供需关系。举例来说,以前用户看病花在预约和挂号的时间基本占到95%,真正用于医患有效沟通和问诊时间仅为5%。人工智能将代替以往所谓“互联网医疗”盲目且低效的连接,如VUI/CUI 初诊问答机器人将患者进行分流,缩短医师护士等在预约和问询过程低效的重复时间,改善供需方的不对等关系。
大家都知道过去60 年里人工智能经历了两次潮起潮落。现在我把这次AI 的兴起,分为新AI 时代的头十年和后十年。前十年是AI解决行业问题,比如前面讲的医疗、教育、信贷和金融风控等,通过大数据和机器学习迅速提升效率和准确率;新AI 时代的后十年,机器智能将全面升级消费产品和用户生活场景,人工智能必将革新交互方式,进入计算无处不在的时代。下一代人机交互革命就在眼前,这将是一个激动人心的时代,就好比百年前蒸汽机、汽车、飞机等伟大产品的发明一样,如今将会出现大量被重新定义的智能产品,无人驾驶车、智能家居、家用机器人、下一个时代的个人助理等。当马车被汽车替代的时候,人们是措手不及的,同样的,AI 时代的创新家们已经蓄势待发准备重新发明和改造今天陈旧的生活方式了。
我觉得赋能是人工智能对人类重要的事情,因为这是人类进化需求的本质。人都渴望被赋能,这是天性。人发明蒸汽机、汽车、飞机、手机、计算机,从运动能力和生产效率等方面突破自身局限。大部分人沉迷于游戏,是因为在游戏中感受到自己被赋予了更大的权利和能力。这些都是顺应人性的事情,我觉得VUI 有价值的场景应用就是在人机交互过程中产生的便利性赋能。
无论是从云端到边缘在下一代硬件架构的变化,还是深度学习算法在图像识别和语音识别的单项上逐渐超过人类水平,AI 的技术成熟度还在不断提升和进化过程,但是今天语音对话交互技术
我在用半语音、半打字的模式写下这段文字时,联想到语音用户界面的发展与互联网技术的发展非常类似。
在互联网时代来临之前,用户界面是以Windows 为主的GUI,当用户需要工作、娱乐和游戏的时候,就购买相应的软件,安装后才可以使用。当时大部分的设计和研究方法都集中在独立程序上。大概在1998 年,拨号上网时代结束,Web 浏览器在功能上的完善让大家的眼光开始关注到互联网上,那时Amazon 刚刚有了百万用户,WebVan 和Pets.com 正在蓬勃发展( 这两款应用目前均已消失)。各种产品开始转向互联网,因为Web 浏览器可以穿透各个程序,方便地把各种各样的内容和功能都呈现在前端页面上。之后,互联网给整个IT 行业带来了深刻的变化,独立程序渐渐消失,取而代之的是在浏览器界面中的应用。
到了移动互联网的时代,一轮新的程序开发又开始了。App 像雨后春笋一样涌现出来,满足用户在娱乐、游戏、工作等各个方面的需求,由于移动屏幕尺寸和网络速度的限制,单单使用一个简单的移动浏览器不能解决所有的问题。
语音和当年的浏览器一样,是一个可以穿透所有程序、解决用户所有问题的方法。当需要叫车服务的时候,我并不在乎是哪个软件在叫车,好的情况是语音发出后,通过各个应用的比较,找出一个的路线,并且符合我使用习惯的叫车方案。
语音是人类古老和自然的交互方式,在人工智能发展到可以部分理解语音的时候,语音时代开启了。语音除了在娱乐、游戏、工作上有广泛应用,还会广泛应用在IoT 上。越来越多的设计师的工作会涉及语音界面设计。这本书的作者Pearl 把自己17 年的工作经验总结出来,介绍了语音界面的设计原则、语音识别技术、自然语言理解、语音用户研究方法,以及语音在设备上的应用。
理论和实践相结合,非常实用!
这本书是天猫精灵设计团队的参考书之一,在使用过程中发现这本书非常有用,因此我们的设计师一行花时间把整本书翻译成中文分享给大家。
Paul Fu
Sr . Director, User Experience, Alibaba Group
推荐序二
一行嘱我为他翻译的书写序,还没有看过是什么,我便欣然同意了。一行曾是我的学生。学生时代的一行就成熟得不像他的年龄。在初期时我对他说,“小心技术过于成熟而落入俗套。”事实证明我是错的。一行的特点是冷静并特立独行。每次问他问题,他先是沉默,想好后可以很缜密地回答,往往挑不出什么漏洞。基于这样的经验,之后的合作我便选择完全地相信他。所以我想一行精心挑选翻译的书籍,一定不会差。
一行陆续给我寄了原稿和翻译稿,我读后有一些感想:
交互方式正从单纯的视觉、硬件交互转化为多感官综合的交互。每一次技术的变革都带来交互上的巨大挑战。“与机器像和人一样对话”,VUI 不是一次升级,而是一个完全不同的新世界。这个世界正在来临,但又还有很多未知;这个全新的体验正呼之欲出,等待人们去定义。
VUI 感性层面的需求比视觉交互和硬件交互更为复杂。除了合理的逻辑之外,场景、对话的上下文关联、角色的设定、语境的感知等都对用户体验起到了重要的作用。VUI 像是给机器赋予一个新的性格。在这个领域也将产生不同的人才需求。近遇见Dyson 的设计师,他称自己为工程师,并解释他自己也不知道自己是什么样的定义,只知道伴随了产品整个的研发流程。在VUI领域,同时需要被打破的职业界限,需要更多元的职业类型介入去共同定义。他们可能是设计师,是开发者,是语言学家,是心理学家,是剧作家,等等。
近我买了Amazon Echo, 女儿每天早上向Echo 问好。Echo 没有屏幕,环转的灯光非常友好地展示了拟人化的倾听。我意识到VUI 已经来了,它很聪明,但是又还很鲁莽;它让人兴奋,但又时时给人带来与机器对话的挫败感受。哪怕产品很智能,一个不好的VUI 就像是一个聪明人无法倾听和表达一样无奈。在这个技术与设计并行发展的进程中,VUI 还处在一个很早期的状态,会有很多令人困扰的问题:怎样的设计流程可以支持这个新的领域?VUI 和屏幕交互是什么样的关系?什么样的场景为适合?机器需要有什么样的性格? 如何管理用户的期望值?如何弥补对话中带来的挫败体验? 交互过程中的情感感受将会怎样?……
VUI 领域还没有太多的经验可以参考,设计教育界也还没有做好足够的应对,而这是一本来得如此及时的、难得的、实用的工具书。
一行告诉我,书的内容只是一个开始,希望读者通过此书能开启一个全新的思考。
刘力丹
designaffairs 合伙人、小猴科技创始人兼CEO
推荐序三
从软件工程转到工业设计专业,现在又在从事交互设计的工作,王一行一直是一个在自己喜欢的方向上执着钻研、追求完美的学生和设计师。当以往的学霸和红点得主来找我为他的译著写序时,我很是欣喜。非常钦佩一行哥(同学中的昵称)在阿里繁忙的工作之余还能挤出时间来学习新知识,并有心布道语音交互界面设计这一交互设计的新成员。
作为一种自然人机交互方式,语音交互由来以久,近年来更是被运用到了越来越多的产品之中,如从手机到智能产品、智能家居,从机器人到车载HMI。然而对语音交互的设计方法、流程,以及对其特有的设计问题的研究却非常匮乏。15 年前在IBM T.J.Watson 参与基于对话的语音交互系统的研究与应用实践,到现在进行多模态车载HMI 的设计中,我大都是把语音交互作为交互系统中的一个重要元素加以运用。本书将语音交互作为一个与视觉交互界面(GUI)并列的界面类型,对其设计进行系统地分析、研究与实践指导,视角新颖,为对语音交互设计的深入研究打开了一片天地。相信一行精准到位的翻译可以将大家完美地带入这一交互设计的新领地。
孙效华
博士、教授、博士研究生导师
同济大学设计创意学院副院长,交互设计方向负责人
数字创意中心负责人
推荐序四
当很多人正在热议AI 究竟是会帮助人类还是毁灭人类的时候,人工智能的浪潮正在悄然颠覆着我们生活的一点一滴。而基于CUI(Conversational User Interface,对话式用户界面)的智能产品,就好像是冲在AI 浪潮前沿的浪花,将隐藏其身下的算法和数据幻化成能“直接拍打在用户皮肤上”的体验。作为一个新生的领域,VUI(Voice User Interface,语音用户交互界面)对于用户体验设计提出了更多语言学、情感塑造、逻辑搭建等方面的新要求,于是这样一本专业、全面的VUI 设计指南的出现,就更显得弥足珍贵。
我在时间就和我的团队一起精读了英文原版,受益匪浅,相信中文译本的出版一定会帮助更多的共同前行的伙伴,受邀作序,备感荣幸。
就在我敲下这些文字的时候,大多数行业从业者都激进地把人工智能在人类历史上的重要性堪比、甚至远超过工业革命,很多人正担忧人工智能即将陆续取代一些职业并改造我们的社会化分工。我认为有一点是毫无疑问的,这是一个不可避免的智能时代,作为新生产工具的AI,除了在限定技术边界的垂直行业应用领域,各行各业都有机会被AI 力收割“low hanging fruits”来迅速提升各类生产效率,将对人类文明和产业变革产生重大影响。
回顾过去,机械设备的出现为人类带来了提升效能的工具,互联网的出现,将效能再次提升,而伴随着AI 的出现,效能将进一步大规模提升。不可避免地说,在智能时代,大量重复性工作的人力工种肯定不复存在,还有很多具有结构化知识的经验性工作也会被机器智能所取代,甚至未来是创造性工作,但是更多的是通过为人赋能的方式,减轻社会劳动者和服务业的压力,将会重新进行一轮人类社会化分工。
在互联网时代,“连接”是核心关键词,如果C 不能满足A 和B的完整需求,那互联网有机会让A 通过连接,跨过B 和C 直接找到D,但如果在一些场景和行业内B/C/D 是稀缺性资源,那么这个情况在互联网时代就很难得到解决,AI 的出现将有机会扭转这种供需关系。举例来说,以前用户看病花在预约和挂号的时间基本占到95%,真正用于医患有效沟通和问诊时间仅为5%。人工智能将代替以往所谓“互联网医疗”盲目且低效的连接,如VUI/CUI 初诊问答机器人将患者进行分流,缩短医师护士等在预约和问询过程低效的重复时间,改善供需方的不对等关系。
大家都知道过去60 年里人工智能经历了两次潮起潮落。现在我把这次AI 的兴起,分为新AI 时代的头十年和后十年。前十年是AI解决行业问题,比如前面讲的医疗、教育、信贷和金融风控等,通过大数据和机器学习迅速提升效率和准确率;新AI 时代的后十年,机器智能将全面升级消费产品和用户生活场景,人工智能必将革新交互方式,进入计算无处不在的时代。下一代人机交互革命就在眼前,这将是一个激动人心的时代,就好比百年前蒸汽机、汽车、飞机等伟大产品的发明一样,如今将会出现大量被重新定义的智能产品,无人驾驶车、智能家居、家用机器人、下一个时代的个人助理等。当马车被汽车替代的时候,人们是措手不及的,同样的,AI 时代的创新家们已经蓄势待发准备重新发明和改造今天陈旧的生活方式了。
我觉得赋能是人工智能对人类重要的事情,因为这是人类进化需求的本质。人都渴望被赋能,这是天性。人发明蒸汽机、汽车、飞机、手机、计算机,从运动能力和生产效率等方面突破自身局限。大部分人沉迷于游戏,是因为在游戏中感受到自己被赋予了更大的权利和能力。这些都是顺应人性的事情,我觉得VUI 有价值的场景应用就是在人机交互过程中产生的便利性赋能。
无论是从云端到边缘在下一代硬件架构的变化,还是深度学习算法在图像识别和语音识别的单项上逐渐超过人类水平,AI 的技术成熟度还在不断提升和进化过程,但是今天语音对话交互技术
评论
还没有评论。