描述
开 本: 16开纸 张: 胶版纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787030247438丛书名: 信息检索丛书
内容简介
本书从理论和实际应用方面,对信息检索可视化领域*进展进行了系统的阐述,集中介绍了信息检索可视化的基本原理及其结构、方法和算法,较为系统地比较了多重参考点可视化模型(MRPBM)、基于欧几里得空间特征的可视化模型(ESCBM)、探路者关联网络(PFNET)、多维尺度模型(MDS)、自组织图模型(SOM)等五种主要的信息检索可视化模型,讨论了信息可视化系统的评估及信息可视化系统设计中人的行为,分析了信息可视化中的一些特有的歧义现象,并提出解决办法。
通过本书,读者可以了解和掌握信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及研究这个领域所必须注意的问题。
本书可作为信息科学、计算机科学及相关学科的研究人员、从业者、系统设计者和分析者、网络管理员、图书管理员、教育者和研究生的参考资料。
通过本书,读者可以了解和掌握信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及研究这个领域所必须注意的问题。
本书可作为信息科学、计算机科学及相关学科的研究人员、从业者、系统设计者和分析者、网络管理员、图书管理员、教育者和研究生的参考资料。
目 录
译者序
中文版的前言
序
前言
第1章 信息检索与可视化
1.1 可视化
1.1.1 定义
1.1.2 科学可视化和信息可视化
1.2 信息检索
1.2.1 浏览与提问搜索
1.2.2 微观信息与宏观信息
1.2.3 信息空间的空间特性
1.2.4 浏览的空间特性
1.3 可视化的感知与认知
1.3.1 感知
1.3.2 认知
1.4 信息检索的可视化
1.4.1 基本原理
1.4.2 三种信息检索可视化模式
1.4.3 建立一个信息检索可视化模型
1.5 小结
第2章 信息检索基础
2.1 向量空间模型
2.2 词语加权法
2.2.1 停用词
2.2.2 逆文献频率
2.2.3 萨尔顿词语加权法
2.2.4 另一个词语加权法
2.2.5 概率词语加权法
2.3 相似性方法
2.3.1 内积相似性方法
2.3.2 戴斯系数法
2.3.3 加卡德相似性方法
2.3.4 重合系数相似性方法
2.3.5 余弦相似法
2.3.6 距离相似法
2.3.7 集成角度-距离相似性方法
2.3.8 皮尔森参数γ相关性法
2.4 信息检索(评价)模型
2.4.1 基于方向的检索(评价)模型
2.4.2 基于距离的检索(评价)模型
2.4.3 椭圆检索(评价)模型
2.4.4 合取检索(评价)模型
2.4.5 析取检索模型
2.4.6 卡斯尼椭圆检索(评价)模型
2.5 聚类算法
2.5.1 非分级聚类算法
2.5.2 分级聚类算法
2.6 检索结果评价
2.7 小结
第3章 多重参考点可视化模型
3.1 多重参考点
3.2 多重固定参考点模型
3.3 可移动多重参考点模型
3.3.1 原始VIBE算法描述
3.3.2 关于模型的讨论
3.4 自动旋转参考点模型
3.4.1 视觉空间的定义
3.4.2 参考点的旋转
3.5 信息检索的含义
3.6 小结
第4章 基于欧几里得空间特征的可视化模型
4.1 欧几里得空间及其特征
4.2 信息检索评价模型介绍
4.3 基于距离-角度的可视化模型
4.3.1 视觉空间(visual space)的定义
4.3.2 信息检索评价模型的可视化
4.4 基于角度-角度的可视化模型
4.4.1 视觉空间的定义
4.4.2 信息检索评价模型的可视化
4.5 基于距离-距离的可视化模型
4.5.1 视觉空间的定义
4.5.2 信息检索评价模型的可视化
4.6 小结
第5章 Kohonen自组织图——一种人造神经网络
5.1 神经网络介绍
5.1.1 神经网络的定义
5.1.2 神经网络的结构和特性
5.2 Kohonen自组织图
5.2.1 Kohonen自组织图结构
5.2.2 SOM算法的学习过程
5.2.3 特征图标识
5.2.4 SOM算法描述
5.3 SOM于信息检索领域的意义
5.4 小结
第6章 探路者关联网络
6.1 探路者关联网络的特性/性能和描述
6.1.1 探路者关联网络的定义及说明
6.1.2 算法的描述
6.1.3 图布局法
6.2 信息检索的含义
6.2.1 作者同被引分析
6.2.2 语词关联网络
6.2.3 Hyperlink超级链接
6.2.4 探路者关联网络中的搜索
6.3 小结
第7章 多维尺度法
7.1 多维尺度法简介
7.1.1 经典MDS算法
7.1.2 非计量MDS
7.1.3 计量MDS
7.2 MDS技术对信息检索的启示
7.2.1 显示对象和对象之间的距离的定义
7.2.2 MDS显示空间的开发
7.2.3 讨论
7.3 小结
第8章 因特网的信息可视化
8.1 引言
8.1.1 因特网的特征
8.1.2 因特网的信息组织和显示的方法
8.1.3 因特网信息的利用
8.1.4 因特网的挑战
8.2 因特网的信息可视化
8.2.1 因特网信息结构的可视化
8.2.2 因特网信息查询的可视化
8.2.3 网络交通流量的可视化
8.2.4 联机讨论历史记录的可视化
8.3 小结
第9章 信息可视化中的歧义性
9.1 信息可视化的歧义性及其影响
9.1.1 信息可视化中歧义性的原因
9.1.2 歧义信息可视化的影响
9.2 信息检索可视化模型中的歧义性分析
9.2.1 欧几里得空间特征为基础的信息模型的歧义性
9.2.2 基于多参考点的信息可视化模型中的歧义性
9.2.3 探路者网络中的歧义性
9.2.4 SOM中的歧义化
9.2.5 多维排列的歧义化
9.3 小结
第10章 隐喻在信息可视化中的意义
10.1 隐喻的定义、基本要素和特征
10.2 隐喻的认知基础
10.3 心智模型、隐喻和人机交互
10.3.1 人机交互中的隐喻
10.3.2 心智模型
10.3.3 HCI中的心智模型
10.4 信息可视化检索中的隐喻
10.4.1 使用隐喻的基本原理
10.4.2 隐喻性信息检索可视化环境
10.5 隐喻应用的步骤和原则
10.5.1 隐喻应用的步骤
10.5.2 设计良好的隐喻视觉信息检索环境的建议
10.6 小结
第11章 信息检索可视化的基准和评价标准
11.1 信息检索可视化的评价
11.2 基准和评价标准
11.2.1 评价标准的影响因素
11.2.2 开发评价基准的原则
11.2.3 评价标准的四种类型
11.2.4 基准的描述
11.3 小结
第12章 后记
12.1 简介
12.2 各种可视化模型的比较
12.3 问题
12.4 小结
参考文献
中英文术语对照表
中文版的前言
序
前言
第1章 信息检索与可视化
1.1 可视化
1.1.1 定义
1.1.2 科学可视化和信息可视化
1.2 信息检索
1.2.1 浏览与提问搜索
1.2.2 微观信息与宏观信息
1.2.3 信息空间的空间特性
1.2.4 浏览的空间特性
1.3 可视化的感知与认知
1.3.1 感知
1.3.2 认知
1.4 信息检索的可视化
1.4.1 基本原理
1.4.2 三种信息检索可视化模式
1.4.3 建立一个信息检索可视化模型
1.5 小结
第2章 信息检索基础
2.1 向量空间模型
2.2 词语加权法
2.2.1 停用词
2.2.2 逆文献频率
2.2.3 萨尔顿词语加权法
2.2.4 另一个词语加权法
2.2.5 概率词语加权法
2.3 相似性方法
2.3.1 内积相似性方法
2.3.2 戴斯系数法
2.3.3 加卡德相似性方法
2.3.4 重合系数相似性方法
2.3.5 余弦相似法
2.3.6 距离相似法
2.3.7 集成角度-距离相似性方法
2.3.8 皮尔森参数γ相关性法
2.4 信息检索(评价)模型
2.4.1 基于方向的检索(评价)模型
2.4.2 基于距离的检索(评价)模型
2.4.3 椭圆检索(评价)模型
2.4.4 合取检索(评价)模型
2.4.5 析取检索模型
2.4.6 卡斯尼椭圆检索(评价)模型
2.5 聚类算法
2.5.1 非分级聚类算法
2.5.2 分级聚类算法
2.6 检索结果评价
2.7 小结
第3章 多重参考点可视化模型
3.1 多重参考点
3.2 多重固定参考点模型
3.3 可移动多重参考点模型
3.3.1 原始VIBE算法描述
3.3.2 关于模型的讨论
3.4 自动旋转参考点模型
3.4.1 视觉空间的定义
3.4.2 参考点的旋转
3.5 信息检索的含义
3.6 小结
第4章 基于欧几里得空间特征的可视化模型
4.1 欧几里得空间及其特征
4.2 信息检索评价模型介绍
4.3 基于距离-角度的可视化模型
4.3.1 视觉空间(visual space)的定义
4.3.2 信息检索评价模型的可视化
4.4 基于角度-角度的可视化模型
4.4.1 视觉空间的定义
4.4.2 信息检索评价模型的可视化
4.5 基于距离-距离的可视化模型
4.5.1 视觉空间的定义
4.5.2 信息检索评价模型的可视化
4.6 小结
第5章 Kohonen自组织图——一种人造神经网络
5.1 神经网络介绍
5.1.1 神经网络的定义
5.1.2 神经网络的结构和特性
5.2 Kohonen自组织图
5.2.1 Kohonen自组织图结构
5.2.2 SOM算法的学习过程
5.2.3 特征图标识
5.2.4 SOM算法描述
5.3 SOM于信息检索领域的意义
5.4 小结
第6章 探路者关联网络
6.1 探路者关联网络的特性/性能和描述
6.1.1 探路者关联网络的定义及说明
6.1.2 算法的描述
6.1.3 图布局法
6.2 信息检索的含义
6.2.1 作者同被引分析
6.2.2 语词关联网络
6.2.3 Hyperlink超级链接
6.2.4 探路者关联网络中的搜索
6.3 小结
第7章 多维尺度法
7.1 多维尺度法简介
7.1.1 经典MDS算法
7.1.2 非计量MDS
7.1.3 计量MDS
7.2 MDS技术对信息检索的启示
7.2.1 显示对象和对象之间的距离的定义
7.2.2 MDS显示空间的开发
7.2.3 讨论
7.3 小结
第8章 因特网的信息可视化
8.1 引言
8.1.1 因特网的特征
8.1.2 因特网的信息组织和显示的方法
8.1.3 因特网信息的利用
8.1.4 因特网的挑战
8.2 因特网的信息可视化
8.2.1 因特网信息结构的可视化
8.2.2 因特网信息查询的可视化
8.2.3 网络交通流量的可视化
8.2.4 联机讨论历史记录的可视化
8.3 小结
第9章 信息可视化中的歧义性
9.1 信息可视化的歧义性及其影响
9.1.1 信息可视化中歧义性的原因
9.1.2 歧义信息可视化的影响
9.2 信息检索可视化模型中的歧义性分析
9.2.1 欧几里得空间特征为基础的信息模型的歧义性
9.2.2 基于多参考点的信息可视化模型中的歧义性
9.2.3 探路者网络中的歧义性
9.2.4 SOM中的歧义化
9.2.5 多维排列的歧义化
9.3 小结
第10章 隐喻在信息可视化中的意义
10.1 隐喻的定义、基本要素和特征
10.2 隐喻的认知基础
10.3 心智模型、隐喻和人机交互
10.3.1 人机交互中的隐喻
10.3.2 心智模型
10.3.3 HCI中的心智模型
10.4 信息可视化检索中的隐喻
10.4.1 使用隐喻的基本原理
10.4.2 隐喻性信息检索可视化环境
10.5 隐喻应用的步骤和原则
10.5.1 隐喻应用的步骤
10.5.2 设计良好的隐喻视觉信息检索环境的建议
10.6 小结
第11章 信息检索可视化的基准和评价标准
11.1 信息检索可视化的评价
11.2 基准和评价标准
11.2.1 评价标准的影响因素
11.2.2 开发评价基准的原则
11.2.3 评价标准的四种类型
11.2.4 基准的描述
11.3 小结
第12章 后记
12.1 简介
12.2 各种可视化模型的比较
12.3 问题
12.4 小结
参考文献
中英文术语对照表
免费在线读
第1章 信息检索与可视化
广泛存在于因特网、OPAC系统、数字图书馆以及其他形式的信息检索系统中的数字信息正在以指数倍增长。每年大约要产生一百万特字节(ITB-1024GB)的数据,其中,99%的是以数字化形式存在(Keim,2001)。这些信息系统中的数据变得越来越复杂,更新速度也越来越快,在日常生活中正在被越来越多的人利用。当具有不同背景、特性、能力、喜好和目的的用户数显著增长时,用户的需求也开始变得更加多样和复杂。因此,迫切需要一种更高效的信息检索手段——这向当前信息检索系统中使用的传统方法与技术提出了挑战。在传统的信息检索系统中,信息检索主要是基于关键词查询,并且,由于用户无法控制内部匹配过程,查询过程是非连续的。传统的信息检索系统还存在一些固有缺陷:内部匹配过程对用户不透明,检索结果以线性列表的形式显示,一次可显示的结果有限,文档间的关系极少用图示展现,检索环境缺乏供用户浏览的交互机制等。这些固有缺陷使得传统的信息检索系统面对信息需求的极度复杂性与海量多维数据束手无策。
当前计算机已拥有高速运算能力和巨大存储容量,进而拥有了强大的图形处理能力。这些技术与成熟的现代信息检索理论和人机交互理论相结合促生了信息可视化技术。为了克服传统信息检索系统固有的缺陷,信息可视化技术应运而生。信息可视化是一个新兴的领域,其主要目的是将信息‘形象化以方便与用户交互。它通过视窗、图标、菜单和定点装置提供前所未有的交互能力。当今计算机强大的图形处理能力已使得这种复杂的可视化展示成为可能。因此,用于信息组织、表示、解释和检索,并且具有直观性与交互性的新的信息可视化方法能够洞察数据集内部,获取丰富的数据关联和数据内容,挖掘数据特点。这种信息检索可视化方法使得人们能够充分发挥自己的灵活性、创造力和想象力来搜寻信息。对于各种类型用户——无论老少、无论是否有使用经验、无论是否有信息检索专业知识、无论是否懂英语——真正优秀的信息检索可视化技术都应该能够满足其需求。
……
广泛存在于因特网、OPAC系统、数字图书馆以及其他形式的信息检索系统中的数字信息正在以指数倍增长。每年大约要产生一百万特字节(ITB-1024GB)的数据,其中,99%的是以数字化形式存在(Keim,2001)。这些信息系统中的数据变得越来越复杂,更新速度也越来越快,在日常生活中正在被越来越多的人利用。当具有不同背景、特性、能力、喜好和目的的用户数显著增长时,用户的需求也开始变得更加多样和复杂。因此,迫切需要一种更高效的信息检索手段——这向当前信息检索系统中使用的传统方法与技术提出了挑战。在传统的信息检索系统中,信息检索主要是基于关键词查询,并且,由于用户无法控制内部匹配过程,查询过程是非连续的。传统的信息检索系统还存在一些固有缺陷:内部匹配过程对用户不透明,检索结果以线性列表的形式显示,一次可显示的结果有限,文档间的关系极少用图示展现,检索环境缺乏供用户浏览的交互机制等。这些固有缺陷使得传统的信息检索系统面对信息需求的极度复杂性与海量多维数据束手无策。
当前计算机已拥有高速运算能力和巨大存储容量,进而拥有了强大的图形处理能力。这些技术与成熟的现代信息检索理论和人机交互理论相结合促生了信息可视化技术。为了克服传统信息检索系统固有的缺陷,信息可视化技术应运而生。信息可视化是一个新兴的领域,其主要目的是将信息‘形象化以方便与用户交互。它通过视窗、图标、菜单和定点装置提供前所未有的交互能力。当今计算机强大的图形处理能力已使得这种复杂的可视化展示成为可能。因此,用于信息组织、表示、解释和检索,并且具有直观性与交互性的新的信息可视化方法能够洞察数据集内部,获取丰富的数据关联和数据内容,挖掘数据特点。这种信息检索可视化方法使得人们能够充分发挥自己的灵活性、创造力和想象力来搜寻信息。对于各种类型用户——无论老少、无论是否有使用经验、无论是否有信息检索专业知识、无论是否懂英语——真正优秀的信息检索可视化技术都应该能够满足其需求。
……
评论
还没有评论。