描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787517097822
- 数据技术专家Timothy Master博士力作
- 展现特征提取与选择的新技术
- 所有算法可被直觉证实
本书是美国著名数据挖掘算法专家、数值计算专业的数理统计学博士Timothy Masters的**作品。作为一名严谨的数据挖掘工程师,应用中的预测或分类使你经常会面对成千上万的候选特征。这些特征绝大多数没有价值或只有很小的价值,只有与某个或某些其他特征联合起来才可能有用;一些特征可能有巨大的预测能力,但它们又可能仅存在于整体特征空间的某些区域……数据挖掘中,类似这种使人痛苦的问题是无穷的。本书中的现代特征选择技术,将帮助你解决这些问题。本书中所有的算法都可被直觉证实,并有相关方程和解释材料支撑。作者还展现了这些算法的完整的、受到高度好评的源代码,并对其进行了解析。本书适合算法、数据挖掘、人工智能等专业领域的教师、学生及相关的技术及研究人员作为参考及学习用书。
第1章 概述 1
第2章 前向选择成分分析 3
前向选择成分分析概述 3
数学原理与代码示例 5
化解释方差 6
方差化准则代码 7
后向细化 10
多线程后向细化 13
有序成分正交化 18
综合应用 20
仅前向选择子集的成分变量 24
后向细化子集的成分变量 25
人工变量示例 26
第3章 局部特征选择 30
算法概述 30
算法输出结果 34
简要介绍:单纯形算法 34
线性规划问题 35
Simplex类的接口 36
更多细节 37
一种更严格的LFS方法 38
类内分割和类间分割 41
计算权重 43
化类间分割 45
小化类内分割 48
测试β试验值 49
关于线程的简要说明 52
CUDA权重计算 52
将CUDA代码集成到算法中 53
初始化CUDA硬件 54
计算与当前实例之差 56
计算距离矩阵 57
计算小距离 59
计算权重方程项 63
转置项矩阵 64
权重项求和 65
权重迁移到主机 66
局部特征选择示例 66
关于运行时的解释说明 67
第4章 时间序列特征的记忆特性 68
简单数学概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常规计算 78
均值和协方差 78
概率密度 79
多元正态概率密度函数 80
启动参数 81
初始化算法流程 81
对均值施加扰动 82
对协方差施加扰动 82
对转移概率施加扰动 83
关于随机数发生器的解释 83
完整优化算法 84
计算状态概率 85
更新均值和协方差 87
更新初始概率和转移概率 89
HMM在时间序列中的记忆特性评估 93
链接特征变量与目标变量 96
链接HMM状态与目标 102
一个人为的不当示例 109
一个合理可行的示例 111
第5章 逐步选择改进算法 113
特征评估模型 114
基本模型实现代码 115
交叉验证性能度量 118
逐步选择算法 120
确定个变量 125
在现有模型中添加变量 127
三个算法演示示例 130
第6章 名义变量到有序变量的转换 133
实现概述 135
合理关系测试 135
股票价格变动示例 136
名义变量到有序变量变换实现代码 138
构造函数 139
输出计数表 141
计算映射函数 143
Monte-Carlo置换检验 145
评论
还没有评论。