Name: 文本挖掘：基于R语言的整洁工具
SKU: 5d8693675f98494bcc13c43f
Price: 29.99 EUR
Availability: OutOfStock

文本挖掘：基于R语言的整洁工具

作者:[美]茱莉亚·斯拉格出版社:机械工业出版社出版时间:2018年04月

ISBN: 9787111588559

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

EUR €29.99

类别：程序设计 SKU：5d8693675f98494bcc13c43f 库存: 缺货

描述

开本: 16开纸张: 胶版纸包装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111588559

内容简介

Array

目　　录

前言1
第1章整洁文本格式7
比较整洁文本结构与其他数据结构8
unnest_tokens函数8
整理Jane Austen的作品10
gutenbergr包13
词频13
总结17
第2章基于整洁数据的情感分析18
情感数据集18
内连接的情感分析21
比较三个情感词典24
最常见的正面单词和负面单词26
Wordclouds模块 28
除单词外的其他文本单元30
总结32
第3章分析词和文件频率：tf-idf33
Jane Austen小说中的词项频率34
Zipf定律35
bind_tf_idf函数38
物理学语料库41
总结45
第4章词之间的关系：n-gram及相关性46
n-gram词条化46
用widyr包对单词对计数并计算相关性60
总结66
第5章非整洁格式转换67
使文档–词项矩阵整洁67
将整洁文本数据转换为矩阵74
总结84
第6章主题建模85
LDA 86
示例：博大的图书馆馆藏91
LDA方法的替代实现 101
总结102
第7章案例研究：Twitter归档文件比较103
单词使用情况的比较107
单词使用情况的变化109
收藏和转发113
总结 117
第8章案例研究：NASA元数据挖掘118
NASA如何组织数据118
共现单词与相关单词123
计算描述字段的tf-idf129
总结142
第9章案例研究：分析Usenet文本143
预处理143
新闻组中的单词146
情感分析151
总结159
参考文献160

抢先评论了 “文本挖掘：基于R语言的整洁工具” 取消回复

还没有评论。

文本挖掘：基于R语言的整洁工具

作者:[美]茱莉亚·斯拉格 出版社:机械工业出版社 出版时间:2018年04月

ISBN: 9787111588559

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “文本挖掘：基于R语言的整洁工具” 取消回复

评论

相关产品

C Primer Plus 第6版 中文版 C语言入门经典教程

R 语言技术手册 2E（影印版）

笨办法学Python 3

数据结构和编程设计——应用C语言(第二版)（影印版）

作者:[美]茱莉亚·斯拉格出版社:机械工业出版社出版时间:2018年04月

C Primer Plus 第6版中文版 C语言入门经典教程