内容简介
数据挖掘技术是当下大数据时代键的技术,其应用领域及前景不可估量。R 是一款极其的统计分析和数据挖掘软件,《数据挖掘:R语言实战》侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的精髓并能快速、和灵活地掌握使用R 进行数据挖掘的技巧。
通过《数据挖掘:R语言实战》,读者不仅能掌握使用R 及相关的算法包来快速解决实际问题的方法,而且能得到从实际问题分析入手,到利用R 进行求解,以及对挖掘结果进行分析的全面训练。
《数据挖掘:R语言实战》适用于计算机、互联网、机器学习、信息、数学、经济金融、管理、运筹、统计以及有关理工科专业的本科生、研究生使用,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人士提高专业水平。
目录
第0 章 致敬,R!.............................. 1
致敬,肩膀!..................... 1
致敬,时代!................................... 3
致敬,人才!................................... 4
致敬,R 瑟!................................. 5
上篇 数据预处理
第1 章 数据挖掘导引........................10
1.1 数据挖掘概述..............................10
1.1.1 数据挖掘的过程.............................10
1.1.2 数据挖掘的对象....................................12
1.1.3 数据挖掘的方法........................................12
1.1.4 数据挖掘的应用...................................13
1.2 数据挖掘的算法.................................................14
1.3 数据挖掘的工具.................................................17
1.3.1 工具的分类.............................................17
1.3.2 工具的选择.............................................18
1.3.3 商用的工具...........................................19
1.3.4 开源的工具............................................21
1.4 R 在数据挖掘中的优势....................................23
第2 章 数据概览................................25
2.1 n×m 数据集....................................25
2.2 数据的分类......................................28
2.2.1 一般的数据分类...................................28
2.2.2 R 的数据分类......................................29
2.2.3 用R 简单处理数据..............................31
2.3 数据抽样及R 实现....................................34
2.3.1 简单随机抽样........................................34
2.3.2 分层抽样.................................................36
2.3.3 整群抽样.................................................38
2.4 训练集与测试集................................................40
2.5 本章汇总.............................................40
第3 章 用R 获取数据.......................................42
3.1 获取内置数据集..................................42
3.1.1 datasets 数据集..........................42
3.1.2 包的数据集....................................43
3.2 获取其他格式的数据...............................45
3.2.1 CSV 与TXT 格式.........................45
3.2.2 从Excel 直接获取数据........................47
3.2.3 从其他统计软件中获取数据................48
3.3 获取数据库数据............................................50
3.4 获取网页数据....................................52
3.5 本章汇总.................................55
第4 章 探索性数据分析...........................56
4.1 数据集.......................................56
4.2 数字化探索...................................57
4.2.1 变量概况...................................57
4.2.2 变量详情.....................................58
4.2.3 分布指标......................................61
4.2.4 稀疏性.............................................62
4.2.5 缺失值............................................63
4.2.6 相关性..............