内容简介
本书紧跟数据分析的**发展趋势,基于Python的数据分台和工具,介绍数据分析的相关知识与技能。本书共7个项目,分为3部分:基础部分、数据分析部分、机器学部分。基础部括项目一和项目二,介绍数据分析环境的搭建,以及NumPy的理论和实践知识;数据分析部括项目三~项目六,结合案例介绍数据检查、数据呈现、数据多维化等,涵盖真实数据分析工作的完整流程;机器学部分括项目七,利用一个神经网络实战案例呈现机器学整过程。
本书选用真实度高的实践案例,深入浅出地介绍与数据分析相关的理论和实践知识。本书可作为高校数据分析相关课程的教材,也可供入数据分析领域的人员及具有实践经验的从业者学考使用。
目录
基础部分
项目一 数据分析概述与环境配置 1
1.1 项目背景 1
1.2 技能图谱 3
1.3 工具介绍 4
1.3.1 Python介绍 4
1.3.2 核介绍 5
1.3.3 辅助工具介绍 6
1.4 工作环境配置 7
1.4.1 安装Python 7
1.4.2 配置虚拟环境 8
1.4.3 安装第三 9
1.5 Jupyter Notebook使用入门 10
1.5.1 Notebook架构 10
1.5.2 Notebook启动 10
1.5.3 Notebook主页基本操作 11
1.5.4 Notebook的保存 12
1.6 项结 12
项目二 NumPy实战 13
2.1 项目背景 13
2.2 技能图谱 14
2.3 数组介绍 14
2.3.1 创建数组 15
2.3.2 了解数组特 18
2.3.3 了解广播 20
2.3.4 练3
2.4 数组基本操作 24
2.4.1 变换数组 24
2.4.2 访问数组 26
2.4.3 数组 29
2.4.4 练1
2.5 数组常用操作 32
2.5.1 使用ufunc 32
2.5.2 查询数组 34
2.5.3 排序数组 35
2.5.4 练7
2.6 项结 38
数据分析部分
项目三 全球气温变化趋势(一)——数据检查 39
3.1 项目背景 39
3.2 技能图谱 40
3.3 数据获取 40
3.3.1 了解获取途径 40
3.3.2 了解项目数据 41
3.3.3 练1
3.4 数据读入 41
3.4.1 了解数据格式 42
3.4.2 读入数据文件 42
3.4.3 处理读入异常 43
3.4.4 练3
3.5 数据检查 43
3.5.1 查看数据集大小 44
3.5.2 查看列标签和数据类型 44
3.5.3 了解数据结构 45
3.5.4 练6
3.6 数据内容访问 47
3.6.1 采用[]方式 47
3.6.2 采用.[i]loc方式 49
3.6.3 采用表达式方式 51
3.6.4 数据可视化 52
3.6.5 练3
3.7 项结 53
项目四 全球气温变化趋势(二)——数据分析 54
4.1 项目背景 54
4.2 技能图谱 55
4.3 列处理 55
4.3.1 重命名列标签 55
4.3.2 删除、合并列 56
4.3.3 转换日期数据 57
4.3.4 练8
4.4 索引处理 58
4.4.1 设置单级索引 59
4.4.2 设置多级索引 60
4.4.3 查询索引 61
4.4.4 练3
4.5 统计分析 64
4.5.1 实现数据排序 64
4.5.2 实现简单统计 65
4.5.3 实现分组统计 66
4.5.4 练0
4.6 项结 71
项目五 全球气温变化趋势(三)——数据呈现 72
5.1 项目背景 72
5.2 技能图谱 73
5.3 数据清洗 73
5.3.1 处理缺失值 74
5.3.2 检测异常值 75
5.3.3 处理异常值 78
5.3.4 练1
5.4 数据转换 82
5.4.1 实现数据替换 82
5.4.2 实现离散化 83
5.4.3 实现重取样 83
5.4.4 练4
5.5 数据可视化 84
5.5.1 绘制折线图 84
5.5.2 绘制饼图 88
5.5.3 绘制柱状图 89
5.5.4 练4
5.6 项结 98
项目六 全球气温变化趋势(四)——数据多维化 99
6.1 项目背景 99
6.2 技能图谱 99
6.3 数据拆分与拼接 100
6.3.1 了解轴向 100
6.3.2 拆分数据 101
6.3.3 拼接数据 103
6.3.4 练09
6.4 数据透视表 109
6.4.1 了解数据透视表 109
6.4.2 使用pivot_table() 110
6.4.3 使用cros() 113
6.4.4 练15
6.5 项结 115
机器学部分
项目七 机器学——模型的自我学17
7.1 项目背景 117
7.2 技能图谱 119
7.3 背景知识介绍 119
7.3.1 了解人工智能 120
7.3.2 了解机器学25
7.3.3 了解人工智能实际应用 129
7.3.4 练30
7.4 神经网络简介 130
7.4.1 了解神经网络 132
7.4.2 了解常见神经网络 136
7.4.3 了解N 139
7.4.4 练43
7.5 N实战 143
7.5.1 预处理数据 143
7.5.2 构建和训练模型 146
7.5.3 分析模型能 148
7.5.4 练53
7.6 项结 155