内容简介
本书全面介绍了云计算与大数据的基础知识、主要技术、基于集群技术的资源整合型云计算技术和基于虚拟化技术的资源切分型云计算技术。全书共10章,主要内容包括云计算与大数据概述、相关技术、虚拟化技术、集群系统基础、MPI、Hadoop、HPCC、Storm、数据中心技术和云计算大数据仿真技术。本书注重实用,实验丰富,将实验内容融合在课程内容中,使理论紧密联系实际。
本书可作为高等院校云计算、大数据相关课程的教材,也可作为相关技术人员的参考用书。
目录
第1章 云计算与大数据基础
1.1 云计算技术概述
1.1.1 云计算简介
1.1.2 云计算的特点
1.1.3 云计算技术分类
1.2 大数据技术概述
1.2.1 大数据简介
1.2.2 主要的大数据处理系统
1.2.3 大数据处理的基本流程
1.3 云计算与大数据的发展
练习题
第2章 云计算与大数据的相关技术
2.1 云计算与大数据
2.2 云计算与物联网
2.3 一致性哈希算法
2.3.1 一致性哈希算法的基本原理
2.3.2 一致性哈希算法中计算和存储位置的一致性
2.4 非关系型数据库
2.4.1 从关系型数据库到非关系型数据库
2.4.2 非关系型数据库的定义
2.4.3 非关系型数据库的分类
2.5 集群高速通信标准InfiniBand
2.6 云计算大数据集群的自组织特性
练习题
第3章 虚拟化技术
3.1 虚拟化技术简介
3.1.1 虚拟化技术的发展
3.1.2 虚拟化的描述
3.1.3 虚拟化技术的优势和劣势
3.1.4 虚拟化技术的分类
3.2 常见虚拟化软件
3.2.1 VirtualBox
3.2.2 VMware Workstation
3.2.3 KVM
3.3 系统虚拟化
3.3.1 服务器虚拟化
3.3.2 桌面虚拟化
3.3.3 网络虚拟化
3.4 使用KVM构建虚拟机群
练习题
第4章 集群系统基础
4.1 集群系统的基本概念
4.2 集群系统的分类
4.3 单一系统映射
4.4 Beowulf集群
4.5 集群文件系统
4.5.1 集群文件系统概念
4.5.2 典型的集群文件系统Lustre
4.6 分布式系统中计算和数据的协作机制
4.6.1 基于计算切分的分布式计算
4.6.2 基于计算和数据切分的混合型分布式计算技术——网格计算
4.6.3 基于数据切分的分布式计算技术
4.6.4 三种分布式系统的分析对比
练习题
第5章 MPI——面向计算的高性能集群技术
5.1 什么是MPI
5.2 MPI的架构和特点
5.3 MPICH并行环境的建立
5.3.1 配置前的准备工作
5.3.2 挂载NFS
5.3.3 配置ssh实现MPI节点间用户的无密码访问
5.3.4 安装MPICH2
5.3.5 建立并行计算环境时的注意事项
5.4 MPI分布式程序设计基础
5.4.1 单的并行程序
5.4.2 获取进程标志和机器名
5.4.3 有消息传递功能的并行程序
5.4.4 Monte Carlo法在并行程序设计中的应用
5.4.5 并行计算中节点间的Reduce操作
5.4.6 用MPI的6个基本函数实现Reduce函数功能
5.4.7 设计MPI并行程序时的注意事项
练习题
第6章 Hadoop——分布式大数据系统
6.1 Hadoop概述
6.2 HDFS
6.2.1 HDFS文件系统的原型GFS
6.2.2 HDFS文件的基本结构
6.2.3 HDFS的存储过程
6.3 MapReduce编程框架
6.3.1 MapReduce的发展历史
6.3.2 MapReduce的基本工作过程
6.3.3 LISP中的MapReduce
6.3.4 MapReduce的特点
6.4 实现Map/Reduce的C语言实例
6.5 建立Hadoop开发环境
6.5.1 相关准备工作
6.5.2 JDK的安装配置
6.5.3 下载、解压Hadoop,配置Hadoop环境变量
6.5.4 修改Hadoop配置文件
6.5.5