内容简介
《Hadoop指南(第3版)(修订版)(影印版)》的内容包括:使用Hadoop分布式文件系统(HDFS)保存大数据集;使用MapReduce运行分布式计算;使用Hadoop的数据和I/O构件实现压缩、数据完整性、序列化(包括Avro)和持久化;了解常见的陷阱和特性,以编写实用的MapReduce程序;设计、构建和管理专用的Hadoop集群——或者在云中运行Hadoop;使用Sqoop从关系型数据库载入数据到HDFS;使用Pig查询语言进行大规模数据处理;使用Hadoop的数据仓库系统Hive分析数据集;利用Hbase处理结构化和半结构化数据,以及利用ZooKeeper构建分布式系统……
目录
Foreword
Preface
1.Meet Hadoop
2.MapReduce
3.The Hadoop Distributed Filesystem
4.Hadoop I/O
5.Developing a MapReduce Application
6.How MapReduce Works
7.MapReduce Types and Formats
8.MapReduce Features
9.Setting Up a Hadoop Cluster
10.Administering Hadoop
11.Pig
12.Hive
13.Hbase
14.ZooKeeper
15.Sqoop
16.Case Studies
A.Installing Apache Hadoop
B.Cloudera’s Distribution Including Apache Hadoop
C.Preparing the NCDC Weather Data
Index