内容简介
《Oracle大数据解决方案 由Oracle大数据团队成员联袂撰写,全面介绍用于获取、组织、分析和利用非结构化数据的Oracle综合集成化产品。本书讨论成功实现大数据方案的策略和技术,包括Apache Hadoop、Oracle大数据机、Oracle大数据连接器、Oracle NoSQL数据库、Oracle Endeca、Oracle分析和Oracle开源R产品,还讲述迁移既有系统并将现有数据仓库和分析解决方案集成到企业大数据基础架构的实践。
主要内容
● 理解综合性大数据战略的价值
● 限度地提高Apache Hadoop平台的分布式处理能力
● 介绍将Oracle大数据机用作Hadoop和Oracle NoSQL数据库工程系统的优势
● 使用Oracle大数据机来配置、部署、监控Hadoop和Oracle NoSQL数据库
● 将现有数据仓库和分析基础架构集成到大数据架构
● 使用Oracle数据连接器在Hadoop和关系型数据库之间共享数据
● 理解如何将Oracle NoSQL数据库集成到Oracle大数据架构
● 使用数据库内分析更快地实现价值
● 使用Oracle分析(Oracle R企业版和Oracle数据挖掘)、OracleR分发版、ROracle和Oracle R Connector for Hadoop来分析数据
● 使用Oracle Endeca信息发现来分析独立数据
● 规划和实施大数据管理战略,开发架构和路线图
目录
第Ⅰ部分 引 言
第1章 大数据简介 3
1.1 大数据 3
1.2 谷歌的MapReduce算法和Apache
Hadoop 4
1.3 Oracle的大数据平台 5
1.4 总结 8
第2章 大数据的价值 9
2.1 我是大数据吗?还是大数据是我? 10
2.2 大数据,小数据——仍然是数据 12
2.2.1 什么已经发生了? 12
2.2.2 现在发生了什么? 13
2.3 请看看现实! 14
2.4 你想把它做成什么? 16
2.5 大数据,大数字,大企业? 17
2.5.1 Twitter 18
2.5.2 Facebook 19
2.5.3 内部源 19
2.5.4 ICR:连接 20
2.5.5 ICR:变更 20
2.6 需要:大数据的价值 22
2.6.1 大数据案例1:医疗行业的临床试验研究 23
2.6.2 大数据案例2:在汽车行业的汽车设计中改进驾驶员安全 23
2.7 总结 24
第 II 部分 大数据平台
第3章 Apache Hadoop平台 27
3.1 软件与硬件 28
3.2 Hadoop的软件平台 28
3.2.1 Hadoop的发布与版本 29
3.2.2 Hadoop Distributed File System(HDFS) 29
3.2.3 调度、计算和处理 31
3.3 操作系统的选择 33
3.4 Hadoop硬件平台 34
3.4.1 CPU和内存 34
3.4.2 网络 34
3.4.3 磁盘 35
3.5 整合在一起 35
第4章 选择Appliance的理由 37
4.1 Oracle创建大数据机的理由 38
4.2 Appliance的概念 39
4.3 Oracle Big
Data Appliance的发展目标 39
4.4 Appliance优化 39
4.5 Oracle Big
Data Appliance第2版软件 40
4.6 Oracle大数据机X3-2硬件 42
4.7 Oracle获取Hadoop知识的地方 44
4.8 配置Hadoop集群 45
4.8.1 选择核心集群组件 45
4.8.2 组装集群 47
4.9 自己组建的集群 48
4.10 集群总成本 49
4.11 时间价值 52
4.12 如何打造更大的集群 53
4.13 Oracle大数据机可否支持其他软件 53
4.14 一体机的缺陷 54
第5章 BDA配置、部署架构和监控 55
5.1 介绍 56
5.1.1 大数据机X3-2满配机架(18个节点) 57
5.1.2