Hadoop权威指南(中文版)从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hado叩这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:haddoop简介:mapreduce简介:hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制:mapreduce的类型和格式;mapreduce的特性:如何安装hadoop集群,如何管理hadoop;pig简介:hbase简介:zookeeper简介,最后还提供了丰富的案例分析。
Hadoop权威指南(中文版)是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。
什么是谷歌帝国的基石?mapreduce算法是也!apache hadoop架构作为mapreduce算法的一种开源应用,是应对海量数据的理想工具。项目负责人tomwhite透过本书详细阐述了如何使用hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装和运行hadoop集群。
Hadoop权威指南(中文版)结合丰富的案例来展示如何用hadoop解决特殊问题,它将帮助您:
·使用hadoop分布式文件系统(hdfs)来存储海量数据集,
通过mapreduce对这些数据集运行分布式计算
·熟悉hadoop的数据和ilo构件,用于压缩、数据集成、序列化和持久处理
·洞悉编~mapreduce实际应用时的常见陷阱和高级特性
·设计、构建和管理一个专用的hadoop集群或在云上运行hadoop
·使用高级查询语言pig来处理大规模数据
·利用hadoop数据库hbase来保存和处理结构化/半结构化数据
·学会使用zookeeper来构建分布式系统
如果您拥有海量数据,无论是gb级还是pb级,hadoop都将是您的完美解决方案。
Hadoop权威指南(中文版)目录:
第1章 初识hadoop 1
第2章 mapreduce简介 15
第3章 hadoop分布式文件系统 44
第4章 hadoop的i/o 80
第5章 mapreduce应用开发 125
第6章 mapreduce的工作原理 166
第7章 mapreduce的类型与格式 188
第8章 mapreduce 特性 227
第9章 hadoop集群的安装 264
第10章 hadoop的管理 293
第11章 pig简介 321
第12章 hbase简介 366
第13章 zookeeper简介 394
第14章 案例研究 431
附录a apache hadoop的安装 491
附录b cloudera的hadoop分发包 497
附录c 预备ncdc气象资料 502