Hadoop权威指南(中文版)从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hado叩这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:haddoop简介:mapreduce简介:hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制:mapreduce的类型和格式;mapreduce的特性:如何安装hadoop集群,如何管理hadoop;pig简介:hbase简介:zookeeper简介,最后还提供了丰富的案例分析。

Hadoop权威指南(中文版)是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。
什么是谷歌帝国的基石?mapreduce算法是也!apache hadoop架构作为mapreduce算法的一种开源应用,是应对海量数据的理想工具。项目负责人tomwhite透过本书详细阐述了如何使用hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装和运行hadoop集群。

Hadoop权威指南(中文版)结合丰富的案例来展示如何用hadoop解决特殊问题,它将帮助您:
·使用hadoop分布式文件系统(hdfs)来存储海量数据集,
通过mapreduce对这些数据集运行分布式计算
·熟悉hadoop的数据和ilo构件,用于压缩、数据集成、序列化和持久处理
·洞悉编~mapreduce实际应用时的常见陷阱和高级特性
·设计、构建和管理一个专用的hadoop集群或在云上运行hadoop
·使用高级查询语言pig来处理大规模数据
·利用hadoop数据库hbase来保存和处理结构化/半结构化数据
·学会使用zookeeper来构建分布式系统
如果您拥有海量数据,无论是gb级还是pb级,hadoop都将是您的完美解决方案。

Hadoop权威指南(中文版)目录:

第1章 初识hadoop        1
第2章 mapreduce简介        15
第3章 hadoop分布式文件系统        44
第4章 hadoop的i/o        80
第5章 mapreduce应用开发        125
第6章 mapreduce的工作原理        166
第7章 mapreduce的类型与格式        188
第8章 mapreduce 特性        227
第9章 hadoop集群的安装        264
第10章 hadoop的管理        293
第11章 pig简介        321
第12章 hbase简介        366
第13章 zookeeper简介        394
第14章 案例研究        431
附录a apache hadoop的安装        491
附录b cloudera的hadoop分发包        497
附录c 预备ncdc气象资料        502

截图:



欢迎投稿 职场/创业方向. 邮箱wangfzcom(AT)163.com:王夫子社区 » Hadoop权威指南(中文版) ((美) Tom White ) pdf扫描版 PDF 免费下载

点评 0

评论前必须登录!

登陆 注册