作者: 【美】Srinath Perera , Thilina Gunarathne 译者: 杨卓荦 责编: 杨海玲 分类: 数据科学 > 大数据 > Hadoop
这是一本学习Hadoop MapReduce的一站式指南,完整介绍了Hadoop生态体系,包括Hadoop平台安装、部署、运维等,Hadoop生态系统成员Hive、Pig、HBase、Mahout等。最重要的是,书中包含丰富的示例和多样的实际应用场景,以一种简单而直接的方式呈现了90个实战攻略,并给出一步步的指导。本书从获取Hadoop并在集群中运行讲起,依次介绍了高级HDFS,高级Hadoop MapReduce管理,开发复杂的Hadoop MapReduce应用程序,Hadoop的生态系统,统计分析,搜索与索引,聚类、推荐和寻找关联,海量文本数据处理,云部署等内容。 更多>>
版权声明 内容提要 审稿人介绍 作者介绍 前言 第1章 搭建Hadoop并在集群中运行 1.1 简介 1.2 在你的机器上安装Hadoop 1.3 写WordCountMapReduce示例程序,打包并使用独立的Hadoop运行它 1.4 给WordCount MapReduce程序增加combiner步骤 1.5 安装HDFS 1.6 使用HDFS监控UI 1.7 HDFS的基本命令行文件操作 1.8 在分布式集群环境中设置Hadoop 1.9 在分布式集群环境中运行WordCount程序 1.10 使用MapReduce监控UI 第2章 HDFS进阶 2.1 简介 2.2 HDFS基准测试 2.3 添加一个新的DataNode 2.4 DataNode下架 2.5 使用多个磁盘/卷以及限制HDFS的磁盘使用情况 2.6 设置HDFS块大小 2.7 设置文件冗余因子 2.8 使用HDFS的Java API 2.9 使用HDFS的C API(libhdfs) 2.10 挂载HDFS(Fuse-DFS) 2.11 在HDFS中合并文件 第3章 高级Hadoop MapReduce运维 第4章 开发复杂的Hadoop MapReduce应用程序 第5章 Hadoop生态系统 第6章 分析 第7章 搜索和索引 第8章 聚类、推荐和关系发现 第9章 海量文本数据处理 第10章 云端部署——在云上使用Hadoop



欢迎投稿 职场/创业方向. 邮箱wangfzcom(AT)163.com:王夫子社区 » [PDF电子书] Hadoop MapReduce实战手册 PDF下载

点评 0

评论前必须登录!

登陆 注册