Hive编程指南是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,演示Hive如何在Hadoop生态系统进行工作。
Hive编程指南适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
Hive编程指南目录
第1章 基础知识
第2章 基础操作
第3章 数据类型和文件格式
第4章 HiveQL:数据定义
第5章 HiveQL:数据操作
第6章 HiveQL:查询
第7章 HiveQL:视图
第8章 HiveQL:索引
第9章 模式设计
第10章 调优
第11章 其他文件格式和压缩方法
第12章 开发
第13章 函数
第14章 Streaming
第15章 自定义Hive文件和记录格式
第16章 Hive的Thrift服务
第17章 存储处理程序和NoSQL
第18章 安全
第19章 锁
第20章 Hive和Oozie整合
第21章 Hive和亚马逊网络服务系统(AWS)
第22章 HCatalog
第23章 案例研究
截图: