《大数据:互联网大规模数据挖掘与分布式处理》源自作者在斯坦福大学教授多年的“Web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:
   分布式文件系统以及Map-Reduce工具;
   相似性搜索;
   数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
   搜索引擎技术,如谷歌的PageRank;
   频繁项集挖掘;
   大规模高维数据集的聚类算法;
   Web应用中的关键问题:广告管理和推荐系统。
  

·查看全部>>

大数据:互联网大规模数据挖掘与分布式处理



欢迎投稿 职场/创业方向. 邮箱wangfzcom(AT)163.com:王夫子社区 » [PDF电子书] 大数据:互联网大规模数据挖掘与分布式处理 电子书下载 PDF下载

点评 0

评论前必须登录!

登陆 注册