本书以Lucene构建搜索引擎的开发过程为主线,由浅入深,循序渐进,为读者展示如何使用Lucene开发自己的搜索引擎系统。全书内容包括搜索引擎概述和原理、Lucene部署安装、Nutch网络蜘蛛与数据获取、Lucene索引建立、Lucene检索与查询、搜索结果排序、文档分析器与中文分词、格式化文本分析、分布式搜索与缓存等。为便于读者理解搜索引擎快速开发过程,本书最后几章进行了应用实例的讲解,包括Nutch构建专题搜索、Lucene构建企业级搜索实例以及相关的整体工程性能测试。
  本书适合对搜索引擎开发有兴趣的读者阅读,包括搜索引擎开发的初学者、高等院校、信息专业学生、从事搜索开发的程序设计人员等。

目录:

第1篇 入门篇
第1章 搜索引擎概述
第2章 搜索引擎原理探秘
第3章 开源搜索引擎入门
第2篇 内核揭秘篇
第4章 搜索引擎数据获取
第5章 搜索引擎信息索引
第6章 搜索引擎查询处理
第7章 搜索引擎结果排序
第8章 文档分析器与中文分词
第9章 搜索引擎文本分析
第10章 分布式搜索与缓存
第3篇 实战篇
第11章 Nutch专题搜索引擎实例
第12章 Lucene实现企业搜索实例

截图:



欢迎投稿 职场/创业方向. 邮箱wangfzcom(AT)163.com:王夫子社区 » Lucene+Nutch搜索引擎开发 PDF 扫描版[79M] PDF 免费下载

点评 0

评论前必须登录!

登陆 注册