首页 > 代码库 > 第二章 构建索引
第二章 构建索引
2.1 Lucene如何对搜索内容进行建模
2.1.1 文档和域
2.1.2 灵活的架构
往文档添加域,跟重建索引二者是什么关系?
Lucene和数据库之间的第二个主要的区别是,Lucene要求你在进行索引操作时简单化或反向规格化原始数据。
2.1.3 反向规格化(Denormalization)
2.2 理解索引过程
2.2.1 提取文本和创建文档
结合Tika框架从各种格式的文件中提取文本信息
2.2.2 分析文档
2.2.3 向索引添加文档
倒排索引
索引段
索引段的格式细节是什么样的
2.3 基本索引操作
2.3.1 向索引添加文档
2.3.2 删除索引中的文档
第二章 构建索引
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。