首页 > 代码库 > 初识Apache Lucene
初识Apache Lucene
最近因为工作需要,需要学习Lucene。没办法只能度娘了,了解一些其中的大概和思想。
1.什么是Lucene?简单点来说,就是一种搜索引擎技术,开源的、高度扩展的搜索引擎库。
映射关系
1.什么是全文检索?简单介绍下。
举个例子,输入LUCENE,所有内容中含有LUCENE的文件都会被检测出来。
LUCENE采用的就是倒排索引,来实现相关映射。
LUCENE架构设计
盗用一张图来体现LUCENE的精髓。
从图中可以看到。LUCENE使用主要体现在俩个步骤:
1 创建索引,通过IndexWriter对不同的文件进行索引的创建,并将其保存在索引相关文件存储的位置中。
2 通过索引查寻关键字相关文档
索引的创建
1.首先定义一个词法分析器。
参数中的Version.LUCENE_CURRENT,代表使用当前的Lucene版本,本文环境中也可以写成Version.LUCENE_40。
这里面使用的是标准的词法分析器,如果专门针对汉语,还可以搭配paoding,进行使用。
2.确定索引文件存储的位置。
3.创建IndexWriter,进行索引文件的写入。
4.进行内容写入,首先将内容存储在docuent中再将document写入。
索引创建完毕后,就是需要查询索引了。
初识Apache Lucene
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。