文献综述
随着网络信息资源的日益丰富,企业自身对信息架构、管理、发布的需求以及用户对信息的组织、查询和信息的可寻性的要求也越来越高,站内搜索也就应运而生。但是,目前站内搜索引擎依旧存在着很大的缺点,部分网站甚至根本没有使用站内搜索系统,或者使用百度、360搜索等公司提供的免费站内搜索,也有部分依赖于简单的数据库SQL查询这种比较传统的方式去解决搜索需求,这也就导致搜索信息不及时、搜索精度低、通用性高等缺点。另外这类搜索也不能依据用户自己提供的热词、搜索关键词等对搜索结果进行个性化的展示,所以网站搜索功能显得单一,用户也得不到较好信息查询的体验。而随着Lucene作为Apache基金会的开源类库的出现,基于Lucene的elasticsearch,solr等站内搜索技术也慢慢普及,未来的站内搜索系统将向着智能化、移动化、个性化三个方向发展,检索结果也将会更加贴切用户的需求。
本课题主要是在研究了搜索引擎技术和全文检索原理的基础上,以基于Lucene的elasticsearch为基础,设计并实现一个站内搜索引擎系统。而这种站内全文搜索框架的研究与实现,旨在解决站内信息检索难的问题以及数据库SQL查询、通用型搜索引擎提供的站内搜索功能所检索的信息不全面、时效性不及时的问题。
参考文献:
[1] 洪涛, 刘奕群, 马少平等. 搜索引擎技术基础. 北京: 清华大学出版社, 2010.III~III
[2] M. S. Divya, S. K.Goyal. ElasticSearch An advanced and quick search technique to handlevoluminous data. Compusoft International Journal of Advanced ComputerTechnology, 2013, 2(6) : 171~174
[3] O. Baysal, O.Kononenko, R Holmes, et al. Mining modern repositories with elasticsearch. NewYork: ACM, 2014. 328~331
[4] 李群, 袁津生. 搜索引擎基础教程. 北京: 清华大学出版社, 2010.2~7
[5] 高凯, 王永成, 肖君. 网页去重策略. 上海交通大学学报, 2006,40(5) : 775~777
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。