论文格式
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 轻化工程 德语论文 工程管理 文化产业管理 信息计算科学 电气自动化 历史论文
机械设计 电子通信 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 电视制片管理 材料科学工程 汉语言文学 免费获取
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 应用物理 电子信息工程 服装设计工程 教育技术学 论文降重
通信工程 电子机电 印刷工程 土木工程 交通工程 食品科学 艺术设计 新闻专业 信息管理 给水排水工程 化学工程工艺 推广赚积分 付款方式
  • 首页 |
  • 毕业论文 |
  • 论文格式 |
  • 个人简历 |
  • 工作总结 |
  • 入党申请书 |
  • 求职信 |
  • 入团申请书 |
  • 工作计划 |
  • 免费论文 |
  • 合作期刊 |
  • 论文同学网 |
搜索 高级搜索

当前位置:论文格式网 -> 毕业论文 -> 其他专业论文
毕业论文标题:

基于java的lucene全文搜索子系统

 本文ID:LWGSW17220 价格:收费积分/100
扫一扫 扫一扫
本站会员可自行下载:下载地址 基于java的lucene全文搜索子系统 (收费:5000 积分)  

论文字数:11610,页数:30   附开题报告,任务书,外文翻译

基于Java的Lucene全文搜索子系统
摘要
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户检索网络信息的困难,目前Web搜索引擎(Search Engine)技术正成为计算机科学界和信息产业界争相研究、开发的对象。
搜索引擎 (Search Engine)是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,收集因特网上大量网站的页面,经过加工处理后建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。
本文介绍了传统的基于关系数据库like检索的网站站内检索方案的不足,对开源的Lucene信息检索技术进行了分析,对比了Lucene与关系数据库的区别。在Lucene检索体系的基础上,采用Spring框架,结合网络爬虫Heritrix、Ajax等技术,最终建立起基于Java的Lucene全文搜索子系统的过程。

关键词:
  Lucene  全文检索  中文分词  Spider  全表扫描

Java-based Lucene full-text search subsystem


Abstract
 With the network of information resources of the rapid growth, people more and more concerned about how quickly and efficiently from the vast network of information, from a potential and valuable information to make it effective in the management and decision-making role. Search engine technology to solve the user network information retrieva l difficulties, the Web search engine (Search Engine) technology is becoming computer science and information industry competing research and development targets.
 Search engine (Search Engine) is on the Internet to provide specialized services for a class of sites, these sites through the Internet search software (also known as the Web search robot) or log sites, including through the collection on the Internet site of the large number of pages, after processing the building, to enable the users to respond to the various enquiries, providing users the information needed.
 In this paper, based on the traditional relational database like search site station crawl under the programme, the Lucene open source information retrieva l technology for the analysis, compared Lucene and the distinction between relational database. With an example and then introduced in the Lucene search system on the basis of a Spring framework, integrated network reptiles Heritrix, Ajax and other technologies, eventually establish a Java-based subsystem Lucene full-text search process.

Keywords:
Lucene    Full Text Search    Chinese Segmentation    Spider    Full-table scans
目 录
摘要 II
关键词: II
Abstract III
Keywords: III
目 录 IV
第一章  前言 1
1.1  系统必要性分析 1
1.1.1  企业网站本身的需要 1
1.1.2  站内全文搜索引擎的优势 2
1.2  Lucene全文搜索应用概述 3
1.2.1  Lucene背景 3
1.2.2  Lucene全文搜索的实现机制 3
1.3  Lucene的创新之处 5
第二章  搜索引擎的基本原理 6
2.1  搜索引擎的基本组成及其功能 6
2.1.1  业务流程 6
2.1.2  组件流程简介 6
2.1.3  搜索引擎程序各组成部分的功能详细介绍 7
2.2 信息检索系统构造过程 8
第三章  实例具体开发过程 9
3.1  实例开发准备 9
3.2  实例具体制作过程 10
3.2.1  网页清单抓取 10
3.2.2  为网页清单定制 11
3.2.3  建立全文文本数据库 12
3.2.4  建立关系数据库 15
3.2.5  WEB平台的搭建 19
3.2.6  Lucene的数据同步方案 23
3.2.7    实例存在的问题 24
结束语 25
致谢 26
参考文献 27


相关论文
本论文在其他专业论文栏目,由论文格式网整理,转载请注明来源www.lwgsw.com,更多论文,请点论文格式范文查看
上一篇:基于JAVA的进销存物资管理系统 下一篇:基于J2ME开发一款多媒体华容道游..
Tags:基于 java lucene 全文 搜索 子系统 【收藏】 【返回顶部】
会计论文
电子机电论文
金融论文
电气自动化论文
模具设计
化学工程与工艺
机械设计
电子通信论文
英语论文
行政管理论文
物流论文
电子商务论文
法律论文
国际贸易论文
财务管理论文
人力资源论文
市场营销论文
土木工程论文
工商管理论文
工程管理论文
汉语言文学论文
教育管理论文
测控专业论文
交通工程论文
旅游管理论文
新闻专业论文
艺术设计
教育技术学论文
应用物理学论文
轻化工程论文
德语专业论文
给水排水工程
服装设计与工程
食品生物技术
材料科学与工程
电视制片管理
工业工程论文
文化产业管理
包装工程论文
印刷工程论文
信息管理论文
制药工程论文
生物工程论文
电子信息工程
信息计算科学
电气工程论文
通信工程论文
财务会计毕业论文
电子商务毕业论文
现代教育技术
信息管理专业
心理学专业
数学与应用数学
数学教育
护理学毕业论文
其他专业论文
历史学论文
学前教育毕业论文
小学教育毕业论文
教育管理毕业论文
法律专业毕业论文
汉语言文学毕业论文
工商管理毕业论文
人力资源毕业论文
营销专业毕业论文
物流专业毕业论文
计算机论文
最新文章
热门文章
计算机论文
推荐文章

本站部分文章来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:349991040@qq.com

论文格式网(www.lwgsw.com--论文格式网拼音首字母组合)提供其他专业论文毕业论文格式,论文格式范文,毕业论文范文

Copyright@ 2010-2018 LWGSW.com 论文格式网 版权所有 蜀ICP备09018832号