电气工程
会计论文
金融论文
国际贸易
财务管理
人力资源
轻化工程
德语论文
工程管理
文化产业管理
信息计算科学
电气自动化
历史论文
机械设计
电子通信
英语论文
物流论文
电子商务
法律论文
工商管理
旅游管理
市场营销
电视制片管理
材料科学工程
汉语言文学
免费获取
制药工程
生物工程
包装工程
模具设计
测控专业
工业工程
教育管理
行政管理
应用物理
电子信息工程
服装设计工程
教育技术学
论文降重
通信工程
电子机电
印刷工程
土木工程
交通工程
食品科学
艺术设计
新闻专业
信息管理
给水排水工程
化学工程工艺
推广赚积分
付款方式
首页
|
毕业论文
|
论文格式
|
个人简历
|
工作总结
|
入党申请书
|
求职信
|
入团申请书
|
工作计划
|
免费论文
|
现成论文
|
论文同学网
|
全站搜索
搜索
高级搜索
当前位置:
论文格式网
->
免费论文
->
计算机毕业论文
基于社交网络的搜索引擎设计与实现(二)
本论文在
计算机毕业论文
栏目,由
论文格式
网整理,转载请注明来源
www.lwgsw.com
,更多论文,请点
论文格式范文
查看
社交网络的蓬勃发展景象,也吸引了搜索引擎企业的注意。2010年6月30日,百度[13]低调地组建社会化网络事业部,并且针对社交网络领域广纳人才,这直接表明,百度将涉足SNS领域,并且SNS服务很有可能成为百度业务新的增长点。搜索引擎的另一巨头谷歌也正乘机进入社交网络范畴。谷歌自从2009年便开始在搜索结果中整合社交内容,但一直未对这类内容给予太大重视。时隔一年多之后,在2011年2月中旬,谷歌搜索产品总监麦克·卡西迪(Mike Cassidy)表示,谷歌今后将针对社交内容重点将展开三大计划:在结果中整合社交内容、提升社交领域的覆盖率、为用户提供更多控制。但是搜索引擎在社交网络领域的应用面临着诸多困难,主要表现在以下几个方面:
首先,。。。。。。
其次,。。。。。。
最后,。。。。。。。。。。。。
(二)研究意义
目前,随着检索技术的发展,信息孤岛问题已经可以解决。针对上述社交网络信息孤岛问题,本文设计并实现一个面向融合社交网络的智能搜索引擎系统。其目标就是使搜索引擎用户,在一个界面内输入一次关键字,就能够检索自己所关注的社交网站内个人主页,从而迅速地通过检索系统返回自己所关注的个人信息。本论文中提出的解决上述问题的基本思想:只针对各个社交网站内个人主页信息,设计实现一个搜索引擎,在一个统一的界面内检索和显示用户在各个社交网站内所关心的信息。
对面向融合社交网络应用的搜索引擎的研究,可以一定程度上缓解搜索引擎面临社交网络的挑战,同时也将为搜索引擎的发展开辟一个新的空间。最主要的是,使用面向融合社交网络的搜索引擎,将为同时在多个SNS检索信息的用户提供极大便利。
(三)主要工作
本文对面向融合社交网络应用的智能搜索引擎系统进行详细设计,并使用全文检索工具包Lucene和开源网络爬虫Heritrix技术来构建系统;本文就本人的主要工作进行说明,主要包括一下几个方面:
调研社交网络的现状,研究搜索引擎的工作原理,通过分析搜索引擎的工作流程,掌握搜索引擎构建过程。
参照网络爬虫知识,对Heritrix开源网络爬虫框架进行学习,主要探讨了其可扩展特性;然后对对全文检索工具包Lucene进行研究,分析其主要架构和主要部件。
在理论基础上,对面向融合社交网络应用的智能搜索引擎系统进行需求分析,设计系统总体结构,重点对系统的关键模块进行详细设计。
依据系统设计方案,利用开源网络爬虫Heritrix和全文检索工具包Lucene对系统进行实现,并完成关键功能模块的测试。
(四)论文结构
第1部分介绍搜索引擎的基本概念、其发展趋势,以及社交网络的现状,详细分析了搜索引擎在社交网络领域应用所面临的问题,简要介绍了解决所面临问题的基本思想,提指出面向融合社交网络应用的智能搜索引擎的研究意义,最后对论文结构做了简要叙述。
第2部分。。。。。。。。。
搜索引擎技术研究
本章首先介绍了搜索引擎的主要分类、发展趋势以及工作原理,然后对其关键技术进行了详细的研究,特别是对开源网络爬虫Heritrix和全文检索工具包Lucene进行详细的阐述。
(一) 搜索引擎概述
(略)
(二) 搜索引擎工作原理
(略)
(三) 搜索引擎的关键技术
(略)
表 2-1 Lucene包结构功能表
Lucene包结构功能表
包名
功能
org.apache.lucene.analysis
语言分析器,主要用于的切词,支持中文主要是扩展此类
org.apache.lucene.document
索引存储时的文档结构管理,类似于关系型数据库的表结构
org.apache.lucene.index
索引管理,包括索引建立、删除等
org.apache.lucene.queryParser
查询分析器,实现查询关键词间的运算,如与、或、非等
org.apache.lucene.search
检索管理,根据查询条件,检索得到结果
org.apache.lucene.store
数据存储管理,主要包括一些底层的I/O操作
org.apache.lucene.util
一些公用类
(四)本章小结
本章首先对搜索引擎的基本概念进行说明,然后对搜索引擎的分类及发展趋势做出简要的介绍,详细阐述了搜索引擎的工作原理。接下来针对本系统采用的全文检索工具包Lucene和网络爬虫框架Heritrix进行重点介绍:主要介绍Lucene的索引文件的逻辑结构、核心类;详细介绍Heritrix的主要组件,以此来理解其主要构架及工作方式。
参考文献
邱哲,符滔滔,王学松.开发自己的搜索引擎---Lucene+Heritrix(第2版)[M].北京:人民邮电出版社,2010
首页
上一页
1
2
下一页
尾页
2
/2/2
上一篇
:
基于计算机信息管理系统
下一篇
:
计算机网络安全大事件分析及防范
Tags:
基于
社交
网络
搜索引擎
设计
实现
【
收藏
】 【
返回顶部
】
人力资源论文
金融论文
会计论文
财务论文
法律论文
物流论文
工商管理论文
其他论文
保险学免费论文
财政学免费论文
工程管理免费论文
经济学免费论文
市场营销免费论文
投资学免费论文
信息管理免费论文
行政管理免费论文
财务会计论文格式
数学教育论文格式
数学与应用数学论文
物流论文格式范文
财务管理论文格式
营销论文格式范文
人力资源论文格式
电子商务毕业论文
法律专业毕业论文
工商管理毕业论文
汉语言文学论文
计算机毕业论文
教育管理毕业论文
现代教育技术论文
小学教育毕业论文
心理学毕业论文
学前教育毕业论文
中文系文学论文