第7章 后续工作
在获得了别人对一篇论文的评论以及这篇论文基于影响力的概括之后,我们可以对这两段话做更多的分析,获得更好的效果。
例如,可以对基于影响力的概括进行分类[Nanba, et al.,2004],分成定义和实现这两大类,这样,可以更加清晰的了解一篇论文的重点。我们还可以对获得的这些评论进行聚类。获得的这些评论中,会有一些意思相近的句子,如果最终都出现在我们的评论段落里,那肯定不利于了解源论文更多的信息。在[Qazvinian and Radev,2008 ]这篇文章里,就是给定了一些评论句子之后,从中找出一些子句集,以更简短的语句更好的将评论表达出来。
还有,我们获得的这些评论以及概括,都是对于一些相对于老的论文比较有效,而对于较新的论文,显然易见,它的被引用次数会很少,很难获得评论,似乎这个系统对这些论文就没有什么作用 了。但是实际上,我们可以利用自己的系统,对这些新来的论文进行评价。如,一篇会议刚刚接收了一篇新论文A,它引用了一个老论文B,我们可以获得B的评论 以及概括commentB和impact-basedsummaryB,而A中如果有一句话s对B进行了评论,那么,就可以通过s与commentB以及 impact-basedsummaryB之间的关系,判断s这句话是好是坏。对A的每一个引用都进行上述过程,那么,最终,可以自动判断这篇新论文A的质量如何。
在对获得的那些评论以及基于影响的概括进行打分排序时,可以利用到一些那些评论的作者以及发表的会议等先验知识。显然,当一篇论文的作者较有知名度,发表的会议等级较高时,那么引用它的论文的评论要更加具有专业性。
此外,关于论文的检索部分,学术检索有其自己的特点。和Web search不一样,学术检索一篇文本的长度非常之长,因此文献页很多,一个查询词来了,可能第一个词在第一页,第二个词在最后一页,实际不相关,却作为相关结果返回了,因此,可以利用基于对象的语言模型[Nie, et al.,2007],来改进搜索的效果。
第8章 致谢
还有不到两个月,就要离开北京大学了,现在想来,还真的有一点伤感。时间过的真的非常快,现在想起来,2005年9月坐着大巴车从五四路进入北大校园的那一刻还历历在目。那一刻,是我一生中最开心,最激动的一个时刻之一。能够进入北京大学学习,是多年的梦想。身上承载着家乡邻里的祝福,承载着兄弟姐妹、同学的羡慕,承载着家庭的希望,更重要的是,实现了自己的梦想。直到现在,每每想到进入校园的那一刻,就忍不住的激动起来。
四年的大学生活,以这次的毕业论文为完结,要感谢的人很多很多。首先,我要感谢我的父母,虽然大学之后半年才能见一次面,但那里还是自己的避风港,不论遇到了什么挫折,有他们在背后支持,安慰自己,心里就会感觉踏实了很多。
然后,我要感谢我的班主任张海洋老师和导师闫宏飞老师。张老师帮助我解决了很多的难题,无论是申请出国、实习,还是平时生活中遇到的点点滴滴的事情,她都不厌其烦的帮助我们。大三大四在网络实验室实习期间,有很多时候都很没有自信,对自己的前途很担心,但是通过和闫老师的谈话让我感受到了网络实验室的温暖。
我还要感谢何靖师兄。在网络实验室实习期间,除了锻炼了自己的编程能力之外,我觉得对我人生影响最大的就是何靖师兄了。跟他在一起工作、学习时,会不自觉的被他所感染,学到很多东西。从他那儿,我学会了以编程为乐,不再像大一大二那样把编程当作完成任务;从他那儿,我学习到了踏踏实实做学问的精神,一个博士生,能坚持每天7点到实验室晚上11点回去,这种持之以恒的精神让我毕生难忘;从他那儿,我还学习到了每天坚持定计划,晚上做总结的好习惯,这不仅在学习上,对以后的工作、生活等每一件事情都有着重要的意义。
当然,还要感谢单栋栋、赵东升、涂启琛师兄,他们每一个人身上都有着天网的精神:踏踏实实做学问,以编程为乐。
最后,我还要感谢我的女朋友何莲同学。进入大二以后之所以能获得这么好的成绩,有一半要归功于她的监督;特别要感谢在我做手术那几个月期间,她对我无微不至的照顾,这就是患难见真情吧,每当想起这些,我总会非常感动。
参考文献
[Croft, et al.,2009] B. Croft, D. Metzler, and T. Strohman, Search Engines: Information Retrieva l in Practice: Addison Wesley, 2009.
[Elkiss, et al.,2008] A. Elkiss, S. Shen, A. Fader, G. Erkan, D. States, and D. Radev, "Blind men and elephants: What do citation summaries tell us about a research article?," J. Am. Soc. Inf. Sci. Technol., vol. 59, pp. 51-62, 2008.
[Mei and Zhai,2008] Q. Mei and C. Zhai, "Generating Impact-Based Summaries for Scientific Literature," presented at Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics (ACL '08). 2008.
[Nakev, et al.,2004] P. I. Nakev, A. S. Schwartz, and M. A. Hearst, "Citances: Citation sentences for semantic analysis of bioscience text," presented at Proceedings of ACM SIGIR'04 Workshop on Search and Discovery in Bioinformatics, Sheffield, UK, 2004.
[Nanba and Okumura,1999 ] H. Nanba and M. Okumura, "Towards Multi-paper Summarization Using Reference Information " in Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence Morgan Kaufmann Publishers Inc., 1999 pp. 926-931
[Nanba, et al.,2004] H. Nanba, N. Kando, and M. Okumura, "Classification of research papers using citation links and citation types: Towards automatic review article generation," presented at Proceedings of the 11th SIG Classification Research Workshop, 2004.
[Nie, et al.,2007] Z. Nie, Y. Ma, S. Shi, J.-R. Wen, and W.-Y. Ma, "Web object retrieva l," in Proceedings of the 16th international conference on World Wide Web. Banff, Alberta, Canada: ACM, 2007, pp. 81-90.
[Qazvinian and Radev,2008 ] V. Qazvinian and D. R. Radev, "Scientific paper summarization using citation summary networks " in Proceedings of the 22nd International Conference on Computational Linguistics - Volume 1 Manchester, United Kingdom Association for Computational Linguistics, 2008 pp. 689-696
[Volkert,2005] L. G. Volkert, "The Science and Art of Literature Searching for Computer Science Research," 2005.