文献信息检索论文
一、文献的基础知识
1.文献的概念 文献是记录知识的一切载体。具体地说,文献是将知识、信息用文字、符号、图像、音频等记录在一定的物质载体上的结合体。由此定义我们可以看出,文献具有三个基本属性,即文献的知识性、记录性和物质性。它具有存贮知识、传递和交流信息的功能。
2.文献的特征分为外部形态特征和内部形态特征两大部分. 1)文献的外部特征 文献名称:它是文献内容的概括. 著者名称:它是指对文献负有一定责任的个人或机关团体. 版本:包括版次和版刻,指文献的排版次数,用来表明文献版本的重要变更. 出版地:是指出版者所在的地域名称. 出版者:包括负责整理,付印出版的机关团体或出版企业组织等. 版期:它取决于,版次,主要指某版次的出版时间. 载体形态:指文献的页数,卷数,插图,折图,彩图,照片,开本,尺寸等. 标准书号和刊号:指图书的ISBN号和期刊的ISSN号.
2)文献的内部形态特征是指可以揭示文献内容和实质的标识,有分类号和主题两种. 分类号:文献分类就是根据确定好的逻辑系统,将文献信息所载知识单元与形式特征,利用号码标识进行分门别类的系统揭示与组织.其中,用来代表类目名称的标识符号称为分类号.从分类号可以得知文献的学科属性,内容实质.比如:文学用"I"字母来标识,中国小说用"I24"来标识. 主题词:它是一种以语词为检索标识,采用词语结识和描述文献信息主题内容,按照主题字顺组织文献的情报检索语言.主题词是文献的中心思想和所要表达的重要内容的高度概括.
3.文献的类型 1)零次文献:指未以公开形式进入社会流通使用的实验记录,会议记录,内部档案,论文草稿,设计草稿等. 2)一次文献:指以作者本人的研究工作或研制成果为依据撰写,已公开发行进入社会流通使用的专著,学术论文,专利说明书,科技报告等. 3)二次文献:指对一次文献信息进行整理,加工的产品.如各种目录,索引和文摘,或各种书目型数据库. 4)三次文献:在一次,二次文献的基础上,对有关知识信息进行综合,分析,提炼,重组而生成的再生文献.如各种教科书,技术书,参考工具书,综述,年鉴,手册等.
二、信息检索的重要意义主要体现在以下两方面:
(1)充分利用信息资源,避免重复劳动 科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的信息,即利用信息检索的方法,充分了解国内,国外,前人和他人对拟探索或研究的问题已做过哪些工作 取得了什么成就 发展动向如何 等等.这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中.因此,信息检索是科学研究必不可少的前期工作. (2)为人们更新知识,实现终生学习提供门径 在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求.美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%~25%,而75%~80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的.因此,掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通,不断进取的主要途径.
三、国内文献检索工具简介 1.《全国总书目》和《全国新书目》 这两种书目创刊于1949年,由国家出版事业管理局版本图书馆编,中华书局出版。 这两种书目是根据全国出版单位向版本图书馆缴送的样本书而编成的,是我国的国家书目。它是检索我国出版图书的主要检索工具。用它可查到公开出版的科技图书和部分内部出版的科技图书。 2.《全国报刊索引》 它创刊于1951年,由上海图书馆编辑出版,月刊,收录中央和各省、市、自治区出版的报纸、杂志资料,以题录形式作报道。通过这个索引,能查到我国主要报刊上的科技论文和资料。该刊从1980年分为科技版和哲学、社会科学版两部分。每条资料依次著录篇名、著译者、刊名、出版年、月及卷、期、页次。 3.《中文科技资料目录》和《科技文摘》 《中文科技资料目录》和《科技文摘》收录国内公开和内部的科技期刊论文、科技资料和译文,不收录密级资料.
四、国外文献检索工具简介
1.《科学引文索引》(Science Citation Index,简称SCI),是美国费城科学情报所(ISI)编辑出版的一种综合性科技引文检索刊物。。《SCI》报道文献的学科涉及生命科学、临床医学、数理科学和化学、农业、工程技术、行为科学等方面,主要侧重于基础学科。
2.美国《化学文摘》(Chemical Abstraccts,简称CA)创刊于1907年,由美国化学学会(CAS)的化学文摘服务处(Chemical Abstraccts Service,简称CAS)编辑出版。它是一种享有世界声誉的化学化工专业性文摘刊物,自称为“打开世界化学文献宝库的钥匙”。它以报道世界各国化学、化工文献为主,同时收录大量生物学、医学、药学、卫生学等相关专业的文献。
3.俄罗斯《文摘杂志》(简称Р.Ж.)1953年创刊,它是由前苏联全苏科学技术情报研究所编辑出版的大型综合性检索刊物。它收录世界上130多个国家的66种文字的科技文献,包括22000多种期刊、10000多种图书、6000多种连续出版物、15万件发明证书和专利以及会议录、科技报告、标准等等。全年报道量约在120万条以上,是目前世界上引用出版物最多、报道量最大的一套文摘刊物。
4.英国《科学文摘》(Science Abstraccts,简称SA),创刊于1898年,是一种物理学、电气电子学、计算机与控制领域综合性科技检索刊物,现由英国电气工程师学会(下设的“国际物理与工程情报服务部”编辑出版。
五、计算机检索技术
1.布尔检索 逻辑“与” (AND),表示为 A and B 或 A * B。表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。
逻辑“或”(OR),表示为 A or B 或 A + B。表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。
逻辑“非”(NOT),表示为 A not B 或 A - B。表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。
2.截词检索
提高查全率,防止漏检的有力手段。包括有限截词和无限截词,常用的有限截词符和无限截词符有:*, #,?,!,$
有限截词--放在词中间或末尾,一个符号表示一个词。如:wom*n woman,women 无限截词--放在司的末尾,一个符号表示任意多个词。 如:comput! Computer,computers,
注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认
3.位置检索
常用的位置算符有:(W) (nW) (N) (nN)等
(W) W的含义为with,表示其两侧的检索词必须紧密相连,除空格和标点之外,不得插入其他词或字母,两词的词序不可颠倒。如输入communication(W)satellite时,系统只检出含有communication satellite的记录。 (nW)这里W的意思是word,允许两个检索词之间插入最多n个词,词序不变。如输communication(2W)satellite系统将会检出communication satellite; communication though satellite; communication on the satellite. (N) N的含义为Near,表示两个检索词必须紧密相连,空格标点除外,词序可以颠倒。 (nN)两个检索词之间可以插入n个单词,前后位置可以互换。
附:三次信息检索实验的心得体会 对于现阶段的学习,通过每次的信息检索实验掌握几个基本数据库的使用方法,知道查文献可以到哪去查,原文到哪里去索取,我自认为的确是学到东西了,但和钻研的同学比起来中间还是存在一段差距.这不禁使我对以前的认知态度产生了某种怀疑. 1.检索的基础 以前一直觉得,信息检索是一种手段,存在一定的技巧,我们不可能一蹴而就,掌握得很好,在现阶段,跟着老师走,以最短的时间在最大程度上提高检索能力,是目前"最优化"的方法,只要能制定出相对正确的检索策略就够了,至于其检索能力的进一步提高,可以在以后的学习工作中不断学习与积累.现在看来这个相对正确,除了不犯not,and,all优先次序的错误外,认真分析课题,确定关键词,防止漏检也是至关重要的.检索前,不妨先花点时间,用词典查一下关键词的英文表述,找一本大百科全书是一个不错的选择.注意不同的检索工具间的区别及其特色,并能熟练掌握. 2.检索与阅读 没有消化与吸收的检索有什么用?检索与阅读文献是科研工作中重要的两个方面,就像是一个木桶上的两块板,一方面的薄弱,都会导致最后盛水量的不足,因此无论是哪方面的缺憾都将制约你的科研工作,只有当两者和谐发展时,才能发挥出最大的作用.一味地追求某一方面的能力,而忽视另一方面的锻炼,都是不可取的.信息检索课程的设置,只能最大限度的提高我们在检索方面的能力,对于文献的阅读,就是"师傅领进门,修行靠自身"了.有目的地培养自己在这方面的能力,文献阅读能力的提高,同时还能加深我们对课题的理解,制定出更为合理的检索策略,促进检索能力的提高.因此两者是相辅相成,相互促进的.可能是因为正处在训练检索能力的阶段吧,我经常会出现这样的情况,用这个方法那个方法查出来一堆文献(有的还要去找原文),结果看着着一堆东西,什么都想要去找,找到了什么都想看看,又不知道先看什么,有点像猴子下山,看到玉米掰玉米,又看到西瓜,丢了玉米去摘西瓜……最后什么收获都没有.有一段时间甚至还想和师兄比较一下看看索取原文的能力差多少,花了很多时间只想看看能找到多少,找到了,也没去看过.我想在这样的过程中,我丢掉的大概是最重要的东西吧! 3.检索与科研 对于信息检索,不能把它孤立地以一门课程来对待,只有当它与其它研究联系起来的时候才能发挥出最大作用.文献的检索与阅读,都是最终和科研联系起来的.针对索取到一大堆文献,结果不去阅读的情况,我觉得,信息检索应该要分类"勤索",阅读.就像"书非借不能读也",存在电脑里的文献放的时间越长,越不会去读,还不如每天就课题的某一方面检索出一定的文章,精心挑选出有价值的(保证在某一期限内可以阅读完成的,不管是通过精读还是略读或者是浏览),保存,并严格按照计划阅读完成.由于该期限内所阅读的文章都是某一内容的,更有利于我们理解与比较.结合整个科研过程,在还没有确定课题的时候,我们可能需要了解很多关于某个领域的相关信息,这个时候,不一定是只查阅文献,还可以看看一些BBS 上关于这个方面的帖子,总之,要尽可能宽的了解这一方面的知识.确定课题后,由于是刚接触,可以翻阅百科全书等了解一下基本知识,阅读一些专著,对该领域有一个系统的了解,可以上超星或图书馆的汇文系统查阅这方面的书籍,在此基础上检索一些综述性的文章,了解课题的背景知识,历史,以及目前的研究状况等,并逐渐深入.在研究的不同阶段有重点的阅读相关的文献,从理论,实验,研究方法,应用各方面建立整体的结构框架,制定实验方案.在实验过程中,及时总结实验结果,不断调整方案,并不忘对课题进行追踪.随着研究的深入,不能只注意深度,仍要不时看看与研究领域相交叉的学科发展等,注意文献的扩展.当然,我现在还没有真正开始这方面的工作,写这些也不过是靠着对研究过程的想象和理解而已,有点纸上谈兵的味道,在实际工作中碰到的可能远比这复杂,并且这种凭空的想象与实际可能还是有很大出入的,说得不对,也别见怪.
4.检索与生活 此外,信息检索与我们的生活也息息相关.我们通过检索更可获得的不只是文献以外的内容.用普通的搜索引擎,我们可以找到现实生活中需要的信息,如商品,想下载的软件,mp3,等等.看了那篇google的应用后,更觉得检索的方便与实在,应该说,它大大提高了我们从网上获取有用信息的效率! 5.检索的不断完善 或许,现在我们的检索水平真的是不咋的,但也不要妄自菲薄啊!它还等着让我们去不断提高与完善呢!当今世界,存在的检索工具,绝不止课上讲授的这些,而随着信息技术的发展,我们有理由相信,会出现越来越多的检索工具,现存的检索工具也会不断的完善,这就要求我们不断地学习与发展,"与时俱进"了.信息检索这门课程,要传授给我们的是一种检索的理念:逻辑运算符的运用,如何查准查全,如何确定关键词,如何搜索……我觉得,无论怎么变,其人性化的设计应该是不变的.或许我们可以从页面上找到例子,找到"browse""dictionary",找到"limit"这些曾经在其它检索页面上看到的东西,触类旁通. 最后,希望检索能为我们扬起在科研的瀚海中航行的风帆.