论文格式
电气工程 会计论文 金融论文 国际贸易 财务管理 人力资源 轻化工程 德语论文 工程管理 文化产业管理 信息计算科学 电气自动化 历史论文
机械设计 电子通信 英语论文 物流论文 电子商务 法律论文 工商管理 旅游管理 市场营销 电视制片管理 材料科学工程 汉语言文学 免费获取
制药工程 生物工程 包装工程 模具设计 测控专业 工业工程 教育管理 行政管理 应用物理 电子信息工程 服装设计工程 教育技术学 论文降重
通信工程 电子机电 印刷工程 土木工程 交通工程 食品科学 艺术设计 新闻专业 信息管理 给水排水工程 化学工程工艺 推广赚积分 付款方式
  • 首页 |
  • 毕业论文 |
  • 论文格式 |
  • 个人简历 |
  • 工作总结 |
  • 入党申请书 |
  • 求职信 |
  • 入团申请书 |
  • 工作计划 |
  • 免费论文 |
  • 现成论文 |
  • 论文同学网 |
搜索 高级搜索

当前位置:论文格式网 -> 免费论文 -> 其他论文

基于知识库的的问答式系统的研究(二)

本论文在其他论文栏目,由论文格式网整理,转载请注明来源www.lwgsw.com,更多论文,请点论文格式范文查看
2.1.1  知网的哲学
 知网系统的哲学也就是它对客观世界的认识与把握。知网的根本哲学点是:世界上一切事物(物质的和精神的)都在特定的时间和空间内不停地运动和变化。它们通常是从一种状态变化到另一种状态, 并通常由其属性值的改变来体现。试以人为例,人的生老病死是一生的主要状态。人的年龄(属性)一年比一年大{属性值},随着年龄的增长头发的颜色(属性)变为灰白{属性值}。另一方面,一个人随着年龄的增长他的性格(精神)变得日益成熟{属性值},他的知识(精神产品)愈益丰富{属性值}。基于上述所述,知网的运算和描述的基本单位是:万物,其中包括物质的和精神的两类,部件,属性,时间,空间,属性值以及事件。
 特别要强调的是,部件和属性,这两个基本单位在知网的哲学体系中占有着重要的地位。关于对部件的认识是:每一个事物都可能是另外一个事物的部件,同时每一个事物也可能是另外一个事物的整体。门和窗是建筑物的部件;手和脚是动物的部件。但与此同时,一个建筑物又可能是一个社区的部件;一个人又可能是他所属的家庭或社会的部件。一切事物都可以分解为部件。空间可以分解为上下左右;时间可以分解为过去、现在和未来。没有一种事物只能是部件,而不能是整体;也没有一种事物只能是整体,而不会是部件。我们认为一个事物被视为是整体还是部件,可以因系统的不同而区别对待。关于部件在整体中的部位和它的功能,知网遵循这样一种认识:事物的部件在它整体中的部位和功能的描述大体上比照人体。例如:山头、山腰、山脚、桌腿、椅背、河口,建筑物的门和窗类似于人体的口和眼等等。汉语用拟人的手法来描述部件,别的语言也类似,这反映了人类认识事物方法的共性。
 关于对属性的认识是:任何一个事物都一定包含着多种属性,事物之间的异或同是由属性决定的,没有属性就没有事物。人有种族、肤色、性别、年龄、性格、会思维、会使用语言等自然属性以及国籍、出身、职业、贫富等社会属性。在某些特定的情况下可以说属性比事物更重要,这一点在人们的日常生活的替代活动中可以得到体现。如:我们要把一个钉子钉到墙上,但没有锤子,我们可找锤子的替代物,那么什么是锤子的替代物呢?那应该是属性最接近锤子的属性的物品才可能是替代物,而这时重量和硬度是关键性的属性。属性和它的宿主之间的关系是固定的,这是说有什么样的宿主就有什么样的属性,反之亦然。属性与宿主之间的关系同部件与整体之间的关系是不同的。这也体现在知网在涉及属性的标注规范上,知网规定在标注属性时必须标注它可能的宿主的类型及它所指向的属性。
2.1.2  知网的特色
 计算机化是知网的重要特色。知网是面向计算机的,是借助于计算机建立的,将来可能是计算机的智能构件。
 知网作为一个知识系统,名副其实是一个网而不是树。它要反映的是概念的共性和个性,例如:对于“教练”和“球员”,“人”是它们的共性。知网在主要特性文件中描述了“人”所具有的共性,那么“教练”的个性是他是“指导”的施事,而“球员”的个性是他是”受指导”的经验者。对于“富翁”和“穷人”,“美女”和“丑八怪”而言,“人”是它们的共性。而它们的个性,即:“贫”、“富”与“美”、“丑”等不同的属性值,则是它们的个性。同时知网还要着力反映概念之间和概念的属性之间的各种关系,知网描述了下列各种关系:
上下位关系 (由概念的主要特征体现)
同义关系(如“签约”,“合同”等)
反义关系(如“取胜”,“失误”等)
对义关系(如“指导”,“聘请”等)
部件-整体关系(如“心”,“CPU”等)
属性-宿主关系(如“颜色”,“速度”等)
 (g) 材料-成品关系(如“布”,“面粉”等)
(h) 施事/经验者/关系主体-事件关系(如“医生”,“雇主”等)(i) 受事/内容/领属物等-事件关系(如“患者”,“雇员”等)(j) 工具-事件关系(如“手表”,“计算机”等)(k) 场所-事件关系(如“银行”,“医院”等)(l) 时间-事件关系(如“假日”,“孕期”等)(m) 值-属性关系(如“蓝”,“慢”等)(n) 实体-值关系(如“矮子”,“傻瓜”等)(o) 事件-角色关系(如“购物”,“盗墓”等)(p) 相关关系(如“谷物”,“煤田”等)
 知网的一个重要特点是:类似于同义、反义、对义等种种关系是借助于同义、反义以及对义组的,由用户自行形成而不是逐一地、显性地标注在各个概念之上的。
 知网是一个知识系统,而不是一部语义词典。尽管被我们称为知识词典的常识性知识库是知网的最基本的数据库。知网的全部的主要文件包括知识词典构成了一个有机结合的知识系统。例如,主要特征文件、次要特征文件、同义、反义以及对义组的形成,以及事件关系和角色转换等都是系统的重要组成部分,而不仅仅是标注的规格文件。
2.1.3  知网的建设方法
 知网是一个以上述各类概念为描述对象的知识系统而不是一部义类词典。知网是把概念与概念之间的关系以及概念的属性与属性之间的关系形成一个网状的知识系统。这是它与其他的树状的词汇数据库的本质不同。知网的哲学和它的根本特性决定了它的特别的建设方法。在清楚知网的建设方法之前,必须明白一个概念:义原。
 什么是义原?目前还难以定义,但是并不因为它难于定义人们就无法把握和利用它们。大体上说,义原是最基本的、不易于再分割的意义的最小单位。例如:“人”虽然是一个非常复杂的概念,它可以是多种属性的集合体,但我们也可以把它看作为一个义原。我们设想所有的概念都可以分解成各种各样的义原。同时我们也设想应该有一个有限的义原集合,其中的义原组合成一个无限的概念集合。如果我们能够把握这一有限的义原集合,并利用它来描述概念之间的关系以及属性与属性之间的关系,我们就有可能建立我们设想的知识系统。
 知网一个重要特点是对大约六千个汉字进行考察和分析来提取这个有限的义原集合。以事件类为例,在中文中具有事件义原的汉字(单纯词)中,可以提取出数千个义原。例:
 治:医治 管理 处罚 ……
 处:处在 处罚 处理 ……
 理:处理 整理 理睬 ……
 综上所述,知网的建设方法的一个重要特点是自下而上的归纳的方法。它是通过对全部的基本义原进行观察分析并形成义原的标注集,然后再用更多的概念对标注集进行考核,据此建立完善的标注集。
 在初步确定了一批义原并形成了一个基本的标注集之后,如何考核和确定?第一、在扩大标注中观察该义原的覆盖面。知网有一条原则:已有的义原一定要能够描述全部的概念。这里有一个比较硬性的规定,即当我们发现一个具有多个概念的词语,例如八个,而我们以有的义原不能够把这八个概念区别开来时,我们就必须对我们的标注集加以调整,这是绝大多数的情况。第二、观察某一个义原在概念之间关系中的地位。如果一个义原在同类别的许多概念中出现或者不同类别的概念中出现,那么这样的义原就是稳定的义原是一个必须确定的义原。以事件类“医治”这个义原为例,它不仅出现在“医”、“治”、“治疗”、“医疗”、“治病”、“求医”、“看病”等概念中,并且还出现在“医生”、“医院”、“医药”、“诊所”、“不治之症”、“有病乱投医”。因此,“医治”这个义原是稳定的、是必须确定的。
 无论是义原的提取还是义原的考核与确定,在知网的建设中都是至关重要的和具有决定意义的。它们贯穿于知网建设的全过程。因此,知网建设的方法的主要特点是:(1)自下而上的;(2)标注集的形成和知网建设是互动的。
2.1.4  知网系统的概貌
 知网系统包括下列数据文件和程序(1) 知网管理系统 (2) 中英双语知识词典
 知网的规模主要取决于双语知识词典数据文件的大小。由于它是在线的,修改和增删都很方便,因此它的规模是动态的。它的规模通常以词语的条数以及由词语所表述的概念的条数计算。
2.1.5  关于事物的规定
 (1) 所谓事物包含下列的概念类型:物质(包括有生命和无生命)、精神(包括情感、欲望、思想、经验)、时间、空间、事情以及它们的部件。这里应该强调说明的是知网中所描述的“事情”,实际上也是事件。
 (2) 知网对于事物类概念的标注的规定较为琐细,不同类的概念有着不同的要求。大体上,应注意到两个方面,其一采用适合的标识符号;其二是多位标识之间的顺序。
 (3) 当我们要标注某概念所具有的特定的属性值时可以将此属性值直接标注,而无须借助于任何标识符号。
 男士: DEF=human|人,male|男
 (4) 关于部件类概念的规定
 第二位标识必须借助于“%”指明其所属的整体的类型,并尽可能标注它在整体中的部位或它的功能,如:
       心脏: DEF=part|部件,%AnimalHuman|动物,heart|心
        CPU: DEF=part|部件,%computer|电脑, heart|心
 这样的标注意味着“心脏”和“CPU”的分别是“动物”和“电脑”的部件,同时“动物”和“电脑”又分别是“心脏”和“CPU”的整体。它们的功能都是整体的“心”。就常识而言如果“心”的功能受损,那么其整体的功能也必受损。这有助于推理。
  (5) 当标注某一概念与事件之间的关系时,应遵循下列规定:
  (a) 当此概念本身是事情时,其首位标识自然为“事情”,一般应在第二位上标注它应属于的事件的主要特征,无须借助于标识符号,如:
 拔河:DEF=fact|事情,exercise|锻练,sport|体育
 (b) 当此概念与事件之间存在一定的动态角色关系时,则必须借助于标识符号,如:
          雇主: DEF=human|人,*employ|雇用
          雇员: DEF=human|人,$employ|雇用
 (c) 如果此概念与事件存在更复杂的动态角色关系时,则必须借助于多标识符号和多标识位,这时有顺序的要求,如:
 洗衣机:DEF=tool|用具,*wash|洗涤,#clothing|衣物
 上例中“洗涤”为“用具”的功能,或该“用具”用于“洗涤”,“衣物”借助于“#”表示其为“洗涤”的受事。他们之间的顺序是不可以颠倒的。又如:
 熨斗: DEF=tool|用具,*AlterForm|变形状,#level|平
 这里“平”是“变形状”的受事属性,这就是说,“变形状”的受事在接受了该事件之后,其属性将有变化,以至于获得一个“平”的属性值。
2.1.6  关于事件类概念
 事件的主要特征可在《知网管理工具》中看到。其总数800以上,占整个知网特征总数的一半以上,足以见得事件类概念的重要以及知网对事件类概念的重视。上述文件中每一个主要特征附有一个必要角色框架,置于“{}”中,还有一个“[]”其中也标有各种特征。角色框架和置于“[]”中的各种特征为事件类概念的共性的次要特征。
2.1.7  主要特征之间的关系
 知网认为事件概念粗略可以做这样的分类,事件分类如图2.1所示:

图2.1 事件的分类
 知网通过自下而上的事件概念的逐一考察,认定事件的主要特征之间的关系有三类:(1) 上下位关系(2) 静与动的对应关系(3) 动态相互感应关系
 关系和状态是属于上述静态之下的两类。上述动态之下的两类即泛动和实动是造成关系和状态的动力。这样就形成了知网所称的静与动的对应关系,简单的说,有什么样的关系或有什么样的状态,就有什么样的行为动作。例如事物之间有领属关系,如:“我有书”表明了“我”和“书”的关系。 与之相对应的、可以改变这种领属关系的行为动作则是“取”或“给”。
 知网认定事件中表示关系的有九类,事件中表示状态的分为物质状态和精神状态两大类。物质状态包括:存现、常态、良态、衰态、消失(如:生物的生、老、病、死)。精神状态包括:情感、态度、欲望、认知。知网认定事件中表示行为动作的都是与上述关系和状态一一对应的,归根结底体现一个“变”字,即变关系和变状态。需要提请注意的有两类:一是变具体属性的行为动作,如:“提高”、“降低”、“美化”、“加温”等;二是变使动或制动的行为动作,如:“使”、“让”、“命令”、“静止”等。粗略的看这两类行为动作与关系或状态没有具体的一一对应的关系,但是实际上它们也是变关系或状态的。任一个实体,当其属性改变的时候,如由冷变热(在“加温”的作用下),就是其自身内在状态的变化。任一实体,当在使动或制动的行为动作的作用下发生某种行为或停止某种行为,都是其与外界关系的变化。
 关于动态相互感应关系,简称互感关系。事件的互感关系体现在两个方面。第一,事件与事件之间的互感关系;第二,事件的动态角色的相互转换关系。
 事件与事件之间的互感关系包括同类的(都是静态的或者都是动态的),也包括跨类的。例如,"有"和"丢失"是同类的,它们之间的关系前者为后者的必要前提,若"无",便不可能"丢失"。再如,"买"和"有"是不同类的,它们之间的关系则是前者为后者的前提。又如,"抱歉"和"道歉"是不同类的,前者是静态的,一种感情状态,后者是动态的,是一种表达感情的行为动作,但它们存在着一种内在的关系,后者为前者的逻辑结果。"罹患"、"医治"和"复原"是不同类的,"罹患"和"复原"是静态的,"医治"是动态的。它们之间的关系是"医治"转化"罹患"这个"衰态"到"复原"这个"良态"。
 事件动态角色相互转换关系说的是在某一事件发生时它的动态角色会自然地转化成为另一事件的动态角色,或者它原来就应该是另一事件的某一个动态角色。例如,“买”的施事将转化为“有”的“关系主体”。又如,“患病”的经验者原来就应该是“医治”的受事。“医治”的受事将转化为“康复”的经验者。
 知网的研究与建设不仅有很高的探索性,而且有很强的工程性。我们相信它作为一种知识资源能够得到广泛的应用。
  可视化语言Visual Basic 6.0
 Visual Basic是Microsoft公司于1991年推出的Windows应用程序开发工具,经过近十年的发展,它已经成为Windows环境下流行的编程语言,它从根本上改变了传统的程序设计模式,大大简化了Windows应用程序设计。Visual Basic与传统的语言不同,它使用可视化、交互式的方法来开发Windows下的应用程序,由于Visual Basic的交互特性,因此可以一边运行着程序,一边进行界面的调整和程序代码的调试。通过这种方式,代码运行的效果可以在开发时进行测试,而不必等到编译完成以后。
 从Visual Basic5.0之后,Microsoft公司将OCX技术和其他的一些关键技术组合到一起,制定出了新的技术规范,并称之为ActiveX(TM)技术。ActiveX(TM)技术仍然遵循OLE2.0的规范,继续可以像原来的OLE应用那样使用其他应用程序提供的功能,例如Microsoft Word字处理器,Microsoft Excel电子数据表及其他Windows应用程序。
 Visual Basic 6.0的新功能和特点:
 增强的数据访问功能: Visual Basic 6.0提供了与已有系统的开放式的互联性技术,包括ActiveX Data Objects、COM/CISC事务集成管理器. Microsoft还为不同的数据库提供了全新的OLE DB和ODBC驱动程序,通过第三方提供的OLE DB和ODBC驱动程序,还可以与其它数据库系统进行连接[12]。
 新的语言特征:包括:用户自低应类型可以作为参数或公共属性和方法的返回值;函数可以返回数组变量;动态数组可以赋值;文件系统对象等。
 新增和加强的控件:ADO DATACONTROL、COOLBAR CONTROL等。
 新增的部件功能: Visual Basic 6.0可以创建和重用COM控件.创建的部件可以被其它语言重用,而且也可以使用其它语言创建的部件。
 增强的和新的向导:新增的向导有安装程序程序向导,数据窗体向导,应用程序向导和类生成工具;新的向导有数据生成向导和工具条向导。
 Visual Basic应用程序开发工具具有非常强大的功能,在此仅就系统开发过程
中用到的相关技术作简单介绍。
2.2.1  Visual Basic 6.0的数据库对象
 用Visual Basic访问数据库有许多可供选择的方案,这些方案各有自己的特点。RDO是Visual Basic访问关系型ODBC数据源的最佳界面接口,就如DAO/Jet是Jet和ISAM()顷序索引查找方法)类型数据源首选的访问接口一样。这两种方法都完整地集成于Visual Basic中,并且形成了Visual Basic核心的数据访问策略。RDO和DAO都已发展为相当成熟的技术。因此假如用户需要访问ODBC数据源河以使用RDO如果需要访问ISAM或Jet类型数据源,那么就使用DAO/Jet 。
 Active Data Objects(ADO)作为另一种可供选择的技术出现,正在逐渐代替其他数据访问接口。由于RDO同ADO的体系结构非常相似,因此当需要将RDO数据接口转换为ADO时,仍可以使用RDO设计的代码。ADO是独立于开发工具和开发语言的简单而且容易使用的数据接口,同ADO相比,其他数据访问接口都会黯然失色。所有的数据源都可以通过ADO来访问,在今天己逐渐成为现实。
 经过数年发展,ODBC技术日臻完善,己成为访问远程数据的主要方法,而Jet成为本地Jet和ISAM数据接口的首选方案.虽然这些方法在不同程度上有功能交迭的地方,在论证选用数据库访问的方法时,主要还应满足用户在特殊应用程序中对具体数据接口的访问。
 近年来,随着Web应用软件的迅速发展和现有数据存储形式的多种多样,Visual Basic访问数据库的解决方案面临诸如快速提取分布于企业内部和外部有用商业信息等的多种挑战。为此Microsoft提出一种新的数据库访问策略,即“统一数据访问” (Universal Data Access)的策略。“统一数据访问”提供了高性能的存取包括关系型和非关系型在内的多种数据源,提供独立于开发工具和开发语言的简单的编程接口,这些技术使得企业集成多种数据源、选择更好的开发工具、应用软件、操作平台、建立容易维护的解决方案成为可能。
 “统一数据访问”的基础是Microsoft的数据访问组件。这些组件包括ActiveX Data Objects(ADO), Remote Data Service(RDS,也称“高级数据连接器”或ADC),OLE DB和ODBC。
2.2.2  DAO对象
 DAO (Database Access Object),在VB中提供了两种与Jet数据库引擎接口的方法:Data控件和数据访问对象(DAO)。 Data控件只给出有限的不需编程而能访问现存数据库的功能,而DAO模型则是全面控制数据库的完整编程接口。Data控件将常用的DAO功能封装在其中,它与DAO控件的关系就好像内存与CACHE之间的关系一样,所以这两种方法并不是互斥的,实际上,它们常同时使用。DAO模型是设计关系数据库系统结构的对象类的集合。它们提供了完成管理一个关系型数据库系统所需的全部操作的属性和方法,这其中包括创建数据库,定义表、字段和索引,建立表间的关系,定位和查询数据库等。
 Visual Basic中的数据库编程就是创建数据访问对象,这些数据访问对象对应于被访问物理数据库的不同部分,如数据库、表、字段和索引等,同时用这些对象的属性和方法来实现对数据库的操作,以便在Visual Basic窗体中使用绑定和非绑定控件来显示操作结果并接收用户输入。
 Visual Basic通过DAO和Jet引擎可以识别三类数据库:
●Visual Basic数据库:也就是*.MDB数据库
●外部数据库:它们是使用几种流行格式的“索引顺序访问方法OSAM)数据库,这些流行格式包括Btrieve,dBASEIII,dBASEIV,Microsoft FoxPro versions2.0和2.5以及Paradox versions 3.x和4.0。在Visual Basic中能够创建和操作所有以上格式的数据库。也可以访问文本文件数据库和Microsoft Excel或otusl-2-3电子表格。
●ODBC数据库:包括符合ODBC标准的客户用ac服务器数据库,如Microsoft SQL Server。要在Visual Basic中创建真正的客户/服务器应用程序,可以使用ODBC Direct直接把命令传递给服务器处理。也就是说Visual Basic还支持其它不使用Jet数据库引擎的数据访问方法。数据访问对象的ODBC Direct模式允许使用同样的对象模型和语法绕过Jet引擎直接访问ODBC数据。
 从上面的论述我们可以得知,对于编程人员来讲,只须了解DAO的使用,对具体的数据库系统无须做深入的探讨,就可对几乎任何一种数据库进行操作,“以不便应万变”。而对数据库文件自身的物理操作,将由相应的数据库引擎把数据访问对象上的这些操作转换为对数据库文件自身的物理操作,这些引擎来处理所有与各种数据库的接口。

首页 上一页 1 2 3 4 下一页 尾页 2/4/4


相关论文
上一篇:绳带在服装设计中的应用——百变.. 下一篇:中国姓名和地名自动识别系统的研究
Tags:基于 知识库 的的 问答 系统 研究 【收藏】 【返回顶部】
人力资源论文
金融论文
会计论文
财务论文
法律论文
物流论文
工商管理论文
其他论文
保险学免费论文
财政学免费论文
工程管理免费论文
经济学免费论文
市场营销免费论文
投资学免费论文
信息管理免费论文
行政管理免费论文
财务会计论文格式
数学教育论文格式
数学与应用数学论文
物流论文格式范文
财务管理论文格式
营销论文格式范文
人力资源论文格式
电子商务毕业论文
法律专业毕业论文
工商管理毕业论文
汉语言文学论文
计算机毕业论文
教育管理毕业论文
现代教育技术论文
小学教育毕业论文
心理学毕业论文
学前教育毕业论文
中文系文学论文
最新文章
热门文章
计算机论文
推荐文章

本站部分文章来自网络,如发现侵犯了您的权益,请联系指出,本站及时确认删除 E-mail:349991040@qq.com

论文格式网(www.lwgsw.com--论文格式网拼音首字母组合)提供其他论文毕业论文格式,论文格式范文,毕业论文范文

Copyright@ 2010-2018 LWGSW.com 论文格式网 版权所有