学术文献关键词标引和检索系统及方法

文档序号:6466048阅读:311来源:国知局
专利名称:学术文献关键词标引和检索系统及方法
技术领域
本发明涉及一种学术文献关键词标引和检索系统及方法。
背景技术
关键词法采用不受词表控制的原文本语言标引和检索文献,其最大的优越性在于其在检 索时不受控制,符合人们日常表达的习惯,简单易用,而且标引简便高效,同时也可以避免 由于文献分析标引的误差和情报检索语言的粗化所造成的标志表达文献主题的失真。正由于 其自由度大,也存在两个难题. 一是如何从原文中抽出最能准确、充分地表达文献主题的关 键词,以及这些关键词与检索课题有效匹配的问题;二是自然语言对同义词、近义词、多义 词及与其相关的一些词没有进行规范与统一,不能反映概念间的一一对应关系而对检索不利 的难题。关键词法的这些缺点也同样增加了检索者的负担。解决的途径就需要对关键词进行 规范,增强其匹配的准确性。
对关键词实施规范控制有两种方法 一种是前控方法,在标引前就设置了一个受控词表 (如叙词表),在标引阶段对词汇进行控制。但在检索阶段不予控制,由计算机通过与受控词 表相联的自然语言接口自动进行转换。但叙词语言并不适应情报检索语言计算机化和网络化 发展的要求,标引速度慢、成本高、跟不上新词汇的发展,损失关键词法原本存在的优势; 而且由于标引人员的专业限制,对复杂主题的分析易产生偏差。再就是后控方法,是指仅在 检索阶段对关键词实施不严格的控制,但自然语言中的同义词、多义词现象不能得到有效解 决,受控词表作用微弱。标引的一致性差,相同主题的文献就会分散,大大影响检索的命中 率和査准率。这是关键词语言在标引和检索中存在的缺陷。
现今学术期刊中标引关键词已很普遍.但如何正确标引关键词,各学术期刊没有统一标 准;关键词的排列次序反映词与词之间的逻辑关系,但绝大多数学术论文作者对关键词的有 序组合概念模糊,排序没有可循的规律。学术期刊文献是学术期刊数据库主要信息源,文献 标引的质量直接妨碍最终用户的检索行为和结果。

发明内容
鉴于此,本发明的目的在于提供一种学术文献关键词标引和检索系统及方法,将学术期 刊网络投稿编辑系统与学术期刊数据库及数据库检索系统构成统一的数据平台,由学术期刊 论文作者直接对学术期刊论文进行标引,而且对关键词采用统一的标引方法和检索方法,减 少学术文献标引与检索之间对文献主题理解和判断方面产生的差异。
本发明的另一目的在于提供一种学术文献关键词标引和检索系统及方法,设置关键词必 备数据项标引,把关键词按检索的目标内容合成特定逻辑关系,来限定检索的内容和范围, 增强其专指性,使检索更有效。
4为了达到以上目的,本发明将学术期刊网络投稿编辑系统与学术期刊数据库及数据库检 索系统集成为统一的数据平台,包括统一的关键词必备数据项及其顺序,为学术期刊论文责 任者(同时也是标引者),和检索用户在选择关键词进行标引和检索时构成语义一致的提问; 统一的用于存储包括关键词必备数据项及其顺序和标引信息的存储装置和统一的关键词必备 数据项的数据接口装置,用于学术期刊网络投稿编辑系统与学术期刊数据库系统之间的数据 交换。学术期刊数据库及数据库检索系统还包括用于检索者根据所述关键词必备数据项形成 査询的检索装置。
在此前提下,学术期刊论文作者即是学术期刊论文的直接标引者,由学术期刊论文作者 在向学术期刊网络投稿时即按照关键词必备数据项、关键词必备数据项属性提示和关键词必 备数据项顺序选择关键词和包含能满足表达的最小自然语言组进行标引输入,并由系统自动 生成关键词表。关键词必备数据项包括研究对象、研究条件、研究对象属性、研究过程、 研究结果等。关键词必备数据项之间有一定的顺序,由词的位置关系确定词的限定关系。学 术期刊论文作者选择关键词进行标引还包括关键词的同义、近义、外文、外文縮写等表示方 式的标引输入的步骤。并由系统将不同学术期刊论文责任者选择输入的不同语言、不同形式 的关键词的同义词、近义词、外文、外文縮写等表示方式基于词间转换链接到表示对应的统 一的概念中间语标识符号上,实现关键词的同义、近义和跨语言自动标引集成和检索集成。
通过学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统之间统一的关键词 必备数据项的接口装置进行数据交换,学术期刊数据库检索系统按照与所述学术期刊网络投 稿编辑系统入口关键词相同的关键词必备数据项及顺序建立可选检索入口 ,关键词必备数据 项之间可以构成布尔逻辑组配。而且作为对检索者输入提交关键词构成的检索提问的响应, 显示的检索结果同时包括对该关键词的同义、近义、外文、外文縮写等表示方式形成的检索 结果。


图l是本发明系统功能示意图2是应用本发明的学术文献关键词必备数据项标引界面的实施例; 图3显示本发明的学术文献关键词的检索界面实施例。
具体实施例方式
下面结合附图及具体实施例做进一步描述。
图1是一系统功能示意图,将学术期刊网络投稿编辑系统与学术期刊数据库及数据库检 索系统构成统一的数据平台,对关键词采用统一的标引方法和检索方法,减少二者之间产生 的差异。
图2是学术文献标引界面的实施例。所述界面包括关键词必备数据项标引入口 201,
5用于学术文献作者输入关键词进行标引;关键词必备数据项属性提示202,用于文献作者标 引时选择关键词的语义范围限定;关键词必备数据项顺序结构203,表示各关键词必备数据 项之间的语义关系;关键词的同义、近义、外文、外文縮写等表示方式的添加按钮204,提 示学术文献作者标引关键词的同义、近义、外文、外文縮写等表示方式,并由系统将不同学 术期刊论文责任者选择输入的不同语言、不同形式的关键词的同义词、近义词、外文、外文 縮写等表示方式基于词间转换链接到表示对应的统一的概念中间语标识符号上,实现关键词
的同义、近义和跨语言自动标引集成;提交按钮205,用于支持标引操作。
图3是学术文献检索界面的实施例。所述界面包括关键词检索输入口 301;区域302
用于指明关键词的语义限定范围,所述关键词的语义限定范围中的选项与学术文献标引时的 关键词必备数据项一致,并可通过单击相关的核选项进行选择。词的位置关系确定词的限定 关系,提高专指性。检索者也可在关键词的语义限定范围之间进行组配,可选项之间用逻辑
运算符表征,收縮检索结果;303为逻辑算符;304为检索检索提交按钮。检索者输入的关键 词如有同义、近义、外文、外文縮写等其他表示方式,输入其中之一,可以一起检索所述关 键词的其他表示方式。
本发明所述的方法并不限于具体实施方式
中所述的实施例,本领域技术人员根据本发明 的技术方案得出其他实施例也是可能的。
权利要求
1.一种学术文献关键词标引和检索系统,其特征在于由学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统构成统一的数据平台,包括统一的关键词必备数据项及其顺序,为学术期刊论文责任者(同时也是标引者),和检索用户在选择关键词进行标引和检索时构成语义一致的提问;统一的用于存储包括关键词必备数据项及其顺序和标引信息的存储装置;将不同学术期刊论文责任者选择输入的不同语言、不同形式的关键词的同义词、近义词、外文、外文缩写等表示方式基于词间转换链接到表示对应的统一的概念中间语标识符号上,实现关键词的同义、近义和跨语言自动标引集成和检索集成;统一的关键词必备数据项的数据接口装置。
2. 如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述学术期刊网络 投稿编辑系统包括用于对所述关键词必备数据项进行输入和完成提交的装置。
3. 如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述关键词必备数 据项的数据接口装置用于学术期刊网络投稿编辑系统与学术期刊数据库系统之间的数据交 换。
4. 如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述学术期刊数据库及数据库检索系统包括用于检索者根据所述关键词必备数据项形成查询的检索装置。
5. —种学术文献关键词标引方法,其特征在于学术期刊论文责任者是学术期刊论文的 直接标引者。
6. 如权利要求5所述的学术文献关键词标引方法,其特征在于,所述方法还包括以下步骤显示关键词必备数据项标引入口;显示关键词必备数据项属性,如研究对象、研究条件、研究对象属性、研究过程、研 究结果等;显示关键词必备数据项顺序;由学术期刊论文责任者在向学术期刊网络投稿时即按照所述关键词必备数据项、关键词 必备数据项属性提示和关键词必备数据项顺序选择关键词和包含能满足表达的最小自然语言 组进行标引输入;以关键词必备数据项及其顺序由系统自动生成关键词表。
7. 如权利要求6所述的学术文献关键词标引方法,其特征在于,学术期刊论文责任者选 择关键词进行标引还包括关键词的同义、近义、外文、外文縮写等表示方式的标引输入的步骤。
8. —种学术文献关键词检索方法,其特征在于所述方法包括以下步骤 显示检索者可选关键词必备数据项属性及其顺序;检索者可选关键词必备数据项属性之间可以构成布尔逻辑组配;检索者通过对关键词必备数据项属性及其组配关系的选择,输入提交关键词或能满足表 达的最小自然语言组构成检索提问;作为对检索者的检索提问的响应显示检索结果。
9. 如权利要求8所述的学术文献关键词检索方法,其特征在于,所述可选关键词必备数 据项属性及其顺序用以在数据集合中定位关键词必备数据项中的一个。
10. 如权利要求8所述的学术文献关键词检索方法,其特征在于,所述对检索者输入提 交关键词构成的检索提问的响应,显示的检索结果同时包括对该关键词的同义、近义、外文、 外文縮写等表示方式形成的检索结果。
全文摘要
一种学术文献关键词标引和检索系统及方法。本系统基于将学术论文网络投稿编辑系统与学术文献数据库检索系统。其网络投稿编辑系统入口关键词按照研究对象、条件、方法、过程、属性、结果等定性描述文献完整主题内容的语义框架构造输入界面。由论文作者直接对学术期刊论文进行标引,由计算机自动生成词表,实现关键词的同义、近义和跨语言自动标引集成和检索集成。其检索系统按照相同的关键词必备数据项及顺序建立可选检索入口,由词的位置关系确定词的限定关系,提高专指性。
文档编号G06F17/30GK101661469SQ20081013977
公开日2010年3月3日 申请日期2008年9月9日 优先权日2008年9月9日
发明者张福俊, 马莎莎 申请人:山东科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1