基于时态推理的学术论文精准检索方法及系统与流程

文档序号:11323284阅读:233来源:国知局
基于时态推理的学术论文精准检索方法及系统与流程

本发明涉及论文检索技术领域,尤其涉及一种基于时态推理的学术论文精准检索方法及系统。



背景技术:

相关技术中,学术论文的搜索方法一般为关键字搜索,通过搜索论文的关键字,检索与之相关的学术论文,或者设定更多的搜索条件,根据搜索条件检索更加精确的论文定位,但是,对于网页上的论文资料,由于其时间参数能够更多的反应论文的性质参数,但是现有技术的学术论文检索技术只能根据论文所在的网页发布日期或论文信息上传至网页的日期来进行限定时间的学术论文检索,例如检索2015之后的学术论文,现有学术论文检索技术无法根据论文的投稿日期、接受日期、网络版上线日期、正式出版日期来进行精准检索,更无法进行这些日期的组合精准检索。

因此,现有技术需要改进。



技术实现要素:

根据本发明实施例的一个方面,提供的一种基于时态推理的学术论文精准检索方法,包括:

获取用户需要检索论文的内容关键词和时间限定条件;

通过内容关键词检索论文数据库中的所有学术论文,使得到的检索结果加入到第一学术论文集合;

从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据;

将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;

将检索学术论文集合的论文作为检索结果输出至用户。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述内容关键词为检索论文中的一个或多个关键词组,所述多个关键词组之间为“与”或“或”的关系,初始状态为“或”的关系,所述多个关键词组之间“与”的关系表示在检索论文中需同时满足多个词组的全部词组的检索,所述多个关键词组之间“或”的关系表示在检索论文中至少满足多个词组中的一个词组的检索。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述多个关键词组的“与”的关系表示为:aandb或a+b,所述a表示一个关键词组,b表示另一个关键词组;

所述多个关键词组的“或”的关系表示为:aorb或ab,所述a表示一个关键词组,b表示另一个关键词组。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述时间限定条件包括:论文投稿时间条件和/或论文出版时间条件;

所述论文投稿时间条件包括论文数据库中所有学术论文中投稿的一个或多个时间点或时间段的时间条件;

所述论文出版时间条件包括论文数据库中所有学术论文中出版的一个或多个时间点或时间段的时间条件;

所述论文投稿时间条件为出版单位收到学术论文并予以登记日期的时间条件;

所述论文出版时间条件表示学术论文公开并予以登记出版时间的时间条件。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述时间点表示某一自然日;

所述时间段的计算方法为:

如果为一日,则该日时间段为本日的自然日时间;

如果为一月,则该一月时间段为本月的第一日至本月的最后一日的全部自然日时间;

如果为一年,则该一年时间段为本年的第一日至本年的最后一日的全部自然日时间;

如果为多日时间段,则表示为从该多日时间段的第一日至最后一日的全部自然日时间;

如果为多月时间段,则表示为从该多月时间段内的第一月的第一日至最后一月的最后一日的全部自然日时间;

如果为多年时间段,则表示为从该多年时间段内的第一年的第一月的第一日至最后一年的最后一月的最后一日的全部自然日时间。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据包括:

从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括:论文投稿时间信息和出版时间信息;

根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;

根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合。

基于上述基于时态推理的学术论文精准检索方法的另一个实施例中,所述将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合包括:

设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;

设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;

判断论文投稿时间条件与论文出版时间条件的关系;

如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;

如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个。

基于本发明实施例的另一个方面,公开一种基于时态推理的学术论文精准检索系统,包括:

数据库单元,所述数据库单元包括存储模块,用于存储学术论文,并根据检索条件生成检索论文的存储模块,所述存储模块包括:第一存储模块、第二存储模块;

关键字搜索单元,输入搜索关键字后,所述关键字搜索单元自动在所述数据库单元搜索相关关键字的学术论文,并将检索到的学术论文存放到数据库单元的第一存储模块中;

时间信息提取单元,所述时间信息提取单元用于提取通过关键字检索后存储的学术论文的时间信息,所述时间信息包括:学术论文的投稿时间、学术论文的出版时间;

时间条件搜索单元,输入时间条件后,所述时间条件搜索单元自动在所述第一存储模块中按照事件条件搜索学术论文,并将符合条件的搜索结果存储在所述第二存储模块中。

基于上述基于时态推理的学术论文精准检索系统的另一个实施例中,所述时间条件搜索单元的输入搜索条件包括两部分,分别为学术论文的投稿时间条件和学术论文的出版时间条件。

所述时间条件搜索单元的输入搜索时间条件为时间点、多个时间点、时间段、多个时间段中的一种或多种。

所述时间条件搜索单元输入搜索时间条件之间的关系包括:“与”的关系和“或”的关系;

所述“与”的关系表示为:aandb或a+b,所述a表示一个关键词组,b表示另一个关键词组;

所述“或”的关系表示为:aorb或ab,所述a表示一个关键词组,b表示另一个关键词组。

基于上述基于时态推理的学术论文精准检索系统的另一个实施例中,所述时间条件搜索单元输入搜索时间条件为:

如果是时间点,表示某一自然日;

如果是多个时间点,表示多个自然日;

如果是时间段,表示从某一自然日到另一自然日之间的多个自然日;

如果是多个时间段,表示多个包含从某一自然日到另一自然日之间的多个自然日的时间段。

与现有技术相比,本发明包括以下优点:

本发明提出的一种基于时态推理的学术论文精准检索方法及系统,通过内容关键词检索获取符合条件的学术论文集合,提取学术论文的论文时态数据后,根据时间限定条件进行检索,从而获得对学术论文的精准检索,本发明可通过获取学术论文上的投稿日期、出版日期来进行时态推理,精准地获得用户想要检索的限定了特定时间点或时间段的学术论文集合。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所使用的附图做一简单地介绍。

图1是本发明的一种基于时态推理的学术论文精准检索系统的一个实施例的结构示意图。

图2是本发明的一种基于时态推理的学术论文精准检索方法的一个实施例的流程图。

图3是本发明的一种基于时态推理的学术论文精准检索方法的另一个实施例的流程图。

图4是本发明的一种基于时态推理的学术论文精准检索方法的又一个实施例的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本发明的一种基于时态推理的学术论文精准检索系统的一个实施例的结构示意图,如图2所示,所述基于时态推理的学术论文精准检索系统包括:

数据库单元1,所述数据库单元1包括存储模块,用于存储学术论文,并根据检索条件生成检索论文的存储模块,所述存储模块包括:第一存储模块、第二存储模块;

关键字搜索单元2,输入搜索关键字后,所述关键字搜索单元2自动在所述数据库单元1搜索相关关键字的学术论文,并将检索到的学术论文存放到数据库单元1的第一存储模块中;

时间信息提取单元3,所述时间信息提取单元3用于提取通过关键字检索后存储的学术论文的时间信息,所述时间信息包括:学术论文的投稿时间、学术论文的出版时间;

时间条件搜索单元4,输入时间条件后,所述时间条件搜索单元4自动在所述第一存储模块中按照事件条件搜索学术论文,并将符合条件的搜索结果存储在所述第二存储模块中。

所述时间条件搜索单元4的输入搜索条件包括两部分,分别为学术论文的投稿时间条件和学术论文的出版时间条件。

所述时间条件搜索单元4的输入搜索时间条件为时间点、多个时间点、时间段、多个时间段中的一种或多种。

所述时间条件搜索单元4输入搜索时间条件之间的关系包括:“与”的关系和“或”的关系;

所述“与”的关系表示为:aandb或a+b,所述a表示一个关键词组,b表示另一个关键词组;

所述“或”的关系表示为:aorb或ab,所述a表示一个关键词组,b表示另一个关键词组。

所述时间条件搜索单元4输入搜索时间条件为:

如果是时间点,表示某一自然日;

如果是多个时间点,表示多个自然日;

如果是时间段,表示从某一自然日到另一自然日之间的多个自然日;

如果是多个时间段,表示多个包含从某一自然日到另一自然日之间的多个自然日的时间段。

图2是本发明的一种基于时态推理的学术论文精准检索方法的一个实施例的流程图,如图2所示,所述基于时态推理的学术论文精准检索方法包括:

10,获取用户需要检索论文的内容关键词和时间限定条件;

20,通过内容关键词检索论文数据库中的所有学术论文,使得到的检索结果加入到第一学术论文集合,所述第一学术论文集合中的元素为学术论文数据库中所有符合内容关键词条件的学术论文;

30,从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据,所述学术论文的时态数据为第一学术集合中所有学术论文的时间特征的集合,包括论文投稿时间数据和论文出版时间数据,论文投稿时间数据为论文的投稿日,也即是学术论文完成撰写,已投送至杂志社、出版社、网站等可被公众知晓技术的媒体,但尚未被公众知晓的时间,论文出版时间数据为论文出版日,也即是学术论文完成向公众公开,并使公众能够以合法的手段获知论文全部技术数据的时间;

40,将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合;

50,将检索学术论文集合的论文作为检索结果输出至用户。

所述内容关键词为检索论文中的一个或多个关键词组,所述多个关键词组之间为“与”或“或”的关系,初始状态为“或”的关系,所述多个关键词组之间“与”的关系表示在检索论文中需同时满足多个词组的全部词组的检索,所述多个关键词组之间“或”的关系表示在检索论文中至少满足多个词组中的一个词组的检索,比如,学术论文检索内容关键词为“北京”、“上海”,如果是“与”的关系,则第一学术论文集合中的学术论文元素满足同时包含“北京”和“上海”两个关键词,如果是“或”的关系,则第一学术论文集合中的学术论文元素满足“北京”和“上海”两个关键词的人一个即可。

所述多个关键词组的“与”的关系表示为:aandb或a+b,所述a表示一个关键词组,b表示另一个关键词组,比如,学术论文检索内容关键词为“北京”、“上海”,其检索表达式可表示为:“北京and上海”,或者“北京+上海”。

所述多个关键词组的“或”的关系表示为:aorb或ab,所述a表示一个关键词组,b表示另一个关键词组,比如,学术论文检索内容关键词为“北京”、“上海”,其检索表达式可表示为:“北京or上海”,或者“北京上海”。

所述时间限定条件包括:论文投稿时间条件和/或论文出版时间条件,在设定时间限定条件时,可设置的时间段范围包括:

设定的时间段范围是学术论文的时态数据范围内的一段时间,此时,设置的时间段范围是全部有效的时间范围;

设定的时间段范围是学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是无效的时间范围,即无法检索到符合条件的学术论文;

设定的时间段范围是一部分为学术论文的时态数据范围内的一段时间、一部分学术论文的时态数据范围外的一段时间,此时,设置的时间段范围是部分有效时间范围,即只能在有效的时间段范围内检索到符合条件的学术论文。

所述论文投稿时间条件包括论文数据库中所有学术论文中投稿的一个或多个时间点或时间段的时间条件;

所述论文出版时间条件包括论文数据库中所有学术论文中出版的一个或多个时间点或时间段的时间条件;

所述论文投稿时间条件为出版单位收到学术论文并予以登记日期的时间条件;

所述论文出版时间条件表示学术论文公开并予以登记出版时间的时间条件。

所述时间点表示某一自然日,如果检索时间限定条件为:aa日bb时cc分dd秒或aa日bb时cc分或aa日bb时,则检索时间限定条件设置为aa日。

所述时间段的计算方法为:

如果为一日,则该日时间段为本日的自然日时间,在aa日00时00分00秒至aa日23时59分59秒范围内的检索时间限定条件的检索都是关于aa日的检索时间限定条件的检索;

如果为一月,则该一月时间段为本月的第一日至本月的最后一日的全部自然日时间;

如果为一年,则该一年时间段为本年的第一日至本年的最后一日的全部自然日时间;

如果为多日时间段,则表示为从该多日时间段的第一日至最后一日的全部自然日时间;

如果为多月时间段,则表示为从该多月时间段内的第一月的第一日至最后一月的最后一日的全部自然日时间;

如果为多年时间段,则表示为从该多年时间段内的第一年的第一月的第一日至最后一年的最后一月的最后一日的全部自然日时间;

上述日然日时间为从00时00分00秒至23时59分59秒之间的所有时间点的集合。

图3是本发明的一种基于时态推理的学术论文精准检索方法的另一个实施例的流程图,如图3所示,所述从第一学术论文集合中的每个论文提取与时间限定条件相关的时间数据,作为学术论文的时态数据包括:

101,从第一学术论文集合中,提取论文的时间信息,所述论文的时间信息包括:论文投稿时间信息和出版时间信息;

102,根据论文投稿时间信息,将第一学术论文集合中的符合论文投稿时间信息条件的元素加入到第二学术论文集合;

103,根据论文出版时间信息,将第一学术论文集合中的符合论文出版时间信息条件的元素加入到第三学术论文集合。

图4是本发明的一种基于时态推理的学术论文精准检索方法的又一个实施例的流程图,如图4所示,所述将第一学术论文集合中的每个论文对应的论文时态数据与时间限定条件进行比较,选择论文时态数据符合时间限定条件的论文加入到检索学术论文集合包括:

201,设定检索的论文投稿时间条件,在所述第二学术论文集合中检索出符合论文投稿时间条件的元素加入第四学术论文集合,所述第四学术论文集合为符合论文投稿时间条件的论文的集合;

202,设定检索的论文出版时间条件,在所述第三学术论文集合中检索出符合论文出版时间条件的元素加入第五学术论文集合,所述第五学术论文集合为符合论文出版时间条件的论文的集合;

203,判断论文投稿时间条件与论文出版时间条件的关系;

204,如果是“与”的关系,则将第四学术论文集合与第五学术论文集合的交集中的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据既符合论文投稿时间条件,又符合论文出版时间条件;

205,如果是“或”的关系,则将第四学术论文集合与第五学术论文集合的并集的元素加入到检索学术论文集合,所述检索数据论文集合中的论文的时态数据符合论文投稿时间条件或论文出版时间条件中的至少一个。

以上对本发明所提供的一种基于时态推理的学术论文精准检索方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1