一种基于经验知识的智能检索方法与流程

文档序号:12465426阅读:216来源:国知局

本发明涉及一种电数字数据处理领域,更具体而言,涉及一种基于经验知识的智能检索方法。



背景技术:

随着社会工业化、信息化水平的不断提高,如今数据已取代计算成为信息计算的中心,互联网、云计算、大数据正在成为一种趋势和潮流。如今,互联网已经成为人们获取信息的最重要途径,海量有价值的信息和知识都蕴藏在网络资源中。然而,网络资源的爆炸性增长可谓利弊双生,既为用户带来越来越丰富的信息,同时用户精确所需的相关知识的获取难度却在增加。如何从大量的网络信息中快速地、高效地提取出有用的信息已经成为当今信息检索中最重要的任务。

现有技术中,存在有多个检索引擎,以试图解决了这些问题,例如百度、谷歌、搜狗、必应等。作为信息检索的重要工具,它们已经成为用户体验互联网、获取信息的主要途径,方便了人们在互联网上获得所需的信息。当用户需要通过检索获取所需的信息时,往往对检索结果满意度不够高。比如用户想要知道中华的信息,通过检索后,往往会出现中华牙膏、中华铅笔、中华映管、中华香烟等,而不全是用户真正想要的信息,这样用户甄别信息特别费时间。在计算机的技术领域中,经验是从多次实践中得到的知识或技能;智能检索以文献和检索词的相关度为基础,综合考查文献的重要性等指标,对检索结果进行排序,以提供更高的检索效率,这样的结果排序更加准确,更能将与用户愿望最相关的文献排到最前面,提高检索效率。所以现实中迫切需要一种基于经验知识的智能检索方法,既能提高检索速度和效率,也能提高查准率和查全率。



技术实现要素:

本发明的目的之一是提供一种基于经验知识的智能检索方法,既能提高检索速度和效率,也能提高查准率和查全率,使得检索结果更有针对性,更为准确。

本发明为解决上述技术问题而采取的技术方案为:一种基于经验知识的智能检索方法包括:用户从客户端输入并发送检索请求;接收端确定是否调用历史信息和记录;接收端分割检索请求;接收端根据经验分析客户端的用户检索目的;接收端进行检索;根据相关程度从高至低依次显示检索结果。

根据本发明的另一个方面,在步骤S1中,用户从客户端输入并发送检索请求之后,进一步执行步骤S11:接收端中的用户界面与客户端的用户进行交互并获取用户标识信息。

根据本发明的另一个方面,接收端中的用户界面与客户端的用户进行交互并获取用户标识信息的步骤S11进一步包括:在步骤S111中,接收端通过用户界面向客户端的用户发送查询:客户端的用户在此次检索之前是否与接收端进行过检索请求交互,如果是,执行步骤S112,否则执行S113;在步骤S112中,直接获取用户的标识信息,向接收端返回首次检索的消息;在步骤S113中,直接获取用户的标识信息,向接收端返回非首次检索的消息。

根据本发明的另一个方面,在步骤S2中,接收端确定是否调用历史信息和记录进一步包括步骤:步骤S21,如果接收端根据用户交互返回的是否首次检索的消息,确定是否调用历史信息和记录,则执行步骤D23;步骤S22,如果接收端直接根据检索请求的附带信息解析出客户端的用户的标识信息,确定是否调用历史信息和记录,则执行步骤D24;步骤S23,如果是首次检索则调用历史信息和记录,否则不调用历史信息和记录;步骤S24,如果标识信息与历史信息和记录中的项匹配,则调用,否则不调用。

根据本发明的另一个方面,在步骤S3中,接收端分割检索请求进一步包括:将检索请求S划分成一个或多个子请求si,i是正整数,其中S={s1,……,si,……,sP},P为子请求个数,是正整数。

根据本发明的另一个方面,在步骤S4中,接收端根据经验分析客户端的用户检索目的进一步包括:步骤S41,接收端中的调用模块调用历史信息和记录;步骤S42,接收端中的分词划分和分类模块将调用历史信息和记录中的源数据进行分词划分,得到分词的频次和源数据的类型;步骤S43,接收端中的目的分析模块根据历史信息和记录、分词的频次和源数据的类型,对检索请求S中的一个或多个子请求si进行目的值计算;步骤S44,接收端中的检索模块将子请求与源数据进行匹配,并根据子请求在单位源数据的不同部分的匹配频次以及目的值和源数据的类型,统计单个源数据的相关程度Mij,其中其中Q是单位源数据的不同部分总数,m1j表示在单位源数据的第j个部分匹配的数量,而w1j表示单位源数据的第j个部分的权重,m2表示目的值,而w2表示目的值的权重,m3表示源数据的类型的标签值,而w3表示源数据的类型的权重。

根据本发明的另一个方面,步骤S43中的计算方式为:先计算每个子请求si的目的值,然后计算所有子请求si的目的值的总和,之后判断每个子请求si之间的关系,如果属于相同类别则在总和基础上加分,否则减分,如果最终的总和大于第二阈值则选择最高的作为目的并添加标签。

根据本发明的另一个方面,在步骤S5中,接收端进行检索进一步包括:步骤S51,基于子请求si,语义扩展模块进行有效扩展。

根据本发明的另一个方面,语义扩展模块进行有效扩展的步骤S51进一步包括:步骤S511:语义扩展模块的第一模块分析子请求si,确定用户请求的语义,关联到确定的概念或对象;步骤S512,语义扩展模块向同义词/近义词语义数据库发出调用请求,该调用请求包括子请求si的信息;步骤S513,同义词/近义词语义数据库在遍历之后返回调用响应;步骤S514,语义扩展模块接收调用响应,并发送给接收端;另外可根据需要添加子请求si的多种语言表达方式和/或其上位概念和下位概念。

根据本发明的另一个方面,在步骤S6中,根据相关程度从高至低依次显示检索结果。根据单个源数据的相关程度Mij进行统计排序,根据相关程度从高至低依次显示检索结果。

附图说明

在附图中通过实例的方式而不是通过限制的方式来示出本发明的实施例,其中相同的附图标记表示相同的元件,其中:

根据本发明的示范性实施例,图1图示一种基于经验知识的智能检索方法的流程图。

具体实施方式

在下面的描述中,参考附图并以图示的方式示出几个具体的实施例。将理解的是:可设想并且可做出其他实施例而不脱离本公开的范围或精神。因此,以下详细描述不应被认为具有限制意义。

根据本发明的示范性实施例,图1图示一种基于经验知识的智能检索方法的流程图。该基于经验知识的智能检索方法包括:

在步骤S1中,用户从客户端输入并发送检索请求;

在步骤S2中,接收端确定是否调用历史信息和记录;

在步骤S3中,接收端分割检索请求;

在步骤S4中,接收端根据经验分析客户端的用户检索目的;

在步骤S5中,接收端进行检索;以及

在步骤S6中,根据相关程度从高至低依次显示检索结果。

优选地,在步骤S1中,该客户端为移动终端,其通过无线链路与接收端进行通信并进行检索。可替代地,在步骤S1中,该客户端为计算机,包括而不限于台式机、膝上型电脑、便携式笔记本、上网本、平板电脑等,其通过有线链路或无线链路与接收端进行通信并进行检索。

优选地,在步骤S1中,用户从客户端输入并发送检索请求之后,进一步执行步骤S11:接收端中的用户界面与客户端的用户进行交互并获取用户标识信息。优选地,接收端中的用户界面与客户端的用户进行交互并获取用户标识信息的步骤S11进一步包括:在步骤S111中,接收端通过用户界面向客户端的用户发送查询:客户端的用户在此次检索之前是否与接收端进行过检索请求交互,如果是,执行步骤S112,否则执行S113;在步骤S112中,直接获取用户的标识信息,向接收端返回首次检索的消息;在步骤S113中,直接获取用户的标识信息,向接收端返回非首次检索的消息。

具体地,本文所述的标识信息可以是任何可以标识客户端的用户的特征/属性的信息;优选地,该标识信息例如可以是IP地址,固定/移动电话号码,解析的地理位置,网络接入注册账号等等。

优选地,在步骤S2中,接收端确定是否调用历史信息和记录进一步包括步骤:步骤S21,如果接收端根据用户交互返回的是否首次检索的消息,确定是否调用历史信息和记录,则执行步骤D23;步骤S22,如果接收端直接根据检索请求的附带信息解析出客户端的用户的标识信息,确定是否调用历史信息和记录,则执行步骤D24;步骤S23,如果是首次检索则调用历史信息和记录,否则不调用历史信息和记录;步骤S24,如果标识信息与历史信息和记录中的项匹配,则调用,否则不调用。

优选地,在步骤S3中,接收端分割检索请求进一步包括:将检索请求S划分成一个或多个子请求si,i是正整数,其中当检索请求为最小可检索单元时,si的数量为一个,否则为多个,其中S={s1,……,si,……,sP},P为子请求个数,是正整数。

优选地,在步骤S4中,接收端根据经验分析客户端的用户检索目的进一步包括:

步骤S41,接收端中的调用模块调用历史信息和记录;

步骤S42,接收端中的分词划分和分类模块将调用历史信息和记录中的源数据进行分词划分,得到分词的频次和源数据的类型;

步骤S43,接收端中的目的分析模块根据历史信息和记录、分词的频次和源数据的类型,对检索请求S中的一个或多个子请求si进行目的值计算;优选地,该计算方式为:先计算每个子请求si的目的值,然后计算所有子请求si的目的值的总和,之后判断每个子请求si之间的关系,如果属于相同类别则在总和基础上加分,否则减分,如果最终的总和大于第二阈值则选择最高的作为目的并添加标签。例如,如果根据前述步骤得到源数据的类型有光电技术、企业、台湾等类型;如果输入的是映管显示,其子请求为映管和显示,各自具有一定的目的值,另,因映管和显示属于相同类别,所以在各自目的值上加分,最终各项结算后会发现光电技术这一类型目的值最高,所以选其作为目的并添加相应标签;如果输入的是中华映管,其子请求为中华和映管,各自具有一定的目的值,另,因中华和映管属于不同类别,所以在各自目的值上减分,最终各项结算后会发现台湾或企业这一类型目的值最高,所以选其作为目的并添加相应标签。

步骤S44,接收端中的检索模块将子请求与源数据进行匹配,并根据子请求在单位源数据的不同部分的匹配频次以及目的值和源数据的类型,统计单个源数据的相关程度Mij,其中其中Q是单位源数据的不同部分总数,m1j表示在单位源数据的第j个部分匹配的数量,而w1j表示单位源数据的第j个部分的权重,m2表示目的值,而w2表示目的值的权重,m3表示源数据的类型的标签值,而w3表示源数据的类型的权重。

优选地,在步骤S5中,接收端进行检索进一步包括:步骤S51,基于子请求si,语义扩展模块进行有效扩展。

优选地,语义扩展模块进行有效扩展的步骤S51进一步包括:步骤S511:语义扩展模块的第一模块分析子请求si,确定用户请求的语义,关联到确定的概念或对象;步骤S512,语义扩展模块向同义词/近义词语义数据库发出调用请求,该调用请求包括子请求si的信息;步骤S513,同义词/近义词语义数据库在遍历之后返回调用响应;步骤S514,语义扩展模块接收调用响应,并发送给接收端。优选地,语义扩展模块在接收调用响应之后、发送给接收端之前,通过语义扩展模块的第二模块将子请求si用多种语言表达方式进行扩展,并与同义词/近义词语义数据库发送的调用响应一起打包发送给接收端。优选地,语义扩展模块在接收调用响应之后、发送给接收端之前,通过语义扩展模块的第三模块将子请求si用其上位概念和下位概念进行扩展,并与同义词/近义词语义数据库发送的调用响应(和多种语言表达方式,如果有必要的话)一起打包发送给接收端。

优选地,在步骤S6中,根据相关程度从高至低依次显示检索结果。根据单个源数据的相关程度Mij进行统计排序,根据相关程度从高至低依次显示检索结果。

综上,在本发明的技术方案中,通过采用了一种基于经验知识的智能检索方法,既能提高检索速度和效率,也能提高查准率和查全率,使得检索结果更有针对性,更为准确。

将理解的是:可以硬件、软件或硬件和软件的组合的形式实现本发明的示例和实施例。如上所述,可存储任何执行这种方法的主体,以易失性或非易失性存储的形式,例如存储设备,像ROM,无论可擦除或可重写与否,或者以存储器的形式,诸如例如RAM、存储器芯片、设备或集成电路或在光或磁可读的介质上,诸如例如CD、DVD、磁盘或磁带。将理解的是:存储设备和存储介质是适合于存储一个或多个程序的机器可读存储的示例,当被执行时,所述一个或多个程序实现本发明的示例。经由任何介质,诸如通过有线或无线连接载有的通信信号,可以电子地传递本发明的示例,并且示例适当地包含相同内容。

应当注意的是:因为本发明解决了既能提高检索速度和效率,也能提高查准率和查全率,使得检索结果更有针对性,更为准确的技术问题,采用了计算机技术领域中技术人员在阅读本说明书之后根据其教导所能理解的技术手段,并获得了既能提高检索速度和效率,也能提高查准率和查全率,使得检索结果更有针对性,更为准确的有益技术效果,所以在所附权利要求中要求保护的方案属于专利法意义上的技术方案。另外,因为所附权利要求要求保护的技术方案可以在工业中制造或使用,因此该方案具备实用性。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应包涵在本发明的保护范围之内。除非以其他方式明确陈述,否则公开的每个特征仅是一般系列的等效或类似特征的一个示例。因此,本发明的保护范围应该以权利要求书的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1