一种语用关键词检索方法与装置的制作方法

文档序号:6373701阅读:193来源:国知局
专利名称:一种语用关键词检索方法与装置的制作方法
技术领域
本发明涉及计算机及通信领域,特别是涉及信息检索中语用关键词检索的方法及
>J-U ρ α装直。
背景技术
搜索服务是组织互联网信 息通讯的基本枢纽。但是,由于目前的全文关键字检索并未对检索关键词进行语义功能和语用功能区分,直接导致了检索效率低下。例如如果用户输入同一检索关键字词“NBA篮球比赛直播时间”,实际上存在着两种截然不同的应用功能需求。一种需求是想检索到与“NBA篮球比赛直播时间”相关的所有信息,这时,“时间” 一词是揭示目标信息主题的“语义关键词”。另一种需求则是只想检索到NBA篮球比赛直播的具体时间,如“NBA篮球比赛直播9-30-20:30”,这时,“时间” 一词则是指示“9-30-20:30”等类似信息的功能与效用的语用关键词。显然,用户输入同一检索关键词的这两种不同应用功能需求,所指向的目标信息有巨大差别。并且,后一种检索需求的应用频率要远高于前一种需求。由于现有搜索服务只做关键词字符匹配和按关键词命中率排序,不做语义关键词和语用关键词的区别检索,严重影响了全文关键字检索的效率与质量。因此,正确判别检索关键词是语用关键词还是语义关键词,实现语义关键词和语用关键词的区别检索,对改善信息检索效率具有重要应用价值。本发明提供一种语用关键词检索方法,以提闻关键字检索效率。以下结合实施例进一步说明本发明。图I : 一种语用关键词检索主流程2 :语用关键词列表示意3 :—种语用关键词检索的附加流程4 :语用关键词固定搭配提示示意5 :—种语用关键词检索的附加流程图2图6 :相关装置结构图

发明内容
本发明实施例提供一种语用关键词检索方法,以提闻关键字检索效率。一种语用关键词检索方法,用于提高关键字检索效率,其包括以下步骤获取用户输入的检索关键词;在检索关键词后添加冒号“”或,先用检索关键词匹配语用关键字词表中的语用关键词,对匹配成功的关键词添加冒号;用关键词紧跟冒号的固定搭配,或者,用紧跟冒号的语用关键词固定搭配匹配发布信息中的关键词;如果匹配成功,则判别该语用关键词后是否有信息;
如果有,则调用并显示该语用关键词匹配成功的对应信息。一种用于语用关键词检索装置,包括语用关键字词典模块,用于存储可以具有语用功能的关键词;匹配模块1,用于将用户输入的关键词匹配语用关键字词典中的语用关键词;匹配模块2,用于语用关键 词加冒号的固定搭配与发布信息关键词匹配;接口模块,用于调用和显示匹配成功的语用关键词对应的信息。
具体实施例方式本发明中的“语用关键词”,是指指示主题词相关信息的功能与效用的关键词。其说明实例见背景技术介绍。参见

图1,本实施例提供语用关键词检索方法,其主要方法流程如下步骤101 :获取用户输入的检索关键词;步骤102 :在检索关键词后添加标点符号冒号“”或,先用检索关键词匹配语用关键字词表(见图表2)的语用关键词,匹配成功后再对该关键词添加冒号;图2中的“语用关键词分类”用于语用关键词分类导航,图2中的“语用关键词”是统计语用关键词应用结果产生的语用关键词,并且该词表中仅收录可以有语用功能的关键
ο步骤103 :用在关键词后紧跟冒号的关键词固定搭配匹配发布信息中的关键词;大多数情况下,用户在发布语用关键词后会紧跟有冒号“”,而检索关键词时则一般不会输入冒号,因此,在检索关键词后自动添加冒号进行检索,有助于判别发布信息中的关键词是语用关键词还是语义关键词。但是,关键词紧跟冒号时有三种基本含义一种是冒号前的关键词在表达信息;例如“张三说……”,或者,冒号后的内容是冒号前关键词的语义描述,例如“NBA ‘美国职业篮球赛’的缩写”;或者,冒号前的关键字是冒号后内容的功能与效用指示词,例如“NBA篮球比赛直播时间9-30-20:30”中的“时间”。因此,仅自动添加冒号进行检索,效果仍不理想。但是,并不是所有关键词都可以作为语用关键词使用,如大多数名词都不会作为语用关键词使用,因此,要想进一步判断用户发布的关键词是语义关键词还是语用关键词,除了判断关键词后是否紧跟冒号之外,还可以建立一个语用关键词词表,先用用户输入关键词匹配语用关键词表,匹配成功的关键词再添加冒号,以进一步提高判别用户输入的检索关键词是语用关键词还是语义关键词的效率。步骤104 :如果匹配成功,则判断该语用关键词后是否有信息;步骤105 :如果有,则调用并显示该语用关键词的对应信息。由于语用关键词也可以作为语义关键词使用,并且语义关键词在文本中的出现频率要远高于语用关键词的出现频率,因此,如果语用关键词匹配成功,可不计算该文件中该关键词的出现频率,直接判别该语用关键词后是否有信息,以进一步提高语用关键词检索效率。以上方法有助于区分同一检索关键词是语义关键词和语用关键词,再通过在检索结果中语用关键词优先排序等方法,可以提高关键字的目标信息检索效率。
以上步骤虽然可以改善关键词检索效率,但是,仍然不能明确判断用户输入的检索关键词是语义关键词还是语用关键词。因此,为了进一步提高关键词的检索效率,还可以加入以下步骤。参见图3 :进一步提闻关键词匹配效率的方法,其步骤如下步骤301 :获取用户输入的检索关键词;步骤302 :用检索 关键词匹配语用关键字词表中的关键词(如图2);步骤303 :判断检索关键词匹配语用关键字词表中的关键词是否成功;步骤304 :如果成功,则在用户输入检索关键词时加入提示语,例如,加入提示语为“是否需要加冒号“”、“加一个冒号试试”……,或者,将已加入冒号的语用关键词固定搭配直接显示在关键词检索的辅助提示框中(参见图4);图4是提供检索服务时的人机交互输入界面示意图。该图的最上行为检索关键字输入栏,以下为检索关键词提不栏,检索关键词提不栏中的“广品说明”是显不在关键词检索的辅助提示框中的语用关键词固定搭配示例。步骤305 :判断检索关键词是否添加了冒号,或,选用了紧跟冒号的关键词的;步骤306 :是,则将此关键词和冒号作为语用关键词固定搭配在发布信息的关键词中进行匹配;否,则将此关键词作为不区分语义、语用功能的关键字符号在发布信息的关键词中进行匹配。步骤301-306在步骤101-105基础上,通过对用户输入关键字冒号的人机交互确认,更为明确地判断用户输入检索关键字需要的是语用功能还是语义功能,但是,由于语用关键词总是和指示检索主题的语义关键词搭配应用,在没有语义关键词匹配成功的前提下,语用关键词匹配成功将检索到大量信息,并且其实用价值并不大。因此,为了更进一步提高关键词检索效率,还可以提供以下步骤(参见图4)步骤401 :在执行步骤101-105或301-306之前或后,判断用户输入的若干检索关键词中是否有其它关键词在同一文件中匹配成功;步骤401中的“其它关键词”是指关键词检索中的语义主题词,如“NBA篮球比赛直播时间”中的“NBA篮球比赛”。步骤402 :如果有,则进一步执行步骤101-105或301-306,如果没有,则可以不再执行步骤101-105或301-306,或,将该关键词不区分语义和语用功能进行符号匹配检索。本发明通过以上步骤可以有效区分关键词检索中的语义关键词检索和语用关键词检索,对提高信息检索效率具有明确而显著的作用。一种用于语用关键词和标点符号的组合检索装置(参见图5),包括语用关键字词典模块,用于存储可以具有语用功能的关键词;匹配模块1,用于将用户输入的关键词匹配语用关键字词典中的语用关键词;匹配模块2,用于语用关键词加冒号的固定搭配与发布信息关键词匹配;接口模块,用于调用和显示匹配成功的语用关键词对应的信息。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流 程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明 的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种语用关键词检索方法,其特征在于,包括以下步骤 获取用户输入的检索关键词; 在检索关键词后添加冒号“”或,先用检索关键词匹配语用关键字词表中的语用关键词,对匹配成功的关键词添加冒号; 用关键词紧跟冒号的固定搭配,或者,用紧跟冒号的语用关键词固定搭配匹配发布信息中的关键词; 如果匹配成功,则判别该语用关键词后是否有信息; 如果有,则调用并显示该语用关键词匹配成功的对应信息。
2.根据权利要求I的一种语用关键词检索方法,其特征在于,包括以下步骤 获取用户输入的检索关键词; 用检索关键词匹配语用关键字词表中的关键词; 判断检索关键词匹配语用关键字词表中的关键词是否成功; 如果成功,则在用户输入检索关键词时加入提示语,或者,将已加入冒号 的语用关键词直接显示在关键词检索的辅助提示框中; 判断检索关键词是否添加或选用了紧跟关键词的冒号; 是,则将此关键词和冒号作为语用关键词固定搭配在发布信息中进行匹配;否,则将此关键词作为不区分语义、语用功能的关键字进行模糊检索。
3.根据权利要求I和2的一种语用关键词检索方法,其特征在于,包括以下步骤 在执行步骤101-105或301-306之前或后,判断用户输入的若干检索关键词中是否有其它关键词在同一文件中匹配成功; 如果有,则进一步执行步骤101-105或301-306,如果没有,则将该关键词不区分语义和语用功能进行符号匹配检索。
4.根据权利要求I的一种语用关键词检索的装置,其特征在于,包括语用关键字词典模块、匹配模块I、匹配模块2、接口模块。
5.根据权利要求4的一种语用关键词检索的装置,其特征在于,其语用关键字词典模块用于存储可以具有语用功能的关键词。
6.根据权利要求4的一种语用关键词检索的装置,其特征在于,匹配模块I用于将用户输入的关键词匹配语用关键字词典中的语用关键词。
7.根据权利要求4的一种语用关键词检索的装置,其特征在于,匹配模块2用于语用关键词加冒号的固定搭配与发布信息关键词匹配。
8.根据权利要求4的一种语用关键词检索的装置,其特征在于,接口模块用于调用和显示匹配成功的语用关键词对应的信息。
全文摘要
本发明公开了一种语用关键词检索方法,用于实现语义关键词和语用关键词的区别检索,以满足在使用关键词检索时需要区分语义关键词和语用关键词的需求,达到提高关键字检索效率的目的。
文档编号G06F17/30GK102880632SQ20121025656
公开日2013年1月16日 申请日期2012年7月24日 优先权日2012年7月24日
发明者刘莎 申请人:刘莎
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1