一种智能语义检索系统和方法

文档序号:8430826阅读:419来源:国知局
一种智能语义检索系统和方法
【技术领域】
[0001] 本发明涉及通信技术领域,特别涉及一种智能语义检索系统和方法。
【背景技术】
[0002] 现有技术的电子商务领域中,电子商务网站提供给用户的商品检索的方式多为关 键词检索,其类似于百度或GOOGLE等检索引擎的检索模式。这种基于关键词的检索模式虽 然能最大限度满足对检索结果的召回率,但是准确率却不高。用户在使用这种检索模式进 行检索时,为了找到想要查询的商品,不得不一次次更换关键词,或者是采用人工从浏览的 方式从大量的检索结果中查找想要的商品。因此,这种检索方式增加了用户操作的复杂度, 降低了用户的检索体验。尽管大多数电商网站和购物平台对提供的检索引擎都会提供排序 的优化,但是由于用户输入的多样性,很难解析出用户真正的语义意图,识别出用户检索商 品的关键彳目息。
[0003] 目前商品检索类方法基本采取基于关键词的检索方式,某些面向商品的语义检索 引擎也只是针对输入端作了部分优化,通过将自然语言输入采取分词等方式,及相应信息 抽取技术,抽取出相应关键词,然后利用语法分析引擎对分词结果进行理解和过滤,最后将 获得的商品相关的关键词提交检索查询器,最终返回查询结果。但是这类商品语义检索的 解决方案,仅限于对输入语句进行浅层的语义分析,通常只是利用了分词结果,及去除无关 联的停用词来抽取相关商品的关键信息或者基于统计处理某些高频词核心词的抽取。但这 种方式并没有结合句子本事的语义表征及某些概念的背景信息分析输入语句,因此对于某 些语音输入的过长语句或者说某些输入的带有歧义的语句不能进行很好的处理。例如,用 户输入自然语言:"我要买个抱枕作为生日礼物送给爸爸",传统方式很难准确把握这句话 的意图。再例如,用户输入自然语言"4G的ASUS平板电脑",现有的检索工具不能很好的 把握商品属性值一4G是网络制式、硬盘大小、内存大小中哪个商品属性的属性值。

【发明内容】

[0004] 本发明所要解决的技术问题是提供一种更加智能化的理解用户输入的检索语句, 检索结果具有更高准确率的智能语义检索系统和方法。
[0005] 本发明解决上述技术问题的技术方案如下:一种智能语义检索系统,包括知识库、 知识管理模块、规则生成模块、信息抽取模块、验证模块、意图生成模块和对话模块;
[0006] 所述知识库,用于存储知识图谱,所述知识图谱包括商品的属性及其属性值以及 商品属性值之间的映射关系;
[0007] 所述知识管理模块,用于加载知识图谱,并通过增、改、删、查的方式对所述知识图 谱进行管理;
[0008] 所述规则生成模块,用于根据知识图谱中商品属性值或商品属性值和商品属性值 之间的映射关系生成抽取规则;
[0009] 所述信息抽取模块,用于获取用户输入的自然语言,将抽取规则与用户输入的自 然语言进行匹配,生成结构化知识;
[0010] 所述验证模块,用于调取知识图谱,将知识图谱与结构化知识进行比对,根据比对 结果生成验证结果;
[0011] 所述意图生成模块,用于检测验证结果中的商品属性的取值是否有歧义,如果是, 则将验证结果发送至对话模块,如果否,则根据验证结果生成商品列表,作为最终检索结果 并输出;
[0012] 所述对话模块,用于根据有歧义的验证结果生成提示语句,并输出提示语句,提示 语句用于提示用户重新输入自然语言。
[0013] 本发明的有益效果是:一方面,本发明的语义检索系统能够更加智能化的理解用 户输入的检索语句,检索结果具有更高准确率。另一方面,当系统对用于输入的检索词理解 有歧义时,系统根据用户个人历史数据矫正检索结果,对于自我矫正后仍有歧义的检索结 果,系统根据有歧义的检索结果生成提示语句,提示用户重新输入检索词,这样避免了用户 在不知自己检索词哪里出问题的情况下一次次输入不合适的检索词,提高了检索效率。
[0014] 在上述技术方案的基础上,本发明还可以做如下改进。
[0015] 进一步,一种智能语义检索系统,还包括个性化历史记录库,所述个性化历史记录 库,用于存储个性化历史记录,所述个性化历史记录为个体用户进行智能语义检索时,输入 的自然语言与生成的最终检索结果的映射关系的记录;
[0016] 所述验证模块,还调取个性化历史记录,将个性化历史记录与结构化知识进行比 对,根据比对结果生成验证结果。
[0017] 进一步,一种智能语义检索系统,所述知识图谱以OWL配置文件的形式存储,包括 基础配置表和规则配置表,所述基础配置表存储根据电子商务网站的约束规则生成的商品 的属性及其对应的属性值,所述规则配置表存储商品属性值之间的映射关系。
[0018] 进一步,一种智能语义检索系统,所述验证模块包括第一消歧单元和第二消歧单 元;
[0019] 所述第一消歧单元,用于调取知识图谱,将知识图谱与结构化知识进行第一次比 对,如果比对结果为一致,则将第一次比对后的结构化知识发送给第二消歧单元;如果比对 结果为不一致,则将所述结构化知识进行第一次消歧处理,并将第一次消歧处理后的结果 作为验证结果并输出;
[0020] 所述第二消歧单元,用于调取个性化历史记录,将所述个性化历史记录与第一次 比对的结构化知识进行第二次比对;如果第二次比对结果为一致,则将第二次比对后的结 构化知识作为验证结果并输出;如果第二次比对结果不一致,则将其进行第二次消歧处理 后作为验证结果并输出。
[0021] 进一步,一种智能语义检索系统,所述意图生成模块包括交叉检测单元和映射检 测单元;
[0022] 所述交叉检测处理单元,用于根据用户输入的自然语言中文字的字符定位判断验 证结果是否有交叉,如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证 结果进行修正,将修正后的结果生成商品列表,作为最终检索结果并输出,如果判定验证结 果无交叉,则将所述验证结果发送至映射检测单元;
[0023] 所述映射检测单元,用于检测验证结果中的商品属性的取值是否映射正确,如果 是,则根据验证结果生成商品列表,作为最终检索结果并输出;如果否,则将验证结果发送 至对话模块。
[0024]-种智能语义检索方法,包括以下步骤:
[0025] 步骤1 :从知识库中加载知识图谱,所述知识图谱包括商品的属性及其属性值以 及商品属性值之间的映射关系;
[0026] 步骤2 :从加载完成的知识图谱中提取商品属性值,根据商品属性值或商品属性 值和商品属性值之间的映射关系生成抽取规则;
[0027] 步骤3 :获取用户输入的自然语言,将抽取规则与用户输入的自然语言进行匹配, 生成结构化知识;
[0028] 步骤4:调取知识图谱,将知识图谱与结构化知识进行比对,根据比对结果生成验 证结果;
[0029] 步骤5 :检测验证结果中的商品属性的取值是否有歧义,如果是,则执行步骤6;如 果否,则根据验证结果生成商品列表,作为最终检索结果并输出,结束检索流程;
[0030] 步骤6 :根据有歧义的验证结果生成提示语句,并输出提示语句;
[0031] 步骤7:再次获取用户重新输入的自然语言,并执行步骤3。
[0032] 进一步,一种智能语义检索方法,步骤3还包括调取个性化历史记录,将个性化历 史记录与结构化知识进行比对,根据比对结果生成验证结果;所述个性化历史记录为个体 用户进行智能语义检索时,输入的自然语言与生成的最终检索结果的映射关系的记录。
[0033] 进一步,一种智能语义检索方法,所述步骤1还包括:在知识库中预先存储知识图 谱;所述知识图谱以OWL配置文件的形式存储,包括基础配置表和规则配置表,所述基础配 置表存储根据电子商务网站的约束规则生成的商品的属性及其对应的属性值,所述规则配 置表存储商品属性值之间的映射关系。
[0034] 进一步,一种智能语义检索方法,所述步骤4具体为:
[0035] 步骤41:调取知识图谱,将知识图谱与结构化知识进行第一次比对,如果比对结 果为一致,则执行步骤42;如果比对结果为不一致,则将所述结构化知识进行第一次消歧 处理,并将第一次消歧处理后的结果作为验证结果并输出,执行步骤5;
[0036] 步骤42:调取个性化历史记录,将所述个性化历史记录与第一次比对后的结构化 知识进行第二次比对,如果第二次比对结果为一致,则将第二次比对后的结构化知识作为 验证结果并输出,执行步骤5;如果第二次比对结果不一致,则将其进行第二次消歧处理后 作为验证结果并输出,执彳丁步骤5。
[0037] 进一步,一种智能语义检索方法,所述步骤5具体为:
[0038] 步骤51 :根据用户输入的自然语言中文字的字符定位判断验证结果是否有交叉, 如果判定验证结果有交叉,根据用户输入的自然语言对有交叉的验证结果进行修正,将修 正后的结果生成商品列表,作为最终检
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1