一种问句匹配方法和计算设备与流程

文档序号:22627736发布日期:2020-10-23 19:36阅读:来源:国知局

技术特征:

1.一种问句匹配方法,适于计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个用户意图的特征匹配模式,每个特征匹配模式包括用于描述该用户意图的至少一个槽位所构成的链条以及链条的成链条件,每个槽位包括至少一个语料词或者至少一个限制条件,所述方法包括步骤:

对用户的输入语句进行实体识别,得到一个或多个实体;

基于实体识别结果提取所述输入语句的语义特征,所述语义特征包括语句长度特征、实体词特征和除实体词之外的辅助词特征;

基于所述语义特征确定多个候选链条,所述候选链条为语义特征满足成链条件的链条;

基于所述语义特征对多个候选链条进行槽位匹配,确定与所述输入语句最匹配的目标链条;以及

结合所述语义特征和所述目标链条的用户意图,查找对应的答案语句反馈给用户。

2.如权利要求1所述的方法,其中,所述链条包括以下至少一种槽位类型:

正向槽位,代表输入语:句的用户意图期望查找该槽位中的实体;

负向槽位,代表输入语句的用户意图不期望查找该槽位中的实体;

函数槽位,代表所述输入语句所应满足的限制条件;

正则槽位,用于将模糊的数值表示转换为由两个实体表示的实体区间;

或集合槽位,代表输入语句中只需满足该槽位中的任一语料词;

与集合槽位,代表输入语句需要同时满足该槽位中的所有语料词。

3.如权利要求1或2所述的方法,其中,

所述用户意图包括查询产品、产品对比、查询口碑、查询配置、查询价格中的至少一种;

所述成链条件包括所应包含的关键词、不应包含的关键词、原句长度区间、历史对话和当前对话的对话场景、实体个数中的至少一种。

4.如权利要求1-3中任一项所述的方法,其中,

所述实体词特征包括实体名、实体类型、有效实体个数;

所述语句长度特征包括原句长度、去掉实体词之后的语句长度、有效实体占原句的比例;

所述限制条件包括去除实体词之后的语句最大长度、完成槽位匹配后的剩余实体最大个数、所应包含的正则匹配词、不应包含的正则匹配词。

5.如权利要求1-4中任一项所述的方法,还包括每类用户意图的链条生成步骤:

从语料库中提取多条语料,确定每条语料的用户意图;

基于每类用户意图的多条语料,提取各类用户意图之间的通用词和特殊词;以及

基于该通用词和特殊词生成每类用户意图的多个语料词,并将该多个语料词填入到对应链条的多个槽位中。

6.如权利要求5所述的方法,其中,所述链条生成步骤还包括:

提取多个链条之间的共有槽位和独有槽位,生成每个槽位的槽位索引,并记录每个链条所包含的槽位索引。

7.如权利要求6所述方法,其中,所述基于所述语义特征确定多个候选链条的步骤包括:

确定所述语义特征中的关键实体所对应的槽位索引,并从记录中查找包含该槽位索引的链条,并将其中语义特征满足成链条件的链条作为所述候选链条。

8.如权利要求1-7中任一项所述的方法,其中,所述对多个候选链条进行槽位匹配的步骤包括:

依次基于该语义特征对每个候选链条的槽位进行匹配,其中,如果所述语义特征满足槽位要求,则代表槽位匹配,反之则不匹配;

统计各候选链条的匹配槽位数目,并计算各候选链条的匹配完整度;

选取达标范围内的匹配完整度最高的候选链条作为所述目标链条。

9.一种计算设备,包括:

存储器;

一个或多个处理器;

一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-8所述方法中的任一方法的指令。

10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-8所述的方法中的任一方法。


技术总结
本发明公开了一种问句匹配方法,适于计算设备中执行,该计算设备存储有多个用户意图的特征匹配模式,每个特征匹配模式包括用于描述该用户意图的至少一个槽位所构成的链条以及链条的成链条件,每个槽位包括至少一个语料词或者至少一个限制条件,该方法包括步骤:对用户的输入语句进行实体识别;基于实体识别结果提取输入语句的语义特征,语义特征包括语句长度特征、实体词特征和辅助词特征;确定语义特征满足成链条件的多个候选链条;基于语义特征对多个候选链条进行槽位匹配,确定与输入语句最匹配的目标链条;以及结合语义特征和目标链条的用户意图,查找对应的答案语句反馈给用户。本发明还一并公开了用于执行该方法的计算设备。

技术研发人员:石智中;董欢欢
受保护的技术使用者:车智互联(北京)科技有限公司
技术研发日:2020.05.25
技术公布日:2020.10.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1