孤立话语检测系统和方法与流程

文档序号：19043006发布日期：2019-11-05 23:20阅读：来源：国知局

技术特征：

1.一种用于将域外话语分类为web搜索查询或者目标语言理解对话系统的孤立项的方法，所述方法包括：

接收被所述目标语言理解对话系统的域分类器拒绝的域外话语；

针对一个或多个语义、句法、词性标注或词汇特征，对所述域外话语进行评估，所述一个或多个语义、句法、词性标注或词汇特征用于确定所述域外话语是web搜索查询还是所述目标语言理解对话系统的孤立项；

确定所述域外话语是孤立项；以及

生成响应，所述响应指示所述域外话语被理解为针对所述目标语言理解对话系统的、用于执行机器动作的请求。

2.根据权利要求1所述的方法，进一步包括以下动作：

接收作为所述目标语言理解对话系统的输入而被提供的话语；以及

确定所述话语是未被与所述目标语言理解对话系统相关联的任务域覆盖的域外话语。

3.根据权利要求1所述的方法，进一步包括以下动作：

生成消息，所述消息报告所述域外话语被理解为针对所述目标语言理解对话系统的、用于执行机器动作的请求；以及

向与所述目标语言理解对话系统相关联的输出设备呈现所述消息。

4.根据权利要求3所述的方法，其中所述响应不包括来自web搜索查询基于所述孤立项的结果。

5.根据权利要求1所述的方法，其中确定所述域外话语是孤立项的动作进一步包括基于作为孤立项分类器的输入而被提供的所述域外话语的特征，使用所述孤立项分类器将所述域外话语分类为孤立项的动作。

6.根据权利要求1所述的方法，进一步包括在确定所述域外话语是孤立项之前，从所述话语提取特征的动作。

7.根据权利要求1所述的方法，进一步包括以下动作：

针对谓语和论元检查所述话语；以及

使用谓语和论元的存在作为孤立项分类特征。

8.根据权利要求1所述的方法，进一步包括以下动作：

语义上聚类多个孤立项；以及

标识包含孤立项的选定测量的语义簇，所述选定测量指示用户进行与不受支持的任务域有关的请求的频率。

9.根据权利要求8所述的方法，进一步包括以下动作：

使用所选定的孤立项的语义簇作为训练数据的肯定类来构建针对所述不受支持的任务域的新的任务域分类模型；以及

向所述目标语言理解对话系统添加所述新的任务域分类模型。

10.根据权利要求2所述的方法，其中确定所述话语是未被与所述目标语言理解对话系统相关联的任务域覆盖的域外话语的所述动作进一步包括以下动作：

使用与一个或多个任务域相关联的一个或多个域分类器来处理所述话语；以及

当所述话语不被所述一个或多个任务域中的任意任务域接受时，将所述域外话语分类为孤立项。

11.根据权利要求1所述的方法，进一步包括在确定所述域外话语是孤立项之前，确定所述域外话语是事实性问题还是聊天的动作。

12.根据权利要求5所述的方法，其中所述孤立项分类器应用分类模型，所述分类模型从包括用于训练所述目标语言理解对话系统的至少一个任务域的多个域内话语的训练数据的肯定类和包括多个web搜索查询的训练数据的否定类中构建。

13.一种具有至少一个域的目标语言理解对话系统，所述目标语言理解对话系统包括：

特征提取器，所述特征提取器可操作用于从话语提取特征；

分类器，所述分类器可操作用于接收所述特征作为输入，确定所述话语是否为不属于与所述分类器相关联的任意域的域外话语；

孤立项检测器，所述孤立项检测器可操作用于接收所述域外话语，确定所述域外话语是否为孤立项；以及

交互管理器，所述交互管理器可操作用于处理所述孤立项而不向通用web搜索发送所述孤立项。

14.根据权利要求13所述的目标语言理解对话系统，其中所述孤立项检测器包括语义解析器，所述语义解析器可操作用于对所述域外话语进行语义解析。

15.根据权利要求14所述的目标语言理解对话系统，其中所述孤立项检测器包括判别分类器，所述判别分类器可操作用于应用分类模型，来确定所述域外话语是否为孤立项，所述分类模型使用与所述域外话语相关联的特征，与所述域外话语相关联的所述特征使用所述语义解析器的输出而被获得。

16.根据权利要求14所述的目标语言理解对话系统，其中所述孤立项检测器进一步包括以下中的至少一个：句法解析器、词性标注器和词汇解析器。

17.根据权利要求13所述的目标语言理解对话系统，其中所述孤立项检测器包括判别分类器，所述判别分类器可操作用于应用语义分类模型。

18.根据权利要求13所述的目标语言理解对话系统，进一步包括：

输入设备，所述输入设备可操作用于从用户收集话语；

与所述输入设备通信的输入解码器，所述输入解码器可操作用于将不是文本的所述话语转换成机器可处理的文本；以及

输出设备，所述输出设备用于呈现指示所述孤立项指定意图的结果，所述意图不具有所述交互管理器已知的对应对话动作。

19.根据权利要求18所述的目标语言理解对话系统，其中所述目标语言理解对话系统是同时响应来自用户的话语的产生式系统，所述交互管理器进一步可操作用于生成向所述用户通知所述意图无法被执行的输出。

20.一种存储计算机可执行指令的计算机存储介质，所述计算机可执行指令在由计算机执行时，执行在具有一个或多个任务域的目标语言理解对话系统中从域外话语中检测孤立项的方法，所述方法包括：

经由与所述目标语言理解对话系统相关联的输入设备接收话语；

使用域分类器集合来处理所述话语，以确定所述话语何时属于被所述目标语言理解对话系统支持的任务域；

当所述话语不属于被所述目标语言理解对话系统支持的任意任务域时，将所述话语分类为域外话语；

提供域分类器集合，以确定所述域外话语何时属于被所述目标语言理解对话系统支持的任务域；

确定针对所述域外话语的语义形状；

当所述域外话语的所述语义形状对应于具有谓语和宾语的参考语义形状时，将所述域外话语分类为孤立项；

生成输出，所述输出指示所述孤立项被理解为不是web搜索查询而且不被所述目标语言理解对话系统支持；以及

经由与所述目标语言理解对话系统相关联的输出设备呈现输出。

完整全部详细技术资料下载

当前第2页1 2 3