问题派发方法及装置与流程

文档序号:18267562发布日期:2019-07-27 09:18阅读:120来源:国知局
问题派发方法及装置与流程

本公开通常涉及计算机技术领域,更具体地,涉及用于派发用户问题的方法及装置。



背景技术:

在互联网企业,尤其是涉及商品交易的互联网企业,通常会提供客服系统来回答客户关于商品质量、商品交易流程、商品售后服务之类的咨询问题。由于客户所咨询的问题通常会涉及不同的业务或流程,不同的业务或流程需要由具有该业务或流程知识的专门客服人员或客服团队(问题处理方)来进行回复,否则会影响客服效果,从而需要提供一种将客户的咨询问题派发给合适的问题处理方的问题派发机制。

问题派发的传统做法是根据用户对需求描述进行分类。然而,很多用户并不喜欢对着机器去描述问题,或者并不清楚自己的问题重点,从而使得用户的问题描述并不准确和完善,由此导致问题派发的准确率不佳,严重地影响答复效果。



技术实现要素:

鉴于上述,本公开提供了一种问题派发方法及装置。利用该问题派发方法及装置,通过在接收到用户问题并得到用户的用户行为轨迹数据和用户特征数据后,基于用户行为轨迹数据和用户特征数据找到对应的辅助文本关键词,然后基于用户问题的问题描述文本和对应的辅助文本关键词来对用户问题进行分类,并按照问题分类结果来将用户问题派发到合适的问题处理方,由此可以将用户问题派发到合适的问题处理方来进行处理,从而使得用户能够得到更为准确的问题答复,由此提升答复效果。

根据本公开的一个方面,提供了一种问题派发方法,包括:在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户行为轨迹数据和用户特征数据;基于所述用户行为轨迹数据和所述用户特征数据,从文本关键词数据库中获取对应的辅助文本关键词;使用神经网络模型来至少部分地基于所述问题描述文本和所述对应的辅助文本关键词进行问题分类;以及基于所述问题分类结果来将所述问题派发给对应的问题处理方,其中,所述文本关键词数据库是基于问题处理方与用户之间的历史对话记录生成的,并且在所述文本关键词数据库中,每次对话所对应的文本关键词与该次对话的用户行为轨迹数据和用户特征数据相对应地存储。

可选地,在上述方面的一个示例中,所述文本关键词数据库是kd-tree,并且,所述kd-tree是利用下述过程生成的:从问题处理方与用户之间的历史对话记录中抽取出每次对话的文本关键词;对每次对话的用户行为轨迹数据和用户特征数据进行向量化处理;基于每次对话的用户行为轨迹数据向量和用户特征数据向量,生成每次对话的索引;以及将每次对话的索引与该次对话的文本关键词相关联,以生成所述kd-tree。

可选地,在上述方面的一个示例中,基于所述用户行为轨迹数据和所述用户特征数据,从文本关键词数据库中获取对应的辅助文本关键词包括:对所述用户行为轨迹数据和所述用户特征数据进行向量化处理;基于用户行为轨迹数据向量和用户特征数据向量,从所述kd-tree中获取匹配的索引;以及从所匹配的索引所对应的对话的文本关键词中获取所述对应的辅助文本关键词。

可选地,在上述方面的一个示例中,所述文本关键词是使用tf-idf技术来从每次对话的历史对话记录中抽取的,并且每个文本关键词具有tf-idf值,从所匹配的索引所对应的对话的文本关键词中获取所述辅助文本关键词包括:基于所匹配的索引的相似度以及所匹配的索引所对应的对话中的文本关键词的tf-idf值,从所匹配的索引所对应的对话的文本关键词中获取所述对应的辅助文本关键词。

可选地,在上述方面的一个示例中,使用神经网络模型来至少部分地基于所述问题描述文本和所述对应的辅助文本关键词进行问题分类包括:将所述问题描述文本和所述对应的辅助文本关键词输入到所述神经网络模型的输入层来进行向量化处理,以得到所述问题描述文本和所述对应的辅助文本关键词的向量表示;将所述问题描述文本和所述对应的辅助文本关键词的向量表示输入到所述神经网络模型中的第一中间隐藏层,以得到所述问题描述文本和所述对应的辅助文本关键词的中间向量;将所得到的所述问题描述文本和所述对应的辅助文本关键词的中间向量输入到所述神经网络模型中的拼接层来进行拼接处理;以及将经过拼接处理后的所述问题描述文本和所述对应的辅助文本关键词的中间向量输入到所述神经网络模型中的分类层来进行分类处理,以确定所述问题的问题分类结果。

可选地,在上述方面的一个示例中,所述第一中间隐藏层包括lstm层、rnn层、gru层、dnn层和cnn层中的至少一种。

可选地,在上述方面的一个示例中,使用神经网络模型来至少部分地基于所述问题描述文本和所述对应的辅助文本关键词进行问题分类包括:使用神经网络模型来至少部分地基于所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据进行问题分类。

可选地,在上述方面的一个示例中,使用神经网络模型来至少部分地基于所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据进行问题分类包括:将所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据分别输入到所述神经网络模型的至少一个输入层来进行向量化处理,以分别得到所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据的向量表示;将所述问题描述文本和所述对应的辅助文本关键词的向量表示输入到所述神经网络模型中的第一中间隐藏层以得到所述问题描述文本和所述对应的辅助文本关键词的中间向量;将所述用户特征数据的向量表示输入到所述神经网络模型中的第二中间隐藏层,以得到所述用户特征数据的中间向量;将所述用户行为轨迹数据的向量表示输入到所述神经网络模型中的第三中间隐藏层,以得到所述用户行为轨迹数据的中间向量;将所生成的所述问题描述文本和所述对应的辅助文本关键词的中间变量、所述用户特征数据的中间变量和所述用户行为轨迹数据的中间向量输入到所述神经网络模型中的拼接层来进行拼接处理;以及将经过拼接处理后的所述问题描述文本和所述对应的辅助文本关键词的中间变量、所述用户特征数据的中间变量和所述用户行为轨迹数据的中间向量输入到所述神经网络模型中的分类层来进行分类处理,以确定所述问题的问题分类结果。

可选地,在上述方面的一个示例中,所述第一中间隐藏层包括lstm层、rnn层、gru层、dnn层和cnn层中的至少一种,所述第二中间隐藏层包括dnn层,以及所述第三中间隐藏层包括lstm层、rnn层或gru层。

可选地,在上述方面的一个示例中,所述分类层是softmax层。

可选地,在上述方面的一个示例中,获取所述问题的问题描述文本包括:在接收到用户的问题后,至少部分地基于所述用户的用户行为轨迹数据和用户特征数据,创建至少一个问答问题;以及至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。

根据本公开的另一方面,提供一种问题派发装置,包括:第一获取单元,被配置为在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户行为轨迹数据和用户特征数据;第二获取单元,被配置为基于所述用户行为轨迹数据和所述用户特征数据,从文本关键词数据库中获取对应的辅助文本关键词;问题分类单元,被配置为使用神经网络模型来至少部分地基于所述问题描述文本和所述对应的辅助文本关键词进行问题分类;以及问题派发单元,被配置为基于所述问题分类结果来将所述问题派发给对应的问题处理方,其中,所述文本关键词数据库是基于问题处理方与用户之间的历史对话记录生成的,并且在所述文本关键词数据库中,每次对话所对应的文本关键词与该次对话的用户行为轨迹数据和用户特征数据相对应地存储。

可选地,在上述方面的一个示例中,所述文本关键词数据库是kd-tree,并且,所述kd-tree是利用下述过程生成的:从问题处理方与用户之间的历史对话记录中抽取出每次对话的文本关键词;对每次对话的用户行为轨迹数据和用户特征数据进行向量化处理;基于每次对话的用户行为轨迹数据向量和用户特征数据向量,生成每次对话的索引;以及将每次对话的索引与该次对话的文本关键词相关联,以生成所述kd-tree。

可选地,在上述方面的一个示例中,所述第二获取单元包括:向量化处理模块,被配置为对所述用户行为轨迹数据和所述用户特征数据进行向量化处理;索引匹配模块,被配置为基于用户行为轨迹数据向量和用户特征数据向量,从所述kd-tree中获取匹配的索引;以及辅助文本关键词获取模块,被配置为从所匹配的索引所对应的对话的文本关键词中获取所述对应的辅助文本关键词。

可选地,在上述方面的一个示例中,所述文本关键词是使用tf-idf技术来从每次对话的历史对话记录中抽取的,并且每个文本关键词具有tf-idf值,所述辅助文本关键词获取模块被配置为:基于所匹配的索引的相似度以及所匹配的索引所对应的对话中的文本关键词的tf-idf值,从所匹配的索引所对应的对话的文本关键词中获取所述对应的辅助文本关键词。

可选地,在上述方面的一个示例中,所述神经网络模型包括:输入层,被配置为对所述问题描述文本和所述对应的辅助文本关键词进行向量化处理,以得到所述问题描述文本和所述对应的辅助文本关键词的向量表示;第一中间隐藏层,被配置为基于所述问题描述文本和所述对应的辅助文本关键词的向量表示,生成所述问题描述文本和所述对应的辅助文本关键词的中间向量;拼接层,被配置为对所生成的所述问题描述文本和所述对应的辅助文本关键词的中间向量进行拼接处理;以及分类层,被配置为对经过拼接处理后的所述问题描述文本和所述对应的辅助文本关键词的中间向量进行分类处理,以确定所述问题的问题分类结果。

可选地,在上述方面的一个示例中,所述问题分类单元被配置为:使用神经网络模型来至少部分地基于所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据进行问题分类。

可选地,在上述方面的一个示例中,所述神经网络模型包括:至少一个输入层,被配置为分别对所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据进行向量化处理,以分别得到所述问题描述文本、所述对应的辅助文本关键词、所述用户特征数据和所述用户行为轨迹数据的向量表示;第一中间隐藏层,被配置为基于所述问题描述文本和所述对应的辅助文本关键词的向量表示,生成所述问题描述文本和所述对应的辅助文本关键词的中间向量;第二中间隐藏层,被配置为基于所述用户特征数据的向量表示,生成所述用户特征数据的中间向量;第三中间隐藏层,被配置为基于所述用户行为轨迹数据的向量表示,生成所述用户行为轨迹数据的中间向量;拼接层,被配置为对所生成的所述问题描述文本和所述对应的辅助文本关键词的中间变量、所述用户特征数据的中间变量和所述用户行为轨迹数据的中间向量进行拼接处理;以及分类层,被配置为对经过拼接处理后的所述问题描述文本和所述对应的辅助文本关键词的中间变量、所述用户特征数据的中间变量和所述用户行为轨迹数据的中间向量进行分类处理,以确定所述问题的问题分类结果。

可选地,在上述方面的一个示例中,所述问题派发装置还包括:问答问题创建单元,被配置为在接收到用户的问题后,至少部分地基于所述用户的用户行为轨迹数据和用户特征数据,创建至少一个问答问题,以及所述第一获取单元被配置为:至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。

根据本公开的另一方面,提供一种计算设备,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的问题派发方法。

根据本公开的另一方面,提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的问题派发方法。

附图说明

通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。

图1示出了根据本公开的实施例的问题派发方法的流程图;

图2示出了根据本公开的实施例的问题的问题描述的一个示例示意图;

图3示出了根据本公开的实施例的kd-tree的生成过程的一个示例的流程图;

图4示出了根据本公开的实施例的辅助关键词获取过程的一个示例的流程图;

图5示出了根据本公开的实施例的神经网络模型的一个示例的示意图;

图6示出了根据本公开的实施例的神经网络模型的另一示例的示意图;

图7示出了根据本公开的实施例的问题描述文本获取过程的流程图;

图8示出了根据本公开的实施例的问题描述文本获取过程的一个示例示意图;

图9示出了根据本公开的实施例的问题派发装置的结构方框图;

图10示出了根据本公开的实施例的用于获取辅助文本关键词的第二获取单元的一个示例的结构方框图;

图11示出了根据本公开的实施例的用于问题派发的计算设备的方框图。

具体实施方式

现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。

在本文中,术语“问题处理方”是指服务提供方(例如公司或企业等)为了处理用户问题而设立的专门问题处理机构,比如,客服系统中的各个客服技能组。通常,服务提供方会设立多个问题处理方,每个问题处理方专门处理某个业务(比如,支付宝应用包、理财线等)或某个处理流程(账号相关处理流程)所涉及的用户问题,并且该问题处理方具有该业务或流程所需的各种知识能力和/或处理技能。在本公开中,所述问题处理方可以是问题处理人或者问题处理组。

下面将结合附图来详细描述根据本公开的问题派发方法及装置的实施例。

图1示出了根据本公开的实施例的问题派发方法的流程图。所述方法由问题派发装置执行,例如公司客服系统中的问题派发装置。

如图1所示,在块110,接收用户的问题。在本公开中,用户可以例如通过语音对话的方式向客服系统发出问题,例如,通过电话或者语音聊天的方式,或者可以通过按键输入或屏幕输入的方式来向客服系统发出问题。所述问题可以是一个标准问题,也可以是针对问题的一段描述文字。所述问题的格式可以是文本格式、语音格式、图片格式或者其他合适的格式。图2示出了根据本公开的实施例的问题的一个示例示意图。

在接收到用户的问题后,在块120,获取所述问题的问题描述文本,并且从用户行为轨迹数据数据库130中获取该用户的用户行为轨迹数据以及从用户特征数据数据库140中获取该用户的用户特征数据。这里,问题描述文本是用于描述用户问题的文本描述信息。在问题的格式不是文本格式的情况下,可以采用合适的格式转换方式来将所述问题转换为文本格式的问题描述文本。此外,可选地,所述问题描述文本还可以是通过对用户所输入的文本格式的问题进行预处理后得到的文本描述信息,所述预处理例如可以是去除无效信息、提取关键分词等。

用户行为轨迹数据数据库130可以是通过经由服务提供方的内部网络和/或比如互联网、其它服务提供方的系统网络之类的外部网络收集用户的历史行为轨迹数据来创建的。例如,可以通过服务提供方的内部服务网络来收集用户的历史行为轨迹数据。所述用户的历史行为轨迹数据例如可以是用户所执行的与服务提供方所提供的服务相关联的操作序列数据,比如,针对支付宝服务,用户历史行为轨迹数据可以包括用户浏览支付宝app次数、用户在支付宝上的操作行为序列等等。这里,所述用户行为轨迹数据是具有序列特征的数据。用户特征数据是指用于描述用户特征的各种信息的数据,比如年龄、身高、特征、消费偏好、性别、收入、职业、用户本月是否还清花呗等等。用户特征数据数据库140可以是通过经由服务提供方的内部网络和/或比如互联网、其它服务提供方的系统网络之类的外部网络收集用户的特征数据来创建的。例如,可以通过服务提供方的内部服务网络来收集用户的特征数据。这里,所述用户特征数据是具有离散特征的数据。用户行为轨迹数据数据库130和用户特征数据数据库140可以存储在问题派发装置中,也可以分布在问题派发装置之外的一个或多个设备中,比如客服系统中的其他设备中,并且与问题派发装置之间经由有线或无线的方式进行通信。

接着,在块150,基于所获取的用户行为轨迹数据和用户特征数据来从文本关键词数据库中获取对应的辅助文本关键词。在本公开中,所述文本关键词数据库是基于问题处理方与用户之间的历史对话记录生成的,所述历史对话记录是问题处理方在处理问题时与用户之间所发生对话的对话记录。并且,在所述文本关键词数据库中,每次对话所对应的文本关键词与该次对话的用户行为轨迹数据和用户特征数据相对应地存储。所述辅助文本关键词是用于辅助对用户问题进行问题分类的文本关键词。关于文本关键词数据库的创建过程以及辅助文本关键词的获取过程将在下面参照图3和图4进行说明。

在如上获取问题的问题描述文本和对应的辅助文本关键词后,在块160,使用神经网络模型来至少部分地基于所获取的问题描述文本和对应的辅助文本关键词进行问题分类。如何使用神经网络模型来进行问题分类,将在下面结合图5和图6进行描述。

在如上进行问题分类后,在块170,基于所述问题分类结果,将所述问题派发给对应的问题处理方。例如,将问题派发给客服系统中的与问题分类结果匹配的客服组来进行处理。

在本公开中,文本关键词数据库可以是kd-tree。kd-tree也称为k维树,是计算机科学中使用的一种高维索引树形数据结构。kd-tree被使用来组织表示k维空间中的点集合。它是一种带有其他约束条件的二分查找树,通常应用于多维空间关键数据的搜索,比如范围搜索和最近邻搜索。图3示出了根据本公开的实施例的kd-tree的生成过程的一个示例的流程图。

如图3所示,在块310,从问题处理方与用户之间的历史对话记录中抽取出每次对话的文本关键词。例如,可以使用tf-idf技术来计算每次对话中的文本关键词的tf-idf值,并且基于所计算出的tf-idf值来从每次对话的历史对话记录中抽取出该次对话的文本关键词。

然后,在块320,对每次对话的用户行为轨迹数据和用户特征数据进行向量化处理。接着,在块330,基于每次对话的用户行为轨迹数据向量和用户特征数据向量,生成每次对话的索引。

在生成每次对话的索引后,在块340,将每次对话的索引与该次对话的文本关键词相关联,以生成所述kd-tree。

图4示出了根据本公开的实施例的辅助关键词获取过程的一个示例的流程图。在图4所示的辅助关键词获取过程示例中,文本关键词数据库是kd-tree。

如图4所示,在块151,对所获取的用户行为轨迹数据和用户特征数据进行向量化处理。接着,在块153,基于所得到的用户行为轨迹数据向量和用户特征数据向量,从kd-tree中获取与之匹配的索引,进而找到与该索引对应的对话。

然后,在块155,从所匹配的索引所对应的对话的文本关键词中获取对应的辅助文本关键词。例如,在一个示例中,可以获取所匹配的索引所对应的对话中的所有文本关键词,作为对应的辅助文件关键词。在另一示例中,也可以基于所匹配的索引的相似度以及所匹配的索引所对应的对话中的文本关键词的tf-idf值,从所匹配的索引所对应的对话的文本关键词中获取所述对应的辅助文本关键词。例如,在基于所得到的用户行为轨迹数据向量和用户特征数据向量,从kd-tree中匹配到预定数目个(例如,m)个索引,每个索引的相似度为ci,i=1,......,m。然后,从m个索引中的每个索引所对应的对话中,取出tf-idf值最高的预定数目个(例如,n)个文本关键词。随后,针对该m*n个文本关键词中的每个文本关键词,计算该文本关键词的tf-idf值与该文本关键词所属对话所对应的索引的相似度ci的乘积。然后,基于所计算出的乘积来获取乘积值最高的预定数目个文本关键词,作为对应的辅助文本关键词。

图5示出了根据本公开的实施例的神经网络模型500的一个示例的示意图。如图5所示,神经网络模型500包括输入层530、第一中间隐藏层540-1,540-2,540-3、拼接层550和分类层560。

在获取问题描述文本510和对应的辅助文本关键词520后,将所获取的问题描述文本510和对应的辅助文本关键词520输入到输入层530。输入层530分别对问题描述文本510和对应的辅助文本关键词520进行向量化处理,以得到问题描述文本510和对应的辅助文本关键词520的向量表示,该向量表示可以是针对问题描述文本510和对应的辅助文本关键词520的单个向量表示。在本公开中,输入层530可以使用嵌入层来实现。此外,在本公开的另一示例中,在将问题描述文本510和对应的辅助文本关键词520输入到输入层530之前,还可以对问题描述文本510和对应的辅助文本关键词520进行拼接处理,以得到一个整合后的文本来输入到输入层530,然后,输入层530输出对应的向量表示。

在如上得到问题描述文本510和对应的辅助文本关键词520的向量表示后,将问题描述文本510和对应的辅助文本关键词520的向量表示提供给第一中间隐藏层540-1,540-2,540-3。

第一中间隐藏层540-1,540-2,540-3基于问题描述文本510和对应的辅助文本关键词520的向量表示,生成问题描述文本510和对应的辅助文本关键词520的中间向量。然后,第一中间隐藏层540-1,540-2,540-3将所生成的问题描述文本510和对应的辅助文本关键词520的中间向量提供给拼接层550。

在本公开中,第一中间隐藏层540可以利用lstm层、rnn层、gru层、dnn层和cnn层中的至少一种来实现。例如,如图5中所示,第一中间隐藏层540可以利用lstm层540-1、dnn层540-2和rnn层540-3来实现。

拼接层550对所生成的问题描述文本510和对应的辅助文本关键词520的中间向量进行拼接处理。然后,分类层560基于经过拼接处理后的问题描述文本510和对应的辅助文本关键词520的中间向量来进行分类处理,以确定问题的问题分类结果。在本公开中,分类层560可以利用softmax层实现。

在本公开的另一示例中,块160中所执行的问题分类过程也可以利用下述过程来实现:使用神经网络模型来至少部分地基于问题描述文本、对应的辅助文本关键词、用户特征数据和用户行为轨迹数据来进行问题分类。图6示出了根据本公开的实施例的在上述问题分类过程中所使用的神经网络模型600的一个示例的示意图。

如图6所示,神经网络模型600包括至少一个输入层650、第一中间隐藏层660-1,660-2,660-3、第二中间隐藏层670、第三中间隐藏层680、拼接层685和分类层690。

在获取到用户问题的问题描述文本610、对应的辅助文本关键词620、用户的用户特征数据630和用户行为轨迹数据640后,将所获取的问题描述文本610、对应的辅助文本关键词620、用户特征数据630和用户行为轨迹数据640分别输入给至少一个输入层650。至少一个输入层650可以包括一个或多个输入层,如图6所示,问题描述文本610和对应的辅助文本关键词620对应一个输入层650,用户特征数据630对应一个输入层650,以及用户行为轨迹数据640对应一个输入层650。在本公开的其它示例,也可以是问题描述文本610、对应的辅助文本关键词620、用户特征数据630和用户行为轨迹数据640中的至少两个对应于至少一个输入层650中的一个输入层。至少一个输入层650分别对问题描述文本610、对应的辅助文本关键词620、用户特征数据630和用户行为轨迹数据640进行向量化处理,以分别得到问题描述文本610、对应的辅助文本关键词620、用户特征数据630和用户行为轨迹数据640的向量表示。同样,在本公开中,输入层650可以使用嵌入层来实现。这里要说明的是,问题描述文本610和对应的辅助文本关键词620是作为整体来进行输入和处理的,并且经过输入层650的处理后得到一个向量表示。

在如上得到问题描述文本610、对应的辅助文本关键词620、用户的用户特征数据630和用户行为轨迹数据640的向量表示后,将问题描述文本610和对应的辅助文本关键词620的向量表示分别提供给第一中间隐藏层660-1,660-2,660-3,将用户特征数据630的向量表示提供给第二中间隐藏层670,以及将用户行为轨迹数据640的向量表示提供给第三中间隐藏层680。

第一中间隐藏层660-1,660-2,660-3基于问题描述文本610和对应的辅助文本关键词620的向量表示,生成问题描述文本610和对应的辅助文本关键词620的中间向量。第二中间隐藏层670基于用户特征数据630的向量表示,生成用户特征数据630的中间向量。第三中间隐藏层680基于用户行为轨迹数据640的向量表示,生成用户行为轨迹数据640的中间向量。然后,第一中间隐藏层660-1,660-2,660-3、第二中间隐藏层670和第三中间隐藏层680将所生成的问题描述文本610、对应的辅助文本关键词620、用户特征数据630和用户行为轨迹数据640的中间向量提供给拼接层685。

在本公开中,第一中间隐藏层660可以利用lstm层、rnn层、gru层、dnn层和cnn层中的至少一种来实现。例如,如图6中所示,第一中间隐藏层660可以利用lstm层660-1、dnn层660-2和rnn层660-3来实现。第二中间隐藏层670可以利用dnn层实现。第三中间隐藏层680可以利用lstm层、rnn层或gru层实现。优选地,第三中间隐藏层680利用lstm层实现。

拼接层685对所生成的问题描述文本610和对应的辅助文本关键词620的中间向量、所生成的用户特征数据630的中间变量和所生成的用户行为轨迹数据640的中间向量进行拼接处理。然后,分类层690基于经过拼接处理后的问题描述文本610和对应的辅助文本关键词620的中间变量、用户特征数据630的中间变量和用户行为轨迹数据640的中间向量来进行分类处理,以确定问题的问题分类结果。在本公开中,分类层690可以利用softmax层实现。

此外,可选地,在使用神经网络模型来执行问题分类处理时,还可以引入注意力(attention)机制。如何在神经网络模型中引入attention机制,在本领域中是公知的,在此不再详细描述。

在本公开中,神经网络模型是利用经过各个问题处理方类目标注处理后的问题描述文本、历史对话记录的文本关键词以及对应的用户行为轨迹数据和用户特征数据来训练的。

利用该问题派发方法及装置,通过在接收到用户问题并得到用户的用户行为轨迹数据和用户特征数据后,基于用户行为轨迹数据和用户特征数据找到对应的辅助文本关键词,然后基于用户问题的问题描述文本和对应的辅助文本关键词来对用户问题进行分类,并按照问题分类结果来将用户问题派发到合适的问题处理方,由此可以将用户问题派发到合适的问题处理方来进行处理,从而使得用户能够得到更为准确的问题答复,由此提升答复效果。

利用该问题派发方法,通过基于用户的问题描述文本、用户行为轨迹数据和用户特征数据来对用户问题进行分类,从而使得能够基于多模态多标签数据来进行问题分类,而不是基于单一的问题描述文本,由此可以提高问题分类预测的准确率,进而能够将用户问题派发到合适的问题处理方来进行处理,使得用户能够得到更为准确的问题答复,由此提升答复效果。

此外,在上述问题派发方法中,针对问题描述文本、用户行为轨迹数据和用户特征数据,基于问题描述文本、用户行为轨迹数据和用户特征数据各自的数据特征,分别采用对应的合适隐藏层来进行处理,由此使得针对问题描述文本、用户行为轨迹数据和用户特征数据的中间向量处理效率更高,从而进一步提升问题分类的准确率。

在本公开中,在一些应用场景下,用户并不喜欢对着客服系统去描述问题,或者并不清楚自己的问题重点,从而使得客服系统所接收的问题描述并不准确和完善,由此导致客服系统所获取的问题描述文本并不能准确地反映出用户的咨询意图,进而使得无法对问题进行准确地分类并将该问题派发到合适的问题处理方来进行解答。

为了获取用户问题的更多有效信息,针对问题描述文本获取过程,本公开提供了一种通过基于用户行为轨迹数据和用户特征数据来创建至少一个问答问题,并基于用户的答复来获取关于用户问题的更多有效信息的问题描述文本获取方案。

图7示出了根据本公开的实施例的问题描述文本获取过程的流程图,以及图8示出了根据本公开的实施例的问题描述文本获取过程的一个示例示意图。

如图7所示,在块710,接收用户的问题,例如,用户可以仅仅拨通一个电话,或者用户发送关于问题的问题描述,例如,用户所提供的问题描述为“我手机号丢失,然后重新补办,然后再登录支付宝,与以前的就不是同一个支付宝账号了”,如图8中所示。这里,如果所接收的问题描述是非文本格式的,则还需要执行从非文本格式到文本格式的转换操作,以得到文本格式的问题描述。

在接收到用户的问题后,在块720,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户。例如,“是想找回原先的支付宝账号吗?”,如图8中所示。此外,在所接收的问题包含问题描述时,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户可以包括:至少部分地基于所接收到的问题的问题描述、用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户。

在接收到用户的肯定答复后,流程进行到块780。如果接收到用户的否定答复,则在块740,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户。例如,“是担心原来支付宝账号找那个的资金安全吗?”,如图8中所示。在本公开的另一示例中,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户可以包括:至少部分地基于用户的用户行为轨迹数据、用户特征数据以及用户针对上一问题的答复,创建另一问答问题并推送给用户。其中,所述用户的答复可以包括用户的肯定答复或者否定答复。在一些情况下,所述用户的答复还可以包括用户的补充问题描述。

在接收到用户的肯定答复后,流程进行到块780。如果接收到用户的否定答复,则在块760,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一个问答问题并推送给用户。同样,在本公开的另一示例中,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户可以包括:至少部分地基于用户的用户行为轨迹数据、用户特征数据以及用户针对上一问题的答复,创建另一问答问题并推送给用户。其中,所述用户的答复可以包括用户的肯定答复或者否定答复。在一些情况下,所述用户的答复还可以包括用户的补充问题描述。如此循环执行上述问答过程,直到得到肯定答复,或者在创建了预定数目个问答问题并且得到用户答复后停止。优选地,所创建的问答问题的数目不超过三个。

在块780,至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本。这里,用户的答复可以包括针对问题的肯定或否定答复。或者,在本公开的其它示例中,用户的答复还可以包括其它补充描述,比如图8中的“资金安全”等。在本公开的另一示例中,在用户所发出的问题包括问题描述的情况下,至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本可以包括:至少部分地基于所述用户的问题的问题描述以及所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本。

此外,针对所创建的至少一个问答问题,如果用户没有答复,则可以视为“肯定”答复或者“否定”答复,并且按照“肯定”答复或者“否定”答复来执行后续操作。具体是视为“肯定”答复还是“否定”答复,可以根据具体情况来由系统设定。

利用图7中示出的问题描述文本获取过程,可以在用户不喜欢对着客服系统描述问题或者不清楚自己的问题重点的情况下,尤其是用户采用比如电话或对话聊天的方式来语音输入问题描述的情形,获取包含关于用户问题的更多有效信息的问题描述文本。

图9示出了根据本公开的实施例的问题派发装置900的结构方框图。

如图9所示,问题派发装置900包括第一获取单元910、第二获取单元920、问题分类单元930和问题派发单元940。

第一获取单元910被配置为在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户行为轨迹数据和用户特征数据。第一获取单元910的操作可以参考上面参照图1、图7和图8描述的块120的操作。

第二获取单元920被配置为基于所获取的用户行为轨迹数据和用户特征数据,从文本关键词数据库中获取对应的辅助文本关键词。文本关键词数据库的生成过程可以参考上面参照图3描述的文本关键词数据库生成过程。此外,第二获取单元920的操作可以参考上面参照图4描述的操作。

图10示出了根据本公开的实施例的用于获取对应的辅助文本关键词的第二获取单元920的一个示例的结构方框图,其中,所述文本关键词数据库为kd-tree。如图10所示,第二获取单元920包括向量化处理模块921、索引匹配模块923和辅助文本关键词获取模块925。

向量化处理模块921被配置为对用户行为轨迹数据和用户特征数据进行向量化处理。向量化处理模块921的操作可以参考上面参照图4描述的块151的操作。

索引匹配模块923被配置为基于用户行为轨迹数据向量和所述用户特征数据向量,从kd-tree中获取匹配的索引。索引模块923的操作可以参考上面参照图4描述的块153的操作。

辅助文本关键词获取模块925被配置为从所匹配的索引所对应的对话的文本关键词中获取对应的辅助文本关键词。辅助文本关键词获取模块925的操作可以参考上面参照图4描述的块155的操作。

在文本关键词是使用tf-idf技术来从每次对话的历史对话记录中抽取的,并且每个文本关键词具有tf-idf值的情况下,辅助文本关键词获取模块925被配置为:基于所匹配的索引的相似度以及所匹配的索引所对应的对话中的文本关键词的tf-idf值,从所匹配的索引所对应的对话的文本关键词中获取对应的辅助文本关键词。

在如上得到问题描述文本和辅助文本关键词后,问题分类单元930将问题描述文本和对应的辅助文本关键词提供给神经网络模型来进行问题分类。问题分类单元930的操作可以参考上面参照图1以及图5描述的块160的操作。

此外,在本公开的另一示例中,问题分类单元930还可以被配置为使用神经网络模型来至少部分地基于问题描述文本、对应的辅助文本关键词、用户特征数据和用户行为轨迹数据进行问题分类。在这种情况下,问题分类单元930的操作可以参考上面参照图1以及图6描述的块160的操作。

在如上完成问题分类后,问题派发单元940基于问题分类结果来将所述问题派发给对应的问题处理方。问题派发单元940的操作可以参考上面参照图1描述的块170的操作。

此外,可选地,问题派发装置900还可以包括问答问题创建单元950。问题创建单元950被配置为在接收到用户的问题后,至少部分地基于所述用户的用户行为轨迹数据和用户特征数据,创建至少一个问答问题。相应地,第一获取单元910被配置为至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。

如上参照图1到图10,对根据本公开的问题派发方法及装置的实施例进行了描述。上面的问题派发装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。

图11示出了根据本公开的实施例的用于问题派发的计算设备1100的方框图。如图11所示,计算设备1100可以包括至少一个处理器1110、存储器1120、内存1130和通信接口1140,并且至少一个处理器1110、存储器1120、内存1130和通信接口1140经由总线1160连接在一起。至少一个处理器1110执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。

在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器1110:在接收到用户的问题的问题描述后,获取所述问题的问题描述文本、所述用户的用户行为轨迹数据和用户特征数据;基于所述用户行为轨迹数据和所述用户特征数据,从文本关键词数据库中获取对应的辅助文本关键词;使用神经网络模型来至少部分地基于所述问题描述文本和所述对应的辅助文本关键词进行问题分类;以及基于所述问题分类结果来将所述问题派发给对应的问题处理方,其中,所述文本关键词数据库是基于问题处理方与用户之间的历史对话记录生成的,并且在所述文本关键词数据库中,每次对话所对应的文本关键词与该次对话的用户行为轨迹数据和用户特征数据相对应地存储。

应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1110进行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。

在本公开中,计算设备1100可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(pda)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。

根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd-rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。

本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。

需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。

以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,fpga或asic)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1