业务处理方法以及装置与流程

文档序号：25518481发布日期：2021-06-18 20:04阅读：99来源：国知局

本说明书实施例涉及计算机技术领域，特别涉及一种业务处理方法。本说明书一个或者多个实施例同时涉及一种业务处理装置，一种计算设备，以及一种计算机可读存储介质。

背景技术：

随着用户群体对健康保障项目关注度的增高，加入该项目的人数也越来越多，因此为了能够让用户更加快捷方便的体验或享受该项目所提供的服务，不同于传统的线下服务模式，许多线上服务平台随之应运而生。用户可通过线下或线上服务平台加入健康保障项目，在用户加入项目，并出现健康问题需要项目发起方为其提供健康保障的情况下，健康保障项目的项目发起方需要收集该用户的就诊证明以及其他相关的证明材料，并对这些就诊证明及其他证明材料进行审核，以判断该用户是否满足享受健康保障的条件。

目前业务发起方多采用预先构建的知识库生成收集证明材料的话术，而目前知识库的构建完全依赖人工或者通过挖掘高频的客户消息辅助人工，初期的人工成本非常高，并且由于知识需要迭代更新，因此知识库的更迭还需要由人工来持续维护，导致的维护成本高的问题，因此，亟需提出一种有效的方法以解决此类问题。

技术实现要素：

有鉴于此，本说明书实施例提供了一种业务处理方法。本说明书一个或者多个实施例同时涉及一种业务处理装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种业务处理方法，包括：

获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息；

将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色；

获取所述文本片段中所述目标对话角色的问题文本间的关联关系；

根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

可选地，所述将所述历史多媒体业务数据转换为文本信息，包括：

对所述历史多媒体业务数据进行语音识别，获得识别生成的文本信息。

可选地，所述将所述文本信息划分为文本片段，包括：

确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，并根据所述语义匹配结果将所述文本信息划分为至少一个文本片段。

可选地，所述确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，包括：

基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

将所述待采集信息与所述文本信息进行语义相似度计算；

根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

可选地，所述确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，包括：

基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

将所述待采集信息与所述文本信息输入预训练的语义匹配模型进行相似度计算；

根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

可选地，所述获取所述文本片段中所述目标对话角色的问题文本间的关联关系，包括：

将所述文本片段输入自然语言处理模型进行关联度计算，生成所述文本片段中所述目标对话角色的问题文本间的关联度计算结果；

根据所述关联度计算结果确定所述文本片段中所述目标对话角色的问题文本间的关联关系。

可选地，所述获取所述文本片段中所述目标对话角色的问题文本间的关联关系，包括：

获取所述文本片段中，所述目标对话角色的第i条问题文本、所述第i条问题文本的答案文本以及第i+1条问题文本的语义信息；

基于所述语义信息确定所述第i条问题文本与第i+1条问题文本间的关联关系，其中，i∈[1，n-1]，n为所述文本片段中目标对话角色的问题文本的条数，且n为正整数。

可选地，所述根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，包括：

确定存在关联关系的问题文本的文本长度，和/或存在关联关系的问题文本的文本数量；

根据所述文本长度，和/或所述文本数量筛选所述目标对话角色的目标问题文本。

可选地，所述根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，包括：

将存在关联关系的问题文本以及与所述问题文本对应的答案文本组成文本对，并计算所述文本对的信息熵；

根据所述信息熵筛选所述文本片段中所述目标对话角色的目标问题文本。

可选地，所述业务处理方法，还包括：

采集用户的语音数据，并对所述语音数据进行语义分析；

根据语义分析结果在所述话术知识库中筛选与所述语音数据匹配的话术推荐信息，并推荐至所述用户。

根据本说明书实施例的第二方面，提供了一种业务处理装置，包括：

获取模块，被配置为获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息；

划分模块，被配置为将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色；

获取模块，被配置为获取所述文本片段中所述目标对话角色的问题文本间的关联关系；

构建模块，被配置为根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

根据本说明书实施例的第三方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令以实现所述业务处理方法的步骤。

根据本说明书实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现所述业务处理方法的步骤。

本说明书一个实施例通过获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息，将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色，获取所述文本片段中所述目标对话角色的问题文本间的关联关系，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

通过目标业务的历史多媒体业务数据构建话术知识库，降低了话术知识库构建的复杂度以及知识库维护难度，并且提高了构建效率；另外，通过将历史多媒体业务数据的文本信息进行文本片段划分，并根据不同文本片段构建所述目标业务的话术知识库，有利于提升所述话术知识库的覆盖率，并进一步保证构建的话术知识库中所包含话术的准确性。

附图说明

图1是本说明书一个实施例提供的一种业务处理方法的处理流程图；

图2是本说明书一个实施例提供的一种业务处理过程的示意图；

图3是本说明书一个实施例提供的一种业务处理方法的处理过程流程图；

图4是本说明书一个实施例提供的一种业务处理装置的示意图；

图5是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本说明书中，提供了一种业务处理方法，本说明书同时涉及一种业务处理装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一个实施例提供的一种业务处理方法的处理流程图，包括步骤102至步骤108。

步骤102，获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息。

具体的，所述历史多媒体业务数据包括但不限于视频数据或音频数据等，所述目标业务是指待审核业务，包括但不限于待审核理赔业务、待审核贷款业务、待审核投资业务等，本说明书实施例以待审核理赔业务为例进行说明，待审核贷款业务、待审核投资业务的具体实现与待审核理赔业务的具体实现类似，参照待审核理赔业务的具体实现即可，在此不再赘述。

若所述目标业务为待理赔业务，则在用户参保并出险后，向业务发起方发送理赔申请，由业务发起方通过面访或调查等方式收集用户的就诊证明以及其他相关的证明材料，并对这些就诊证明及其他证明材料进行初始审核，以为后续判断所述用户是否满足理赔条件做准备。而所述历史多媒体业务数据即由所述业务发起方在通过面访的方式收集相关材料的过程中，对面访过程以视频或音频形式进行记录所形成的视频数据或音频数据，所述视频数据或音频数据中则包含至少两个对话角色，所述至少两个对话角色可以包括业务发起方和用户等。

具体实施时，在获取到所述历史多媒体业务数据后，需将历史多媒体业务数据转换为文本信息，以基于文本信息构建话术知识库，将历史多媒体业务数据转换为文本信息，具体即对所述历史多媒体业务数据进行语音识别，获得识别生成的文本信息。

实际应用中，可使用语音识别技术(automaticspeechrecognition，asr)将所述历史多媒体业务数据中的声音信息转化为文字信息。

步骤104，将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色。

具体的，所述目标业务为待审核业务，在对所述待审核业务进行审核的过程中，为保证审核结果的准确性，通常需对多项业务信息进行审核，并综合得出最后的审核结果，并且，可能审核的多项业务信息中存在任意两项或多项业务信息之间的关联性较低，因此，若将文本信息作为一个整体进行问题文本的关联度分析，获得的分析结果的准确度并不高，因此，在构建话术知识库的过程中，可根据业务处理模板中业务信息采集项与文本信息之间的匹配关系，对文本信息进行划分，以根据划分生成的各文本片段分别构建与各业务信息采集项对应的话术知识库。

如前所述，所述历史多媒体业务数据为对面访过程以视频或音频形式进行记录所形成的视频数据或音频数据，所述视频数据或音频数据中则包含业务发起方和用户这至少两个对话角色。

而本说明书实施例的目的在于根据历史多媒体业务数据为目标业务构建话术知识库，并利用话术知识库为业务发起方推荐话术链路，从而通过所述话术链路中的话术信息挖掘更加有效的审核材料信息，可见，本说明书实施例用于为业务发起方构建话术知识库，因此，在话术知识库的构建过程中，则可对文本片段进行对话角色划分，并根据划分结果确定目标对话角色，所述目标对话角色即为所述业务发起方。

具体实施时，将所述文本信息划分为文本片段，即确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，并根据所述语义匹配结果将所述文本信息划分为至少一个文本片段。

进一步的，确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，具体可通过以下方式实现：

基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

将所述待采集信息与所述文本信息进行语义相似度计算；

根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

具体的，由于所述目标业务为待审核业务，因此，在通过面访的方式采集审核数据的过程中，所述目标业务的业务发起方可基于业务处理模板向用户进行提问的方式采集所述审核数据，由于对面访过程进行记录所获得的历史多媒体业务数据中包含的采集信息通常与所述业务处理模板中的各信息采集项对应，因此，可通过确定业务处理模板中各业务信息采集项与所述文本信息的语义匹配结果，并根据所述语义匹配结果对文本信息进行文本片段划分。后续可通过各文本片段中的文本信息构建各信息采集项对应的话术知识库。

仍以所述目标业务为待审核理赔业务为例，在面访过程中，业务发起方会基于业务处理模板(理赔业务的理赔信息采集模板)向用户进行提问，以基于用户的答复信息采集理赔材料。由于所述信息采集模板中的业务信息采集项一般包括用户基本信息(姓名、年龄等)、商保、社保、体检、高血压/糖尿病/肝炎等，因此，可通过确定各业务信息采集项与所述文本信息的语义匹配结果，并根据所述语义匹配结果对文本信息进行文本片段划分。

实际应用中，可基于业务处理模板中的业务信息采集项确定各业务信息采集项对应的待采集信息，并计算待采集信息与文本信息间的语义相似度，从而根据语义相似度的计算结果对文本信息进行文本片段划分。

例如，若转换后的文本信息包含10行数据，根据语义相似度计算结果确定第1-4行文本与用户基本信息相关，第5至7行与社保相关，第8至10行与体检相关，则将所述文本信息划分为3个文本片段(1-4行划分为一个文本片段、5至7行划分为一个文本片段、8至10行划分为一个文本片段)。

本说明书实施例在构建话术知识库的过程中，根据业务处理模板中业务信息采集项与文本信息之间的匹配关系，对文本信息进行划分，以根据划分生成的各文本片段分别构建与各业务信息采集项对应的话术知识库，有利于保证构建的各业务信息采集项的话术知识库的有效性及准确性。

另外，确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，还可通过以下方式实现：

基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

将所述待采集信息与所述文本信息输入预训练的语义匹配模型进行相似度计算；

根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

具体的，可通过语义匹配模型(enhancedsequentialinferencemodel，esim)对所述待采集信息和所述文本信息进行相似度计算。

本说明书实施例借助语义匹配模型对待采集信息和文本信息进行相似度计算，既有利于保证计算结果的准确性，又有利于提高计算过程的效率。

此外，在实际应用中，由于面访过程中，业务发起方多通过向用户进行提问的方式来采集用户的审核信息，因此，可通过确定文本句式的方式确定目标对话角色，具体可将各对话角色的文本中，陈述疑问句式较多的对话角色确定为目标对话角色。

步骤106，获取所述文本片段中所述目标对话角色的问题文本间的关联关系。

具体的，由于本说明书实施例需通过目标业务的历史多媒体业务数据构建所述目标业务的话术知识库，以在实际应用过程中，根据所述话术知识库中各话术之间的关联关系为用户推荐在面访过程中可使用的话术链路，从而通过所述话术链路中的话术信息挖掘更加有效的审核材料信息。

因此，在话术知识库的构建过程中，即需要构建文本片段中所述目标对话角色的问题文本间的关联关系，以根据所述关联关系生成所述话术链路。

具体实施时，获取所述文本片段中所述目标对话角色的问题文本间的关联关系，具体可将所述文本片段输入自然语言处理模型进行关联度计算，生成所述文本片段中所述目标对话角色的问题文本间的关联度计算结果，根据所述关联度计算结果确定所述文本片段中所述目标对话角色的问题文本间的关联关系。

具体的，可通过数据自然语言处理模型(naturallanguageprocessing，nlp)对所述文本片段中的问题文本做关联度计算，生成文本片段中目标对话角色的问题文本间的关联度计算结果，从而根据所述关联度计算结果确定所述问题文本间的关联关系。

另外，还可通过确定文本片段中任意两个相邻问题文本间的关联关系，从而确定整个文本片段中目标对话角色的全部问题文本间的关联关系，具体可通过以下方式实现：

获取所述文本片段中，所述目标对话角色的第i条问题文本、所述第i条问题文本的答案文本以及第i+1条问题文本的语义信息；

具体的，文本片段中包含目标对话角色的n条问题文本，可通过确定任意两条相邻的问题文本间是否存在关联关系，从而确定整个文本片段中所述目标对话角色的问题文本间的关联关系。

例如，若文本片段中包含目标对话角色的5条问题文本，其中，若确定所述目标对话角色的第2条问题文本与第3条问题文本之间是否存在关联关系，则具体需根据目标对话角色的第2条问题文本、第3条问题文本以及第2条问题文本对应的答案文本来确定这一关联关系。

在实际的面访过程中，为保证面访所获得的审核信息的有效性，则需业务发起方实时的根据用户的答复信息对下一个面访提问信息进行调整，而具体的调整策略则需由话术知识库给出，因此，在构建话术知识库的过程中，则需确定文本片段中目标对话角色的问题文本间的关联关系，以为根据所述关联关系生成可供业务发起方参考的话术链路奠定基础。

步骤108，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

具体的，确定文本片段中目标对话角色的问题文本间的关联关系后，即可根据所述关联关系进一步筛选目标文本以构建话术知识库。

具体实施时，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，具体可通过以下方式实现：

确定存在关联关系的问题文本的文本长度，和/或存在关联关系的问题文本的文本数量；

根据所述文本长度，和/或所述文本数量筛选所述目标对话角色的目标问题文本。

另外，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，还可通过以下方式实现：

将存在关联关系的问题文本以及与所述问题文本对应的答案文本组成文本对，并计算所述文本对的信息熵；

根据所述信息熵筛选所述文本片段中所述目标对话角色的目标问题文本。

具体的，本说明书实施例可以从文本长度、问题文本数量以及信息熵三个维度对目标问题文本的质量进行评估；

其中，由于通过答案长度可直观的反映用户答案的长短，通常情况下，可能用户的答案越长，其包含的有效信息则可能越多，因此，可结合问题文本及其对应答案文本的文本长度，共同筛选目标问题文本，具体可将存在关联关系的问题文本中，问题文本及其答案文本的文本长度之和大于预设长度阈值的问题文本作为目标问题文本。

另外，由于问题文本的数量可用于反映业务发起方与用户之间问答交互的次数，问题文本的数量越多，则表明二者之间的问答交互次数越多，可进一步表明问题文本的深度越深，对应的答案文本中包含的信息越有效，因此，可将多组存在关联关系的问题文本中，文本数量大于预设数量阈值的一组、两组或多组问题文本作为目标问题文本。

此外，由于信息熵是事件不确定性的度量，若将问题文本和答案文本组成文本对，则文本对的信息熵即可用于表征答案文本相对于问题文本的准确性，信息熵越小，则表明答案越准确，进而表明这一问题越有效，因此，可将存在关联关系的问题文本及其对应的答案文本组成的文本对中，信息熵小于预设信息熵阈值的文本对中的问题文本作为目标问题文本。

或者，若同时从文本长度、文本数量以及信息熵三个维度筛选问题文本，则可按照三个维度分别对应的权重进行加权计算，以筛选目标问题文本。

从文本长度、文本数量以及信息熵这三个维度筛选目标问题文本，有利于提升筛选获得的目标问题文本有效性。

除此之外，筛选获得目标问题文本后，还需对所述目标问题文本进行审核，以确定所述目标问题文本与预先由人工构建的初始话术剧本中的话术是否匹配，以根据匹配结果对所述初始话术剧本进行更新。

例如，初始话术剧本中并未包含询问“你是否有高血压”这一节点，但通过对历史多媒体业务数据进行处理，最后筛选出的目标问题文本中包含“你是否有高血压”，并且这一目标问题文本与初始话术剧本中关于高血压这一询问模块的语义匹配度较高，则可将“你是否有高血压”这一目标问题文本添加到初始话术剧本中关于高血压这一询问模块，以实现对初始话术剧本的更新。

对初始话术剧本进行更新生成话术知识库后，可将其存储至业务平台供业务发起方使用，并且后期还可继续对所述话术知识库进行迭代更新。

此外，还可基于话术知识库为业务发起方进行话术推荐，通过采集用户的语音数据，并对所述语音数据进行语义分析，根据语义分析结果在所述话术知识库中筛选与所述语音数据匹配的话术推荐信息，并推荐至所述用户。

通过这种方式为业务发起方推荐话术，有利于在业务发起方进行面访过程中，为业务发起方实时推荐更加优质的话术，从而有利于使得业务发起方获取更加有效的审核材料信息。

本说明书实施例提供的业务处理过程的示意图如图2所示，首先获取目标业务的历史多媒体业务数据(音频文件)，将音频文件转为文本信息(语音转文字)，再根据业务处理模板中各信息采集项的语义信息对文本信息进行切割，生成多个文本片段；然后从各文本片段中筛选优质话术，并对筛选结果中的优质话术进行评分，根据评分结果确定目标话术，再对目标话术进行校验，校验通过的情况下，利用所述目标话术对初始话术剧本进行更新(所述初始话术剧本由人工基于用户基本信息、商保/社保、体检以及既往病史等信息采集项构建)；将更新后的话术进行存储，后期可通过对存储的话术进行评估，以不断对所述话术进行迭代优化，从而构建话术生成、话术存储、话术评估优化的一个闭环。

下述结合附图3，以本说明书提供的业务处理方法在理赔场景的应用为例，对所述业务处理方法进行进一步说明。其中，图3示出了本说明书一个实施例提供的一种业务处理方法的处理过程流程图，具体步骤包括步骤302至步骤322。

步骤302，获取理赔业务中包含至少两个对话角色的历史面访视频数据。

步骤304，对所述历史面访视频数据进行语音识别，获得识别生成的文本信息。

步骤306，基于所述理赔业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息。

步骤308，将所述待采集信息与所述文本信息输入预训练的语义匹配模型进行相似度计算。

步骤310，根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

步骤312，根据所述语义匹配结果将所述文本信息划分为至少一个文本片段。

步骤314，根据文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色。

步骤316，将所述文本片段输入自然语言处理模型进行关联度计算，生成所述文本片段中所述目标对话角色的问题文本间的关联度计算结果。

步骤318，根据所述关联度计算结果确定所述文本片段中所述目标对话角色的问题文本间的关联关系。

步骤320，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本。

步骤322，基于所述目标问题文本构建所述理赔业务的话术知识库。

本说明书实施例通过理赔业务的历史面访视频数据构建话术知识库，降低了话术知识库构建的复杂度以及知识库维护难度，并且提高了构建效率；另外，通过将历史面访视频数据的文本信息进行文本片段划分，并根据不同文本片段构建不同业务信息采集项对应的话术知识库，有利于提升所述话术知识库的覆盖率，并进一步保证构建的话术知识库中所包含话术的准确性。

与上述方法实施例相对应，本说明书还提供了业务处理装置实施例，图4示出了本说明书一个实施例提供的一种业务处理装置的示意图。如图4所示，该装置包括：

转换模块402，被配置为获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息；

划分模块404，被配置为将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色；

获取模块406，被配置为获取所述文本片段中所述目标对话角色的问题文本间的关联关系；

构建模块408，被配置为根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

可选地，所述转换模块402，包括：

语音识别子模块，被配置为对所述历史多媒体业务数据进行语音识别，获得识别生成的文本信息。

可选地，所述划分模块404，包括：

划分子模块，被配置为确定所述目标业务的业务处理模板中，至少一个业务信息采集项与所述文本信息的语义匹配结果，并根据所述语义匹配结果将所述文本信息划分为至少一个文本片段。

可选地，所述划分子模块，包括：

第一确定单元，被配置为基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

第一计算单元，被配置为将所述待采集信息与所述文本信息进行语义相似度计算；

第二确定单元，被配置为根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

可选地，所述划分子模块，包括：

第三确定单元，被配置为基于所述目标业务的业务处理模板中的至少一个业务信息采集项，确定与所述至少一个业务信息采集项对应的待采集信息；

第二计算单元，被配置为将所述待采集信息与所述文本信息输入预训练的语义匹配模型进行相似度计算；

第四确定单元，被配置为根据计算结果确定所述至少一个业务信息采集项与所述文本信息的语义匹配结果。

可选地，所述获取模块406，包括：

关联度计算子模块，被配置为将所述文本片段输入自然语言处理模型进行关联度计算，生成所述文本片段中所述目标对话角色的问题文本间的关联度计算结果；

第一获取子模块，被配置为根据所述关联度计算结果确定所述文本片段中所述目标对话角色的问题文本间的关联关系。

可选地，所述获取模块406，包括：

第二获取子模块，被配置为获取所述文本片段中，所述目标对话角色的第i条问题文本、所述第i条问题文本的答案文本以及第i+1条问题文本的语义信息；

第三确定子模块，被配置为基于所述语义信息确定所述第i条问题文本与第i+1条问题文本间的关联关系，其中，i∈[1，n-1]，n为所述文本片段中目标对话角色的问题文本的条数，且n为正整数。

可选地，所述构建模块408，包括：

文本信息确定子模块，被配置为确定存在关联关系的问题文本的文本长度，和/或存在关联关系的问题文本的文本数量；

第一筛选子模块，被配置为根据所述文本长度，和/或所述文本数量筛选所述目标对话角色的目标问题文本。

可选地，所述构建模块408，包括：

信息熵计算子模块，被配置为将存在关联关系的问题文本以及与所述问题文本对应的答案文本组成文本对，并计算所述文本对的信息熵；

第二筛选子模块，被配置为根据所述信息熵筛选所述文本片段中所述目标对话角色的目标问题文本。

可选地，所述业务处理装置，还包括：

采集模块，被配置为采集用户的语音数据，并对所述语音数据进行语义分析；

推荐模块，被配置为根据语义分析结果在所述话术知识库中筛选与所述语音数据匹配的话术推荐信息，并推荐至所述用户。

上述为本实施例的一种业务处理装置的示意性方案。需要说明的是，该业务处理装置的技术方案与上述的业务处理方法的技术方案属于同一构思，业务处理装置的技术方案未详细描述的细节内容，均可以参见上述业务处理方法的技术方案的描述。

图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接，数据库550用于保存数据。

计算设备500还包括接入设备540，接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(nic))中的一个或多个，诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口，等等。

在本说明书的一个实施例中，计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图5所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备500可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或pc的静止计算设备。计算设备500还可以是移动式或静止式的服务器。

其中，所述存储器510用于存储计算机可执行指令，处理器520用于执行计算机可执行指令以用于实现所述业务处理方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的业务处理方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述业务处理方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时以用于实现所述业务处理方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的业务处理方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述业务处理方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许瑾
技术所有人：支付宝(杭州)信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。