基于对比学习的智能对话问答方法及系统与流程

文档序号：37152517发布日期：2024-02-26 17:08阅读：31来源：国知局

本技术涉及智能问答，尤其涉及基于对比学习的智能对话问答方法及系统。

背景技术：

1、随着互联网的普及和快速发展，企业、网站和应用的用户量不断增长，对应的客户服务需求也日益增长。传统的客服方式往往无法满足大规模、高效率、个性化的服务需求。智能客服系统在金融、教育、电商等行业得到了广泛应用。

2、传统的智能客服系统主要采用的是基于规则的方法或基于深度学习的方法进行问答匹配。然而，对于复杂的问题，基于规则的方法难以覆盖所有场景，基于深度学习的方法虽然提高了问答匹配的准确性，但模型参数庞大，计算复杂高，导致实时性较差，同时，传统方式无法精准识别问题内容，因此易导致错误回答问题，且无法保证生成的答案准确性且存在语义不可控等问题，导致用户体验不佳。也就是说，现有的智能客服系统在问题识别、答案检索、响应时间等方面仍存在一定的局限性。

技术实现思路

1、鉴于此，本技术实施例提供了基于对比学习的智能对话问答方法及系统，以消除或改善现有技术中存在的一个或更多个缺陷。

2、本技术的一个方面提供了一种基于对比学习的智能对话问答方法，包括：

3、将目标问题数据输入语义表达智能识别模型，以使该语义表达识别模型输出所述目标问题数据对应的语义表达向量，其中，所述语义表达识别模型预先以预设的语义向量化框架和对比学习方式，采用样本空间对预训练模型进行微调训练后得到；所述样本空间包括：相似正负样本对、不相似正负样本对以及基于文本生成式对话大语言模型生成的负样本；

4、自预设的开源向量数据库中检索所述语义表达向量对应的多个相似问题向量，并基于所述语义表达识别模型对应的阈值判断多个所述相似问题向量中是否包含有所述目标问题数据对应的目标相似问题向量，若是，则输出该目标相似问题向量对应的对话问答数据。

5、在本技术的一些实施例中，在所述将目标问题数据输入语义表达智能识别模型之前，还包括：

6、基于预设的分层响应策略自交互界面获取用户提出的对话问题数据；

7、对所述对话问题数据进行预处理，以得到对应的目标问题数据，所述预处理包括：敏感词汇识别、同义词替换和符号替换中的至少一项。

8、在本技术的一些实施例中，所述交互界面用于展示热门问题数据以及在用户输入词汇的过程中显示提示问题数据；

9、相对应的，所述基于预设的分层响应策略自交互界面获取用户提出的对话问题数据，包括：

10、若接收到用户自所述交互界面展示的各个所述热门问题数据选取的任一热门问题数据，则将该热门问题数据确定为用户当前提出的对话问题数据；

11、若检测到用户在输入词汇，则根据最长公共子串改进算法，根据用户已输入的词汇和预设知识库中的问题句子计算出最长公共子串长度，并基于该最长公共子串长度在所述交互界面中显示多个所述提示问题数据，若接收到用户自各个所述提示问题数据中选取的任一提示问题数据，则将选取的该提示问题数据确定为用户当前提出的对话问题数据；

12、若接收到用户直接输入的由多个词汇组成的问题句子数据，则将该问题句子数据确定为用户当前提出的对话问题数据。

13、在本技术的一些实施例中，在所述将目标问题数据输入语义表达智能识别模型之前，还包括：

14、判断本地是否存储有语义表达智能识别模型，若否，则以流水线方式构建相似正负样本对及不相似正负样本，并基于文本生成式对话大语言模型生成的负样本，以形成对应的样本空间；

15、以预设的语义向量化框架和对比学习方式，采用样本空间对预训练模型进行微调训练，以得到对应的语义表达智能识别模型。

16、在本技术的一些实施例中，在所述基于所述语义表达识别模型对应的阈值判断多个所述相似问题向量中是否包含有所述目标问题数据对应的目标相似问题向量之前，还包括：

17、判断本地是否存储有所述语义表达智能识别模型对应的阈值，若否，则基于约登指数算法构建所述阈值。

18、在本技术的一些实施例中，所述输出该目标相似问题向量对应的对话问答数据，包括：

19、若所述目标相似问题向量有多个，则输出各个所述目标相似问题各自对应的问题数据以供用户选择，并在接收到用户自各个所述目标相似问题各自对应的问题数据中选择的一个问题数据后，自所述开源向量数据库中提取被用户选择的该问题数据对应的答案数据，并将被用户选择的该问题数据和对应的答案数据作为所述对话问答数据以进行输出；

20、若所述目标相似问题向量有一个，则自所述开源向量数据库中提取该问题数据对应的答案数据，并将该问题数据和对应的答案数据作为所述对话问答数据以进行输出；

21、相对应的，所述基于对比学习的智能对话问答方法还包括：

22、若经判断获知多个所述相似问题向量中不包含有所述目标问题数据对应的目标相似问题向量，则输出预设的无答案澄清话术数据。

23、在本技术的一些实施例中，还包括：

24、输出针对所述对话问答数据的评价选项提示信息，以使用户选择对应的评价选项；

25、将用户选择的所述评价选项存储至本地预设的模型迭代数据库中。

26、本技术的另一个方面提供了一种基于对比学习的智能对话问答系统，包括：

27、问题识别模块，用于将目标问题数据输入语义表达智能识别模型，以使该语义表达识别模型输出所述目标问题数据对应的语义表达向量，其中，所述语义表达识别模型预先以预设的语义向量化框架和对比学习方式，采用样本空间对预训练模型进行微调训练后得到；所述样本空间包括：相似正负样本对、不相似正负样本对以及基于文本生成式对话大语言模型生成的负样本；

28、答案检索模块，用于自预设的开源向量数据库中检索所述语义表达向量对应的多个相似问题向量，并基于所述语义表达识别模型对应的阈值判断多个所述相似问题向量中是否包含有所述目标问题数据对应的目标相似问题向量，若是，则输出该目标相似问题向量对应的对话问答数据。

29、本技术的第三个方面提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述的基于对比学习的智能对话问答方法。

30、本技术的第四个方面提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的基于对比学习的智能对话问答方法。

31、本技术提供的基于对比学习的智能对话问答方法，将目标问题数据输入语义表达智能识别模型，以使该语义表达识别模型输出所述目标问题数据对应的语义表达向量，其中，所述语义表达识别模型预先以预设的语义向量化框架和对比学习方式，采用样本空间对预训练模型进行微调训练后得到；所述样本空间包括：相似正负样本对、不相似正负样本对以及基于文本生成式对话大语言模型生成的负样本；自预设的开源向量数据库中检索所述语义表达向量对应的多个相似问题向量，并基于所述语义表达识别模型对应的阈值判断多个所述相似问题向量中是否包含有所述目标问题数据对应的目标相似问题向量，若是，则输出该目标相似问题向量对应的对话问答数据，也就是说，本技术提高的方法通过采用深度学习的人工智能算法模型，能够解决基于规则方法存在的难以覆盖所有场景的问题，如语义表达相似的不同句子的答案检索，进而能够有效提高智能对话问答的适用广泛性；通过构造相似和不相似的正负样本对作为样本集，能够解决语义空间向量表达不准确的问题，进而能够提供更好的效果评估方式，通过在答案检索阶段采用阈值，能够使得模型更加稳定，答案检索更准确，因此，能够在降低计算复杂度的基础上，有效提高问题识别及答案检索的准确性及实时性，能够有效提高智能对话问答的智能化程度和响应速度，进而能够提高用户体验。

32、本技术的附加优点、目的，以及特征将在下面的描述中将部分地加以阐述，且将对于本领域普通技术人员在研究下文后部分地变得明显，或者可以根据本技术的实践而获知。本技术的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。

33、本领域技术人员将会理解的是，能够用本技术实现的目的和优点不限于以上具体所述，并且根据以下详细说明将更清楚地理解本技术能够实现的上述和其他目的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗衍潮
技术所有人：中企云链股份有限公司
我是此专利的发明人

上一篇：一种运载火箭防热板及参数确定方法与流程
上一篇：分布式Key-Value存储处理方法、系统、计算设备及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。