模型在线更新方法及其装置、设备、介质与流程

文档序号：35398055发布日期：2023-09-09 17:07阅读：46来源：国知局

本技术涉及电商，尤其涉及一种模型在线更新方法及其相应的装置、计算机设备、计算机可读存储介质。

背景技术：

1、在电商领域中，自动化智能回复客服的线上服务是不可或缺的电商业务，为了能够提供优质的所述线上服务，支持线上服务的模型需要不断地迭代，迭代后的新模型需要更新迭代前的旧模型。

2、传统技术中，通常采用离线更新，即选择在凌晨时分等少人使用自动化智能回复客服的线上服务的时候，停止当前旧模型提供的线上服务，将新模型部署，长时间处理完海量的业务数据后，以新模型替换旧模型提供线上服务，重启线上服务，可见模型更新过程中长时间中断现有的线上服务，对线上业务造成非常大的影响，由于不能提供业务服务，用户会因为无法完成操作而感到焦虑和失望，这会影响用户的满意度和忠诚度，甚至可能导致客户流失，此外，通常业务数据体量大，基本上无时无刻都在写入数据库存储，而模型处理业务数据的速度有限，故而可能会出现模型重复处理同一业务数据，以及模型处理已经写入的静态业务数据和实时持续写入的动态业务数据可能出现紊乱，导致未处理完成所需处理的所有业务数据便处理失败，无法更新。

3、鉴于传统技术的不足，本技术人长期从事相关领域的研究，为解决电商领域业内难题，故另辟蹊径。

技术实现思路

1、本技术的首要目的在于解决上述问题至少之一而提供一种模型在线更新方法及其相应的装置、计算机设备、计算机可读存储介质。

2、为满足本技术的各个目的，本技术采用如下技术方案：

3、适应本技术的目的之一而提供的一种模型在线更新方法，包括如下步骤：

4、响应旧模型更新请求，部署新模型，持续推送数据库中属于增量的相似问至消息中间件中的实时队列；

5、记录当前数据库中的最新相似问的数据位点，推送当前数据库中的所有相似问至消息中间件中的历史队列；

6、拉取所述历史队列中的所有相似问调用所述新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库；

7、拉取所述实时队列中的所述数据位点之后的所有相似问调用所述新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库；

8、当所述新模型处理的相似问的时间戳，与当前时间相差小于预设阈值时，以所述新模型更新旧模型。

9、进一步的实施例中，拉取所述实时队列中的所述数据位点之后的所有相似问调用所述新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库，包括如下步骤：

10、拉取所述实时队列中的所述数据位点之后的所有相似问，识别每个相似问对应预设的幂等键，所述幂等键表示相应的相似问是否被处理；

11、当所述幂等键表示相应的相似问未被处理，调用所述新模型处理该幂等键的相似问，获得相应的向量化表示，当所述幂等键表示相应的相似问被处理，跳过对该幂等键的相似问的处理。

12、进一步的实施例中，以所述新模型更新旧模型，包括如下步骤：

13、获取所述数据库中调用所述新模型处理的相似问及其向量化表示；

14、根据每两个相似问之间是否相似，确定出相应的正样本和负样本，所述正样本中的两个相似问之间相似，所述负样本中的两个相似问之间不相似；

15、将所述正样本和所述负样本中对应的两个相似问的向量化表示之间的相似度作为预测值，评估出所述新模型的准确度；

16、当所述准确度达到预设标准时，确定所述新模型通过校验，以所述新模型替换旧模型上线；

17、当所述准确度未达到预设标准时，确定所述新模型不通过校验，响应旧模型更新失败事件。

18、进一步的实施例中，根据每两个相似问之间是否相似，确定出相应的正样本和负样本，所述正样本中的两个相似问之间相似，所述负样本中的两个相似问之间不相似，包括如下步骤：

19、采用聚类算法对多个相似问进行聚类，确定出多个相似问群，不同的相似问群对应表达不同的意图；

20、将同一相似问群中的距离类簇中心点最近的两个相似问构造为正样本，将同一相似问群中的表达不同意图的两个相似问构造为负样本。

21、进一步的实施例中，以所述新模型替换旧模型上线之后，包括如下步骤：

22、保留下线的所述旧模型与所述新模型并行工作；

23、响应新模型异常事件，以所述旧模型替换所述新模型上线；

24、响应旧模型下线事件，下线所述旧模型，删除数据库中调用所述旧模型处理的相似问的向量化表示。

25、进一步的实施例中，响应旧模型更新失败事件，包括如下步骤：

26、获取数据库中调用旧模型处理的相似问及其向量化表示，构造出正样本和负样本，根据正样本和负样本中分别的两个相似问的向量化表示之间的相似度，相应标注正样本和负样本分别的监督标签，所述正样本中两个相似问之间相似，所述负样本中两个相似问之间不相似；

27、调用所述新模型对所述正样本和负样本进行处理，获得正样本和负样本中分别的两个相似问的向量化表示，计算出两个相似问的向量化表示之间的相似度，获得所述正样本和负样本分别的预测值；

28、采用所述正样本和负样本分别的监督标签，确定所述正样本和负样本分别的预测值的损失值，在所述损失值未达到预设阈值时，对新模型实施权重更新，并继续调用其他正样本和负样本实施迭代训练直至新模型收敛。

29、进一步的实施例中，以所述新模型更新旧模型之后，包括如下步骤：

30、响应客服回复请求，获取用户输入的提问文本；

31、调用所述新模型对所述提问文本进行处理，获得相应的向量化表示；

32、根据所述提问文本的向量化表示，确定出数据库中与所述提问文本相匹配的相似问，获取所述相似问关联的答案作为回复文本推送给用户。

33、另一方面，适应本技术的目的之一而提供的一种模型在线更新装置，包括请求响应模块、历史推送模块、历史处理模块、实时处理模块以及模型更新模块，其中，请求响应模块，用于响应旧模型更新请求，部署新模型，持续推送数据库中属于增量的相似问至消息中间件中的实时队列；历史推送模块，用于记录当前数据库中的最新相似问的数据位点，推送当前数据库中的所有相似问至消息中间件中的历史队列；历史处理模块，用于拉取所述历史队列中的所有相似问调用所述新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库；实时处理模块，用于拉取所述实时队列中的所述数据位点之后的所有相似问调用所述新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库；模型更新模块，用于当所述新模型处理的相似问的时间戳，与当前时间相差小于预设阈值时，以所述新模型更新旧模型。

34、进一步的实施例中，所述实时处理模块，包括：幂等键识别子模块，用于拉取所述实时队列中的所述数据位点之后的所有相似问，识别每个相似问对应预设的幂等键，所述幂等键表示相应的相似问是否被处理；幂等键处理子模块，用于当所述幂等键表示相应的相似问未被处理，调用所述新模型处理该幂等键的相似问，获得相应的向量化表示，当所述幂等键表示相应的相似问被处理，跳过对该幂等键的相似问的处理。

35、进一步的实施例中，所述模型更新模块，包括：数据获取子模块，用于获取所述数据库中调用所述新模型处理的相似问及其向量化表示；正负样本确定子模块，用于根据每两个相似问之间是否相似，确定出相应的正样本和负样本，所述正样本中的两个相似问之间相似，所述负样本中的两个相似问之间不相似；准确度评估子模块，用于将所述正样本和所述负样本中对应的两个相似问的向量化表示之间的相似度作为预测值，评估出所述新模型的准确度；校验通过子模块，用于当所述准确度达到预设标准时，确定所述新模型通过校验，以所述新模型替换旧模型上线；校验不通过子模块，用于当所述准确度未达到预设标准时，确定所述新模型不通过校验，响应旧模型更新失败事件。

36、进一步的实施例中，所述正负样本确定子模块，包括：相似问聚类单元，用于采用聚类算法对多个相似问进行聚类，确定出多个相似问群，不同的相似问群对应表达不同的意图；正负样本构造单元，用于将同一相似问群中的距离类簇中心点最近的两个相似问构造为正样本，将同一相似问群中的表达不同意图的两个相似问构造为负样本。

37、进一步的实施例中，所述正负样本确定子模块之后，包括：并行并作子模块，用于保留下线的所述旧模型与所述新模型并行工作；第一事件响应子模块，用于响应新模型异常事件，以所述旧模型替换所述新模型上线；第二事件响应子模块，用于响应旧模型下线事件，下线所述旧模型，删除数据库中调用所述旧模型处理的相似问的向量化表示。

38、进一步的实施例中，所述校验不通过子模块，包括：样本构造标注单元，用于获取数据库中调用旧模型处理的相似问及其向量化表示，构造出正样本和负样本，根据正样本和负样本中分别的两个相似问的向量化表示之间的相似度，相应标注正样本和负样本分别的监督标签，所述正样本中两个相似问之间相似，所述负样本中两个相似问之间不相似；模型预测单元，用于调用所述新模型对所述正样本和负样本进行处理，获得正样本和负样本中分别的两个相似问的向量化表示，计算出两个相似问的向量化表示之间的相似度，获得所述正样本和负样本分别的预测值；迭代训练单元，用于采用所述正样本和负样本分别的监督标签，确定所述正样本和负样本分别的预测值的损失值，在所述损失值未达到预设阈值时，对新模型实施权重更新，并继续调用其他正样本和负样本实施迭代训练直至新模型收敛。

39、进一步的实施例中，所述模型更新模块之后，包括：提问获取模块，用于响应客服回复请求，获取用户输入的提问文本；提问处理模块，用于调用所述新模型对所述提问文本进行处理，获得相应的向量化表示；回复推送模块，用于根据所述提问文本的向量化表示，确定出数据库中与所述提问文本相匹配的相似问，获取所述相似问关联的答案作为回复文本推送给用户。

40、又一方面，适应本技术的目的之一而提供的一种计算机设备，包括中央处理器和存储器，所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的模型在线更新方法的步骤。

41、又一方面，适应本技术的另一目的而提供的一种计算机可读存储介质，其以计算机可读指令的形式存储有依据所述的模型在线更新方法所实现的计算机程序，该计算机程序被计算机调用运行时，执行该方法所包括的步骤。

42、本技术的技术方案存在多方面优势，包括但不限于如下各方面：

43、本技术响应旧模型更新请求，部署新模型，持续推送数据库中属于增量的相似问至消息中间件中的实时队列，记录当前数据库中的最新相似问的数据位点，推送当前数据库中的所有相似问至消息中间件中的历史队列，拉取历史队列中的所有相似问调用新模型进行处理，获得每个相似问对应的向量化表示存储至所述数据库，拉取实时队列中的所述数据位点之后的所有相似问调用新模型进行处理，获得每个相似问对应的向量化表示存储至数据库，当新模型处理的相似问的时间戳，与当前时间相差小于预设阈值时，以所述新模型更新旧模型。一方面，将数据库中动态增量的相似问数据暂放在消息队列中的实时队列，以及将数据库中静态已有的相似问暂放在消息中间件中的历史队列，实现动态业务数据和静态业务数据之间的隔离，相互之间的操作互不干扰，在保证数据的稳定性和可靠性的基础上，能够有序无误地处理动静态的所有业务数据。另一方面，在不影响正常的模型提供的线上服务情况下，实现令用户无法感知到的线上更新模型，提升用户体验，方便随时更新。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨鹏
技术所有人：广州商研网络科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。