联想词推荐方法、装置、非易失性存储介质和计算机设备与流程

文档序号:37385072发布日期:2024-03-22 10:37阅读:10来源:国知局
联想词推荐方法、装置、非易失性存储介质和计算机设备与流程

本发明涉及数据处理领域,具体而言,涉及一种联想词推荐方法、装置、非易失性存储介质和计算机设备。


背景技术:

1、电商搜索算法是电商平台为了提供准确的搜索结果所采用的算法。这些算法通常基于大数据分析和机器学习技术,结合用户行为和商品信息,以更好地满足用户的搜索需求。联想词算法是一种常用于电商搜索的技术,可以通过分析用户输入的关键词,提供与之相关的联想词或推荐搜索词,以帮助用户更快速地找到他们想要的商品。但相关技术中为用户提供联想词的方法中仍存在一些缺点:1、缺乏对用户个性化需求的理解和反馈,无法满足用户的个性化需求。2、往往依赖于文本语境,无法准确理解用户的实际需求,导致提供的关联词不够精准。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种联想词推荐方法、装置、非易失性存储介质和计算机设备,以至少解决相关技术中为用户提供联想词无法理解用户的实际需求,导致提供的关联词不够准确的技术问题。

2、根据本发明实施例的一个方面,提供了一种联想词推荐方法,包括:接收目标账户输入的关键词;将关键词输入大语言模型中,由大语言模型确定与关键词相关的多个联想词,其中,大语言模型通过在原始大语言模型的基础上采用第一训练样本进行调整得到,第一训练样本包括样本关键词与样本联想词的第一样本对应关系,以及第一样本对应关系的标签,第一样本对应关系的标签用于描述样本关键词与样本联想词是否存在关联;将多个联想词排序,得到联想词序列;向目标账户返回联想词序列。

3、可选地,将关键词输入大语言模型中,由大语言模型确定与关键词相关的多个联想词,包括:将关键词输入第一大语言模型,由第一大语言模型生成与关键词相关的多个备选联想词,其中,大语言模型包括第一大语言模型,第一大语言模型通过在第一原始大语言模型的基础上采用第二训练样本进行调整得到,第二训练样本包括样本备选联想词,以及样本备选联想词的标签,样本备选联想词的标签用于描述样本备选联想词是否为具有语义含义的词汇,原始大语言模型包括第一原始大语言模型;将关键词和多个备选联想词输入第二大语言模型,由第二大语言模型在多个备选联想词中选出多个联想词,其中,大语言模型包括第二大语言模型,第二大语言模型通过在第二原始大语言模型的基础上采用第一训练样本进行调整得到,原始大语言模型包括第二原始大语言模型。

4、可选地,将关键词和多个备选联想词输入第二大语言模型,由第二大语言模型在多个备选联想词中选出多个联想词,包括:将多个备选联想词输入相似度匹配单元,由相似度匹配单元输出多个备选联想词分别与关键词的相似度;基于第二大语言模型中设定的参数,按照相似度从高到低的顺序,在多个备选联想词分别与关键词的相似度中,输出数量与参数匹配的联想词作为多个联想词。

5、可选地,在关键词为商品信息的情况下,第二大语言模型通过如下方式训练:获取样本商品信息和第一训练样本;采用样本商品信息作为训练集,对第二原始大语言模型进行语义训练,得到语义训练后的第二原始大语言模型,其中,语义训练后的第二原始大语言模型能够识别商品信息的语义特征;采用第一训练样本训练语义训练后的第二原始大语言模型,得到第二大语言模型。

6、可选地,获取第一训练样本,包括:获取第二训练样本和样本关键词;采用第二训练样本对第一原始大语言模型进行训练,得到第一大语言模型;将样本关键词输入第一大语言模型,由第一大语言模型输出样本关键词对应的正样本联想词;随机组词作为样本关键词对应的负样本联想词;根据样本关键词、正样本联想词和负样本联想词,确定第一训练样本。

7、可选地,将多个联想词排序,得到联想词序列,包括:获取目标账户的历史浏览记录;将多个联想词和历史浏览记录输入第三大语言模型,由第三大语言模型输出与多个联想词一一对应的多个点击概率,其中,第三大语言模型通过在第三原始大语言模型的基础上采用第三训练样本进行调整得到,第三训练样本包括样本账户输入的关键词与样本账户待选择联想词的第三样本对应关系,样本账户的样本历史浏览记录,以及第三样本对应关系的标签,第三样本对应关系的标签为被样本账户选择的联想词;根据多个点击概率,将多个联想词排序,得到联想词序列。

8、可选地,在关键词为商品信息的情况下,还包括:获取目标账户在联想词序列中选中的目标联想词;根据历史浏览记录、联想词序列和目标联想词,调整第三原始大语言模型。

9、根据本发明实施例的另一方面,还提供了一种联想词推荐装置,包括:接收模块,用于接收目标账户输入的关键词;确定模块,用于将关键词输入大语言模型中,由大语言模型确定与关键词相关的多个联想词,其中,大语言模型通过在原始大语言模型的基础上采用第一训练样本进行调整得到,第一训练样本包括样本关键词与样本联想词的第一样本对应关系,以及第一样本对应关系的标签,第一样本对应关系的标签用于描述样本关键词与样本联想词是否存在关联;排序模块,用于将多个联想词排序,得到联想词序列;返回模块,用于向目标账户返回联想词序列。

10、根据本发明实施例的又一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行上述中任意一项联想词推荐方法。

11、根据本发明实施例的再一方面,还提供了一种计算机设备,计算机设备包括处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项联想词推荐方法。

12、在本发明实施例中,采用联想词推荐方法,通过接收目标账户输入的关键词;将关键词输入大语言模型中,由大语言模型确定与关键词相关的多个联想词,其中,大语言模型通过在原始大语言模型的基础上采用第一训练样本进行调整得到,第一训练样本包括样本关键词与样本联想词的第一样本对应关系,以及第一样本对应关系的标签,第一样本对应关系的标签用于描述样本关键词与样本联想词是否存在关联;将多个联想词排序,得到联想词序列;向目标账户返回联想词序列,达到了理解用户的实际需求的目的,从而实现了提高推荐的联想词精度的技术效果,进而解决了相关技术中为用户提供联想词无法理解用户的实际需求,导致提供的关联词不够准确的技术问题。



技术特征:

1.一种联想词推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述关键词输入大语言模型中,由所述大语言模型确定与所述关键词相关的多个联想词,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述关键词和所述多个备选联想词输入第二大语言模型,由所述第二大语言模型在所述多个备选联想词中选出所述多个联想词,包括:

4.根据权利要求2所述的方法,其特征在于,在所述关键词为商品信息的情况下,所述第二大语言模型通过如下方式训练:

5.根据权利要求2所述的方法,其特征在于,获取所述第一训练样本,包括:

6.根据权利要求1所述的方法,其特征在于,所述将所述多个联想词排序,得到联想词序列,包括:

7.根据权利要求6所述的方法,其特征在于,在所述关键词为商品信息的情况下,还包括:

8.一种联想词推荐装置,其特征在于,包括:

9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述联想词推荐方法。

10.一种计算机设备,其特征在于,包括:存储器和处理器,


技术总结
本发明公开了一种联想词推荐方法、装置、非易失性存储介质和计算机设备。其中,该方法包括:接收目标账户输入的关键词;将关键词输入大语言模型中,由大语言模型确定与关键词相关的多个联想词,其中,大语言模型通过在原始大语言模型的基础上采用第一训练样本进行调整得到,第一训练样本包括样本关键词与样本联想词的第一样本对应关系,以及第一样本对应关系的标签,第一样本对应关系的标签用于描述样本关键词与样本联想词是否存在关联;将多个联想词排序,得到联想词序列;向目标账户返回联想词序列。本发明解决了相关技术中为用户提供联想词无法理解用户的实际需求,导致提供的关联词不够准确的技术问题。

技术研发人员:李明超
受保护的技术使用者:天翼电子商务有限公司
技术研发日:
技术公布日:2024/3/21
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1