一种数据处理方法及相关装置与流程

文档序号:36390756发布日期:2023-12-15 08:56阅读:36来源:国知局
一种数据处理方法及相关装置与流程

本技术涉及人工智能领域,尤其涉及一种数据处理方法及相关装置。


背景技术:

1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

2、机器学习系统,包括个性化推荐系统,基于输入数据和标签,通过梯度下降等优化方法训练机器学习模型的参数,当模型参数收敛之后,可利用该模型来完成未知数据的预测。以个性化推荐系统中的点击率预测为例,其输入数据包括用户属性和商品属性等。如何根据用户的喜好,预测出个性化的推荐列表,对提升推荐系统的推荐精度有着重要的影响。

3、现有推荐系统基本都是封闭的系统,即模型在封闭系统的给定数据集上进行训练和部署。推荐系统中使用的数据局限于一个或几个特定的应用领域,与外部世界的知识隔离,因此限制了可以用于推荐模型学习的信息,从而导致模型的推荐精度较差。


技术实现思路

1、本技术提供了一种数据处理方法,可以提高推荐模型的精度。

2、第一方面,本技术提供了一种数据处理方法,所述方法包括:获取第一提示prompt,所述第一prompt包括用户的属性信息,且所述第一prompt指示根据所述用户的属性信息推测所述用户的喜好;根据所述第一prompt,通过大语言模型llm,得到第一信息;根据所述第一信息和第二信息,通过推荐模型,预测所述用户对物品的操作信息;所述第二信息为所述物品的属性信息。、本技术实施例中,利用prompt(也就是第一prompt)来引导llm推测用户的喜好,并将该喜好信息作为推荐模型的输入,结合了llm和传统推荐模型的优势,可以得到更精准、可解释性更强的推荐结果,从而提高了推荐模型的推荐精度。

3、在一种可能的实现中,所述第一prompt还包括所述用户的历史操作信息,且所述第一prompt具体指示根据所述用户的属性信息以及所述历史操作信息推测所述用户的喜好。

4、在一种可能的实现中,所述第一prompt还包括对所述用户对所述物品的喜好相关联的因素,且所述第一prompt具体指示根据用户的属性信息以及所述因素来分析所述用户的喜好。

5、在一种可能的实现中,所述因素为根据第三prompt,通过llm确定的,所述第三prompt指示确定与用户对所述物品的喜好相关联的因素。

6、在一种可能的实现中,所述第一信息与所述用户的喜好有关,且所述喜好为所述属性信息中不包含的。

7、在一种可能的实现中,所述第一prompt还指示确定推测出的所述用户的喜好的解释。

8、在一种可能的实现中,所述方法还包括:获取第二prompt,所述第二prompt指示提供所述物品的属性信息;根据所述第二prompt,通过llm,得到所述第二信息。

9、在一种可能的实现中,预设的数据库中物品的属性信息可能存在不全面的问题。可以通过prompt来引导llm对物品的属性信息进行丰富。

10、在一种可能的实现中,所述第二prompt具体指示提供与所述用户对所述物品的喜好相关联的因素相关的所述物品的属性信息。

11、在上述实施例中,第一prompt中可以包括对用户对物品的喜好相关的因素,该因素可以为物品的一些属性维度。这部分属性维度的信息可以在预设的数据库中缺失,因此可以通过prompt的方式引导llm提供。

12、在一种可能的实现中,所述第一信息为自然语言描述或者所述llm得到的特征表示。

13、在一种可能的实现中,所述第一信息为自然语言描述;所述方法还包括:

14、根据所述第一信息和所述第二信息,通过特征提取网络,得到所述第一信息的特征表示和所述第二信息的特征表示;所述根据所述第一信息和第二信息,通过推荐模型,预测所述用户对所述物品的操作信息,包括:根据所述第一信息的特征表示和所述第二信息的特征表示,通过推荐模型,预测所述用户对所述物品的操作信息。

15、在一种可能的实现中,所述特征提取网络包括:第一权重确定网络、第二权重确定网络、第一特征提取分支、第二特征提取分支和第三特征提取分支;所述根据所述第一信息和所述第二信息,通过特征提取网络,得到所述第一信息的特征表示和所述第二信息的特征表示,包括:根据所述第一信息,通过所述第一权重确定网络,确定所述第一特征提取分支对应的第一权重、以及所述第二特征提取分支对应的第二权重;根据所述第二信息,通过所述第二权重确定网络,确定所述第一特征提取分支对应的第三权重、以及所述第三特征提取分支对应的第四权重;根据所述第一信息,分别通过所述第一特征提取分支和所述第二特征提取分支,确定第一子特征和第二子特征;根据所述第二信息,分别通过所述第一特征提取分支和所述第三特征提取分支,确定第三子特征和第四子特征;根据所述第一权重和所述第二权重,对所述第一子特征和所述第二子特征进行融合,得到所述用户的特征表示;根据所述第三权重和所述第四权重,对所述第三子特征和所述第四子特征进行融合,得到所述物品的特征表示。

16、通过上述方式,通过混合多专家适配器,将文本信息由语义空间到推荐空间的映射,进行降维、噪声处理的同时保存有效信息。

17、在一种可能的实现中,属性信息包括用户的用户属性,用户属性包括如下的至少一种:性别,年龄,职业,收入,爱好,教育程度。

18、在一种可能的实现中,属性信息包括物品的物品属性,物品属性包括如下的至少一种:物品名称,开发者,安装包大小,品类,好评度。

19、其中,用户的属性信息可以为与用户喜好特征相关的属性,性别、年龄、职业、收入、爱好以及受教育程度中的至少一种,其中,性别可以为男或者女,年龄可以为0-100之间的数字,职业可以为教师、程序员、厨师等等,爱好可以为篮球、网球、跑步等等,受教育程度可以为小学、初中、高中、大学等等;本技术并不限定用户的属性信息的具体类型;

20、其中,物品可以为实体物品,或者是虚拟物品,例如可以为app、音视频、网页以及新闻资讯等物品,物品的属性信息可以为物品名称、开发者、安装包大小、品类以及好评度中的至少一种,其中,以物品为应用程序为例,物品的品类可以为聊天类、跑酷类游戏、办公类等等,好评度可以为针对于物品的打分、评论等;本技术并不限定物品的属性信息的具体类型。

21、在一种可能的实现中,第一方面介绍的方法可以为模型训练的前馈过程,或者是模型的推理过程。

22、在一种可能的实现中,所述方法还包括:在所述操作信息满足预设条件时,向所述用户推荐所述物品。

23、在一种可能的实现中,所述方法还包括:根据所述操作信息和对应的标签,更新所述推荐模型。

24、第二方面,本技术提供了一种数据处理装置,所述装置包括:

25、处理模块,用于获取第一提示prompt,所述第一prompt包括用户的属性信息,且所述第一prompt指示根据所述用户的属性信息推测所述用户的喜好;

26、根据所述第一prompt,通过大语言模型llm,得到第一信息;

27、根据所述第一信息和第二信息,通过推荐模型,预测所述用户对物品的操作信息;所述第二信息为所述物品的属性信息。

28、在一种可能的实现中,所述第一prompt还包括所述用户的历史操作信息,且所述第一prompt具体指示根据所述用户的属性信息以及所述历史操作信息推测所述用户的喜好。

29、在一种可能的实现中,所述第一prompt还包括对所述用户对所述物品的喜好相关联的因素,且所述第一prompt具体指示根据用户的属性信息以及所述因素来分析所述用户的喜好。

30、在一种可能的实现中,所述因素为根据第三prompt,通过llm确定的,所述第三prompt指示确定与用户对所述物品的喜好相关联的因素。

31、在一种可能的实现中,所述第一信息与所述用户的喜好有关,且所述喜好为所述属性信息中不包含的。

32、在一种可能的实现中,所述第一prompt还指示确定推测出的所述用户的喜好的解释。

33、在一种可能的实现中,所述处理模块,还用于:

34、获取第二prompt,所述第二prompt指示提供所述物品的属性信息;

35、根据所述第二prompt,通过llm,得到所述第二信息。

36、在一种可能的实现中,所述第二prompt具体指示提供与所述用户对所述物品的喜好相关联的因素相关的所述物品的属性信息。

37、在一种可能的实现中,所述第一信息为自然语言描述或者所述llm得到的特征表示。

38、在一种可能的实现中,所述第一信息为自然语言描述;所述处理模块,还用于:

39、根据所述第一信息和所述第二信息,通过特征提取网络,得到所述第一信息的特征表示和所述第二信息的特征表示;

40、所述处理模块,具体用于:

41、根据所述第一信息的特征表示和所述第二信息的特征表示,通过推荐模型,预测所述用户对所述物品的操作信息。

42、在一种可能的实现中,所述特征提取网络包括:第一权重确定网络、第二权重确定网络、第一特征提取分支、第二特征提取分支和第三特征提取分支;

43、所述处理模块,具体用于:

44、根据所述第一信息,通过所述第一权重确定网络,确定所述第一特征提取分支对应的第一权重、以及所述第二特征提取分支对应的第二权重;

45、根据所述第二信息,通过所述第二权重确定网络,确定所述第一特征提取分支对应的第三权重、以及所述第三特征提取分支对应的第四权重;

46、根据所述第一信息,分别通过所述第一特征提取分支和所述第二特征提取分支,确定第一子特征和第二子特征;

47、根据所述第二信息,分别通过所述第一特征提取分支和所述第三特征提取分支,确定第三子特征和第四子特征;

48、根据所述第一权重和所述第二权重,对所述第一子特征和所述第二子特征进行融合,得到所述用户的特征表示;

49、根据所述第三权重和所述第四权重,对所述第三子特征和所述第四子特征进行融合,得到所述物品的特征表示。

50、第三方面,本技术实施例提供了一种数据处理装置,可以包括存储器、处理器以及总线系统,其中,存储器用于存储程序,处理器用于执行存储器中的程序,以执行如上述第一方面任一可选的方法。

51、第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述第一方面及任一可选的方法。

52、第五方面,本技术实施例提供了一种计算机程序产品,包括代码,当代码被执行时,用于实现上述第一方面及任一可选的方法。

53、第六方面,本技术提供了一种芯片系统,该芯片系统包括处理器,用于支持数据处装置实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据;或,信息。在一种可能的设计中,芯片系统还包括存储器,所述存储器,用于保存执行设备或训练设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1