评论有用性的处理方法、系统、装置和存储介质

文档序号:34989667发布日期:2023-08-03 20:36阅读:18来源:国知局
评论有用性的处理方法、系统、装置和存储介质

本发明涉及大数据处理,尤其是一种评论有用性的处理方法、系统、装置和存储介质。


背景技术:

1、相关技术中,尽管已有大量机器学习算法应用于评论有用性的预测,但是多数预测模型并不完善,导致或多或少存在一些问题。例如,采用横截面设计,这种静态的评论可能会导致评论有用性预测产生偏颇;比如没有将评论、用户和商家相关的信息纳入模型,只考虑用户投屏行为这一个属性,导致预测与实际存在误差。由此可知,现有评论有用性的预测方法,由于信息考虑不全,导致评论有用性预测结果准确度不高。


技术实现思路

1、本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种评论有用性的处理方法、系统、装置和存储介质,能够有效提高评论有用性分析结果的准确度。

2、一方面,本发明实施例提供了一种评论有用性的处理方法,包括以下步骤:

3、对评论关联数据进行预处理,所述预处理包括对影响因子、文本数据和图片数据进行预处理,所述评论关联数据包括训练数据和当前待处理评论数据;

4、分别构建影响因子模块、文本处理模块和图片数据处理模块,所述影响因子模块包括输入层、预处理层、全连接层和激活层;所述文本处理模块包括双向编码模型或长短期记忆递归神经网络模型;所述图片数据处理模块包括卷积神经网络模型和预训练模型;

5、以所述影响因子模块、所述文本处理模块和所述图片数据处理模块作为不同分支输入单元,构建评论有用性票数预测模型;

6、通过预处理后的所述训练数据对所述评论有用性票数预测模型进行训练;

7、将预处理后的当前待处理评论数据输入训练好的评论有用性票数预测模型,得到评论有用性投票数据。

8、在一些实施例中,所述对评论关联数据的影响因子进行预处理,包括:

9、对所述影响因子中的价格字符串值转化;

10、对价格字符串值转化后的影响因子进行日期值转化;

11、对日期值转化后的影响因子进行标准化处理。

12、在一些实施例中,所述对评论关联数据的文本数据进行预处理,包括:

13、对所述文本数据中的文本内容以预设字数进行截断;

14、当截断后得到的文本内容少于所述预设字数,对截断后得到的文本内容进行填充;

15、将填充或截断处理后的文本内容组成文本矩阵。

16、在一些实施例中,所述对评论关联数据的图片数据进行预处理,包括:

17、当所述图片数据中的图片数量少于预设张数,对所述图片数据进行补充;

18、对所述图片数据或补充后的图片数据进行标准化处理。

19、在一些实施例中,所述评论关联数据包括不同时间段的数据。

20、在一些实施例中,所述预训练模型包括轻量级预训练模型,所述轻量级预训练模型包括mobilenet网络。

21、在一些实施例中,在所述通过预处理后的所述训练数据对所述评论有用性票数预测模型进行训练时,设置迭代次数包括6次,所述迭代次数用于表征所述评论有用性票数预测模型中每个模块的训练次数。

22、另一方面,本发明实施例提供了一种评论有用性的处理系统,包括:

23、第一模块,用于对评论关联数据进行预处理,所述预处理包括对影响因子、文本数据和图片数据进行预处理,所述评论关联数据包括训练数据和当前待处理评论数据;

24、第二模块,用于分别构建影响因子模块、文本处理模块和图片数据处理模块,所述影响因子模块包括输入层、预处理层、全连接层和激活层;所述文本处理模块包括双向编码模型或长短期记忆递归神经网络模型;所述图片数据处理模块包括卷积神经网络模型和预训练模型;

25、第三模块,用于以所述影响因子模块、所述文本处理模块和所述图片数据处理模块作为不同分支输入单元,构建评论有用性票数预测模型;

26、第四模块,用于通过预处理后的所述训练数据对所述评论有用性票数预测模型进行训练;

27、第五模块,用于将预处理后的当前待处理评论数据输入训练好的评论有用性票数预测模型,得到评论有用性投票数据。

28、另一方面,本发明实施例提供了一种评论有用性的处理装置,包括:

29、至少一个存储器,用于存储程序;

30、至少一个处理器,用于加载所述程序以执行所述的评论有用性的处理方法。

31、另一方面,本发明实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现所述的评论有用性的处理方法。

32、本发明实施例提供的一种评论有用性的处理方法,具有如下有益效果:

33、本实施例通过分别构建由输入层、预处理层、全连接层和激活层组成的影响因子模块、由双向编码模型或长短期记忆递归神经网络模型组成的文本处理模块以及由卷积神经网络模型和预训练模型组成的图片数据处理模块,并以影响因子模块、文本处理模块和图片数据处理模块作为不同分支输入单元来构建评论有用性票数预测模型,然后通过对影响因子、文本数据和图片数据进行预处理后,通过预处理后组成的训练数据对评论有用性票数预测模型进行训练,再将预处理后的当前待处理评论数据输入训练好的评论有用性票数预测模型中进行评论有用性分析后得到评论有用性投票数据,从而能够有效提高评论有用性分析结果的准确度,进而提高投票数据的准确度。

34、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。



技术特征:

1.一种评论有用性的处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种评论有用性的处理方法,其特征在于,所述对评论关联数据的影响因子进行预处理,包括:

3.根据权利要求1所述的一种评论有用性的处理方法,其特征在于,所述对评论关联数据的文本数据进行预处理,包括:

4.根据权利要求1所述的一种评论有用性的处理方法,其特征在于,所述对评论关联数据的图片数据进行预处理,包括:

5.根据权利要求1-4任一项所述的一种评论有用性的处理方法,其特征在于,所述评论关联数据包括不同时间段的数据。

6.根据权利要求1所述的一种评论有用性的处理方法,其特征在于,所述预训练模型包括轻量级预训练模型,所述轻量级预训练模型包括mobilenet网络。

7.根据权利要求1所述的一种评论有用性的处理方法,其特征在于,在所述通过预处理后的所述训练数据对所述评论有用性票数预测模型进行训练时,设置迭代次数包括6次,所述迭代次数用于表征所述评论有用性票数预测模型中每个模块的训练次数。

8.一种评论有用性的处理系统,其特征在于,包括:

9.一种评论有用性的处理装置,其特征在于,包括:

10.一种存储介质,其特征在于,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现如权利要求1-7任一项所述的评论有用性的处理方法。


技术总结
本发明公开了一种评论有用性的处理方法、系统、装置和存储介质,可应用于大数据处理技术领域。本发明通过分别构建影响因子模块、由双向编码模型或长短期记忆递归神经网络模型组成的文本处理模块以及由卷积神经网络模型和预训练模型组成的图片数据处理模块,并以影响因子模块、文本处理模块和图片数据处理模块作为不同分支输入单元来构建评论有用性票数预测模型,然后通过对影响因子、文本数据和图片数据进行预处理后,通过训练数据对评论有用性票数预测模型进行训练,再将当前待处理评论数据输入训练好的评论有用性票数预测模型中进行评论有用性分析后得到评论有用性投票数据,从而能够有效提高评论有用性分析结果的准确度。

技术研发人员:郑天翔,谭鸿博,范泽森
受保护的技术使用者:暨南大学
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1