本技术涉及大数据,特别是涉及一种竞争产品信息获取方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、获取竞争对手的竞争产品信息对软件产品来说具有巨大的价值,它可以帮助技术人员了解不断变化的市场以及用户环境,从而调整策略、扩充功能并提高用户下载量。
2、传统技术中,获取竞争产品信息一般是通过调查方法与内容分析相结合的方式来对竞争选手的竞争产品进行分析。如,技术人员可以通过发布调查问卷、采集用户意见等方式来对可能存在的竞争产品进行调查,并且对调查结果进行内容分析,以分析哪些竞争产品是威胁较大的,从而获取竞争产品信息。
3、然而,目前的这种技术手段并不够准确,无法获取准确的竞争产品信息。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种准确的竞争产品信息获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种竞争产品信息获取方法。所述方法包括:
3、获取当前产品的第一网络评价文本数据;
4、从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
5、确定所述第一竞争产品信息中不同竞争产品名称的词频率;
6、基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
7、基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
8、在其中一个实施例中,所述从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据包括:
9、获取比较文本分类器,所述比较文本分类器用于对网络评价文本数据是否包含比较文本数据进行分类;
10、将所述第一网络评价文本数据输入至所述比较文本分类器,得到所述第一网络评价文本数据对应的预测分类标签;
11、根据所述对应的预测分类标签,从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据。
12、在其中一个实施例中,所述获取比较文本分类器包括:
13、获取初始比较文本分类器、及网络评价文本分类训练集;
14、根据所述网络评价文本分类训练集,对所述初始比较文本分类器进行逻辑回归训练,并获取训练完成的初始比较文本分类器的损失函数;
15、采用梯度下降法对所述损失函数进行优化,并根据优化后的损失函数,得到比较文本分类器。
16、在其中一个实施例中,还包括:
17、获取网络评价文本分类测试集、及所述网络评价文本分类测试集对应的真实标签;
18、将所述网络评价文本分类测试集输入至比较文本分类器,得到所述网络评价文本分类测试集对应的预测分类标签;
19、对比所述真实标签、与预测分类标签,得到kappa系数,并根据所述kappa系数,对所述比较文本分类器进行校验。
20、在其中一个实施例中,所述基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息包括:
21、对所述第三网络评价文本数据进行情感分析,得到第二竞争产品信息中不同竞争产品信息的平均情感取向、及平均情感得分;
22、根据第二竞争产品信息中不同竞争产品信息的所述平均情感取向、及所述平均情感得分,得到情感分析结果;
23、基于所述情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
24、在其中一个实施例中,所述对所述第三网络评价文本数据进行情感分析,得到第二竞争产品信息中不同竞争产品信息的平均情感取向、及平均情感得分包括:
25、对所述第三网络评价文本数据进行情感分析,获取所述第二竞争产品信息中不同竞争产品信息对应的评价文本总数量、积极评价文本数量、消极评价文本数量、及评价文本情感强度;
26、根据所述评价文本总数量、所述积极评价文本数量、及所述消极评价文本数量,得到第二竞争产品信息中不同竞争产品信息的平均情感取向;
27、根据所述评价文本情感强度,得到第二竞争产品信息中不同竞争产品信息的平均情感得分。
28、第二方面,本技术还提供了一种竞争产品信息获取装置。所述装置包括:
29、数据获取模块,用于获取当前产品的第一网络评价文本数据;
30、一次筛选模块,用于从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
31、词频确定模块,用于确定所述第一竞争产品信息中不同竞争产品名称的词频率;
32、二次筛选模块,用于基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
33、三次筛选模块,用于基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
34、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
35、获取当前产品的第一网络评价文本数据;
36、从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
37、确定所述第一竞争产品信息中不同竞争产品名称的词频率;
38、基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
39、基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
40、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
41、获取当前产品的第一网络评价文本数据;
42、从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
43、确定所述第一竞争产品信息中不同竞争产品名称的词频率;
44、基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
45、基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
46、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
47、获取当前产品的第一网络评价文本数据;
48、从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
49、确定所述第一竞争产品信息中不同竞争产品名称的词频率;
50、基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
51、基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。
52、上述竞争产品信息获取方法、装置、计算机设备、存储介质和计算机程序产品,首先,获取当前产品的第一网络评价文本数据;从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;确定所述第一竞争产品信息中不同竞争产品名称的词频率;基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息、并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息。整个过程中,通过依次执行确定包含比较文本数据的第二网络评价文本数据中的第一竞争产品信息、从第一竞争产品信息中基于不同竞争产品名称的词频率确定第二竞争产品信息、及基于情感分析结果从第二竞争产品信息确定目标竞争产品信息三个阶段,实现准确的竞争产品信息获取。