一种数据处理方法及其装置与流程

文档序号：11387505阅读：162来源：国知局

本发明涉及数据处理技术，尤其涉及一种数据处理方法及其装置。

背景技术：

随着电商平台的兴起和互联网的高速发展，越来越多的用户选择在电商平台上进行购物，这样，针对同一产品每天都会产生大量的评价信息；同时，现实生活中对评论极性(正评或负评)产生影响的市场因素也有很多，分析各种市场因素(如价格，促销时长，营业时间等)对评价信息评论极性的发展趋势的影响将会有效指导产品的市场运作和经营投资策略的制定。

技术实现要素：

为解决现有存在的技术问题，本发明实施例提供了一种数据处理方法及其装置，能至少解决现有技术中存在的上述问题。

本发明实施例的技术方案是这样实现的：

本发明实施例第一方面提供了一种数据处理方法，所述方法包括：

获取至少两组目标数据，每组所述目标数据包含有表征用户对目标产品进行评价的体现用户体验特征的至少两个用户体验信息；

基于用户体验信息所表征的用户体验特征，对每一组所述目标数据进行分类，得到每一组目标数据的分类特征值；

确定影响用户对所述目标产品的用户体验特征的至少两个影响参数；

基于所有组目标数据中至少一个组目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的参数特征值，利用所述至少两个影响参数的参数特征值建立出表征所述至少两个影响参数与分类特征值映射关系的体验模型，以通过所述体验模型分析出每一影响参数对分类特征值的影响趋势。

本发明实施例第二方面提供了一种数据处理装置，所述装置包括：

输入装置，用于获取至少两组目标数据，每组所述目标数据包含有表征用户对目标产品进行评价的体现用户体验特征的至少两个用户体验信息；

处理器，用于基于用户体验信息所表征的用户体验特征，对每一组所述目标数据进行分类，得到每一组目标数据的分类特征值；确定影响用户对所述目标产品的用户体验特征的至少两个影响参数；基于所有组目标数据中至少一个组目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的参数特征值，利用所述至少两个影响参数的参数特征值建立出表征所述至少两个影响参数与分类特征值映射关系的体验模型，以通过所述体验模型分析出每一影响参数对分类特征值的影响趋势。

本发明实施例所述的数据处理方法及其装置，能够基于目标数据的分类特征值，和影响用户对目标产品的用户体验特征的影响参数来建立体验模型，进而通过该体验模型即可分析出每一影响参数对分类特征值的影响趋势，因此，本发明实施例解决了现有舆情趋势模型不能将舆情走势与市场因素相关联的问题，拓展了模型分析的使用场景，为利用体验模型来有效指导产品的市场运作和制定经营投资策略奠定了理论基础。

附图说明

图1为本发明实施例数据处理方法的实现流程示意图；

图2为本发明实施例数据处理方法在一具体应用中的实现流程示意图；

图3为本发明实施例数据处理装置的组成结构示意图。

具体实施方式

目前，针对分析舆情趋势(也即评价信息的评论极性)影响的技术多集中于对趋势时序序列的模型构建，但是，构建得到的模型并未将舆情走势与市场因素相关联，从而无法进一步指导生产者的经营决策，同时现有技术也不能帮助用户分析某一行为(如涨价)对舆情走势的影响程度。因此，为解决上述问题，本发明实施例提供了一种数据处理方法及其装置，为了能够更加详尽地了解本发明的特点与技术内容，下面结合附图对本发明的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本发明。

实施例一

本实施例提供了一种数据处理方法，所述方法应用于数据处理装置；该数据处理装置可以具体为任意具有数据处理能力的电子设备，如服务器等。具体地，图1为本发明实施例数据处理方法的实现流程示意图，如图1所示，所述方法包括：

步骤101：获取至少两组目标数据，每组所述目标数据包含有表征用户对目标产品进行评价的体现用户体验特征的至少两个用户体验信息；

在实际应用中，所述用户体验信息可以具体为评价信息，也就是说，所述目标数据可以具体包括用户针对所述目标产品的多条评价信息，其中，每条评价信息均能够体现出用户对所述目标产品的用户体验特征，例如，用户体验特征可以大致分为体验较好和体验较差两类，对应地，评价信息可以具体为正评或负评(也即好评或差评)。

步骤102：基于用户体验信息所表征的用户体验特征，对每一组所述目标数据进行分类，得到每一组目标数据的分类特征值；

在一具体实施例中，所述用户体验特征至少包括第一特征和第二特征；所述第一特征表征用户对所述目标产品的用户体验特征满足预设条件，例如，所述第一特征表征正评；所述第二特征表征用户对所述目标产品的用户体验特征不满足预设条件，例如，所述第二特征表征负评。这里，在实际应用中，可以对用户体验信息(也即评价信息)进行分词处理，得到若干个分词，进而根据该若干个分词的极性来确定用户体验信息的极性，例如，当若干个分词中正评分词的个数与负评分词的个数之比大于预设阈值(比如1)时，确定为该用户体验信息为正评，否则，确定为负评；当然，在实际应用中，还可以有其他方式来确定用户体验信息的极性，本实施例对此不作限制。

进一步地，可以根据用户体验信息的极性，来确定每一组目标数据的分类特征值，具体地，基于所述第一特征和第二特征，对每一组目标数据进行分类处理，得到每一组目标数据中满足所述第一特征的用户体验信息的第一数量，以及满足第二特征的用户体验信息的第二数量，进而基于第一数量和第二数量确定出每一组目标数据的分类特征值，例如，可以将第一数量与第二数量的比值作为目标数据的分类特征值。

步骤103：确定影响用户对所述目标产品的用户体验特征的至少两个影响参数；

当然，在实际应用中，可以根据实际需求来确定针对目标产品的影响参数，例如，所述影响参数可以具体为产品定价、广告投放、员工数目和产品品类等。

步骤104：基于所有组目标数据中至少一个组目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的参数特征值；

具体地，可以将分类特征值作为因变量，即y，而将影响参数作为子变量，即x，来建立体验模型，即y＝a1x1+a2x2+…+anxn，其中，n为大于等于1的正整数，n的数值取决于确定出的影响参数的个数，xi为影响参数，ai为影响参数对应的系数，也即本实施例所述的参数特征值，所述n为大于等于1的正整数；所述i为大于等于1小于等于n的正整数。进一步地，利用至少一组目标数据对应的分类特征值，以及用户体验信息即可确定出上述体验模型中的系数ai，进而最终建立完成体验模型；也就是说，获取到目标数据所对应的所有评价信息后，即可根据评价信息确定出y以及xi的具体值，进而对上述方程求解，得到各系数ai，这样，建立出的体验模型既能够表征出影响参数与舆情趋势的对应关系，进而利用该体验模型即可帮助用户分析某一影响参数的变动(如涨价)对舆情走势的影响程度进而辅助用户制定经营决策。

步骤105：利用所述至少两个影响参数的参数特征值建立出表征所述至少两个影响参数与分类特征值映射关系的体验模型，以通过所述体验模型分析出每一影响参数对分类特征值的影响趋势。

在实际应用中，当建立出体验模型后，还可以对模型进行评估，具体地，对所述体验模型进行参数检验，根据参数检验结果确定是否对所述体验模型中的影响参数和/或影响参数对应的参数特征值进行调整，以使调整的体验模型满足预设规则。例如，对体验模型进行f检验和t检验，调整模型的参数，以最终得出各影响参数对舆情趋势的体验模型。

这样，本发明实施例所述的方法，能够基于目标数据的分类特征值，和影响用户对目标产品的用户体验特征的影响参数来建立体验模型，进而通过该体验模型即可分析出每一影响参数对分类特征值的影响趋势，因此，本发明实施例解决了现有舆情趋势模型不能将舆情走势与市场因素相关联的问题，拓展了模型分析的使用场景，为利用体验模型来有效指导产品的市场运作和制定经营投资策略奠定了理论基础。

实施例二

基于实施例一所述的方法，本实施例给出了确定影响参数的参数特征值的具体实现方式；具体地，

方式一，将所述至少两组目标数据进行分组处理，得到至少一组第一目标数据和至少一组第二目标数据；进一步地，利用所述至少一组第一目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的预估参数特征值；利用所述至少一组第二目标数据所对应的分类特征值以及用户体验信息，对预估参数特征值进行校验，将校验后得到的预估参数特征值作为所述至少两个影响参数的参数特征值。也就是说，本方式中，将多组目标数据进行分组，至少得到两组，即至少一组第一目标数据，和至少一组第二目标数据，进而利用第一目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai，利用第二目标数据对确定出的系数ai进行校验；例如，共五组目标数据，分别为目标数据1、目标数据2、目标数据3、目标数据4和目标数据5；这里，每组目标数据包含多条评价信息，利用目标数据1、目标数据2、目标数据3对应的分类特征值和多条评价信息，确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai，然后，利用目标数据4和目标数据5对确定出的ai进行校验，以最终确定出体验模型。

方式二，将所述至少两组目标数据进行分组处理，得到至少一组第一目标数据和至少一组第二目标数据；利用所述至少一组第一目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的第一预估参数特征值；利用所述至少一组第二目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的第二预估参数特征值；至少基于第一预估参数特征值和第二预估参数特征值确定出所述至少两个影响参数的参数特征值。也就是说，本方式中，将多组目标数据进行分组，至少得到两组，即至少一组第一目标数据，和至少一组第二目标数据，进而利用第一目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai’，同时，利用第二目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai”，最后基于ai’和ai”确定出ai；例如，共五组目标数据，分别为目标数据1、目标数据2、目标数据3、目标数据4和目标数据5；这里，每组目标数据包含多条评价信息，利用目标数据1、目标数据2、目标数据3对应的分类特征值和多条评价信息，确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai’，同时，利用目标数据4和目标数据5对应的分类特征值和多条评价信息确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai”，最后，利用ai’和ai”确定出最终的ai，基于两者的平均值确定出最终的ai，以最终确定出体验模型。

在实际应用中，上述两种方式可以择一而执行。当然，以上确定参数特征值的方式仅仅是示例性的，在实际应用中还可以有其他计算方式，本实施例对此不作限制。

以下给出本发明实施例的一具体应用示例，具体地，如图2所示，首先，收集产品的用户舆情信息，统计用户舆情信息的正负评占比，收集影响产品运营的市场因素，如产品定价、广告投放、员工数目和产品品类等，将用户舆情信息的正负评占比作为因变量，将影响产品运营的市场因素作为自变量，建立模型；然后，使用多元回归模型拟合，并拟合出自变量的系数；最后，对模型评估，如f检验和t检验，以调整模型的参数，得出各因素对舆情趋势的影响方程，从而帮助用户指定经营策略和预判舆情走势。例如，若生成的模型通过了参数检验，则该模型可以作为舆情的趋势模型，指导用户的经营策略，并可以用来预判某营销行为的潜在作用；若模型未通过检验，则需要修正模型的参数，如增删参数项等，直到通过参数检验，以获得最后的趋势分析模型。这样，相较于现有趋势时序序列模型，本实施例建立的模型不仅能提供舆情趋势的预测，同时也能体现出每一个因素对舆情趋势的作用，进而便于分析出舆情趋势的驱动因素。

实施例三

本实施例提供了一种数据处理装置，该数据处理装置可以具体为任意具有数据处理能力的电子设备，如服务器等。具体地，如图3所示，所述装置包括：

输入装置31，用于获取至少两组目标数据，每组所述目标数据包含有表征用户对目标产品进行评价的体现用户体验特征的至少两个用户体验信息；

处理器32，用于基于用户体验信息所表征的用户体验特征，对每一组所述目标数据进行分类，得到每一组目标数据的分类特征值；确定影响用户对所述目标产品的用户体验特征的至少两个影响参数；基于所有组目标数据中至少一个组目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的参数特征值，利用所述至少两个影响参数的参数特征值建立出表征所述至少两个影响参数与分类特征值映射关系的体验模型，以通过所述体验模型分析出每一影响参数对分类特征值的影响趋势。

在一实施例中，所述处理器32，还用于：

将所述至少两组目标数据进行分组处理，得到至少一组第一目标数据和至少一组第二目标数据；利用所述至少一组第一目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的预估参数特征值；利用所述至少一组第二目标数据所对应的分类特征值以及用户体验信息，对预估参数特征值进行校验，将校验后得到的预估参数特征值作为所述至少两个影响参数的参数特征值。也就是说，所述处理器将多组目标数据进行分组，至少得到两组，即至少一组第一目标数据，和至少一组第二目标数据，进而利用第一目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai，利用第二目标数据对确定出的系数ai进行校验；例如，共五组目标数据，分别为目标数据1、目标数据2、目标数据3、目标数据4和目标数据5；这里，每组目标数据包含多条评价信息，利用目标数据1、目标数据2、目标数据3对应的分类特征值和多条评价信息，确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai，然后，利用目标数据4和目标数据5对确定出的ai进行校验，以最终确定出体验模型。

在另一实施例中，所述处理器32，还用于：

将所述至少两组目标数据进行分组处理，得到至少一组第一目标数据和至少一组第二目标数据；利用所述至少一组第一目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的第一预估参数特征值；利用所述至少一组第二目标数据对应的分类特征值以及用户体验信息，分析得到所述至少两个影响参数的第二预估参数特征值；至少基于第一预估参数特征值和第二预估参数特征值确定出所述至少两个影响参数的参数特征值。也就是说，所述处理器将多组目标数据进行分组，至少得到两组，即至少一组第一目标数据，和至少一组第二目标数据，进而利用第一目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai’，同时，利用第二目标数据对应的分类特征值和用户体验信息，确定出体验模型的系数ai”，最后基于ai’和ai”确定出ai；例如，共五组目标数据，分别为目标数据1、目标数据2、目标数据3、目标数据4和目标数据5；这里，每组目标数据包含多条评价信息，利用目标数据1、目标数据2、目标数据3对应的分类特征值和多条评价信息，确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai’，同时，利用目标数据4和目标数据5对应的分类特征值和多条评价信息确定出体验模型y＝a1x1+a2x2+…+anxn的系数ai”，最后，利用ai’和ai”确定出最终的ai，基于两者的平均值确定出最终的ai，以最终确定出体验模型。

在另一实施例中，所述用户体验特征至少包括第一特征和第二特征；所述第一特征表征用户对所述目标产品的用户体验特征满足预设条件；例如，所述第一特征表征正评；所述第二特征表征用户对所述目标产品的用户体验特征不满足预设条件；例如，所述第二特征表征负评。这里，在实际应用中，可以对用户体验信息(也即评价信息)进行分词处理，得到若干个分词，进而根据该若干个分词的极性来确定用户体验信息的极性，例如，当若干个分词中正评分词的个数与负评分词的个数之比大于预设阈值(比如1)时，确定为该用户体验信息为正评，否则，确定为负评；当然，在实际应用中，还可以有其他方式来确定用户体验信息的极性，本实施例对此不作限制。

对应地，所述处理器32，还用于基于所述第一特征和第二特征，对每一组目标数据进行分类处理，得到每一组目标数据中满足所述第一特征的用户体验信息的第一数量，以及满足第二特征的用户体验信息的第二数量；基于第一数量和第二数量确定出每一组目标数据的分类特征值。例如，可以将第一数量与第二数量的比值作为目标数据的分类特征值。

在另一实施例中，所述处理器32，还用于对所述体验模型进行参数检验；根据参数检验结果确定是否对所述体验模型中的影响参数和/或影响参数对应的参数特征值进行调整，以使调整的体验模型满足预设规则。例如，对体验模型进行f检验和t检验，调整模型的参数，以最终得出各影响参数对舆情趋势的体验模型。

这样，本发明实施例所述的装置，能够基于目标数据的分类特征值，和影响用户对目标产品的用户体验特征的影响参数来建立体验模型，进而通过该体验模型即可分析出每一影响参数对分类特征值的影响趋势，因此，本发明实施例解决了现有舆情趋势模型不能将舆情走势与市场因素相关联的问题，拓展了模型分析的使用场景，为利用体验模型来有效指导产品的市场运作和制定经营投资策略奠定了理论基础。

这里需要指出的是：以上数据处理装置实施例项的描述，与上述方法描述是类似的，具有同方法实施例相同的有益效果，因此不做赘述。对于本发明数据处理装置实施例中未披露的技术细节，本领域的技术人员请参照本发明方法实施例的描述而理解，为节约篇幅，这里不再赘述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明实施例的实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明实施例原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明实施例的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王文韬
技术所有人：联想（北京）有限公司
我是此专利的发明人

上一篇：一种广告轮播方法及装置与流程
上一篇：信息处理装置、服务器装置、广告投稿方法以及优惠提供方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。