一种跨端群对群数据关联分析方法、系统及存储介质与流程

文档序号:35934345发布日期:2023-11-05 15:35阅读:38来源:国知局
一种跨端群对群数据关联分析方法、系统及存储介质与流程

本发明涉及大数据分析,尤其涉及的是一种跨端群对群数据关联分析方法、系统及存储介质。


背景技术:

1、跨端群对群数据是指来自多个数据拥有方的,包括不同类型终端设备的多种用户群数据的集合,这种数据集合涵盖了不同数据拥有方所持有的手机、电脑、ott设备等多种终端设备上的数据,通过联合分析可以揭示不同群体之间的关系、行为模式和交互动态,从而获得深入的洞察和信息。

2、申请号为2021107601748的发明专利申请公布了一种基于数据中立国的数据安全共享方法、系统及存储介质,其包括步骤:

3、数据中立国获取数据共享方提供的共享数据,所述共享数据存储在所述数据共享方专用的数据存储空间;

4、对至少一部分所述共享数据进行加工,生成可用于共享的加工数据。

5、申请号为2023107603085的发明专利申请公布了一种基于临时数据空间的数据加工共享方法、存储介质及系统,其中方法包括步骤:

6、a.若接收到数据需求方发起的数据共享请求,则根据该数据共享请求确定所需的原始数据;

7、b.在本数据平台创建临时数据空间,从所需的原始数据所属的数据供给方处将该原始数据同步到该临时数据空间;

8、c.接收数据需求方上传的数据加工处理算法;

9、d.在上述临时数据空间中使用该数据加工处理算法对原始数据进行加工处理;

10、e.把加工处理后的数据输出给数据需求方,并销毁所述临时数据空间以及上述原始数据。

11、由于不同类型的数据往往存在数据异构性,包括结构、格式、语义和含义的差异,因此,在数据联合分析时需要处理复杂的数据集成和转换,可能导致数据的一致性和准确性问题;而且,相差较大的数据可能难以建立明确的关联关系,从而限制了联合分析的深度和洞察力,无法有效揭示有意义的模式或趋势;同时,数据质量差异可能影响整体分析结果的可信度,低质量数据可能引入噪音或误差;此外,对于不同类型的数据,可能需要不同的加工处理算法才能揭示有用信息,而这些方法的适用性可能受限于数据类型。

12、上述两个发明专利申请适用于特定类型数据的联合分析,但在面对相差较大的数据时,需要进一步的技术创新和解决方案,以克服上述挑战,实现有效的数据联合分析,并获得可靠的洞察。

13、可见,现有技术还有待于改进和完善。


技术实现思路

1、鉴于上述现有技术的不足,本发明的目的在于提供一种跨端群对群数据关联分析方法、系统及存储介质,旨在解决传统技术在面对相差较大的数据时,难以实现有效的数据联合分析的问题。

2、本发明的技术方案如下:

3、一种跨端群对群数据关联分析方法,其包括:

4、分别接收来自于至少两方的终端数据集以及至少一方的广告数据集,并分别分配私有区进行存储;

5、将所接收的终端数据集输入至跨终端关系模型进行关联分析,并按照所述广告数据集的格式输出第一数据集;

6、对所述第一数据集与所述广告数据集取交集获得交集数据;

7、进行交集数据的统计分析以生成分析报告。

8、上述方案的效果在于:本发明从多方收集终端数据集和广告数据集,并将它们分别存储在私有区域,然后将终端数据集输入跨终端关系模型进行关联分析,以揭示不同数据源中相同格式数据之间的关系、行为模式和交互动态,通过关联分析,本发明可以获得关于多方终端数据集的洞察,以及这些数据如何相互关联和影响,从而提高分析效率;而且,经过关联分析后,所得的终端数据集被按照广告数据集的格式输出为第一数据集,将不同类型的数据转化为相同格式的数据集,以便于进行进一步的统计分析,消除数据格式差异可能带来的干扰,以提高数据分析的准确性和一致性。此外,数据分配和存储皆在私有区域进行,故而数据源之间的隔离性和安全性可以得到有效保障,降低了数据共享和处理过程中的风险。

9、在进一步地优选方案中,所述对所述第一数据集与所述广告数据集取交集获得交集数据的步骤之后还包括:对所述交集数据进行群体数据筛选生成结果集。

10、上述方案的效果在于:本发明通过基于群体行为模式和数据分布特点对交集数据进行筛选,能够针对特定群体的需求,去除不相关数据或噪音数据,使得结果集更加精准,确保最终的结果集更加切合特定群体的特征和行为;基于数据分布特点的分析,群体数据筛选能够快速且准确地确定需要关注的数据子集,减少了分析的数据量,使更高效的分析过程,专注于特定群体数据的分析,从而加速洞察的获取。

11、在进一步地优选方案中,所述对所述第一数据集与所述广告数据集取交集获得交集数据的步骤之后还包括:对所述交集数据进行统计计数,并将统计结果经前置机发送至媒体平台。

12、上述方案的效果在于:统计计数是统计学的基本方法之一,通过对数据进行计数和汇总,可以揭示数据的分布和特征,本发明通过统计计数,将复杂的交集数据转化为可量化的指标和数据点,可以帮助用户更好地理解数据的分布、趋势和关联,统计结果凸显了交集数据中的关键信息、模式和趋势,为用户提供了深入分析的依据;而后,本发明将统计结果以数据可视化的方式发送至媒体平台,通过图表、图形等形式将抽象的统计数据转化为直观且易于理解的展示,使得复杂的统计信息变得更加清晰,帮助用户更快速地洞察数据背后的意义,而且,通过将统计结果发送至媒体平台,实现了及时的信息传递与共享,团队成员可以在平台上共同查看、讨论和分析统计结果,促进了团队合作和决策支持,有助于更好地利用洞察来推动业务发展。

13、在进一步地优选方案中,所述终端数据集及广告数据集皆包括设备标志数据包;

14、所述分别接收来自于至少两方的终端数据集以及至少一方的广告数据集,并分别分配私有区进行存储的步骤还包括:所有的设备标志数据包统一存储于文件存储区;

15、所述分别接收来自于至少两方的终端数据集以及至少一方的广告数据集,并分别分配私有区进行存储的步骤之后还包括:根据自动创建的查询任务,通过任务调度器执行任务,利用设备标志数据包中的设备标志从私有区调取终端数据集内的终端数据以构建跨终端关系模型。

16、上述方案的效果在于:设备标志是用于标识不同终端设备的唯一标识符,所有的设备标志数据包统一存储于文件存储区,确保数据的集中管理和易于访问,但同时,由于统一保存的并无隐私数据,保证了数据的安全性;而且,本发明利用从多方获取的终端数据集联合构建的跨终端关系模型,整合了来自不同数据拥有方的多源数据,提高了跨终端关系模型的精确性和可靠性,且可以从多个维度、多个角度深入洞察用户行为、关系和互动,以获取更全面、准确的洞察,帮助做出更明智的决策;同样的,跨终端数据模型可以揭示不同终端设备上的用户行为模式和趋势,从而更好地理解用户的行为轨迹,预测用户的兴趣和需求,为产品和服务的优化提供依据;同时,跨终端数据模型可以在更细粒度的层面上分析用户行为,例如,可以跟踪用户在不同设备上的单个操作,从而更准确地理解用户的偏好和需求。

17、在进一步地优选方案中,所述终端数据集及广告数据集在上传过程中附带md5值,以用于进行数据的一致性和完整性校验。

18、上述方案的效果在于:通过在数据上传时附带md5值,可以确保上传的数据在传输过程中未被篡改或损坏,而接收方在获取数据后,可以计算接收到的数据的md5值并与附带的md5值进行比对,从而验证数据的完整性和一致性,以防止数据传输过程中的潜在问题,保障数据的可靠性。

19、在进一步地优选方案中,所述进行交集数据的统计分析以生成分析报告的步骤之后还包括:采用多次通知机制,在未接收到对方的成功信息的情况下,以预设的时间间隔发送多次通知。

20、上述方案的效果在于:由于通信环境可能存在不稳定性,信息传递的成功率可能会受到影响,为了确保数据需求方能够及时获得分析报告,本发明引入了多次通知机制,通过多次通知机制,即使在某次通知未被成功接收或处理的情况下,系统仍会继续尝试发送通知,以确保信息的及时传递,以降低通信故障对数据需求方获取结果的影响,提高通知的可靠性和成功率,从而进一步增强了数据分析报告的可信度和实用性,有效解决了通信不稳定性可能带来的信息传递问题。

21、在进一步地优选方案中,所述对所述第一数据集与所述广告数据集取交集获得交集数据的步骤具体为:对所述第一数据集与所述广告数据集进行隐私求交,获得交集数据。

22、上述方案的效果在于:隐私求交是一种安全的数据处理方法,能够在不直接暴露原始数据的情况下计算数据集的交集,在隐私保护的前提下,对第一数据集与广告数据集进行隐私求交操作,计算出交集数据,可以获得两个数据集中共同的部分,即交集数据,用于后续的统计分析;不仅保护了数据隐私,还能够保证交集数据的完整性,确保没有丢失任何重要信息。

23、在进一步地优选方案中,所述分别接收来自于至少两方的终端数据集以及至少一方的广告数据集,并分别分配私有区进行存储的步骤具体为:分别接收至少两方通过httpapi接口发送来的终端数据集,以及至少一方通过httpapi接口发送来的广告数据集,并分别分配私有区进行存储。

24、上述方案的效果在于:通过httpapi接口,从至少两方接收终端数据集和至少一方接收广告数据集,相较于传统的人工下载数据然后人工上传的方式而言,确保了数据的安全传输,减少了数据在传输过程中被篡改或泄露的风险;而且,由于数据是通过httpapi接口发送并分别存储的,可以合理假设数据格式是一致的,以便于后续的数据处理和分析工作。

25、一种用于实现跨端群对群数据关联分析方法的系统,其包括存储器及处理器,所述存储器用于存储跨端群对群数据关联分析程序,所述处理器用于运行所述跨端群对群数据关联分析程序以实现如上所述的跨端群对群数据关联分析方法。所述系统包括上述跨端群对群数据关联分析方法的所有技术特征,因此也具有上述跨端群对群数据关联分析方法的所有技术效果,不再赘述。

26、一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的跨端群对群数据关联分析方法的步骤。所述存储介质包括上述跨端群对群数据关联分析方法的所有技术特征,因此也具有上述跨端群对群数据关联分析方法的所有技术效果,不再赘述。

27、与现有技术相比,本发明提供的跨端群对群数据关联分析方法,从多方收集终端数据集和广告数据集,并将它们分别存储在私有区域,然后将终端数据集输入跨终端关系模型进行关联分析,以揭示不同数据源中相同格式数据之间的关系、行为模式和交互动态,通过关联分析,本发明可以获得关于多方终端数据集的洞察,以及这些数据如何相互关联和影响,从而提高分析效率;而且,经过关联分析后,所得的终端数据集被按照广告数据集的格式输出为第一数据集,将不同类型的数据转化为相同格式的数据集,以便于进行进一步的统计分析,消除数据格式差异可能带来的干扰,以提高数据分析的准确性和一致性。此外,数据分配和存储皆在私有区域进行,故而数据源之间的隔离性和安全性可以得到有效保障,降低了数据共享和处理过程中的风险。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1