一种基于知识图谱的APP传播分析方法及系统与流程

文档序号:16609341发布日期:2019-01-14 21:27阅读:294来源:国知局
一种基于知识图谱的APP传播分析方法及系统与流程

本发明属于大数据分析技术领域,更具体地,涉及一种基于知识图谱的app传播分析方法及系统。



背景技术:

目前app的传播主要依靠人工的调查、地推,需要投入很大的人力物力,分析及优化手段缺乏,而对于各类需管控的app,甚至是非法app的传播,没有有效手段预防,直接导致更大的影响范围。

随着云计算、大数据、人工智能的不断发展,数据越发成为重要资产,尤其是多维度的数据及可持续分析的用户群体,此先决条件也是限制自动化和智能化的分析能力提升的最重要因素。但一方面,由于一个app所属行业数据维度单一,分析视角无法多元化,分析结论指导性存在局限;另一方面,由于app所属行业用户群体有限,特征行为相似,群体流动性大,无法实现持续、全面的用户分析,难以提供行为预测、app传播预测的准确性指导。

因此,亟需基于多维、全面的大数据体系,通过自动化和智能化手段对app传播进行分析及预测,指导及管控app的传播行为。



技术实现要素:

为克服上述传统app传播分析方法无法自动、全面和持续地进行app传播分析的问题或者至少部分地解决上述问题,本发明提供一种基于知识图谱的app传播分析方法及系统。

根据本发明的第一方面,提供一种基于知识图谱的app传播分析方法,包括:

s11,根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;

s12,对所述知识图谱进行分析,获取分析结果。

具体地,所述步骤s11具体包括:

将所述待分析app和所述种子用户作为实体,将所述待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据作为属性,根据所述实体、所述属性,以及所述待分析app与所述种子用户的关系构建知识图谱。

具体地,所述步骤s12具体包括:

s121,根据所述种子用户的社交关系数据,获取与所述种子用户有关系的待传播用户;

s122,根据各所述待传播用户的数据,判断各所述待传播用户是否满足所述待分析app对应的用户特征;其中,所述待分析app与所述用户特征预先关联存储;

s123,将满足用户特征的待传播用户作为新种子用户,迭代执行步骤s121到s122直到没有符合所述用户特征的待传播用户;

s124,根据每次迭代中获取的所述新种子用户的数量,计算潜在用户的数量。

具体地,所述待传播用户的数据包括用户自身信息、行为数据、服务感知数据、位置轨迹数据、家庭信息数据和社交关系数据中的一种或多种。

具体地,所述步骤s122具体包括:

根据各所述待传播用户的数据,获取所述待传播用户的标签;

根据所述标签构建所述待传播用户的画像;

从所述待传播用户的画像中检索出满足所述用户特征的潜在用户。

具体地,所述待传播用户的标签包括基本标签、生活类标签、消费习惯标签、兴趣爱好标签和人生阶段标签中的一种或多种;

所述基本标签包括姓名、年龄、性别、文化程度、职业和收入中的一种或多种;

所述生活类标签包括有房、无房、有车和无车中的一种或多种;

所述人生阶段标签为婚恋阶段、育儿阶段或孕产阶段。

具体地,所述步骤s124具体包括:

将每次迭代中获取的所述新种子用户的数量乘以每次迭代对应的权重后相加,获取潜在用户数量;

其中,每次迭代对应的权重根据每次迭代的迭代次数确定。

根据本发明第二方面提供一种基于知识图谱的app传播分析系统,包括:

构建模块,用于根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;

获取模块,用于对所述知识图谱进行分析,获取分析结果。

根据本发明的第三方面,提供一种基于知识图谱的app传播分析设备,包括:

至少一个处理器、至少一个存储器和总线;其中,

所述处理器和存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。

根据本发明的第四方面,提供一种非暂态计算机可读存储介质,用于存储如前所述方法的计算机程序。

本发明提供一种基于知识图谱的app传播分析方法及系统,该方法通过采用多维数据的融合分析获取使用待分析app的种子用户的数据,根据待分析app的数据和种子用户的数据构建知识图谱,对知识图谱进行分析获取分析结果,从而实现对待分析app的传播进行自动、全面和持续的分析,提高待分析app传播分析的精确度。

附图说明

图1为本发明实施例提供的基于知识图谱的app传播分析方法整体流程示意图;

图2为本发明实施例提供的基于知识图谱的app传播分析系统整体结构示意图;

图3为本发明实施例提供的基于知识图谱的app传播分析设备整体结构示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

在本发明的一个实施例中提供一种基于知识图谱的app传播分析方法,图1为本发明实施例提供的基于知识图谱的app传播分析方法整体流程示意图,该方法包括:s11,根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;

其中,待分析app(application,应用软件)为需要进行传播分析的app。待分析app的数据为待分析app的自身属性数据,如待分析app的名称、用途描述和所针对的用户的特征等。种子用户为当前正在使用待分析app的用户。种子用户的数据通过用户的移动通信类、互联网类和位置类等信息获取。从而通过多维跨域数据的采集使得获取的用户数据更全面,提升待分析app传播分析的准确性。采用大数据平台架构将待分析app的数据和各种子用户的数据进行分域存放。对待分析app的数据和各种子用户的数据进行数据清洗,利用数据清洗规则,对数据进行清洗和标准化,对清洗出的异常数据进行及时发现和关联分析。采用实体聚焦分析方法将清洗后的无序数据进行主题分类,生成种子用户和app主题域。根据待分析app的数据和使用所述待分析app的各种子用户的数据,构建知识图谱。

s12,对知识图谱进行分析,获取分析结果。

具体地,对知识图谱进行知识推理,从而完成对待分析app的传播分析。分析结果为预测的潜在用户、预测的流量等。分析结果可以用于挖掘潜在用户、预测流量及内容暴发,指导用户推广,提前做好感知保障,实现待分析app传播的有效管控。

本实施例通过采用多维数据的融合分析获取使用待分析app的种子用户的数据,根据待分析app的数据和种子用户的数据构建知识图谱,对知识图谱进行分析获取分析结果,从而实现对待分析app的传播进行自动、全面和持续的分析,提高待分析app传播分析的精确度。

在上述实施例的基础上,本实施例中步骤s11具体包括:将待分析app和种子用户作为实体,将待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据作为属性,根据实体、属性,以及待分析app与种子用户的关系构建知识图谱。

具体地,知识图谱的构建包括知识抽取、知识融合和知识加工三个步骤。其中,知识抽取为从通信运营商数据、互联网数据等各种类型的数据源中提取出使用待分析app的种子用户和待分析app实体,以及各实体相应的属性和两个实体之间的关系。在此基础上形成本体化的知识表达。实体、属性和关系在抽取时,一方面从通信运营商的结构化数据中提取,另一方面从互联网的文本数据集中自动识别出实体。知识融合为在获得用户和app实体,以及各实体相应的属性和两个实体之间的关系后,需要对其进行整合,消除知识图谱中的矛盾和歧义,然后进行实体链接和知识合并。知识加工为对于经过融合获取的知识图谱,经过质量评估之后,将合格的部分加入到知识库中。

在上述各实施例的基础上,本实施例中所述步骤s12具体包括:s121,根据种子用户的社交关系数据,获取与种子用户有关系的待传播用户;

其中,种子用户的社交关系数据包括家庭数据和互联网上的好友数据等,如qq好友和微信好友。根据知识图谱中种子用户的社交关系数据,获取与种子用户有关系的待传播用户。待传播用户为与种子用户有关系的用户,与种子用户有关系的用户都可能受种子用户的影响而使用待分析app,如种子用户在微信上发表待分析app的微信公众号和言论等,从而使其微信好友获知并了解待分析app,进而可能使用待分析app。

s122,根据各待传播用户的数据,判断各待传播用户是否满足待分析app对应的用户特征;其中,待分析app与用户特征预先关联存储;

其中,根据待传播用户的数据,判断各待传播用户是否满足待分析app对应的用户特征。例如,根据待传播用户的网上行为数据获知待传播用户多次购买母婴用品,结合其他数据分析获知待传播用户属于孕产阶段或育儿阶段的用户。待分析app为用于购买母婴用品的应用软件,待分析app对应的用户特征为孕产阶段或育儿阶段的用户。从而根据待传播用户的数据获知待传播用户满足待分析app对应的用户特征。其中,待分析app与用户特征预先关联存储。

s123,将满足用户特征的待传播用户作为新种子用户,迭代执行步骤s121到s122直到没有符合用户特征的待传播用户;

具体地,将满足用户特征的待传播用户作为新种子用户,根据新种子用户的社交关系数据获取与新种子用户有关系的待传播用户。根据与新种子用户有关系的待传播用户的数据,判断与新种子用户有关系的待传播用户是否满足待分析app对应的用户特征,直到没有符合所述用户特征的待传播用户。每次迭代都会在上次迭代获取的种子用户的基础上产生新的种子用户。

s124,根据每次迭代中获取的新种子用户的数量,计算潜在用户的数量。

其中,潜在用户为潜在会使用待分析app的用户,每次迭代获取的新种子用户将来并不会全部都使用待分析app,因此根据每次迭代中获取的新种子用户的数量,通过概率评估,计算潜在用户的数量。

在上述实施例的基础上,本实施例中待传播用户的数据包括自身信息、行为数据、服务感知数据、位置轨迹数据、家庭信息数据和社交关系数据中的一种或多种。

具体地,自身信息为用户的基本信息,包括姓名、年龄、性别、文化程度、职业和收入中的一种或多种。行为数据包括客户在生活娱乐类网站和app上的行为信息,例如,国内外旅游信息,生活团购信息和亲子活动信息等。服务感知数据为用户的评论。位置轨迹数据通过gps数据获取的用户的位置和移动轨迹。家庭数据包括家庭成员的信息。社交关系数据为与待传播用户有关系的其他人员。

在上述实施例的基础上,本实施例中步骤s122具体包括:根据各待传播用户的数据,获取待传播用户的标签;根据所述标签构建所述待传播用户的画像;从待传播用户的画像中检索出满足用户特征的潜在用户。

在上述实施例的基础上,本实施例中待传播用户的标签包括基本标签、生活类标签、消费习惯标签、兴趣爱好标签和人生阶段标签中的一种或多种;所述基本标签包括姓名、年龄、性别、文化程度、职业和收入中的一种或多种;所述生活类标签包括有房、无房、有车和无车中的一种或多种;所述人生阶段标签为婚恋阶段、育儿阶段或孕产阶段。

本实施例通过多种信息渠道获取到待传播用户多方面的信息,使用多方面的信息构建待传播用户的画像,为潜在用户的获取提供数据。

在上述实施例的基础上,本实施例中步骤s124具体包括:将每次迭代中获取的新种子用户的数量乘以每次迭代对应的权重后相加,获取潜在用户数量;其中,每次迭代对应的权重根据每次迭代的迭代次数确定。

具体地,潜在用户的数量通过以下公式获取:

其中,m为潜在用户的数量,n为迭代总次数,n为迭代次数,sn为第n次迭代获取的新种子用户的数量。由于迭代次数之前的待传播用户都可能不使用待分析app,因此,迭代次数越大,迭代对应的权重越小。

在本发明的另一个实施例中提供一种基于知识图谱的app传播分析系统,图2为本发明实施例提供的基于知识图谱的app传播分析系统整体结构示意图,该系统包括构建模块1和获取模块2;其中:

构建模块1用于根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;

其中,待分析app(application,应用软件)为需要进行传播分析的app。待分析app的数据为待分析app的自身属性数据,如待分析app的名称、用途描述和所针对的用户的特征等。种子用户为当前正在使用待分析app的用户。种子用户的数据通过用户的移动通信类、互联网类和位置类等信息获取。从而通过多维跨域数据的采集使得获取的用户数据更全面,提升待分析app传播分析的准确性。采用大数据平台架构将待分析app的数据和各种子用户的数据进行分域存放。对待分析app的数据和各种子用户的数据进行数据清洗,利用数据清洗规则,对数据进行清洗和标准化,对清洗出的异常数据进行及时发现和关联分析。采用实体聚焦分析方法将清洗后的无序数据进行主题分类,生成种子用户和app主题域。构建模块1根据待分析app的数据和使用所述待分析app的各种子用户的数据,构建知识图谱。

获取模块2用于对所述知识图谱进行分析,获取分析结果。

具体地,获取模块2对知识图谱进行知识推理,从而完成对待分析app的传播分析。分析结果为预测的潜在用户、预测的流量等。分析结果可以用于挖掘潜在用户、预测流量及内容暴发,指导用户推广,提前做好感知保障,实现待分析app传播的有效管控。

本实施例通过采用多维数据的融合分析获取使用待分析app的种子用户的数据,根据待分析app的数据和种子用户的数据构建知识图谱,对知识图谱进行分析获取分析结果,从而实现对待分析app的传播进行自动、全面和持续的分析,提高待分析app传播分析的精确度。

在上述实施例的基础上,本实施例中构建模块具体用于:将待分析app和种子用户作为实体,将待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据作为属性,根据实体、属性,以及待分析app与种子用户的关系构建知识图谱。

在上述各实施例的基础上,本实施例中获取模块包括获取子模块、判断子模块、迭代子模块和计算子模块,其中:

获取子模块用于根据种子用户的社交关系数据,获取与种子用户有关系的待传播用户;判断子模块用于根据各待传播用户的数据,判断各待传播用户是否满足待分析app对应的用户特征;其中,待分析app与用户特征预先关联存储;迭代子模块用于将满足用户特征的待传播用户作为新种子用户迭代执行获取待传播用户和判断各待传播用户是否满足用户特征的步骤,直到没有符合用户特征的待传播用户;计算子模块用于根据每次迭代中获取的新种子用户的数量,计算潜在用户的数量。

在上述实施例的基础上,本实施例中待传播用户的数据包括自身信息、行为数据、服务感知数据、位置轨迹数据、家庭信息数据和社交关系数据中的一种或多种。

在上述实施例的基础上,本实施例中判断子模块具体用于:根据各待传播用户的数据,获取待传播用户的标签;根据所述标签构建所述待传播用户的画像;从待传播用户的画像中检索出满足用户特征的潜在用户。

在上述实施例的基础上,本实施例中待传播用户的标签包括基本标签、生活类标签、消费习惯标签、兴趣爱好标签和人生阶段标签中的一种或多种;所述基本标签包括姓名、年龄、性别、文化程度、职业和收入中的一种或多种;所述生活类标签包括有房、无房、有车和无车中的一种或多种;所述人生阶段标签为婚恋阶段、育儿阶段或孕产阶段。

在上述实施例的基础上,本实施例中计算子模块具体用于:将每次迭代中获取的新种子用户的数量乘以每次迭代对应的权重后相加,获取潜在用户数量;其中,每次迭代对应的权重根据每次迭代的迭代次数确定。

其中,潜在用户的数量通过以下公式获取:

其中,m为潜在用户的数量,n为迭代总次数,n为迭代次数,sn为第n次迭代获取的新种子用户的数量。由于迭代次数之前的待传播用户都可能不使用待分析app,因此,迭代次数越大,迭代对应的权重越小。

本实施例提供一种基于知识图谱的app传播分析设备,图3为本发明实施例提供的基于知识图谱的app传播分析设备整体结构示意图,该设备包括:至少一个处理器31、至少一个存储器32和总线33;其中,

处理器31和存储器32通过总线33完成相互间的通信;

存储器32存储有可被处理器31执行的程序指令,所述处理器调用所述程序指令能够执行上述各方法实施例所提供的方法,例如包括:s11,根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;s12,对所述知识图谱进行分析,获取分析结果。

本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:s11,根据待分析app的数据,以及使用所述待分析app的各种子用户的互联网数据和运营商数据,构建知识图谱;s12,对所述知识图谱进行分析,获取分析结果。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的基于知识图谱的app传播分析设备实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1