一种对应用程序进行项目评估的方法及系统与流程

文档序号:12035352阅读:372来源:国知局
一种对应用程序进行项目评估的方法及系统与流程

本申请涉及数据处理技术领域,特别是涉及一种对应用程序进行项目评估的方法,以及一种对应用程序进行项目评估的系统。



背景技术:

随着信息技术的发展,应用程序app的数量呈指数增长,仅中国就已有将近百万的量级。然而,这些app中,只有很少一部分可以获得投资,大部分有潜力的app因无法及时获得投资而得不到发展。因此,迫切需要建立一种app信用评估体系。

目前,与app信用评估体系最为相关的信用评估体系是对人和公司或项目的信用评估。

然而,针对人的信用评估体系,是以人为维度进行信用体系的构建,对于app并无移植性。

针对公司或项目的信用评估,往往都是以公司或项目等实体为维度进行评估,在授信时,对每个实体进行实地考察和精细估值。然而app市场由于其庞大的app数量,对每个app进行考察和精细估值并不可取。

因此,目前需要本领域技术人员迫切解决的一个技术问题就是:构建一种适用于app评估的信用评估体系,用以对app进行全面的评估,得到更具参考价值的项目信用系数。



技术实现要素:

本申请实施例所要解决的技术问题是提供一种对应用程序进行项目评估的方法,用以对app进行全面的评估,得到更具参考价值的项目信用系数。

相应的,本申请实施例还提供了一种对应用程序进行项目评估的系统,用以保证上述方法的实现及应用。

为了解决上述问题,本申请实施例公开了一种对应用程序进行项目评估的方法,所述方法包括:

获取多种异构数据;

分别从所述异构数据中获取待评估的目标应用程序的特征信息;

基于所述目标应用程序的特征信息,获取所述目标应用程序的项目信用系数。

优选地,所述获取多种异构数据的步骤包括:

分别从预设的多个数据资源站点中获取对应的异构数据;

分别将所述异构数据组织成异构数据集合。

优选地,所述异构数据至少包括:日志数据、公共关系数据以及社交网络服务数据;所述异构数据集合至少包括:日志数据集合、公共关系数据集合以及社交网络服务数据集合。

优选地,所述特征信息至少包括:访问行为特征、公共关系特征、社交属性特征;

所述分别从所述异构数据中获取待评估的目标应用程序的特征信息的步骤包括:

确定待评估的目标应用程序;

从所述日志数据集合中获取所述目标应用程序的访问行为特征;

从所述公共关系数据集合中获取所述目标应用程序的公共关系特征;

从所述社交网络服务数据集合中获取所述目标应用程序的社交属性特征。

优选地,所述确定待评估的目标应用程序的步骤包括:

获取所述日志数据集合中记录的,每个应用程序在预设时间段内的访问次数;

基于所述访问次数,对所述应用程序进行排序;

将排序在前的n个应用程序确定为待评估的目标应用程序,其中,n为正整数。

优选地,所述访问行为特征至少包括:所述目标应用程序的日均独立访客量,和/或,日活跃用户数,和/或,日均平均使用时长;

和/或,

所述公共关系特征至少包括:与所述目标应用程序关联的文稿的数量,和/或,所述与所述目标应用程序关联的文稿的评论数和/或转发数;

和/或,

所述社交属性特征至少包括:所述目标应用程序被下载的次数,和/或,所述目标应用程序的官方微博中的粉丝数和/或大v粉丝数和/或关注数和/或官方微博的所有评论数和/或转发数,所述目标应用程序的相关人员名称,和/或,所述相关人员的微博的粉丝数和/或大v粉丝数和/或关注数和/或所述相关人员的微博的所有评论数和/或转发数。

优选地,所述相关人员包括投资者和/或开发者和/或运维推广者。

优选地,所述项目信用系数包括期望授信金额,所述基于所述目标应用程序的特征信息,获取所述目标应用程序的项目信用系数的步骤包括:

创建所述目标应用程序的知识图谱;

以单个目标应用程序为主键,将所述知识图谱、所述访问行为特征、所述公共关系特征、所述社交属性特征,拼合成所述目标应用程序的特征数据表;

基于所述特征数据表,预估所述目标应用程序的期望授信金额。

优选地,所述创建所述目标应用程序的知识图谱的步骤包括:

从所述公共关系数据集合中获得与所述目标应用程序相关联的文稿;

对所述相关联的文稿进行分词处理,获得所述文稿的有效词,并统计所述有效词的词频;

将词频排序在前m的有效词,作为所述目标应用程序的实体知识,其中,m为正整数;

识别所述实体知识的实体类型;

生成所述目标应用程序、所述实体类型以及所述实体知识的映射关系;

将所有映射关系组织成所述目标应用程序的知识图谱。

优选地,所述基于所述特征数据表,预估所述目标应用程序的期望授信金额的步骤包括:

获取在先获得投资的已授信应用程序的授信数据,作为案例集合;

根据所述案例集合以及所述特征数据表,生成训练样本;

对所述训练样本进行模型训练,生成预测模型;

针对所述预测模型,计算所述目标应用程序的期望授信金额。

优选地,所述项目信用系数还包括信用评分,所述方法还包括:

对所述期望授信金额进行对数运算以及归一化处理,得到所述目标应用程序的信用评分。

本申请实施例还提供了一种对应用程序进行项目评估的系统,所述系统包括:

异构数据获取模块,用于获取多种异构数据;

特征信息获取模块,用于分别从所述异构数据中获取待评估的目标应用程序的特征信息;

项目信用系数获取模块,用于基于所述目标应用程序的特征信息,获取所述目标应用程序的项目信用系数。

优选地,所述异构数据获取模块包括:

异构数据获取子模块,用于分别从预设的多个数据资源站点中获取对应的异构数据;

组织子模块,用于分别将所述异构数据组织成异构数据集合。

优选地,所述异构数据至少包括:日志数据、公共关系数据以及社交网络服务数据;所述异构数据集合至少包括:日志数据集合、公共关系数据集合以及社交网络服务数据集合。

优选地,所述特征信息至少包括:访问行为特征、公共关系特征、 社交属性特征;

所述特征信息获取模块包括:

目标应用程序确定子模块,用于确定待评估的目标应用程序;

访问特征获取子模块,用于从所述日志数据集合中获取所述目标应用程序的访问行为特征;

公共关系特征获取子模块,用于从所述公共关系数据集合中获取所述目标应用程序的公共关系特征;

社交特征获取子模块,用于从所述社交网络服务数据集合中获取所述目标应用程序的社交属性特征。

优选地,所述目标应用程序确定子模块包括:

访问次数获取单元,用于获取所述日志数据集合中记录的,每个应用程序在预设时间段内的访问次数;

排序单元,用于基于所述访问次数,对所述应用程序进行排序;

确定单元,用于将排序在前的n个应用程序确定为待评估的目标应用程序,其中,n为正整数。

优选地,所述访问行为特征至少包括:所述目标应用程序的日均独立访客量,和/或,日活跃用户数,和/或,日均平均使用时长;

和/或,

所述公共关系特征至少包括:与所述目标应用程序关联的文稿的数量,和/或,所述与所述目标应用程序关联的文稿的评论数和/或转发数;

和/或,

所述社交属性特征至少包括:所述目标应用程序被下载的次数,和/或,所述目标应用程序的官方微博中的粉丝数和/或大v粉丝数和/或关注数和/或官方微博的所有评论数以及转发数,和/或,所述目标应用程序的相关人员名称,和/或,所述相关人员的微博的粉丝数和/或大v粉丝数和/或关注数和/或所述相关人员的微博的所有评论数和/或转发数。

优选地,所述相关人员包括投资者和/或开发者和/或运维推广者。

优选地,所述项目信用系数包括期望授信金额,所述项目信用系数 获取模块包括:

知识图谱创建子模块,用于创建所述目标应用程序的知识图谱;

特征合并子模块,用于以单个目标应用程序为主键,将所述知识图谱、所述访问行为特征、所述公共关系特征、所述社交属性特征,拼合成所述目标应用程序的特征数据表;

金额预估子模块,用于基于所述特征数据表,预估所述目标应用程序的期望授信金额。

优选地,所述知识图谱创建子模块包括:

关联文稿获取单元,用于从所述公共关系数据集合中获得与所述目标应用程序相关联的文稿;

文稿分词单元,用于对所述相关联的文稿进行分词处理,获得所述文稿的有效词,并统计所述有效词的词频;

知识确定单元,用于将词频排序在前m的有效词,作为所述目标应用程序的实体知识,其中,m为正整数;

类型识别单元,用于识别所述实体知识的实体类型;

实体映射单元,用于生成所述目标应用程序、所述实体类型以及所述实体知识的映射关系;

知识图谱构建单元,用于将所有映射关系组织成所述目标应用程序的知识图谱。

优选地,所述金额预估子模块包括:

案例获取单元,用于获取在先获得投资的已授信应用程序的授信数据,作为案例集合;

样本获取单元,用于根据所述案例集合以及所述特征数据表,生成训练样本;

模型训练单元,用于对所述训练样本进行模型训练,生成预测模型;

授信金额计算单元,用于针对所述预测模型,计算所述目标应用程序的期望授信金额。

优选地,所述项目信用系数还包括信用评分,所述系统还包括:

信用评分获取模块,用于对所述期望授信金额进行对数运算以及归一化处理,得到所述目标应用程序的信用评分。

与背景技术相比,本申请实施例包括以下优点:

本申请实施例提出一种通用的对应用程序的项目评估方式,并不限于某一行业的应用程序,可以实现跨行业应用程序的对比,提高应用程序的可比性。

另外,本申请实施例能够自动结合多种异构数据,获取待评估的目标应用程序的各项特征信息,并根据特征信息来获取目标应用程序的项目信用系数,多种异构数据可以提高数据来源的全面性,从而使得项目信用系数真实反映目标应用程序的特征,提高项目评估的准确率,使得项目信用系数的参考意义更大。

附图说明

图1是本申请的一种对应用程序进行项目评估的方法实施例一的步骤流程图;

图2是本申请的一种对应用程序进行项目评估的方法实施例二的步骤流程图;

图3是本申请的一种对应用程序进行项目评估的系统实施例的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。

参照图1,示出了本申请的一种对应用程序进行项目评估的方法实施例一的步骤流程图,所述方法可以包括如下步骤:

步骤101,获取多种异构数据;

步骤102,分别从所述异构数据中获取待评估的目标应用程序的特征信息;

步骤103,基于所述目标应用程序的特征信息,获取所述目标应用程序的项目信用系数。

本申请实施例提出一种通用的对应用程序的项目评估方式,并不限于某一行业的应用程序,可以实现跨行业应用程序的对比,提高应用程序的可比性。

另外,本申请实施例能够自动结合多种异构数据,获取待评估的目标应用程序的各项特征信息,并根据特征信息来获取目标应用程序的项目信用系数,多种异构数据可以提高数据来源的全面性,从而使得项目信用系数真实反映目标应用程序的特征,提高项目评估的准确率,使得项目信用系数的参考意义更大。

参照图2,示出了本申请的一种对应用程序进行项目评估的方法实施例二的步骤流程图,本申请实施例可以应用在投资方或银行等对应用程序的项目信用评估场景中,为投资方或银行等提供更具参考价值的针对应用程序的项目评估方案。

本申请实施例可以包括如下步骤:

步骤201,分别从预设的多个数据资源站点中获取对应的日志数据、公共关系数据以及社交网络服务数据;

在本申请实施例中,可以从预设的多个数据资源站点中获取对应的日志数据、公共关系(publicrelation,简称pr)数据以及社交网络服务(socialnetworkingservices,简称sns)数据等异构数据。

在具体实现中,数据资源站点可以为相对独立的站点,包括行业热点网站、开发平台或分析平台、社交服务网站等。

可以通过网络爬虫从多个数据资源站点中爬取对应的日志数据、公共关系数据以及社交网络服务数据。

例如,可以通过网络爬虫从开发者平台或数据分析平台的数据库中爬取日志数据,该开发者平台或数据分析平台可以包括如移动开发者服务平台友盟、中文网站统计分析平台cnzz等平台。

又如,可以通过网络爬虫从行业热点网站中爬取pr数据,如从虎嗅网等it行业热点网站的数据库中获取pr数据。

又如,可以通过网络爬虫从社交服务网站中爬取sns数据,如从微薄的数据库中获取sns数据。

步骤202,分别将所述日志数据、公共关系数据以及社交网络服务数据组织成对应的日志数据集合、公共关系数据集合以及社交网络服务数据集合;

从多个数据资源站点中获取对应的日志数据、公共关系数据以及社交网络服务数据等数据以后,进一步可以将所有获取到的日志数据组织成日志数据集合,以及,将所有获取到的公共关系数据组织成公共关系数据集合(又称pr数据集合),以及,将所有获取到的社交网络服务数据组织成社交网络服务数据集合(又称sns数据集合)。

在具体实现中,日志数据集合记录了用户对应用程序的访问行为以及在应用程序上的操作等信息。

pr数据集合记录了与应用程序相关的行业信息以及该应用程序的动态信息等。

sns数据集合记录了应用程序的社交属性信息,包括该应用程序的开发者、创始人等相关人员的社交属性信息。

在实际中,可以创建日志数据库保存该日志数据集合,以及,创建pr数据库保存该pr数据集合,以及,创建sns数据库保存该sns数据集合。

步骤203,确定待评估的目标应用程序;

在本申请实施例的一种优选实施例中,步骤203可以包括如下子步骤:

子步骤s11,获取所述日志数据集合中记录的,每个应用程序在预设时间段内的访问次数;

子步骤s12,基于所述访问次数,对所述应用程序进行排序;

子步骤s13,将排序在前的n个应用程序确定为待评估的目标应用 程序,其中,n为正整数。

具体而言,根据日志数据集合中记录的对每个应用程序的访问行为,可以统计预设时间段(例如,一个月)内每个应用程序的访问次数,并以访问次数对应用程序进行排序,获得排序在前n(n为正整数)的较为活跃的应用程序,组成待进行项目评估的评估对象列表,即目标应用程序列表。

需要说明的是,上述确定目标应用程序的方式仅仅是本申请实施例的一种实施方式,但本申请实施例并不限于此,本领域技术人员采用其他方式确定目标应用程序均是可以的,例如,根据银行或投资方等评估方的实际需求,将评估方需要进行项目评估的应用程序作为目标应用程序,等等。

另外,本申请实施例并不限于某一行业的应用程序的评估,可以通用于各种行业的各种应用程序的评估,实现同行业纵向的应用程序评估以及跨行业横向的应用程序评估,提高不同应用程序评估的可比性。

步骤204,从所述日志数据集合中获取所述目标应用程序的访问行为特征;

在实际中,该访问行为特征反映了与访问相关的特征,是目标应用程序当前数据的表现,可以以单个目标应用程序为主键,从日志数据集合中获取该目标应用程序的访问行为特征。

作为本申请实施例的一种优选示例,所述访问行为特征至少可以包括如下信息:所述目标应用程序的日均独立访客量(uniquevisitor,简称uv),和/或,日活跃用户数,和/或,日均平均使用时长等。

在具体实现中,除了可以从日志数据集合中提取目标应用程序的访问行为特征以外,还可以从日志数据集合中提取该目标应用程序的属性信息,该目标应用程序的属性信息至少可以包括:该目标应用程序所属的行业、该目标应用程序的年龄、该所属的行业内应用程序的平均年龄(该行业内所有app的年龄之和与该行业内所有app的数量的比值)等。

步骤205,从所述公共关系数据集合中获取所述目标应用程序的公共 关系特征;

目标应用程序的公共关系特征为反映了涉及目标应用程序的运营推广等公共关系相关的特征,其中,目标应用程序的公共关系是指目标应用程序与公众环境之间的沟通与传播关系。例如,行业热点网站中的文稿是应用程序的公共关系的表现形式之一。

在本申请实施例中,首先可以从公共关系数据集合中提取与目标应用程序关联的文稿。在具体实现中,可以通过etl(extract-transform-load,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程)技术获取pr数据集合中的所有文稿的结构化信息。

作为一种示例,该结构化信息可以包括但不限于:pr数据集合中每个文稿的标题、标题分词、文章标签、摘要等。例如,某一文稿的标题为《a音乐的正版之路》,文章标签为:a音乐、音乐版权和创业三个,内容为正文,则其结构化信息为:《a音乐的正版之路》+多米/音乐/正版+a音乐/音乐版权/创业+null(因为获取的数据中只有正文内容,而摘要为空,所以用null代替)。

得到pr数据集合中的每个文稿的结构化信息以后,可以从该结构化信息中匹配目标应用程序的匹配因子(包括目标应用程序的名称、功能等),若匹配成功,则该文稿为与目标应用程序关联的文稿,若匹配不成功,则该文稿为与目标应用程序不相关的文稿。

确定与目标应用程序的关联的文稿以后,可以根据该关联的文稿,获取目标应用程序的公共关系特征。

作为本申请实施例的一种优选示例,公共关系特征至少可以包括如下信息:与目标应用程序关联的文稿的数量,和/或,与目标应用程序关联的文稿的评论数和/或转发数等。

具体而言,得到目标应用程序的关联的文稿以后,可以计算该关联的文稿的数量,作为目标应用程序的公共关系特征之一。

目标应用程序关联的文稿的评论数和转发数可以为从pr数据集合中 获取的每一个关联的文稿的评论数和/或转发数。

和/或,

目标应用程序关联的文稿的评论数和转发数也可以是在获得每一个关联的文稿的评论数以及转发数以后,将所有关联的文稿的评论数进行汇总得到的汇总值以及将所有的转发数进行汇总得到的汇总值。

和/或,

目标应用程序关联的文稿的评论数和转发数也可以是在获得每一个关联的文稿的评论数以及转发数以后,将所有关联的文稿的评论数进行汇总求平均后得到的平均评论数以及将所有的转发数进行汇总求平均后得到的平均转发数。

如虎嗅网中一个月内有多篇pr稿件是关于某音乐app的,因此生成的该音乐app的公共关系特征可以为:音乐app名称+12(稿件数量)+3327(评论数)+58(转发数)。

步骤206,从所述社交网络服务数据集合中获取所述目标应用程序的社交属性特征;

目标应用程序的社交属性特征为反映了目标应用程序及相关人员的社交能力与关注程度相关的特征,该目标应用程序的社交属性特征至少可以包括目标应用程序本身的推广属性特征以及目标应用程序的相关人员的社交属性特征。例如,该目标应用程序本身的推广属性特征可以从该目标应用程序的官方微博中体现,该目标应用程序的相关人员的社交属性特征可以从该相关人员的微博中体现。

作为一种示例,该相关人员至少可以包括如下人员的一种:投资者(当目标应用程序已有投资者时)、开发者、运维推广者。

作为一种示例,目标应用程序本身的推广属性特征至少可以包括:该目标应用程序被下载的次数,和/或,该目标应用程序的官方微博中的粉丝数和/或大v粉丝数和/或关注数和/或官方微博的所有评论数和/或转发数等。

该目标应用程序的相关人员的社交属性特征至少可以包括:所述目 标应用程序的相关人员名称,和/或,所述相关人员的微博的粉丝数和/或大v粉丝数和/或关注数和/或该相关人员的微博的所有评论数和/或转发数。

步骤207,创建所述目标应用程序的知识图谱;

知识图谱(mappingknowledgedomain)也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(point)和边(edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(heterogeneousinformation)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

在本申请实施例的一种优选实施例中,步骤207可以包括如下子步骤:

子步骤s21,从所述公共关系数据集合中获得与所述目标应用程序相关联的文稿;

在具体实现中,可以在pr数据集合的所有文稿的结构化信息中匹配目标应用程序的匹配因子(包括目标应用程序的名称、功能等),若匹配成功,则该文稿为与目标应用程序关联的文稿,若匹配不成功,则该文稿为与目标应用程序不相关的文稿。

子步骤s22,对所述相关联的文稿进行分词处理,获得所述文稿的有效词,并统计所述有效词的词频;

获得与目标应用程序关联的文稿以后,可以对每个关联的文稿的全文进行分词处理,得到分词结果,然后去掉分词结果中的诸如“的”“了”“是”等停用词,得到每一个关联的文稿的有效词。

需要说明的是,可以采用通用的分词方法,例如,基于字符串匹配、 基于理解、基于统计等分词方法对关联的文稿进行全文分词,得到分词结果,本申请实施例对具体的分词方式不作限制。

得到每个关联的文稿的有效词以后,可以以有效词为单位,统计所有关联的文稿的每一个有效词的出现的频率,得到每个有效词的词频。

子步骤s23,将词频排序在前m的有效词,作为所述目标应用程序的实体知识;

得到每个有效词的词频以后,可以按照词频对有效词进行排序,并获取排序在前m(m为正整数)的有效词,作为该目标应用程序的实体知识,即作为知识图谱中的节点。例如,a音乐app的实体知识可以为b音乐、c音乐、张三等。

子步骤s24,识别所述实体知识的实体类型;

当确定目标应用程序的实体知识时,可以在预设字典中查找与该实体知识对应的实体类型。在具体实现中,预设字典可以包括投资人列表、开发者列表、著名微博大v列表、同行业应用程序列表等。

例如,若目标应用程序为a音乐app,其中一个实体知识为张三,则可以在上述投资人列表、开发者列表、著名微博大v列表、同行业应用程序列表等字典中查找张三,最后在投资人列表中找到“张三”,则得到“张三”的实体类型为投资人。

又如,若目标应用程序为a音乐app,其中一个实体知识为b音乐app,则可以在上述投资人列表、开发者列表、著名微博大v列表、同行业应用程序列表等字典中查找b音乐app,最后在同行业应用程序列表中找到b音乐app,则得到b音乐app的实体类型为竞争对手。

在实际中,该预设字典存储在sns数据库中。

需要说明的是,上述识别实体类型的方式仅仅是本申请实施例的一种示例,本领域技术人员采用其他方式均是可以的,本申请实施例对此不作限制。

子步骤s25,生成所述目标应用程序、所述实体类型以及所述实体知识的映射关系;

得到目标应用程序的实体知识以及实体类型以后,可以生成三者的映射关系,例如,参照上例,生成“a音乐app——投资人——张三”的映射关系。又如,生成“a音乐app——竞争对手——b音乐app”的映射关系。

子步骤s26,将所有映射关系组织成所述目标应用程序的知识图谱。

得到所有实体知识的映射关系以后,组织所有的映射关系,可以得到目标应用程序的知识图谱。

需要说明的是,后续得到的映射关系,若在知识图谱中存在,则放弃该映射关系,若不存在,则在知识图谱中增加该映射关系。

步骤208,以单个目标应用程序为主键,将所述知识图谱、所述访问行为特征、所述公共关系特征、所述社交属性特征,拼合成所述目标应用程序的特征数据表;

获得目标应用程序的公共关系特征、访问行为特征、社交属性特征以及知识图谱以后,可以以目标应用程序为主键,将其公共关系特征、访问行为特征、社交属性特征以及知识图谱进行合并,得到描述目标应用程序多个维度的特征信息的特征数据宽表。

在具体实现中,在生成特征数据表的过程中,还可以考虑目标应用程序的属性信息、每一关联文稿的结构化信息等的因素,将目标应用程序的属性信息、每一关联文稿的结构化信息等信息添加到特征数据表中。

例如,a音乐app的特征数据表为:a音乐+12(相关的文稿的数量)+3327(相关的文稿的评论数)+58(相关的文稿的转发数)+……。

步骤209,基于所述特征数据表,预估所述目标应用程序的期望授信金额;

得到目标应用程序的特征数据表以后,可以根据该特征数据表,预估目标应用程序的期望授信金额(或称期望投资金额)。

在本申请实施例的一种优选实施例中,步骤209可以包括如下子步骤:

子步骤s31,获取在先获得投资的已授信应用程序的授信数据,作为 案例集合;

在具体实现中,sns集合中还可以包括在先获得投资的已授信应用程序的授信数据,该授信数据可以包括投资金额。

可以从sns集合中获得在先获得投资的已授信应用程序的授信数据,作为案例集合。

子步骤s32,根据所述案例集合以及所述特征数据表,生成训练样本;

具体来说,可以依据特征数据表从案例集合中提取相对应格式的宽表作为特征变量,将已授信应用程序的投资金额作为目标变量,得到训练样本。

子步骤s33,对所述训练样本进行模型训练,生成预测模型;

得到训练样本以后,可以采用回归模型对训练样本进行监督学习,生成预测模型,该预测模型用于预测目标应用程序的期望授信金额。

子步骤s34,针对所述预测模型,计算所述目标应用程序的期望授信金额。

在具体实现中,可以将目标应用程序的特征数据表输入预测模型进行运算,最后得到该目标应用程序的期望授信金额。

步骤210,对所述期望授信金额进行对数运算以及归一化处理,得到所述目标应用程序的信用评分。

具体而言,可以首先对期望授信金额进行log对数运算,并将得到的运算结果进行归一化运算,得到信用评分。作为一种示例,该信用评分的范围可以为0-100。

在另一种实施方式中,还可以根据期望授信金额或信用评分获得目标应用程序的信用评级,具体可以根据预设的信用评级与投资金额的关联关系,获得与该期望投资金额对应的信用评级,例如,期望投资金额为100万,该100万在五星评级的范围内,则将该目标app的信用评级确定为五星。

本申请实施例通过社交属性特征(app及相关人员的社交能力)、公共关系特征(运营推广能力)以及访问行为特征(app的当前状况)等几 个方面的整合和自学习打分,生成可应用于行业纵向以及整个app市场横向比较的信用评估体系,从而获得更具参考意义的项目信用系数。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。

参照图3,示出了本申请一种对应用程序进行项目评估的系统实施例的结构框图,所述系统可以包括如下模块:

异构数据获取模块301,用于获取多种异构数据;

特征信息获取模块302,用于分别从所述异构数据中获取待评估的目标应用程序的特征信息;

项目信用系数获取模块303,用于基于所述目标应用程序的特征信息,获取所述目标应用程序的项目信用系数。

在本申请实施例的一种优选实施例中,所述异构数据获取模块301可以包括如下子模块:

异构数据获取子模块,用于分别从预设的多个数据资源站点中获取对应的异构数据;

组织子模块,用于分别将所述异构数据组织成异构数据集合。

在本申请实施例的一种优选实施例中,所述异构数据至少包括:日志数据、公共关系数据以及社交网络服务数据;所述异构数据集合至少包括:日志数据集合、公共关系数据集合以及社交网络服务数据集合。

在本申请实施例的一种优选实施例中,所述特征信息至少包括:访问行为特征、公共关系特征、社交属性特征;

所述特征信息获取模块302可以包括如下子模块:

目标应用程序确定子模块,用于确定待评估的目标应用程序;

访问特征获取子模块,用于从所述日志数据集合中获取所述目标应用程序的访问行为特征;

公共关系特征获取子模块,用于从所述公共关系数据集合中获取所述目标应用程序的公共关系特征;

社交特征获取子模块,用于从所述社交网络服务数据集合中获取所述目标应用程序的社交属性特征。

在本申请实施例的一种优选实施例中,所述目标应用程序确定子模块包括:

访问次数获取单元,用于获取所述日志数据集合中记录的,每个应用程序在预设时间段内的访问次数;

排序单元,用于基于所述访问次数,对所述应用程序进行排序;

确定单元,用于将排序在前的n个应用程序确定为待评估的目标应用程序,其中,n为正整数。

在本申请实施例的一种优选实施例中,所述访问行为特征至少包括:所述目标应用程序的日均独立访客量,和/或,日活跃用户数,和/或,日均平均使用时长;

和/或,

所述公共关系特征至少包括:与所述目标应用程序关联的文稿的数量,和/或,所述与所述目标应用程序关联的文稿的评论数和/或转发数;

和/或,

所述社交属性特征至少包括:所述目标应用程序被下载的次数,和/或,所述目标应用程序的官方微博中的粉丝数和/或大v粉丝数和/或关注数和/或官方微博的所有评论数和/或转发数,和/或,所述目标应用程序的相关人员名称,和/或,所述相关人员的微博的粉丝数和/或大v粉丝数和/或关注数和/或所述相关人员的微博的所有评论数和/或转发数。

在本申请实施例的一种优选实施例中,所述相关人员包括投资者和/或开发者和/或运维推广者。

在本申请实施例的一种优选实施例中,所述项目信用系数包括期望 授信金额,所述项目信用系数获取模块303可以包括如下子模块:

知识图谱创建子模块,用于创建所述目标应用程序的知识图谱;

特征合并子模块,用于以单个目标应用程序为主键,将所述知识图谱、所述访问行为特征、所述公共关系特征、所述社交属性特征,拼合成所述目标应用程序的特征数据表;

金额预估子模块,用于基于所述特征数据表,预估所述目标应用程序的期望授信金额。

在本申请实施例的一种优选实施例中,所述知识图谱创建子模块包括:

关联文稿获取单元,用于从所述公共关系数据集合中获得与所述目标应用程序相关联的文稿;

文稿分词单元,用于对所述相关联的文稿进行分词处理,获得所述文稿的有效词,并统计所述有效词的词频;

知识确定单元,用于将词频排序在前m的有效词,作为所述目标应用程序的实体知识,其中,m为正整数;

类型识别单元,用于识别所述实体知识的实体类型;

实体映射单元,用于生成所述目标应用程序、所述实体类型以及所述实体知识的映射关系;

知识图谱构建单元,用于将所有映射关系组织成所述目标应用程序的知识图谱。

在本申请实施例的一种优选实施例中,所述金额预估子模块包括:

案例获取单元,用于获取在先获得投资的已授信应用程序的授信数据,作为案例集合;

样本获取单元,用于根据所述案例集合以及所述特征数据表,生成训练样本;

模型训练单元,用于对所述训练样本进行模型训练,生成预测模型;

授信金额计算单元,用于针对所述预测模型,计算所述目标应用程序的期望授信金额。

在本申请实施例的一种优选实施例中,所述项目信用系数还包括信用评分,所述系统还包括:

信用评分获取模块,用于对所述期望授信金额进行对数运算以及归一化处理,得到所述目标应用程序的信用评分。

对于系统实施例而言,由于其与上述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序操作指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序操作指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的操作指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序操作指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的操作指令产生包括操作指令装置的制造品,该操 作指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序操作指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的操作指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种对应用程序进行项目评估的方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1