推荐应用的方法及装置的制造方法

文档序号:10572779阅读:644来源:国知局
推荐应用的方法及装置的制造方法
【专利摘要】本发明提供了一种推荐应用的方法及一种推荐应用的装置,其中,该方法包括:获取与多个第一用户的相关的已安装应用信息及用户相关信息;基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器学习以构建用户属性预测模型;将待预测的第二用户的特征信息输入用户属性预测模型,以预测确定第二用户的个人属性信息;基于第二用户的用户属性信息,确定与其相匹配的待推荐应用。基于本发明提供的用户属性预测模型预测确定的个人属性信息准确率较高,且预测确定的过程不需要用户的参与,实现了全自动化的软件推荐方式。
【专利说明】
推荐应用的方法及装置
技术领域
[0001] 本发明涉及无线移动通信技术领域,具体而言,本发明涉及一种推荐应用的方法 及一种推荐应用的装置。
【背景技术】
[0002] 随着科学技术日新月异的发展,具有各式各样功能的软件层出不穷,它为人们的 生活带来了便利。在现有技术中,由于应用市场中的软件数量庞大,所以在向用户进行软件 推荐时,通常采取对软件进行分类的方式,分别计算同一分类下的各个软件的使用率,并在 各个分类中将使用率较高的软件作为热门软件向用户进行推荐。但上述向用户进行软件推 荐的方式,并未针对不同用户设计个性化推荐方式,因此,软件推荐的成功率较低。因此,如 何针对不同用户进行个性化的软件推荐,同时保证较高的软件推荐成功率成为了亟待解决 的问题。

【发明内容】

[0003] 为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
[0004] 本发明的一个实施例提出了一种推荐应用的方法,包括:
[0005] 获取与多个第一用户的相关的已安装应用信息及用户相关信息;
[0006] 基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器学习以构建 用户属性预测模型;
[0007] 将待预测的第二用户的特征信息输入用户属性预测模型,以预测确定第二用户的 个人属性信息;
[0008] 基于第二用户的用户属性信息,确定与其相匹配的待推荐应用。
[0009] 优选地,已安装应用信息包括第一用户的终端设备中已安装应用的应用描述信 息、应用分类信息、应用价格信息中的至少一项。
[0010]优选地,用户相关信息包括第一用户的终端设备的设备相关信息和/或第一用户 的个人属性信息。
[0011]优选地,基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器学 习以构建用户属性预测模型,具体包括:
[0012] 采用特征工程,基于已安装应用信息及用户相关信息生成特征向量;
[0013] 将特征向量输入预定的训练模型进行机器学习以构建用户属性预测模型。
[0014] 优选地,个人属性信息包括以下一项或多项:
[0015] 年龄区间;性别;收入区间;教育程度;婚姻状况。
[0016] 优选地,基于第二用户的个人属性信息,确定与其相匹配的待推荐应用,包括:
[0017] 基于第二用户的个人属性信息,确定与第二用户相匹配的一个或多个应用分类;
[0018] 从相匹配的应用分类对应的应用集合中选取相应的至少一个待推荐应用。
[0019] 优选地,基于第二用户的个人属性信息,确定与其相匹配的待推荐应用,包括:
[0020] 确定多个待推荐应用分别所属的应用分类;
[0021] 基于应用分类与第二用户的个人属性信息的对应关系,从该多个待推荐应用种选 取与第二用户相匹配的待推荐应用。
[0022] 本发明的另一实施例提出了一种推荐应用的装置,包括:
[0023] 获取模块,用于获取与多个第一用户的相关的已安装应用信息及用户相关信息; [0024]学习模块,用于基于已安装应用信息及用户相关信息,通过预定的训练模型进行 机器学习以构建用户属性预测模型;
[0025] 预测模块,用于将待预测的第二用户的特征信息输入用户属性预测模型,以预测 确定第二用户的个人属性信息;
[0026] 确定模块,用于基于第二用户的用户属性信息,确定与其相匹配的待推荐应用。 [0027]优选地,已安装应用信息包括第一用户的终端设备中已安装应用的应用描述信 息、应用分类信息、应用价格信息中的至少一项。
[0028]优选地,用户相关信息包括第一用户的终端设备的设备相关信息和/或第一用户 的个人属性信息。
[0029]优选地,学习模块具体包括:
[0030]向量生成单元,用于采用特征工程,基于已安装应用信息及用户相关信息生成特 征向量;
[0031] 机器学习单元,用于将特征向量输入预定的训练模型进行机器学习以构建用户属 性预测模型。
[0032] 优选地,个人属性信息包括以下一项或多项:
[0033] 年龄区间;性别;收入区间;教育程度;婚姻状况。
[0034]优选地,确定模块包括:
[0035] 第一确定单元,用于基于第二用户的个人属性信息,确定与第二用户相匹配的一 个或多个应用分类;
[0036] 第一选取单元,用于从相匹配的应用分类对应的应用集合中选取相应的至少一个 待推荐应用。
[0037]优选地,确定模块包括:
[0038]第二确定单元,用于确定多个待推荐应用分别所属的应用分类;
[0039] 第二选取单元,用于基于应用分类与第二用户的个人属性信息的对应关系,从该 多个待推荐应用种选取与第二用户相匹配的待推荐应用。
[0040] 本发明的技术方案解决了如何针对不同用户的个人情况进行应用推荐的问题。首 先,训练用户属性预测模型,该模型是基于大量原始数据训练得到的;接着,将待预测的第 二用户的特征信息输入用户属性预测模型,以预测确定第二用户的个人属性信息,基于用 户属性预测模型可保证对个人属性信息的判断具有较高的准确率;最后,基于第二用户的 用户属性信息,确定与其相匹配的待推荐应用,有针对性地根据不同用户的特点以预先制 定的不同的应用推荐策略将待推荐应用推荐给第二用户。基于本发明实施例提供的用户属 性预测模型预测确定的个人属性信息准确率较高,且预测确定的过程不需要用户的参与, 实现了全自动化的软件推荐方式。另外,根据预测确定的准确率较高的个人属性信息进行 应用推荐操作的应用推荐成功率也相应会大大提高。
[0041] 本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0042] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得 明显和容易理解,其中:
[0043] 图1为本发明一个实施例的软件推荐的方法的流程示意图;
[0044] 图2为本发明一个优选实施例的软件推荐的方法的流程示意图;
[0045] 图3为本发明另一实施例的软件推荐的装置的结构示意图。
【具体实施方式】
[0046] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0047]本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式"一"、"一 个"、"所述"和"该"也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措 辞"包括"是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加 一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元 件被"连接"或"耦接"到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在 中间元件。此外,这里使用的"连接"或"親接"可以包括无线连接或无线耦接。这里使用的措 辞"和/或"包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0048]本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术 语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该 理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的 意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义 来解释。
[0049]本技术领域技术人员可以理解,这里所使用的"终端"、"终端设备"既包括无线信 号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件 的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备 可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示 器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可 以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人 数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日 历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上 型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其 他设备。这里所使用的"终端"、"终端设备"可以是便携式、可运输、安装在交通工具(航空、 海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球 和/或空间的任何其他位置运行。这里所使用的"终端"、"终端设备"还可以是通信终端、上 网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网 设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
[0050] 图1为本发明一个实施例的软件推荐的方法的流程示意图。
[0051] 步骤S110:获取与多个第一用户的相关的已安装应用信息及用户相关信息。
[0052]优选地,与第一用户的相关的已安装应用信息包括但不限于:第一用户的终端设 备中已安装应用的应用描述信息、应用分类信息、应用价格信息。
[0053]具体地,获取与多个第一用户的相关的已安装应用信息的步骤包括:首先,分别提 取多个第一用户的终端设备中的已安装的多个应用分别对应的应用日志;接着,依据各个 应用的应用日志,分别建立多个第一用户的相关的已安装应用信息。
[0054] 例如,在提取用户A的终端设备中的已安装的3款应用分别对应的应用日志的应用 情景下,提取用户A的移动终端如智能手机中存储的已安装的3款应用分别对应的应用日 志,应用日志分别记录着3款应用的应用信息,该信息包括应用标识、应用描述信息、应用分 类信息、应用价格信息,3款应用的应用信息具体如下所述:
[0055] APP1的应用日志包括,应用标识:XX即时通讯应用;应用描述信息:安装XX即时通 讯是一种生活方式,你可以快速高效地收发消息,轻松愉快地和朋友畅谈,让沟通更方便; 应用分类信息:聊天通讯类;应用价格信息:应用内消费。
[0056] APP2的应用日志包括,应用标识:XX拍照应用;应用描述信息:超过5亿用户正在使 用!近50款小清新范儿全新实时滤镜,搭配独有的美颜技术和景深功能,让镜头里的你拥有 无与伦比的美丽!现已获得众多知名摄影师倾情推荐;应用分类信息:图像编辑类;应用价 格信息:免费。
[0057] APP3的应用日志包括,应用标识:XX游戏应用;应用描述信息:XX游戏的多种玩法 百玩不腻!新版本加入萌宠系统及宝物探索,增加青菜英雄!战斗中可召唤宠物一同战;应 用分类信息:游戏类;应用价格信息:18RMB。
[0058] 优选地,用户相关信息包括但不限于:第一用户的终端设备的设备相关信息和/或 第一用户的个人属性信息。
[0059] 其中,第一用户的终端设备的设备相关信息包括但不限于:移动终端型号、内存大 小、网络环境状态;第一用户的个人属性信息包括但不限于:年龄区间、性别、收入区间、教 育程度、婚姻状况。
[0060] 具体地,获取多个第一用户的终端设备的设备相关信息和/或个人属性信息可以 根据用户的输入操作获取,如在人机交互界面以调查问卷的方式向提供用户输入窗口,接 收用户输入的与调查问卷相应的数据信息;还可以基于第一用户的用户标识在服务器端预 存的数据库中查询获得。
[0061] 步骤S120:基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器 学习以构建用户属性预测模型。
[0062] 优选地,如图2所示,基于已安装应用信息及用户相关信息,通过预定的训练模型 进行机器学习以构建用户属性预测模型的步骤具体包括步骤S121和步骤S122:步骤S121: 采用特征工程,基于已安装应用信息及用户相关信息生成特征向量;步骤S122:将特征向量 输入预定的训练模型进行机器学习以构建用户属性预测模型。
[0063]首先,采用特征工程,基于已安装应用信息及用户相关信息生成特征向量。
[0064]需要说明的是,特征工程是利用数据领域的相关知识来创建能够使机器学习的算 法达到最佳性能的特征的过程,是把原始数据如在本实施例中的已安装应用信息及用户相 关信息转变成特征向量的过程,这些特征向量可以较为准确地描述原始数据,利用特征向 量建立的模型可以达到最优在未知数据的预测上。
[0065] 另外,在机器学习的过程中,特征向量是原始数据的一种独立、可测量的属性,选 择信息量大的、有差别性的、独立的特征向量是解决机器学习中主要问题如模式识别、分类 和回归问题的关键的一步。然而,原始数据的规模是巨大的,且原始数据中存在着冗余的提 供非必要信息的原始数据,因此,在机器学习的过程中,需要选择原始数据中的一部分生成 特征向量,或者基于原始数据重新构建一套特征向量,以减少冗余的原始数据,故而可以促 进机器学习的过程,提高泛化能力和可解释性。
[0066] 接着,将特征向量输入预定的训练模型进行机器学习以构建用户属性预测模型。
[0067] 其中,预定的训练模型可以是预先存储的可以解决构建用户属性预测模型的问题 的训练t吴型。
[0068]优选地,本发明实施例可以通过逻辑回归模型或线性回归SVM模型进行机器学习 以构建用户属性预测模型。
[0069] 具体地,逻辑回归模型是机器学习中的一种分类模型,由于算法的简单和高效,在 实际中应用非常广泛。其中,逻辑回归模型应用逻辑回归方法,逻辑回归方法是回归方法的 一种。回归方法是通过具有已知值的变量值来预测其他非已知变量值,最简单的回归方法 采用线性回归方法。但是很多问题不能应用简单的线性回归方法预测,因为不能应用简单 的线性回归方法预测的事件所需的变量值的规模较大,且变量值是非线性的,故而在解决 上述问题时,可以应用非线性回归方法如逻辑回归方法、决策树等解决。
[0070] 逻辑回归模型分为二项逻辑回归模型和多项逻辑回归模型,二模型要区别在于目 标变量所属的类别数量。逻辑回归模型,主要用来对受多因素影响的事件进行概率预测,根 据预测的概率对目标变量进行分类。以最常用的二项逻辑回归模型为例,即因变量的取值 只包含两个类别,通过以下公式可以计算两个类别中一个类别发生的概率:
[0071]
[0072]
[0073]
[0074] 其中,p为两个类别中一个类别发生的概率;X为影响因素。
[0075]另外,线性回归SVM模型是20世纪90年代初Vapnik等人根据统计学习理论提出的 一种新的机器学习方法,它以结构风险最小化原则为理论基础,通过适当地选择函数子集 及该子集中的判别函数,使学习机器的实际风险达到最小,保证了通过有限训练样本得到 的小误差分类器,对独立测试集的测试误差仍然较小。
[0076]线性回归SVM模型的基本思想是:首先,在线性可分情况下,在原空间寻找两类样 本的最优分类超平面。在线性不可分的情况下,加入了松弛变量进行分析,通过使用非线性 映射将低维输入空间的样本映射到高维属性空间使其变为线性情况,从而使得在高维属性 空间采用线性算法对样本的非线性进行分析成为可能,并在该特征空间中寻找最优分类超 平面。其次,它通过使用结构风险最小化原理在属性空间构建最优分类超平面,使得分类器 得到全局最优,并在整个样本空间的期望风险以某个概率满足一定上界。
[0077]需要说明的是,可以根据步骤S110中获取得到的大量的已安装的应用信息及安装 这些应用的相应用户的用户相关信息,在步骤S120中通过预定的训练模型进行机器学习以 构建用户属性预测模型,可以输入特征向量于用户属性预测模型中,以根据输出结果判断 个人属性信息。
[0078]步骤S130:将待预测的第二用户的特征信息输入用户属性预测模型,以预测确定 第二用户的个人属性信息。
[0079] 首先,获取第二用户的特征信息如已安装应用信息、包括终端设备的设备相关信 息和个人属性信息的用户相关信息,在此步骤中可以尽量多地获取第二用户的特征信息; 接着,基于获取到的第二用户的特征信息生成第二用户的特征向量;最后,将第二用户的特 征向量输入用户属性预测模型得到预测结果,基于预测结果可以预测确定第二用户的个人 属性信息。
[0080] 需要说明的是,在获取第二用户的特征信息时,相对于获取第二用户的个人属性 信息,终端设备更易于获取到第二用户的已安装应用信息和终端设备的设备相关信息,因 为第二用户的已安装应用信息和终端设备的设备相关信息可以通过提取第二用户的终端 设备中的相应的信息获取,在上述信息获取的过程中不需要第二用户的主动参与。相反地, 在获取第二用户的个人属性信息时,需要第二用户主动参与完成信息获取的过程,例如需 要第二用户在人机交互界面填写调查问卷提供个人属性信息。本发明提供的实施例可以仅 根据第二用户的已安装应用信息、终端设备的设备相关信息生成第二用户的特征向量,将 该特征向量输入用户属性预测模型得到输出结果,以预测确定第二用户的个人属性信息, 不需要第二用户过多的主动参与。另外,如果可以获取到全面的或者非全面的第二用户的 个人属性信息,将该信息作为参考进行第二用户的个人属性信息的预测的准确度也会大大 提尚。
[0081] 优选地,个人属性信息包括但不限于:年龄区间、性别、收入区间、教育程度、婚姻 状况。
[0082] 例如,获取用户A的终端设备如智能手机的已安装应用信息"应用标识:XX游戏应 用;应用描述信息:XX游戏的多种玩法百玩不腻!新版本加入萌宠系统及宝物探索,增加青 菜英雄!战斗中可召唤宠物一同战;应用分类信息:游戏类;应用价格信息:18RMB"、设备相 关信息"iPhone6s内存大小:64G";随后,基于获取到的已安装应用信息、设备相关信息生成 特征向量;最后,将该特征向量输入训练好的用户属性预测模型,根据模型输出结果可以预 测确定用户A的个人属性信息如收入区间为"5000-10000RMB"。
[0083]需要说明的是,用户属性预测模型是基于相关联的事实对个人属性信息进行预测 的,例如,接上例,事实上用户A安装的应用非免费应用而是需要消费18RMB的应用,且用户A 使用的智能手机也属于高端档位的手机,因为可以推断用户A的收入水平是较高的。本发明 实施例中的用户属性预测模型是基于大量原始数据训练得到的,因而基于该用户属性预测 模型输出结果得到的个人属性信息比人为主观推断个人属性信息更加准确。基于本发明实 施例提供的用户属性预测模型预测确定的个人属性信息进行相应的应用推荐的操作使得 待推荐应用的推荐成功率大大提高。
[0084]又例如,获取用户A的用户相关信息"年龄区间:22-24岁;教育程度:本科",将基于 用户A的用户相关信息生成的特征向量输入用户属性预测模型,可以预测确定用户A的收入 区间为 "5000-8000RMB"。
[0085]步骤S140:基于第二用户的用户属性信息,确定与其相匹配的待推荐应用。
[0086] 优选地,基于第二用户的用户属性信息,确定与其相匹配的待推荐应用的步骤包 括步骤S141和步骤S142:步骤S141:基于第二用户的个人属性信息,确定与第二用户相匹配 的一个或多个应用分类;步骤S142:从相匹配的应用分类对应的应用集合中选取相应的至 少一个待推荐应用。
[0087] 首先,基于第二用户的个人属性信息,确定与第二用户相匹配的一个或多个应用 分类。
[0088]例如,预测确定用户B的个人属性信息"年龄区间:22-24岁;性别:男;收入区间: 5000-10000RMB;教育程度:本科;婚姻状况:未婚",根据用户B的个人属性信息查找预先存 储的个人属性信息与应用分类对应关系的列表;随后,基于用户B是男性、年龄区间在22-24 岁,在预先存储的个人属性信息与应用分类对应关系的列表中确定相匹配的应用分类是格 斗游戏类,确定与用户B相匹配的一个应用分类为格斗游戏类。
[0089] 接着,从相匹配的应用分类对应的应用集合中选取相应的至少一个待推荐应用。
[0090] 例如,接上例,与用户B相匹配的一个应用分类为格斗游戏类,再在预先存储的个 人属性信息与应用对应关系的列表中基于用户B的个人属性信息查找与用户B相匹配的待 推荐应用;接着,基于用户B的收入区间"5000-10000RMB",在预先存储的个人属性信息与应 用对应关系的列表中确定与收入区间是"5000-10000RMB"相应的待推荐应用是"XX拳王", 且该格斗游戏应用的获取费用是"5RMB"。需要说明的是,因为预测确定用户B的收入区间是 "5000-100001?^",所以可以推断用户8是"小资"水平,相应地可以给用户财隹荐收取一定费 用的应用。
[0091] 除上述步骤方法之外,基于第二用户的用户属性信息,确定与其相匹配的待推荐 应用的步骤也可以包括步骤S143和步骤S144:步骤S143:确定多个待推荐应用分别所属的 应用分类;步骤S144:基于应用分类与第二用户的个人属性信息的对应关系,从该多个待推 荐应用种选取与第二用户相匹配的待推荐应用。
[0092]例如,确定待推荐应用"XX即时通讯应用"所属的应用分类为聊天通讯类、XX拍照 应用所属的应用分类为图像编辑类、XX游戏应用所属的应用分类为游戏类;接着,基于待推 荐应用所属的应用分类和用户C的个人属性信息"年龄区间:22-24岁;性别:女;收入区间: 5000-10000RMB;教育程度:本科;婚姻状况:未婚",在预先存储的应用分类与个人属性信息 对应关系的列表中查找确定与用户C相匹配的待推荐应用为"XX拍照应用"。需要说明的是, 因为用户C是名女性用户,因此根据绝大多数女性用户的偏好可以得知女性用户偏向于图 像编辑类应用以美化个人照等人物照片,所以根据用户C的性别对用户C具有针对性地推荐 图像编辑类应用时,用户C接受该推荐的成功率大大提高。当然,在具体推荐策略的制定中, 远比本实施例中的举例说明要复杂,对于待推荐应用的推荐过程,需要综合考虑全面的用 户的个人属性信息。
[0093] 本发明的技术方案解决了如何针对不同用户的个人情况进行应用推荐的问题。首 先,训练用户属性预测模型,该模型是基于大量原始数据训练得到的;接着,将待预测的第 二用户的特征信息输入用户属性预测模型,以预测确定第二用户的个人属性信息,基于用 户属性预测模型可保证对个人属性信息的判断具有较高的准确率;最后,基于第二用户的 用户属性信息,确定与其相匹配的待推荐应用,有针对性地根据不同用户的特点以预先制 定的不同的应用推荐策略将待推荐应用推荐给第二用户。基于本发明实施例提供的用户属 性预测模型预测确定的个人属性信息准确率较高,且预测确定的过程不需要用户的参与, 实现了全自动化的软件推荐。另外,根据预测确定的准确率较高的个人属性信息进行应用 推荐操作的应用推荐成功率也相应会大大提高。
[0094] 图3为本发明另一实施例的软件推荐的装置的结构示意图。
[0095]获取模块310获取与多个第一用户的相关的已安装应用信息及用户相关信息。 [0096]优选地,与第一用户的相关的已安装应用信息包括但不限于:第一用户的终端设 备中已安装应用的应用描述信息、应用分类信息、应用价格信息。
[0097]具体地,获取模块310具体用于首先,分别提取多个第一用户的终端设备中的已安 装的多个应用分别对应的应用日志;接着,依据各个应用的应用日志,分别建立多个第一用 户的相关的已安装应用信息。
[0098]例如,在提取用户A的终端设备中的已安装的3款应用分别对应的应用日志的应用 情景下,提取用户A的移动终端如智能手机中存储的已安装的3款应用分别对应的应用日 志,应用日志分别记录着3款应用的应用信息,该信息包括应用标识、应用描述信息、应用分 类信息、应用价格信息,3款应用的应用信息具体如下所述:
[0099] APP1的应用日志包括,应用标识:XX即时通讯应用;应用描述信息:安装XX即时通 讯是一种生活方式,你可以快速高效地收发消息,轻松愉快地和朋友畅谈,让沟通更方便; 应用分类信息:聊天通讯类;应用价格信息:应用内消费。
[0100] APP2的应用日志包括,应用标识:XX拍照应用;应用描述信息:超过5亿用户正在使 用!近50款小清新范儿全新实时滤镜,搭配独有的美颜技术和景深功能,让镜头里的你拥有 无与伦比的美丽!现已获得众多知名摄影师倾情推荐;应用分类信息:图像编辑类;应用价 格信息:免费。
[0101] APP3的应用日志包括,应用标识:XX游戏应用;应用描述信息:XX游戏的多种玩法 百玩不腻!新版本加入萌宠系统及宝物探索,增加青菜英雄!战斗中可召唤宠物一同战;应 用分类信息:游戏类;应用价格信息:18RMB。
[0102] 优选地,用户相关信息包括但不限于:第一用户的终端设备的设备相关信息和/或 第一用户的个人属性信息。
[0103] 其中,第一用户的终端设备的设备相关信息包括但不限于:移动终端型号、内存大 小、网络环境状态;第一用户的个人属性信息包括但不限于:年龄区间、性别、收入区间、教 育程度、婚姻状况。
[0104] 具体地,获取多个第一用户的终端设备的设备相关信息和/或个人属性信息可以 根据用户的输入操作获取,如在人机交互界面以调查问卷的方式向提供用户输入窗口,接 收用户输入的与调查问卷相应的数据信息;还可以基于第一用户的用户标识在服务器端预 存的数据库中查询获得。
[0105] 学习模块320基于已安装应用信息及用户相关信息,通过预定的训练模型进行机 器学习以构建用户属性预测模型。
[0106] 优选地,学习模块320具体包括向量生成单元和机器学习单元:向量生成单元采用 特征工程,基于已安装应用信息及用户相关信息生成特征向量;机器学习单元将特征向量 输入预定的训练模型进行机器学习以构建用户属性预测模型。
[0107] 首先,向量生成单元采用特征工程,基于已安装应用信息及用户相关信息生成特 征向量。
[0108] 接着,机器学习单元将特征向量输入预定的训练模型进行机器学习以构建用户属 性预测模型。
[0109] 其中,预定的训练模型可以是预先存储的可以解决构建用户属性预测模型的问题 的训练t吴型。
[0110] 优选地,本发明实施例可以通过逻辑回归模型或线性回归SVM模型进行机器学习 以构建用户属性预测模型。
[0111] 需要说明的是,获取模块310可以获取得到大量的已安装的应用信息及安装这些 应用的相应用户的用户相关信息,学习模块320通过预定的训练模型进行机器学习来构建 用户属性预测模型,可以输入特征向量于用户属性预测模型中,以根据输出结果判断个人 属性信息。
[0112]预测模块330将待预测的第二用户的特征信息输入用户属性预测模型,以预测确 定第二用户的个人属性信息。
[0113]首先,获取第二用户的特征信息如已安装应用信息、包括终端设备的设备相关信 息和个人属性信息的用户相关信息,可以尽量多地获取第二用户的特征信息;接着,基于获 取到的第二用户的特征信息生成第二用户的特征向量;最后,将第二用户的特征向量输入 用户属性预测模型得到预测结果,基于预测结果可以预测确定第二用户的个人属性信息。
[0114] 需要说明的是,在获取第二用户的特征信息时,相对于获取第二用户的个人属性 信息,终端设备更易于获取到第二用户的已安装应用信息和终端设备的设备相关信息,因 为第二用户的已安装应用信息和终端设备的设备相关信息可以通过提取第二用户的终端 设备中的相应的信息获取,在上述信息获取的过程中不需要第二用户的主动参与。相反地, 在获取第二用户的个人属性信息时,需要第二用户主动参与完成信息获取的过程,例如需 要第二用户在人机交互界面填写调查问卷提供个人属性信息。本发明提供的实施例可以仅 根据第二用户的已安装应用信息、终端设备的设备相关信息生成第二用户的特征向量,将 该特征向量输入用户属性预测模型得到输出结果,以预测确定第二用户的个人属性信息, 不需要第二用户过多的主动参与。另外,如果可以获取到全面的或者非全面的第二用户的 个人属性信息,将该信息作为参考进行第二用户的个人属性信息的预测的准确度也会大大 提尚。
[0115] 优选地,个人属性信息包括但不限于:年龄区间、性别、收入区间、教育程度、婚姻 状况。
[0116] 例如,获取用户A的终端设备如智能手机的已安装应用信息"应用标识:XX游戏应 用;应用描述信息:XX游戏的多种玩法百玩不腻!新版本加入萌宠系统及宝物探索,增加青 菜英雄!战斗中可召唤宠物一同战;应用分类信息:游戏类;应用价格信息:18RMB"、设备相 关信息"iPhone6s内存大小:64G";随后,基于获取到的已安装应用信息、设备相关信息生成 特征向量;最后,将该特征向量输入训练好的用户属性预测模型,根据模型输出结果可以预 测确定用户A的个人属性信息如收入区间为"5000-10000RMB"。
[0117]需要说明的是,用户属性预测模型是基于相关联的事实对个人属性信息进行预测 的,例如,接上例,事实上用户A安装的应用非免费应用而是需要消费18RMB的应用,且用户A 使用的智能手机也属于高端档位的手机,因为可以推断用户A的收入水平是较高的。本发明 实施例中的用户属性预测模型是基于大量原始数据训练得到的,因而基于该用户属性预测 模型输出结果得到的个人属性信息比人为主观推断个人属性信息更加准确。基于本发明实 施例提供的用户属性预测模型预测确定的个人属性信息进行相应的应用推荐的操作使得 待推荐应用的推荐成功率大大提高。
[0118]又例如,获取用户A的用户相关信息"年龄区间:22-24岁;教育程度:本科",将基于 用户A的用户相关信息生成的特征向量输入用户属性预测模型,可以预测确定用户A的收入 区间为 "5000-8000RMB"。
[0119] 确定模块340基于第二用户的用户属性信息,确定与其相匹配的待推荐应用。
[0120] 优选地,确定模块340具体包括第一确定单元和第一选取单元:第一确定单元基于 第二用户的个人属性信息,确定与第二用户相匹配的一个或多个应用分类;第一选取单元 从相匹配的应用分类对应的应用集合中选取相应的至少一个待推荐应用。
[0121] 首先,第一确定单元基于第二用户的个人属性信息,确定与第二用户相匹配的一 个或多个应用分类。
[0122] 例如,预测确定用户B的个人属性信息"年龄区间:22-24岁;性别:男;收入区间: 5000-10000RMB;教育程度:本科;婚姻状况:未婚",根据用户B的个人属性信息查找预先存 储的个人属性信息与应用分类对应关系的列表;随后,基于用户B是男性、年龄区间在22-24 岁,在预先存储的个人属性信息与应用分类对应关系的列表中确定相匹配的应用分类是格 斗游戏类,确定与用户B相匹配的一个应用分类为格斗游戏类。
[0123] 接着,第一选取单元从相匹配的应用分类对应的应用集合中选取相应的至少一个 待推荐应用。
[0124] 例如,接上例,与用户B相匹配的一个应用分类为格斗游戏类,再在预先存储的个 人属性信息与应用对应关系的列表中基于用户B的个人属性信息查找与用户B相匹配的待 推荐应用;接着,基于用户B的收入区间"5000-10000RMB",在预先存储的个人属性信息与应 用对应关系的列表中确定与收入区间是"5000-10000RMB"相应的待推荐应用是"XX拳王", 且该格斗游戏应用的获取费用是"5RMB"。需要说明的是,因为预测确定用户B的收入区间是 "5000-100001?^",所以可以推断用户8是"小资"水平,相应地可以给用户财隹荐收取一定费 用的应用。
[0125] 除上述模块之外,确定模块340也可以包括第二确定单元和第二选取单元:第二确 定单元确定多个待推荐应用分别所属的应用分类;第二选取单元基于应用分类与第二用户 的个人属性信息的对应关系,从该多个待推荐应用种选取与第二用户相匹配的待推荐应 用。
[0126] 例如,确定待推荐应用"XX即时通讯应用"所属的应用分类为聊天通讯类、XX拍照 应用所属的应用分类为图像编辑类、XX游戏应用所属的应用分类为游戏类;接着,基于待推 荐应用所属的应用分类和用户C的个人属性信息"年龄区间:22-24岁;性别:女;收入区间: 5000-10000RMB;教育程度:本科;婚姻状况:未婚",在预先存储的应用分类与个人属性信息 对应关系的列表中查找确定与用户C相匹配的待推荐应用为"XX拍照应用"。需要说明的是, 因为用户C是名女性用户,因此根据绝大多数女性用户的偏好可以得知女性用户偏向于图 像编辑类应用以美化个人照等人物照片,所以根据用户C的性别对用户C具有针对性地推荐 图像编辑类应用时,用户C接受该推荐的成功率大大提高。当然,在具体推荐策略的制定中, 远比本实施例中的举例说明要复杂,对于待推荐应用的推荐过程,需要综合考虑全面的用 户的个人属性信息。
[0127] 本发明的技术方案解决了如何针对不同用户的个人情况进行应用推荐的问题。首 先,训练用户属性预测模型,该模型是基于大量原始数据训练得到的;接着,将待预测的第 二用户的特征信息输入用户属性预测模型,以预测确定第二用户的个人属性信息,基于用 户属性预测模型可保证对个人属性信息的判断具有较高的准确率;最后,基于第二用户的 用户属性信息,确定与其相匹配的待推荐应用,有针对性地根据不同用户的特点以预先制 定的不同的应用推荐策略将待推荐应用推荐给第二用户。基于本发明实施例提供的用户属 性预测模型预测确定的个人属性信息准确率较高,且预测确定的过程不需要用户的参与, 实现了全自动化的软件推荐。另外,根据预测确定的准确率较高的个人属性信息进行应用 推荐操作的应用推荐成功率也相应会大大提高。
[0128] 本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的 一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用 计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地 激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在 适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不 限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、R0M( Read-Only Memory,只 读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡 片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介 质。
[0129] 本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或 框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领 域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他 可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理 器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
[0130]本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的 步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各 种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。 进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案 也可以被交替、更改、重排、分解、组合或删除。
[0131]以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。
【主权项】
1. 一种推荐应用的方法,包括: 获取与多个第一用户的相关的已安装应用信息及用户相关信息; 基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器学习以构建用户 属性预测模型; 将待预测的第二用户的特征信息输入所述用户属性预测模型,以预测确定所述第二用 户的个人属性信息; 基于所述第二用户的用户属性信息,确定与其相匹配的待推荐应用。2. 根据权利要求1所述的方法,其中,所述已安装应用信息包括第一用户的终端设备中 已安装应用的应用描述信息、应用分类信息、应用价格信息中的至少一项。3. 根据权利要求1所述的方法,其中,所述用户相关信息包括第一用户的终端设备的设 备相关信息和/或第一用户的个人属性信息。4. 根据权利要求1所述的方法,其中,基于已安装应用信息及用户相关信息,通过预定 的训练模型进行机器学习以构建用户属性预测模型,具体包括: 采用特征工程,基于所述已安装应用信息及用户相关信息生成特征向量; 将所述特征向量输入预定的训练模型进行机器学习以构建用户属性预测模型。5. 根据权利要求1所述的方法,其中,所述个人属性信息包括以下一项或多项: 年龄区间;性别;收入区间;教育程度;婚姻状况。6. 根据权利要求5所述的方法,其中,基于所述第二用户的个人属性信息,确定与其相 匹配的待推荐应用,包括: 基于所述第二用户的个人属性信息,确定与第二用户相匹配的一个或多个应用分类; 从相匹配的应用分类对应的应用集合中选取相应的至少一个待推荐应用。7. 根据权利要求5所述的方法,其中,基于所述第二用户的个人属性信息,确定与其相 匹配的待推荐应用,包括: 确定多个待推荐应用分别所属的应用分类; 基于应用分类与所述第二用户的个人属性信息的对应关系,从该多个待推荐应用种选 取与所述第二用户相匹配的待推荐应用。8. -种推荐应用的装置,包括: 获取模块,用于获取与多个第一用户的相关的已安装应用信息及用户相关信息; 学习模块,用于基于已安装应用信息及用户相关信息,通过预定的训练模型进行机器 学习以构建用户属性预测模型; 预测模块,用于将待预测的第二用户的特征信息输入所述用户属性预测模型,以预测 确定所述第二用户的个人属性信息; 确定模块,用于基于所述第二用户的用户属性信息,确定与其相匹配的待推荐应用。9. 根据权利要求8所述的装置,其中,所述已安装应用信息包括第一用户的终端设备中 已安装应用的应用描述信息、应用分类信息、应用价格信息中的至少一项。10. 根据权利要求8所述的装置,其中,所述用户相关信息包括第一用户的终端设备的 设备相关信息和/或第一用户的个人属性信息。
【文档编号】H04L29/08GK105933425SQ201610330682
【公开日】2016年9月7日
【申请日】2016年5月18日
【发明人】周楠, 岳华东, 张永攀, 常富洋
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1