用户模型建立方法及其装置、电子设备、计算机可读介质与流程

文档序号:17662240发布日期:2019-05-15 22:27阅读:113来源:国知局
用户模型建立方法及其装置、电子设备、计算机可读介质与流程

本申请涉及互联网领域,尤其涉及一种用户模型建立方法及其装置、电子设备、计算机可读介质。



背景技术:

现如今,大数据云存储普及程度越来越高,而无疑其信息的私密性也有被泄漏的风险,由此引起的数据安全问题是不容忽视的。

数据往往以一定形式存储在数据库中,方便用户存取和操作。现如今,大数据依托于更广泛更开放的云平台出现,但是,由于用户的需求千变万化,如何动态的满足用户的数据需求,成为亟待提供的技术问题之一。



技术实现要素:

本申请的目的在于提出一种用户模型建立方法及其装置、电子设备、计算机可读介质,用于解决现有技术中的上述问题。

第一方面,本申请实施例提供一种用户模型建立方法,其包括:

收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

可选地,在本申请的任一实施例中,收集参与用户模型建立学习的样本,包括:根据设定的离线数据收集规则或者在线收集规则收集参与用户模型建立学习的样本。

可选地,在本申请的任一实施例中,还包括:根据所述数据使用习惯和数据流转轨迹,建立数据使用习惯向量以及数据流转轨迹向量。

可选地,在本申请的任一实施例中,根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型,包括:根据数据使用习惯向量以及数据流转轨迹向量建立用户模型。

可选地,在本申请的任一实施例中,还包括:预先建立样本库,并将用户的数据使用习惯以及数据流转轨迹添加到所述样本库中。

可选地,在本申请的任一实施例中,还包括:根据新增数据对应的数据使用习惯以及数据流转轨迹对所述样本库进行增量更新。

可选地,在本申请的任一实施例中,还包括:根据新的数据使用习惯以及新的数据流转轨迹对所述样本库进行全量更新。

第二方面,本申请实施例还提供一种用户模型建立装置,其包括:

第一程序单元,用于收集参与用户模型建立学习的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

第二程序单元,用于根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

第三方面,本申请实施例提供一种电子设备,包括:

一个或多个处理器;

计算机可读介质,配置为存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请实施例任一所述的方法。

第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例中所述的方法。

本申请实施例公开的技术方案中,通过收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型,从而可以实现根据用户的模型向用户推荐数据,使得用户可以根据其地理位置的变化较为快速地获得其关注的数据。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本申请实施例一中用户模型建立方法的流程示意图;

图2为本申请实施例二中用户模型建立方法的流程示意图;

图3为本申请实施例三中用户模型建立方法的流程示意图;

图4为本申请实施例四中用户模型建立方法的流程示意图;

图5为本申请实施例五中用户模型建立方法的流程示意图;

图6为本申请实施例六中用户模型建立装置的结构示意图;

图7为本申请实施例七中电子设备的结构示意图;

图8为本申请实施例八中电子设备的硬件结构。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请实施例公开的技术方案中,通过收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型,从而可以实现根据用户的模型向用户推荐数据,使得用户可以根据其地理位置的变化较为快速地获得其关注的数据。

本申请下述实施例中提供的用户模型建立方法,其核心思想在于包括:收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

图1为本申请实施例一中用户模型建立方法的流程示意图;如图1所示,其包括:

s101、根据设定的离线数据收集规则或者在线收集规则收集参与用户模型建立学习的样本。

本实施例中,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹。本实施例中,对于离线收集来说,可以通过网络爬虫自动提取关联与数据流转轨迹的信息以及数据使用习惯的数据,从一个或若干个数据源,在从数据源抓取数据的过程中,不断将数据源地址放入队列,直到满足系统的一定停止条件。所有被爬虫抓取的数据将会被存储,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

本实施例中,数据流转轨迹的产生比如可以是由于用户的物理位置发生变化,而为了让用户更为接近其所需要的数据,动态的调整存储该数据的数据节点。数据流转轨迹具体可以通过数据节点的id来反映。数据使用习惯比如包括用户的偏好、用户的活跃度等。

s102、根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型练。

本实施例中,用户模型比如为决策树,通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类,它用树形的图或者模型表示决策及其可能的后果,包括随机事件的影响、资源消耗、以及用途。

本实施例中,在步骤s202中,可以根据所述数据使用习惯和数据流转轨迹,建立数据使用习惯向量以及数据流转轨迹向量,再进一步根据数据使用习惯向量以及数据流转轨迹向量建立用户模型,从而使得建立的用户模型同时关联与数据使用习惯以及数据流转轨迹,建立的用户模型准确度更高。

图2为本申请实施例二中用户模型建立方法的流程示意图;如图2所示,其包括:

s201、收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

本实施例中,与上述实施例类似,通过网络爬虫自动提取关联与数据流转轨迹的信息以及数据使用习惯的数据,从一个或若干个数据源,在从数据源抓取数据的过程中,不断将数据源地址放入队列,直到满足系统的一定停止条件。所有被爬虫抓取的数据将会被存储,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

s202、根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立作为用户模型的分类器。

本实施例中,具体可以采用adaboost算法来建立上述分类器,从而针对同一个样本集(若干输入数据)训练不同的分类器(比如弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。并根据每次训练集之中的每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本(若干输入数据)的权值。将修改权值的新数据送给下层分类器进行训练,然后将每次训练得到的分类器融合起来,作为最后的决策分类器。

图3为本申请实施例三中用户模型建立方法的流程示意图;如图3所示,其包括:

s301、收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

本实施例中,与上述实施例类似,通过网络爬虫自动提取关联与数据流转轨迹的信息以及数据使用习惯的数据,从一个或若干个数据源,在从数据源抓取数据的过程中,不断将数据源地址放入队列,直到满足系统的一定停止条件。所有被爬虫抓取的数据将会被存储,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

s302、根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立作为用户模型的神经网络。

本实施例中,神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。神经网络中,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activationfunction)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。

图4为本申请实施例四中用户模型建立方法的流程示意图;如图4所示,其包括:

s401、收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

本实施例中,与上述实施例类似,通过网络爬虫自动提取关联与数据流转轨迹的信息以及数据使用习惯的数据,从一个或若干个数据源,在从数据源抓取数据的过程中,不断将数据源地址放入队列,直到满足系统的一定停止条件。所有被爬虫抓取的数据将会被存储,进行一定的分析、过滤,并建立索引,以便之后的查询和检索。

s402、根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立作为用户模型的向量机。

本实施例中,向量机具体可以通过svm(supportvectormachine):svm法即支持向量机算法来实现,假设在n维空间,有一组点,每个点对应包含两种类型,svm生成a(n-1)维的超平面,把这些点分成两组。svm会找到一个直线,把这些点分成两类,并且会尽可能远离这些点。

图5为本申请实施例五中用户模型建立方法的流程示意图;如图5所示,其包括:

s501、收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

本实施例中,与上述实施例类似,通过网络爬虫自动提取关联与数据流转轨迹的信息以及数据使用习惯的数据,从一个或若干个数据源,在从数据源抓取数据的过程中,不断将数据源地址放入队列,直到满足系统的一定停止条件。所有被爬虫抓取的数据将会被存储,进行一定的分析、过滤,并建立索引,以便之后的查询和检索

s502、根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立作为用户模型的逻辑回归模型。

本实施例中,逻辑回归模型把有一个或者多个解释变量的数据,建立为二项式类型的模型,通过用累积逻辑分布的逻辑函数估计概率,测量分类因变量和一个或多个独立变量之间的关系。相比于线性回归,它多了一个sigmoid函数(或称为logistic函数)。

进一步地,在上述实施例耳机基础上,还可以包括:预先建立样本库,并将用户的数据使用习惯以及数据流转轨迹添加到所述样本库中。该预先建立样本库的步骤可以在上述方案方法实施例的第一个步骤之前执行,或者在第一个步骤和第二步骤之间执行。

进一步地,还可以包括:根据新增数据对应的数据使用习惯以及数据流转轨迹对所述样本库进行增量更新。或者,根据新的数据使用习惯以及新的数据流转轨迹对所述样本库进行全量更新

图6为本申请实施例六中用户模型建立装置的结构示意图;如图6所示,其包括:

第一程序单元601,用于收集参与用户模型建立学习的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;

第二程序单元602,用于根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型

图7为本申请实施例七中电子设备的结构示意图;该电子设备可以包括:

一个或多个处理器701;

计算机可读介质702,可以配置为存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例中所述的存储方法。

图8为本申请实施例八中电子设备的硬件结构;如图8所示,该电子设备的硬件结构可以包括:处理器801,通信接口802,计算机可读介质803和通信总线804;

其中处理器801、通信接口802、计算机可读介质803通过通信总线804完成相互间的通信;

可选的,通信接口802可以为通信模块的接口,如gsm模块的接口;

其中,处理器801具体可以配置为:收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

处理器801可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述实施例中,电子设备可以为前端的智能终端,也可以为后台的服务器,当为前端的智能终端时,以是智能家电。该家电可包括以下至少一种,例如:电视、数字化视频光碟(dvd)播放器、音响装置、冰箱、空调、真空清洁器、烤箱、微波炉、洗衣机、空气净化器、机顶盒、家庭自动化控制面板、安全控制面板、电视盒(例如,samsunghomesynctm、appletvtm或googletvtm)、游戏机(例如,xboxtm和playstationtm)、电子词典、电子钥匙、摄录机和电子相框。

根据另一个实施方式,电子设备可包括以下至少一种:各种医疗设备(例如,各种便携式医疗测量设备(例如,血糖监测设备、心率监测设备、血压测量设备、体温测量设备等)、磁共振血管造影(mra)、磁共振成像(mri)、计算机断层扫描(ct)仪、以及超声仪)、导航设备、全球定位系统(gps)接收器、事件数据记录器(edr)、飞行数据记录器(fdr)、车辆娱乐信息设备、用于船舶的电子设备(例如,用于船舶的导航设备和回转罗盘)、航空电子设备、安全设备、机动车头部单元、家用或工业机器人、银行中的自动柜员机(atm)、商店中的销售点(pos)、或物联网设备(例如,电灯泡、各种传感器、电量计或气量计、喷淋设备、消防报警器、恒温控制器、路灯、烤面包器、运动器械、热水箱、加热器、热水器等)。

根据一些实施方式,电子设备可包括以下至少一种:家具或建筑/结构的一部分、电子板、电子签名接收设备、投影仪和各种类型的测量仪器(例如,水量计、电量计、气量计或无线电波计)。根据本公开各种实施方式的电子设备可以是上述各种设备的一种或多种的组合。根据本公开的一些实施方式的电子设备可以是柔性设备。另外,根据本公开实施方式的电子设备不限于上述设备,而可包括根据技术发展的新的电子设备。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(ram)、只读存储介质(rom)、可擦式可编程只读存储介质(eprom或闪存)、光纤、便携式紧凑磁盘只读存储介质(cd-rom)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写配置为执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系,但这些先后关系只是示例性的,在具体实现的时候,这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括:第一程序单元,用于收集参与用户模型建立学习的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;第二程序单元,用于根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

作为另一方面,本申请还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例中所描述的方法。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:收集参与用户模型建立的样本,所述样本包括用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹;根据所述用户的数据使用习惯以及因数据跟随用户进行动态迁移而产生的数据流转轨迹建立用户模型。

在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关,但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如,第一用户设备和第二用户设备表示不同的用户设备,虽然两者均是用户设备。例如,在不背离本公开的范围的前提下,第一元件可称作第二元件,类似地,第二元件可称作第一元件。

本文中所使用的用语“模块”或“功能单元”例如可意为包括有硬件、软件和固件的单元或者包括有硬件、软件和固件中两种或更多种的组合的单元。“模块”可与例如用语“单元”、“逻辑”、“逻辑块”、“部件”或“电路”可交换地使用。“模块”或“功能单元”可以是集成部件元件的最小单元或集成部件元件的一部分。“模块”可以是用于执行一个或多个功能的最小单元或其一部分。“模块”或“功能单元”可机械地或电学地实施。例如,根据本公开的“模块”或“功能单元”可包括以下至少一种:专用集成电路(asic)芯片、场可编程门阵列(fpga)以及已公知的或今后待开发的用于执行操作的可编程逻辑器件。以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。

本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当一个元件(例如,第一元件)称为与另一元件(例如,第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如,第二元件)或“连接至”另一元件(例如,第二元件)时,应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如,第三元件)间接连接至该另一个元件。相反,可理解,当元件(例如,第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时,则没有元件(例如,第三元件)插入在这两者之间。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1