一种亲密关系挖掘方法、广告推送方法及系统与流程

文档序号:19676276发布日期:2020-01-10 23:22阅读:330来源:国知局
一种亲密关系挖掘方法、广告推送方法及系统与流程

本发明属于电子商务领域,尤其涉及一种亲密关系挖掘方法、广告推送方法及系统。



背景技术:

当今社会,几乎人手一部或数部手机、pad等移动端,伴随着人们高频使用,移动端已经成为每天接触流量最大的端口,因此投放广告进行引流,移动端则成为其中最具价值的媒介。但广告推送是否成功是要通过数据来体现,即广告转化率的高低。由于广告转化率的高低直接影响着广告主投放广告的积极性,因此,如何提高广告转化率一直是广告推送领域亟待解决的问题。

目前,广告推送技术主要依赖于用户个人画像的构建,虽然基于个人喜好和行为来推送广告一定程度上有助于提高移动广告投放的精准性和转化率。

但发明人发现,这些广告推送技术忽略了对用户之间关系的利用。而且实证发现,利用用户间的亲密关系来提高广告的转化率是可行的。因此,如何基于移动端来挖掘用户间是否存在亲密关系,并基于亲密关系推送广告是移动广告领域的一个亟待解决的问题。



技术实现要素:

鉴于此,本发明实施例提供了亲密关系挖掘方法和系统,旨在解决现有技术实现精准推送以提高广告转化率的维度单一,更多的依赖于用户画像的构建,从而忽略了对用户之间关系的利用,本发明从另一个维度出发,在不侵犯用户隐私的前提下,仅利用手机等移动端提供的位置、时间信息挖掘用户间是否存在亲密关系,并基于挖掘的亲密关系进行推送广告,提高广告转化率。

第一方面,提供了一种亲密关系挖掘方法,所述方法包括步骤:

依据设定时间间隔采集不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集;

通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集;

将所述用户共现信息合集投入预先训练好的决策树,对每个共现用户信息进行逐一判别,以获得投入判别的两个用户之间的亲密关系并进行标记存储成用户对。

进一步地,所述扩展信息包括地理位置类型、日期类型、节假日类型。

进一步地,所述地理坐标通过线性加密,线性方程为r(d)=ad(x)+bd(y)+c;其中,d(x)、d(y)分别为地理位置的x,y坐标,a、b、c为常数。

进一步地,通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集步骤包括:

筛选出任意两个用户信息合集中地理位置小于d米以获得用户位置共现信息合集;

从所述用户位置共现信息合集筛选出时间戳小于s秒以获得用户共现信息合集,所述共现信息中的地理信息和时间戳为两个用户的同类信息的平均值。

进一步地,决策树的训练具体步骤包括:

采集亲密关系确定的用户训练信息合集;

将所述共现信息分别与一个随机阈值组成不同的判别式以构建出分裂属性合集;

利用所述用户训练信息合集和所述分裂属性合集训练决策树。

进一步地,采用最小化信息增益方式训练决策树。

进一步地,所述决策树层数为5-15层。

第二方面,提供了一种亲密关系挖掘系统,所述系统包括:

信息采集模块,用于依据设定时间间隔采集不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集;

信息筛选模块,用于通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集;

关系判别模块,用于将所述用户共现信息合集投入预先训练好的决策树,对每个共现用户信息进行逐一判别,以获得投入判别的两个用户之间的亲密关系并进行标记存储成用户对。

第三方面,基于亲密关系挖掘方法,还提供了一种广告推送方法,包括步骤:

采用如权利要求1-7任一所述的亲密关系挖掘方法,从用户对中提取有亲密关系的第一用户和第二用户;

向所述第一用户推送所述第二用户浏览或收藏的广告,或向所述第一用户和所述第二用户推送同一品牌的广告。

第四方面,还提供了一种广告推送系统,包括,

提取模块,用于采用如权利要求1-7任一所述的亲密关系挖掘方法,从用户对中提取有亲密关系的第一用户和第二用户;

广告推送模块,用于向所述第一用户推送所述第二用户浏览或收藏的广告,或向所述第一用户和所述第二用户推送同一品牌的广告。

与现有技术相比,本发明通过以设定时间间隔采集到的不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集,然后通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集投入到预先训练好的决策树,对每个共现用户信息进行逐一判别,最终获得两用户之间的亲密关系,并标记存储成为用户对。本发明的实施,在不侵犯用户隐私的前提下,提供简单高效的亲密关系挖掘方法,有利于跳出传统的广告推送的思维,对用户之间的关系加以利用,来提高广告的转化率。

附图说明

图1是本发明实施例提供的亲密关系挖掘方法的流程图;

图2是本发明实施例提供的亲密关系挖掘系统的原理图;

图3是本发明实施例提供的信息筛选模块的子单元原理图;

图4是本发明实施例提供的关系判别模块的子单元原理图;

图5是本发明实施例提供的广告推送方法的流程图;

图6是本发明实施例提供的广告推送系统的原理图;

图7是本发明实施例提供的决策树局部示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明通过以设定时间间隔采集到的不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集,然后通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集投入到预先训练好的决策树,对每个共现用户信息进行逐一判别,最终获得两用户之间的亲密关系,并标记存储成为用户对。本发明的实施,在不侵犯用户隐私的前提下,提供简单高效的亲密关系挖掘方法,有利于跳出传统的广告推送的思维,对用户之间的关系加以利用,来提高广告的转化率。

本发明实施例还提供了相应的系统和一种广告推送方法及其相应的系统,以下分别进行详细的说明。

图1示出了本发明实施例提供的亲密关系挖掘方法的流程图。

在本发明实施例中,所述亲密关系挖掘方法应用于可以运用在电子商务领域,尤其是广告推送方面。

参阅图1,所述亲密关系挖掘方法包括:

s10,依据设定时间间隔采集不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集。

在本发明实施例中,为了更好的举例说明,将地理坐标定义为d,时间戳定义为t,其中所述地理坐标d和时间戳t从用户手机等移动端中的gps或北斗系统数据来获取,采集的时间间隔设定为10秒,该时间间隔可以基于提高准确率的原则并结合实际情况进行调整,由于每间隔10秒中,即可以获得一组数据,因此在某一段时间内所获得的数据组数用k来表示,在某一时间段内,k为一定值。

为了提高亲密关系判断的准确性,还需要进一步采集更多种类的扩展信息,这些扩展信息包括地理位置类型、日期类型、节假日类型。下面,对这些扩展信息分别进行说明。

1、地理位置类型,基于地理坐标d扩展获得,地理位置类型包括小区、马路、公司、学校、商场、餐馆、酒店等,通过在电子地图上查询地理坐标值得到,为了保护用户隐私,地理位置类型用数字进行表示,小区表示为1、马路表示为2、公司表示为3、学校表示为4、商场表示为5、餐馆表示为6、酒店表示为7。

2、日期类型,基于时间戳t扩展获得,日期类型包括工作日、节假日,通过当年度的放假安排对具体的日期进行标记区别。

3、节假日类型,基于时间戳t扩展获得,节假日类型包括国家的法定节假日,如端午节、中秋节等传统的法定节假日;约定俗成或者源自西方的非法定节假日,如情人节、七夕节等;以及公休日,周六、周天。

同样为了便于后续的说明的解释,将地理位置类型定义为l,日期类型定义为j,节假日类型定义为q。通过将采集到的任一用户的地理坐标d、时间戳t和扩展信息整合到一起,则可以获得我们的用户信息合集。此处将任一用户用i表示,用户信息合集用x表示,那么某一段时间内,第k组任一用户的用户信息合集可以表示为xik=(dik,lik,tik,jik,qik)。如果当k=5,即在50s内取得的数据,任一用户的用户信息合集可以表示为xi={di1,li1,ti1,ji1,qi1,di2,li2,ti2,ji2,qi2,…,di5,li5,ti5,ji5,qi5}。

进一步地,为保护用户隐私,在数据上传到服务器前,采集的地理坐标通过线性变换进行加密,所述地理坐标通过线性加密,线性方程为r(d)=ad(x)+bd(y)+c;其中,d(x)、d(y)分别为地理位置的x,y坐标,a、b、c为常数。

s20,通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集。

具体地,通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集步骤包括:筛选出任意两个用户信息合集中地理位置小于d米以获得用户位置共现信息合集;从所述用户位置共现信息合集筛选出时间戳小于s秒以获得用户共现信息合集,所述共现信息中的地理信息和时间戳为两个用户的同类信息的平均值,由于贡献的扩展信息的值是相同的,所以在形成共现信息合集的时候,选取两个用户中任一用户的该类扩展信息的值即可。在本实施例中,d取值为20,s取值为300,筛选条件可以根据实际情况进行调整,以获取更精确的筛选。

进一步,对任意存在时空共现新的两个用户i和j,将两人的用户共现信息合集记录为{xijk,k=1,2,…,k}其中k为共现信息的条数。当k=k时,共现信息合集为,xijk=(dijk,tijk,lik,jik,qik),其中,i和j两用户的共现信息中的地理位置和时间戳更新为同类信息数据的平均值,例如dijk=(dik+djk)/2,tijk=(tik+tjk)/2。

s13,将所述用户共现信息合集投入预先训练好的决策树,对每个共现用户信息进行逐一判别,以获得投入判别的两个用户之间的亲密关系并进行标记存储成用户对。

其中,决策树的训练具体步骤包括:

采集亲密关系确定的用户训练信息合集,用户训练信息合集用s表示,则可以表示为s={{xrhk,k=1,2,…,k},yrh},其中yrh为标注的用户r和用户h真实的亲密关系类型。当用户用户r和用户h不存在亲密关系时,yrh=0。随着y取值的变化,表示的亲密关系也在变化,具体地,在本实施例中,判断时对存在共现信息的任意两个用户i和j的亲密关系类型yij的取值为0、1、2、3、4,分别表示不存在亲密关系、男女朋友关系、夫妻关系、同事关系以及普通朋友关系。为了训练出尽可能准确进行判别的决策树,采集了3000对亲密关系类型确定的用户,对每对用户采集了一个月的时空数据用于决策树的训练,当然采集的亲密关系确定的用户对越多,时间越长,相应的在判断任意两用户之间的亲密关系类型就越准确。

将所述共现信息分别与一个随机阈值组成不同的判别式以构建出分裂属性合集;分裂属性合集中的每组数据都是一个判别式,用于将述的一个节点上的数据分裂到左右两个子节点。分裂属性合集中的数据可由可由dijk、tijk、lik、jik、qik分别与一个随机阈值组成。在本实施例中,分裂属性的形式为:tijk>t1&tijk<t2、lik==q`、jik==0或jik==1、qik==q`、tijk>t1&tijk<t1&qik==q`、tijk>t1&tijk<t1&qik==q`&lik==l`,其中,t1和t2为表示时间的变量,l`为表示地点类型的变量,q`为表示节假日类型的变量。不难理解,改变t1、t2、q`、l`可以生成大量的分裂属性。

利用所述用户训练信息合集和所述分裂属性合集训练决策树。本实施例中,采用最小化信息增益方式训练决策树,决策树的层数为5-15层,优选10层。

为了便于理解,图7中示出了一个较佳实施例的决策树局部示意图。决策树通过最小化信息增益方式训练得到。训练过程中,将为决策树的各个非叶子节点选定一个最优的分类属性。在图7中,为各个非叶子节点选点的属性分别为qik==7,在本实施例中qik==7表示节假日类型为情人节;tijk>0:00&tijk<6:00即时间为晚上0点到早上6点;lik==7即表示地址类型为酒店。在决策树被系统调用时:s1:用户共现信息将会输入到树的根节点上;s2:然后根据节点上的分裂属性被分配到或左或右之一的子节点上,其中满足分裂属性往左的子节点执行,不满徐分裂属性往右的子节点执行;s3:迭代执行s2,直至叶子节点;s4:取叶子节点上的判别作为用户关系的判别结果。

例如在图7所示的决策树局部示意图中,假若通过s2步骤执行若干步后,某个用户共现信息被分配到了决策树局部示意qik==7节点上,而该用户共现信息中qik==7不成立,那么该用户共现信息将被分配到右子节点,即lik==7进行进一步判断;假若该用户共现信息中lik==7成立,那么该用户共现信息将被分配到左子节点。此时,左子节点已为叶子节点,迭代完成,可以判断该用户共现信息所属的两个用户关系为yij==2,在本实施例中yij==2表示关系类型为男女朋友。需要说明的是,此处判断亲密关系类型的时候,条件成立与否与下一步节点走向一致即可,在此不做限定,例如满足条件都往左,不满足条件都往右;或者相反。

本发明实施例提供的亲密关系挖掘方法较现有技术中的方案有以下提升:保护用户信息的私密性,仅通过手机端便可以获取的地理位置和时间戳,以及依据获得的信息扩展得到的扩展信息构成用户信息合集,再将任意两个用户筛选出的用户共现信息合集投入到训练好的决策树进行亲密关系类型的判别,并保存相应的用户信息对以便于后续运用到其他方面加以利用。

应理解,在上述实施例中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

图2示出了本发明实施例提供的亲密关系挖掘系统的原理图,为了便于说明,仅示出了与本发明实施例相关的部分。

在本发明实施例中,所述系统用于实现上述图1实施例中所述的亲密关系挖掘方法,可以是内置于计算机、服务器的软件单元、硬件单元或者软硬件结合的单元。

参阅图2,所述系统包括:

信息采集模块10,用于依据设定时间间隔采集不同用户的地理坐标、时间戳以及扩展信息,以生成不同的用户信息合集;

信息筛选模块20,用于通过预设参数筛选出任意两个用户信息合集中的共现信息,以获取用户共现信息合集;

所述信息筛选模块20包括:

位置筛选单元21,用于筛选出任意两个用户信息合集中地理位置小于d米以获得用户位置共现信息合集;

时间筛选单元22,用于从所述用户位置共现信息合集筛选出时间戳小于s秒以获得用户共现信息合集;

共现信息整理单元23,所述共现信息为两个用户的同类信息的平均值。

关系判别模块30,用于将所述用户共现信息合集投入预先训练好的决策树,对每个共现用户信息进行逐一判别,以获得投入判别的两个用户之间的亲密关系并进行标记存储成用户对。

所述关系判别模块30包括:

训练信息采集单元31,用于采集亲密关系确定的用户训练信息合集;

分裂属性合集建立单元32,用于将所述共现信息分别与一个随机阈值组成不同的判别式以构建出分裂属性合集;

决策树训练单元33,用于利用所述用户训练信息合集和所述分裂属性合集训练决策树。

需要说明的是,本发明实施例中的系统可以用于实现上述方法实施例中的全部技术方案,其各个功能模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述实例中的相关描述,此处不再赘述。

另一方面,图3示出了本发明实施例提供的广告推送方法的流程图。

参阅图3,所述亲密关系挖掘方法包括:

s100,采用如权利要求1-7任一所述的亲密关系挖掘方法,从用户对中提取有亲密关系的第一用户和第二用户;

s200,向所述第一用户推送所述第二用户浏览或收藏的广告,或向所述第一用户和所述第二用户推送同一品牌的广告。

具体的推送类型的前提,由广告商根据自己的品牌结合具体的用户亲密关系类型进行选择。例如广告商是买口红的,那么优选取亲密关系为情侣的用户对,向男方推送女方浏览或收藏的广告,以便促成成交;但如果广告商是买家具的,则会优先选取亲密关系类型为夫妻的对该品牌商品进行推送,当然推送的具体产品可以结合用户画像来提高精准度,在此不做限定。

图4示出了本发明实施例提供的亲密关系挖掘系统的原理图,为了便于说明,仅示出了与本发明实施例相关的部分。

在本发明实施例中,所述系统用于实现上述图4实施例中所述的亲密关系挖掘方法,可以是内置于计算机、服务器的软件单元、硬件单元或者软硬件结合的单元。

参阅图4,所述系统包括:

提取模块100,用于采用如权利要求1-7任一所述的亲密关系挖掘方法,从用户对中提取有亲密关系的第一用户和第二用户;

广告推送模块200,用于向所述第一用户推送所述第二用户浏览或收藏的广告,或向所述第一用户和所述第二用户推送同一品牌的广告。

综上所述,本发明实施例提供的亲密关系挖掘方法在保护用户隐私的前提下,仅通过手机端便可以获取的地理位置和时间戳,以及依据获得的信息扩展得到的扩展信息构成用户信息合集,再将任意两个用户筛选出的用户共现信息合集投入到训练好的决策树进行亲密关系类型的判别,并保存相应的用户信息对以便于后续运用到其他方面加以利用。

进一步地,提供一种广告推送方法,跳出传统的广告推送的思维,对用户之间的关系加以利用,基于亲密关系的挖掘方法来进行广告推送进而提高广告的转化率。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1