一种获取受众的方法和服务器设备与流程

文档序号：11063875阅读：788来源：国知局

本发明涉及互联网技术，特别是指一种获取受众的方法和服务器设备。

背景技术：

互联网的盈利模型包括：游戏、电子商务和广告。互联网广告与传统广告的最大卖点就是精准营销。借助各种受众定向技术(Audience Targeting)，分析用户的属性(User Profile)的众多标签，挖掘用户兴趣或需求，推送最有价值、用户最需要的广告。

从受众定位技术区分互联网广告，不关注受众定位的互联网广告包括：条幅广告(Banner Ad)、邮件直接营销广告(EDM，Email Direct Marketing)、FLASH广告(Rich Media Ad)、视频广告(Video Ad)等；搜索广告(Search Ad)，例如google、百度等根据用户的搜索词进行定向，然后投放相关的广告；上下文广告(Contextual Advertising)，根据用户当前的网页，假定用户的兴趣点跟当前的网页内容是相关的，然后推送与网页上下文内容相关的广告；社交广告(Social Ad)，随着社交网络(Social Network)的兴起，在社交平台(微信、微博等)，综合亲密关系、上下文、历史信息等定向推送广告，并开展定制化营销活动。

现有受众定位技术如图1所示，包括：根据cookie等手段收集用户历史信息；根据用户历史信息和场景信息，找到一个适合这个人的广告候选集；结合广告特征及期望，在广告候选集里面排序，找到最好、价值最高的一个或若干个广告。

现有互联网广告的受众定位技术存在诸多问题。场景信息不全：现在的受众定位技术，完全采用线上信息，导致只能局限于线上相关场景，例如电子商务、搜索、社交等，但与用户线下场景、现实的位置、时间没有关联，因此无法实现“用户在shopping mall的某一层中，到了饭点，系统主动给他定制同一层的、或步行数分钟路程内的、某口味的餐馆”等O2O广告形式。现有的类似功能，例如大众点评和百度地图等都需要用户发起需求，才能知道具体位置，若是室内，互联网公司是无法定位楼层的。用户历史信息不全：现在的受众定位技术，完全采用线上信息，没有融合用户在线下去了哪里，在哪里停留多久等信息，使受众定位有局限。无法与其他、现实商业体系融合：互联网广告仅仅是整个商业体系的一部分而已，由于现在的受众定位技术完全采用线上信息，割裂了现实中的灯箱广告、实体店、LED广告等线下商业体系。现有技术基本依赖内容源挖掘，这对运营商不利：线下的用户用运营商的网络链接线上的应用，互联网公司通过现有受众定位技术，为用户推送广告，获得莫大的收益，而运营商仅仅成了真正的管道。

如何借助管道挖掘，凸显运营商O&O(online&offline)场景掌控力、端到端数据和线下发展优势，实现管道价值变现，成为运营商亟待解决的问题。

技术实现要素：

本发明要解决的技术问题是提供一种获取受众的方法和服务器设备，用于解决现有受众定位技术中的受众定位有局限的问题，借助管道挖掘为广告找到合适的受众。

为解决上述技术问题，本发明的实施例提供一种获取受众的方法，方法包括：获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息，将所述线下信息和线上信息存放在用户行为数据仓库中；获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息；对所述第一线下信息和所述第一线上信息进行归一化；根据归一化后的数据计算出所述第一用户在当前采样周期中对至少一个广告商品的兴趣指数。

所述的方法中，获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息之前还包括：搭建无线接入控制服务器的日志服务器，收集无线接入控制服务器日志，根据无线接入控制服务器日志获取用户线下行为的轨迹；搭建WLAN网管收集WLAN网络的拓扑关系；搭建单无线接入控制服务器的分布式下行深度包检测设备，还原出用户上网浏览的目标网页，获取用户上网使用的每一个应用程序名称。

所述的方法中，获取广告商品的实体信息和用户线下行为形成线下信息包括：根据所述用户线下行为的轨迹、WLAN网络的拓扑关系形成每一个访问节点AP的线下信息，建立一个线下信息标签库存放所述线下信息；获取用户的上网浏览行为形成线上信息包括：根据所述目标网页和应用程序名称，将每位用户的上网浏览行为编码成数字标签，数字标签的逻辑顺序是类别、来源、分类和详细信息，形成线上信息；建立一个线上信息标签库存放所述线上信息。

所述的方法中，将所述线下信息和线上信息存放在用户行为数据仓库中包括：根据用户和时间点将所述线下信息和线上信息融合成行为数据，将所述行为数据存放在用户行为数据仓库中；线上信息包括线上点击次数，线下信息包括线下到达次数和线下停留时长；获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息包括：获取第一用户对特定行为数据的线上点击次数、线下到达次数和线下停留时长。

所述的方法中，对所述第一线下信息和所述第一线上信息进行归一化包括：χ₁，χ₂，χ₃，......，χ_n为采样周期内，n名用户分别对特定行为数据的线上点击次数；δ₁，δ₂，δ₃，......，δ_n为采样周期内，n名用户分别对特定行为数据的线下到达次数；φ₁，φ₂，φ₃，......，φ_n为采样周期内，n名用户分别对特定行为数据的线下停留时长大于分钟阈值m的次数；MAX₁为采样周期内，n名用户中线上点击次数的最大值；MAX₂为采样周期内，n名用户中线下到达次数的最大值；MAX₃为采样周期内，n名用户中线下停留时长大于分钟阈值m的次数最大值；采用min-max标准化模型，取min＝0，采样周期内的第一用户，对特定行为数据的、归一化的线上点击指数λ₁、线下到达指数λ₂和线下停留指数λ₃分别为和

所述的方法中，根据归一化后的数据计算出所述第一用户在当前采样周期中对至少一个广告商品的兴趣指数包括：计算第一用户在第i采样周期的兴趣指数θ_i＝η×λ₁+β×λ₂+γ×λ₃，η、β、γ为系数；计算出前期x个采样周期的记忆的时间退化因素；则计算出第一用户在当前第i采样周期的兴趣指数为x表示向前追溯x个采样周期。

一种获取受众的服务器设备，包括：行为数据单元，用于获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息，将所述线下信息和线上信息存放在用户行为数据仓库中；信息指数单元，用于获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息；归一化单元，用于对所述第一线下信息和所述第一线上信息进行归一化；

兴趣指数单元，用于根据归一化后的数据计算出所述第一用户在当前采样周期中对至少一个广告商品的兴趣指数。

所述的服务器设备，行为数据单元包括：线下信息标签库模块，用于根据所述用户线下行为的轨迹明确每一个访问节点AP的线下信息，建立一个线下信息标签库存放所述线下信息；线上信息标签库模块，用于根据所述目标网页和应用程序名称，将每位用户的上网浏览行为编码成数字标签，数字标签的逻辑顺序是类别、来源、分类和详细信息，形成线上信息；建立一个线上信息标签库存放所述线上信息。

所述的服务器设备，行为数据单元包括：行为数据单元包括数据仓库模块，数据仓库模块用于将所述线下信息和线上信息融合成行为数据，将所述行为数据存放在用户行为数据仓库中；线上信息包括线上点击次数，线下信息包括线下到达次数、线下停留时长；单用户行为采集模块，用于获取第一用户对特定行为数据的线上点击次数、线下到达次数、线下停留时长。

所述的服务器设备，归一化单元包括：归一化实现模块，用于采用min-max标准化模型，取min＝0，采样周期内的第一用户对特定行为数据的、归一化的线上点击指数λ₁、线下到达指数λ₂和线下停留指数λ₃分别为χ₁，χ₂，χ₃，......，χ_n为采样周期内，n名用户分别对特定行为数据的线上点击次数；δ₁，δ₂，δ₃，......，δ_n为采样周期内，n名用户分别对特定行为数据的线下到达次数；φ₁，φ₂，φ₃，......，φ_n为采样周期内，n名用户分别对特定行为数据的线下停留时长大于分钟阈值m的次数；MAX₁为采样周期内，n名用户中线上点击次数的最大值；MAX₂为采样周期内，n名用户中线下到达次数的最大值；MAX₃为采样周期内，n名用户中线下停留时长大于分钟阈值m的次数最大值。

所述的服务器设备，兴趣指数单元包括：单周期兴趣指数模块，用于计算第一用户在第i采样周期的兴趣指数θ_i＝η×λ₁+β×λ₂+γ×λ₃，η、β、γ为系数；前期时间退化因素模块，用于计算出前期x个采样周期的记忆的时间退化因素；兴趣指数计算模块，用于计算出第一用户在当前第i采样周期的兴趣指数为x表示向前追溯x个采样周期。

本发明的上述技术方案的有益效果如下：相较传统的互联网广告受众定位技术，不仅更适合运营商，还能与线下商业体系融合，形成对单一内容源挖掘的全面压制，实现运营商转型。

附图说明

图1表示现有受众定向技术的工作原理示意图；

图2表示一种获取受众的方法的流程示意图；

图3表示获取受众的应用场景的示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明实施例提供一套零硬件成本、实用性广、运营商级的受众定位技术，全面融合O&O场景、端到端数据，实时挖掘的用户兴趣并量化之。

本发明实施例提供一种获取受众的方法，如图2所示，包括：

步骤201，获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息，将所述线下信息和线上信息存放在用户行为数据仓库中；

步骤202，获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息；

步骤203，对所述第一线下信息和所述第一线上信息进行归一化；

步骤204，根据归一化后的数据计算出所述第一用户在当前采样周期中对至少一个广告商品的兴趣指数。

应用本发明实施例提供的技术，全面融合O&O场景、端到端数据，实现用户兴趣的实时挖掘并量化，是一套全新的、零硬件成本的、实用性广的、运营商级的受众定位技术。

其中，兴趣指数是指用户对广告商品的兴趣；兴趣指数与兴趣的大小呈正相关，数值高则表示兴趣大。

在一个优选实施例中，如图3所示，步骤101获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息之前还包括：采集各个数据源。具体地，搭建硬件网络，在硬件网络上采集三个数据源，即，搭建无线接入控制服务器的日志服务器，收集无线接入控制服务器日志，根据无线接入控制服务器日志获取用户线下行为的轨迹；

搭建WLAN网管收集WLAN网络的拓扑关系、资源信息和关键绩效指标；

搭建单无线接入控制服务器的分布式下行深度包检测设备，还原出用户上网浏览的目标网页，获取用户上网使用的每一个应用程序名称。这一步骤具体包括：

步骤11，搭建收集无线接入控制服务器(AC，Wireless Access Point Controller)日志的日志服务器，收集AC日志，这些AC日志用于完成采集用户轨迹：在所有AC上、日志服务器两端上都设置syslog功能，将AC日志实时传输至日志服务器，并保存在日志服务器上。用户轨迹是用户经历的每一个AP。

步骤12，搭建WLAN网管，收集WLAN网络的拓扑关系、资源信息和关键绩效指标(KPI，Key Performance Indicator)；WLAN网管从设备厂家的MIB 库，采集WLAN的信号发送设备(AP，Access Point)与AC的拓扑关系，记录资源信息及变更情况。

步骤13，搭建单AC的分布式下行深度包检测(DPI，Deep Packet Inspection)设备，在AC的下行流量口，进行DPI，还原出用户上网的每一个网页，获取用户上网使用的每一个APP名称。这里得到的是用户上网的内容，例如AC日志提供的是你行车的路线图，这里提供的是行车所看到的风景。

在一个优选实施例中，还包括：根据所述用户线下行为的轨迹、WLAN网络的拓扑关系，甚至资源信息和关键绩效指标KPI形成每一个访问节点AP的线下信息，建立一个线下信息标签库存放所述线下信息；根据所述目标网页和应用程序名称，将每位用户的上网浏览行为编码成数字标签，数字标签的逻辑顺序是类别、来源、分类和详细信息，根据数字标签形成线上信息；建立一个线上信息标签库存放所述线上信息。如图3所示，这一步骤具体包括：

步骤21，建立线下信息标签库，将每个AP覆盖下的专柜、店铺、广告位、特征等信息，编码成数字标签，数字标签的逻辑顺序是项目-楼宇-楼层-专柜/店铺/广告位，明确每一个AP的线下广告商品的实体信息；

例如，某用户去银泰A座4楼，在雅戈尔专柜内驻留了下，该条信息被逻辑分词为“线下(B)-银泰(01)-A座(02)-4楼(14)-雅戈尔专柜(58)”，因此本条信息的数字标签为B01021458。

步骤22，建立线上信息标签库，将每位用户浏览的包括网页、FTP、EMAIL、APP等在内的上网内容编码成数字标签，数字标签的逻辑顺序是类别-来源-分类-详细信息，根据数字标签明确每位用户每一条上网内容的线上信息。

例如，第一用户通过淘宝网看了一下雅戈尔的店铺；该上网内容被逻辑分词为线上(A)-电商(00)-淘宝(01)-服装(89)-雅戈尔(32)，因此，该条线上信息的数字标签为A00018932。

在一个优选实施例中，将所述线下信息和线上信息存放在用户行为数据仓库中包括：根据用户和时间点将所述线下信息和线上信息融合成行为数据，将所述行为数据存放在用户行为数据仓库中；线上信息包括线上点击次数，线下信息包括线下到达次数和线下停留时长；

获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息包括：获取第一用户对特定行为数据的线上点击次数、线下到达次数和线下停留时长。

如图3所示，包括步骤3，根据用户和用户线下行为发生的时间点，将线下信息和线上信息，融合成以用户为轴的O&O用户行为数据仓库。

例如，2015年1月1日9点20分-9点28分，用户X在银泰A座4楼，在雅戈尔专柜内驻留了8分钟(数字标签为B01021458)，在此期间，用户X在9点22分10秒还通过淘宝网浏览了雅戈尔的店铺-数字标签为A00018932，9点22分35秒，用户X还通过淘宝APP完成了其他的操作。

在一个优选实施例中，获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息包括：

获取第一用户对特定行为数据的线上点击次数、线下到达次数、线下停留时长。本发明实施例中，为方便描述，将线下信息和线上信息融合成行为数据，某一个广告商品的行为数据则是该广告商品的特定行为数据，因此，当用户在线上点击某一个广告商品的线上信息时，是对某一个特定行为数据的线上点击，当用户在线下到达访问某一个广告商品时，则是对某一个特定行为数据的线下到达。

在一个应用场景中，如图3所示，具体的流程包括：

步骤41～步骤43，获取第一用户对特定行为数据-包括某品牌、某内容，的线上点击次数、线下到达次数和线下停留时长；

步骤44～步骤45，获取全量用户对该特定行为数据的相关用户数、线上点击总次数、线下达到总次数、线下停留总时长等信息，这些信息可以用于在以后对本发明实施例提供的技术进行升级、改进的过程中使用。

在一个应用场景中，需要评估雅戈尔时，筛选出“线上数字标签的第8和9位为32”及“线下数字标签的第8和9位为58”的用户经历，获得第一用户及全量用户，对雅戈尔的线上点击次数、线下到达次数、线下停留时长等信息。

在一个优选实施例中，采用min-max标准化，实现三个信息指数的归一化。如图3所示，这一过程具体包括：

χ₁，χ₂，χ₃，......，χ_n为采样周期内，n名用户分别对特定行为数据的线上点击次数；

δ₁，δ₂，δ₃，......，δ_n为采样周期内，n名用户分别对特定行为数据的线下到达次数；

φ₁，φ₂，φ₃，......，φ_n为采样周期内，n名用户分别对特定行为数据的线下停留时长大于分钟阈值m的次数；

MAX₁为采样周期内，n名用户中线上点击次数的最大值；

MAX₂为采样周期内，n名用户中线下到达次数的最大值；

MAX₃为采样周期内，n名用户中线下停留时长大于分钟阈值m的次数最大值；

步骤51～步骤53，参考min-max标准化，取min＝0，避免了次数＝min时指数为0的问题，采样周期内的第一用户(a)，对特定行为数据的、归一化的线上点击指数λ₁、线下到达指数λ₂、线下停留指数λ₃分别为和

在一个优选实施例中，如图3所示，根据归一化后的数据计算出第一用户在当前采样周期中对第一行为数据的兴趣指数包括步骤6：

第一用户在第i采样周期的兴趣指数，η、β、γ为系数；

用户的兴趣决定于当天的信息获得，以及第i采样周期之前x个采样周期以来的记忆，因此前期x个采样周期的记忆还需要考虑时间退化因素；

则第一用户在当前第i采样周期的兴趣指数为x表示向前追溯x个采样周期。

本发明实施例提供一种获取受众的服务器设备，包括：

行为数据单元，用于获取广告商品的实体信息和用户线下行为形成线下信息，获取用户的上网浏览行为形成线上信息，将所述线下信息和线上信息存放在用户行为数据仓库中；

信息指数单元，用于获取第一用户针对用户行为数据仓库中的至少一个广告商品的第一线下信息和第一线上信息；

归一化单元，用于对所述第一线下信息和所述第一线上信息进行归一化；

兴趣指数单元，用于根据归一化后的数据计算出所述第一用户在当前采样周期中对至少一个广告商品的兴趣指数。

相较传统的互联网广告受众定位技术，不仅更适合运营商，还能与线下商业体系融合，形成对单一内容源挖掘的全面压制，实现运营商转型。

在一个优选实施例中，行为数据单元包括：

线下信息标签库模块，用于根据所述用户线下行为的轨迹明确每一个访问节点AP的线下信息，建立一个线下信息标签库存放所述线下信息；

线上信息标签库模块，用于根据所述目标网页和应用程序名称，将每位用户的上网浏览行为编码成数字标签，数字标签的逻辑顺序是类别、来源、分类和详细信息，形成线上信息；建立一个线上信息标签库存放所述线上信息。

在一个优选实施例中，行为数据单元包括：

行为数据单元包括数据仓库模块，数据仓库模块用于将所述线下信息和线上信息融合成行为数据，将所述行为数据存放在用户行为数据仓库中；线上信息包括线上点击次数，线下信息包括线下到达次数、线下停留时长；

单用户行为采集模块，用于获取第一用户对特定行为数据的线上点击次数、线下到达次数和线下停留时长。

在一个优选实施例中，归一化单元包括：

归一化实现模块，用于采用min-max标准化模型，取min＝0，采样周期内的第一用户，对特定行为数据的、归一化的线上点击指数λ₁、线下到达指数λ₂和线下停留指数λ₃分别为和χ₁，χ₂，χ₃，......，χ_n为采样周期内，n名用户分别对特定行为数据的线上点击次数；

δ₁，δ₂，δ₃，......，δ_n为采样周期内，n名用户分别对特定行为数据的线下到达次数；

φ₁，φ₂，φ₃，......，φ_n为采样周期内，n名用户分别对特定行为数据的线下停留时长大于分钟阈值m的次数；

MAX₁为采样周期内，n名用户中线上点击次数的最大值；

MAX₂为采样周期内，n名用户中线下到达次数的最大值；

MAX₃为采样周期内，n名用户中线下停留时长大于分钟阈值m的次数最大值。

在一个优选实施例中，兴趣指数单元包括：

单周期兴趣指数模块，用于计算第一用户在第i采样周期的兴趣指数θ_i＝η×λ₁+β×λ₂+γ×λ₃，η、β、γ为系数；

前期时间退化因素模块，用于计算出前期x个采样周期的记忆的时间退化因素；

兴趣指数计算模块，用于计算出第一用户在当前第i采样周期的兴趣指数为x表示向前追溯x个采样周期。

采用本方案之后的优势是：将用户线上点击的内容与线下场景的位置、到达时间和停留时间相融合，这样，当用户在购物中心(shopping mall)的某一层时，系统能够在吃饭时间段内主动向用户推送同一层、或步行数分钟路程内、某口味的餐馆等O2O广告；与传统的互联网广告受众定位技术相比，本发明实施例融合了用户在线下去了哪里，在哪里停留多久等信息，扩展了分析的全面性，不仅更适合运营商，还能与线下商业体系融合，形成对单一内容源挖掘的全面压制，实现运营商转型。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张敏;范永升;彭陈发;薛嵬峰;姚志华;吴斌;边铮;
技术所有人：中国移动通信集团浙江有限公司;
我是此专利的发明人

上一篇：一种同步结果展示的方法及装置与制造工艺
上一篇：对原始建议价值度进行修正的方法及装置与制造工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。