信息推送方法、系统、可读存储介质和计算机设备与流程

文档序号:16855990发布日期:2019-02-12 23:18阅读:108来源:国知局
信息推送方法、系统、可读存储介质和计算机设备与流程

本发明涉及移动网络技术领域,特别是涉及一种信息推送方法、系统、可读存储介质和计算机设备。



背景技术:

随着移动网络技术的不断发展,越来越多的电子商务信息在移动网络中被广泛应用,其中一些电子商务信息用来推送给客户终端。

目前一般的信息推送方式都没有针对性,普遍采用区域广播的方式进行推送,内容繁复杂乱,难以为客户终端提供实用有效的信息;还有另一种推送方式,基于客户终端的网络访问行为偏好有目的性地对客户终端推送信息,该种推送的信息针对性较好。

在实现本发明过程中,发明人发现传统技术中,至少存在如下问题:由于需要了解客户终端的网络访问行为偏好,必须获取客户终端的网络访问行为数据,客户终端的信息资料泄露风险大,安全性大大降低。



技术实现要素:

基于此,有必要针对传统的推送信息方式安全性低的问题,提供一种信息推送方法、系统、可读存储介质和计算机设备。

一种信息推送方法,包括以下步骤:

获取终端处于基站信号覆盖范围内的停留时长;

根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域中的逗留时长;

将相互对应的终端信息、选择区域信息和逗留时长输入预置模型,获取预置模型输出的推荐区域信息,将推荐区域信息推送至终端。

根据上述信息推送方法,获取终端处于基站信号覆盖范围内的停留时长,通过基站与选择区域之间的关联关系进一步获取终端在选择区域中的逗留时长,利用预置模型分析相互对应的终端信息、选择区域信息和逗留时长,从而得到推荐区域信息并推送至终端,在此方案中,由于终端在未使用的情况下也会与基站进行通信,可以获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系得到终端在选择区域的逗留时长,根据终端、选择区域和逗留时长为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐区域信息。

在其中一个实施例中,在停留时长大于等于预设时长时,执行根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域的逗留时长的步骤。

在其中一个实施例中,将相互对应的终端信息、选择区域信息和逗留时长输入预置模型的步骤之前,还包括以下步骤:

建立区域分析模型,获取多组历史样本信息对区域分析模型进行训练,获得预置模型,其中,历史样本信息包括终端信息、选择区域信息以及终端在选择区域中的逗留时长。

在其中一个实施例中,获取多组历史样本信息对区域分析模型进行训练的步骤包括以下步骤:

通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度,根据各兴趣度对其他选择区域进行排序,将排序在前的其他选择区域的信息作为推荐区域信息输出。

在其中一个实施例中,通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度的步骤包括以下步骤:

根据计算相似度;

式中,n(i)表示与选择区域i相关联的终端数量,n(j)表示与选择区域j相关联的终端数量,wij表示选择区域i与选择区域j之间的相似度。

在其中一个实施例中,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度的步骤包括以下步骤:

根据puj=∑i∈n(u)wijrui计算兴趣度;

式中,wij表示目标终端u对应的选择区域i与其他选择区域j之间的相似度,rui表示目标终端u在对应的选择区域i中的逗留时长,n(u)表示目标终端u对应的选择区域i的集合,puj表示目标终端u对其他选择区域j的兴趣度。

在其中一个实施例中,获取多组历史样本信息对区域分析模型进行训练的步骤还包括以下步骤:

获取多个目标终端的当前选择区域,根据各当前选择区域和各推荐区域计算区域分析模型的召回率,若召回率低于预设值,则对区域分析模型进行调整。

在其中一个实施例中,将推荐区域信息推送至终端的步骤包括以下步骤:

获取终端的常驻地坐标以及多个推荐区域的位置坐标,分别计算各位置坐标与常驻地坐标之间的距离值;

根据各距离值对各推荐区域进行排序,将排序后的各推荐区域的信息推送至终端。

在其中一个实施例中,获取终端的常驻地坐标的步骤包括以下步骤:

确定预设时间段内终端的信号连接次数最多的目标基站,获取目标基站的位置坐标作为终端的常驻地坐标。

一种信息推送系统,包括:

信息获取单元,用于获取终端处于基站信号覆盖范围内的停留时长;

信息处理单元,用于根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域中的逗留时长;

信息推送单元,用于将相互对应的终端信息、选择区域信息和逗留时长输入预置模型,获取预置模型输出的推荐区域信息,将推荐区域信息推送至终端。

根据上述信息推送系统,信息获取单元获取终端处于基站信号覆盖范围内的停留时长,信息处理单元通过基站与选择区域之间的关联关系进一步获取终端在选择区域中的逗留时长,信息推送单元利用预置模型分析相互对应的终端信息、选择区域信息和逗留时长,从而得到推荐区域信息并推送至终端,在此方案中,由于终端在未使用的情况下也会与基站进行通信,可以获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系得到终端在选择区域的逗留时长,根据终端、选择区域和逗留时长为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐区域信息。

在其中一个实施例中,信息处理单元在停留时长大于等于预设时长时,根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域的逗留时长。

在其中一个实施例中,信息推送系统还包括模型训练单元,用于建立区域分析模型,获取多组历史样本信息对区域分析模型进行训练,获得预置模型,其中,历史样本信息包括终端信息、选择区域信息以及终端在选择区域中的逗留时长。

在其中一个实施例中,模型训练单元通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度,根据各兴趣度对其他选择区域进行排序,将排序在前的其他选择区域的信息作为推荐区域信息输出。

在其中一个实施例中,模型训练单元根据计算相似度;

式中,n(i)表示与选择区域i相关联的终端数量,n(j)表示与选择区域j相关联的终端数量,wij表示选择区域i与选择区域j之间的相似度。

在其中一个实施例中,模型训练单元根据puj=∑i∈n(u)wijrui计算兴趣度;

式中,wij表示目标终端u对应的选择区域i与其他选择区域j之间的相似度,rui表示目标终端u在对应的选择区域i中的逗留时长,n(u)表示目标终端u对应的选择区域i的集合,puj表示目标终端u对其他选择区域j的兴趣度。

在其中一个实施例中,模型训练单元获取多个目标终端的当前选择区域,根据各当前选择区域和各推荐区域计算区域分析模型的召回率,若召回率低于预设值,则对区域分析模型进行调整。

在其中一个实施例中,信息推送单元获取终端的常驻地坐标以及多个推荐区域的位置坐标,分别计算各位置坐标与常驻地坐标之间的距离值;根据各距离值对各推荐区域进行排序,将排序后的各推荐区域的信息推送至终端。

在其中一个实施例中,信息推送单元确定预设时间段内终端的信号连接次数最多的目标基站,获取目标基站的位置坐标作为终端的常驻地坐标。

一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述信息推送方法的步骤。

上述可读存储介质,通过其存储的可执行程序,实现了获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系以及逗留时长,可以为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐信息。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述信息推送方法的步骤。

上述计算机设备,通过处理器上运行的可执行程序,实现了获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系得到终端在选择区域的逗留时长,根据终端、选择区域和逗留时长为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐区域信息。

附图说明

图1为一个实施例中的信息推送方法的应用场景示意图;

图2为一个实施例中的信息推送方法的流程示意图;

图3为一个实施例中的信息推送系统的结构示意图;

图4为另一个实施例中的信息推送系统的结构示意图;

图5为一个实施例中的基站与商圈的位置关系示意图;

图6为一个实施例中的基站与商圈的位置关系示意图;

图7为一个实施例中的基站与商圈的位置关系示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。

图1为一个实施例中信息推送方法的应用环境示意图,图1中包括终端、基站和后台服务器,

终端在日常使用时会与基站进行数据通信,后台服务器可以根据终端与基站的通信状态来确定终端处于基站信号覆盖范围内的停留时长,基站是设于一固定地理位置的设备,选择区域一般也是固定的,两者在位置上具有相互关系,利用这种相互关系可以获取终端在选择区域中的逗留时长,结合终端信息和选择区域进行分析,可以得到推荐区域信息发送至终端;终端可以是手机、平板电脑等不同类型的移动电子设备,信息推送方法可以在后台服务器中实现。

参见图2所示,为一个实施例的信息推送方法的流程示意图。该实施例中的信息推送方法包括以下步骤:

步骤s110:获取终端处于基站信号覆盖范围内的停留时长;

步骤s120:根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域中的逗留时长;

在本步骤中,基站与选择区域之间的关联关系是指基站与选取区域的位置关系,在基站与选择区域的位置相互重叠时,停留时间和逗留时间可以视为等同;

步骤s130:将相互对应的终端信息、选择区域信息和逗留时长输入预置模型,获取预置模型输出的推荐区域信息,将推荐区域信息推送至终端。

在本步骤中,预置模型的作用是对相互对应的终端信息、选择区域信息和逗留时长进行分析,得到推荐区域信息,该推荐区域信息与终端的行为模式相符。

根据上述信息推送方法,获取终端处于基站信号覆盖范围内的停留时长,通过基站与选择区域之间的关联关系进一步获取终端在选择区域中的逗留时长,利用预置模型分析相互对应的终端信息、选择区域信息和逗留时长,从而得到推荐区域信息并推送至终端,在此方案中,由于终端在未使用的情况下也会与基站进行通信,可以获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系得到终端在选择区域的逗留时长,根据终端、选择区域和逗留时长为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐区域信息。

需要说明的是,终端在基站信号覆盖范围内的停留时长是在一个时间段内的停留时长,在终端离开基站信号覆盖范围后重新进入该范围时,停留时长重新开始计算;若终端离开基站信号覆盖范围后进入另一个基站信号覆盖范围,另一个基站与选择区域没有对应关系,逗留时长与终端在前一个基站信号覆盖范围内的停留时长相同;另一个基站与选择区域也相互关系,逗留时长是终端在两个基站信号覆盖范围内的停留时长的和值。

在一个实施例中,在停留时长大于等于预设时长时,执行根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域的逗留时长的步骤。

在本实施例中,可以在停留时长大于等于预设时长时获取逗留时长,停留时长足够大时,才能表示终端对相应的选择区域的需求,有利于提高推荐区域信息的有效性和准确性,而且还可以减少许多无效的逗留时长数据,提高预置模型的处理效率。

可选的,预设时长可以设置为30分钟以上。

在一个实施例中,将相互对应的终端信息、选择区域信息和逗留时长输入预置模型的步骤之前,还包括以下步骤:

建立区域分析模型,获取多组历史样本信息对区域分析模型进行训练,获得预置模型,其中,历史样本信息包括终端信息、选择区域信息以及终端在选择区域中的逗留时长。

在本实施例中,可以获取多组终端信息、选择区域信息以及终端在选择区域中的逗留时长,利用上述历史样本信息对建立的区域分析模型进行训练,使区域分析模型不断地进行学习,转换成能对终端在选择区域中的逗留时长进行分析并得到推荐区域信息的预置模型。

需要说明的是,历史样本信息中的终端可以有多个,选择区域也可以有多个,逗留时长是不同的终端在不同选择区域中的逗留时长。

在一个实施例中,获取多组历史样本信息对区域分析模型进行训练的步骤包括以下步骤:

通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度,根据各兴趣度对其他选择区域进行排序,将排序在前的其他选择区域的信息作为推荐区域信息输出。

在本实施例中,在将多组历史样本信息作为训练样本对区域分析模型进行训练时,可以从历史样本信息中选取一个终端作为目标终端,确定目标终端逗留过的选择区域,即目标终端对应的选择区域,目标终端未逗留过的选择区域为其他选择区域,利用目标终端对应的选择区域与其他选择区域的相似度可以对目标终端对其他选择区域的兴趣度进行判断,根据兴趣度进行排序后可以将排序在前的其他选择区域作为推荐区域进行输出,如此就可以准确得到针对目标终端的推送信息,该推送信息与目标终端的行为模式是相符的。

在一个实施例中,通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度的步骤包括以下步骤:

根据计算相似度;

式中,n(i)表示与选择区域i相关联的终端数量,n(j)表示与选择区域j相关联的终端数量,wij表示选择区域i与选择区域j之间的相似度。

在本实施例中,n(i)表示与选择区域i相关联的终端数量,n(j)表示与选择区域j相关联的终端数量,n(i)∩n(j)表示均在选择区域i和选择区域j中逗留过的终端数量,这一数值越大,代表在选择区域i中逗留过的终端在选择区域i中逗留的可能性越高,进而利用上述公式可以较为准确地得到选择区域i与选择区域j之间的相似度。

在一个实施例中,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度的步骤包括以下步骤:

根据puj=∑i∈n(u)wijrui计算兴趣度;

式中,wij表示目标终端u对应的选择区域i与其他选择区域j之间的相似度,rui表示目标终端u在对应的选择区域i中的逗留时长,n(u)表示目标终端u对应的选择区域i的集合,puj表示目标终端u对其他选择区域j的兴趣度。

在本实施例中,利用上述公式将逗留时长与选择区域之间的相似度相结合,可以快速有效地得到终端对其他选择区域的兴趣度,以此为依据选取推荐的选择区域。

可选的,在计算兴趣度时,可以对计算所采用的目标终端u对应的选择区域i进行选取,如可以选取与其他选择区域j的相似度大于相似度阈值的选择区域,以此可以提高兴趣度的准确性。

在一个实施例中,获取多组历史样本信息对区域分析模型进行训练的步骤还包括以下步骤:

获取多个目标终端的当前选择区域,根据各当前选择区域和各推荐区域计算区域分析模型的召回率,若召回率低于预设值,则对区域分析模型进行调整。

在本实施例中,对区域分析模型进行训练的过程中,得到的推荐区域可以与目标终端的当前选择区域进行比较,计算区域分析模型的召回率,计算时可以使用多个目标终端对应的当前选择区域和推荐区域,召回率可以表征区域分析模型的准确度,在召回率高于预设值时,表示区域分析模型可以满足信息推送的准确度要求,在召回率低于预设值时,表示区域分析模型的准确度较低,可以则对区域分析模型进行调整,使召回率满足条件,保证区域分析模型输出的推荐区域信息的准确性。

在一个实施例中,将推荐区域信息推送至终端的步骤包括以下步骤:

获取终端的常驻地坐标以及多个推荐区域的位置坐标,分别计算各位置坐标与常驻地坐标之间的距离值;

根据各距离值对各推荐区域进行排序,将排序后的各推荐区域的信息推送至终端。

在本实施例中,终端在日常中的移动范围有限,一般会有常驻地坐标,考虑到距离的远近,可以获取多个推荐区域的位置坐标与终端的常驻地坐标之间的距离值,根据距离值对各推荐区域进行排序后,将各推荐区域推送至终端,便于终端能快速地对推荐区域进行选择。

可选的,常驻地可以包括居住地和工作地,一般用户在使用终端时在居住地和工作地的停留时长最长,因此可以获取多个推荐区域的位置坐标分别与终端的居住地坐标或工作地坐标之间的距离值。

在一个实施例中,获取终端的常驻地坐标的步骤包括以下步骤:

确定预设时间段内终端的信号连接次数最多的目标基站,获取目标基站的位置坐标作为终端的常驻地坐标。

在本实施例中,可以利用终端信号的目标基站的位置坐标来确定终端的常驻地坐标,如此可以无需对终端进行复杂的精确定位,降低定位复杂度,由于目前基站的覆盖率较大,将基站的位置坐标作为终端的常驻地坐标并不会产生太大的误差,对各推荐区域的排序不会产生影响。

可选的,常驻地可以是居住地,选择0点至6点之间终端的信号连接次数最多的基站的位置坐标作为居住地坐标;常驻地可以是工作地,选择6点至18点之间终端的信号连接次数最多的基站的位置坐标作为工作地坐标。

根据上述信息推送方法,本发明实施例还提供一种信息推送系统,以下就信息推送系统的实施例进行详细说明。

参见图3所示,为一个实施例的商圈信息推送系统的结构示意图。该实施例中的商圈信息推送系统包括:

信息获取单元210,用于获取终端处于基站信号覆盖范围内的停留时长;

信息处理单元220,用于根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域中的逗留时长;

信息推送单元230,用于将相互对应的终端信息、选择区域信息和逗留时长输入预置模型,获取预置模型输出的推荐区域信息,将推荐区域信息推送至终端。

在本实施例中,信息获取单元210获取终端处于基站信号覆盖范围内的停留时长,信息处理单元220通过基站与选择区域之间的关联关系进一步获取终端在选择区域中的逗留时长,信息推送单元230利用预置模型分析相互对应的终端信息、选择区域信息和逗留时长,从而得到推荐区域信息并推送至终端。由于终端在未使用的情况下也会与基站进行通信,可以获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系得到终端在选择区域的逗留时长,根据终端、选择区域和逗留时长为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐区域信息。

在一个实施例中,信息处理单元220在停留时长大于等于预设时长时,根据停留时长以及基站与选择区域之间的关联关系获取终端在选择区域的逗留时长。

在一个实施例中,如图4所示,信息推送系统还包括模型训练单元240,用于建立区域分析模型,获取多组历史样本信息对区域分析模型进行训练,获得预置模型,其中,历史样本信息包括终端信息、选择区域信息以及终端在选择区域中的逗留时长。

在一个实施例中,模型训练单元240通过区域分析模型分别计算目标终端对应的选择区域与其他选择区域之间的相似度,根据各相似度和目标终端在对应的选择区域中的逗留时长分别获取目标终端对其他选择区域的兴趣度,根据各兴趣度对其他选择区域进行排序,将排序在前的其他选择区域的信息作为推荐区域信息输出。

在一个实施例中,模型训练单元240根据计算相似度;

式中,n(i)表示与选择区域i相关联的终端数量,n(j)表示与选择区域j相关联的终端数量,wij表示选择区域i与选择区域j之间的相似度。

在一个实施例中,模型训练单元240根据puj=∑i∈n(u)wijrui计算兴趣度;

式中,wij表示目标终端u对应的选择区域i与其他选择区域j之间的相似度,rui表示目标终端u在对应的选择区域i中的逗留时长,n(u)表示目标终端u对应的选择区域i的集合,puj表示目标终端u对其他选择区域j的兴趣度。

在一个实施例中,模型训练单元240获取目标终端的当前选择区域,根据当前选择区域和推荐区域计算区域分析模型的召回率,若召回率低于预设值,则对区域分析模型进行调整。

在一个实施例中,信息推送单元230获取终端的常驻地坐标以及多个推荐区域的位置坐标,分别计算各位置坐标与常驻地坐标之间的距离值;根据各距离值对各推荐区域进行排序,将排序后的各推荐区域的信息推送至终端。

在一个实施例中,信息推送单元230确定预设时间段内终端的信号连接次数最多的目标基站,获取目标基站的位置坐标作为终端的常驻地坐标。

本发明实施例的信息推送系统与上述信息推送方法一一对应,在上述信息推送方法的实施例阐述的技术特征及其有益效果均适用于信息推送系统的实施例中。

根据上述信息推送方法,本发明实施例还提供一种可读存储介质和一种计算机设备。

一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述信息推送方法的步骤。

上述可读存储介质,通过其存储的可执行程序,实现了获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系以及逗留时长,可以为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐信息。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述信息推送方法的步骤。

上述计算机设备,通过处理器上运行的可执行程序,实现了获取终端在基站信号覆盖范围内的停留时长,通过终端、基站、选择区域的关联关系以及逗留时长,可以为终端推送推荐区域信息,无需获取终端的网络访问行为数据来确定终端的网络访问行为偏好,大大提高了终端信息资料的安全性,同时可以为终端推送与终端行为模式相符且有效的推荐信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一非易失性的计算机可读取存储介质中,如实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述信息推送方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

在一个实施例中,信息推送方法可以应用于商圈信息推送的场景中。在具体应用时,商圈的覆盖区域是选择区域,推荐区域信息是推荐商圈信息,采集终端逗留商圈的历史足迹,基于地点上下文的物品协同过滤推荐算法(itemcollaborationfilter,下称:itemcf),为终端推荐偏好的商圈,满足终端用户的消费需求,同时为商圈引入最具消费潜力的用户。

具体过程如下:

一:采集终端逗留商圈的历史足迹

1)建立基站和商圈的对应关系

商圈的覆盖半径一般是2-3公里,城市内基站的覆盖半径一般是5-10公里,基站和商圈存在覆盖区域交集的情况,则基站和商圈有对应关系。

假设城市共有m个商圈,每个商圈的坐标是bi(x,y)(1≤i≤m);n个基站,每个基站的坐标是cj(x,y)(1≤j≤n),则每个商圈和每个基站之间存在三种关系:

如图5所示,基站覆盖商圈;如图6所示,基站和商圈交集;如图7所示,基站和商圈没有交集;

如果基站和商圈存在覆盖和交集关系,则二者有对应关系。商圈和基站之间可以是多对多的关系,即一个商圈可能会有多个基站覆盖到,一个基站也可能和多个商圈有交集。

2)判断终端的居住地和工作地

这是itemcf基于地点上下文的重要信息。判断终端的居住地很直接,选择0点-6点之间终端登记的基站中出现信号连接次数最多的基站。判断终端的工作地原理一样,选择在6点-18点之间终端登记的基站中出现信号连接次数最多的基站。

这个判断是基于终端的用户睡觉或工作期间,基站和终端会定期通信,如果一个用户长期呆在一个地方,那么这个地方的基站是登记用户的终端最多的。

假设手机用户的居住地所属的基站的坐标是ch(x,y),工作地所属的基站的坐标是cw(x,y)。

3)采集终端历史逗留的商圈记录

假设终端在某基站附近(非居住地和工作地)停留超过30分(这个阈值可以根据不同的主题商圈定义,一般来说逗留商圈的时间基本都会超过30分),而基站和商圈正好有对应关系,即则可以判断终端在该商圈逗留并消费。

如果终端离开该商圈,即基站发生转移,而所注册的基站已经和商圈没有覆盖或交集关系了,则记录下终端离开商圈时间,并可计算出用户在该商圈的逗留时长。

完成数据的采集、处理,最终会生成如表1样本集的数据,用于itemcf模型训练。

表1样本集

二:itemcf模型训练和评估

本方案中将商圈作为一种物品推荐给终端。itemcf算法给终端用户推荐和之前浏览的物品相似的物品,它主要通过分析终端的行为记录计算物品之间的相似度,也就是说物品a和物品b具有很大的相似度是因为喜欢物品a的终端用户大都也喜欢物品b;同时,itemcf也可以利用终端的历史足迹给推荐结果提供推荐解释,用于解释的物品都是终端用户之前浏览的物品。

1)计算商圈之间的相似度

公式定义:其中n(i)表示喜欢商圈i的终端用户数,n(j)表示喜欢商圈j的终端用户数,在样本集中就是在商圈逗留的终端号的记录数量。

通过该公式,可以建立其所有商圈之间的相似度,及构建一个商圈-商圈相似度矩阵,其值就是wij。

2)计算终端用户对一个商圈j的兴趣:

公式定义:puj=∑i∈n(u)∩s(j,k)wijrui,其中n(u)是终端u逗留过的商圈的集合,s(j,k)是和商圈j最相似(即相似度大于相似度阈值)的k个商圈的集合,wij就是商圈i和j之间的相似度,rui是终端u的用户对商圈i的兴趣(反映在样本集中就是逗留时长,逗留越长兴趣越高)。

该公式说明和终端用户历史上感兴趣的商圈越相似的商圈,越有可能在终端的推荐列表中获得较高的排名,排名在前的商圈可以推荐给终端,推荐终端用户去推荐的商圈消费。

2)模型评估

用召回率来评估itemcf模型,测试集来自实际数据,按照采集终端逗留商圈的历史足迹的方式采集实际数据。

召回率定义:其中r(u)表示itemcf模型向终端u推荐的n个商圈,t(u)表示测试集上用户逗留过商圈的集合,召回率越高,说明模型越准确,在召回率低于预设值时,表示itemcf模型推荐的商圈不够准确,需要对itemcf模型进行调整。

三:商圈推荐排名和过滤

基于样本集训练的itemcf在给出推荐商圈列表时是没有考虑地点上下文的。在推荐过滤中,需要对所推荐的商圈列表进行重构,按照距离重新排序。

非工作日期间,以推荐的商圈坐标和居住地坐标之间的距离为排序依据,即|bi(x,y)-ch(x,y)|;

工作日期间,以推荐的商圈坐标和工作地坐标之间的距离为排序依据,即|bi(x,y)-cw(x,y)|。

考虑地点上下文后,根据商圈列表排名给出推荐。

在推荐时,还可以定义商圈的标签或主题,如大类可定义娱乐、购物、饮食、汽车等,大类下还可以定义小类,然后应用基于标签的推荐算法,可以关联到终端用户的内容和兴趣偏好。

根据上述商圈信息推荐方式,实例案例如下:小明家住琶洲,工作在天河猎德,历史上逗留过的商圈有白马服装城、万博中心、正佳广场等,通过itemcf以及结合地点上下文,向其推荐国际轻纺城、金海马家居、跑马场等商圈。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成。所述的程序可以存储于可读取存储介质中。该程序在执行时,包括上述方法所述的步骤。所述的存储介质,包括:rom/ram、磁碟、光盘等。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1