通勤订单识别方法和装置的制造方法

文档序号:10535699阅读:164来源:国知局
通勤订单识别方法和装置的制造方法
【专利摘要】本申请公开了通勤订单识别方法和装置。所述方法的一【具体实施方式】包括:获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息;根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。该实施方式实现了通勤订单的准确识别。
【专利说明】
通勤订单识别方法和装置
技术领域
[0001]本申请涉及计算机技术领域,具体涉及互联网订单处理技术领域,尤其涉及通勤订单识别方法和装置。
【背景技术】
[0002]随着互联网用车业务的发展,一部分互联网叫车用户会在通勤过程中选择专车和顺风车等互联网用车业务。这些通勤订单具有优良的商业价值,如果能够获取到通勤订单,就可以获取到通勤用户和通勤时间等重要信息,从而可以更好的分析用户行为,理解用户需求,有针对性的进行车辆调度,也为精准的营销提供有力的数据支持。
[0003]然而,现有的通勤订单识别方法通常是通过用户预先设定的通勤线路清单来获取的,而无法自动识别叫车业务中的通勤订单。

【发明内容】

[0004]本申请的目的在于提出一种改进的通勤订单识别方法和装置,来解决以上【背景技术】部分提到的技术问题。
[0005]第一方面,本申请提供了一种通勤订单识别方法,所述方法包括:获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息;根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。
[0006]在一些实施例中,所述方法还包括:建立通勤位置识别模型的步骤,包括:获取在预定应用程序中提交了第一位置信息和第二位置信息的用户,并获取所述用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;基于所述轨迹点的簇集合和在预定时间段内所述用户的轨迹点落入所述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型。
[0007]在一些实施例中,所述训练得到通勤位置识别模型包括:利用分类器训练得到通勤位置识别模型,其中,所述分类器包括:决策树、随机森林、迭代决策树和支持向量机。
[0008]在一些实施例中,所述方法还包括:基于通勤订单的数量或比例,识别通勤用户,包括:获取所述用户在历史时间段内所有订单的数量,并统计所述所有订单中所述用户的通勤订单的数量;确定所述通勤订单的数量占所有订单的数量的比例;将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户。
[0009]在一些实施例中,在所述将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户之后,所述方法还包括:识别所述通勤用户的通勤时间,包括:采集所述通勤用户在历史时间段内发生的通勤订单的时间信息;将所述历史时间段内的所述时间信息在一天中对应的不同的时间段内出现的次数添加到所述时间段对应的订单数量列表中;将所述订单数量列表中的订单数量大于预设阈值并且所述订单数量与所述订单数量列表中的订单总数量的比值大于预设阈值的订单数量所对应的时间段标识为所述用户的通勤时间。
[0010]在一些实施例中,所述根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单,包括:获取所述历史订单的位置信息中的轨迹起点坐标位置与所述第一位置信息中的第一坐标位置之间的距离;获取所述历史订单的位置信息中的轨迹终点坐标位置与所述第二位置信息中的第二坐标位置之间的距离;识别所述距离小于预设阈值的订单为通勤订单。
[0011]在一些实施例中,所述聚类算法包括:基于密度的聚类算法。
[0012]第二方面,本申请提供了一种通勤订单识别装置,所述装置包括:轨迹数据获取单元,配置用于获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;簇集合生成单元,配置用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;第一位置信息和第二位置信息获取单元,配置用于将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息;通勤订单识别单元,配置用于根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。
[0013]在一些实施例中,所述装置还包括:通勤位置识别模型建立单元,配置用于建立通勤位置识别模型,包括:轨迹数据获取子单元,配置用于获取在预定应用程序中提交了第一位置信息和第二位置信息的用户,并获取所述用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;簇集合生成子单元,配置用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;通勤位置识别模型建立子单元,配置用于基于所述轨迹点的簇集合和在预定时间段内所述用户的轨迹点落入所述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型。
[0014]在一些实施例中,所述通勤位置识别模型建立子单元进一步配置用于:利用分类器训练得到通勤位置识别模型,其中,所述分类器包括:决策树、随机森林、迭代决策树和支持向量机。
[0015]在一些实施例中,所述装置还包括:通勤用户识别单元,配置用于基于通勤订单的数量或比例,识别通勤用户,包括:通勤订单数量统计子单元,配置用于获取所述用户在历史时间段内所有订单的数量,并统计所述所有订单中所述用户的通勤订单的数量;比例确定子单元,配置用于确定所述通勤订单的数量占所有订单的数量的比例;通勤用户识别子单元,配置用于将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户。
[0016]在一些实施例中,所述装置还包括:通勤时间识别单元,配置用于识别所述通勤用户的通勤时间,包括:时间信息采集子单元,配置用于采集所述通勤用户在历史时间段内发生的通勤订单的时间信息;添加子单元,配置用于将所述历史时间段内的所述时间信息在一天中对应的不同的时间段内出现的次数添加到所述时间段对应的订单数量列表中;通勤时间标识子单元,配置用于将所述订单数量列表中的订单数量大于预设阈值并且所述订单数量与所述订单数量列表中的订单总数量的比值大于预设阈值的订单数量所对应的时间段标识为所述用户的通勤时间。
[0017]在一些实施例中,所述通勤订单识别单元包括:第一获取子单元,配置用于获取所述历史订单的位置信息中的轨迹起点坐标位置与所述第一位置信息中的第一坐标位置之间的距离;第二获取子单元,配置用于获取所述历史订单的位置信息中的轨迹终点坐标位置与所述第二位置信息中的第二坐标位置之间的距离;通勤订单识别子单元,配置用于识别所述距离小于预设阈值的订单为通勤订单。
[0018]在一些实施例中,所述聚类算法包括:基于密度的聚类算法。
[0019]本申请提供的通勤订单识别方法和装置,通过利用通勤位置识别模型得到用户的第一位置信息和第二位置信息,之后基于用户的历史订单的位置信息和该用户的第一位置信息和第二位置信息识别该用户历史订单中的通勤订单,从而有效的利用了已知第一位置信息和第二位置信息的用户的相关信息,实现了通勤订单的准确识别。
【附图说明】
[0020]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0021]图1是本申请可以应用于其中的示例性系统架构图;
[0022]图2是根据本申请的通勤订单识别方法的一个实施例的流程图;
[0023]图3是根据本申请的通勤订单识别方法的又一个实施例的流程图;
[0024]图4是根据本申请的通勤订单识别装置的一个实施例的结构示意图;
[0025]图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
【具体实施方式】
[0026]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0027]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0028]图1示出了可以应用本申请的通勤订单识别方法及装置的实施例的示例性系统架构 100
[0029]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0030]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如网页浏览器应用、地图类应用,位置服务类应用、叫车服务类应用等。
[0031]终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Aud1 Layer 111,动态影像专家压缩标准音频层面3)、MP4 (Moving PictureExperts Group Aud1 Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0032]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上识别的通勤订单提供后台支持的通勤订单识别装置。通勤订单识别装置可以对获取到的用户的轨迹数据进行聚类、分析等处理,并将处理结果(例如通勤订单识别结果信息)反馈给终端设备。
[0033]需要说明的是,本申请实施例所提供的通勤订单识别方法一般由服务器105执行。
[0034]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0035]继续参考图2,示出了根据本申请的通勤订单识别方法的一个实施例的流程200。所述的通勤订单识别方法,包括以下步骤:
[0036]步骤201,获取用户的轨迹数据。
[0037]在本实施例中,通勤订单识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或无线连接方式从用户利用其进行互联网叫车的终端设备(客户端)获取到用户的轨迹数据。上述电子设备可以向终端设备发出轨迹数据请求,并接收终端设备响应于轨迹数据请求而发送的轨迹数据。终端设备也可以以一定的周期向上述电子设备上报轨迹数据。
[0038]在本实施例中,轨迹数据可以包括多个轨迹点的位置信息,其中,轨迹点可以是终端设备停留的地理位置点。在一些实施例中,轨迹点可以是停留时间超过一个阈值(例如30分钟)的地理位置点。可选地,轨迹数据还可以包括时间连续的运动轨迹。
[0039]通常,用户在使用终端设备的定位功能或打开位置服务应用时,终端设备可以记录用户当前的位置信息,并保存位置信息。终端设备可以将保存多个轨迹点的位置信息发送至服务器,还可以将轨迹点对应的终端设备标识和用户标识上报服务器。这样,服务器可以将轨迹数据与用户标识或终端设备标识对应。
[0040]需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
[0041]步骤202,针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合。
[0042]在本实施例中,上述电子设备获取到轨迹点的位置信息之后,可以利用聚类算法对上述位置信息进行聚类,从而生成轨迹点的簇集合。
[0043]在本实施例的一些可选的实现方式中,上述聚类算法可以是基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Applicat1n with Noise)。上述基于密度的聚类算法DBSCAN可以将簇定义为密度相连的点的最大集合,它能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
[0044]步骤203,将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息。
[0045]在本实施例中,上述电子设备可以将步骤202中生成的轨迹点的簇集合导入预先训练的通勤位置识别模型以得到用户的第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)。
[0046]在本实施例的一些可选的实现方式中,上述方法还可以包括建立通勤位置识别模型的步骤,可以包括:首先,获取在预定应用程序中提交了第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)的用户,例如,上述电子设备可以在上述用户的购物类应用程序中获取到用户的收货地址,上述电子设备也可以在外卖类应用程序中获取到用户的收货地址,其中,上述收货地址可能是用户的家庭住址,也可能是用户的公司地址,通过对上述收货地址进行频率分析得到用户的常用地址(如将用户选择的次数占总次数40%以上的收货地址设置为该用户的常用地址),再通过对上述常用地址的属性分析得到该用户的家庭住址或公司地址(如将该常用地址为XX大厦、XX商场的地址设置为公司地址);上述电子设备还可以在地图类应用程序或打车类应用程序中获取到用户注册时填写的家庭住址信息和公司地址信息,在获取到这些已知家庭住址信息和公司地址信息的用户之后,上述电子设备获取上述用户的轨迹数据,其中,轨迹数据可以包括多个轨迹点的位置信息。然后,上述电子设备可以利用基于密度的聚类算法DBSCAN对上述位置信息进行聚类,从而生成轨迹点的簇集合,上述电子设备可以将包含用户家庭住址的簇标记为home簇,也可以将包含用户公司地址的簇标记为company簇,还可以将剩余的簇标记为useless簇。最后,利用机器学习方法,基于得到的轨迹点的簇集合和在预定时间段内上述用户的轨迹点落入上述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型,其中,相关信息包括但不限于:上述用户在轨迹点的簇集合中出现的天数的比例(例如,在过去10天内,上述用户在home簇中出现4天,在company簇中出现6天,贝Ij出现的天数的比例为4/6)、上述用户在轨迹点的簇集合中的白天和夜间出现的比例(例如,在过去1天内,上述用户在home簇中白天出现5次,夜间出现9次,则在home簇中白天和夜间出现的比例为5/9)、通过上述用户在轨迹点的簇集合中连接的各个无线网的概率(例如,在过去1天内,上述用户在company簇中3次连接到第一无线网,2次连接到第二无线网,则连接到第一无线网的概率为3/5,连接到第二无线网的概率为2/5)而计算出的无线网的熵、上述用户在轨迹点的簇集合中的不同的时间段出现的比例(例如,将一天的时间分为三个时间段:6:00-14:00,14:00-20:00,20:00-次日6:00,在过去10天内,上述用户在home簇中出现在时间段6:00-14:00的次数为7次,出现在时间段14:00-20:00的次数为6次,出现在时间段20:00-次日6:00的次数为1次,则在home簇的时间段6:00-14:00、时间段14:00-20:00、时间段20:00-次日6:00出现的比例为:7/6/10),基于得到的轨迹点的簇集合和上述相关信息,上述电子设备可以利用分类器训练得到通勤位置识别模型,其中,上述分类器可以包括但不限于:决策树、随机森林、迭代决策树和支持向量机。
[0047]步骤204,根据获取到的用户的多个历史订单的位置信息、第一位置信息和第二位置信息,识别出历史订单中的通勤订单。
[0048]在本实施例中,上述电子设备可以根据获取到的上述用户的多个历史订单的位置信息和步骤203中得到的第一位置信息和第二位置信息来识别历史订单中的通勤订单,其中,历史订单的位置信息可以包括历史订单的轨迹起点的位置信息和轨迹终点的位置信息。
[0049]在本实施例的一些可选的实现方式中,上述电子设备可以首先获取历史订单的轨迹起点的位置信息中的起点坐标位置和轨迹终点的位置信息中的终点坐标位置;然后,获取上述起点坐标位置与上述第一位置信息中的第一坐标位置之间的距离,再获取上述终点坐标位置和上述第二位置信息中的第二坐标位置之间的距离;最后,将上述距离均小于预设阈值(例如,300米)的订单标识为通勤订单。
[0050]本申请的上述实施例提供的方法通过根据已知家庭住址和公司地址的用户的轨迹点的簇集合和相关信息训练得到通勤位置识别模型,而后利用上述通勤位置识别模型识别家庭住址和公司地址未知的用户,得到该用户的家庭住址和公司地址,之后基于用户的历史订单的位置信息和该用户的家庭住址信息和公司地址信息识别用户历史订单中的通勤订单,实现了通勤订单的准确识别。
[0051]进一步参考图3,其示出了通勤订单识别方法的又一个实施例的流程图300。该通勤订单识别方法的流程300,包括以下步骤:
[0052]步骤301,获取用户的轨迹数据。
[0053]在本实施例中,通勤订单识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或无线连接方式从用户利用其进行互联网叫车的终端设备(客户端)获取到用户的轨迹数据。
[0054]在本实施例中,轨迹数据可以包括多个轨迹点的位置信息,其中,轨迹点可以是终端设备停留的地理位置点。在一些实施例中,轨迹点可以是停留时间超过一个阈值(例如30分钟)的地理位置点。可选地,轨迹数据还可以包括时间连续的运动轨迹。
[0055]步骤302,针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合。
[0056]在本实施例中,上述电子设备获取到步骤301中的轨迹点的位置信息之后,可以利用聚类算法对上述位置信息进行聚类,从而生成轨迹点的簇集合。
[0057]步骤303,将轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息。
[0058]在本实施例中,上述电子设备将步骤302中生成的轨迹点的簇集合导入预先训练的通勤位置识别模型以得到用户的第一位置信息(家庭住址信息)和第二位置信息(公司地址信息)。
[0059]步骤304,根据获取到的用户的多个历史订单的位置信息、第一位置信息和第二位置信息,识别出历史订单中的通勤订单。
[0060]在本实施例中,上述电子设备可以根据获取到的上述用户的多个历史订单的位置信息和步骤303中得到的第一位置信息和第二位置信息来识别历史订单中的通勤订单,其中,历史订单的位置信息可以包括历史订单的轨迹起点的位置信息和轨迹终点的位置信息。
[0061]步骤305,基于通勤订单的数量或比例,识别通勤用户。
[0062]在本实施例中,上述电子设备可以首先获取到用户在历史时间段内的所有订单的数量,并统计上述所有订单中所述用户的通勤订单的数量;然后,上述电子设备可以计算上述通勤订单的数量占所有订单的数量的比例;最后,可以将通勤订单的数量超过预设阈值(例如5)或上述通勤订单的数量占所有订单的数量的比例超过预设阈值(例如50%)的用户识别为通勤用户。
[0063]作为示例,上述电子设备获取到用户在过去一个月内的叫车订单为24个,统计上述24个叫车订单中标识为通勤订单的数量为18个;上述通勤订单的数量18占所有订单的数量24的比例为75%;上述通勤订单的数量18大于预设阈值5,并且上述通勤订单的数量18占所有订单的数量24的比例75%大于预设阈值50%,则可以将上述用户标识为通勤用户。
[0064]步骤306,识别通勤用户的通勤时间。
[0065]在本实施例中,基于步骤305中得到的通勤用户,上述电子设备可以标识上述通勤用户的通勤时间。可以包括:首先,采集上述通勤用户在历史时间段(过去10天)内发生的通勤订单的时间信息,其中,时间信息可以是上述通勤用户的通勤订单执行的开始时间(例如,在基于互联网的叫车服务订单中,用户从轨迹起点出发的时间),也可以是上述通勤用户的通勤订单执行的结束时间(例如,在基于互联网的叫车服务订单中,用户到达轨迹终点的时间),还可以是从通勤订单执行的开始时间到通勤订单执行的结束时间之间的时间段;然后,将采集到的多个时间信息在预先将一天的时间划分成的不同的时间段中出现的次数添加到上述时间段所对应的订单数量列表中;最后,上述电子设备将上述订单数量列表中的订单数量大于预设阈值(例如5)并且上述订单数量与上述订单数量列表中的订单总数量的比值大于预设阈值(例如25%)的订单数量所对应的时间段标识为上述通勤用户的通勤时间。
[0066]作为示例,上述电子设备将采集到的通勤用户在过去一个月内订单执行的开始时间在将一天按一小时进行划分得到的时间段中出现的次数添加到上述时间段所对应的订单数量列表中后,得到的订单数量列表为(0,0,0,0,0,0,0,0,8,3,1,0,0,0,1,0,2,2,6,1,
0,0,0,0);将各个订单数量与预设阈值5进行比对,得到8:00-9:00和18:00-19:00时间段所对应的订单数量大于预设阈值5;再将上述订单数量与上述订单数量列表中的订单总数量的比值与预设阈值25%进行比对,得到8:00-9:00时间段所对应的订单数量8与上述订单数量列表中的订单总数量24的比值33.33%大于预设阈值25%,则8:00-9:00时间段为上述通勤用户的通勤时间所在的时间区间。
[0067]从图3中可以看出,与图2对应的实施例相比,本实施例中的通勤订单识别方法的流程300突出了通勤用户识别和通勤时间识别的步骤。由此,本实施例描述的方案可以基于通勤订单识别该通勤订单对应的用户是否为通勤用户,以及确定通勤用户的通勤时间,从而可以更加有针对性的分析用户行为。
[0068]进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种通勤订单识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0069]如图4所示,本实施例所述的通勤订单识别装置400包括:轨迹数据获取单元401、簇集合生成单元402、第一位置信息和第二位置信息获取单元403和通勤订单识别单元404。其中,轨迹数据获取单元401用于获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;簇集合生成单元402用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;第一位置信息和第二位置信息获取单元403用于将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息;通勤订单识别单元404用于根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。
[0070]在本实施例中,通勤订单识别装置400的轨迹数据获取单元401可以通过有线连接方式或无线连接方式从用户利用其进行互联网叫车的终端设备(客户端)获取到用户的轨迹数据。轨迹数据可以包括多个轨迹点的位置信息,其中,轨迹点可以是终端设备停留的地理位置点。在一些实施例中,轨迹点可以是停留时间超过一个阈值(例如30分钟)的地理位置点。可选地,轨迹数据还可以包括时间连续的运动轨迹。
[0071]在本实施例中,基于轨迹数据获取单元401获取到的轨迹点的位置信息之后,上述簇集合生成单元402可以利用聚类算法对上述位置信息进行聚类,从而生成轨迹点的簇集入口 ο
[0072]在本实施例中,上述第一位置信息和第二位置信息获取单元403在得到簇集合生成单元402的轨迹点的簇集合后,可以将其导入预先训练的通勤位置识别模型以得到用户的第一位置信息(如家庭住址信息)和第二位置信息(如公司地址信息)。
[0073]在本实施例中,上述通勤订单识别单元404可以根据获取到的上述用户的多个历史订单的位置信息和上述第一位置信息和第二位置信息获取单元403中得到的第一位置信息和第二位置信息来识别历史订单中的通勤订单,其中,历史订单的位置信息可以包括历史订单的轨迹起点的位置信息和轨迹终点的位置信息。
[0074]在本实施例的一些可选的实现方式中,本实施例的通勤订单识别装置还可以包括:通勤位置识别模型建立单元(图中未示出),用于建立通勤位置识别模型。通勤位置识别模型建立单元可以包括:轨迹数据获取子单元(图中未示出)、簇集合生成子单元(图中未示出)和通勤位置识别模型建立子单元(图中未示出)。其中,轨迹数据获取子单元用于获取在预定应用程序中提交了第一位置信息和第二位置信息的用户,并获取所述用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;簇集合生成子单元用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;通勤位置识别模型建立子单元用于基于所述轨迹点的簇集合和在预定时间段内所述用户的轨迹点落入所述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型。
[0075]在本实施例的一些可选的实现方式中,本实施例的通勤位置识别模型建立子单元进一步配置用于:利用分类器训练得到通勤位置识别模型,其中,所述分类器包括:决策树、随机森林、迭代决策树和支持向量机。
[0076]在本实施例的一些可选的实现方式中,本实施例的通勤订单识别装置还可以包括:通勤用户识别单元(图中未示出),用于基于通勤订单的数量或比例,识别通勤用户。通勤用户识别单元可以包括:通勤订单数量统计子单元(图中未示出)、比例确定子单元(图中未示出)和通勤用户识别子单元(图中未示出)。其中,通勤订单数量统计子单元用于获取所述用户在历史时间段内所有订单的数量,并统计所述所有订单中所述用户的通勤订单的数量;比例确定子单元用于确定所述通勤订单的数量占所有订单的数量的比例;通勤用户识别子单元用于将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户。
[0077]在本实施例的一些可选的实现方式中,本实施例的通勤订单识别装置还可以包括:通勤时间识别单元(图中未示出),用于识别所述通勤用户的通勤时间。通勤时间识别单元可以包括:时间信息采集子单元(图中未示出)、添加子单元(图中未示出)和通勤时间标识子单元(图中未示出)。其中,时间信息采集子单元用于采集所述通勤用户在历史时间段内发生的通勤订单的时间信息;添加子单元用于将所述历史时间段内的所述时间信息在一天中对应的不同的时间段内出现的次数添加到所述时间段对应的订单数量列表中;通勤时间标识子单元用于将所述订单数量列表中的订单数量大于预设阈值并且所述订单数量与所述订单数量列表中的订单总数量的比值大于预设阈值的订单数量所对应的时间段标识为所述用户的通勤时间。
[0078]在本实施例的一些可选的实现方式中,本实施例的通勤订单识别单元包括:第一获取子单元(图中未示出)、第二获取子单元(图中未示出)和通勤订单识别子单元(图中未示出)。其中,第一获取子单元用于获取所述历史订单的位置信息中的轨迹起点坐标位置与所述第一位置信息中的第一坐标位置之间的距离;第二获取子单元用于获取所述历史订单的位置信息中的轨迹终点坐标位置与所述第二位置信息中的第二坐标位置之间的距离;通勤订单识别子单元用于识别所述距离小于预设阈值的订单为通勤订单。
[0079]在本实施例的一些可选的实现方式中,本实施例的聚类算法包括:基于密度的聚类算法。
[0080]下面参考图5,其示出了适于用来实现本申请实施例的装置的计算机系统500的结构示意图。
[0081 ]如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(R0M)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有系统500操作所需的各种程序和数据。CPU50UR0M502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口 505也连接至总线504。
[0082]以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506 ;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口 505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
[0083]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
[0084]附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0085]描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括轨迹数据获取单元、簇集合生成单元、第一位置信息和第二位置信息获取单元和通勤订单识别单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。例如,簇集合生成单元还可以被描述为“轨迹点的簇集合生成单元”。
[0086]作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息;针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息;根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。
[0087]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1.一种通勤订单识别方法,其特征在于,所述方法包括: 获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息; 针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息; 根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 建立通勤位置识别模型的步骤,包括: 获取在预定应用程序中提交了第一位置信息和第二位置信息的用户,并获取所述用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息; 针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合;基于所述轨迹点的簇集合和在预定时间段内所述用户的轨迹点落入所述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型。3.根据权利要求2所述的方法,其特征在于,所述训练得到通勤位置识别模型包括: 利用分类器训练得到通勤位置识别模型,其中,所述分类器包括:决策树、随机森林、迭代决策树和支持向量机。4.根据权利要求1-3之一所述的方法,其特征在于,所述方法还包括: 基于通勤订单的数量或比例,识别通勤用户,包括: 获取所述用户在历史时间段内所有订单的数量,并统计所述所有订单中所述用户的通勤订单的数量; 确定所述通勤订单的数量占所有订单的数量的比例; 将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户。5.根据权利要求4所述的方法,其特征在于,在所述将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户之后,所述方法还包括: 识别所述通勤用户的通勤时间,包括: 采集所述通勤用户在历史时间段内发生的通勤订单的时间信息; 将所述历史时间段内的所述时间信息在一天中对应的不同的时间段内出现的次数添加到所述时间段对应的订单数量列表中; 将所述订单数量列表中的订单数量大于预设阈值并且所述订单数量与所述订单数量列表中的订单总数量的比值大于预设阈值的订单数量所对应的时间段标识为所述用户的通勤时间。6.根据权利要求1所述的方法,其特征在于,所述根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单,包括: 获取所述历史订单的位置信息中的轨迹起点坐标位置与所述第一位置信息中的第一坐标位置之间的距离; 获取所述历史订单的位置信息中的轨迹终点坐标位置与所述第二位置信息中的第二坐标位置之间的距离; 识别所述距离小于预设阈值的订单为通勤订单。7.根据权利要求1-2之一所述的方法,其特征在于,所述聚类算法包括:基于密度的聚类算法。8.一种通勤订单识别装置,其特征在于,所述装置包括: 轨迹数据获取单元,配置用于获取用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息; 簇集合生成单元,配置用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合; 第一位置信息和第二位置信息获取单元,配置用于将所述轨迹点的簇集合导入预先训练的通勤位置识别模型进行识别,得到第一位置信息和第二位置信息; 通勤订单识别单元,配置用于根据获取到的所述用户的多个历史订单的位置信息、所述第一位置信息和所述第二位置信息,识别出所述历史订单中的通勤订单。9.根据权利要求8所述的装置,其特征在于,所述装置还包括: 通勤位置识别模型建立单元,配置用于建立通勤位置识别模型,包括: 轨迹数据获取子单元,配置用于获取在预定应用程序中提交了第一位置信息和第二位置信息的用户,并获取所述用户的轨迹数据,其中,所述轨迹数据包括多个轨迹点的位置信息; 簇集合生成子单元,配置用于针对各个轨迹点的位置信息利用聚类算法对轨迹点进行聚类,生成轨迹点的簇集合; 通勤位置识别模型建立子单元,配置用于基于所述轨迹点的簇集合和在预定时间段内所述用户的轨迹点落入所述轨迹点的簇集合中的相关信息,训练得到通勤位置识别模型。10.根据权利要求9所述的装置,其特征在于,所述通勤位置识别模型建立子单元进一步配置用于: 利用分类器训练得到通勤位置识别模型,其中,所述分类器包括:决策树、随机森林、迭代决策树和支持向量机。11.根据权利要求8-10之一所述的装置,其特征在于,所述装置还包括: 通勤用户识别单元,配置用于基于通勤订单的数量或比例,识别通勤用户,包括: 通勤订单数量统计子单元,配置用于获取所述用户在历史时间段内所有订单的数量,并统计所述所有订单中所述用户的通勤订单的数量; 比例确定子单元,配置用于确定所述通勤订单的数量占所有订单的数量的比例; 通勤用户识别子单元,配置用于将所述通勤订单的数量大于预设阈值或所述比例大于预设阈值的用户识别为通勤用户。12.根据权利要求11所述的装置,其特征在于,所述装置还包括: 通勤时间识别单元,配置用于识别所述通勤用户的通勤时间,包括: 时间信息采集子单元,配置用于采集所述通勤用户在历史时间段内发生的通勤订单的时间信息; 添加子单元,配置用于将所述历史时间段内的所述时间信息在一天中对应的不同的时间段内出现的次数添加到所述时间段对应的订单数量列表中; 通勤时间标识子单元,配置用于将所述订单数量列表中的订单数量大于预设阈值并且所述订单数量与所述订单数量列表中的订单总数量的比值大于预设阈值的订单数量所对应的时间段标识为所述用户的通勤时间。13.根据权利要求8所述的方法,其特征在于,所述通勤订单识别单元包括: 第一获取子单元,配置用于获取所述历史订单的位置信息中的轨迹起点坐标位置与所述第一位置信息中的第一坐标位置之间的距离; 第二获取子单元,配置用于获取所述历史订单的位置信息中的轨迹终点坐标位置与所述第二位置信息中的第二坐标位置之间的距离; 通勤订单识别子单元,配置用于识别所述距离小于预设阈值的订单为通勤订单。14.根据权利要求8-9之一所述的装置,其特征在于,所述聚类算法包括:基于密度的聚类算法。
【文档编号】G06Q30/06GK105894358SQ201610197051
【公开日】2016年8月24日
【申请日】2016年3月31日
【发明人】王超
【申请人】百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1