一种在网络用车系统中使用tf-idf评估承运车辆与地域相关性的方法

文档序号:8544155阅读:499来源:国知局
一种在网络用车系统中使用tf-idf评估承运车辆与地域相关性的方法
【技术领域】
[0001]本发明涉及到网络用车领域中的评估承运车辆与地域相关性的方法,更具体地涉及到以TF-1DF评估承运车辆与地域相关性的方法。
【背景技术】
[0002]在网络用车领域中,承运车辆通常与地域有较强的关联性。例如,由于承运司机对不同地域的熟悉程度和对不同类型地域的偏好,造成承运车辆接单时对其运营的地域有较强的选择性。为了将用车的订单更准确和高效地发送给适合于承运的司机,需要对承运车辆与地域相关性进行评估。
[0003]TF-1DF (term frequency -1nverse document frequency)是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的代表能力。TF-1DF实际上是:TF词频(Term Frequency)与IDF逆向文件频率(Inverse Document Frequency)的乘积。词频TF表示词条在文档d中出现的频率。实际上,如果一个词条在一个文档中频繁出现,则说明该词条能够更好代表这个文本的特征。IDF的主要思想是:如果包含某个词条t的文档越少,那么IDF越大,则说明词条t具有很好代表能力。
[0004]TF-1DF在信息检索技术中已经有成功的应用,例如在搜索引擎中有广泛应用。但是,如何将其应用到网络用车系统中,尤其是应用到承运车辆与地域相关性的评估中,仍然是现有技术中待解决的问题。

【发明内容】

[0005]针对上述问题,本发明将TF-1DF统计方法创造性地应用到了网络用车系统中的承运车辆与地域相关性的评估中,提出了一种在网络用车系统中使用TF-1DF评估承运车辆与地域相关性的方法,所述方法包括如下步骤:
[0006]将承运车辆的运营区域划分为多个区块Bi;
[0007]在给定的一个时间段内,
[0008]统计出参与运营的承运车辆总数S,
[0009]对任一区块Bi,统计出曾经以其作为运营起点或终点的承运车辆数目Ni,
[0010]计算出区块Bi的 IDFi= 1g(SziNi);
[0011]对每个承运车辆j,统计出其总的运营次数η」和区块B i作为其运营起点或终点的次数
[0012]计算出区块Bi在承运车辆j中的TFy= n i;J/nJ;
[0013]那么,承运车辆j与区块&的相关度R^= TFi,」* IDF i。
[0014]优选地,在所述的评估承运车辆和地域相关性的方法中,所述区块Bi是将城市按经玮度划分成的矩形块。
[0015]优选地,在所述的评估承运车辆和地域相关性的方法中,所述矩形块的大小不相同,并且用车密度较大的区域所述矩形块较小。
[0016]优选地,在所述的评估承运车辆和地域相关性的方法中,所述区块Bi是形状不规则的区域。
[0017]优选地,在所述的评估承运车辆和地域相关性的方法中,所给定的时间段为最近一周或一个月或更长的时间段。
[0018]本发明另外一方面提出了一种在网络用车系统中使用TF-1DF评估承运车辆与地域相关性的方法,所述方法包括如下步骤:
[0019]将承运车辆的运营区域划分为多个区块Bi,并为每个区块定义一种或多种地域标签 Cn,Ci2,…Cin;
[0020]在给定的一个时间段内,
[0021]统计出参与运营的承运车辆总数S,
[0022]对任一地域标签Ci,统计出曾经以其作为运营起点或终点的承运车辆数目Ni,
[0023]计算出地域标签(^的IDFi= 1g(SZNi);
[0024]对每个承运车辆j,统计出其总的运营次数η」和有标签C i的地域作为其运营起点或终点的次数
[0025]计算出地域标签Ci在承运车辆j中的TF i,j = n i;J/nJ;
[0026]因而,承运车辆j与地域标签(^的相关度RC i;J= TF IDF i;
[0027]承运车辆j与区块&的相关度RiJ= W1* RCilJw2* RCi2,,…+wn* RCin,J;其中W1, Wf wn是区块B 1各标签的权重。
[0028]优选地,在所述的评估承运车辆和地域相关性的方法中,所述地域标签包括有机场、火车站、客运站、商业区、办公区、居民区、学校、公园、体育场馆。
[0029]本发明所提出的方法能够很好地评估承运车辆和地域的关联性,该关联性能为派单提供有利的参考,为提高派单的准确性和运营质量提供支持。
【附图说明】
[0030]图1是根据本发明的一个实施例的使用TF-1DF评估承运车辆与地域相关性的方法的流程图。
[0031]图2是根据本发明的一个实施例的使用TF-1DF评估承运车辆与地域相关性的方法的流程图。
【具体实施方式】
[0032]下面将参考附图结合具体的实施例对本发明进行说明,但应该明白的是,这些实施例仅是示例性的,并不构成对本发明的限制,本发明的保护范围由权利要求确定,并且,在本发明的原理和思想范围内,本领域技术人员对本发明所述的技术方案的组合或利用常规技术手段进行的替换所得到的技术方案都落入到本发明的保护范围内。
[0033]本发明基于如下思想:承运车辆与地域的相关性可以等价于某一地域与承运车辆已经完成订单的地域列表的关联性。
[0034]一方面,如果某一地域在承运车辆所完成订单中出现的频度越高,则表示该地域与该承运车辆的关联程度高。如果将已完成的订单的起点和终点所属的地域列表看作一个文档,起点和终点所属的地域看作词,那么,词频TF代表了该地域与该承运车辆的关联程度。
[0035]另外一个方面,如果完成某个地域订单的承运车辆越少,则表示该地域对承运车辆的附着性越强,如果将每个承运车辆完成的订单的起点和终点所属的地域列表看作一个文档,起点和终点所属的地域看作词,那么IDF即表示了地域对承运车辆的附着性的大小。
[0036]从上面的分析可知,如果将每个承运车辆完成的订单的起点和终点所属的地域列表看作一个文档,那么使用TF-1DF就可以评估承运车辆与地域的相关性。
[0037]首先,可将承运车辆的运营区域按经玮度划分成多个区块,在该实施例中,其中的每一个区块为大小相同的矩形。但是在其他的实施例中,可以将运营区域按经玮度划分成大小各不相同的矩形。例如按照用车频度的不同,将用车频度较高的区域划分为相对小的区块,将用车频度较低的区域划分为相对大的区块。同时在其他实施例中,也可以将运营区域划分为形状不规则的区块,例如按照管辖关系或是地理地形等。
[0038]所划分的区块在后续的统计中被作为地域的基本单元。
[0039]图1示出了根据本发明的一个实施例的使用TF-1DF评估承运车辆和地域相关性的方法的步骤:
[0040]首先,如图2中的步骤S1001所示,需要将承运车辆的运营区域按照需要划分为多个区块,并将第i个区块标示为
[0041]之后,需要对承运车辆所完成的订单进行统计,以得到能代表地域与出租车关联关系的TF-1DF值。所述统计是在一个指定的时间段上来进行的,如图2中的步骤S1002所示,设置统计时间段。所述时间段可以依据实际的运营需要,设定为最近一个月或最近一周。<
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1