一种订单地址匹配方法及装置的制造方法_2

文档序号:9866350阅读:来源:国知局
护的范围。
[0051] -个小区可W是一个居民小区,例如天和苑A期、天和苑B期、天和苑C期、天和苑D 期,分别为4个小区,并且每个小区中包含多个楼宇;一个小区也可W是一个学校的某个校 区,例如上海交通大学A校区、上海交通大学B校区、上海交通大学C校区、上海交通大学D校 区、上海交通大学E校区,分别为5个校区,每个校区为一个小区,并且每个校区包含多个楼 宇。
[0052] 本发明实施例中将W小区为某个学校的校区为例进行说明,对此后续不再寶述。
[0053] 下面结合说明书附图对本发明实施例作进一步详细描述,如图1所示,本发明实施 例提供的订单地址匹配方法,包括:
[0化4] 步骤101、确定订单地址对应的小区;
[0055] 步骤102、根据所述订单地址,生成所述订单地址对应的字段集合;
[0056] 步骤103、针对所述小区中的一个楼宇,从所述楼宇对应的字段集合中确定与所述 订单对应的字段集合匹配的字段;w及根据匹配的字段的字段分值,确定所述楼宇的匹配 分值;
[0057]步骤104、将所述小区中匹配分值最高的楼宇,确定为所述订单地址对应的楼宇。 [005引具体地,在上述步骤101中,首先确定订单地址对应的小区。一般用户通过移动终 端,如平板电脑,手机等下单时,会手动输入一个配送地址,或者使用预先保存的配送地址, 该配送地址即为订单地址,并且一般用户在下单时,是在某个小区内或者是在某个小区附 近,因而可W基于用户的下单时的订单地址,确定该订单地址对应的小区。具体地,根据订 单地址,确定订单地址对应的小区的方式有很多种,例如可W是预先存储一个小区与一些 地址的对应的关系,比如将小区的地址W及附近路段名称作为该小区对应的地址信息,当 一个订单地址中出现一个小区对应的地址信息中的一个或者多个时,可W确定该订单地址 对应该小区,对于确定订单地址对应的小区的具体方式不做限定,对此不再寶述。
[0059] 上述步骤102中,根据订单地址,生成订单地址对应的字段集合。具体地,根据订单 地址生成订单地址对应的字段集合的方式有很多,例如可W使用正向最大匹配法,逆向最 大匹配法,最少切分法,双向最大匹配法等方法中的一种,对订单地址进行中文分词,然后 对分词后得到的字段进行去重处理,得到字段集合,例如,订单地址为""上海交通大学巧行 校区西六十栋",则可W生成该订单地址的对应字段集合为{上海交通大学,巧行,校区,西, 六十,栋}。
[0060] 下面给出一种本发明实施例使用的生成订单地址对应的字段集合的方式。
[0061 ]可选地,所述根据所述订单地址,生成所述订单地址对应的字段集合,包括:
[0062] 将所述订单地址中的中文数字转换为阿拉伯数字;
[0063] 对转换后的订单地址进行分词,生成所述订单地址对应的字段集合。
[0064] 上述方法中,首先将订单地址中的中文数字转换为阿拉伯数字,然后对转换后的 订单地址进行分词,得到订单地址对应的字段集合。例如,订单地址为""上海交通大学巧行 校区西六十栋",则首先将订单地址转换为"上海交通大学巧行校区西60栋",然后进行分 词,得到最终的字段集合为{上海交通大学,巧行,校区,西,60,栋},其中对于分词的方式不 做限定,例如可W是正向最大匹配法,逆向最大匹配法,最少切分法,双向最大匹配法等,优 选地,使用逆向最大匹配法对转换后的订单地址进行分词处理。
[0065] 该方法,之所W将订单地址中的中文数字转换为阿拉伯数字,是为了后续对订单 地址与楼宇做匹配时,可W更加准确和方便地匹配出订单地址对应的楼宇,因为楼宇一般 使用数字进行编号,因而数字的识别度比较高,因此该方法可W更加便于对订单地址跟楼 宇进行匹配处理。
[0066] 上述步骤103中,针对订单地址对应的小区中的每一个楼宇,都需要确定该楼宇与 订单地址的匹配分值,其中确定的方式为:从楼宇对应的字段集合中确定与订单对应的字 段集合匹配的字段,然后根据匹配的字段的字段分值,确定楼宇的匹配分值。
[0067] 其中,一个小区中包含很多楼宇,一个小区对应的楼宇记录信息都预先做了存储, 例如,W上海交通大学巧行校区为例进行说明,假设巧行校区一共包含5栋楼宇,则预先存 储了该5栋楼宇的楼宇记录信息,如表1所示。
[006引
[0069] 表1上海交通大学巧行校区楼宇记录信息表
[0070] 需要说明的是,上面只是作为举例,W上海交通大学巧行校区有5个楼宇进行说 明,实际应用中,W实际情况为准,对于楼宇的数量,本发明不做限定。
[0071] 上述针对上海交通大学巧行校区的楼宇记录信息表,是在步骤103之前预先存储 的,下面对于如何得到一个小区(如一个学校的某个校区)的楼宇记录信息表进行说明,还 是W上海交通大学巧行校区为例。
[0072] 步骤1、收集小区中的楼宇地址信息。
[0073] 需要通过人工方式或者浏览学校地图的方式,收集上海交通大学巧行校区的每个 楼宇的楼宇地址,并且W固定的格式生成楼宇地址信息,例如经过收集的楼宇地址信息如 表2所不。
[0074]
[0075] ~表2收集到的上海交通大学巧行校区楼宇地址信息 '
[0076] 步骤2、根据楼宇地址信息,生成与楼宇地址对应的字段集合。
[0077] 该步骤与步骤102中根据订单地址,生成订单地址对应的字段集合的方式相同,在 此不寶述,同时为了便于区分不同的楼宇记录信息,还可W为每一条楼宇记录信息分配一 个楼宇标识,用于唯一标识该楼宇的楼宇记录信息,因此根据表2中收集到的上海交通大学 巧行校区楼宇地址数据信息,经过处理,可W得到表1所示的上海交通大学巧行校区楼宇记 录倍息表。
[0078] 此外,由于步骤103中在确定楼宇的匹配分值时,需要用到字段集合中的字段的字 段分值,因此在得到表1所示的上海交通大学巧行校区楼宇记录信息表之后,还需要继续确 定每个字段的字段分值,可通过步骤3完成。
[0079] 步骤3、确定校区中所有的字段的字段分值。
[0080] 可选地,根据下列方式确定字段与字段分值之间的对应关系:
[0081] 将一个小区中所有楼宇对应的字段集合进行合并去重处理,生成楼宇字段总集 合;
[0082] 针对所述楼宇字段总集合中的一个字段,若该字段为数字或字母,则将该字段对 应的字段分值设置为预先设定的值;否则,根据该字段的长度与该字段在所有楼宇对应的 字段集合中出现的频率,确定该字段对应的字段分值。
[0083] 上述方法中,首先将一个小区中所有楼宇对应的字段集合进行合并去重处理,生 成楼宇字段总集合,例如对表1中的5个楼宇的所有字段集合,可生成楼宇字段总集合为{:西 区,东区,58,X,宿舍,60,62,65,67}。
[0084] 然后针对楼宇字段总集合中的字段,如果该字段为数字或者字母,则将该字段对 应的字段分值设定为预先设定的值,例如可W将数字的字段分值设置为150,200等,将字母 的分值设置为100,80等,因为针对一个小区的楼宇,数字的识别度较高,一般一个数字就是 用于表示该栋楼宇的楼号,因此可W将数字的字段分值设置较高,基于相同的原因,单独的 一个字母的字段分值也可W设置较高,在实际应用中,可W将数字的字段分值设置略高于 字母。
[0085] 如果该字段不为数字,也不为字母,例如字段为"西区"、
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1