一种订单地址匹配方法及装置的制造方法_4

文档序号:9866350阅读:来源:国知局
置还包括对应关系确定单元305,用于:
[0125] 将一个小区中所有楼宇对应的字段集合进行合并去重处理,生成楼宇字段总集 合;
[0126] 针对所述楼宇字段总集合中的一个字段,若该字段为数字或字母,则将该字段对 应的字段分值设置为预先设定的值;否则,根据该字段的长度与该字段在所有楼宇对应的 字段集合中出现的频率,确定该字段对应的字段分值。
[0127] 可选地,所述对应关系确定单元305,具体用于:
[0128] 根据下列公式确定该字段对应的字段分值:
[0129]
[0130] 其中,I该字段对应的字段分值,L为该字段长度,1〇宮(^)为该字段的反文档频 \ 率,T为所述小区中的楼宇总数量,N为包含该字段的楼宇数量。
[0131 ]可选地,所述字段集合生成单元302,具体用于:
[0132] 将所述订单地址中的中文数字转换为阿拉伯数字;
[0133] 对转换后的订单地址进行分词,生成所述订单地址对应的字段集合。
[0134] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提供运些计算机程序 指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器W产 生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0135] 运些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备W特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0136] 运些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤W产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。
[0137] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对运些实施例作出另外的变更和修改。所W,所附权利要求意欲解释为包括优 选实施例W及落入本发明范围的所有变更和修改。
[0138] 显然,本领域的技术人员可W对本发明进行各种改动和变型而不脱离本发明的精 神和范围。运样,倘若本发明的运些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含运些改动和变型在内。
【主权项】
1. 一种订单地址匹配方法,其特征在于,包括: 确定订单地址对应的小区; 根据所述订单地址,生成所述订单地址对应的字段集合; 针对所述小区中的一个楼宇,从所述楼宇对应的字段集合中确定与所述订单对应的字 段集合匹配的字段;以及根据匹配的字段的字段分值,确定所述楼宇的匹配分值; 将所述小区中匹配分值最高的楼宇,确定为所述订单地址对应的楼宇。2. 如权利要求1所述的方法,其特征在于,所述从所述楼宇对应的字段集合中确定与所 述订单对应的字段集合匹配的字段,包括: 将所述楼宇对应的字段集合与所述订单对应的字段集合的交集中的字段作为匹配字 段; 根据匹配的字段的字段分值,确定所述楼宇的匹配分值,包括: 根据字段与字段分值之间的对应关系,确定匹配的每个字段的字段分值; 将匹配的每个字段的字段分值之和作为所述楼宇的匹配分值。3. 如权利要求2所述的方法,其特征在于,根据下列方式确定字段与字段分值之间的对 应关系: 将一个小区中所有楼宇对应的字段集合进行合并去重处理,生成楼宇字段总集合; 针对所述楼宇字段总集合中的一个字段,若该字段为数字或字母,则将该字段对应的 字段分值设置为预先设定的值;否则,根据该字段的长度与该字段在所有楼宇对应的字段 集合中出现的频率,确定该字段对应的字段分值。4. 如权利要求3所述的方法,其特征在于,根据下列公式确定该字段对应的字段分值:其中,I该字段对应的字段分值,L为该字段长度,log (f)为该字段的反文档频率,T为 所述小区中的楼宇总数量,N为包含该字段的楼宇数量。5. 如权利要求1~3中任一项所述的方法,其特征在于,所述根据所述订单地址,生成所 述订单地址对应的字段集合,包括: 将所述订单地址中的中文数字转换为阿拉伯数字; 对转换后的订单地址进行分词,生成所述订单地址对应的字段集合。6. -种订单地址匹配装置,其特征在于,包括: 小区确定单元,用于确定订单地址对应的小区; 字段集合生成单元,用于根据所述订单地址,生成所述订单地址对应的字段集合; 楼宇匹配分值确定单元,用于针对所述小区中的一个楼宇,从所述楼宇对应的字段集 合中确定与所述订单对应的字段集合匹配的字段;以及根据匹配的字段的字段分值,确定 所述楼宇的匹配分值; 楼宇确定单元,用于将所述小区中匹配分值最高的楼宇,确定为所述订单地址对应的 楼宇。7. 如权利要求6所述的装置,其特征在于,所述楼宇匹配分值确定单元,具体用于: 将所述楼宇对应的字段集合与所述订单对应的字段集合的交集中的字段作为匹配字 段; 根据字段与字段分值之间的对应关系,确定匹配的每个字段的字段分值; 将匹配的每个字段的字段分值之和作为所述楼宇的匹配分值。8. 如权利要求7所述的装置,其特征在于,所述装置还包括对应关系确定单元,用于: 将一个小区中所有楼宇对应的字段集合进行合并去重处理,生成楼宇字段总集合; 针对所述楼宇字段总集合中的一个字段,若该字段为数字或字母,则将该字段对应的 字段分值设置为预先设定的值;否则,根据该字段的长度与该字段在所有楼宇对应的字段 集合中出现的频率,确定该字段对应的字段分值。9. 如权利要求8所述的装置,其特征在于,所述对应关系确定单元,具体用于: 根据下列公式确定该字段对应的字段分值:其中,I该字段对应的字段分值,L为该字段长度,log (f)为该字段的反文档频率,T为 所述小区中的楼宇总数量,N为包含该字段的楼宇数量。10. 如权利要求6~8中任一项所述的装置,其特征在于,所述字段集合生成单元,具体 用于: 将所述订单地址中的中文数字转换为阿拉伯数字; 对转换后的订单地址进行分词,生成所述订单地址对应的字段集合。
【专利摘要】本发明涉及文本挖掘技术领域,尤其涉及一种订单地址匹配方法及装置,用以解决现有技术在将订单地址匹配到某个楼宇的方法时,存在效率低下且容易出错的技术问题,包括:首先确定订单地址对应的小区,然后根据订单地址生成订单地址对应的字段集合,然后根据小区的楼宇对应的字段集合,确定小区中的楼宇的匹配分值,并将匹配分值最大的楼宇作为该订单地址对应的楼宇,因而该方法可实现自动将一个订单地址匹配到小区中某个具体的楼宇,相较于人工匹配方式,提高了效率,节约了人力物力。
【IPC分类】G06F17/30, G06F17/27, G06Q10/08, G06Q50/28
【公开号】CN105631627
【申请号】CN201510979877
【发明人】张永亮
【申请人】拉扎斯网络科技(上海)有限公司
【公开日】2016年6月1日
【申请日】2015年12月23日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1