一种楼层信息提取方法及系统与流程

文档序号:21409845发布日期:2020-07-07 14:45阅读:1104来源:国知局
本发明涉及物流数据处理
技术领域
:,特别涉及一种楼层信息提取方法及系统。
背景技术
::随着电子商务和互联网技术的不断发展,人们生活节奏不断加快,网络购物消费方式越来越普及,在物流末端的揽派场景中,快递员每天要面对大量的快递收派,其工作强度往往很大。实际具体到每一天、某栋楼、某个快递员,若这栋楼没有设置电梯,那么负责这栋楼的快递员就需要每天携带大量快件通过爬楼梯的方式去派件或者揽件;如果这栋楼没有设置电梯且历史收件或者揽件量还集中在高楼层,那么快递员要完成任务会更加辛苦,而且还不一定能保证快件的时效性;相比其它快递员负责的楼层带电梯的情况,或者快递员负责的快件大概率集中在楼层较低的情况下,这个快递员付出的劳动力显然更大,长期以往,会造成快递员之间劳动力不平衡,目前这种情况下,客户对快递员的辛苦劳动并没有另付费用,鉴于此,如何更好的评估快递员的劳动力成为各行各业亟待解决的问题。目前市面上是通过简单的“数字+楼”的正则匹配方法提取目标地址的楼层,然后通过服务过的楼层情况来评估快递员的劳动力。通过此方法,当快递员每完成一个任务,系统后台就会显示快递员是在几层完成的,然后根据该快递员累积服务过的楼层是否有电梯以及楼层高低就能对快递员的劳动力做出合理的评估,但这种方式因为只仅仅是通过“数字+楼”组合方式去获取楼层,而实际种楼层出现的场景和组合方式是比较复杂的,因此这种方法往往无法返回准确的楼层信息,而且获取速度较慢,更不要说从大规模的文本地址到楼层的批量转换。然而,针对上述问题,现有技术中尚未提出有效的解决方案。技术实现要素:鉴于现有技术中的上述缺陷或不足,期望提供一种楼层信息提取方法及系统,全面考虑海量文本地址出现的场景和组合形式,可以快速、准确地从地址文本信息中提取楼层信息,并可实现地址文本信息到楼层的批量转换。第一方面,本申请提供一种楼层信息提取方法,包括:接收地址信息;识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。第二方面,本申请提供一种楼层信息提取系统,包括:地址模块,用于接收地址信息;识别模块,用于识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。综上,本申请实施例提供的楼层信息提取方法及系统,主要是通过识别地址信息中是否存在第一组合和第二组合,并按照各自组合形式对应的处理方式提取楼层。首先这两种组合覆盖了大部分地址文本楼层出现的场景和组合形式,相比现有技术此方法考虑更加全面;另外,还对地址信息进行删除符号、数字转化为阿拉伯数字的操作,相比简单的通过“数字+楼层”的正则匹配方式来提取楼层的方法,此方法提取楼层的结果更加准确,并且这种楼层信息提取方法可以大大提高从大量文本地址中提取楼层信息的转换速度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请实施例提供的一种楼层信息提取方法的基本流程示意图;图2为本申请实施例提供的一种楼层信息提取方法的完整框架示意图;图3为本申请实施例提供的一种楼层信息提取方法中地址文本的组合形式示例1;图4为本申请实施例提供的一种楼层信息提取方法中地址文本的组合形式示例2;图5为本申请实施例提供的一种楼层信息提取方法中地址文本的组合形式示例3;图6为本申请实施例提供的一种楼层信息提取方法中地址文本的组合形式示例4;图7为本申请实施例提供的一种楼层信息提取系统的基本流程示意图;图8为本申请实施例提供的一种计算机系统。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。本申请实施例提供一种楼层信息提取方法,该方法应用于终端中。需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer,pc)、个人数字助理(personaldigitalassistant,pda)、平板电脑(tabletcomputer)、无线手持设备和手机等。为了便于理解和说明,下面通过图1至图7详细的阐述本申请实施例提供的楼层信息提取方法及系统。请参考图1,其为本申请实施例提供一种楼层地址信息提取方法的基本流程示意图,该方法包括以下步骤:s101,接收地址信息。需要说明的是,地址信息指的是地址文本信息,具体指的是客户通过物流客户端下单时输入的详细通讯地址,经快递员揽件后,这个地址信息就会进入物流公司后台形成运单表。可以理解的是,地址文本信息是只要有客户下单且被快递员揽收就会产生,可以说是时时刻刻在生成,每天下来会有大量的运单表生成。具体的,接收地址信息是指物流公司工作人员对上面生成的运单表进行读取。需要说明的是,读取这个工作可以是定时读取,也可以是实时读取。所谓定时读取,比如每一天早上集中读取一次,就可以对前一天所有的地址文本信息进行楼层提取;所谓实时读取,比如给物流公司的后台系统连接一个实时系统,就可以实时对地址文本信息进行楼层提取。进一步的,可以根据这种楼层地址信息提取方法的实际使用场景选择合适的方式进行运单表中地址文本信息的读取。s102,识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。具体的,第一组合就是根据大量地址文本信息中地址常见的组合顺序或者组合规律,事先将地址文本信息总结划分出几种带有关键字的组合形式,这些组合形式可以覆盖大部分的地址文本信息。进一步的,第一组合包括以下三种组合形式:组合一:建筑物量词、数字和楼层量词的顺序组合;组合二:建筑物量词、数字和房间量词的顺序组合;组合三:建筑物量词、房间量词和数字的顺序组合。进一步的,建筑物量词是指描述建筑物的单位,比如:栋、楼、单元、大厦、座、馆、幢。进一步的,楼层量词是指描述楼层的单位,比如:楼、层、字母(如:a、a、...、z、z)等。进一步的,房间量词是指描述房间的单位,比如:室、号、字母(如:a、a、...、z、z)等。进一步的,在识别第一组合之前,还包括识别地址是否具备信息中第二组合,第二组合包括区域量词和数字,数字在区域量词之后,且数字之后还包括“号”,即为区域量词、数字和号的顺序组合,若识别出存在这种组合方式,则直接将此组合删去,或者替换为格式内容,例如文字、符号等信息,本实施例中,将第二组合替换为“号”。此处理步骤可以提高对识别地址信息中第一组合的效率和准确率。若未出现这种组合,则此步骤不做任何处理。进一步的,区域量词是指描述区域的单位,比如:路,街,坊,村,巷。需要说明的是,若地址文本中出现类似“xxxx栋1201a”时,判定a是楼层量词,还是房间量词,依据是一般楼层通常是小于100层的,所以直接判定此处a就是房间量词,又比如:若地址文本中出现类似“xxxx栋12a”时,则直接判定此处a就是楼层量词。本发明实施例中的楼层量词对应描述的楼层数是两位数字的情况,而对于楼层超过100层的建筑,应先在物流公司后台系统数据库里单独对该建筑进行标定,如果地址文本中出现该建筑名称和“xxxx栋1201a”,则a是楼层量词,还是房间量词,需做进一步做判断,例如北京超过100层的建筑只有两个,这两个建筑的房间号是不是用类似“1201a”来表示的,很容易人工现场发现,通过人工对数据库做数据矫正,反过来在地址文本出现“xxxx栋1201a”时,就可以知道a到底是楼层量词,还是房间量词。具体的,根据所述第一组合获取楼层信息,指的是通过在大量地址文本信息中检索是否存在上述三种组合形式,若结果是肯定的,则按照每种组合形式提取楼层的方法正确提取楼层,若结果是否定的,则返回重新开始。可选的,在识别地址信息中是否存在第二组合之前,可以对地址信息预处理,包括:处理一:删除地址信息中所有的符号:这里的符号指代不表示具体地址信息的任何非文字的符号,包括但不限于“,”、“#”、“@”、“...”、“+”、“&”、“¥”、“%”、“$”、“——”、“?”、“/”等符号,但表示门牌号、单元号、楼号的罗马数字或符号不在此列。处理二:将地址信息中的数字转换为阿拉伯数字:这里的数字包括但不限于汉字大写数字、罗马数字等。当地址信息中出现大写数字、罗马数字等不同形式的数字信息时,将会增加识别信息的难度和识别信息的时间,通过这个步骤处理,将数学内容按照统一形式展现,可以提高对楼层信息识别的准确率和效率。处理三:将地址文本信息中出现的“首”转换成“1”。可以理解的是,预处理步骤结束后的地址信息全部是由汉字、阿拉伯数字和英文字母组成的,是具有一定的组合顺序的或者组合规律的,相比现有技术,可以更加高效、更加准确地提取楼层。为便于更好地理解上述s101、s102,现以一个具体的实现过程为例进行说明。如图2所示,其为本申请实施例提供的一种楼层地址信息提取方法的完整框架示意图。假设以实时读取地址文本信息的应用场景为例,在本实施例中:对应步骤s101,接收地址信息,即实时地读取地址文本信息。可选的,先对地址文本信息进行预处理,包括删除地址文本信息中所有符号,并将数字转化为阿拉伯数字,得到预处理后的地址信息。对应步骤s102,在地址信息中识别是否具备第二组合,即“[路,街,坊,村,巷]+阿拉伯数字+号”这样的组合方式,若出现这种组合方式,则直接将此组合替换为“号”,若未出现这种组合,则此步骤不做任何处理,直接进入后面识别是否存在第一组合的步骤。需要说明的是,若出现“[路,街,坊,村,巷]+阿拉伯数字+号”这种组合方式,将其替换为“号”,也可以替换为其它文字或符号,此处不做限制。对应步骤s102,常见的地址文本组合形式有很多种,依据常见的场景和楼层解析方式,经过上述步骤的处理,开始识别地址信息中是否具备第一组合,根据第一组合包括的三种组合形式提取楼层。进一步的,当识别出存在组合一形式,即建筑物量词、数字和楼层量词的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+1位或2位阿拉伯数字+[楼,层,a,a,...,z,z]”,这种顺序组合的楼层书写方式是最简单、最常见的场景,只需将楼层量词之前的全部数字作为楼层信息。举例说明:如图3所示,其为本实施例提供的一种楼层信息提取方法中地址文本的组合形式示例1,软件产业基地1栋b座12楼,返回“楼”前面的12作为楼层;软件产业基地1栋b座12层,返回“层”前面的12作为楼层;软件产业基地1栋b座12a,返回“a”前面的12作为楼层。另外,如果出现“xxxx楼+1位或2位数字+[楼,层]”的情况,则返回[楼,层]前面的数字,例如:“软件产业基地西1楼12楼”或者“软件产业基地西1楼12层”,则返回12作为楼层。进一步的,当识别出存在组合二形式,即建筑物量词、数字和房间量词的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+3位或4位阿拉伯数字+[室,号,a,a,...,z,z]”,这种顺序组合的楼层书写方式没有明确的“楼”、“层”等字眼,但是根据地址的书写方式,可以总结出“单元”或“座”与“室”中间的数字即为对应的门牌号,也就包含了我们所需的楼层信息,一旦抓取到地址文本中的门牌号,将房间量词之前的数字中的后两位排除后的剩余数字作为楼层信息,具体的,三位数字时返回第一位作为楼层,四位数字时返回前两位作为楼层。举例说明:如图4所示,其为本实施例提供的一种楼层信息提取方法中地址文本的组合形式示例2,广东省深圳市龙华新区东环一路共和新村c区7栋903室,抓取“室”前面的903的第一位数字9作为楼层;广东省深圳市龙岗区万科天誉二期10栋a座1219室,抓取“室”前面的1219的前两位数字12作为楼层;广东省深圳市龙岗区万科天誉二期10栋1219a,抓取“a”前面的1219的前两位数字12作为楼层。需要注意的是,如果地址文本中含有xx酒店、xx宾馆字眼且以特殊数字开头的四位数字取第二位数字作为楼层,例如:xx酒店8311室,则返回“室”前面的8311的第二位3作为楼层,又例如:xx宾馆0311室,则返回“室”前面的0311的第二位3作为楼层。因为一般酒店或宾馆的楼层数不超过10层,且如果房间号是四位数字,往往第一位是特殊数字,常见以“8”或“0”表示,这些是不代表任何意义的。进一步的,当识别出存在组合三,即建筑物量词、房间量词和数字的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+[室,号,a,a,...,z,z]+3位或4位阿拉伯数字”,这种顺序组合的楼层书写方式没有明确的“楼”、“层”等字眼,但是根据地址的书写方式,可以总结出地址文本最后出现的阿拉伯数字即为对应的门牌号,也就包含了我们所需的楼层信息,一旦抓取到地址文本中的门牌号,将阿拉伯数字中的后两位排除后的剩余数字作为楼层信息,具体的,三位数字时返回第一位作为楼层,四位数字时返回前两位作为楼层。举例说明:如图5所示,其为本实施例提供的一种楼层信息提取方法中地址文本的组合形式示例3,广东省深圳市龙华新区东环一路共和新村c区7栋a903,抓取“903”的第一位数字9作为楼层;广东省深圳市龙岗区万科天誉二期10栋a1219,抓取“1219”的前两位数字12作为楼层;江苏省南京市建邺区南湖街道安泰村13栋43号403,抓取“403”的第一位数字4作为楼层。需要注意的是,如果地址文本中含有xx酒店、xx宾馆字眼且以特殊数字开头的四位数字取第二位数字作为楼层,例如:xx酒店8311室,则返回“室”前面的8311的第二位3作为楼层,又例如:xx宾馆0311室,则返回“室”前面的0311的第二位3作为楼层。因为一般酒店或宾馆的楼层数不超过10层,且如果房间号是四位数字,往往第一位是特殊数字,常见以“8”或“0”表示,这些是不代表任何意义的。进一步的,经过对地址文本信息中的组合形式进行识别,发现若没有组合一、组合二、组合三所包含的顺序组合形式,即从字面以上解读不出楼层信息,此时需要返回步骤s101,之所以返回重新开始读取地址文本信息,是为了处理实际地址文本信息中出现的两个“数字+[号,室]”的组合,即每个地址中都存在两组数字,且每组数字都含有“数字+[号,室]”的形式,这种地址文本是很难直接通过提取数字来获取正确的楼层的。因此,利用上下文关键字来辅助解决这个问题,先按照第二组合将地址文本信息中的“[路,街,坊,村,巷]+阿拉伯数字+号”这样的组合直接替换为“号”,再按照步骤s102中所述的三种组合形式的组合场景处理。举例说明,如图6所示,其为本实施例提供的一种楼层信息提取方法中地址文本的组合形式示例4,“广东省深圳市龙华区民康路213号蓝坤大厦902室”中出现“213号”、“902室”两组“数字+[号,室]”的形式,先将“广东省深圳市龙华区民康路213号蓝坤大厦902室”中的“路213号”替换成“号”,即“广东省深圳市龙华区民康号蓝坤大厦902室”,此组合形式符合步骤s102中组合二的形式,直接按照组合二形式对应的处理方式提取出9作为楼层。进一步的,可将图2中所示的一种楼层信息提取方法的完整框架示意图对应的逻辑关系用java语言打包生成hive自定义函数,经测算,调用此自定义函数,在10分钟内可轻松转换1000多万的地址文本信息,利用此方式不仅实现了从大量地址文本信息到楼层的批量转换,而且提高了转换速率。综上,本申请实施例提供的楼层信息提取方法,通过读取地址文本信息,预处理地址文本信息,结合海量的地址文本信息,利用大数据技术,充分考虑地址文本中楼层出现的场景和组合方式,对得到的地址信息中组合形式进行预设的分类,总结出四种组合形式下地址文本中楼层提取的处理方法,这四种组合形式覆盖了大部分地址文本中楼层出现的场景和组合方式,避免了仅仅通过简单的“数字+楼”的组合方式去获取楼层,这种方法相比现有技术,提取楼层的准确度大大提升,而且通过打包成hive自定义函数的方式,成功解决了大量文本地址批量转换的慢速与耗时的问题。基于前述实施例,本申请实施例提供一种楼层信息提取系统,该系统可以应用于图1至图6对应的实施例提供的楼层信息提取方法中。参照图7所示,该楼层信息提取系统包括:地址模块201,用于接收地址信息;识别模块202,用于识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。在本申请的其它实施例中,地址模块201,用于接收地址文本信息。具体的,接收地址信息是指物流公司工作人员对上面生成的运单表进行读取。需要说明的是,读取这个工作可以是定时读取,也可以是实时读取。所谓定时读取,比如每一天早上集中读取一次,就可以对前一天所有的地址文本信息进行楼层提取;所谓实时读取,比如给物流公司的后台系统连接一个实时系统,就可以实时对地址文本信息进行楼层提取。进一步的,可以根据这种楼层地址信息提取方法的实际使用场景选择合适的方式进行运单表中地址文本信息的读取。在本申请的其它实施例中,识别模块202,用于识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。进一步的,第一组合包括以下三种组合形式:组合一:建筑物量词、数字和楼层量词的顺序组合;组合二:建筑物量词、数字和房间量词的顺序组合;组合三:建筑物量词、房间量词和数字的顺序组合。进一步的,当识别出存在组合一,即建筑物量词、数字和楼层量词的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+1位或2位数字+[楼,层,a,a,...,z,z]”,这种顺序组合的楼层书写方式是最简单、最常见的场景,只需将楼层量词之前的全部数字作为楼层信息。进一步的,当识别出存在组合二,即建筑物量词、数字和房间量词的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+3位或4位阿拉伯数字+[室,号,a,a,...,z,z]”,这种顺序组合的楼层书写方式没有明确的“楼”、“层”等字眼,但是根据地址的书写方式,可以总结出“单元”或“座”与“室”中间的数字即为对应的门牌号,也就包含了我们所需的楼层信息,一旦抓取到地址文本中的门牌号,将房间量词之前的数字中的后两位排除后的剩余数字作为楼层信息,具体的,三位数字时返回第一位作为楼层,四位数字时返回前两位作为楼层。进一步的,当识别出存在组合三,即建筑物量词、房间量词和数字的顺序组合时,实际组合形式为:“xxxx[栋,楼,单元,大厦,座,馆,幢]+[室,号,a,a,...,z,z]+3位或4位阿拉伯数字”,这种顺序组合的楼层书写方式没有明确的“楼”、“层”等字眼,但是根据地址的书写方式,可以总结出地址文本最后出现的阿拉伯数字即为对应的门牌号,也就包含了我们所需的楼层信息,一旦抓取到地址文本中的门牌号,将阿拉伯数字中的后两位排除后的剩余数字作为楼层信息,具体的,三位数字时返回第一位作为楼层,四位数字时返回前两位作为楼层。进一步的,经过对地址文本信息进行组合识别,发现若没有组合一、组合二、组合三所包含的顺序组合形式,即从字面以上解读不出楼层信息,此时需要返回步骤s101,之所以返回重新开始读取地址文本信息,是为了处理实际地址文本信息中出现的两个“数字+[号,室]”的组合,即每个地址中都存在两组数字,且每组数字都含有“数字+[号,室]”的形式,这种地址文本是很难直接通过提取数字来获取正确的楼层的。因此,先按照第二组合将地址文本信息中的“[路,街,坊,村,巷]+阿拉伯数字+号”这样的组合直接替换为“号”,再按照步骤s102中所述的三种组合形式的组合场景处理。本申请实施例提供的楼层信息提取方法及系统,通过读取地址文本信息,预处理地址文本信息,结合海量的地址文本信息,利用大数据技术,充分考虑地址文本中楼层出现的场景和组合方式,对得到的地址信息的组合形式进行预设的分类,总结出四种组合形式下地址文本中楼层提取的处理方法,这四种组合形式覆盖了大部分地址文本中楼层出现的场景和组合方式,避免了仅仅通过简单的“数字+楼”的组合方式去获取楼层,这种方法相比现有技术,提取楼层的准确度大大提升,而且通过打包成hive自定义函数的方式,成功解决了大量文本地址批量转换的慢速与耗时的问题。基于前述实施例,本申请实施例提供一种计算机系统。请参照图8所示,该计算机系统300包括中央处理单元(cpu)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储部分加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram303中,还存储有系统操作所需的各种程序和数据。cpu301、rom302以及ram303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。以下部件连接至i/o接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。特别地,根据本申请的实施例,上文参考流程图1~6描述的过程可以被实现为计算机软件程序。例如,本申请的实施例2包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序由cpu301执行,以实现如下步骤:接收地址信息;识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。附图中的流程图和框图,图示了按照本申请各种实施例楼层信息提取的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括地址获取模块、预处理模块及识别模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的终端中所包含的;也可以是单独存在,而未装配入该终端中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该终端执行时,使得该终端实现如上述实施例中的楼层信息提取方法。例如,终端可以实现如图1中所示的:s101,接收地址信息;s102,识别所述地址是否具备信息中第一组合,所述第一组合包括建筑物量词和数字,所述数字在所述建筑物量词之后,根据所述第一组合获取楼层信息。又如,终端可以实现如图2至图6中所示的各个步骤。应当注意,尽管在上文详细描述中提及了用于动作执行的终端的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1