用电地址数据处理方法、装置、计算机设备和存储介质与流程

文档序号:17442449发布日期:2019-04-17 04:56阅读:266来源:国知局
用电地址数据处理方法、装置、计算机设备和存储介质与流程

本申请涉及计算机应用领域,特别是涉及一种用电地址数据处理方法、装置、计算机设备和存储介质。



背景技术:

随着网络技术的发展,人们通过网络注册用电地址信息,并利用网络支付电费等,给人们的生活带来了极大的便利。然而,不同用户填写的用电地址信息混乱,填写形式不同,不利于准确定位。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够利于准确定位的用电地址数据处理方法、装置、计算机设备和存储介质。

一种用电地址数据处理方法,所述方法包括:

获取第一用电地址数据;

对所述第一用电地址数据识别,得到用电地址层级化数据;

将所述用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,其中,所述参考地址数据库中存储有参考用电地址数据。

在其中一个实施例中,所述对所述第一用电地址数据识别,得到用电地址层级化数据,包括:

采用地址决策树对所述第一用电地址数据进行分类识别,得到用电地址层级化数据,所述地址决策树是根据用电地址数据进行训练得到的决策树。

在其中一个实施例中,所述将所述用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,包括:

将所述用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,选取置信度最高的参考用电地址数据,将所述置信度最高的参考用电地址数据作为所述第二用电地址数据。

在其中一个实施例中,所述用电地址层级化数据包括多层级用电地址;

所述将所述用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,选取置信度最高的参考用电地址数据,将所述置信度最高的参考用电地址数据作为所述第二用电地址数据,包括:

将所述多层级用电地址中的各级用电地址依次与所述参考地址数据库中的参考用电地址数据进行匹配,得到所述各级用电地址所属的置信度最高的参考用电地址;

将所述各级用电地址所属的置信度最高的参考用电地址组成第二用电地址数据。

在其中一个实施例中,所述多层级用电地址包括省、市、区县、街道、社区、道路名称、道路号、小区标识、楼牌标识和门牌标识。

在其中一个实施例中,所述方法还包括:

获取所述第二用电地址数据对应的地理位置坐标;

在电子地图中将所述第二用电地址数据与所述地理位置坐标关联。

在其中一个实施例中,所述方法还包括:

获取对所述第二用电地址数据的触发指令;

根据所述触发指令进入电子地图界面,并在所述电子地图界面上展示所述第二用电地址数据对应的地理位置。

一种用电地址数据处理装置,所述装置包括:

获取模块,用于获取第一用电地址数据;

识别模块,用于对所述第一用电地址数据识别,得到用电地址层级化数据;

匹配模块,用于将所述用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,其中,所述参考地址数据库中存储有参考用电地址数据。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述用电地址数据处理方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述用电地址数据处理方法的步骤。

上述用电地址数据处理方法、装置、计算机设备和存储介质,通过对获取的第一用电地址数据进行识别,得到用电地址层级化数据,然后将用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,得到第二用电地址数据,将第一用电地址数据转化为准确的参考用电地址数据,方便准确定位。

附图说明

图1为一个实施例中用电地址数据处理方法的应用环境图;

图2为一个实施例中用电地址数据处理方法的流程示意图;

图3为一个实施例中用电地址数据处理方法的框架图;

图4为另一个实施例中用电地址数据处理方法的框架图;

图5为一个实施例中电子地图上显示小区的合围边界线的示意图;

图6为一个实施例中电子地图上显示街道办的合围边界线的示意图;

图7为一个实施例中用电地址数据清单示意图;

图8为一个实施例中用电地址处理装置的结构框图;

图9为另一个实施例中用电地址处理装置的结构框图;

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的用电地址数据处理方法,可以应用于如图1所示的应用环境中。其中,计算机设备102通过网络与服务器104通过网络进行通信。计算机设备102可从服务器104获取用电地址数据进行分析识别,得到用电地址层次化数据,对用电地址层次化数据与参考用电地址数据进行匹配得到匹配的参考用电地址数据,实现了用电地址数据规范化和标准化,保证了数据的准确,方便准确定位。其中,计算机设备102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、便携式可穿戴设备,计算机设备102也可以是单个服务器或服务器集群。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种用电地址数据处理方法,以该方法应用于图1中的计算机设备102为例进行说明,包括以下步骤:

步骤202,获取第一用电地址数据。

其中,第一用电地址数据是指用户根据用电注册请求输入的用电地址数据。该输入的用电地址数据可为文本数据或图像数据。该输入的用电地址数据可包括字、词、数字、字母等中一种或多种。

用户终端访问用电数据服务器,发起用电注册请求,根据该用电注册请求,接收用电数据服务器返回的注册信息填写界面,并展示。用户终端接收用户在注册信息填写界面输入的用电地址数据。例如用电地址数据为广东省深圳市龙岗区保安马六村一巷4号。

具体地,计算机设备从用电数据服务器获取第一用电地址数据。

步骤204,对该第一用电地址数据识别,得到用电地址层级化数据。

其中,用电地址层级化数据是指按照行政区域划分的多层级地址。用电地址层级化数据可包括省、市、区县、街道、社区、道路、道路号、小区、楼牌、门牌等多个层级。

若第一用电地址数据为文本数据,则可采用机器学习识别算法结合参考地址字典库对文本数据进行识别,得到用电地址层级化数据。其中,参考地址字典库用于存储作为参考的地址数据,将行政区域按照字典方式存储,如省、市、区县、街道、社区、道路、道路号、小区、楼牌、门牌等,则省包括该省内的各个市,每个市包括该市内的各个区县,每个区县包括该区县内的各个街道,依次类推。

若第一用电地址数据为图像数据,则可先将图像数据转换为文本数据,然后再采用机器学习识别算法结合参考地址字典库对文本数据进行识别,得到用电地址层级化数据。

机器学习识别算法可包括用电地址频率、信息增益、互信息、卡方统计、期望交叉熵、迭代聚类算法、k近邻算法、cart分类回归算法等。

具体地,计算机设备对第一用电地址数据识别,得到用电地址层级化数据。

步骤206,将该用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,其中,该参考地址数据库中存储有参考用电地址数据。

其中,参考地址数据库用于存储参考用电地址数据。参考用电地址数据是统一编码的用电地址数据。统一编码是指对同一个用电地址有唯一的编码。例如对同一个小区有唯一的名称。参考地址数据库可为行政区域地址数据库或第三方标准地址数据库。

计算机设备将用电地址层级化数据通过机器学习算法与参考地址数据库进行匹配,得到第二用电地址数据。

上述用电地址数据处理方法,通过对获取的第一用电地址数据进行识别,得到用电地址层级化数据,然后将用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,得到第二用电地址数据,将第一用电地址数据转化为准确且唯一的参考用电地址数据,方便准确定位。

在一个实施例中,在获取第一用电地址数据后,还包括:对第一用电地址数据进行预处理,得到预处理后的第一用电地址数据。预处理可包括对第一用电地址数据中的非地址数据进行删除处理。例如第一用电地址数据为广东省深圳市的龙岗区的保安马六村一巷4号,进行预处理可以去除里面的“的”。通过预处理,去掉第一用电地址数据中的噪声,方便后续进行识别。

在一个实施例中,该对该第一用电地址数据识别,得到用电地址层级化数据,包括:采用地址决策树对该第一用电地址数据进行分类识别,得到用电地址层级化数据,该地址决策树是根据用电地址数据进行训练得到的决策树。

首先,获取参考用电地址数据作为样本,进行训练得到地址决策树。通过地址决策树对第一用电地址数据进行分类识别,可以得到用电地址层级化数据。地址决策树可为cart分类回归树。cart分类回归树采用基于最小距离的基尼指数估计函数,用来决定子数据集生成的决策树的拓展形。如果目标变量是标称的,称为分类树;如果目标变量是连续的,称为回归树。回归树是使用树结构算法将数据进行拟合的方法。

地址决策树的生成可包括:获取参考用电地址数据,从参考用电地址数据获取各层级用电地址,将各层级用电地址分别作为对应层级的样本数据,将对应层级的样本数据进行训练,得到各个层级的决策树,将各个层级的决策树组合得到地址决策树。

通过地址决策树对第一用电地址数据进行逐层识别,得到用电地址层级化数据。例如第一用电地址数据为广东省深圳市龙岗区保安马六村一巷4号,通过地址决策树进行分类时,首先对省一级进行决策,确定为广东,再对市一级进行分类,确定类别为深圳,对区一级进行分类,确定为龙岗,对小区一级进行分类,确定为马六村一巷4号。

在一个实施例中,该将该用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,包括:将该用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,选取置信度最高的参考用电地址数据,将该置信度最高的参考用电地址数据作为该第二用电地址数据。

具体地,采用机器学习算法将用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,得到用电地址层级化数据所属的参考用电地址数据的置信度,选择置信度最高的参考用电地址数据作为第二用电地址数据。机器学习算法可包括用电地址频率、信息增益、互信息、卡方统计、期望交叉熵、迭代聚类算法、k近邻算法等。

将第一用电地址数据转换为第二用电地址数据,如表1。

表1

其中,用电地址频率(documentfrequency,df),表示在训练集中包含某个特征项t的用电地址数。这种衡量特征重要程度的方法基于这样一个假设:df较小的特征项对分类结果的影响较小;这种方法优先取df较大的特征项,而df较小的特征项将被剔除。

信息增益(informationgain,ig)通过统计某个特征项在用电地址中出现或不出现的次数来预测用电地址的类别。ig的计算公式如下:

信息增益g(t)反映了特征t对分类混乱程度的降低,也就是对分类的信息量。在实现中通过根据各个特征的信息增益取值排序,并根据设置的阈值选择出合适规模的特征子集。通过信息增益求取用电地址层级化数据中各个层级所属的用电地址,得到第二用电地址数据。

互信息值(mutualinformation,mi),它通过计算特征t和类别c间的相关性来完成提取。计算公式为:

其中,a为t和c同时出现的次数。b为t出现而c没有出现的次数。c为c出现而t没有出现的次数。n为所有用电地址数。如果t和c不相关,则i(t,c)值为0。如果有m个类,于是对于每个t会有m个值,取它们的平均,就可得到特征选取所需的一个线性序。大的i平均值的特征被选取的可能性大。通过互信息值计算用电地址层级化数据与参考用电地址之间的相关性。

χ2统计(chi)方法有和mi方法基本相似的思想,同样通过计算特征t和类别c间的依赖程度来完成提取。如果特征项t和类别c反相关,就说明含有特征项t的用电地址不属于c的概率要大一些,这对于判断用电地址是否不属于类别也是很有指导意义的。为克服这个缺陷,chi使用公式计算特征项t和类别c的相关性。

期望交叉嫡(ce)的定义如下:

其中,pr(ci|t)pr(ci)的意义同信息增益。如果词条和用电地址类别强相关,也就是pr(ci|t)大,且相应的类别出现概率小,则说明词条对分类的影响大,相应的ce值就大,就很可能被选中作为特征项。

期望交叉熵反映了文本类别的概率分布和在出现了某个特定词的条件下文本类别的概率分布之间的距离。

词条t的期望交叉熵越大,对文本类别分布的影响也越大。

同类的用电地址相似度较大,而不同类的用电地址相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文本手工标注类别,因此具有一定的灵活性和较高的自动化处理能力。

一个用电地址表现为一个由字、词和数字组成,可采用最出名的信息检索方面的向量空间模型(vectorspacemodel,vsm),将用电地址表示为加权特征向量d=d(t1,w1;t2,w2;…;tn,wn),然后,通过计算用电地址相似度的方法来确定待分样本的类别。当用电地址被表示为空间向量模型的时候,用电地址的相似度就可以借助特征向量之间的内积来表示。最简单来说一个用电地址可以看成是由若干个单词组成的,每个单词转化成权值以后,每个权值可以看成向量中的一个分量,那么一个用电地址可以看成是n维空间中的一个向量,这就是向量空间模型的由来。单词对应的权值可以通过tf-idf(termfrequency–inversedocumentfrequency,词频-逆文本频率指数)加权技术计算出来。

k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。

k-means算法过程如下:

1)从n个数据对象任意选择k个对象作为初始聚类中心;

2)对于所剩下其它对象,则根据它们与这些聚类中心的相似度,闵可夫斯基距离

分别将它们分配给与其最相似的(聚类中心所代表的)聚类;

3)计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);

4)不断重复这一过程直到标准测度函数开始收敛为止。

k最近邻(knn,k-nearestneighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。

knn算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。knn方法在类别决策时,只与极少量的相邻样本有关。由于knn方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,knn方法较其他方法更为适合。

knn算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权值(weight),如权值与距离成反比。

根据评价指标选择最优模型距离函数一般为闵可夫斯基距离,设

p=(x1,x2,…,xn)q=(y1,y2,…,yn)两点之间的闵可夫斯基距离公式为:

在一个实施例中,该用电地址层级化数据包括多层级用电地址。该多层级用电地址包括省、市、区县、街道、社区、道路名称、道路号、小区标识、楼牌标识和门牌标识等。

该将该用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,选取置信度最高的参考用电地址数据,将该置信度最高的参考用电地址数据作为该第二用电地址数据,包括:将该多级用电地址中的各级用电地址依次与该参考地址数据库中的参考用电地址数据进行匹配,得到该各级用电地址所属的置信度最高的参考用电地址;将该各级用电地址所属的置信度最高的参考用电地址组成第二用电地址数据。

具体地,将多级用电地址中的各级用电地址依次与参考地址数据库中的参考用电地址数据进行匹配,得到该各级用电地址所属不同参考用电地址的置信度,然后从中选取置信度最高的参考用电地址,将每一层级所属的置信度最高的参考用电地址组合在一起形成第二用电地址数据。计算准确,且计算效率高。

例如,用电地址层级化数据包括广东省、深圳市、龙岗区、保安马六村、一巷、4号共6个层级,按照层级从大到小进行逐级匹配,如广东省与广东省匹配的置信度为100%,广东省与广西省匹配的置信度为90%,则选择最高置信度100%的广东省。

在一个实施例中,用电地址数据还可包括用电编号、用户名称、电表编号、虚拟表箱坐标等。用电编号用于唯一标识用电合同的编号。用户名称是指用电地址数据对应的户主的名称。电表编号是用于唯一标识电表的。虚拟表箱坐标为虚拟表箱在电子地图中的坐标。虚拟表箱是对应实体的电表所在的表箱。用电编号、用户名称、电表编号、虚拟表箱坐标四者之间一一对应。

此外,用电地址数据还可包括楼层、房号、建筑面积、室内面积、户型等。

图3为一个实施例中用电地址数据处理方法的框架图。如图3所示,第一用电地址数据为原始地址文本;第二用电地址数据为规范化地址;参考地址数据库采用标准地址库。用电地址数据处理过程包括:获取原始地址文本,对原始地址文本进行初始化处理,去掉噪声等,然后将经过初始化处理的原始地址文本通过机器学习算法结合标准地址字典库进行层次解析,得到地址层级化数据,地址层级化数据包括省、市、区县、街道办、社区、道路、道路号、小区、门牌等,再将地址层级化数据通过机器学习算法与标准地址库中标准地址进行匹配,得到规范化地址。该规范化地址包括市、区县、街道、社区、道路、道路号、小区、楼牌、门牌等。规范化地址是采用标准地址库中的地址数据准确。对于未匹配上的地址,如道路、小区、兴趣点等,通过标准化地址库子流程,导入到机器学习算法层次解析中,结合标准字典库再次解析,得到地址层级化数据,然后将新得到地址层级化数据通过机器学习算法与标准地址库中标准地址进行匹配,如此循环直到原始地址文本中的地址均被解析及匹配到标准地址。

图4为另一个实施例中用电地址数据处理方法的框架图。如图4所示,第一用电地址数据为原始地址文本;第二用电地址数据为规范化地址;参考地址数据库采用标准地址库。用电地址数据处理过程包括:获取原始地址文本,对原始地址文本进行初始化处理,去掉噪声等,然后将经过初始化处理的原始地址文本通过机器学习算法结合标准地址字典库进行层次解析,得到地址层级化数据,地址层级化数据包括省、市、区县、街道办、道路、道路号、小区、门牌等,再将地址层级化数据通过机器学习算法与标准地址库中标准地址进行匹配,得到规范化地址。该规范化地址包括省、市、区县、街道、道路、道路号、小区、楼牌、门牌等。通过匹配的标准地址进一步完善标准地址字典库。规范化地址是采用标准地址库中的地址数据准确。对于未匹配上的地址,如道路、小区、兴趣点等,通过标准化地址库子流程,导入到机器学习算法层次解析中,结合标准地址字典库再次解析,得到地址层级化数据,然后将新得到地址层级化数据通过机器学习算法与标准地址库中标准地址进行匹配,如此循环直到原始地址文本中的地址均被解析及匹配到标准地址。

在一个实施例中,上述用电地址数据处理方法还包括:获取该第二用电地址数据对应的地理位置坐标;在电子地图中将该第二用电地址数据与该地理位置坐标关联。

其中,地理位置坐标可采用地理信息系统(geographicinformationsystem,gis)建立的坐标,利用经纬度作为坐标值。在电子地图中搜索到对应的第二用电地址数据,将第二用电地址数据与对应的地理位置坐标关联。方便可以在电子地图中查看该第二用电地址数据。

在一个实施例中,上述用电地址数据处理方法还包括:获取对该第二用电地址数据的触发指令;根据该触发指令进入电子地图界面,并在该电子地图界面上展示该第二用电地址数据对应的地理位置。

其中,在用电信息填写界面上显示用电地址数据,如广东省深圳市福田区花好园小区3栋806号。该第二用电地址数据配置有链接控件,计算机设备获取到对该第二用电地址数据的触发指令,调用电子地图接口,进入电子地图界面,在电子地图界面上展示该第二用电地址数据对应的地理位置。

在一个实施例中,上述用电地址数据处理方法还包括:接收服务器推送的停电通知。

具体地,当某个用电地址所属的小区需要进行停电处理时,服务器提前预设时间发送停电通知给小区的业主。

在一个实施例中,上述用电地址数据处理方法还包括:统计各个供电区域内的用电地址的用电数据;根据该用电数据确定各个供电区域对应的供电策略。

具体地,供电区域是指供电设备提供电能所划分的区域。一个供电区域可以包括多个小区。首先统计各个供电区域内的用电地址的用电数据,该用电数据可包括用电时间、用电量等,然后根据用电时间和用电量动态配置供电策略。例如,供电区域a和供电区域b,供电区域a内的各个用电地址的用电时间段为19点至24点,则可以通知在1点至18点停电等,供电区域b内的各个用电地址的用电时间段为17点至23点,则可以通知在0点至16点停电等。

通过各个供电区域的用电数据,动态调整供电策略,节省电能供给,保证正常用电。

在一个实施例中,上述用电地址数据处理方法还包括:获取该第二用电地址数据所对应的小区的合围边界线,在电子地图上显示该小区的合围边界线。小区的合围边界线是指小区的边界,通过小区的合围边界线将小区的范围显示出来,可以直观的显示小区的范围,方便查看。如图5所示,在电子地图上显示第二用电地址数据对应的地理位置502以及第二用电地址数据对应的小区的合围边界线504。

在一个实施例中,上述用电地址数据处理方法还包括:获取该第二用电地址数据所对应的街道办的合围边界线,在电子地图上显示该街道办的合围边界线。街道办的合围边界线是指街道办的边界,通过街道办的合围边界线将街道办的范围显示出来,可以直观的显示街道办的范围,方便查看。如图6所示,在电子地图上显示第二用电地址数据对应的地理位置602以及第二用电地址数据对应的街道办的合围边界线604。

在一个实施例中,上述用电地址数据处理方法对第一用电地址数据进行处理得到用电地址层级化数据,以及对用电地址层级化数据进行匹配得到第二用电地址数据。如图7所示,第一用电地址数据包括合同号0944000047472201、用电地址为南山区白石路御景东方2栋17层d室、小区为御景东方、表箱编号为x11620548、区县为南山区沙河街道办。根据机器学习算法自动分解得到包括区、街道办、道路、小区、楼栋、层和门牌等,如南山区、白石路、御景东方、2栋、17层、d室。第二用电地址数据包括合同号0944000047472201、用电地址为南山区白石路御景东方2栋17层d室、小区为御景东方、道路为白石路、楼栋为2栋、门牌号为17层d室。分词时间为2018年10月11日10时10分10秒。分词时间用于记录用电地址数据进行识别时间。

下面结合详细的实施例描述用电地址数据处理方法的过程。一种用电地址数据处理方法包括:

(1)获取第一用电地址数据。

(2)采用地址决策树对该第一用电地址数据进行分类识别,得到用电地址层级化数据,该地址决策树是根据用电地址数据进行训练得到的决策树,该用电地址层级化数据可包括省、市、区县、街道、社区、道路、道路号、小区、楼牌、门牌。

(3)将该多级用电地址中的各级用电地址依次与该参考地址数据库中的参考用电地址数据进行匹配,得到该各级用电地址所属的置信度最高的参考用电地址;将该各级用电地址所属的置信度最高的参考用电地址组成第二用电地址数据。

(4)在电子地图中将该第二用电地址数据与该地理位置坐标关联。

(5)获取对该第二用电地址数据的触发指令;根据该触发指令进入电子地图界面,并在该电子地图界面上展示该第二用电地址数据对应的地理位置。

(6)获取该第二用电地址数据所对应的小区的合围边界线,在电子地图上显示该小区的合围边界线。

上述用电地址处理方法,通过对获取的第一用电地址数据进行识别,得到用电地址层级化数据,然后将用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,得到第二用电地址数据,将第一用电地址数据转化为准确且唯一的参考用电地址数据,方便准确定位;通过置信度选择,计算准确,且自动计算方便;在电子地图上将用电地址数据与地理坐标关联,方便在电子地图上展示,方便查看,并在电子地图上显示小区的合围边界线,方便清楚用电地址所在的区域位置。

应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图8为一个实施例中用电地址处理装置的结构框图。如图8所示,一种用电地址处理装置,包括获取模块802、识别模块804、匹配模块806。

获取模块802用于获取第一用电地址数据。

识别模块804用于对该第一用电地址数据识别,得到用电地址层级化数据。

匹配模块806用于将该用电地址层级化数据与参考地址数据库进行匹配,得到第二用电地址数据,其中,该参考地址数据库中存储有参考用电地址数据。

上述用电地址数据处理装置,通过对获取的第一用电地址数据进行识别,得到用电地址层级化数据,然后将用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,得到第二用电地址数据,将第一用电地址数据转化为准确的参考用电地址数据,方便准确定位。

在一个实施例中,识别模块804还用于采用地址决策树对该第一用电地址数据进行分类识别,得到用电地址层级化数据,该地址决策树是根据用电地址数据进行训练得到的决策树。

在一个实施例中,匹配模块806还用于将该用电地址层级化数据与参考地址数据库中的参考用电地址数据进行匹配,选取置信度最高的参考用电地址数据,将该置信度最高的参考用电地址数据作为该第二用电地址数据。

在一个实施例中,该用电地址层级化数据包括多层级用电地址。

匹配模块806还用于将该多层级用电地址中的各级用电地址依次与该参考地址数据库中的参考用电地址数据进行匹配,得到该各级用电地址所属的置信度最高的参考用电地址;将该各级用电地址所属的置信度最高的参考用电地址组成第二用电地址数据。

在一个实施例中,该多层级用电地址包括省、市、区县、街道、社区、道路名称、道路号、小区标识、楼牌标识和门牌标识。

在一个实施例中,如图9所示,一种用电地址处理装置,除了包括获取模块802、识别模块804、匹配模块806,还包括坐标获取模块808、关联模块810、指令获取模块812、切换模块814和展示模块816。

坐标获取模块808用于获取该第二用电地址数据对应的地理位置坐标。

关联模块810用于在电子地图中将该第二用电地址数据与该地理位置坐标关联。

指令获取模块812用于获取对该第二用电地址数据的触发指令。

切换模块814用于根据该触发指令进入电子地图界面。

展示模块816用于在该电子地图界面上展示该第二用电地址数据对应的地理位置。

本申请实施例还提供了一种计算机设备。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述用电地址数据处理方法的步骤。

本申请实施例还提供了计算机可读存储介质。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述用电地址数据处理方法的步骤。

关于用电地址数据处理装置的具体限定可以参见上文中对于用电地址数据处理方法的限定,在此不再赘述。上述用电地址数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用电地址数据处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用电地址数据处理方法。在其他实施例中,该计算机设备可以是终端。

本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1