一种电商企业打上地域标签的标准化处理方法及系统与流程

文档序号:18063898发布日期:2019-07-03 03:15阅读:248来源:国知局
一种电商企业打上地域标签的标准化处理方法及系统与流程
本发明涉及统计分析和数据处理领域,具体地说是一种电商企业打上地域标签的标准化处理方法及系统。
背景技术
:统计分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。通过对数据进行统计分析,进而得出相应的结论,这些结论可以帮助人们做出判断,以便采取适当行动。数据处理是对数据的采集、存储、检索、加工、变换和传输,是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节,贯穿于社会生产和社会生活的各个领域,极大地影响着人类社会发展的进程。近几年随着电商平台的大力发展,网上购物已经成为消费者获取商品的主要途径之一。大量的商品和交易产生海量的数据,如何从这海量数据中挖掘消费热点成了当下研究的重点。在电商数据分析中,地域维度分析是其中一个重点。由于各个电商平台对商家要求规则不一。当前,电商平台主要分为三类:b2c、c2c和b2b,其中,b2c主要包括天猫商城、京东商城、苏宁易购、国美在线、当当网和亚马逊(中国)等,c2c主要包括淘宝网,b2b主要包括1688。对于这些平台,企业店铺(俗称b店)成为消费者选择的热点和主体,而企业作为该店铺的所有者,在将企业所在地作为店铺销售数据归属地的前提下,如何将电商企业店铺销售数据合理划归到具体的省市区县成为目前现有技术中急需解决的技术问题。技术实现要素:本发明的技术任务是提供一种电商企业打上地域标签的标准化处理方法及系统,来解决在将企业所在地作为店铺销售数据归属地的前提下,如何将电商企业店铺销售数据合理划归到具体的省市区县的问题。本发明的技术任务是按以下方式实现的,一种电商企业打上地域标签的标准化处理方法,该方法步骤如下:s1、从各大电商平台获取店铺公开显示的店铺企业名称清单;s2、对店铺企业名称进行预处理;s3、根据预处理得到的店铺企业名称清单,结合网上公开的店铺企业工商注册信息,获取店铺企业对应的登记机关、地址和统一社会信用代码;s4、给店铺企业打上省市区县三级地域标签;s5、检查店铺企业名称、店铺企业地域三级标签,确保准确无误;s6、制定特殊地域标签规则;s7、根据店铺企业地域省市区县三级标签,结合政府网站公布的省市区县三级行政区划代码和最新名称,对店铺企业地域省市区县三级名称进行标准化处理;其中,标准化处理包括补全店铺企业地域省市区县三级行政区划代码以及补全或更正店铺企业地域省市区县三级最新名称。作为优选,所述步骤s2中对店铺企业名称进行预处理包括去除无关和错误字符并将字符转化为英文半角字符;其中,无关和错误字符包括空格、乱码和多余文字。更优地,所述步骤s4中给店铺企业打上省市区县三级地域标签具体包括如下方法:(一)、根据店铺企业登记机关获取行政区划三级信息:大量企业根据企业登记机关可以明确得到行政区划三级信息,如企业登记机关为“济南市历城区工商行政管理局”,则给该企业打上地域三级标签分别为山东省、济南市、历城区;(二)、根据店铺企业登记地址获取行政区划三级信息;(三)、根据店铺企业统一社会信用代码获取行政区划三级信息:企业统一社会信用代码中第3-8位为6位行政区划代码信息,根据该行政区划代码能够得到三级行政区划名称,作为企业打上地域三级标签。更优地,所述步骤(二)中根据店铺企业登记地址获取行政区划三级信息分如下两种情况:(1)、登记地址中明确包含三级行政区划信息,则直接提取作为店铺企业三级地域标签;(2)、地址中未明确三级行政区划信息,则需要调用百度地图接口进行处理。更优地,所述步骤(2)中地址中未明确三级行政区划信息,则需要调用百度地图接口进行处理的具体步骤如下:①、根据店铺企业登记地址获取模糊地理位置的经纬度信息;②、根据经纬度信息获取行政区划三级位置信息;③、检查三级位置信息,确认无误后将该三级位置信息作为店铺企业三级地域标签。更优地,所述步骤s6中制定特殊地域标签规则具体包括如下情况:①、直辖市的城市级别行政区划代码和名称为省级行政区划代码和名称;②、省直管区县的城市级别行政区划代码置空,名称根据省级行政区划类型填写对应“某某省/某某自治区直辖”;③、五个不设市辖区地级市的区县级别的行政区划代码和名称均置空。一种电商企业打上地域标签的标准化处理系统,该系统包括,店铺企业名称获取模块,用于从各大电商平台获取店铺公开显示的店铺企业名称清单;店铺企业名称预处理模块,用于对店铺企业名称进行预处理,包括去除无关和错误字符并将字符转化为英文半角字符;其中,无关和错误字符包括空格、乱码和多余文字;店铺企业工商注册信息获取模块,用于根据预处理得到的店铺企业名称清单,结合网上公开的店铺企业工商注册信息,获取店铺企业对应的登记机关、地址和统一社会信用代码;店铺企业三级地域标签划分模块,用于给店铺企业打上省市区县三级地域标签;店铺企业三级地域标签校验模块,用于检查店铺企业名称、店铺企业地域三级标签,确保准确无误;特殊地域标签制定模块,用于制定特殊地域标签规则;店铺企业名称标准化处理模块,用于根据店铺企业地域省市区县三级标签,结合政府网站公布的省市区县三级行政区划代码和最新名称,对店铺企业地域省市区县三级名称进行标准化处理;其中,标准化处理包括补全店铺企业地域省市区县三级行政区划代码以及补全或更正店铺企业地域省市区县三级最新名称。作为优选,所述店铺企业三级地域标签划分模块给企业打上省市区县三级地域标签具体包括如下方法:(一)、根据店铺企业登记机关获取行政区划三级信息:大量企业根据企业登记机关可以明确得到行政区划三级信息,如企业登记机关为“济南市历城区工商行政管理局”,则给该企业打上地域三级标签分别为山东省、济南市、历城区;(二)、根据店铺企业登记地址获取行政区划三级信息;(三)、根据店铺企业统一社会信用代码获取行政区划三级信息:企业统一社会信用代码中第3-8位为6位行政区划代码信息,根据该行政区划代码能够得到三级行政区划名称,作为企业打上地域三级标签。更优地,所述步骤(二)中根据店铺企业登记地址获取行政区划三级信息分如下两种情况:(1)、登记地址中明确包含三级行政区划信息,则直接提取作为店铺企业三级地域标签;(2)、地址中未明确三级行政区划信息,则需要调用百度地图接口进行处理,步骤如下:①、根据店铺企业登记地址获取模糊地理位置的经纬度信息;②、根据经纬度信息获取行政区划三级位置信息;③、检查三级位置信息,确认无误后将该三级位置信息作为店铺企业三级地域标签。作为优选,所述特殊地域标签制定模块制定的特殊地域标签规则具体包括如下情况:①、直辖市的城市级别行政区划代码和名称为省级行政区划代码和名称;②、省直管区县的城市级别行政区划代码置空,名称根据省级行政区划类型填写对应“某某省/某某自治区直辖”;③、五个不设市辖区地级市的区县级别的行政区划代码和名称均置空。本发明的电商企业打上地域标签的标准化处理方法及系统具有以下优点:(一)、电商企业打上标准的地域三级标签后,可以将电商平台店铺销售数据进行地域方面划归,这大大降低了后期电商销售数据在地域维度上分析的难度和复杂度,方便总结出相应的电商销售热点话题和结论,为电商数据分析节约大量时间成本和人力物力成本;(二)、本发明通过对采集得到的电商平台店铺企业数据进行方法和流程设计,将企业数据进行标准化,为企业打上省份、城市和区县三级地域标签,进而方便后续电商数据在地域维度方面的统计和分析;(三)、本发明达到有效利用采集得到的电商企业数据并对企业打上准确的省市区县三级地域标签,进而总结电商平台分地域销售热点的目的,特对电商企业进行地域标准化处理。附图说明下面结合附图对本发明进一步说明。附图1为电商企业打上地域标签的标准化处理方法流程框图;附图2为电商企业打上地域标签的标准化处理系统的结构框图。具体实施方式参照说明书附图和具体实施例对本发明的一种电商企业打上地域标签的标准化处理方法及系统作以下详细地说明。实施例1:如附图1所示,本发明的电商企业打上地域标签的标准化处理方法,该方法步骤如下:s1、从各大电商平台获取店铺公开显示的店铺企业名称清单;s2、对店铺企业名称进行预处理,包括去除无关和错误字符并将字符转化为英文半角字符;其中,无关和错误字符包括空格、乱码和多余文字。s3、根据预处理得到的店铺企业名称清单,结合网上公开的店铺企业工商注册信息,获取店铺企业对应的登记机关、地址和统一社会信用代码;s4、给店铺企业打上省市区县三级地域标签,具体包括如下方法:(一)、根据店铺企业登记机关获取行政区划三级信息:大量企业根据企业登记机关可以明确得到行政区划三级信息,如企业登记机关为“济南市历城区工商行政管理局”,则给该企业打上地域三级标签分别为山东省、济南市、历城区;(二)、根据店铺企业登记地址获取行政区划三级信息,分如下两种情况:(1)、登记地址中明确包含三级行政区划信息,则直接提取作为店铺企业三级地域标签;(2)、地址中未明确三级行政区划信息,则需要调用百度地图接口进行处理,具体步骤如下:①、根据店铺企业登记地址获取模糊地理位置的经纬度信息;②、根据经纬度信息获取行政区划三级位置信息;③、检查三级位置信息,确认无误后将该三级位置信息作为店铺企业三级地域标签。(三)、根据店铺企业统一社会信用代码获取行政区划三级信息:企业统一社会信用代码中第3-8位为6位行政区划代码信息,根据该行政区划代码能够得到三级行政区划名称,作为企业打上地域三级标签。s5、检查店铺企业名称、店铺企业地域三级标签,确保准确无误;s6、制定特殊地域标签规则,具体包括如下情况:①、直辖市的城市级别行政区划代码和名称为省级行政区划代码和名称,如下表:省份城市区县110000北京市110000北京市110101东城区②、省直管区县的城市级别行政区划代码置空,名称根据省级行政区划类型填写对应“某某省/某某自治区直辖”,如下表:省份城市区县650000新疆维吾尔自治区新疆维吾尔自治区直辖659001石河子市460000海南省海南省直辖469021定安县③、五个不设市辖区地级市的区县级别的行政区划代码和名称均置空,如下表:省份城市区县440000广东省442000中山市s7、根据店铺企业地域省市区县三级标签,结合政府网站公布的省市区县三级行政区划代码和最新名称,对店铺企业地域省市区县三级名称进行标准化处理;其中,标准化处理包括补全店铺企业地域省市区县三级行政区划代码以及补全或更正店铺企业地域省市区县三级最新名称。实施例2:如附图2所示,本发明的电商企业打上地域标签的标准化处理系统,该系统包括,店铺企业名称获取模块,用于从各大电商平台获取店铺公开显示的店铺企业名称清单;店铺企业名称预处理模块,用于对店铺企业名称进行预处理,包括去除无关和错误字符并将字符转化为英文半角字符;其中,无关和错误字符包括空格、乱码和多余文字;店铺企业工商注册信息获取模块,用于根据预处理得到的店铺企业名称清单,结合网上公开的店铺企业工商注册信息,获取店铺企业对应的登记机关、地址和统一社会信用代码;店铺企业三级地域标签划分模块,用于给店铺企业打上省市区县三级地域标签,具体包括如下方法:(一)、根据店铺企业登记机关获取行政区划三级信息:大量企业根据企业登记机关可以明确得到行政区划三级信息,如企业登记机关为“济南市历城区工商行政管理局”,则给该企业打上地域三级标签分别为山东省、济南市、历城区;(二)、根据店铺企业登记地址获取行政区划三级信息,分如下两种情况:(1)、登记地址中明确包含三级行政区划信息,则直接提取作为店铺企业三级地域标签;(2)、地址中未明确三级行政区划信息,则需要调用百度地图接口进行处理,步骤如下:①、根据店铺企业登记地址获取模糊地理位置的经纬度信息;②、根据经纬度信息获取行政区划三级位置信息;③、检查三级位置信息,确认无误后将该三级位置信息作为店铺企业三级地域标签。(三)、根据店铺企业统一社会信用代码获取行政区划三级信息:企业统一社会信用代码中第3-8位为6位行政区划代码信息,根据该行政区划代码能够得到三级行政区划名称,作为企业打上地域三级标签。店铺企业三级地域标签校验模块,用于检查店铺企业名称、店铺企业地域三级标签,确保准确无误;特殊地域标签制定模块,用于制定特殊地域标签规则,具体包括如下情况:①、直辖市的城市级别行政区划代码和名称为省级行政区划代码和名称,如下表:省份城市区县110000北京市110000北京市110101东城区②、省直管区县的城市级别行政区划代码置空,名称根据省级行政区划类型填写对应“某某省/某某自治区直辖”,如下表:省份城市区县650000新疆维吾尔自治区新疆维吾尔自治区直辖659001石河子市460000海南省海南省直辖469021定安县③、五个不设市辖区地级市的区县级别的行政区划代码和名称均置空,如下表:省份城市区县440000广东省442000中山市店铺企业名称标准化处理模块,用于根据店铺企业地域省市区县三级标签,结合政府网站公布的省市区县三级行政区划代码和最新名称,对店铺企业地域省市区县三级名称进行标准化处理;其中,标准化处理包括补全店铺企业地域省市区县三级行政区划代码以及补全或更正店铺企业地域省市区县三级最新名称。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1