确定企业所属行业类别的方法及系统与流程

文档序号:11250954阅读:20120来源:国知局
确定企业所属行业类别的方法及系统与流程

本发明涉及企业分类技术领域,具体而言,涉及一种确定企业所属行业类别的方法及系统。



背景技术:

所谓行业,是反映以生产要素组合为特征的各类经济活动。行业是根据人类经济活动的技术特点划分的,即按反映生产力三要素(劳动者、劳动对象、劳动资料)不同排列组合的各类经济活动的特点划分的。

在现代市场经济社会中,需要明确分类的行业及产品所包括的范围。行业分类要从有利于产品生产、销售、经营习惯出发,最大限度地方便生产者、销售者及消费者的需要,并保持行业的分类上的科学性,选择的分类依据要适当,同时应具有科学的系统性。

随着社会的发展,众多小微创新型企业蓬勃发展,社会分工逐步精细化,产品和服务不再像过去一样粗放,提供的是个性化的产品和服务,那么简单的遵从现有的行业分类,已不能对这些小微创新型企业进行区分,那么需要有适应这种个性化发展的行业划分方法及系统。



技术实现要素:

本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此,本发明的一个目的在于提出了一种确定企业所属行业类别的方法。

本发明的另一个目的在于提出了一种确定企业所属行业类别的系统。

有鉴于此,根据本发明的一个目的,提出了一种确定企业所属行业类别的方法,用于服务器,包括:获取行业表述词数据;根据行业表述词数据,确定企业的第一行业类别;获取主营业务数据;根据主营业务数据,确定企业的第二行业类别;获取供应商和/或客户的行业类别数据;根据供应商和/或客户的行业类别数据,确定企业的第三行业类别;根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

本发明提供的确定企业所属行业类别的方法,根据行业表述词对企业进行分类得到企业的第一行业分类,根据企业的主营业务得到企业的第二行业分类,根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。

根据本发明的上述确定企业所属行业类别的方法,还可以具有以下技术特征:

在上述技术方案中,优选地,获取行业表述词数据的步骤,具体包括:接收企业名称;从企业名称中提取所述行业表述词数据。

在该技术方案中,在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。

在上述任一技术方案中,优选地,根据行业表述词数据,确定企业的所述第一行业类别的步骤,具体包括:通过k近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。

在该技术方案中,通过k近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出k个行业表述词,k个行业表述词中多数行业表述词的数据近邻a行业类别,则将a行业类别作为企业的第一行业类别。

在上述任一技术方案中,优选地,根据主营业务数据,确定企业的第二行业类别的步骤,具体包括:接收企业名称;根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。

在该技术方案中,根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。

在上述任一技术方案中,优选地,根据供应商和/或客户的行业类别数据,确定企业的所述第三行业类别的步骤,具体包括:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。

在该技术方案中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。

在上述任一技术方案中,优选地,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别的步骤,具体包括:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

在该技术方案中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。

根据本发明的另一个目的,提出了一种确定企业所属行业类别的系统,用于服务器,包括:获取单元,用于获取行业表述词数据;第一确定单元,用于根据由获取单元获取的所述行业表述词数据,确定企业的第一行业类别;所述获取单元,还用于获取主营业务数据;第二确定单元,用于根据由获取单元获取的所述主营业务数据,确定企业的第二行业类别;获取单元,还用于获取供应商和/或客户的行业类别数据;第三确定单元,用于根据由获取单元获取的供应商和/或客户的行业类别数据,确定企业的第三行业类别;总确定单元,用于根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

本发明提供的确定企业所属行业类别的系统,第一确定单元根据行业表述词对企业进行分类得到企业的第一行业分类,第二确定单元根据企业的主营业务得到企业的第二行业分类,第三确定单元根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再由总确定单元综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。

根据本发明的上述确定企业所属行业类别的系统,还可以具有以下技术特征:

在上述技术方案中,优选地,还包括:接收单元,用于接收企业名称;获取单元,用于从企业名称中提取所述行业表述词数据。

在该技术方案中,获取单元在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。

在上述任一技术方案中,优选地,第一确定单元,具体用于:通过k近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。

在该技术方案中,第一确定单元通过k近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出k个行业表述词,k个行业表述词中多数行业表述词的数据近邻a行业类别,则将a行业类别作为企业的第一行业类别。

在上述任一技术方案中,优选地,还包括:接收单元,用于接收企业名称;第二确定单元,用于根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。

在该技术方案中,第二确定单元根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。

在上述任一技术方案中,优选地,第三确定单元,具体用于:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。

在该技术方案中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。

在上述任一技术方案中,优选地,总确定单元,具体用于:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

在该技术方案中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。

本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;

图2示出了本发明的另一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;

图3示出了本发明的再一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;

图4示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;

图5示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;

图6示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的系统的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。

本发明第一方面的实施例,提出一种确定企业所属行业类别的方法,用于服务器,图1示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:

步骤102,获取行业表述词数据;

步骤104,根据行业表述词数据,确定企业的第一行业类别;

步骤106,获取主营业务数据;

步骤108,根据主营业务数据,确定企业的第二行业类别;

步骤110,获取供应商和/或客户的行业类别数据;

步骤112,根据供应商和/或客户的行业类别数据,确定企业的第三行业类别;

步骤114,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

本发明提供的确定企业所属行业类别的方法,根据行业表述词对企业进行分类得到企业的第一行业分类,根据企业的主营业务得到企业的第二行业分类,根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。

图2示出了本发明的另一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:

步骤202,接收企业名称;

步骤204,从企业名称中提取所述行业表述词数据;

步骤206,通过k近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;

步骤208,将行业表述词数据的类别作为第一行业类别。

在该实施例中,在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。通过k近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出k个行业表述词,k个行业表述词中多数行业表述词的数据近邻a行业类别,则将a行业类别作为企业的第一行业类别。

图3示出了本发明的再一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:

步骤302,获取主营业务数据;

步骤304,根据企业名称,在工商局网站中查询并获取企业的经营范围数据;

步骤306,根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;

步骤308,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。

在该实施例中,根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。

图4示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:

步骤402,获取供应商和/或客户的行业类别数据;

步骤404,根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;

步骤406,将供应商和/或客户的行业类别作为第三行业类别。

在该实施例中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。

图5示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:

步骤502,接收企业名称,从企业名称中提取所述行业表述词数据;

步骤504,通过k近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;

步骤506,将行业表述词数据的类别作为第一行业类别;

步骤508,根据企业名称,在工商局网站中查询并获取企业的经营范围数据;

步骤510,获取主营业务数据,根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;

步骤512,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别;

步骤514,获取供应商和/或客户的行业类别数据,根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别,将供应商和/或客户的行业类别作为第三行业类别;

步骤516,通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

在该实施例中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。

本发明第二方面的实施例,提出一种确定企业所属行业类别的系统600,用于服务器,图6示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的系统600的示意图。其中,该系统包括:

获取单元602,用于获取行业表述词数据;

第一确定单元604,用于根据由获取单元获取的所述行业表述词数据,确定企业的第一行业类别;

获取单元602,还用于获取主营业务数据;

第二确定单元606,用于根据由获取单元获取的所述主营业务数据,确定企业的第二行业类别;

获取单元602,还用于获取供应商和/或客户的行业类别数据;

第三确定单元608,用于根据由获取单元获取的供应商和/或客户的行业类别数据,确定企业的第三行业类别;

总确定单元610,用于根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

本发明提供的确定企业所属行业类别的系统600,第一确定单元604根据行业表述词对企业进行分类得到企业的第一行业分类,第二确定单元606根据企业的主营业务得到企业的第二行业分类,第三确定单元608根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再由总确定单元610综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。

在本发明的一个实施例中,如图6所示,优选地,还包括:接收单元612,用于接收企业名称;获取单元602,用于从企业名称中提取所述行业表述词数据。

在该实施例中,获取单元602在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。

在本发明的一个实施例中,优选地,第一确定单元604,具体用于:通过k近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。

在该实施例中,第一确定单元604通过k近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出k个行业表述词,k个行业表述词中多数行业表述词的数据近邻a行业类别,则将a行业类别作为企业的第一行业类别。

在本发明的一个实施例中,优选地,还包括:接收单元612,用于接收企业名称;第二确定单元606,用于根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。

在该实施例中,第二确定单元606根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。

在本发明的一个实施例中,优选地,第三确定单元608,具体用于:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。

在该实施例中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。

在本发明的一个实施例中,优选地,总确定单元610,具体用于:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。

在该实施例中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1