公司名称的行业分类标签的确定方法和装置的制造方法

文档序号:9489734阅读:1478来源:国知局
公司名称的行业分类标签的确定方法和装置的制造方法
【技术领域】
[0001]本发明涉及数据处理技术,尤其涉及一种公司名称的行业分类标签的确定方法和
目.0
【背景技术】
[0002]公司名称可以在一定程度上反映出这个公司的经验范围以及行业分类,从而可以根据公司名称向该公司推荐与其相关业务。
[0003]现有技术中,只能根据公司的公司名称,随机的确定与这个公司名称对应的行业分类标签。这样随机的确定与这个公司名称对应的行业分类标签,准确率较低,不利于根据该公司的行业分类标签,向这个公司推荐与其相关业务。

【发明内容】

[0004]本发明提供一种公司名称的行业分类标签的确定方法和装置,用以解决现有技术中确定与这个公司名称对应的行业分类标签,准确率较低,不利于根据该公司的行业分类标签,向这个公司推荐与其相关业务的问题。
[0005]本发明的一方面是提供一种公司名称的行业分类标签的确定方法,包括:
[0006]获取待分类的公司名称,提取所述待分类的公司名称中的特征词;
[0007]根据预先分类训练得到的公司名称分类模型,确定所述特征词对应的各第一概率,所述各第一概率表征了特征词属于各行业分类标签的概率;
[0008]根据所述各第一概率,确定所述待分类的公司名称的行业分类标签。
[0009]本发明的另一方面是提供一种公司名称的行业分类标签的确定装置,包括:
[0010]第一获取模块,用于获取待分类的公司名称,提取所述待分类的公司名称中的特征词;
[0011]概率确定模块,用于根据预先分类训练得到的公司名称分类模型,确定所述特征词对应的各第一概率,所述各第一概率表征了特征词属于各行业分类标签的概率;
[0012]分类确定模块,用于根据所述各第一概率,确定所述待分类的公司名称的行业分类标签。
[0013]本发明的技术效果是:通过获取待分类的公司名称,提取待分类的公司名称中的特征词;根据预先分类训练得到的公司名称分类模型,确定特征词对应的各第一概率,各第一概率表征了特征词属于各行业分类标签的概率;根据各第一概率,确定待分类的公司名称的行业分类标签。从而通过确定公司名称与行业分类标签之间的关系,实现了在需要了解大量的公司所属于的行业类别的时候,可以通过本发明提供的方法获知公司名称的行业分类标签,可以有效的提高了获取行业分类标签的准确率,有助于根据公司名称的行业分类标签,向各个公司推荐与其相关的业务。
【附图说明】
[0014]图1为本发明实施例一提供的公司名称的行业分类标签的确定方法的流程图;
[0015]图2为本发明实施例二提供的公司名称的行业分类标签的确定方法的流程图;
[0016]图3为本发明实施例三提供的公司名称的行业分类标签的确定装置的结构示意图;
[0017]图4为本发明实施例四提供的公司名称的行业分类标签的确定装置的结构示意图。
【具体实施方式】
[0018]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019]图1为本发明实施例一提供的公司名称的行业分类标签的确定方法的流程图,如图1所示,本实施例的方法包括:
[0020]步骤101、获取待分类的公司名称,提取待分类的公司名称中的特征词。
[0021]在本实施例中,具体的,获取待分类的公司名称,对待分类的公司名称进行分词处理,可以得到待分类的公司名称中的特征词。例如,待分类的公司名称为“北京某某科技有限公司”,可以得到特征词“北京”、“科技”和“公司”。
[0022]步骤102、根据预先分类训练得到的公司名称分类模型,确定特征词对应的各第一概率,各第一概率表征了特征词属于各行业分类标签的概率。
[0023]在本实施例中,具体的,将步骤101中提取的待分类的公司名称中的特征词,输入到预先分类训练而得到的公司名称分类模型中,可以得到特征词对应的各第一概率,各第一概率表征了特征词属于各行业分类标签的概率,各行业分类标签不相同。
[0024]步骤103、根据各第一概率,确定待分类的公司名称的行业分类标签。
[0025]在本实施例中,具体的,由于步骤102中确定了特征词分别属于多个不同行业分类标签的第一概率,可以选取第一概率的值较大的几个行业分类标签,作为待分类的公司名称的行业分类标签。
[0026]本实施例通过提取待分类的公司名称中的特征词,将特征词输入到预先分类训练得到的公司名称分类模型中,可以确定特征词对应的各第一概率,各第一概率表征了特征词属于各行业分类标签的概率;并且可以根据各第一概率,确定待分类的公司名称的行业分类标签。从而通过确定公司名称与行业分类标签之间的关系,实现了在需要了解大量的公司所属于的行业类别的时候,可以通过本发明提供的方法获知公司名称的行业分类标签,实现自动的确定公司名称的行业分类标签的效果,提高获取行业分类标签的效率,有助于根据公司名称的行业分类标签,向各个公司推荐与其相关的业务。
[0027]图2为本发明实施例二提供的公司名称的行业分类标签的确定方法的流程图,在实施例一的基础上,如图2所示,本实施例的方法中,在步骤101之前,还包括:
[0028]步骤201、获取训练样本数据,训练样本数据中包括公司名称、以及与公司名称对应的行业分类标签。
[0029]在本实施例中,具体的,获取训练样本数据,训练样本数据有不同的公司名称、以及与公司名称对应的该行业分类标签构成。一个公司名称的行业分类标签可以是一个,也可以是多个。例如,公司名称为“北京橙鑫数据科技有限公司”,与它对应的行业分类标签为“科技”;公司名称为“民生银行”,与它对应的行业分类标签为“银行”和“金融”。
[0030]步骤202、提取训练样本数据中的公司名称的特征词。
[0031]在本实施例中,具体的,首先过滤掉公司名称中的标点符号等无用字符,统一格式,可以采用正则表达式去除公司名称中的标点符号等无用字符;然后对训练样本数据中的各公司名称进行分词处理,提取各个公司名称中的特征词,从而可以到由至少一个特征词构成的各公司名称。例如,提取公司名称为“北京橙鑫数据科技有限公司”中的特征词,特征词为“北京”、“橙鑫”、“数据”、“科技”和“公司”;提取公司名称为“民生银行”中的特征词,特征词为“民生”和“银行”;提取公司名称为“某某快捷酒店”中的特征词,特征词为“快捷”和“酒店”。
[0032]步骤203、根据提取了特征词的训练样本数据对公司名称分类模型进行分类训练,得到训练样本数据中的特征词对应的各第二概率,各第二概率表征了训练样本数据中的特征词属于各行业分类标签的概率。
[0033]在本实施例中,具体的,根据步骤202中提取的各公司名称中的各特征词,以及与各公司名称对应的各行业分类
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1