一种启发式的工作岗位分级方法及装置与流程

文档序号:12272550阅读:364来源:国知局
一种启发式的工作岗位分级方法及装置与流程
本发明属于电子人力资源管理和数据挖掘领域,通过构造工作岗位分级规则,自动对工作岗位进行分级。本发明可直接应用在工作岗位管理、分析和推荐中。该发明涉及一种启发式的工作岗位分级方法及装置。
背景技术
:目前的工作岗位分级,主要是针对专业技术岗位和管理岗位进行分类和分级,包含的领域有政府机构、事业单位、咨询公司等传统领域。由于这些领域的岗位名称相对固定,在相当长的时间内岗位名称不会发生变化,因此针对这些领域有固定的岗位分级依据,每一个岗位都有固定的归类和分级。现有的岗位分级和分类主要依靠领域专家人工完成。以互联网为代表的新兴行业的岗位具有周期短、变化快等特点,往往会在短时间内出现较多新的岗位名称,传统的基于人工的和固定式的岗位分级方式不适用于互联网这类的新兴行业。技术实现要素:对于以互联网为代表的新兴行业,由于其工作岗位更新周期短、变化快,使用传统的基于人工的和固定内容的分级方法来判断岗位的级别高低,不但效率低,而且无法满足市场快速发展的需求。本发明设计了一种启发式工作岗位分级方法,利用岗位关键词构造分级规则来判断工作岗位的级别,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。本发明解决其技术问题所采用的技术方案是:首先根据所选行业确定岗位层级,然后结合使用通用词典和行业专用词典对训练集中的工作岗位进行关键词提取,最后通过对提取的关键词进行迭代统计分析生成分级规则。对于新的需要分级的工作岗位,首先同样进行分词处理后提取关键词列表,然后把提取的工作岗位关键词列表按照分级规则进行逐条匹配,满足哪一条分级规则就判断其为该级工作岗位。本发明的出发点是通过工作岗位的关键词列表与分级规则进行匹配来进行岗位分级,关键在于工作岗位的关键词提取和分级规则的制定与匹配。主要包含三个子过程,分别是工作岗位的关键词提取过程、启发式分级规则的制定和分级规则匹配过程。本发明的技术方案为:1)对训练集中的工作岗位进行分词处理,生成每一个工作岗位的关键词列表;2)对岗位关键词进行统计分析,生成工作岗位分级规则;3)对测试集的工作岗位同样进行分词处理,生成每一个工作岗位的关键词列表;4)将待分级的工作岗位的关键词列表与分级规则逐级进行匹配,符合某一条分级规则就将这个工作岗位归类为此级别。在上述技术方案的基础上,本发明还可以做如下改进。进一步,步骤1)中工作岗位的分词处理,具体过程为:(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;(2)将训练集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。进一步,步骤2)中生成工作岗位规则,具体过程为:(1)对工作岗位的关键词列表进行统计分析,使用频率较高的关键词生成分级的基础规则;(2)依据分级的基础规则对训练集的工作岗位进行分级匹配;(3)对分级得到的每一级中的工作岗位的关键词重新进行统计分析,根据相关领域专家的判断,如果高频率关键词列表中出现不合理的关键词,则通过添加新的约束条件对分级结果进行调整以避免出现的不合理现象;(4)依据附有约束条件的基础规则对训练集的工作岗位重新进行分级匹配;(5)迭代执行步骤(3)和(4),直至分级匹配后的工作岗位正确率符合要求,即在每一级的分级结果中,对于设定频率阈值的高频词列表中未出现不合理的关键词;(6)根据基础规则和迭代添加的约束条件生成分级规则。进一步,步骤3)中工作岗位的分词处理,具体过程为:(1)将通用分词词典和行业专用词典进行统一,生成综合分词词典;(2)将测试集的工作岗位应用综合分词词典进行分词处理,得到工作岗位的分词结果;(3)在分词结果中去除与分级无明显相关性或不相关的词语,得到工作岗位的关键词列表。进一步,步骤4)中关键词列表与分级规则逐级匹配,具体过程为:(1)将匹配规则按照其判断准确率的顺序排列,准确率越高的规则匹配时优先权越高;(2)对于每一个工作岗位的关键词列表,按照规则的优先级与分级规则逐条进行匹配;(3)若符合某一条规则,匹配结束并将该工作岗位归类为相应的级别。此外,为解决传统的固定式工作岗位分级方法对于互联网这类新兴行业的不适用性问题,本发明提出了一种启发式的工作岗位分级装置。一种启发式的工作岗位分级装置,包括:工作岗位的关键词提取模块,用于对工作岗位进行自然语言处理并提取关键词列表;启发式分级规则制定模块,用于根据训练集中工作岗位关键词的统计分析结果,迭代生成分级规则;分级规则匹配模块,用于将工作岗位的关键词列表与分级规则逐条进行匹配,若满足某一条规则,则匹配结束,并将该工作岗位归类为此工作岗位级别。本方法的有益效果是:该启发式方法及装置在对互联网这类新兴行业的工作岗位进行分级处理时,在保证准确性的前提下,可以大大提高数据处理的效率,并减少人工操作的成本。以互联网为例,数据涵盖了互联网行业所有主流的公司和工作岗位,具有高度的普遍性和代表性。下面结合数据实例进行分析。数据集信息如表1所示。表1数据集详细参数序号参数数量1用户数1290552工作记录2564913公司数358921根据互联网行业的工作岗位特征,具体分级如表2所示。表2工作岗位分级说明级别序列级别岗位1实习生2工程师3高级工程师、经理4公司高层利用在上述训练数据集上得到的分级规则,对测试的300个互联网工作岗位进行分级,通过领域专家人工对分级结果进行检查,结果显示300个被测岗位中有290个岗位分级正确,10个工作岗位分级结果不合理,正确率为96.7%。实验结果表明所设计的方法不仅正确率较高,且效率远远高于人工手动分级。该方法及装置能够很好的对互联网行业工作岗位进行分级处理,解决了人工分类成本高昂以及固定式分类不适用于互联网这类新兴行业的问题。附图说明下面结合附图和实施例对本方法进一步说明。图1是工作岗位关键词提取过程的流程图。图2是启发式分级规则制定过程的流程图。图3是工作岗位关键词列表与分级规则匹配的流程图。图4是一种启发式的工作岗位分级方法及装置的示意图。具体实施方式以下结合附图对本发明的原理和性质进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明提供一种启发式的工作岗位分级方法,包括三个过程:工作岗位关键词提取过程、启发式分级规则制定过程和工作岗位关键词列表与分级规则匹配过程,以下步骤:工作岗位关键词提取过程,如图1所示,详细过程如下:1)如图步骤S101,对于训练数据上的每一个工作岗位,综合使用通用分词词典和行业专用词典,进行自然语言处理,得到分词的结果;2)如图步骤S102,对于每一个工作岗位的分词结果,去除与判断工作岗位级别不相关或不明显的词语;3)如图步骤S103,将处理后的关键词构造为该工作岗位的关键词列表;启发式分级规则制定过程,如图2所示,详细过程如下:1)如图步骤S201,对分词后的工作岗位关键词列表进行统计分析,按照频率从高到低进行排序;2)如图步骤S202,根据频率较高的关键词生成分级的基础规则;3)如图步骤S203,依据分级的基础规则对训练集的工作岗位进行分级匹配;4)如图步骤S204,对各级岗位中的关键词分别进行统计分析;5)如图步骤S205,根据相关领域专家的判断,如果所有岗位级别的高频率关键词列表中都没有出现不合理的关键词,则转至步骤S208,否则转至步骤S206;6)如图步骤S206,根据每级岗位的高频率关键词列表中的不合理关键词,添加新的约束条件以避免不合理分级的出现;7)如图步骤S207,依据附有约束条件的基础规则对训练集的工作岗位重新进行分级匹配,并跳转至步骤S204;8)如图步骤S208,根据基础规则和迭代添加的约束条件生成分级规则。工作岗位关键词列表与分级规则匹配过程,如图3所示,详细如下:1)如图步骤S301,将工作岗位的关键词列表逐条与分级规则匹配,先与优先级最高的规则1进行匹配;2)如图步骤S302,如果该工作岗位的关键词列表与分级规则1匹配,则跳至步骤S304;3)如图步骤S303,如果该工作岗位的关键词列表与分级规则1不匹配,则继续与下一个优先级的分级规则进行匹配,并跳至步骤S302;4)如图步骤S304,一旦工作岗位的关键词满足某一条分级规则后,则可判定该工作岗位属于这个工作岗位级别。此外,本发明提供一种启发式的工作岗位分级装置,如图4所示,包括三个模块:工作岗位的关键词提取模块、启发式分级规则制定模块和分级规则匹配模块,其中:工作岗位的关键词提取模块101,用于将工作岗位进行自然语言处理后得到关键词列表。启发式分级规则制定模块102,用于根据训练集的工作岗位数据特征迭代生成分级规则。工作岗位关键词列表和分级规则匹配模块103,用于将工作岗位的关键词列表逐条与工作岗位的分级规则进行匹配,从而判断每一个工作岗位分别属于哪一个工作岗位级别。在本实施例中,工作岗位的关键词提取模块101还用于去除工作岗位中的与分级特征不相关或者不明显的词语,从而得到特征明显的关键词列表。工作岗位的关键词提取模块101还用于通过结合通用词典和行业专用词典,生成行业工作岗位专用词典。启发式分级规则制定模块102还用于生成基础规则和约束条件,其中基础规则由第一次关键词统计分析得出,约束条件由分级结果不合理的数据集合迭代产生,最终的分级规则由基础规则和约束条件共同构成。采用了上述基于启发式的工作岗位分级及装置之后,对于以互联网为代表的新兴行业工作岗位的分级过程,对于每一个岗位都采取提取关键词的方式进行分析,并将这个岗位的关键词列表与每一个级别的分级规则按照优先级的顺序进行匹配,从而完成对每一个工作岗位的分级过程。这样的分级方式,可以在保证工作岗位分级正确性的前提下提高分级的效率,解决了互联网这类新兴行业的工作岗位分级困难和效率低的问题。以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1