基于工作说明书解析的岗位画像标签提取方法及装置

文档序号:35346184发布日期:2023-09-07 19:53阅读:来源:国知局

技术特征:

1.一种基于工作说明书解析的岗位画像标签提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,对所述工作说明书进行预处理,得到预处理后的工作说明书,包括:

3.根据权利要求1所述的方法,其特征在于,根据自然语言处理技术对所述预处理后的工作说明书进行向量化处理,得到向量化后的工作说明书,包括:

4.根据权利要求3所述的方法,其特征在于,根据tf-idf算法对所述预处理后的工作说明书进行关键词提取,包括:

5.根据权利要求1所述的方法,其特征在于,对所述向量化后的工作说明书中的关键词进行模糊计算,得到关键词的模糊因子,包括:

6.根据权利要求5所述的方法,其特征在于,利用所述模糊因子设置模糊聚类的损失函数,包括:

7.根据权利要求5所述的方法,其特征在于,根据基于密度的dbscan算法对分配初始类别后的关键词进行密度聚类,得到每个类别对应的关键词集合,包括:

8.一种基于工作说明书解析的岗位画像标签提取装置,其特征在于,所述装置包括:


技术总结
本申请涉及一种基于工作说明书解析的岗位画像标签提取方法及装置。所述方法包括:获取相关企业岗位的工作说明书;对工作说明书进行预处理,得到预处理后的工作说明书;根据自然语言处理技术对预处理后的工作说明书进行向量化处理,得到向量化后的工作说明书;对向量化后的工作说明书中的关键词进行模糊计算,得到关键词的模糊因子;利用模糊因子设置模糊聚类的损失函数,根据损失函数对关键词进行分配,得到每个关键词所属的初始类别;根据基于密度的DBSCAN算法对分配初始类别后的关键词进行密度聚类,得到每个类别的中心以及中心对应的关键词集合;将关键词集合作为岗位的画像标签。采用本方法能够实现岗位画像标签提取。

技术研发人员:王涛,沈大勇,张忠山,姚锋,刘晓路,杜永浩,闫俊刚,王沛,陈英武,吕济民,何磊,陈宇宁,陈盈果
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1