一种安全生产数字化知识库构建方法、系统、介质及设备与流程

文档序号:33383734发布日期:2023-03-08 07:08阅读:来源:国知局

技术特征:
1.一种安全生产数字化知识库构建方法,其特征在于,包括:步骤1,获取行业国标数据以及岗位数据,基于所述行业国标数据的名称以及岗位数据的名称在不同网站爬取不同类别的数据,并根据类别存入对应数据库;步骤2,对每个数据库进行词频分析,得到每个数据库对应的分析结果;步骤3,将每个数据库对应的分析结果与每个数据库对应的人工抽查结果进行对比,根据对比结果调整每个分析结果在对应数据库中的关系度;步骤4,通过每个分析结果在对应数据库中的关系度,构建安全生产知识图谱;步骤5,通过多个安全生产知识图谱构建安全生产数字化知识库。2.根据权利要求1所述的一种安全生产数字化知识库构建方法,其特征在于,所述在不同网站爬取不同类别的数据,并根据类别存入对应数据库具体过程为:利用网络爬虫爬取数据收集收集安全生产相关法律法规条文,按照第一预设格式将所述安全生产相关法律法规条文存储至第一mongodb数据库;利用网络爬虫爬取安全生产相关行业的新闻资讯,按照第二预设格式将所述新闻咨询保存至第二mongodb数据库;利用网络爬虫爬取行业的安全生产培训视频以及行业的安全生产培训试题,按照第三预设格式将所述安全生产培训试题保存至第三mongodb数据库,按照第四预设格式将所述行业的安全生产培训视频保存至postgresql数据库。3.根据权利要求2所述的一种安全生产数字化知识库构建方法,其特征在于,所述步骤2具体为:获取停用词库,基于所述停用词库对所述第一mongodb数据库、所述第二mongodb数据库、所述第三mongodb数据库以及所述postgresql数据库中的数据进行过滤,通过jieba中文分词组件对过滤后的所述第一mongodb数据库、过滤后的所述第二mongodb数据库、过滤后的所述第三mongodb数据库以及过滤后的所述postgresql数据库进行词频分析,得到过滤后的所述第一mongodb数据库对应的第一分析结果、过滤后的所述第二mongodb数据库对应的第二分析结果、过滤后的所述第三mongodb数据库对应的第三分析结果以及过滤后的所述postgresql数据库对应的第四分析结果。4.根据权利要求3所述的一种安全生产数字化知识库构建方法,其特征在于,所述根据对比结果调整每个分析结果在对应数据库中的关系度具体过程为:将第一分析结果与其对应的第一人工抽查结果进行对比,根据第一对比结果对第一关系度进行优化调整;将第二分析结果与其对应的第二人工抽查结果进行对比,根据第二对比结果对第二关系度进行优化调整;将第三分析结果与其对应的第三人工抽查结果进行对比,根据第三对比结果对第三关系度进行优化调整;将第四分析结果与其对应的第四人工抽查结果进行对比,根据第四对比结果对第四关系度进行优化调整。5.一种安全生产数字化知识库构建系统,其特征在于,包括:存储模块,用于获取行业国标数据以及岗位数据,基于所述行业国标数据的名称以及岗位数据的名称在不同网站爬取不同类别的数据,并根据类别存入对应数据库;
分析模块,用于对每个数据库进行词频分析,得到每个数据库对应的分析结果;调整模块,用于将每个数据库对应的分析结果与每个数据库对应的人工抽查结果进行对比,根据对比结果调整每个分析结果在对应数据库中的关系度;第一构建模块,用于通过每个分析结果在对应数据库中的关系度,构建安全生产知识图谱;第二构建模块,用于通过多个安全生产知识图谱构建安全生产数字化知识库。6.根据权利要求5所述的一种安全生产数字化知识库构建系统,其特征在于,所述在不同网站爬取不同类别的数据,并根据类别存入对应数据库具体过程为:利用网络爬虫爬取数据收集收集安全生产相关法律法规条文,按照第一预设格式将所述安全生产相关法律法规条文存储至第一mongodb数据库;利用网络爬虫爬取安全生产相关行业的新闻资讯,按照第二预设格式将所述新闻咨询保存至第二mongodb数据库;利用网络爬虫爬取行业的安全生产培训视频以及行业的安全生产培训试题,按照第三预设格式将所述安全生产培训试题保存至第三mongodb数据库,按照第四预设格式将所述行业的安全生产培训视频保存至postgresql数据库。7.根据权利要求6所述的一种安全生产数字化知识库构建系统,其特征在于,所述分析模块具体用于:获取停用词库,基于所述停用词库对所述第一mongodb数据库、所述第二mongodb数据库、所述第三mongodb数据库以及所述postgresql数据库中的数据进行过滤,通过jieba中文分词组件对过滤后的所述第一mongodb数据库、过滤后的所述第二mongodb数据库、过滤后的所述第三mongodb数据库以及过滤后的所述postgresql数据库进行词频分析,得到过滤后的所述第一mongodb数据库对应的第一分析结果、过滤后的所述第二mongodb数据库对应的第二分析结果、过滤后的所述第三mongodb数据库对应的第三分析结果以及过滤后的所述postgresql数据库对应的第四分析结果。8.根据权利要求7所述的一种安全生产数字化知识库构建系统,其特征在于,所述根据对比结果调整每个分析结果在对应数据库中的关系度具体过程为:将第一分析结果与其对应的第一人工抽查结果进行对比,根据第一对比结果对第一关系度进行优化调整;将第二分析结果与其对应的第二人工抽查结果进行对比,根据第二对比结果对第二关系度进行优化调整;将第三分析结果与其对应的第三人工抽查结果进行对比,根据第三对比结果对第三关系度进行优化调整;将第四分析结果与其对应的第四人工抽查结果进行对比,根据第四对比结果对第四关系度进行优化调整。9.一种存储介质,其特征在于,所述介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至4中任一项所述的一种安全生产数字化知识库构建方法。10.一种电子设备,其特征在于,包括权利要求9所述的存储介质、执行所述存储介质内的指令的处理器。

技术总结
本发明属于计算机应用技术领域,尤其涉及一种安全生产数字化知识库构建方法、系统、介质及设备。该方法包括:获取行业国标数据以及岗位数据,基于行业国标数据的名称以及岗位数据的名称在不同网站爬取不同类别的数据;对每个数据库进行词频分析;将每个数据库对应的分析结果与每个数据库对应的人工抽查结果进行对比,调整每个分析结果在对应数据库中的关系度;通过每个分析结果在对应数据库中的关系度,构建安全生产知识图谱;通过多个安全生产知识图谱构建安全生产数字化知识库。以知识图谱的存储方式将改变安全知识以点状结构保存不利于业务表现及使用的现象,使得安全生产相关知识内容以知识点及行业的属性串联起来。关知识内容以知识点及行业的属性串联起来。关知识内容以知识点及行业的属性串联起来。


技术研发人员:李进 赵守超 鲍飞 樊延欣 焦玉辉
受保护的技术使用者:中安华邦(北京)安全生产技术研究院股份有限公司
技术研发日:2022.11.24
技术公布日:2023/3/7
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1