辅助定密方法和装置的制造方法_5

文档序号:9506684阅读:来源:国知局
以及比例值作为辅助定密意见输出。5.根据权利要求4所述的方法,其特征在于,所述预设的分段优化规则,包括: 根据所述已定密文件中作为语义划分的标点符号将所述已定密文件分为多段,每一段所述已定密文件为一个原始指纹段; 计算每一个原始指纹段的长度,删除长度小于预设的长度阈值的原始指纹段; 计算每一个原始指纹段的有效词个数,删除有效词个数小于预设的有效词个数阈值的原始指纹段; 将未被删除的原始指纹段作为已定密指纹段。6.根据权利要求4所述的方法,其特征在于,查找相互匹配的待定密指纹段和已定密指纹段,包括: 计算进行对比的待定密指纹段和已定密指纹段的长度差值; 如果长度差值大于预设的长度差值阈值,对比待定密指纹段和已定密指纹段的文字内容,如果两者其中一个为另一个的子集,则认为所述进行对比的待定密指纹段和已定密指纹段匹配; 如果长度差值小于预设的长度差值阈值,计算所述进行对比的待定密指纹段与已定密指纹段的编辑距离,如果编辑距离小于预设的编辑距离阈值,则认为匹配。7.根据权利要求1所述的方法,其特征在于,所述基于待定密文件的文件主题的辅助定密方式包括:对所述待定密文件进行文本向量化,由所述待定密文件生成对应的待定密样本向量;将所述待定密样本向量与预先保存的主题空间中的主题矩阵进行相似度计算,计算所述待定密样本向量与每一个主题向量的相似度,所述主题矩阵包括多个主题向量,所述主题向量是对预先保存的已定密文件进行文本向量化得到的,一个所述主题向量对应一个所述已定密文件; 选择前N个最大的相似度以及N个对应的主题向量所对应的已定密文件的涉密密级、已定密文件的文件内容作为辅助定密意见输出,N为预设的第三阈值。8.一种辅助定密装置,其特征在于,所述装置包括: 待定密文件接收单元,用于获得需要进行定密的待定密文件; 辅助定密单元,用于采用多个辅助定密方式对所述待定密文件进行辅助定密,得到对应的多个辅助定密意见; 选择指令接收单元,用于接收用户输入的选择指令,所述选择指令包括在多个辅助定密方式中选择的至少一个辅助定密方式; 辅助定密意见输出单元,用于输出所选择的至少一个辅助定密方式对应的辅助定密意见,以供用户查看; 其中,所述辅助定密单元包括: 第一辅助定密单元,用于采用基于待定密文件的所属领域索引其密级具体范围的规定的辅助定密方式对所述待定密文件进行辅助定密,得到辅助定密意见; 第二辅助定密单元,用于采用基于待定密文件的定密特征的辅助定密方式对所述待定密文件进行辅助定密,得到辅助定密意见; 第三辅助定密单元,用于采用基于待定密文件的文件结构的辅助定密方式对所述待定密文件进行辅助定密,得到辅助定密意见; 第四辅助定密单元,用于采用基于待定密文件的文件主题的辅助定密方式对所述待定密文件进行辅助定密,得到辅助定密意见。9.根据权利要求8所述的装置,其特征在于,所述第一辅助定密单元包括: 行业识别单元,用于接收用户输入的选择指令,所述选择指令包括在多个领域中用户选择的所述待定密文件的所属领域; 第一辅助定密意见输出单元,用于若该待定密文件所属领域属于非涉密领域,则将该所属领域对应的非涉密的密级具体范围的规定作为辅助定密意见输出,若该待定密文件所属领域属于涉密领域,则输出辅助定密意见为“此领域涉密,涉密领域的密级具体范围的规定不予支持”。10.根据权利要求8所述的装置,其特征在于,所述第二辅助定密单元包括: 定密特征匹配单元,用于将所述待定密文件与预先保存的定密特征库中的定密特征的经过模糊涉密信息后的定密特征段使用通配符匹配算法进行匹配,所述定密特征库中的经过模糊涉密信息后的定密特征段是用户在已定密文件和待定密文件中手动选出并手动消除涉密信息后形成的定密特征段,其中,所述定密特征包括对应该定密特征的经过模糊涉密信息后的定密特征段、定密属性以及定密期限; 第二辅助定密意见输出单元,用于将所述定密特征库中的被匹配到的定密特征作为辅助定密意见输出。11.根据权利要求8所述的装置,其特征在于,所述第三辅助定密单元包括: 指纹段生成单元,用于按照预设的分段规则将所述待定密文件分为多段,每一段所述待定密文件为一个对应所述待定密文件的待定密指纹段,所有对应所述待定密文件的待定密指纹段组成对应所述待定密指纹段集合; 指纹段对比单元,用于将所述待定密指纹段集合中的每一个待定密指纹段逐一与预先保存的指纹库中的对应于已定密文件的已定密指纹段进行对比,所述已定密指纹段是根据多个已定密文件按照预设的分段优化规则得到的,根据每一个已定密文件得到一个或多个所述已定密指纹段; 指纹段匹配单元,用于查找相互匹配的待定密指纹段和已定密指纹段; 比例值计算单元,用于计算与同一个所述已定密文件的已定密指纹段相匹配的待定密指纹段在所述待定密指纹段集合中的比例值; 第三辅助定密意见输出单元,用于将对应的比例值大于预设的第二阈值的已定密文件的文件名、被待定密指纹段匹配到的属于该已定密文件的已定密指纹段以及比例值作为辅助定密意见输出。12.根据权利要求11所述的装置,其特征在于,所述指纹段生成单元包括: 原始指纹段生成单元,用于根据所述已定密文件中作为语义划分的标点符号将所述已定密文件分为多段,每一段所述已定密文件为一个原始指纹段; 原始指纹段长度计算单元,用于计算每一个原始指纹段的长度,删除长度小于预设的长度阈值的原始指纹段; 有效词个数计算单元,用于计算每一个原始指纹段的有效词个数,删除有效词个数小于预设的有效词个数阈值的原始指纹段; 已定密指纹段生成单元,用于将未被删除的原始指纹段作为已定密指纹段。13.根据权利要求12所述的装置,其特征在于,所述指纹段匹配单元包括: 长度差值计算单元,用于计算进行对比的待定密指纹段和已定密指纹段的长度差值; 第一指纹段匹配单元,用于如果长度差值大于预设的长度差值阈值,对比待定密指纹段和已定密指纹段的文字内容,如果两者其中一个为另一个的子集,则认为所述进行对比的待定密指纹段和已定密指纹段匹配; 第二指纹段匹配单元,用于如果长度差值小于预设的长度差值阈值,计算所述进行对比的待定密指纹段与已定密指纹段的编辑距离,如果编辑距离小于预设的编辑距离阈值,则认为匹配。14.根据权利要求8所述的装置,其特征在于,所述第四辅助定密单元包括: 第二文本向量化单元,用于对所述待定密文件进行文本向量化,由所述待定密文件生成对应的待定密样本向量; 第二相似度计算单元,用于将所述待定密样本向量与预先保存的主题空间中的主题矩阵进行相似度计算,计算所述待定密样本向量与每一个主题向量的相似度,所述主题矩阵包括多个主题向量,所述主题向量是对预先保存的已定密文件进行文本向量化得到的,一个所述主题向量对应一个所述已定密文件; 第四辅助定密意见输出单元,用于选择前N个最大的相似度以及N个对应的主题向量所对应的已定密文件的涉密密级、已定密文件的文件内容作为辅助定密意见输出,N为预设的第三阈值。
【专利摘要】本发明提供了一种辅助定密方法和装置,涉及保密科学技术领域。采用多个辅助定密方式对待定密文件进行辅助定密,得到对应的多个辅助定密意见,多个辅助定密方式包括基于待定密文件的所属领域索引其密级具体范围的规定的辅助定密方式、基于待定密文件的定密特征的辅助定密方式、基于待定密文件的文件结构的辅助定密方式以及基于待定密文件的文件主题的辅助定密方式。接收用户输入的选择指令,输出用户所选择的至少一个辅助定密方式对应的辅助定密意见。本发明提供的辅助定密方法和装置,对待定密文件从不同的角度进行处理,通过不同的判定方式对同一篇待定密文件分别给出不同辅助定密意见,能够帮助定密工作人员更高效更准确的完成定密工作。
【IPC分类】G06Q10/10
【公开号】CN105260878
【申请号】CN201510613516
【发明人】朱永强, 江雪, 黄筱聪
【申请人】成都网安科技发展有限公司
【公开日】2016年1月20日
【申请日】2015年9月23日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1