辅助定密方法和装置的制造方法_4

文档序号:9506684阅读:来源:国知局
始指纹段长度计算单元952,用于计算每一个原始指纹段的长度,删除长度小于预设的长度阈值的原始指纹段;
[0113]有效词个数计算单元953,用于计算每一个原始指纹段的有效词个数,删除有效词个数小于预设的有效词个数阈值的原始指纹段;
[0114]已定密指纹段生成单元954,用于将未被删除的原始指纹段作为已定密指纹段。
[0115]所述指纹段匹配单元903包括:
[0116]长度差值计算单元955,用于计算进行对比的待定密指纹段和已定密指纹段的长度差值;
[0117]第一指纹段匹配单元956,用于如果长度差值大于预设的长度差值阈值,对比待定密指纹段和已定密指纹段的文字内容,如果两者其中一个为另一个的子集,则认为所述进行对比的待定密指纹段和已定密指纹段匹配;
[0118]第二指纹段匹配单元957,用于如果长度差值小于预设的长度差值阈值,计算所述进行对比的待定密指纹段与已定密指纹段的编辑距离,如果编辑距离小于预设编辑距离阈值,则认为匹配。
[0119]参阅图11,本发明实施例提供的第四辅助定密单元,包括:
[0120]第二文本向量化单元1001,用于对所述待定密文件进行文本向量化,由所述待定密文件生成对应的待定密样本向量;
[0121]第二相似度计算单元1002,用于将所述待定密样本向量与预先保存的主题空间中的主题矩阵进行相似度计算,计算所述待定密样本向量与每一个主题向量的相似度,所述主题矩阵包括多个主题向量,所述主题向量是对预先保存的已定密文件进行文本向量化得到的,一个所述主题向量对应一个所述已定密文件;
[0122]第四辅助定密意见输出单元1003,用于选择前N个最大的相似度以及N个对应的主题向量所对应的已定密文件的涉密密级、已定密文件的文件内容作为辅助定密意见输出,N为预设的第三阈值。
[0123]本发明实施例所提供的辅助定密装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
[0124]在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0125]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0126]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0127]所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0128]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0129]在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0130]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
【主权项】
1.一种辅助定密方法,其特征在于,所述方法包括: 获得需要进行定密的待定密文件; 采用多个辅助定密方式对所述待定密文件进行辅助定密,得到对应的多个辅助定密意见,其中,所述多个辅助定密方式包括基于待定密文件的所属领域索引其密级具体范围的规定的辅助定密方式、基于待定密文件的定密特征的辅助定密方式、基于待定密文件的文件结构的辅助定密方式以及基于待定密文件的文件主题的辅助定密方式; 接收用户输入的选择指令,所述选择指令包括在多个辅助定密方式中选择的至少一个辅助定密方式; 输出所选择的至少一个辅助定密方式对应的辅助定密意见,以供用户查看。2.根据权利要求1所述的方法,其特征在于,所述基于待定密文件的所属领域索引其密级具体范围的规定的辅助定密方式包括: 接收用户输入的选择指令,所述选择指令包括在多个领域中用户选择的所述待定密文件的所属领域; 判断所述待定密文件的所属领域是否属于涉密领域,若该待定密文件所属领域属于非涉密领域,则将该所属领域对应的密级具体范围的规定作为辅助定密意见输出,若该待定密文件所属领域属于涉密领域,则输出表示该所属领域涉密的辅助定密意见。3.根据权利要求1所述的方法,其特征在于,所述基于待定密文件的定密特征的辅助定密方式包括: 将所述待定密文件与预先保存的定密特征库中的定密特征的定密特征段使用通配符匹配算法进行匹配,所述定密特征段是用户在已定密文件和待定密文件中手动选出并手动消除涉密信息后形成,其中,所述定密特征包括对应该定密特征的经过模糊涉密信息后的定密特征段、定密属性以及定密期限; 将所述定密特征库中的被匹配到的定密特征作为辅助定密意见输出。4.根据权利要求1所述的方法,其特征在于,所述基于待定密文件的文件结构的辅助定密方式包括: 按照预设的分段规则将所述待定密文件分为多段,每一段所述待定密文件为一个对应所述待定密文件的待定密指纹段,所有对应所述待定密文件的待定密指纹段组成对应所述待定密指纹段集合; 将所述待定密指纹段集合中的每一个待定密指纹段逐一与预先保存的指纹库中的对应于已定密文件的已定密指纹段进行对比,所述已定密指纹段是根据多个已定密文件按照预设的分段优化规则得到的,根据每一个已定密文件得到一个或多个所述已定密指纹段; 查找相互匹配的待定密指纹段和已定密指纹段; 计算与同一个所述已定密文件的已定密指纹段相匹配的待定密指纹段在所述待定密指纹段集合中的比例值; 将对应的比例值大于预设的第二阈值的已定密文件的文件名、被待定密指纹段匹配到的属于该已定密文件的已定密指纹段
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1