一种用于同行评议系统合谋对抗攻击样本生成方法及系统

文档序号:33498277发布日期:2023-03-17 21:30阅读:来源:国知局

技术特征:
1.一种用于同行评议系统合谋对抗攻击样本生成方法,其特征在于包括如下步骤:步骤1、收集目标文本和参与评议者中的合谋者文本,并对目标文本和合谋者文本进行文本预处理,得到预处理后的词集;步骤2、从词集中寻找目标攻击词;步骤3、根据目标攻击词构造候选攻击词表;步骤4、根据攻击词表的顺序替换单词,生成对抗样本。2.根据权利要求1所述的用于同行评议系统合谋对抗攻击样本生成方法,其特征在于还包括:分别将所述目标文本和对抗样本输入至同行评议系统,为其分配评议者的结果进行比对,用以评估同行评议系统分配对抗样本的效果。3.根据权利要求1所述的用于同行评议系统合谋对抗攻击样本生成方法,其特征在于步骤1具体方法如下:输入目标文本p的文档p
ori
,合谋评议者的文档r,目标文本的作者r
tar
,收集目标文本的作者r
tar
的文档p
ori
和目标文本p的合谋者r
att
的文档r,对文档p
ori
和文档r进行停用词过滤和词性标准化操作,得到处理后的词集。4.根据权利要求3所述的用于同行评议系统合谋对抗攻击样本生成方法,其特征在于步骤2具体方法如下:结合使用两种方法构造候选攻击词列表,其一是使用同义词词汇表进行查表从而获取攻击目标词,其二是基于语义词典计算单词的相似度获取攻击目标词;具体结合操作如:首先按词频由大到小收集文档p
ori
的词集p
w
,收集合谋评议者文档的词集r
w
,获取词集p
w
的同义词集a
w
,然后将同义词集a
w
和词集r
w
取交集得到再找到词集r
w
中与词集p
w
词意距离差距不超过δ的词作为的补充,得到目标攻击词集。5.根据权利要求4所述的用于同行评议系统合谋对抗攻击样本生成方法,其特征在于步骤3具体方法如下:构建替换词表,通过目标攻击词集构造候选攻击词表,用目标攻击词集中的替换词对(p
w
,r
w
)构成替换词表即得到候选攻击词表所述的替换词对(p
w
,r
w
)中的p
w
为词集p
w
中的词,词集p
w
为词集r
w
中的词。6.根据权利要求5所述的用于同行评议系统合谋对抗攻击样本生成方法,其特征在于步骤4具体方法如下:根据攻击词表的顺序替换单词,生成对抗文本;根据候选攻击词表中的顺序,将文档p
ori
中的词p
w
替换为r
w
,由此迭代得到对抗性文本p
att
,词p
w
表示第w个替换词对中的词;根据设定的α值和词pw计算攻击预算|w

|,|w

|≤p
w
·
α;文档p
ori
中每替换一组词对(p
w
,r
w
),则变量changed累加一次,直到changed大于攻击预算|w

|,返回对抗性样本p
att
。7.一种用于同行评议系统合谋对抗攻击样本生成系统,其特征在于包括:原始分配模块、对抗攻击模块和日志模块;原始分配模块:用于展示目标文本的同行评议分配结果,该模块接收用户输入的目标文本,根据选择的相似度计算方法和分配方法将同行评议分配结果返回;对抗攻击模块:用于模拟在目标文本受到对抗攻击时的效果,该模块接收用户输入的攻击参数α和δ,并获取原始分配模块传入的目标文本,根据对抗样本生成算法对目标文本
进行扰动以构造对抗性样本,返回对抗性样本;日志模块,用于获取原始目标样本和对抗性样本,通过文本差异度量算法将其对比,通过对比指标直观展示对抗攻击的效果。

技术总结
本发明公开了一种用于同行评议系统合谋对抗攻击样本生成方法及系统。本发明主要针对同行评议系统对于文本提交者与评议者合谋,构造对抗性文本从而操纵同行评议分配系统结果的问题,探索了同行评议场景下的合谋对抗攻击的方法,所述方法包括收集目标文本和参与评议者中的合谋者的文本并进行文本预处理;寻找目标攻击词;构造候选的攻击词表;根据攻击词表的顺序替换单词,生成对抗样本。本发明通过将目标文本和合谋者文本的近义词进行同义词和近义词替换,在最小程度上对目标文本的语句进行更改,生成在最大限度上不会引发人类察觉的对抗样本,使得同行评议分配质量降低,提高对抗样本的成功率,并且降低了算法的时间和复杂度。度。度。


技术研发人员:张剑 薛丽敏 吕秋云 王震
受保护的技术使用者:杭州电子科技大学
技术研发日:2022.12.21
技术公布日:2023/3/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1