本发明涉及网络数据监测技术领域,具体为基于人工智能组态的网络数据链安全监测平台。
背景技术:
人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,随着网络时代的进步,人工智能的应用领域不断地扩大,人工智能由不同的领域组成,如机器学习、语言识别、图像识别、自然语言处理和专家系统等,也可以用来对网络数据进行监测,人们会经常性地在网上发布信息或文章,一些热度较高的文章会引来网友们的讨论和评论,然而,并非所有的评论是善意或保持中立的,也会出现一些恶意的评论,会给相关人员带来很大的伤害,为了避免这种情况发生,需要对网上出现的评论进行实时的监测,并对监测到的恶意评论进行及时地处理,所有的评论中都会由核心关键词,通过一定的方法监测出关键词,并利用人工智能技术对其进行机器学习更新机器词库,提高了每次监测恶意评论的有效性,减轻了对相关人员的伤害。
所以,人们需要基于人工智能组态的网络数据链安全监测平台来解决上述问题。
技术实现要素:
本发明的目的在于提供基于人工智能组态的网络数据链安全监测平台,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:基于人工智能组态的网络数据链安全监测平台,其特征在于:所述平台包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块;
所述网络数据截取模块的输出端连接所述热度评估模块的输入端,所述热度评估模块的输出端连接所述热门评论获取模块的输入端,所述热门评论获取模块的输出端连接所述关键词提取模块的输入端,所述关键词库的输出端连接所述关键词提取模块和所述关联匹配模块的输出端,所述关键词提取模块的输出端连接所述关联匹配模块的输入端,所述关联匹配模块的输出端连接所述恶意评论监测模块的输入端,所述恶意评论监测模块的输出端连接所述评论管理模块和所述人工智能学习模块的输入端;
所述网络数据截取模块用于获取网络上的部分文章内容,所述热度评估模块用于评估获取到的文章的热门程度,所述热门评论获取模块用于筛选获取相对热门文章的评论内容,所述关键词提取模块用于提取筛选出评论内容中的关键词,所述关联匹配模块用于匹配所述关键词库中存储的关键词和提取到的关键词特征,所述关键词库中存储有历史评论内容中带有恶意性质的关键词,所述恶意评论监测模块用于依据匹配结果监测评论中带有恶意性质的关键词,所述评论管理模块用于对带有恶意关键词的评论进行禁止发布或传播管理,所述人工智能学习模块用于对所述关键词库未存储的新监测到的关键词进行训练学习并对所述关键词库进行更新。
进一步的,所述热度评估模块对获取到的文章热度评估的依据是内容的初始阅读数、点赞数和评论数加权之和、内容当前的阅读数、点赞数和评论数加权之和、热度衰减速度以及文章发布以来的时长,所述初始阅读数、点赞数和评论数加权之和表示文章的初始热度,所述当前的阅读数、点赞数和评论数加权之和表示文章现在维持的热度。
进一步的,所述网络数据截取模块随机截取网络上的文章内容后,将截取内容传输到所述热度评估模块,所述热度评估模块依据阅读、点赞和评论数对截取到的内容进行热度评估,将评估数据传输到所述热门评论获取模块,所述热门评论获取模块依据评估结果筛选出热度高的文章的评论内容,将评论内容传输到所述关键词提取模块中,所述关键词提取模块调取所述关键词库中的所有关键词,并提取接收到的评论内容中的关键词,将所述关键词库中和评论内容中的关键词输入到所述关联匹配模块中。
进一步的,所述关联匹配模块接收到所述关键词库和评论内容中的关键词后,依据两者的特征匹配和所述关键词库中相似的关键词,将匹配结果传输到所述恶意评论监测模块中,所述恶意评论监测模块依据匹配结果监测评论中带有恶意性质的关键词,将监测结果传输到所述评论管理模块中,所述评论管理模块对带有恶意关键词的评论进行删除和屏蔽处理,所述恶意评论监测模块同时将带有恶意性质的关键词传输到所述人工智能学习模块,所述人工智能学习模块对新监测到的关键词进行训练学习并对所述关键词库进行更新,对带有恶意关键词的评论进行删除或屏蔽处理,避免了恶意评论内容的传播,减轻了对与评论内容相关人员的伤害。
进一步的,所述网络数据截取模块随机截取网络上的文章内容,获取到所有文章内容的初始阅读数集合为a={a1,a2,...,an},当前阅读数集合为a’={a1’,a2’,...,an’},初始评论数集合为b={b1,b2,...,bn},当前评论数集合为b’={b1’,b2’,...,bn’},初始点赞数集合为c={c1,c2,...,cn},当前点赞数集合为c’={c1’,c2’,...,cn’},获取到热度衰减速度集合为v={v1,v2,...,vn},文章发布以来的时长集合为t={t1,t2,...,tn},其中,n表示截取的文章总数,将获取到的数据传输到所述热度评估模块中。
进一步的,通过所述热度评估模块对截取到的内容进行热度评估:根据下列公式分别计算文章内容的初始热度w及当前维持热度w’:
其中,i表示截取到的随机一篇文章序号,根据下列公式计算截取到的内容热度h:
得到所有文章的热度集合:h={h1,h2,...,hn},将评估数据传输到所述热门评论获取模块,所述热门评论获取模块设置有热度阈值h’,将h和h’比较,筛选出大于等于热度阈值h’的文章评论,将筛选出的评论内容传输到所述关键词提取模块中,文章的热度会随着时间的推移而发生衰减,依据初始和当前不同的热度计算文章热度的目的在于更准确地分析文章维持热度能力,为筛选文章评论内容提供重点,减轻了筛选的难度,提高了提取评论关键词的效率。
进一步的,所述关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为a={a1,a2,...,am},其中,m表示筛选出的文章评论中提取的关键词总数,提取到的关键词特征向量坐标集合为
进一步的,所述关联匹配模块对所述关键词库中存储的关键词特征和提取到的关键词特征进行匹配:根据下列公式计算关键词相似系数q:
相似系数越大,说明两者的匹配度越高,设定相似系数阈值为q’,将q与q’相比较:若q≥q',说明所述关键词库和提取到的关键词相似程度高;若q<q',说明所述关键词库和提取到的关键词相似程度低,将比较的结果传输到所述恶意评论监测模块中,根据向量之间的夹角余弦值来计算其相似系数的目的在于确认提取到的关键词与关键词库中词汇的匹配度,提高了恶意评论监测模块识别监测带有恶意性质关键词的评论的效率,为评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽提供有效的帮助。
进一步的,所述恶意评论监测模块将相似系数大于等于阈值q’的关键词进行监测识别,判断关键词是否有恶意性质,将识别到的带有恶意性质关键词的评论内容传输到所述评论管理模块中,所述评论管理模块调整对应的评论内容对他人屏蔽。
进一步的,所述恶意评价监测模块将识别到相似系数大于等于阈值q’并带有恶意性质的关键词传输到所述人工智能学习模块中,所述人工智能学习模块对关键词进行训练学习,将新监测到的与所述关键词库中的对应匹配度高的关键词存储到一起,更新所述关键词库,帮助了对关键词库进行调优和查询优化,提高了每次监测恶意评论的效率。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过网络数据截取模块获取网络上发布的部分文章内容,通过热度评估模块对截取到的内容进行热度评估:由于文章的热度会随着时间的推移而发生衰减变化,根据对应文章的初始和当前的阅读数、评论数和点赞数综合性地评估文章的热门程度提高了热度评估结果的准确性,将评估数据传输到热门评论获取模块,通过与热门评论获取模块中设置的热度阈值进行比较,进一步筛选出热度保持稳定的文章的评论,将筛选出的评论内容传输到关键词提取模块中,通过关键词提取模块提取筛选出的评论内容中出现频率最高的关键词,将之与关键词库中的关键词特征进行比较,通过关联匹配模块匹配出相似度较高的关键词,通过恶意评论监测模块对匹配度高的关键词进行监测识别,判断其是否有恶意性质,通过评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽,有效减轻了网络上的不当言论对相关人员的伤害;
2.本发明通过人工智能学习模块对关键词进行训练学习,将新监测到的与关键词库中的对应匹配度高的关键词存储到一起,更新关键词库,帮助了关键词库进行调优和查询优化,丰富了关键词库中的数据量,提高了每次监测恶意评论的效率,降低了监测关键词的时延。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于人工智能组态的网络数据链安全监测平台的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1,本发明提供技术方案:基于人工智能组态的网络数据链安全监测平台,其特征在于:平台包括:网络数据截取模块、热度评估模块、热门评论获取模块、关键词提取模块、关键词库、关联匹配模块、恶意评论监测模块、评论管理模块和人工智能学习模块;网络数据截取模块的输出端连接热度评估模块的输入端,热度评估模块的输出端连接热门评论获取模块的输入端,热门评论获取模块的输出端连接关键词提取模块的输入端,关键词库的输出端连接关键词提取模块和关联匹配模块的输出端,关键词提取模块的输出端连接关联匹配模块的输入端,关联匹配模块的输出端连接恶意评论监测模块的输入端,恶意评论监测模块的输出端连接评论管理模块和人工智能学习模块的输入端;
网络数据截取模块用于获取网络上的部分文章内容,热度评估模块用于评估获取到的文章的热门程度,热门评论获取模块用于筛选获取相对热门文章的评论内容,关键词提取模块用于提取筛选出评论内容中的关键词,关联匹配模块用于匹配关键词库中存储的关键词和提取到的关键词特征,关键词库中存储有历史评论内容中带有恶意性质的关键词,恶意评论监测模块用于依据匹配结果监测评论中带有恶意性质的关键词,评论管理模块用于对带有恶意关键词的评论进行禁止发布或传播管理,人工智能学习模块用于对关键词库未存储的新监测到的关键词进行训练学习并对关键词库进行更新。
热度评估模块对获取到的文章热度评估的依据是内容的初始阅读数、点赞数和评论数加权之和、内容当前的阅读数、点赞数和评论数加权之和、热度衰减速度以及文章发布以来的时长,初始阅读数、点赞数和评论数加权之和表示文章的初始热度,当前阅读数、点赞数和评论数加权之和表示文章现在维持的热度。
网络数据截取模块随机截取网络上的文章内容后,将截取内容传输到热度评估模块,热度评估模块依据阅读、点赞和评论数对截取到的内容进行热度评估,将评估数据传输到热门评论获取模块,热门评论获取模块依据评估结果筛选出热度高的文章的评论内容,将评论内容传输到关键词提取模块中,关键词提取模块调取关键词库中的所有关键词,并提取接收到的评论内容中的关键词,将关键词库和评论内容中的关键词输入到关联匹配模块中。
关联匹配模块接收到关键词库中和评论内容中的关键词后,依据两者的特征匹配和关键词库中相似的关键词,将匹配结果传输到恶意评论监测模块中,恶意评论监测模块依据匹配结果监测评论中带有恶意性质的关键词,将监测结果传输到评论管理模块中,评论管理模块对带有恶意关键词的评论进行删除和屏蔽处理,恶意评论监测模块同时将带有恶意性质的关键词传输到人工智能学习模块,人工智能学习模块对新监测到的关键词进行训练学习并对关键词库进行更新,对带有恶意关键词的评论进行删除或屏蔽处理,能够避免恶意评论内容的传播并减轻对与评论内容相关人员的伤害。
网络数据截取模块随机截取网络上的文章内容,获取到所有文章内容的初始阅读数集合为a={a1,a2,...,an},当前阅读数集合为a’={a1’,a2’,...,an’},初始评论数集合为b={b1,b2,...,bn},当前评论数集合为b’={b1’,b2’,...,bn’},初始点赞数集合为c={c1,c2,...,cn},当前点赞数集合为c’={c1’,c2’,...,cn’},获取到热度衰减速度集合为v={v1,v2,...,vn},文章发布以来的时长集合为t={t1,t2,...,tn},其中,n表示截取的文章总数,将获取到的数据传输到热度评估模块中。
通过热度评估模块对截取到的内容进行热度评估:根据下列公式分别计算文章内容的初始热度w及当前维持热度w’:
其中,i表示截取到的随机一篇文章序号,根据下列公式计算截取到的内容热度h:
得到所有文章的热度集合:h={h1,h2,...,hn},将评估数据传输到热门评论获取模块,热门评论获取模块设置有热度阈值h’,将h和h’比较,筛选出大于等于热度阈值h’的文章评论,将筛选出的评论内容传输到关键词提取模块中,文章的热度会随着时间的推移而发生衰减,依据初始和当前不同的热度计算文章热度的目的在于更准确地分析文章维持热度能力,为筛选文章评论内容提供重点,便于减轻筛选的难度以提高提取评论关键词的效率。
关键词提取模块提取到筛选出的评论内容中出现频率最高的关键词,对提取到的关键词进行编号,编号集合为a={a1,a2,...,am},其中,m表示筛选出的文章评论中提取的关键词总数,提取到的关键词特征向量坐标集合为
关联匹配模块对关键词库中存储的关键词特征和提取到的关键词特征进行匹配:根据下列公式计算关键词相似系数q:
相似系数越大,说明两者的匹配度越高,设定相似系数阈值为q’,将q与q’相比较:若q≥q',说明关键词库和提取到的关键词相似程度高;若q<q',说明关键词库和提取到的关键词相似程度低,将比较的结果传输到恶意评论监测模块中,根据向量之间的夹角余弦值来计算其相似系数的目的在于确认提取到的关键词与关键词库中词汇的匹配度,便于提高恶意评论监测模块识别监测带有恶意性质关键词的评论的效率,为评论管理模块调整带有恶意性质关键词的评论内容对他人屏蔽提供有效的帮助。
恶意评论监测模块将相似系数大于等于阈值q’的关键词进行监测识别,判断关键词是否有恶意性质,将识别到的带有恶意性质关键词的评论内容传输到评论管理模块中,评论管理模块调整对应的评论内容对他人屏蔽。
恶意评价监测模块将识别到相似系数大于等于阈值q’并带有恶意性质的关键词传输到人工智能学习模块中,人工智能学习模块对关键词进行训练学习,将新监测到的与关键词库中的对应匹配度高的关键词存储到一起,更新关键词库,便于帮助对关键词库进行调优和查询优化,能够提高每次监测恶意评论的效率。
实施例一:网络数据截取模块获取到所有文章内容的初始阅读数集合为a={a1,a2,a3,a4,a5}={1000,500,600,1200,2000},当前阅读数集合为a’={a1’,a2’,a3’,a4’,a5’}={8000,5000,6000,50000,4000},初始评论数集合为b={b1,b2,b3,b4,b5}={20,6,12,18,100},当前评论数集合为b’={20,160,50,200,350},初始点赞数集合为c={c1,c2,c3,c4,c5}={0,30,400,500,60},当前点赞数集合为c’={c1’,c2’,c3’,c4’,c5’}={5,300,400,1000,2000},热度衰减速度集合为v={2,5,6,3,2.1},文章发布以来的时长集合为t={20,10,5,8,30},根据公式
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。