广告识别规则归纳方法、装置及设备与流程

文档序号:11920786阅读:来源:国知局
技术总结
本发明公开了一种广告识别规则归纳方法、装置及设备。其中,基于第一网址列表生成训练集;根据人工和/或通过广告识别软件进行识别的结果,将训练集中的每个元素标注为广告元素或非广告元素;通过机器学习算法,基于训练集中各元素的广告识别特征及其是否为广告元素的标注结果,得到广告识别模型;基于第二网址列表生成测试集;基于测试集中各元素的广告识别特征,使用广告识别模型识别测试集中的广告元素;对测试集中的广告元素的统一资源定位符进行归纳,得到广告识别规则。此时,可以使用新的广告识别规则来识别页面中的广告元素,也可以将新的广告识别规则和人工标注的规则/广告识别软件的广告识别规则进行结合,来识别页面中的广告元素。

技术研发人员:周志明;丁俊玮
受保护的技术使用者:广州市动景计算机科技有限公司
文档号码:201510768446
技术研发日:2015.11.11
技术公布日:2017.05.17

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1