基于OCR和可信结构化数据的信息鉴别方法与流程

文档序号:16504865发布日期:2019-01-05 08:58阅读:来源:国知局

技术特征:

技术总结
本发明涉及一种一种基于OCR和可信结构化数据库的信息鉴别方法,包括:步骤S100,对信息载体(纸)的一个或多个影像进行OCR处理,获得信息载体的主索引内容CI、第一内容向量A=(a1,a2,...,am)和第二内容向量B=(b1,b2,...,bn),其中m和n分别为第一、二内容向量中元素的数量;步骤S200,在可信结构化数据库中使用主索引内容CI进行检索,并将检索获得结果记录中提取第一可信内容向量P=(p1,p2,...,pm)和第二可信内容向量Q=(q1,q2,...,qn);步骤S300,如果A=P,那么执行步骤S400;如果A≠P,那么向用户提示所述影像中呈现的内容为虚假内容;步骤S400,计算B和Q的相似度其中,bqi为bi和qi的相似度,如果SBQ≥D,那么判断所述影像中呈现的内容为真实内容;否则,向用户提示影像中呈现的内容为虚假内容。

技术研发人员:王佩光;杨小蕾;罗奕;朱友卫;林雄建;肖郑海;陈龙;潘盛裕;孟浩
受保护的技术使用者:国网信通亿力科技有限责任公司;国网信息通信产业集团有限公司;国家电网有限公司
技术研发日:2018.08.22
技术公布日:2019.01.04
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1