基于反识别渲染的文本内容识别率测试方法及装置的制造方法_4

文档序号:9810566阅读:来源:国知局
耦合或通信连接,可以是电性,机械或其它的形式。
[0087]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0088]另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以2个或2个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0089]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施方式所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0090]最后应说明的是:以上实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施方式技术方案的精神和范围。
【主权项】
1.一种基于反识别渲染的文本内容识别率测试方法,其特征在于,所述方法包括: 接收关键词和与所述关键词对应的识别率测试样本,所述识别率测试样本为所述关键词和反识别元素的组合; 通过文本内容识别算法计算所述识别率测试样本,以获得所述关键词对应的识别率,其中,所述识别率=成功识别数/识别率测试样本的数量,所述成功识别数为通过所述算法将识别率测试样本识别为所述关键词的数量。2.根据权利要求1所述的基于反识别渲染的文本内容识别率测试方法,其特征在于,“接收关键词和与所述关键词对应的识别率测试样本,所述识别率测试样本为所述关键词和反识别元素的组合”具体包括: 接收关键词; 根据反识别模板将所述关键词渲染为识别率测试样本,所述反识别模板包括反识别元素及反识别元素与所述关键词的对应关系。3.根据权利要求1所述的基于反识别渲染的文本内容识别率测试方法,其特征在于,所述方法还包括: 接收与所述关键词对应的误报关键词,以及与所述误报关键词对应的误报率测试样本,所述误报率测试样本为所述误报关键词和反识别元素的组合; 通过文本内容识别算法计算所述误报率测试样本,以获得所述关键词对应的误报率,其中,所述误报率=误识别数/误报率测试样本的数量,所述误识别数为通过所述算法将所述误报率测试样本识别为所述关键词的数量。4.根据权利要求3所述的基于反识别渲染的文本内容识别率测试方法,其特征在于,“接收与所述关键词对应的误报关键词,以及与所述误报关键词对应的误报率测试样本,所述误报率测试样本为所述误报关键词和反识别元素的组合”具体包括: 接收与所述关键词对应的误报关键词; 根据反识别模板将所述误报关键词渲染为误报率测试样本,所述反识别模板包括反识别元素及反识别元素与所述误报关键词的对应关系。5.根据权利要求4所述的基于反识别渲染的文本内容识别率测试方法,其特征在于,“接收与所述关键词对应的误报关键词”具体包括: 对所述关键词中的至少一个字进行组词,以将所述关键词生成为至少一个误报关键 ο6.根据权利要求3所述的基于反识别渲染的文本内容识别率测试方法,其特征在于,所述方法还包括计算所述反识别渲染文本内容的识别有效性, 所述识别有效性=[识别率+(1-误报率)]/2。7.一种基于反识别渲染的文本内容识别率测试装置,其特征在于,所述装置包括: 样本获取模块,用于接收关键词和与所述关键词对应的识别率测试样本,所述识别率测试样本为所述关键词和反识别元素的组合; 计算模块,用于通过文本内容识别算法计算所述识别率测试样本,以获得所述关键词对应的识别率,其中,所述识别率=成功识别数/识别率测试样本的数量,所述成功识别数为通过所述算法将识别率测试样本识别为所述关键词的数量。8.根据权利要求7所述的基于反识别渲染的文本内容识别率测试装置,其特征在于,所述样本获取模块用于: 接收关键词; 根据反识别模板将反识别元素及反识别元素与所述关键词的对应关系。9.根据权利要求7所述的基于反识别渲染的文本内容识别率测试装置,其特征在于, 所述样本获取模块还用于:接收与所述关键词对应的误报关键所述关键词渲染为识别率测试样本,所述反识别模板包括 词,以及与所述误报关键词对应的误报率测试样本,所述误报率测试样本为所述误报关键词和反识别元素的组合; 所述计算模块还用于:通过文本内容识别算法计算所述误报率测试样本,以获得所述关键词对应的误报率,其中,所述误报率=误识别数/误报率测试样本的数量,所述误识别数为通过所述算法将所述误报率测试样本识别为所述关键词的数量。10.根据权利要求9所述的基于反识别渲染的文本内容识别率测试装置,其特征在于,所述样本获取模块还具体用于: 接收与所述关键词对应的误报关键词; 根据反识别模板将所述误报关键词渲染为误报率测试样本,所述反识别模板包括反识别元素及反识别元素与所述误报关键词的对应关系。11.根据权利要求10所述的基于反识别渲染的文本内容识别率测试装置,其特征在于,所述样本获取模块还具体用于: 对所述关键词中的至少一个字进行组词,以将所述关键词生成为至少一个误报关键 ο12.根据权利要求11所述的基于反识别渲染的文本内容识别率测试装置,其特征在于,所述计算模块还用于: 计算所述反识别渲染文本内容的识别有效性,所述识别有效性=[识别率+(1-误报率)]/2。
【专利摘要】本发明提供一种基于反识别渲染的文本内容识别率测试方法及装置,所述方法包括:接收关键词和与所述关键词对应的识别率测试样本,所述识别率测试样本为所述关键词和反识别元素的组合;通过文本内容识别算法计算所述识别率测试样本,以获得所述关键词对应的识别率,其中,所述识别率=成功识别数/识别率测试样本的数量,所述成功识别数为通过所述算法将识别率测试样本识别为所述关键词的数量。本发明的基于反识别渲染的文本内容识别率测试方法及装置,可实时地对文本内容识别的有效性算法进行测试评估,以通过该测试结果对文本内容识别算法进行优化,不仅提升了文本内容识别算法优化的及时性,也大大的节约了人力成本。
【IPC分类】G06F17/21, G06F17/30
【公开号】CN105574038
【申请号】CN201410549089
【发明人】张翔
【申请人】阿里巴巴集团控股有限公司
【公开日】2016年5月11日
【申请日】2014年10月16日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1