成像性能测试方法、装置、介质及设备与流程

文档序号:29614751发布日期:2022-04-13 11:04阅读:111来源:国知局
成像性能测试方法、装置、介质及设备与流程

1.本技术涉及图像技术领域,具体涉及成像性能测试方法、装置、介质及设备。


背景技术:

2.人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理、机器学习、深度学习等几大方向。随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
3.在图像识别的应用中,识别结果的准确性直接影响产品的可行性与用户的使用体验,而识别结果是否准确除了与模型算法紧密相关,还与拍摄图像的成像设备的成像性能有关。因此为了给基于图像识别的应用或产品选择适配的成像设备,有效准确地衡量成像设备的成像性能成了亟待解决的问题。


技术实现要素:

4.为了有效准确地衡量成像设备的成像性能,本技术提供了成像性能测试方法、装置、介质及设备。所述技术方案如下:
5.第一方面,本技术提供了一种成像性能测试方法,所述方法包括:
6.获取标准测试用例,基于所述标准测试用例得到待测成像设备拍摄的第一测试图像;
7.对所述第一测试图像进行第一文本识别,得到第一识别结果;
8.获取业务测试用例,基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像;
9.对所述第二测试图像进行第二文本识别,得到第二识别结果;
10.根据所述待测成像设备的解析力信息、所述第一识别结果和所述第二识别结果,确定所述待测成像设备的成像性能。
11.第二方面,本技术提供了一种成像性能测试装置,所述装置包括:
12.第一获取模块,用于获取标准测试用例,基于所述标准测试用例得到待测成像设备拍摄的第一测试图像;
13.第一识别模块,用于对所述第一测试图像进行第一文本识别,得到第一识别结果;
14.第二获取模块,用于获取业务测试用例,基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像;
15.第二识别模块,用于对所述第二测试图像进行第二文本识别,得到第二识别结果;
16.成像性能确定模块,用于根据所述待测成像设备的解析力信息、所述第一识别结果和所述第二识别结果,确定所述待测成像设备的成像性能。
17.第三方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并
执行以实现如第一方面所述的一种成像性能测试方法。
18.第四方面,本技术提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由所述处理器加载并执行以实现如第一方面所述的一种成像性能测试方法。
19.第五方面,本技术提供了一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令被处理器执行时实现如第一方面所述的一种成像性能测试方法。
20.本技术提供的成像性能测试方法、装置、介质及设备,具有如下技术效果:
21.本技术提供的方案基于标准测试用例得到待测成像设备拍摄的第一测试图像,进而对第一测试图像进行第一文本识别,得到第一识别结果;同时基于业务测试用例得到待测成像设备拍摄的第二测试图像,进而对第二测试图像进行第二文本识别,得到第二识别结果;最后根据待测成像设备的解析力信息、第一识别结果和第二识别结果,确定待测成像设备的成像性能。在本技术提供的方案中,除了考量生产厂商提供的待测成像设备的解析力信息,还考量了在采用标准测试用例进行测试时基于待测成像设备所拍摄的第一测试图像得到的第一识别结果,以及在采用业务测试用例进行测试时基于待测成像设备所拍摄的第二测试图像得到的第二识别结果,综合上述最终确定该待测成像设备的成像性能,该成像性能既能体现该待测成像设备的基础成像性能,也能体现该待测成像设备在具体业务中的成像性能,使得对成像设备的成像性能的测试更为有效准确。
22.本技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
23.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
24.图1是本技术实施例提供的一种成像性能测试方法的实施环境示意图;
25.图2是本技术实施例提供的一种成像性能测试方法的流程示意图;
26.图3是本技术实施例提供的一种确定第一识别结果的流程示意图;
27.图4是本技术实施例提供的一种进行图像预处理和第一文本识别的流程示意图;
28.图5是本技术实施例提供的一种第一文本识别的流程示意图;
29.图6是本技术实施例提供的另一种第一文本识别的流程示意图;
30.图7是本技术实施例提供的一种获得第二测试图像的流程示意图;
31.图8是本技术实施例提供的一种确定第二识别结果的流程示意图;
32.图9是本技术实施例提供的一种构建关联关系的示意图;
33.图10是本技术实施例提供的一种嵌入了成像设备的产品示意图;
34.图11是本技术实施例提供的一种筛选摄像头的流程示意图;
35.图12是本技术实施例提供的一种摄像头安装位置的示意图;
36.图13是本技术实施例提供的一种模拟拍摄效果的示意图;
37.图14是本技术实施例提供的一种真实拍摄效果的示意图;
38.图15是本技术实施例提供的一种成像性能测试装置的示意图;
39.图16是本技术实施例提供的用于实现一种成像性能测试方法的设备的硬件结构示意图。
具体实施方式
40.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
41.本技术实施例提供的方案涉及人工智能的计算机视觉(computer vision,cv)等技术。
42.计算机视觉技术(computer vision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
43.本技术实施例提供的方案可部署在云端,其中还涉及云技术等。
44.云技术(cloud technology):是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称,可以组成资源池,按需所用,灵活便利。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站,伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,因此云技术需要以云计算作为支撑。云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被
称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。作为云计算的基础能力提供商,会建立云计算资源池平台,简称云平台,一般称为基础设施即服务(iaas,infrastructure as a service),在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(可为虚拟化机器,包含操作系统)、存储设备和网络设备。
45.为了有效准确地衡量成像设备的成像性能,本技术实施例提供了成像性能测试方法、装置、介质及设备。下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
46.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
47.为了便于理解本技术实施例所述的技术方案及其产生的技术效果,本技术实施例对于涉及到的相关专业名词进行解释:
48.解析力:镜头的解析力也叫解像力,解像力表征分辨被摄原物细节的能力。解像力是用来描述缩微摄影系统再现被摄原件细微部分能力的物理量,是影像解像力量评价的重要指标。
49.ocr:optical character recognition,光学字符识别;是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是ocr最重要的课题,icr(intelligent character recognition)的名词也因此而产生。衡量一个ocr系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
50.ctpn:detecting text in natural image with connectionist text proposal network,基于连接预选框网络的文本检测;该算法主要是对图片中的文本行进行准确定位,其基本做法是直接在卷积获得的feature map(特征图)上生成的一系列适当尺寸的文本proposals(预选框),从而进行文本行的检测。
51.textbox:一种基于单深度神经网络的快速文本检测器,借鉴ssd(single shot multibox detector,经典的单阶段目标检测模型之一)的网络用于文字检测。
52.east:an efficient and accurate scene text detector,一种高效准确的场景文本检测模型,这种模型能检测任意角度的文字,且速度较快,同时对英文短单词检测效果
较好。
53.psenet:progressive scale expansion network,渐进式扩展网络,是一种基于语义分割的方法,主要用于检测任意方向的文本,其采用了渐进式尺度扩展的方法用来区分邻近的文本块。首先,能够对任意形状的文本进行定位;其次,提出了一种渐进的尺度扩展算法,该算法可以成功地识别相邻文本块,即可以精确地检测任意形状的文本,并且准确地将文本实例紧密地分开。
54.dbnet:differentiable binarization network,可微二值化网络,可以在分割网络中执行二值化过程,可以自适应地设置二值化阈值,不仅简化了后处理,而且提高了文本检测的性能。
55.crnn:convolutional recurrent neural network,卷积递归神经网络,是一种端到端的文字识别的网络
56.注意力机制:attention mechanism,是机器学习中的一种数据处理方法,广泛应用在自然语言处理、图像识别及语音识别等各种不同类型的机器学习任务中。
57.lstm:long short-term memory,长短期记忆网络,是一种时间循环神经网络。
58.ctc:是一种损失计算方法,用ctc代替softmax loss,训练样本无需对齐。
59.请参阅图1,其为本技术实施例提供的一种成像性能测试方法的实施环境示意图,如图1所示,该实施环境可以至少包括客户端01和服务器02。
60.具体的,所述客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、车载终端、数字助理、智能可穿戴设备、监控设备及语音交互设备等类型的设备,也可以包括运行于设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,所述客户端01上安装有成像设备,如摄像头、扫描仪等,可以在采用标准测试用例进行测试时,得到成像设备所拍摄的第一测试图像,以及在采用业务测试用例进行测试时,得到成像设备所拍摄的第二测试图像。
61.具体的,所述服务器02可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。所述服务器02可以包括有网络通信单元、处理器和存储器等等。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。具体的,所述服务器02可以用于基于所述客户端得到的第一测试图像和第二测试图像分别进行第一文本识别和第二文本识别,对应得到第一识别结果和第二识别结果,进而可以根据成像设备的解析力信息、第一识别结果和第二识别结果,确定该成像设备的成像性能。
62.在另一种可行的实施方式中,所述客户端01对第二测试图像进行第二文本识别,得到第二识别结果,该第二文本识别方法基于所述客户端01中运行的识别算法。
63.本技术实施例还可以结合云技术实现,云技术(cloud technology)是指在广域网或局域网内将硬件、软件及网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术,也可理解为基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术及应用技术等的总称。云技术需要以云计算作为支撑。云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取
计算力、存储空间和信息服务。提供资源的网络被称为“云”。具体地,所述服务器02和数据库位于云端,所述服务器02可以是实体机器,也可以是虚拟化机器。
64.以下介绍本技术提供的一种成像性能测试方法。图2是本技术实施例提供的一种成像性能测试方法的流程图,本技术提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。请参照图2,本技术实施例提供的一种成像性能测试方法可以包括如下步骤:
65.s210:获取标准测试用例,基于所述标准测试用例得到待测成像设备拍摄的第一测试图像。
66.可以理解的是,在智能终端设备上大多使用了摄像头组件,从而为用户提供拍照等相关的功能,同时摄像头拍摄的图片还会应用在图片处理及图片识别的业务场景中,比如ocr识别、目标检测及分类等。在图像识别的应用中,识别结果的准确性直接影响应用或产品的可行性与用户的使用体验,而识别结果是否准确除了与图像识别的模型算法紧密相关,还与拍摄图像的成像设备的成像性能有关。因此为了给基于图像识别的应用或产品选择适配的成像设备,有必要对成像设备的成像性能进行有效准确地衡量,尤其是在细化的垂直应用领域或是嵌入了成像设备的产品设备的结构较为特殊的情况下,示例性的,如果摄像头是斜着安装在产品设备上面,摄像头会和被拍摄对象形成一定的夹角,被拍摄对象四周相对于摄像头的角度和距离都是变化的,很难通过摄像头的解析力来直接判断摄像头是否满足产品设备的需求。
67.在本技术实施例中,获取标准测试用例,利用待测成像设备对该标准测试用例进行拍摄,得到对应的第一测试图像。其中,标准测试用例可以是在一定类型的业务中与理想化或常规化的业务场景对应的测试用例,例如,对于面向教育辅助的图像识别业务,产品设备中嵌入的摄像头所要拍摄的一般是书本、试卷等纸张,则在对产品设备中嵌入的摄像头的成像性能进行测试时,标准测试用例可以指定纸张的尺寸、字体、行高、间距等要素,如采用字体为5号、行间距为30的a4纸张。进一步地,标准测试用例除了限定所拍摄对象的参数,还可以指定所拍摄的环境参数,例如光线亮度、色温等,本技术实施例对此不作赘述。
68.s220:对所述第一测试图像进行第一文本识别,得到第一识别结果。
69.在本技术实施例中,对基于标准测试用例得到的第一测试图像进行第一文本识别,得到第一识别结果,该第一识别结果表征对第一测试图像的识别准确性,隐含地,该第一识别结果也与待测成像设备的成像性能有关,且由于是采用标准测试用例进行测试,故得到的第一识别结果可以表征待测成像设备基础的成像性能。不同配置的成像设备对于同一标准测试用例拍摄得到的第一测试图像存在差异,进而对多个第一测试图像进行相同的第一文本识别的处理,对应得到第一识别结果,多个第一测试图像对应的第一识别结果的差异,也体现了不同配置的成像设备在成像性能上的差异。
70.在本技术的一个实施例中,对第一测试图像进行图像预处理以及对预处理后的图像进行预设方式的第一文本识别,得到第一识别结果。具体的,如图3所示,步骤s220可以包括以下步骤:
71.s221:对所述第一测试图像进行图像预处理,得到第一待识别图像。
72.具体地,图像预处理可以包括:对所述第一测试图像进行尺度变化处理或畸变矫正处理,得到所述第一待识别图像。其中尺度变化处理包括但不限于图像的缩放和尺寸的裁剪;由于透镜制造精度以及组装工艺的偏差会引入畸变,导致原始图像的失真,因此必要时还需要进行畸变校正处理。
73.示例性的,如果摄像头是斜着安装在产品设备上面,且摄像头和被拍摄对象形成一定的夹角,靠近摄像头一端的图像内容会比远离摄像头一端的图像内容更为清楚,且为了拍摄完整的内容信息,第一测试图像中还覆盖了一些无关要素,如放置纸张的桌面等,因此在这种情况下,图像的预处理可以有效保留关键信息。
74.s223:对所述第一待识别图像进行第一文本识别,得到所述第一识别结果,所述第一识别结果表征对所述第一测试图像的文本识别准确性。
75.具体地,所述第一文本识别可以是基于人工智能的光学符号识别方式。基于人工智能中的文本检测算法和文本识别算法,得到第一待识别图像中的候选文本,该候选文本为识别出的文本内容,进而将候选文本和该标准测试用例对应的标准文本进行比对,得到第一识别结果,第一识别结果可以表征对第一测试图像的文本识别准确性。
76.在一种可行的实施方式中,如图4所示,对于采用a4纸张的标准测试用例,首先调用产品设备中的待测成像设备—相机进行拍照并获取到原始图像数据,也即第一测试图像,该第一测试图像的图像格式可以为jpeg(joint photographic experts group,一种图像文件格式),并通过字节数组的形式保存第一测试图像的图像信息;其次在图像预处理阶段,将原始图像数据的字节数组解码为可编辑的数据类型,如bitmap(位图)或mat(计算机视觉中用来存储图像信息的内存对象),接着进行图像的裁剪、缩放或畸形矫正,即可以裁剪掉图像中拍摄到的产品设备部分或者桌面部分等,仅保留作为标准测试用例的a4纸范围内的内容,然后再进行缩放,将图像缩放至后台服务器可接受的尺寸,如果图像发生了变形,还会做进一步地畸形矫正,得到一张只有有效a4内容的图像;最后将图像进行编码压缩上传至提供ocr识别服务的服务器进行图像中的文本识别,并由服务器根据识别出的文本内容和标准测试用例中的真实文本内容进行比对,得到对应于原始图像数据的第一识别结果。
77.在本技术的另一个实施例中,所述第一文本识别可以是基于人工智能的光学符号识别,主要采用了基于人工智能中的文本检测算法和文本识别算法。具体地,如图5所示,步骤s223可以包括以下步骤:
78.s2231:将所述第一待识别图像输入文本检测网络,进行文本检测处理,得到所述第一待识别图像对应的第一文本特征信息。
79.具体地,文本检测方法一般可以分为基于回归的文本检测方法和基于分割的文本检测方法。其中基于回归的文本检测算法可以采用基于候选框回归的ctpn模型算法、textbox模型算法和east模型算法,这类算法对规则形状文本检测效果较好;另外还可以采用基于像素值回归的方法,主要有craft和sa-text,主这类算法对弯曲文本或者小文本的检测效果较好;此外,基于分割的文本检测方法可以采用psenet模型算法、dbnet模型算法等,这类算法不受文本形状的限制,对各种形状的文本都能取得较好的效果。优选地,可以将基于候选框回归的模型算法和基于分隔的模型算法相结合,先确定包含文本内容的候选
区域,进而对候选区域内的文本进行分割,得到单位字符的集合,单位字符可以为单个汉字、单个英文字符或单个数字字符等。两者相结合的方式能够进一步地提高文本检测效果。
80.s2232:将所述第一文本特征信息输入至文本识别网络,进行文本识别处理,得到所述第一待识别图像对应的第一文本识别信息。
81.具体地,文本识别方法可以包括基于crnn的ocr识别方法和基于注意力机制(attention)的ocr识别方法。其中基于crnn的ocr识别方法引入了lstm+ctc的模型结构来解决不定长序列对齐问题;基于注意力机制(attention)的ocr识别方法参考了encoder-decoder(编码器-解码器)模型,并通过注意力(attention)机制来帮助特征对齐。优选地,可以以基于crnn的ocr识别方法为主并结合注意力机制的方式进行文本识别。
82.s2233:获取所述标准测试用例对应的文本参考信息。
83.所述标准测试用例对应的文本参考信息为预设的已知信息。
84.s2234:根据所述第一文本识别信息与所述文本参考信息的比对结果,得到所述第一识别结果,所述第一识别结果表征对所述第一测试图像的文本识别准确性。
85.如图6所示,对第一待识别图像进行ocr识别,将得到的第一文本识别信息和文本参考信息进行比对,如依次进行字符匹配等,计算识别正确的字符数量,进而得到本次的识别准确率数据。
86.s230:获取业务测试用例,基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像。
87.在本技术实施例中,获取业务测试用例,利用待测成像设备对该业务测试用例进行拍摄,得到对应的第二测试图像。其中,业务测试用例可以是在一定类型的业务中与一种或多种真实业务场景对应的一个或多个测试用例,例如对于面向教育辅助的图像识别业务,在真实的业务场景中,被拍摄的纸张内容可以是中文文本、英文文本、数字字符等,字体可以包括印刷体和手写体,对于手写的文本内容,其字体大小、行高间距等都是变化的,此外,业务测试用例还可以对所拍摄的环境参数进行设定,如光线亮度、色温等,不同亮度、不同色温的环境下成像设备所体现的成像性能也会有所差异。因此为了能够有效地识别真实业务场景下的文本内容,除了提升软件算法的识别有效性,还需要为软件算法、业务需求或产品设备结构等选择适配的成像设备,仅仅根据成像设备出厂时检测到的解析力参数来选择成像设备,其成像性能不一定与业务需求、产品构造、算法模型等相适配,从而不能有效准确地提供图像识别的业务服务。
88.在本技术的另一个实施例中,如图7所示,所述步骤s230可以包括以下步骤:
89.s231:获取业务测试用例,所述业务测试用例对应于业务场景;所述业务场景包括所述待测成像设备与所述业务测试用例的相对位置、所述待测成像设备所处的外界环境或文本识别业务中所采用的文本识别算法。
90.s233:基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像。
91.优选地,当产品设备结构较为特殊,如所需嵌入的成像设备相对于所拍摄对象存在一定的倾斜角,为了对该产品设备中的成像设备的成像性能进行有效地检测,可以对业务测试用例与待测成像设备的相对位置进行限定,以使得根据成像性能所选出的成像设备与产品设备的结构更适配。
92.优选地,在实际的文本识别业务中,嵌入了成像设备的产品设备的使用环境不会
保持不变,为了使产品设备能在不同外界环境中都能提供较优的图像文本识别服务,成像设备则需要能在不同外界环境下都能展现很好的成像性能,因此可以通过业务测试用例设定待测成像设备所处的外界环境,以对待测成像设备的成像性能进行更准确的测试。
93.优选地,不同类型的文本识别业务所适用的文本识别算法不同,其对图像数据的要求也不尽相同,故为了使所选择的成像设备与所选择的文本识别算法相适配,还可以通过业务测试用例设定测试时所用的文本识别算法,以对基于业务测试用例得到的第二测试图像进行文本识别,能够考察待测成像设备所体现的成像性能对文本识别算法识别结果的影响。
94.s240:对所述第二测试图像进行第二文本识别,得到第二识别结果。
95.在本技术实施例中,对基于业务测试用例得到的第二测试图像进行第二文本识别,得到第二识别结果,该第二识别结果表征对第二测试图像的识别准确性,隐含地,该第二识别结果也与也与待测成像设备的成像性能有关,且由于是采用与业务场景相关的业务测试用例进行测试,故得到的第二识别结果可以表征待测成像设备应用于该类业务时所体现的成像性能。不同配置的成像设备对于同一业务测试用例拍摄得到的第二测试图像存在差异,进而对多个第二测试图像进行相同的第二文本识别的处理,对应得到第二识别结果,多个第二测试图像对应的第二识别结果的差异,也体现了不同配置的成像设备在成像性能上的差异。
96.在本技术的一个实施例中,对第二测试图像进行图像预处理以及对预处理后的图像进行预设方式的第二文本识别,得到第二识别结果。如图8所示,所述步骤s240可以包括以下步骤:
97.s241:对所述第二测试图像进行图像预处理,得到第二待识别图像。
98.具体地,图像预处理可以包括:对第二测试图像进行尺度变化处理或畸变矫正处理,得到第二待识别图像。其中尺度变化处理包括但不限于图像的缩放和尺寸的裁剪。
99.s243:基于所述文本识别业务中所采用的所述文本识别算法,对所述第二待识别图像进行第二文本识别,得到所述第二识别结果,所述第二识别结果表征对所述第二测试图像的文本识别准确性。
100.需要说明的是,为了与业务需求、产品构造及产品所运行的软件算法相适配,本技术实施例在对第二测试图像进行第二文本识别时,采用的是实际业务中产品所运行的软件算法来实施文本识别,从而得到的第二识别结果可以表征待测成像设备应用于具体业务、应用和产品时所体现的成像性能。
101.可选的,第二文本识别方法同样可以采用基于人工智能的文本检测方法和文本识别方法,此处不再赘述,且文本检测模型和文本识别模型都经过了训练,训练集为与实际业务、应用相关的样本数据。
102.s250:根据所述待测成像设备的解析力信息、所述第一识别结果和所述第二识别结果,确定所述待测成像设备的成像性能。
103.在本技术实施例中,待测成像设备在生产出厂时会对其成像性能进行检测,一般可以用解析力来表征,镜头的解析力也叫解像力,解像力表征分辨被拍摄原物细节的能力。而本技术实施例中得到的第一识别结果可以表征待测成像设备在采用标准测试用例进行测试时的基础成像性能,由于是理想化或常规化的拍摄场景,故其可以表征待测成像设备
基本的成像能力;本技术实施例中得到的第二识别结果可以表征待测成像设备在具体特定的业务场景用例中所体现的成像性能。如图9所示,在本技术实施例中,综合考虑上述三类指标,从而最终确定待测成像设备在所设计的文本识别业务中的成像性能,使得对待测成像设备的成像性能的测试更为有效和准确。
104.在本技术的一个实施例中,所述确定所述待测成像设备的成像性能可以包括以下步骤:
105.s251:获取多个待测成像设备中各待测成像设备的解析力信息,所述解析力信息表征所述待测成像设备的成像清晰度能力。
106.s253:根据所述各待测成像设备的解析力信息、所述各待测成像设备的第一识别结果和所述各待测成像设备的第二识别结果,确定关联阈值。
107.具体地,对于同一业务中,以多个待测成像设备各自对应的解析力信息、第一识别结果和第二识别结果为数据基础,确定关联阈值,该关联阈值包括三类指标(也即解析力、第一识别结果和第二识别结果)各自的指标阈值,且指标阈值之间是相互制约、相互关联的,如该关联阈值可以是当解析力满足预设阈值范围时第一识别结果和第二识别结果各自的阈值范围,也可以是在第二识别结果满足预设最低阈值的条件下时,解析力和第一识别结果各自的最低阈值,还可以是当第一识别结果和第二识别结果满足各自的预设最低阈值的条件下,解析力这一指标所对应的最低阈值。
108.s255:基于所述关联阈值、所述解析力信息、所述第一识别结果和所述第二识别结果,确定各所述待测成像设备在文本识别业务中的成像性能。
109.具体地,分别将各个待测成像设备的解析力信息、第一识别结果和第二识别结果与所述关联阈值中所包括的三类指标阈值进行比较,根据比较结果确定各个待测成像设备在待应用的文本识别业务中的成像性能。示例性的,关联阈值所包括的三类指标的指标阈值分别是第一识别结果对应的识别准确率最低阈值、第二识别结果对应的识别准确率最低阈值以及在前述条件下的解析力最低阈值,若其中一个待测成像设备的三类指标数据均高于对应的指标阈值,则可判定该待测成像设备在在待应用的文本识别业务中的成像性能较优。
110.综合考虑上述三类指标,从而最终确定待测成像设备的成像性能,使得对待测成像设备的成像性能的测试更为有效和准确。
111.在为业务、应用或产品选择合适的成像设备阶段,可以基于各个待测成像设备的成像性能,从所述多个待测成像设备中选取与所述文本识别业务适配的目标成像设备。
112.进一步地,基于本技术实施例最终确定的成像性能选择目标成像设备,不仅能够有效满足业务、应用或产品的需求,还可以有效控制经济成本,方便量产。
113.在上述实施例中,本技术提供的方案除了考量生产厂商提供的待测成像设备的解析力信息,还考量了在采用标准测试用例进行测试时基于待测成像设备所拍摄的第一测试图像得到的第一识别结果,以及在采用业务测试用例进行测试时基于待测成像设备所拍摄的第二测试图像得到的第二识别结果,综合上述三类数据最终确定该待测成像设备的成像性能,该成像性能既能体现该待测成像设备的基础成像性能,也能体现该待测成像设备在特定业务中的成像性能,使得对成像设备的成像性能的测试更为有效准确。
114.在本技术实施例提供的一个具体应用场景中,提供了智能台灯这一产品设备,该
产品设备能够通过所嵌入的摄像头拍摄书本、教材、作业等,并通过内置的软件算法进行文本识别。如图10所示,智能台灯作为台灯,能够提供最基本的照明功能,但是作为一类智能终端,其还具备如作业拍照识别、作业检查,指尖点读等多个智能辅导学生进行学习的功能,在使用功能时都需要摄像头进行拍照,并且需要将书或者作业本等的放在智能台灯的摄像头下面,供台灯进行拍照识别。
115.在智能台灯的设计阶段,提出了以下具体的产品和业务需求:台灯的头部即安装灯光的部分可以360度旋转以更好的满足用户体验;摄像头成像效果要求高,能够识别5号字体文字。
116.在为这一产品设备选配合适的摄像头时,可以采用上述实施例提供的成像性能测试方法,从而可以选择到满足业务需求、与产品构造适配的摄像头。具体地,如图11所示,除了考量摄像头1至摄像头n的解析力信息,通过采用标准测试用例测试得到各摄像头对应的第一识别结果,以及通过采用业务测试用例测试得到各摄像头对应的第二识别结果,根据上述三类数据为该产品设备选择合适的摄像头。在一种可行的选择方式中,参考产品和业务需求对应的实际识别准确率标准,根据第二识别结果对n各摄像头进行筛选,确定能够满足实际识别准确率标准的最低解析力对应的摄像头,可以将该摄像头作为最终选择的摄像头,以及确定该摄像头对应的第一识别结果,在智能台灯的量产阶段,将该摄像头对应的第一识别结果作为产品质检的合格标准之一,采用标准测试用例可以方便快速地实施量产阶段的质检。在另一种可行的选择方式中,还可以对异常情况进行判别,如相同解析力信息的多个摄像头,其第一识别结果差异较大,由于第一识别结果是基于标准测试用例得到的,导致差异较大的原因之一可以是摄像头生产厂商提供的解析力信息有误,需要重新进行检测,才能准确测试摄像头的成像性能,导致差异较大的原因之二可以是识别算法,可以经过人工肉眼识别判断成像效果,如果是识别算法的问题,可以对识别算法进行优化。在另一种可行的选择方式中,还可以根据第一识别结果和第二识别结果对摄像头进行筛选,确定符合第一识别结果准确率和第二识别结果准确率的解析力最低的摄像头,或者是将第二识别结果准确率大于第一识别结果准确率的摄像筛选出来,进而从中选择解析力最低的摄像头,一般的,解析力越低,摄像头的造价越低,可以在满足业务需求的同时有效控制经济成本。
117.根据上述的产品和业务需求,本技术实施例中还对摄像头的安装位置进行了设计。如图12所示,因为需要进行360度旋转,摄像头如果跟着旋转,那不便于拍摄处于固定位置的书本,如果摄像头每旋转一定角度书本也需要跟着摄像头的角度摆放位置,可能产生人为的抖动,影响拍摄效果,因此摄像头不能安装在与台灯底部垂直的方向上,也即摄像头将不能安装在图12中标号为2的地方。在图12中标号为3的地方为智能屏幕,其上也无法安装摄像头,摄像头镜头与就台灯底部平行,台灯底部会占据较大的图像区域。故可以在台灯的中间部分(也即标号为1的地方),在与台灯垂直方向形成一定夹角的方向上,斜着安装一个摄像头进行拍照。
118.进一步地需要确定摄像头安装的高度和倾斜的角度。一方面,根据实际体验及测试发现,摄像头在灯的垂直方向上越靠上,所能拍照的范围就越大,越靠近台灯底座部分,则拍摄到的台灯本身的范围就越大,这一部分属于无效部分,需要进行裁剪,以免影响真正的有效部分,因此可以将摄像头的高度定义为在图12中所示的1处,高度记为h(t)。另一方
面,摄像头的角度与实际摄像头的分辨率、所拍摄物体即a4纸里面的内容比如字体大小、字的行间距、目标清晰度、台灯本身被拍照的范围等多种业务因素相关,用r(y)表示摄像头在纵向方向上的分辨率,用f(s)表示字体大小,f(h)行高,a4纸拍照的范围占整个拍摄图片的比例为p(t),则为了满足上述的业务需求,以上变量需要满足公式(1)所指示的条件:
119.r(y)*p(t)》f(s)*f(h);
ꢀꢀ
(1)
120.根据a4纸需要在拍照图片中成像的大小,以台灯底座边缘为起始,可以整理出摄像头角度、高度及与a4纸摆放位置的关系,如公式(2)所示:
121.a(t)

h(t)p(t);
ꢀꢀ
(2)
122.其中a(t)代表摄像头与垂直方向的夹角,h(t)为摄像头的高度,p(t)指在实际成像中a4纸所占整个图像的比例。
123.根据以上的公式,可以大致进行摄像头高度、角度及实际a4纸在实际拍照中的效果模拟,模拟效果可以如图13所示,其中外围的实线区域为摄像头的视野区域,也即成像区域,成像区域内包括了纸张区域和底座区域,在实际应用中,需保证底座区域不覆盖在纸张区域上,纸张区域在成像区域中的占比也即p(t)。根据公式和模拟效果,可以真实计算出摄像头与垂直方向的夹角,并进行实际验证,其实际效果可以如图14所示,纸张中的字体大小均为四号,由于摄像头相对于桌面有一定的倾斜角度,导致在所拍摄的图像中靠近台灯底座一侧的文字会比远离台灯底座一侧的文字大些。当成像效果符合初期业务需求时,则在此基础上,对图像进行智能识别,获取第一识别结果和第二识别结果,以测试应用于具体业务的该结构的产品设备中摄像头的成像性能,可参考上述实施例,此处不再赘述。
124.本技术实施例还提供了一种成像性能测试装置1500,如图15所示,所述装置可以包括:
125.第一获取模块1510,用于获取标准测试用例,基于所述标准测试用例得到待测成像设备拍摄的第一测试图像;
126.第一识别模块1520,用于对所述第一测试图像进行第一文本识别,得到第一识别结果;
127.第二获取模块1530,用于获取业务测试用例,基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像;
128.第二识别模块1540,用于对所述第二测试图像进行第二文本识别,得到第二识别结果;
129.成像性能确定模块1550,用于根据所述待测成像设备的解析力信息、所述第一识别结果和所述第二识别结果,确定所述待测成像设备的成像性能。
130.在本技术的一个实施例中,所述第一识别模块1520可以包括:
131.第一图像预处理单元,用于对所述第一测试图像进行图像预处理,得到第一待识别图像;
132.第一识别单元,用于对所述第一待识别图像进行第一文本识别,得到所述第一识别结果,所述第一识别结果表征对所述第一测试图像的文本识别准确性。
133.在本技术的一个实施例中,所述图像预处理单元可以包括:
134.第一处理子单元,用于对所述第一测试图像进行尺度变化处理或畸变矫正处理,得到所述第一待识别图像。
135.在本技术的一个实施例中,所述第一识别单元可以包括:
136.文本检测子单元,用于将所述第一待识别图像输入文本检测网络,进行文本检测处理,得到所述第一待识别图像对应的第一文本特征信息;
137.文本识别子单元,用于将所述第一文本特征信息输入至文本识别网络,进行文本识别处理,得到所述第一待识别图像对应的第一文本识别信息;
138.文本参考信息获取子单元,用于获取所述标准测试用例对应的文本参考信息;
139.比对子单元,用于根据所述第一文本识别信息与所述文本参考信息的比对结果,得到所述第一识别结果,所述第一识别结果表征对所述第一测试图像的文本识别准确性。
140.在本技术的一个实施例中,所述第二获取模块1530可以包括:
141.业务测试用例单元,用于获取业务测试用例,所述业务测试用例对应于业务场景;所述业务场景包括所述待测成像设备与所述业务测试用例的相对位置、所述待测成像设备所处的外界环境或文本识别业务中所采用的文本识别算法;
142.第二测试图像获取单元,用于基于所述业务测试用例得到所述待测成像设备拍摄的第二测试图像。
143.在本技术的一个实施例中,所述第二识别模块1540可以包括:
144.第二图像预处理单元,用于对所述第二测试图像进行图像预处理,得到第二待识别图像;
145.第二识别单元,用于基于所述文本识别业务中所采用的所述文本识别算法,对所述第二待识别图像进行第二文本识别,得到所述第二识别结果,所述第二识别结果表征对所述第二测试图像的文本识别准确性。
146.在本技术的一个实施例中,所述成像性能确定模块1550可以包括:
147.解析力信息获取单元,用于获取多个待测成像设备中各待测成像设备的解析力信息,所述解析力信息表征所述待测成像设备的成像清晰度能力;
148.关联阈值确定单元,用于根据所述各待测成像设备的解析力信息、所述各待测成像设备的第一识别结果和所述各待测成像设备的第二识别结果,确定关联阈值;
149.成像性能确定单元,用于基于所述关联阈值、所述解析力信息、所述第一识别结果和所述第二识别结果,确定各所述待测成像设备在文本识别业务中的成像性能。
150.在本技术的一个实施例中,所述装置1500还可以包括:
151.筛选单元,用于基于所述各待测成像设备的所述成像性能,从所述多个待测成像设备中选取与所述文本识别业务适配的目标成像设备。
152.需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
153.本技术实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的一种成像性能测试方法。
154.图16示出了一种用于实现本技术实施例所提供的一种成像性能测试方法的设备
的硬件结构示意图,所述设备可以参与构成或包含本技术实施例所提供的装置或系统。如图16所示,设备10可以包括一个或多个(图中采用1002a、1002b,
……
,1002n来示出)处理器1002(处理器1002可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1004、以及用于通信功能的传输装置1006。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为i/o接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图16所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,设备10还可包括比图16中所示更多或者更少的组件,或者具有与图16所示不同的配置。
155.应当注意到的是上述一个或多个处理器1002和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
156.存储器1004可用于存储应用软件的软件程序以及模块,如本技术实施例中所述的方法对应的程序指令/数据存储装置,处理器1002通过运行存储在存储器1004内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种成像性能测试方法。存储器1004可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1004可进一步包括相对于处理器1002远程设置的存储器,这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
157.传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中,传输装置1006包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1006可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
158.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。
159.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质可设置于服务器之中以保存用于实现方法实施例中一种成像性能测试方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的一种成像性能测试方法。
160.可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
161.本发明实施例还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施方式中提供的一种成像性能测试方法。
162.由上述本技术提供的成像性能测试方法、装置、介质及设备的实施例可见,
163.本技术提供的方案基于标准测试用例得到待测成像设备拍摄的第一测试图像,进而对第一测试图像进行第一文本识别,得到第一识别结果;同时基于业务测试用例得到待测成像设备拍摄的第二测试图像,进而对第二测试图像进行第二文本识别,得到第二识别结果;最后根据待测成像设备的解析力信息、第一识别结果和第二识别结果,确定待测成像设备的成像性能。在本技术提供的方案中,除了考量生产厂商提供的待测成像设备的解析力信息,还考量了在采用标准测试用例进行测试时基于待测成像设备所拍摄的第一测试图像得到的第一识别结果,以及在采用业务测试用例进行测试时基于待测成像设备所拍摄的第二测试图像得到的第二识别结果,综合上述最终确定该待测成像设备的成像性能,该成像性能既能体现该待测成像设备的基础成像性能,也能体现该待测成像设备在具体业务中的成像性能,使得对成像设备的成像性能的测试更为有效准确。
164.需要说明的是:上述本技术实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本技术特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
165.本技术中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
166.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
167.以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1