本申请实施例涉及计算机,尤其涉及一种背景图像生成方法、电子设备及计算机存储介质。
背景技术:
1、随着计算机技术的发展,在人们的日常生活和工作中经常有需要电子扫描文件的情况,例如,书籍电子化、发票报销、工作文档扫描打印、证件材料扫描件等等应用场景。
2、因专业的扫描仪价格昂贵,扫描软件应运而生。通过扫描软件,用户可以随时随地实现方便、低成本的文件扫描。伴随着扫描软件的广泛使用,扫描场景也越来越多样化,这就要求扫描软件能够不断地迭代更新,以适应新场景需求。但扫描软件的迭代更新,需要以大量的各种扫描场景下的训练样本为前提。为此,在现有的一种方式中,利用专业的渲染软件(如unity3d等)搭建虚拟的光照环境,其可以包含不同的光源、不同的遮挡物、不同的纹理背景等,通过变换光源的位置、强弱、色温等再搭配不同的遮挡物以及纸面纹理来模拟用户扫描文件的场景,以使生成的扫描图像的背景更为逼真,进而使得扫描图像较为逼真。但这种方式中,一是这类专业渲染软件使用门槛较高,需要长时间的调试与学习才能达到一定的模拟效果,时间成本也较大,造成整体实现成本较高;二是这类专业渲染软件模拟生成的图像背景在数据分布上和真实的样本分布存在比较大的偏差,使得生成的扫描图像的背景效果较差,进而导致虽然实现软件扫描的机器学习模型在模拟的训练样本上效果很好,但在真实数据上却效果很差。
技术实现思路
1、有鉴于此,本申请实施例提供一种背景图像生成方案,以至少部分解决上述问题。
2、根据本申请实施例的第一方面,提供了一种背景图像生成方法,包括:获取基于物理文件生成的真实图像;对所述真实图像进行多种不同类型的目标内容检测,获得对应的多个目标内容图像区域及对应的多个目标内容掩膜;对所述多个目标内容掩膜进行融合,获得融合掩膜;从所述真实图像中,擦除所述融合掩膜对应的图像区域,并根据擦除结果获得所述真实图像对应的背景图像。
3、根据本申请实施例的第二方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述方法对应的操作。
4、根据本申请实施例的第三方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法。
5、根据本申请实施例提供的方案,可以基于真实的包含文件信息的图像,对其进行目标内容检测和掩膜处理,并基于多个目标内容掩膜生成融合掩膜,基于融合掩膜进行图像区域擦除,从而获得真实图像对应的背景图像。由此,一方面,无需图像处理人员进行复杂的参数学习和调试,基于真实图像即可生成相应的背景图像,降低了背景图像生成成本;另一方面,背景图像基于真实图像生成,因而在数据分布上和真实的样本分布一致,不仅能够使得生成的扫描图像的背景效果较好;并且,后续,基于背景图像来合成扫描图像以作为训练样本时,也能够使得实现软件扫描的机器学习模型的训练效果更好。
1.一种背景图像生成方法,包括:
2.根据权利要求1所述的方法,其中,所述对所述多个目标内容掩膜进行融合,获得融合掩膜,包括:
3.根据权利要求2所述的方法,其中,
4.根据权利要求1-3任一项所述的方法,其中,所述从所述真实图像中,擦除所述融合掩膜对应的图像区域,并根据擦除结果获得所述真实图像对应的背景图像,包括:
5.根据权利要求4所述的方法,其中,所述方法还包括:
6.根据权利要求4所述的方法,其中,所述预设信息熵阈值通过以下方式确定:
7.根据权利要求1所述的方法,其中,所述目标内容包括以下类型至少之一:文字类型内容、图表类型内容、色块图案类型内容、印章类型内容;
8.根据权利要求7所述的方法,其中,所述根据检测结果,获得检测出的多种类型的目标内容对应的多个图像区域,包括以下至少之一:
9.根据权利要求1-3任一项所述的方法,其中,所述方法还包括:
10.根据权利要求9所述的方法,其中,所述方法还包括:
11.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
12.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-10中任一所述的方法。