本申请属于深度学习计算机视觉领域,具体涉及一种文本图像的分类方法、装置、电子设备及存储介质。
背景技术:
1、在例如保险理赔等业务中,准确判断图像内文字是否模糊对于数字图像处理至关重要。在光学字符识别(optical character recognition,ocr)任务和文本检测任务中,如果输入图像中的文字模糊,可能会导致错误识别或无法识别。特别是在理赔场景中,这一问题显得尤为重要,文字模糊的图像需要额外的人工工作才能正确处理后续流程,这会导致理赔流程受阻,增加理赔所需时间,降低用户理赔体验等。因此,在数字图像处理中精确识别图像内的模糊文字具有重要意义。
2、传统的图像文字模糊判断通常依赖于手动定义的阈值或规则,这种静态的方式无法适应不同场景和不同程度的模糊度变化,不同的阈值选择可能导致不同的判断结果,降低了算法的一致性和可靠性。其次,传统的图像文字模糊判断方式无法有效地处理复杂背景和多变光照等情况。另外,传统的图像文字模糊判断方式在处理噪声较大的图像时容易产生误判。总体来说,传统图像文字模糊判断方式存在无法准确地判断图像内文字的模糊程度的问题。
技术实现思路
1、本申请实施例提供一种文本图像的分类方法、装置、电子设备及存储介质,存在无法准确地判断图像内文字的模糊程度的问题。
2、第一方面,本申请实施例提供了一种文本图像的分类方法,该方法包括:将目标文本图像输入预先训练的深度学习模型;通过所述深度学习模型提取所述目标文本图像中文本的关联特征,以使所述深度学习模型根据所述关联特征输出所述目标文本图像中的文本清晰的预测概率;根据所述预测概率,将所述目标文本图像分类为文本模糊图像或者文本清晰图像。
3、第二方面,本申请实施例提供了一种文本图像的分类装置,该装置包括:执行模块,用于将待分类的目标文本图像输入到深度学习模型,所述深度学习模型为预先通过拍摄得到的文本图像训练得到的;获取模块,用于获取所述深度学习模型输出的所述目标文本图像内的文本清晰的预测概率;分类模块,用于根据所述预测概率,将所述目标文本图像分类为文本模糊图像或者文本清晰图像。
4、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
5、第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
6、在本申请实施例中,通过将目标文本图像输入预先训练的深度学习模型;通过深度学习模型提取目标文本图像中文本的关联特征,以使深度学习模型根据关联特征输出目标文本图像中的文本清晰的预测概率;根据预测概率,将目标文本图像分类为文本模糊图像或者文本清晰图像,通过深度学习模型来自动提取图像内文本的关联特征,并进行模糊判断,能够有效地分析和判断文字模糊的程度,并对文本图像进行评估分类,提高了图像中模糊文本识别的准确性。
1.一种文本图像的分类方法,其特征在于,包括:
2.根据权利要求1所述的分类方法,其特征在于,在所述将待分类的目标文本图像输入到深度学习模型之前,还包括:
3.根据权利要求2所述的分类方法,求特征在于,所述通过所述训练文本图像训练所述深度学习模型,包括:
4.根据权利要求2所述的分类方法,其特征在于,所述通过所述测试文本图像优化所述深度学习模型,包括:
5.根据权利要求1所述的分类方法,其特征在于,所述根据所述预测概率,将所述目标文本图像分类为文本模糊图像或者文本清晰图像,包括:
6.根据权利要求3所述分类方法,其特征在于,在通过所述训练文本图像训练所述深度学习模型之后,还包括:
7.根据权利要求2所述的分类方法,其特征在于,在所述将所述文本图像分为训练文本图像和测试文本图像之前,还包括:
8.一种文本图像的分类装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7中任一项所述的文本图像的分类方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7中任一项所述的文本图像的分类方法的步骤。