一种文本定位方法、装置、设备及介质与流程

文档序号:35918562发布日期:2023-11-03 22:32阅读:36来源:国知局
一种文本定位方法、装置、设备及介质与流程

本申请涉及大数据领域或金融领域,特别涉及一种文本定位方法、装置、设备及介质。


背景技术:

1、并行测试是一种自动化测试过程,目标是通过在可用资源之间分布测试来解决时间限制问题。相关技术中,在多批次、多环境的并行测试的情况下,为保证开发成功而面临的测试支持越发频繁。

2、在测试支持过程中,经常需要提取某个文件的某条数据的某个字段值,以便进行后续的测试或判断。而该提取过程需要逐个手工一一对应,才能查找到所需要的字段值,导致了定位字段取值的过程较复杂且耗时,降低了技术人员的工作效率。


技术实现思路

1、有鉴于此,本申请实施例提供了一种文本定位方法、装置、设备及介质,能够迅速定位字段取值,进而提高技术人员的工作效率。

2、本申请实施例公开了如下技术方案:

3、第一方面,本申请提供了一种文本定位方法,所述方法包括:

4、获取文件接口文档;

5、以测试解析文件和测试字作为神经网络模型的输入,以测试定位结果作为所述神经网络模型的输出,训练所述神经网络模型,以建立文本定位模型,所述测试定位结果是以所述文件接口文档的定义内容为定位条件获取的;

6、将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

7、可选的,所述将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果,包括:

8、获取待解析文件,所述待解析文件的格式为图片格式或可移植文档格式;

9、对所述待解析文件进行灰度化处理,以获取灰度化文件;

10、将所述灰度化文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

11、可选的,所述将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果,包括:

12、获取待解析文件,所述待解析文件的格式为图片格式或可移植文档格式;

13、对所述待解析文件进行归一化处理,以获取归一化文件,所述归一化处理包括对所述原始文件进行角度矫正归一化、比例缩放归一化、比例填充归一化、分辨率归一化和剪裁归一化中的一种或多种;

14、将所述归一化文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

15、可选的,所述文本接口文档的定义内容为字段序号、字段取值、字段内容和中文字段释义中的一种或多种。

16、第二方面,本申请提供了一种文本定位装置,所述装置包括:获取模块、建立模块和定位模块;

17、所述获取模块,用于获取文件接口文档;

18、所述建立模块,用于以测试解析文件和测试字作为神经网络模型的输入,以测试定位结果作为所述神经网络模型的输出,训练所述神经网络模型,以建立文本定位模型,所述测试定位结果是以所述文件接口文档的定义内容为定位条件获取的;

19、所述定位模块,用于将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

20、可选的,所述定位模块具体包括:第一获取子模块、第二获取子模块和第一定位子模块;

21、所述第一获取子模块,用于获取待解析文件,所述待解析文件的格式为图片格式或可移植文档格式;

22、所述第二获取子模块,用于对所述待解析文件进行灰度化处理,以获取灰度化文件;

23、所述第一定位子模块,用于将所述灰度化文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

24、可选的,所述定位模块具体包括:第三获取子模块、第四获取子模块和第二定位子模块;

25、所述第三获取子模块,用于获取待解析文件,所述待解析文件的格式为图片格式或可移植文档格式;

26、所述第四获取子模块,用于对所述待解析文件进行归一化处理,以获取归一化文件,所述归一化处理包括对所述原始文件进行角度矫正归一化、比例缩放归一化、比例填充归一化、分辨率归一化和剪裁归一化中的一种或多种;

27、所述第二定位子模块,用于将所述归一化文件和关键字输入至所述文本定位模型中,以获取文本定位结果。

28、可选的,所述文本接口文档的定义内容为字段序号、字段取值、字段内容和中文字段释义中的一种或多种。

29、第三方面,本申请提供了一种文本定位设备,包括:存储器和处理器;

30、所述存储器,用于存储程序;

31、所述处理器,用于执行所述计算机程序时实现上述文本定位方法的步骤。

32、第四方面,本申请提供了一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述文本定位方法的步骤。

33、相较于现有技术,本申请具有以下有益效果:

34、本申请公开了一种文本定位方法、装置、设备及介质,该方法包括:获取文件接口文档;以测试解析文件和测试字作为神经网络模型的输入,以测试定位结果作为神经网络模型的输出,训练神经网络模型,以建立文本定位模型,测试定位结果是以文件接口文档的定义内容为定位条件获取的;将待解析文件和关键字输入至文本定位模型中,以获取文本定位结果。由此,能够迅速定位字段取值,降低文本定位的时间成本,进而提高技术人员的工作效率。



技术特征:

1.一种文本定位方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果,包括:

3.根据权利要求1所述的方法,其特征在于,所述将待解析文件和关键字输入至所述文本定位模型中,以获取文本定位结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述文本接口文档的定义内容为字段序号、字段取值、字段内容和中文字段释义中的一种或多种。

5.一种文本定位装置,其特征在于,所述装置包括:获取模块、建立模块和定位模块;

6.根据权利要求5所述的装置,其特征在于,所述定位模块具体包括:第一获取子模块、第二获取子模块和第一定位子模块;

7.根据权利要求5所述的装置,其特征在于,所述定位模块具体包括:第三获取子模块、第四获取子模块和第二定位子模块;

8.根据权利要求5所述的装置,其特征在于,所述文本接口文档的定义内容为字段序号、字段取值、字段内容和中文字段释义中的一种或多种。

9.一种文本定位设备,其特征在于,包括:存储器和处理器;

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至4中任一项所述的方法的各个步骤。


技术总结
本申请公开了一种文本定位方法、装置、设备及介质,涉及大数据领域或金融领域。该方法包括:获取文件接口文档;以测试解析文件和测试字作为神经网络模型的输入,以测试定位结果作为神经网络模型的输出,训练神经网络模型,以建立文本定位模型,测试定位结果是以文件接口文档的定义内容为定位条件获取的;将待解析文件和关键字输入至文本定位模型中,以获取文本定位结果。由此,能够迅速定位字段取值,降低文本定位的时间成本,进而提高技术人员的工作效率。

技术研发人员:孔庆钰
受保护的技术使用者:中国银行股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1