一种图像识别领域中自动选择识别通道的方法、系统及装置与流程

文档序号:31781739发布日期:2022-10-12 10:38阅读:72来源:国知局
一种图像识别领域中自动选择识别通道的方法、系统及装置与流程

1.本发明涉及计算机软件应用技术领域,更具体地说,它涉及一种图像识别领域中自动选择识别通道的方法、系统及装置。


背景技术:

2.在银行场景中,随着银行业务规模和客户的不断扩大,在审核客户资质或者员工报销的时候,都需要客户上传发票图像(飞机票、增值税专票、增值税普票、火车票、出租车票、定额发票),然后后台业务人员人工输入票面信息的话,办公效率将非常低下,因此银行会引入ocr识别系统,通过将发票图像传给ocr识别通道厂商,ocr识别通道厂商识别解析后将发票图像上的文本信息返回给银行。
3.考虑系统运行的稳定性、运营成本、响应时效等因素,一般银行会接入了多个ocr识别通道厂商,各个识别通道厂商的受理权重后台可配,实现将交易量按比例分配到各个厂商。
4.通过投产后数据分析以及运营过程中出现的问题及解决方案处理,将目前现有的识别通道选择方法的问题和不足之处总结为如下几点:
5.(1)每个厂商所在线承载的用户体量不一样,尤其月末,响应时效变慢,严重影响银行使用体验。
6.(2)当一个厂商出现问题时,不能实时监控,难以及时发现问题。
7.(3)需要切换厂商路由时,需要人工配置切换的权重。
8.(4)识别通道路由因采样数据不足或者根本就没有采样数据,难以继续监测识别通道可用性,难以调整各个厂商识别通道的权重。


技术实现要素:

9.本发明的目的是提供一种图像识别领域中自动选择识别通道的方法、系统及装置,达到根据各个识别通道的运行状态实时进行调整,保证系统能够选出最佳识别通道的效果。
10.本发明的上述技术目的是通过以下技术方案得以实现的:一种图像识别领域中自动选择识别通道的方法,包括如下步骤:
11.对各个识别通道设置初始权重;
12.首次收到识别交易请求时,根据各个识别通道的初始权重,运行通道选择算法来选择识别通道;
13.在第一时间周期之后收到识别交易请求时,对所有识别通道执行权重动态调整算法;
14.根据执行权重动态调整算法之后更新的所有识别通道的状态和权重,运行通道选择算法来选择识别通道。
15.作为本发明的一种优选技术方案,根据识别通道成本数据,对每个识别通道设置
初始权重,设置初始权重的原则为:成本低的识别通道权重>成本高的识别通道权重。
16.作为本发明的一种优选技术方案,权重动态调整算法的内容包括异步执行的:
17.正常状态识别通道的权重调整计算;
18.异常状态识别通道和部分正常状态识别通道的心跳试探处理:
19.降低了权重的识别通道的权重恢复处理。
20.作为本发明的一种优选技术方案,正常状态识别通道的权重调整计算包括:
21.对正常状态的识别通道,每隔第一时间周期,获取并计算识别通道内的当前周期交易数量、当前周期识别成功率、当前周期平均响应时间;
22.若识别通道的当前周期交易数量大于最低取样数量,则发出识别通道权重调整指令;若识别通道的当前周期识别成功率<第一识别成功率,则对识别通道发起心跳试探处理;若当前周期识别成功率>第一识别成功率或者当前周期交易数量为零,则不调整识别通道的权重;
23.根据识别通道权重调整指令,获取识别通道的实时运行数据,若当前周期识别成功率为零,则发起心跳试探处理,若当前周期识别成功率不为零,则判断是否同时满足当前周期识别成功率≥第二识别成功率、当前周期平均响应时间≤第一响应时间的条件,若否,则降低识别通道当前权重;若是,则增加识别通道当前权重;
24.对调整后的权重数据,执行权重范围限定算法,得到识别通道可运行权重并更新配置。
25.作为本发明的一种优选技术方案,权重范围限定算法包括:
26.在当前周期识别成功率<第二识别成功率和/或当前周期平均响应时间>第一响应时间,降低识别通道当前权重时:若降低后的识别通道权重≥权重阈值,则将降低后的权重更新到缓存;若降低后的识别通道权重<权重阈值,则将识别通道的运行状态更新为异常;
27.在当前周期识别成功率≥第二识别成功率、当前周期平均响应时间≤第一响应时间,增加识别通道当前权重时:若增加后的识别通道权重≤权重最大值,则将增加后的权重更新到缓存;若增加后的识别通道权重>权重最大值,则将权重最大值更新到缓存。
28.作为本发明的一种优选技术方案,心跳试探处理的过程为:
29.获取识别通道中第一数量采样数据,其中识别通道中第一数量采样数据源于第一时间周期之前历史交易数据或人工预设的采样数据;
30.依次通过识别通道中第一数量采样数据对识别通道进行心跳试探交易,并统计试探交易的成功率和平均响应时间。
31.作为本发明的一种优选技术方案,心跳试探处理的对象包括:对异常状态的识别通道发起心跳试探处理;对在第一时间周期内,不满足最低取样数量,且识别通道的当前周期识别成功率>第一识别成功率条件的正常状态识别通道发起心跳试探处理;对在第一识别周期内,识别通道的当前周期交易数量大于最低取样数量,且满足当前周期识别成功率为零条件的正常状态识别通道发起心跳试探处理;
32.在对在第一时间周期内,不满足最低取样数量,且识别通道的当前周期识别成功率>第一识别成功率条件的正常状态识别通道发起心跳试探处理时,判断心跳试探交易是否全部失败,若是,则将更新识别通道的运行状态为异常,若否,则不调整识别通道权重;
33.在对在第一识别周期内,识别通道的当前周期交易数量大于最低取样数量,且满足当前周期识别成功率为零条件的正常状态识别通道发起心跳试探处理时:若心跳试探交易均成功,则不调整识别通道权重;若心跳试探交易不完全成功,则降低识别通道权重;若心跳试探全部失败,则通过可用性算法判断识别通道的状态;
34.对异常状态的识别通道发起心跳试探处理时,判断心跳试探交易成功数量是否达到心跳试探交易成功阈值,且平均响应时间<最大响应时间,若是,则更新识别通道运行状态为正常,且将识别通道的权重设置为识别通道原权重的第一比例;若否,则对其执行独立定时任务。
35.作为本发明的一种优选技术方案,可用性算法为:判断(交易成功的总次数+心跳试探交易成功次数)*最低交易数量

交易失败的总次数的结果是否大于0,若是,则判断识别通道状态正常,若否,则判断识别通道状态异常。
36.作为本发明的一种优选技术方案,权重恢复处理包括执行独立定时任务,其中独立定时任务包括:对于降低了权重的正常状态识别通道,若在执行了降低权重的周期之后的n个周期内,执行了至少m次交易处理且均成功,则恢复权重;对进行心跳试探处理失败的异常通道,若在心跳试探处理失败之后的n个周期内,执行了至少m次心跳试探交易且均成功,则将其状态转为正常且恢复权重。
37.作为本发明的一种优选技术方案,运行通道选择算法包括:
38.选取出运行状态为正常的所有识别通道;
39.根据所有识别通道权重以及所有识别通道权重之和,生成数值范围集合,在所述数值范围集合中每个识别通道的权重都存在一个相互没有交集的连续数值范围子集;
40.在数值范围集合中生成一个随机数;
41.选择对应于包含所述随机数的连续数值范围子集的识别通道进行交易。
42.作为本发明的一种优选技术方案,当对识别通道的权重进行增加时,则调整后的权重f

=f

+b,当对识别通道的权重进行降低时,则调整后的权重f

=f
前-b,其中,f

为前一周期的识别通道权重,b为权重调整基数。
43.一种图像识别领域中自动选择识别通道的系统,包括:
44.权重设置模块,用于对各个识别通道设置初始权重;
45.权重调整模块:在第一时间周期之后收到识别交易请求时,对所有识别通道执行权重动态调整算法;
46.选择执行模块,用于首次收到识别交易请求时,根据各个识别通道的初始权重,运行通道选择算法来选择识别通道;根据执行权重动态调整算法之后更新的所有识别通道的状态和权重,运行通道选择算法来选择识别通道。
47.一种图像识别领域中自动选择识别通道的装置,包括:处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
48.综上所述,本发明具有以下有益效果:1、能够在一个厂商识别通道服务响应不良情况下,不需要人工参数配置修改,快速的切换到其他识别通道,提升用户体验。
49.2、能够根据各个识别通道的运行状态实时进行动态调整,保证系统能够选出最佳识别通道。
50.3、能够在识别通道最初权重设定时,根据实际侧重因素来进行识别通道设定,如成本设定,可通过侧重低成本识别通道的权重,来使得实际进行识别通道选择时,确保识别工作高效运行的同时,在成本控制上仍得以延续,最大程度节约识别成本。
51.4、具有完整的识别通道权重调整方案,完全由系统进行执行调整和识别通道选择,调整和选择速度快,且更加准确,确保实际识别的高效率运行。
附图说明
52.图1是本发明的方法流程图。
53.图2是本发明的权重调整计算示意图。
具体实施方式
54.以下结合附图对本发明作进一步详细说明。
55.如图1和2所示,本发明提供一种图像识别领域中自动选择识别通道的方法,并通过对应的系统模块来执行方法步骤,具体的步骤如下:
56.s1、通过权重设置模块,对各个识别通道设置初始权重;具体的,根据识别通道成本数据,对每个识别通道设置初始权重,设置初始权重的原则为:成本低的识别通道权重>成本高的识别通道权重。由于后续的权重调整都是根据识别效率来调整的,那么本发明中从一开始就根据成本来设定倾向性的权重,就可以在之后的选择使用中,同时兼顾到成本和效率的选择。
57.s2、通过选择执行模块,首次收到识别交易请求时,根据各个识别通道的初始权重,运行通道选择算法来选择识别通道;由于没有实际运行数据,在最开始运行时,都默认所有的识别通道的状态的是正常的,将所有的识别通道都作为选择对象。
58.s3、权重调整模块,在第一时间周期之后收到识别交易请求时,对所有识别通道执行权重动态调整算法;
59.权重动态调整算法的内容包括异步执行的:a、正常状态识别通道的权重调整计算;b、异常状态识别通道和部分正常状态识别通道的心跳试探处理;c、降低了权重的识别通道的权重恢复处理。
60.a、正常状态识别通道的权重调整计算包括:
61.a1、对正常状态的识别通道,每隔第一时间周期,获取并计算识别通道内的交易数据,即每一笔交易的请求时间、响应结束时间、响应码;其中响应码包括成功和失败,用于指示交易的成功与否,从而可以计算得出当前周期交易数量、当前周期识别成功率、当前周期平均响应时间;
62.举例:其获取的交易数据模型如下表1所示:
63.表1
64.65.a2、若识别通道的当前周期交易数量大于最低取样数量,则发出识别通道权重调整指令;若识别通道的当前周期识别成功率<第一识别成功率,则对识别通道发起心跳试探处理;若当前周期识别成功率>第一识别成功率或者当前周期交易数量为零,则不调整识别通道的权重,其中,如果周期内交易数量为0,则说明当前时段为工作低峰段,不用进行心跳试探处理,默认通道可用,且由于采样数量不足,则无需进行权重调整;
66.a3、根据识别通道权重调整指令,获取识别通道的实时运行数据,若当前周期识别成功率为零,则发起心跳试探处理,若当前周期识别成功率不为零,则判断是否同时满足当前周期识别成功率≥第二识别成功率、当前周期平均响应时间≤第一响应时间的条件,若否,则降低识别通道当前权重;若是,则增加识别通道当前权重;
67.a4、对调整后的权重数据,执行权重范围限定算法,得到识别通道可运行权重并更新配置。
68.其中,权重范围限定算法包括:
69.在当前周期识别成功率<第二识别成功率和/或当前周期平均响应时间>第一响应时间,降低识别通道当前权重时:若降低后的识别通道权重≥权重阈值,则将降低后的权重更新到缓存;若降低后的识别通道权重<权重阈值,则将识别通道的运行状态更新为异常;
70.在当前周期识别成功率≥第二识别成功率、当前周期平均响应时间≤第一响应时间,增加识别通道当前权重时:若增加后的识别通道权重≤权重最大值,则将增加后的权重更新到缓存;若增加后的识别通道权重>权重最大值,则将权重最大值更新到缓存。
71.具体的,当对识别通道的权重进行增加时,则调整后的权重f

=f

+b,当对识别通道的权重进行降低时,则调整后的权重f

=f
前-b,其中,f

为前一周期的识别通道权重,b为权重调整基数。例如,b设为5,则每次增加通道权重时,f

=f

+5,每次降低通道权重时,f

=f
前-5。
72.b、异常状态识别通道和部分正常状态识别通道的心跳试探处理:
73.具体的,心跳试探处理的过程为:
74.获取识别通道中第一数量采样数据,其中识别通道中第一数量采样数据源于第一时间周期之前历史交易数据或人工预设的采样数据;
75.举例如下:按日进行采样数据收集,存储昨日成功识别的任意3笔采样数据包括影像资料、识别返回结果,同时需要注意的是每个通道均需要存储3笔被成功识别的数据。
76.具体的,通过单独的每日定时任务进行心跳采样数据的更新,时间为每天00:00点;
77.采样数据获取规则为:
78.初次上线,所有通道采样数据,可先人工预设好,即开发后台取样;
79.若该通道昨日无请求数据,则从交易量最大的识别通道取采样数据;
80.若所有通道昨日均无请求数据,则从交易量最大的通道取一周的数据做为采集数据;
81.若所有通道一周均无请求数据,则邮件、短信预警,请人工干预。
82.得到采样数据后,依次通过识别通道中第一数量采样数据对识别通道进行心跳试探交易,并统计试探交易的成功率和平均响应时间。
83.心跳试探处理的对象包括:对异常状态的识别通道发起心跳试探处理;对在第一时间周期内,不满足最低取样数量,且识别通道的当前周期识别成功率>第一识别成功率条件的正常状态识别通道发起心跳试探处理;对在第一识别周期内,识别通道的当前周期交易数量大于最低取样数量,且满足当前周期识别成功率为零条件的正常状态识别通道发起心跳试探处理;
84.在对在第一时间周期内,不满足最低取样数量,且识别通道的当前周期识别成功率>第一识别成功率条件的正常状态识别通道发起心跳试探处理时,判断心跳试探交易是否全部失败,若是,则将更新识别通道的运行状态为异常,若否,则不调整识别通道权重;
85.在对在第一识别周期内,识别通道的当前周期交易数量大于最低取样数量,且满足当前周期识别成功率为零条件的正常状态识别通道发起心跳试探处理时:若心跳试探交易均成功,则不调整识别通道权重;若心跳试探交易不完全成功,则降低识别通道权重;若心跳试探全部失败,则通过可用性算法判断识别通道的状态;
86.对异常状态的识别通道发起心跳试探处理时,判断心跳试探交易成功数量是否达到心跳试探交易成功阈值,且平均响应时间<最大响应时间,若是,则更新识别通道运行状态为正常,且将识别通道的权重设置为识别通道原权重的第一比例;若否,则对其执行独立定时任务。其中第一比例可以为二分之一。
87.可用性算法为:判断(交易成功的总次数+心跳试探交易成功次数)*最低交易数量

交易失败的总次数的结果是否大于0,若是,则判断识别通道状态正常,若否,则判断识别通道状态异常。需要注意的是,在进行权重动态调整之前也有关于识别通道状态的认定,如果识别通道的状态不明确,或到达状态更新的时间点,就采用可用性算法更新识别通道的状态。
88.具体举例:
89.以图像识别通道标识a为例,构建请求时间周期数据:
90.1)从每日00:00:00开始——每日24:00:00结束;
91.2)00:00:00——00:05:00,记为第1个5分钟周期;
92.3)记录:图像识别通道标识a、时间周期内的交易识别的总次数、时间周期内的交易失败的总次数、时间周期内的交易成功的总次数;
93.4)同理,重新记录下1个5分钟数据;
94.5)该场景下业务数据分别记录为:
95.通道a1、10次请求、1次成功、9次失败、;
96.通道a1、10次请求、全部失败(识别类型不同);
97.通道a1、1次请求、全部失败(识别类型不同);
98.其数据模型如下表2所示:
99.表2
[0100][0101]
c、降低了权重的识别通道的权重恢复处理。
[0102]
权重恢复处理包括执行独立定时任务,其中独立定时任务包括:对于降低了权重的正常状态识别通道,若在执行了降低权重的周期之后的n个周期内,执行了至少m次交易处理且均成功,则恢复权重;例如第一时间周期是五分钟,那么选取6个第一时间周期做统计,如果在30分钟内有3个交易且都成功了,则说明该识别通道可以进行正常的高效交易,那么就恢复识别通道的权重。
[0103]
对进行心跳试探处理失败的异常通道,若在心跳试探处理失败之后的n个周期内,执行了至少m次心跳试探交易且均成功,则将其状态转为正常且恢复权重,由于异常通道无法进行实际的交易,此处还采用心跳交易试探,当其可以满足前述条件,则说明该通道可以正常交易且效率达标,因此可以进行权重的恢复。
[0104]
s4、通过选择执行模块,根据执行权重动态调整算法之后更新的所有识别通道的状态和权重,运行通道选择算法来选择识别通道。
[0105]
运行通道选择算法包括:
[0106]
选取出运行状态为正常的所有识别通道;
[0107]
根据所有识别通道权重以及所有识别通道权重之和,生成数值范围集合,在数值范围集合中每个识别通道的权重都存在一个相互没有交集的连续数值范围子集;
[0108]
在数值范围集合中生成一个随机数;
[0109]
选择对应于包含随机数的连续数值范围子集的识别通道进行交易。
[0110]
举例如下:假设有a,b,c三个通道,配置的权重比分别为x:y:z,
[0111]
当收到交易请求时,在0到x+y+z之前生成一个随机数rand(x+y+z);
[0112]
当rand(x+y+z)《x时,走a通道;
[0113]
当x=《rand(x+y+z)《x+y时,走b通道;
[0114]
当x+y=《rand(x+y+z)《x+y+z时,则走c通道。
[0115]
对应于上述的方法和系统,本发明还提供一种图像识别领域中自动选择识别通道的装置,包括:处理器和存储器,存储器存储有处理器可执行的计算机程序,处理器执行计算机程序时实现上述方法。
[0116]
本发明的优势在于:能够在一个厂商通道服务响应不良情况下,不需要人工参数配置修改,快速的切换到其他通道,提升用户体验。能够根据各个通道的运行状态实时进行动态调整,保证系统能够选出最佳通道。能够在通道最初权重设定时,根据实际侧重因素来进行通道设定,如成本设定,可通过侧重低成本通道的权重,来使得实际进行通道选择时,确保识别工作高效运行的同时,在成本控制上仍得以延续,最大程度节约识别成本。具有完整的通道权重调整方案,完全由系统进行执行调整和通道选择,调整和选择速度快,且更加准确,确保实际识别的高效率运行。
[0117]
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1