动态调整时间阈值的方法、装置、计算机设备和存储介质与流程

文档序号:18899163发布日期:2019-10-18 21:41阅读:563来源:国知局
动态调整时间阈值的方法、装置、计算机设备和存储介质与流程

本申请涉及到计算机领域,特别是涉及到一种动态调整时间阈值的方法、装置、计算机设备和存储介质。



背景技术:

服务器在目前生产、生活中经常使用,用于对客户端提供服务,当同时对服务器进行访问的客户端过多时,例如接收大量客户端在短时间内进行轮询调用接口时,将导致服务器压力过大,性能降低,甚至于服务器崩溃。用于文字识别的服务器在访问量过多时,同样存在压力过大,性能降低,甚至于服务器崩溃的问题。传统方法对于上述问题没有很好的解决方案,亟需能够解决由访问量过多带来的服务器性能降低的问题的技术方案。



技术实现要素:

本申请的主要目的为提供一种动态调整时间阈值的方法、装置、计算机设备和存储介质,旨在解决由访问量过多带来的服务器性能降低的问题。

为了实现上述发明目的,本申请提出一种动态调整时间阈值的方法,应用于服务器,包括以下步骤:

获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;

若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;

利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;

利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;

判断所述相似程度值是否大于预设的相似程度阈值;

若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

进一步地,所述获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值的步骤之后,包括:

若所述时间间隔不大于预设的时间阈值,则获取所述服务器的当前访问人数;

判断所述当前访问人数是否大于预设的人数阈值;

若所述当前访问人数大于预设的人数阈值,则拒绝所述调用申请。

进一步地,所述利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字的步骤,包括:

利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积;

所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:

利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果。

进一步地,所述调用申请携带有用户唯一标识,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤之前,包括:

利用所述用户唯一标识,根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本,其中所述识别文本的最近一次添加的识别文字标记有阅读标识;

通过在所述客户端对应的识别文本中查询所述阅读标识,从而得到所述前次识别文字。

进一步地,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:

采用公式:

计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;其中similarity为相似度,a为所述指定识别文字的词频向量,b为所述前次识别文字的词频向量,ai为所述指定识别文字的第i个单词出现的次数,bi为所述前次识别文字的第i个单词出现的次数。

进一步地,所述判断所述相似程度值是否大于预设的相似程度阈值的步骤之后,包括:

若所述相似程度值不大于预设的相似程度阈值,则将所述指定识别文字发送给所述客户端;

根据预设的时间阈值调整规则,减小所述时间阈值。

进一步地,所述若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值的步骤,包括:

统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;

计算出所述成功次数/所述总次数的商值,并根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数,其中所述指定时间阈值调整参数大于0;

在所述时间阈值的基础上增加所述指定时间阈值调整参数。

本申请提供一种动态调整时间阈值的装置,应用于服务器,包括:

调用申请获取单元,用于获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;

指定文字图片接收单元,用于若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;

指定识别文字获取单元,用于利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;

相似程度值计算单元,用于利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;

相似程度值判断单元,用于判断所述相似程度值是否大于预设的相似程度阈值;

时间阈值增大单元,用于若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的动态调整时间阈值的方法、装置、计算机设备和存储介质,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则接收所述客户端通过所述指定接口发送的指定文字图片;识别所述指定文字图片,得到指定识别文字;计算所述指定识别文字与预存的前次识别文字的相似程度值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。从而在保证对客户端的服务质量的前提下,降低服务器压力。

附图说明

图1为本申请一实施例的动态调整时间阈值的方法的流程示意图;

图2为本申请一实施例的动态调整时间阈值的装置的结构示意框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请实施例提供一种动态调整时间阈值的方法,应用于服务器,包括以下步骤:

s1、获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;

s2、若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;

s3、利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;

s4、利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;

s5、判断所述相似程度值是否大于预设的相似程度阈值;

s6、若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

服务器在目前生产、生活中经常使用,用于对客户端提供服务,当同时对服务器进行访问的客户端过多时,将导致服务器压力过大,性能降低,甚至于服务器崩溃。用于文字识别的服务器在访问量过多时,同样存在压力过大,性能降低,甚至于服务器崩溃的问题。传统方法对于上述问题没有很好的解决方案,亟需能够解决由访问量过多带来的服务器性能降低的问题的技术方案。本申请根据判断客户端上传服务器的图片是否曾经上传过服务器的结果,从而针对不同的客户端动态调节时间阈值,以在保证对客户端的服务质量的前提下,减轻服务器的压力。

如上述步骤s1所述,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值。其中所述指定接口用于接口客户端的文字图片。当调用指定接口的客户端过多时,会使服务器的压力过大,例如客户端每隔一段时间轮询指定接口,当高并发的情况存在时,同时调用指定接口的客户端过多,使服务器的压力过大。因此本申请采用预设的时间阈值的方式,避免同一客户端在预设的时间阈值之内多次调用指定接口,从而降低服务器压力。

如上述步骤s2所述,若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。若所述时间间隔大于预设的时间阈值,表明所述客户端并非频繁调用指定接口,因此允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。其中,所述文字图片指包括文字的图片,例如客户端对纸质书籍进行拍照、扫描而获得的包括文字的图片。

如上述步骤s3所述,利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字。所述图片文字识别技术用于对图片进去识别,从而提出图片中的文字信息。所述图片文字识别技术可采用现有的已成熟识别技术,例如ocr技术(ocr技术是光学字符识别的缩写(opticalcharacterrecognition),是可用于图像信息转化为可以使用的计算机输入技术),在此不再赘述。据此,可获得由指定文字图片中提出得到的指定识别文字。进一步地,利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字包括:利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积,从而通过识别更小的区域内的文字即可,能够进一步减小服务器的压力。

如上述步骤s4所述,利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果。其中,预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值可为任意方法,例如:采用wmd算法(wordmover’sdistance)、simhash算法、基于余弦相似度、词频向量的算法以计算所述指定识别文字与预存的前次识别文字的相似程度值。进一步地,利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值包括:利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果,从而利用识别得到的更小的区域内的文字即可判断指定识别文字与前次识别文字是否相似,还能进一步减小服务器的压力(减少计算量)。

如上述步骤s5所述,判断所述相似程度值是否大于预设的相似程度阈值。所述相似程度值反应了客户端上传的指定文字图片与最近一次上传的文字图片是否相同。若所述相似程度值大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片相同;若所述相似程度值不大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片不同。

如上述步骤s6所述,若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。若所述相似程度值大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片相同(例如客户端处于待机状态,并且图像采集设备仍在采集相同的图片并上传至服务器),由于客户端已经具有文字图片的识别结果(服务器已将对最近一次上传的文字图片的识别结果发送给了客户端),因此没有必要将对指定文字图片的扫描结果发送给客户端,据此向所述客户端发送无需更新识别文字的信息(客户端根据所述信息,调用本地存储的识别文字即可),从而减少了发送信息的开销,进一步减小服务器压力。并且,由于客户端本次上传的文字图片与最近一次上传的文字图片相同,表明所述客户端实际调用指定接口的需求较低,据此增大所述时间阈值,从而进一步减少服务器的压力。其中,预设的时间阈值调整规则例如为:统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;利用所述成功次数/所述总次数的商值,根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数;在所述时间阈值的基础上增加所述指定时间阈值调整参数。进一步地,所述无需更新识别文字的信息还附带有要求所述客户端调取本地存储的前次识别文字并展示的信息。从而客户端从本地存储即可调取并展示与所述指定文字图片的识别结果相同的文字。

在一个实施方式中,所述获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值的步骤s1之后,包括:

s11、若所述时间间隔不大于预设的时间阈值,则获取所述服务器的当前访问人数;

s12、判断所述当前访问人数是否大于预设的人数阈值;

s13、若所述当前访问人数大于预设的人数阈值,则拒绝所述调用申请。

如上所述,实现了拒绝所述调用申请。若所述时间间隔不大于预设的时间阈值,表明所述客户端频繁调用指定接口,但是若服务器当前的压力不大,那么仍旧可以给所述客户端提供服务。因此获取所述服务器的当前访问人数,判断所述当前访问人数是否大于预设的人数阈值,若所述当前访问人数大于预设的人数阈值,表明服务器压力过大,据此拒绝所述调用申请。进一步地,若所述当前访问人数不大于预设的人数阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。

在一个实施方式中,所述利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字的步骤s3,包括:

st3、利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积;

所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤s4,包括:

st4、利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果。

如上所述,实现了通过采用预定区域的方式,进一步减少服务器压力。本实施方式中,获得的指定识别文字为所述指定文字图片中的预定区域中的文字,因此服务器并不需要对整个指定文字图中进行识别,而仅需识别预定区域即可,从而减少计算量以减少服务器压力。相应地,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果,从而在计算相似程度值时,利用识别得到的更小的区域内的文字即可判断指定识别文字与前次识别文字是否相似,从而进一步减小服务器的压力(减少计算量)。

在一个实施方式中,所述调用申请携带有用户唯一标识,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤s4之前,包括:

s31、利用所述用户唯一标识,根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本,其中所述识别文本的最近一次添加的识别文字标记有阅读标识;

s32、通过在所述客户端对应的识别文本中查询所述阅读标识,从而得到所述前次识别文字。

如上所述,实现了获取所述前次识别文字。所述调用申请携带有用户唯一标识,因此服务器通过用户唯一标识,即可唯一确定所述客户端对应的用户,再根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本(所述服务器预先保存有所述客户端之前上传的文字图片的识别结果)。而所述识别文本的最近一次添加的识别文字标记有阅读标识,即所述阅读标识标记的内容为所述客户端最近一次发送的待识别文字图片的识别结果,因此通过在所述客户端对应的识别文本中查询所述阅读标识,即可得到所述前次识别文字。

在一个实施方式中,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤s4,包括:

s401、采用公式:

计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;其中similarity为相似度,a为所述指定识别文字的词频向量,b为所述前次识别文字的词频向量,ai为所述指定识别文字的第i个单词出现的次数,bi为所述前次识别文字的第i个单词出现的次数。

如上所述,实现了计算所述指定识别文字与预存的前次识别文字的相似程度值。所述词频向量是以文字内容中的各词出现的次数(频率)作为向量的维度数值,所构成的多维向量。即a=(a1,a2,…,an),其中an为最后一个词(共有n个词)的词频。所述相似度算法是根据两个节点的文字内容的余弦相似度进行计算得到,以反应两个节点的文字内容间的相似程度。当similarity的值越接近于1,表明越相似;越接近于0,表明越不相似。

在一个实施方式中,所述判断所述相似程度值是否大于预设的相似程度阈值的步骤s5之后,包括:

s51、若所述相似程度值不大于预设的相似程度阈值,则将所述指定识别文字发送给所述客户端;

s52、根据预设的时间阈值调整规则,减小所述时间阈值。

如上所述,实现了动态调整所述时间阈值。若所述相似程度值不大于预设的相似程度阈值,表明所述指定文字图片与所述客户端最近一次发送的待识别文字图片不相同,因此需要将所述指定识别文字发送给所述客户端。并且所述客户端具有连续识别文字的需求,因此根据预设的时间阈值调整规则,减小所述时间阈值。进一步地,所述时间阈值的减小数值与预定时间内所述客户端成功调用所述指定接口的次数成正比,从而满足所述客户端对于快速文字识别的需要。

在一个实施方式中,所述若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值的步骤s6,包括:

s601、统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;

s602、计算出所述成功次数/所述总次数的商值,并根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数,其中所述指定时间阈值调整参数大于0;

s603、在所述时间阈值的基础上增加所述指定时间阈值调整参数。

如上所述,实现了根据预设的时间阈值调整规则,增大所述时间阈值。本实施方式利用历史数据:在指定时间内,所述客户端调用所述指定接口的总次数与成功次数,并利用所述成功次数/所述总次数的商值以确定所述客户端对于文字识别的需求的迫切程度。当所述成功次数/所述总次数的商值较高时,相应的所述客户端对于文字识别的需求的迫切程度较高,此时对应的时间阈值调整参数也较大。据此,预设商值与时间阈值调整参数的对应关系。从而,利用所述成功次数/所述总次数的商值,根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数。并在所述时间阈值的基础上增加所述指定时间阈值调整参数,即可得到调整后的时间阈值,从而实现了动态调整时间阈值,进而减少了服务器的压力。

本申请的动态调整时间阈值的方法,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则接收所述客户端通过所述指定接口发送的指定文字图片;识别所述指定文字图片,得到指定识别文字;计算所述指定识别文字与预存的前次识别文字的相似程度值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。从而在保证对客户端的服务质量的前提下,降低服务器压力。

参照图2,本申请实施例提供一种动态调整时间阈值的装置,应用于服务器,包括:

调用申请获取单元10,用于获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;

指定文字图片接收单元20,用于若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;

指定识别文字获取单元30,用于利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;

相似程度值计算单元40,用于利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;

相似程度值判断单元50,用于判断所述相似程度值是否大于预设的相似程度阈值;

时间阈值增大单元60,用于若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

服务器在目前生产、生活中经常使用,用于对客户端提供服务,当同时对服务器进行访问的客户端过多时,将导致服务器压力过大,性能降低,甚至于服务器崩溃。用于文字识别的服务器在访问量过多时,同样存在压力过大,性能降低,甚至于服务器崩溃的问题。传统方法对于上述问题没有很好的解决方案,亟需能够解决由访问量过多带来的服务器性能降低的问题的技术方案。本申请根据判断客户端上传服务器的图片是否曾经上传过服务器的结果,从而针对不同的客户端动态调节时间阈值,以在保证对客户端的服务质量的前提下,减轻服务器的压力。

如上述单元10所述,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值。其中所述指定接口用于接口客户端的文字图片。当调用指定接口的客户端过多时,会使服务器的压力过大,例如客户端每隔一段时间轮询指定接口,当高并发的情况存在时,同时调用指定接口的客户端过多,使服务器的压力过大。因此本申请采用预设的时间阈值的方式,避免同一客户端在预设的时间阈值之内多次调用指定接口,从而降低服务器压力。

如上述单元20所述,若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。若所述时间间隔大于预设的时间阈值,表明所述客户端并非频繁调用指定接口,因此允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。其中,所述文字图片指包括文字的图片,例如客户端对纸质书籍进行拍照、扫描而获得的包括文字的图片。

如上述单元30所述,利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字。所述图片文字识别技术用于对图片进去识别,从而提出图片中的文字信息。所述图片文字识别技术可采用现有的已成熟识别技术,例如ocr技术(ocr技术是光学字符识别的缩写(opticalcharacterrecognition),是可用于图像信息转化为可以使用的计算机输入技术),在此不再赘述。据此,可获得由指定文字图片中提出得到的指定识别文字。进一步地,利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字包括:利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积,从而通过识别更小的区域内的文字即可,能够进一步减小服务器的压力。

如上述单元40所述,利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果。其中,预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值可为任意方法,例如:采用wmd算法(wordmover’sdistance)、simhash算法、基于余弦相似度、词频向量的算法以计算所述指定识别文字与预存的前次识别文字的相似程度值。进一步地,利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值包括:利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果,从而利用识别得到的更小的区域内的文字即可判断指定识别文字与前次识别文字是否相似,还能进一步减小服务器的压力(减少计算量)。

如上述单元50所述,判断所述相似程度值是否大于预设的相似程度阈值。所述相似程度值反应了客户端上传的指定文字图片与最近一次上传的文字图片是否相同。若所述相似程度值大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片相同;若所述相似程度值不大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片不同。

如上述单元60所述,若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。若所述相似程度值大于预设的相似程度阈值,表明指定文字图片与最近一次上传的文字图片相同(例如客户端处于待机状态,并且图像采集设备仍在采集相同的图片并上传至服务器),由于客户端已经具有文字图片的识别结果(服务器已将对最近一次上传的文字图片的识别结果发送给了客户端),因此没有必要将对指定文字图片的扫描结果发送给客户端,据此向所述客户端发送无需更新识别文字的信息(客户端根据所述信息,调用本地存储的识别文字即可),从而减少了发送信息的开销,进一步减小服务器压力。并且,由于客户端本次上传的文字图片与最近一次上传的文字图片相同,表明所述客户端实际调用指定接口的需求较低,据此增大所述时间阈值,从而进一步减少服务器的压力。其中,预设的时间阈值调整规则例如为:统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;利用所述成功次数/所述总次数的商值,根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数;在所述时间阈值的基础上增加所述指定时间阈值调整参数。进一步地,所述无需更新识别文字的信息还附带有要求所述客户端调取本地存储的前次识别文字并展示的信息。从而客户端从本地存储即可调取并展示与所述指定文字图片的识别结果相同的文字。

在一个实施方式中,所述装置,包括:

当前访问人数获取单元,用于若所述时间间隔不大于预设的时间阈值,则获取所述服务器的当前访问人数;

人数阈值判断单元,用于判断所述当前访问人数是否大于预设的人数阈值;

拒绝调用单元,用于若所述当前访问人数大于预设的人数阈值,则拒绝所述调用申请。

如上所述,实现了拒绝所述调用申请。若所述时间间隔不大于预设的时间阈值,表明所述客户端频繁调用指定接口,但是若服务器当前的压力不大,那么仍旧可以给所述客户端提供服务。因此获取所述服务器的当前访问人数,判断所述当前访问人数是否大于预设的人数阈值,若所述当前访问人数大于预设的人数阈值,表明服务器压力过大,据此拒绝所述调用申请。进一步地,若所述当前访问人数不大于预设的人数阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片。

在一个实施方式中,所述指定识别文字获取单元30,包括:

指定识别文字获取子单元,用于利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积;

所述相似程度值计算单元40,包括:

相似程度值计算子单元,用于利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果。

如上所述,实现了通过采用预定区域的方式,进一步减少服务器压力。本实施方式中,获得的指定识别文字为所述指定文字图片中的预定区域中的文字,因此服务器并不需要对整个指定文字图中进行识别,而仅需识别预定区域即可,从而减少计算量以减少服务器压力。相应地,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果,从而在计算相似程度值时,利用识别得到的更小的区域内的文字即可判断指定识别文字与前次识别文字是否相似,从而进一步减小服务器的压力(减少计算量)。

在一个实施方式中,所述调用申请携带有用户唯一标识,所述装置,包括:

识别文本确定单元,用于利用所述用户唯一标识,根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本,其中所述识别文本的最近一次添加的识别文字标记有阅读标识;

前次识别文字获取单元,用于通过在所述客户端对应的识别文本中查询所述阅读标识,从而得到所述前次识别文字。

如上所述,实现了获取所述前次识别文字。所述调用申请携带有用户唯一标识,因此服务器通过用户唯一标识,即可唯一确定所述客户端对应的用户,再根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本(所述服务器预先保存有所述客户端之前上传的文字图片的识别结果)。而所述识别文本的最近一次添加的识别文字标记有阅读标识,即所述阅读标识标记的内容为所述客户端最近一次发送的待识别文字图片的识别结果,因此通过在所述客户端对应的识别文本中查询所述阅读标识,即可得到所述前次识别文字。

在一个实施方式中,所述相似程度值计算单元40,包括:

相似程度值计算子单元,用于采用公式:

计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;其中similarity为相似度,a为所述指定识别文字的词频向量,b为所述前次识别文字的词频向量,ai为所述指定识别文字的第i个单词出现的次数,bi为所述前次识别文字的第i个单词出现的次数。

如上所述,实现了计算所述指定识别文字与预存的前次识别文字的相似程度值。所述词频向量是以文字内容中的各词出现的次数(频率)作为向量的维度数值,所构成的多维向量。即a=(a1,a2,…,an),其中an为最后一个词(共有n个词)的词频。所述相似度算法是根据两个节点的文字内容的余弦相似度进行计算得到,以反应两个节点的文字内容间的相似程度。当similarity的值越接近于1,表明越相似;越接近于0,表明越不相似。

在一个实施方式中,所述装置,包括:

指定识别文字发送单元,用于若所述相似程度值不大于预设的相似程度阈值,则将所述指定识别文字发送给所述客户端;

时间阈值减小单元,用于根据预设的时间阈值调整规则,减小所述时间阈值。

如上所述,实现了动态调整所述时间阈值。若所述相似程度值不大于预设的相似程度阈值,表明所述指定文字图片与所述客户端最近一次发送的待识别文字图片不相同,因此需要将所述指定识别文字发送给所述客户端。并且所述客户端具有连续识别文字的需求,因此根据预设的时间阈值调整规则,减小所述时间阈值。进一步地,所述时间阈值的减小数值与预定时间内所述客户端成功调用所述指定接口的次数成正比,从而满足所述客户端对于快速文字识别的需要。

在一个实施方式中,所述时间阈值增大单元60,包括:

调用次数统计子单元,用于统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;

指定时间阈值调整参数获取子单元,用于计算出所述成功次数/所述总次数的商值,并根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数,其中所述指定时间阈值调整参数大于0;

指定时间阈值调整参数增加子单元,用于在所述时间阈值的基础上增加所述指定时间阈值调整参数。

如上所述,实现了根据预设的时间阈值调整规则,增大所述时间阈值。本实施方式利用历史数据:在指定时间内,所述客户端调用所述指定接口的总次数与成功次数,并利用所述成功次数/所述总次数的商值以确定所述客户端对于文字识别的需求的迫切程度。当所述成功次数/所述总次数的商值较高时,相应的所述客户端对于文字识别的需求的迫切程度较高,此时对应的时间阈值调整参数也较大。据此,预设商值与时间阈值调整参数的对应关系。从而,利用所述成功次数/所述总次数的商值,根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数。并在所述时间阈值的基础上增加所述指定时间阈值调整参数,即可得到调整后的时间阈值,从而实现了动态调整时间阈值,进而减少了服务器的压力。

本申请的动态调整时间阈值的装置,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则接收所述客户端通过所述指定接口发送的指定文字图片;识别所述指定文字图片,得到指定识别文字;计算所述指定识别文字与预存的前次识别文字的相似程度值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。从而在保证对客户端的服务质量的前提下,降低服务器压力。

参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储动态调整时间阈值的方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种动态调整时间阈值的方法。

上述处理器执行上述动态调整时间阈值的方法,包括以下步骤:获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;判断所述相似程度值是否大于预设的相似程度阈值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

在一个实施方式中,所述获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值的步骤之后,包括:若所述时间间隔不大于预设的时间阈值,则获取所述服务器的当前访问人数;判断所述当前访问人数是否大于预设的人数阈值;若所述当前访问人数大于预设的人数阈值,则拒绝所述调用申请。

在一个实施方式中,所述利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字的步骤,包括:利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积;所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果。

在一个实施方式中,所述调用申请携带有用户唯一标识,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤之前,包括:利用所述用户唯一标识,根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本,其中所述识别文本的最近一次添加的识别文字标记有阅读标识;通过在所述客户端对应的识别文本中查询所述阅读标识,从而得到所述前次识别文字。

在一个实施方式中,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:

采用公式:

计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;其中similarity为相似度,a为所述指定识别文字的词频向量,b为所述前次识别文字的词频向量,ai为所述指定识别文字的第i个单词出现的次数,bi为所述前次识别文字的第i个单词出现的次数。

在一个实施方式中,所述判断所述相似程度值是否大于预设的相似程度阈值的步骤之后,包括:若所述相似程度值不大于预设的相似程度阈值,则将所述指定识别文字发送给所述客户端;根据预设的时间阈值调整规则,减小所述时间阈值。

在一个实施方式中,所述若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值的步骤,包括:统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;计算出所述成功次数/所述总次数的商值,并根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数,其中所述指定时间阈值调整参数大于0;在所述时间阈值的基础上增加所述指定时间阈值调整参数。

本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请的计算机设备,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则接收所述客户端通过所述指定接口发送的指定文字图片;识别所述指定文字图片,得到指定识别文字;计算所述指定识别文字与预存的前次识别文字的相似程度值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。从而在保证对客户端的服务质量的前提下,降低服务器压力。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现动态调整时间阈值的方法,包括以下步骤:获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则允许所述客户端调用所述指定接口,并接收所述客户端通过所述指定接口发送的指定文字图片;利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字;利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;判断所述相似程度值是否大于预设的相似程度阈值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。

在一个实施方式中,所述获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值的步骤之后,包括:若所述时间间隔不大于预设的时间阈值,则获取所述服务器的当前访问人数;判断所述当前访问人数是否大于预设的人数阈值;若所述当前访问人数大于预设的人数阈值,则拒绝所述调用申请。

在一个实施方式中,所述利用预设的图片文字识别技术识别所述指定文字图片,得到指定识别文字的步骤,包括:利用预设的图片文字识别技术识别所述指定文字图片中的预定区域,得到指定识别文字,其中预定区域的面积小于所述指定文字图片的面积;所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字中的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片中的预定区域的识别结果。

在一个实施方式中,所述调用申请携带有用户唯一标识,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤之前,包括:利用所述用户唯一标识,根据预设的用户唯一标识与识别文本的对应关系,确定所述客户端对应的识别文本,其中所述识别文本的最近一次添加的识别文字标记有阅读标识;通过在所述客户端对应的识别文本中查询所述阅读标识,从而得到所述前次识别文字。

在一个实施方式中,所述利用预设的相似度计算方法,计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果的步骤,包括:

采用公式:

计算所述指定识别文字与预存的前次识别文字的相似程度值,所述前次识别文字是所述服务器对所述客户端最近一次发送的待识别文字图片的识别结果;其中similarity为相似度,a为所述指定识别文字的词频向量,b为所述前次识别文字的词频向量,ai为所述指定识别文字的第i个单词出现的次数,bi为所述前次识别文字的第i个单词出现的次数。

在一个实施方式中,所述判断所述相似程度值是否大于预设的相似程度阈值的步骤之后,包括:若所述相似程度值不大于预设的相似程度阈值,则将所述指定识别文字发送给所述客户端;根据预设的时间阈值调整规则,减小所述时间阈值。

在一个实施方式中,所述若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值的步骤,包括:统计在指定时间内,所述客户端调用所述指定接口的总次数与成功次数;计算出所述成功次数/所述总次数的商值,并根据预设的商值与时间阈值调整参数的对应关系,获得与所述成功次数/所述总次数的商值对应的指定时间阈值调整参数,其中所述指定时间阈值调整参数大于0;在所述时间阈值的基础上增加所述指定时间阈值调整参数。

本申请的计算机可读存储介质,获取客户端发送的对指定接口的调用申请,并判断所述服务器的当前时间与所述客户端最近一次调用所述指定接口的时间点的时间间隔是否大于预设的时间阈值;若所述时间间隔大于预设的时间阈值,则接收所述客户端通过所述指定接口发送的指定文字图片;识别所述指定文字图片,得到指定识别文字;计算所述指定识别文字与预存的前次识别文字的相似程度值;若所述相似程度值大于预设的相似程度阈值,则向所述客户端发送无需更新识别文字的信息,并根据预设的时间阈值调整规则,增大所述时间阈值。从而在保证对客户端的服务质量的前提下,降低服务器压力。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1