本发明涉及软件方法领域,尤其涉及一种英文翻译方法及系统。
背景技术:
目前,英文翻译只能针对机器输入的单词或句子进行翻译,对于手写的英文,存在翻译速度慢,识别率低的问题,当手写英文存在粘连问题时,会出现无法识别的问题。
因此,现有技术无法对存在粘连问题,或不够规范标准,或其他字体的英文进行准确的识别和翻译。
技术实现要素:
本发明所要解决的技术问题是针对现有技术的不足,提供一种英文翻译方法及系统。
本发明解决上述技术问题的技术方案如下:
一种英文翻译方法,包括:
步骤1,获取待识别的英文字段;
步骤2,判断所述英文字段中包含的英文字符是否能被识别,当不能识别时,执行步骤3至步骤5,当能识别时,执行步骤5;
步骤3,对未能识别的所述英文字符进行水平投影,并得到所述英文字符的水平投影曲线;
步骤4,根据所述水平投影曲线对所述英文字符进行识别;
步骤5,对识别出的所述英文字符进行处理得到字符串,对所述字符串进行翻译。
本发明的有益效果是:本发明提供的一种英文翻译方法,通过获取待识别的英文字段,对英文字段中包含的英文字符进行识别,当不能识别时,对未能识别的英文字符进行水平投影,并得到英文字符的水平投影曲线,根据水平投影曲线对英文字符进行识别,能够提高识别的准确率,实现了对粘连英文或其他字体的英文等不易识别的英文进行识别,再对识别出的英文字符进行处理得到字符串,对字符串进行翻译,能够提高翻译的速度和准确度。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,步骤3中,具体包括:
步骤31,对未能识别的所述英文字符进行水平投影;
步骤32,以所述英文字符的高度为x坐标,以所述英文字符的上沿为所述x坐标的原点,以所述英文字符的高度下水平投影得到的像素个数为y坐标;
步骤33,根据所述x坐标、所述y坐标和所述原点,得到所述英文字符的水平投影曲线。
进一步地,步骤4中,具体包括:
步骤41,检测所述水平投影曲线上每个水平投影点的梯度值;
步骤42,根据所述梯度值,标记处所述水平投影曲线上的发生梯度突变的字符高度的最小值点;
步骤43,获取所述最小值点对应的像素值,以及所述最小值点的上沿高度;
步骤44,将所述像素值与所述上沿高度的差值与预设的差值阈值进行比较,识对所述英文字符进行识别。
进一步地,步骤5中,具体包括:
步骤51,将识别出的所述英文字符分解为多个待识别图像元;
步骤52,将全部所述待识别图像元分别与预设的标准字母表进行对比,并返回对应的标准字母图像元;
步骤53,将所述标准字母图像元按所述英文字符的顺序进行排列,得到字符串;
步骤54,对所述字符串进行翻译。
本发明解决上述技术问题的另一种技术方案如下:
一种英文翻译系统,包括:
获取单元,用于获取待识别的英文字段;
识别单元,用于判断所述英文字段中包含的英文字符是否能被识别,当不能识别时,依次调用投影单元、投影识别单元和翻译单元,当能识别时,调用所述翻译单元;
投影单元,用于对未能识别的所述英文字符进行水平投影,并得到所述英文字符的水平投影曲线;
投影识别单元,用于根据所述水平投影曲线对所述英文字符进行识别;
翻译单元,用于对识别出的所述英文字符进行处理得到字符串,对所述字符串进行翻译。
进一步地,所述投影单元具体用于对未能识别的所述英文字符进行水平投影;以所述英文字符的高度为x坐标,以所述英文字符的上沿为所述x坐标的原点,以所述英文字符的高度下水平投影得到的像素个数为y坐标;根据所述x坐标、所述y坐标和所述原点,得到所述英文字符的水平投影曲线。
进一步地,所述投影识别单元具体用于检测所述水平投影曲线上每个水平投影点的梯度值;根据所述梯度值,标记处所述水平投影曲线上的发生梯度突变的字符高度的最小值点;获取所述最小值点对应的像素值,以及所述最小值点的上沿高度;将所述像素值与所述上沿高度的差值与预设的差值阈值进行比较,识对所述英文字符进行识别。
进一步地,所述翻译单元具体用于将识别出的所述英文字符分解为多个待识别图像元;将全部所述待识别图像元分别与预设的标准字母表进行对比,并返回对应的标准字母图像元;将所述标准字母图像元按所述英文字符的顺序进行排列,得到字符串;对所述字符串进行翻译。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明实施例一提供的一种英文翻译方法的流程示意图;
图2为本发明实施例二提供的一种英文翻译系统的结构框架图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明实施例一提供的一种英文翻译方法的流程示意图,该方法包括:
s1,获取待识别的英文字段;
s2,判断英文字段中包含的英文字符是否能被识别,当不能识别时,执行s3至s5,当能识别时,执行s5;
s3,对未能识别的英文字符进行水平投影,并得到英文字符的水平投影曲线;
s4,根据水平投影曲线对英文字符进行识别;
s5,对识别出的英文字符进行处理得到字符串,对字符串进行翻译。
本实施例提供的一种英文翻译方法,通过获取待识别的英文字段,对英文字段中包含的英文字符进行识别,当不能识别时,对未能识别的英文字符进行水平投影,并得到英文字符的水平投影曲线,根据水平投影曲线对英文字符进行识别,能够提高识别的准确率,实现了对粘连英文或其他字体的英文等不易识别的英文进行识别,再对识别出的英文字符进行处理得到字符串,对字符串进行翻译,能够提高翻译的速度和准确度。
优选地s3中,具体包括:
对未能识别的英文字符进行水平投影;
以英文字符的高度为x坐标,以英文字符的上沿为x坐标的原点,以英文字符的高度下水平投影得到的像素个数为y坐标;
根据x坐标、y坐标和原点,得到英文字符的水平投影曲线。
优选地,s4中,具体包括:
检测水平投影曲线上每个水平投影点的梯度值;
根据梯度值,标记处水平投影曲线上的发生梯度突变的字符高度的最小值点;
获取最小值点对应的像素值,以及最小值点的上沿高度;
将像素值与上沿高度的差值与预设的差值阈值进行比较,识对英文字符进行识别。
优选地,s5中,具体包括:
将识别出的英文字符分解为多个待识别图像元;
将全部待识别图像元分别与预设的标准字母表进行对比,并返回对应的标准字母图像元;
将标准字母图像元按英文字符的顺序进行排列,得到字符串;
对字符串进行翻译。
如图2所示,为本发明实施例二提供的一种英文翻译系统的结构框架图,该系统包括:
获取单元1,用于获取待识别的英文字段;
识别单元2,用于判断英文字段中包含的英文字符是否能被识别,当不能识别时,依次调用投影单元3、投影识别单元4和翻译单元5,当能识别时,调用翻译单元5;
投影单元3,用于对未能识别的英文字符进行水平投影,并得到英文字符的水平投影曲线;
投影识别单元4,用于根据水平投影曲线对英文字符进行识别;
翻译单元5,用于对识别出的英文字符进行处理得到字符串,对字符串进行翻译。
优选地,投影单元3具体用于对未能识别的英文字符进行水平投影;以英文字符的高度为x坐标,以英文字符的上沿为x坐标的原点,以英文字符的高度下水平投影得到的像素个数为y坐标;根据x坐标、y坐标和原点,得到英文字符的水平投影曲线。
优选地,投影识别单元4具体用于检测水平投影曲线上每个水平投影点的梯度值;根据梯度值,标记处水平投影曲线上的发生梯度突变的字符高度的最小值点;获取最小值点对应的像素值,以及最小值点的上沿高度;将像素值与上沿高度的差值与预设的差值阈值进行比较,识对英文字符进行识别。
优选地,翻译单元5具体用于将识别出的英文字符分解为多个待识别图像元;将全部待识别图像元分别与预设的标准字母表进行对比,并返回对应的标准字母图像元;将标准字母图像元按英文字符的顺序进行排列,得到字符串;对字符串进行翻译。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。