一种便携式智能汉藏文字互译机的制作方法

文档序号:31053238发布日期:2022-08-06 08:56阅读:99来源:国知局
一种便携式智能汉藏文字互译机的制作方法

1.本发明属于通信技术技术领域,具体为一种便携式智能汉藏文字互译机。


背景技术:

2.翻译机就是用计算机实现一种自然语言到另一种自然语言的转换。一般指自然语言之间句子和全文的翻译。
3.在进行汉藏之间交流时,需要进行互译机的使用才能进行有效沟通,而现有的互译机在进行翻译时一般都为翻译结果直出,对于不同语言顺序使用习惯的人来说,有些语序的不同可能造成理解上的歧义,因此造成后续沟通问题;因此,针对目前的状况,现需对其进行改进。


技术实现要素:

4.针对上述情况,为克服现有技术的缺陷,本发明提供一种便携式智能汉藏文字互译机,有效的解决了在进行汉藏之间交流时,需要进行互译机的使用才能进行有效沟通,而现有的互译机在进行翻译时一般都为翻译结果直出,对于不同语言顺序使用习惯的人来说,有些语序的不同可能造成理解上的歧义,因此造成后续沟通问题的问题。
5.为实现上述目的,本发明提供如下技术方案:一种便携式智能汉藏文字互译机,所述便携式智能汉藏文字互译机包括文字采集系统、语音采集系统、文字处理系统、语音处理系统、智能互译系统、语序修正系统以及结果输出系统;
6.文字采集系统:所述文字采集系统用于对插入设备端显示页面中的所有文字进行采集,所述文字采集系统具体为基于小波变换的文字检测算法以及基于gabor变换的文字检测算法的综合的文字采集检测技术;
7.语音采集系统:所述语音采集系统用于在谈话中根据设定对谈话一方的语音数据进行采集并特征提取,所述语音采集系统具体为mel频率倒谱系数、线性预测系数、线谱频率和感知线性预测综合的语音数据采集以及特征提取技术;
8.文字处理系统:所述文字处理系统用于对文字采集系统所采集到的文字数据进行格式转换、拼写检查、顺序调整、数据切片以及数据集的预处理;
9.语音处理系统:所述语音处理系统用于对语音采集系统所采集到的语音数据进行字词识别处理、智能调序处理以及句子构成处理,在句子构成后,将其发送至文字处理系统;
10.智能互译系统:所述智能互译系统用于对经过文字处理系统处理后的文字数据进行数据batching处理,并在处理过后将数据代入转换模型中进行文字互译转换;
11.语序修正系统:所述语序修正系统用于通过学习使用者的常用语句顺序,并在文字互译转换过后,将语句按照使用者的常用语句顺序进行智能语序调整修正;
12.结果输出系统:所述结果输出系统用于对翻译结果进行输出,在输出时的形式可通过设定进行选择,包括文字文件终端的发送、文字屏幕显示以及语音输出。
13.优选的,所述文字采集系统在进行设备端显示页面文字采集时分为视频页面文字采集以及纯文字页面采集,在进行视频页面文字采集时,对文字的检测采用帧差法、多帧综合法或时空切片法中的一种或几种的组合,对文字的定位采用纹理法、边缘法或机器学习法中的一种或几种的组合。
14.优选的,所述语音采集系统在进行特征提取时具体过程为:对采集到的语音数据进行分析和处理,同时对冗余信息进行取出,提取表达语言含义的特征信息。
15.优选的,所述文字处理系统中所述格式转换用于将设备端显示页面中的所有文字转换成所述便携式智能汉藏文字互译机可处理格式;所述拼写检查用于对经过格式转换的文字文件进行拼写检查;所述顺序调整用于根据拼写检查的结果对存在歧义的语句进行智能调整;所述数据切片用于对经过顺序调整的文字文件每一个字以及标点符号用空格隔开,以形成分隔;所述数据集的预处理用于将经过数据切片的文字与翻译数据库中编号数据进行对应映射。
16.优选的,所述语音处理系统中所述字词识别处理用于对经过特征提取的语音数据进行最小单元字词的识别;所述智能调序处理用于对字词识别处理识别出的字词进行顺序调整,在进行调整时,以前后意思当作辅助调整条件;所述句子构成处理用于对经过顺序调整的字词进行连接,同时根据语句意思调整句子构成。
17.优选的,所述智能互译系统中的所述数据batching处理用于将较短的句子补齐到与同batch内最长句子相同的长度;所述转换模型具体为基于云翻译技术的基准翻译模型。
18.优选的,所述语序修正系统具体为基于神经网络的ai智能学习法,所述语序修正系统在进行学习时对学习使用者的常用语句进行采集并存储学习。
19.优选的,包括机体,所述机体的左侧设置有usb接口,所述机体的右侧开设有充电孔,所述充电孔内腔设置有防尘塞,所述机体顶部设置有显示屏和操作按键,且所述机体的前后侧均设置有收音扩音件。
20.与现有技术相比,本发明的有益效果是:1、本发明,在进行汉藏文字的互译时,通过对使用者的常用语句进行采集并存储学习,接着在使用者使用过程中,互译机的语序修正系统根据使用者的常用语句顺序对翻译结果进行自动修正,避免因直译文字顺序对使用者理解造成歧义,从而使得翻译结果更准确,减少理解错误,使得此互译机更加人性化,智能化;
21.2、本发明,不仅可以在终端进行页面文字的翻译,且可用于在人与人交流时对语音进行采集,并根据需要采取对应翻译,因此可进行人机两用,满足不同需求,适用范围更广;
22.3、本发明,体积小,便于携带和使用,且可以根据需要进行不同的结果输出,从而能够满足使用需求。
附图说明
23.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
24.在附图中:
25.图1为本发明一种一种便携式智能汉藏文字互译机框图;
26.图2为本发明一种便携式智能汉藏文字互译机使用流程图;
27.图3为本发明一种便携式智能汉藏文字互译机结构图;
28.其中,100、机体;101、usb接口;102、显示屏;103、操作按键;104、充电孔;105、防尘塞;106、收音扩音件。
具体实施方式
29.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
30.如图1所示,本发明提供一种技术方案:一种便携式智能汉藏文字互译机,便携式智能汉藏文字互译机包括文字采集系统、语音采集系统、文字处理系统、语音处理系统、智能互译系统、语序修正系统以及结果输出系统;
31.文字采集系统:文字采集系统用于对插入设备端显示页面中的所有文字进行采集,文字采集系统具体为基于小波变换的文字检测算法以及基于gabor变换的文字检测算法的综合的文字采集检测技术;
32.语音采集系统:语音采集系统用于在谈话中根据设定对谈话一方的语音数据进行采集并特征提取,语音采集系统具体为mel频率倒谱系数、线性预测系数、线谱频率和感知线性预测综合的语音数据采集以及特征提取技术;
33.文字处理系统:文字处理系统用于对文字采集系统所采集到的文字数据进行格式转换、拼写检查、顺序调整、数据切片以及数据集的预处理;
34.语音处理系统:语音处理系统用于对语音采集系统所采集到的语音数据进行字词识别处理、智能调序处理以及句子构成处理,在句子构成后,将其发送至文字处理系统;
35.智能互译系统:智能互译系统用于对经过文字处理系统处理后的文字数据进行数据batching处理,并在处理过后将数据代入转换模型中进行文字互译转换;
36.语序修正系统:语序修正系统用于通过学习使用者的常用语句顺序,并在文字互译转换过后,将语句按照使用者的常用语句顺序进行智能语序调整修正;
37.结果输出系统:结果输出系统用于对翻译结果进行输出,在输出时的形式可通过设定进行选择,包括文字文件终端的发送、文字屏幕显示以及语音输出。
38.其中,文字采集系统在进行设备端显示页面文字采集时分为视频页面文字采集以及纯文字页面采集,在进行视频页面文字采集时,对文字的检测采用帧差法、多帧综合法或时空切片法中的一种或几种的组合,对文字的定位采用纹理法、边缘法或机器学习法中的一种或几种的组合;语音采集系统在进行特征提取时具体过程为:对采集到的语音数据进行分析和处理,同时对冗余信息进行取出,提取表达语言含义的特征信息;文字处理系统中格式转换用于将设备端显示页面中的所有文字转换成便携式智能汉藏文字互译机可处理格式;拼写检查用于对经过格式转换的文字文件进行拼写检查;顺序调整用于根据拼写检查的结果对存在歧义的语句进行智能调整;数据切片用于对经过顺序调整的文字文件每一个字以及标点符号用空格隔开,以形成分隔;数据集的预处理用于将经过数据切片的文字与翻译数据库中编号数据进行对应映射;语音处理系统中字词识别处理用于对经过特征提
取的语音数据进行最小单元字词的识别;智能调序处理用于对字词识别处理识别出的字词进行顺序调整,在进行调整时,以前后意思当作辅助调整条件;句子构成处理用于对经过顺序调整的字词进行连接,同时根据语句意思调整句子构成;智能互译系统中的数据batching处理用于将较短的句子补齐到与同batch内最长句子相同的长度;转换模型具体为基于云翻译技术的基准翻译模型;语序修正系统具体为基于神经网络的ai智能学习法,语序修正系统在进行学习时对学习使用者的常用语句进行采集并存储学习。
39.在进行汉藏文字的互译时,通过对使用者的常用语句进行采集并存储学习,接着在使用者使用过程中,互译机的语序修正系统根据使用者的常用语句顺序对翻译结果进行自动修正,避免因直译文字顺序对使用者理解造成歧义,从而使得翻译结果更准确,减少理解错误,使得此互译机更加人性化,智能化。
40.如图3所示,包括机体100,机体100的左侧固定连接有usb接口101,usb接口101用于将互译机和设备端进行连接,以对设备端显示页面中的所有文字进行采集,机体100的右侧开设有充电孔104,充电孔104内腔设置有防尘塞105,防尘塞105用于对充电孔104进行防尘,避免其长期落入灰尘,造成损坏,机体100顶部设置有显示屏102和操作按键103,显示屏102用于显示翻译文字,操作按键103用于设置模式以及控制互译机的开关,且机体100的前后侧均设置有收音扩音件106,收音扩音件106用于对语音数据进行采集,且用于进行语音结果输出,不仅可以在终端进行页面文字的翻译,且可用于在人与人交流时对语音进行采集,并根据需要采取对应翻译,因此可进行人机两用,满足不同需求,适用范围更广;同时该互译机体积小,便于携带和使用,且可以根据需要进行不同的结果输出,从而能够满足使用需求。
41.实施例一
42.如图2所示,一种便携式智能汉藏文字互译机使用流程如下:
43.①
:在使用互译机前,首先使用3-5天,通过其语序修正系统对使用者的常用语句进行采集并存储学习;
44.②
:在用户需要进行设备页面文字的翻译时,则将互译机的usb接口101插入设备端口,通过操作按键103将互译机设置成文字互译模式,通过文字采集系统对设备端显示页面中的所有文字进行采集,并通过文字处理系统对采集到的文字进行格式转换、拼写检查、顺序调整、数据切片以及数据集的预处理;
45.③
:在用户需要进行对话中的翻译时,则直接通过操作按键103将互译机设置成语音互译模式,并设定需要翻译的语音,通过语音采集系统对谈话一方的语音数据进行采集并特征提取,同时通过语音处理系统对采集到的语音数据进行字词识别处理、智能调序处理以及句子构成处理,在句子构成后,将其发送至文字处理系统,再通过文字处理系统对其进行同

中的操作;
46.④
:在文字处理系统处理完毕后,通过智能互译系统对处理后的文字数据进行数据batching处理,并在处理过后将数据代入转换模型中进行文字互译转换,并在转换后通过语序修正系统按照使用者的常用语句顺序进行智能语序调整修正,再根据设定的输出格式,进行文字文件终端的发送、文字屏幕显示或语音输出。
47.实施例二
48.转换模型的生成步骤如下:
49.①
:通过云翻译技术对网络数据进行采集;
50.②
:对采集到的数据进行数据切片以及数据集预处理;
51.③
:将数据进行batching;
52.④
:将数据代入模型进行学习训练;
53.⑤
:对学习后的模型进行逆推测试,完成模型建立。
54.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
55.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1