支持全球语言翻译的方法及手机与流程

文档序号:16403139发布日期:2018-12-25 20:14阅读:284来源:国知局
支持全球语言翻译的方法及手机与流程

本发明涉及通信及翻译技术领域,具体涉及一种支持全球语言翻译的方法及手机。

背景技术

翻译是将一种相对陌生的表达方式,转换成相对熟悉的表达方式的过程。其内容有语言、文字、图形、符号的翻译。是增强促进人们社会交流发展的重要手段。

现有的翻译针对不同语种来实现翻译,不发实现同语种的不同地区之间的语言翻译,例如,对于粤语,90%以上的中国人均是听不懂的,另外对于江浙话、上海话等等地方话(俗称:方言),均十分难懂,此种情况,目前手机无法实现翻译,因此无法实现全球语言翻译,影响用户体验度。



技术实现要素:

本发明实施例提供了一种支持全球语言翻译的方法及手机,可以实现方言之间的翻译,提高用户体验度的优点。

第一方面,本发明实施例提供一种支持全球语言翻译的方法,所述方法包括如下步骤:

智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;

智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;

智能手机将该第二方言的第二语音信息通过发声设备播放。

可选的,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:

提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。

可选的,所述识别该第一语音信息对应的第一语种以及第一方言具体包括:

提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。

可选的,所述获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法具体包括:

如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。

第二方面,提供一种智能手机,所述智能手机包括:处理器、通信单元和发声设备,

所述通信单元,用于接收终端发送的通话请求,接通该通话请求,建立通话连接,接收该通话连接传送的第一语音信息;

所述处理器,用于识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息,控制所述发声设备将该第二方言的第二语音信息播放。

可选的,所述处理器,具体用于提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。

可选的,所述处理器,具体提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。

可选的,所述处理器,具体用于如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。

第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面提供的方法。

实施本发明实施例,具有如下有益效果:

可以看出,本申请提供的技术方案在接收通话请求时,接听该通话请求建立通话连接,依据该通话连接接收第一语音信息后,确定第一语音信息的第一语种以及第一方言,然后提取与第一方言对应的翻译模型来实现对第一方言翻译成第二方言的第二语音信息,这样就实现了同种语种的不同方言的翻译,降低了沟通交流成本,提高了用户体验度。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是一种终端的结构示意图。

图2是一种支持全球语言翻译的方法的流程示意图。

图3是一种输入矩阵与权值矩阵的拆分示意图。

图4是本发明实施例提供的智能手机的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

参阅图1,图1为一种终端结构示意图,如图1所示,该终端包括:处理器101、显示屏105、通信模组102、存储器103和扬声器104。

上述处理器101具体可以包括:多核处理器。

可选的,上述处理器101还可以集成神经网络处理芯片。该神经网络处理芯片自身可以携带内存进行数据存储。

参阅图2,图2提供了一种支持全球语言翻译的方法,该方法由如图1所示的终端执行,该终端具体可以为智能手机,该方法如图2所示,包括如下步骤:

步骤s201、智能手机接收终端发送的通话请求,接通该通话请求,建立通话连接;

上述终端可以为手机、平板电脑、pda等等智能设备。

可选的,上述通话请求具体可以为基于2g的通话请求,也可以为基于4g的通话请求,即volte,当然还可以是基于5g的通话请求或短距离通话请求,例如对讲机等等。

步骤s202、智能手机接收该通话连接传送的第一语音信息,识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息;

上述第二方言为预设设定的方言,例如四川话,例如上海话,例如闽南语。例如粤语。

上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:

提取第一语音信息对应的终端的当前位置,识别当前位置的国别为城市,将该国别对应的语言确定为第一语种,将该城市对应的方言确定为第一方言。

具体的,以一个实际的例子来说,如终端a所在位置为中国广州,那么确定中国对应的语言中文为第一语种,确定广州对应的方言粤语确定为第一方言。

上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:

提取第一语言信息对应的终端的号码,确定该号码对应的用户的籍贯,确定该籍贯对应的国家的语言为第一语种,确定该籍贯对应的方言确定为第一方言。

具体的,例如,用户a发送的而第一语言信息,用户a的号码为13901234567,则依据该号码确定归属地为用户a的籍贯为中国北京,则确定中文为第一语种,确定北京对应的方言北京话为第一方言。

可选的,上述识别该第一语音信息对应的第一语种以及第一方言具体可以包括:

将该第一语音信息发送至分类器中进行分类处理得到该第一语音信息对应的第一语种以及第一方言。上述分类器具体可以为,神经网络模型,当然还可以为其他的分类器,例如机器学习、深度学习模型等等。

上述获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法具体可以包括:

如该翻译模型为深度学习模型,确定深度学习模型中第一方言对应的权值的第一位置范围,保留权值的第一位置范围内的元素值,将权值的剩余位置全部置零的该第一方言对应的第一权值,将该第一权值与该第一方言对应的输入数据计算翻译得到第二方言的第二语音信息。

此基于的原理为,例如一个权值,以一个三维数据为例,其可以为权值ci*h*w,其中,ci为深度值、h为高度值、w为宽度值,对于权值的分布,因为该翻译模型需要涉及很多语言,例如科大讯飞的翻译模型能够涉及40多种语言,对于不同的语言,其使用的权值的范围不同,例如,如果为中文,那么其可能使用权值ci*h*w中的1*h*w、2*h*w、3*h*w,即深度层中的第1、2、3层,当然还可以细分,例如粤语为1*h*w,北京话为2*h*w等等,这里不在一一举例。那么其他的权值的计算不仅会增加计算量,其计算的结果也会对翻译结果干扰,所以这里将其他位置范围进行置零,这样避免了其他层的元素值对有效元素值进行影响,提高了翻译的准确性。

可选的,上述将该将该第一方言的第一语音信息翻译成第二方言的第二语音信息的方法可以采用通用的方法来实现,例如科大讯飞的翻译机器人来实现,当然还可以通过其他的方式,例如谷歌语音、苹果语音(siri)来实现。

步骤s203、智能手机将该第二方言的第二语音信息通过发声设备播放。

本申请提供的技术方案在接收通话请求时,接听该通话请求建立通话连接,依据该通话连接接收第一语音信息后,确定第一语音信息的第一语种以及第一方言,然后提取与第一方言对应的翻译模型来实现对第一方言翻译成第二方言的第二语音信息,这样就实现了同种语种的不同方言的翻译,降低了沟通交流成本,提高了用户体验度。

上述将第一语言信息组成输入矩阵e的方法可以采用现有的分类识别算法的输入矩阵组成方法来得到,例如,采集第一语言信息的波形图(例如可以直接通过录音软件来采集该波形图),将该波形图中采样多个值,将多个值按顺序排列组成该输入矩阵。当然还可以采用其他的方式,本申请并不局限上述输入矩阵的组成方式。

上述确将该第一权值与该第一方言对应的输入数据计算如包括矩阵运算,该矩阵运算具体可以包括:

如输入矩阵e与权值矩阵p的矩阵乘法运算,将输入矩阵e按列数拆分成α个列矩阵,将权值矩阵p按行数拆分成α个行矩阵;将α个列矩阵和α个行矩阵分别发送给α个计算单元进行内积运算得到α个矩阵子结果,将α个矩阵子结果对应位置的值相加即得到计算结果。

为了提高计算速度,这里将输入矩阵e以及权值矩阵p按拆分成α个列矩阵与α个行矩阵,然后将列矩阵以及行矩阵对应分发给一个计算装置来计算,例如第1个列矩阵和第1个行矩阵发送第一计算单元,第2个列矩阵和第2个行矩阵发送第二计算单元,以此类推,即能够实现拆分和计算,从而实现并行计算,提高计算速度。

参阅图3,下面以一个实际的例子,为了方便描述,这里的输入矩阵e为5*10矩阵,该权值矩阵为10*1矩阵,

如果α为5,那么对输入矩阵e1按列切割成5个1*10列矩阵,将该10*1矩阵切割成5个2*1矩阵,将第一个1*10列矩阵以及2*1矩阵分配给第一计算单元,同理,将其他的分配个其他4个计算单元进行计算即能够得到5个结果矩阵,然后将5个结果矩阵对应位置的数值相加即为输入矩阵e与权值矩阵的计算结果。

本申请提供的技术方案通过拆分以及并行计算的方法来实现对输入数据与权值数据的并行计算,不仅提高了计算速度,并且对于多个计算单元的内存的要求也较低,因为拆分数据以后的数据量小了,相对的内存也教小,上述计算单元具体可以为,加法器和乘法器的组合。

参阅图4,图4提供一种智能手机,所述智能手机包括:处理器401、通信单元402和发声设备403(扬声器或听筒),

所述通信单元,用于接收终端发送的通话请求,接通该通话请求,建立通话连接,接收该通话连接传送的第一语音信息;

所述处理器,用于识别该第一语音信息对应的第一语种以及第一方言,获取第一方言对应翻译模型将该第一方言的第一语音信息翻译成第二方言的第二语音信息,控制所述发声设备将该第二方言的第二语音信息播放。

本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种支持全球语言翻译的方法的部分或全部步骤。

本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种支持全球语言翻译的方法的部分或全部步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-onlymemory,简称:rom)、随机存取器(英文:randomaccessmemory,简称:ram)、磁盘或光盘等。

以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1