应用于网络协议语音的多国语音辨识及翻译幕显像系统的制作方法

文档序号：7893592阅读：203来源：国知局

专利名称：应用于网络协议语音的多国语音辨识及翻译幕显像系统的制作方法
技术领域：
本发明涉及一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，而能执行多国语音辨识及翻译系统，并以字幕呈现。
背景技术：
随着网络的发展，网络协议语音(Voice over Internet Protocol, VOIP),例如SKYPE软件，透过网络传递语音、影像，已逐步地改变传统电话通信的方式，并由于成本便宜、潜在市场庞大，已经是目前网络通信的兵家必争之地。然而，现在对于网络协议语音，虽然提供了网络无国界的方便性，但是仍缺乏实时转换语音并翻译文字的系统，因此，若能够发展应用于网络协议语音的语音辨识及翻译系统，则网络协议语音系统对于未来商业、社群的连系将更为紧密。

发明内容
本发明的主要目的在于提供一种应用于网络协议语音的语音辨识及翻译系统，该系统主要包含多个网络通信装置，而网络通信装置的每一个都包含一设定单元、一网络协议语音(Voice over Internet Protocol, VOIP)单兀、辨识单兀以及翻译单兀。设定单元对于VOIP单元设定所需的语言，发出一语言设定信息至VOIP单元以及一语音决定信息至辨识单元，VOIP单元用以发出一文字信息或一语音信息至另一网络通信装置，或从另一网络通信装置的VOIP单元接收一文字信息或一语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息传送至辨识单元，辨识单元接收该辨识请求信息，当辨识出辨识请求信息的语言与语音决定信息设定的语言相同时，传送一辨识相同信息至该VOIP单元，而该文字信息或语音信息会直接在VOIP单元上呈现，而当辨识出辨识请求信息的语言与语音决定信息设定的语言不相同时，依照语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，翻译单元接收该翻译请求信息，并将该翻译请求信息翻译为所需的语言后，将一翻译的语音及文字信息发送至VOIP单元，从而在VOIP单元上成呈现出翻译后的语音及文字。网络通信装置可以为手机、个人计算机、笔记型计算机、平板计算机、个人数字助理(Personal Digital Assistant, PDA)等，进一步地,可以透过服务器装置，来进行通信，或是在服务器装置上进行辨识及/或翻译的工作，以获得较稳定的频宽以及各种通信结构的变化。本发明的特点在于，能够在常用VOIP直接配合语音/文字及翻译的辨识系统，而使用者收到文字信息或语音信息时，能够藉由辨识单元及翻译单元的辅助，而在自身的VOIP单元显示设定的语言及文字，因而，世界的各种语言隔阂能够透过本发明应用于网络协议语音的语音辨识及翻译系统而能最小化。

图I为本发明第一实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。图2为本发明第二实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。图3为本发明第三实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。图4为本发明第四实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。图5为本发明第五实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。图6为本发明第六实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。其中，附图标记说明如下I应用于网络协议语音的多国语音辨识及翻译幕显像系统2应用于网络协议语音的多国语音辨识及翻译幕显像系统3应用于网络协议语音的多国语音辨识及翻译幕显像系统4应用于网络协议语音的多国语音辨识及翻译幕显像系统5应用于网络协议语音的多国语音辨识及翻译幕显像系统6应用于网络协议语音的多国语音辨识及翻译幕显像系统IOA网络通信装置IOB网络通信装置11设定单元13网络协议语音单元15辨识单元17翻译单元20A网络通信装置20B网络通信装置21设定单元22A网络通信装置22B网络通信装置23网络协议语音单元24A网络通信装置24B网络通信装置25辨识单元27翻译单元30服务器装置31通信单元32服务器装置33辨识单元34服务器装置35翻译单元36服务器装置
具体实施例方式以下配合图式及组件符号对本发明的实施方式做更详细的说明，以使熟悉本领域的技术人员在研读本说明书后能据以实施。参考图1，本发明第一实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图I所示，本发明第一实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统I包含多个网络通信装置10A、10B,网络通信装置10A、IOB的每一个都包含一设定单兀11、一网络协议语音(Voice over Internet Protocol, VOIP)单兀13、辨识单元15以及翻译单元17，设定单元11对于VOIP单元13设定所需的语言，发出一语言设定信息至VOIP单元13以及一语音决定信息至辨识单元15，网络通信装置IOA的VOIP单元13用以发出一文字信息或一语音信息至另一网络通信装置10B，或从另一网络通信装置IOB的VOIP单元13接收一文字信息或一语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息传送至辨识单元15，辨识单元15接收该辨识请求信息，当辨识出辨识请求信息的语言与语音决定信息设定的语言相同时，传送一辨识相同信息至该VOIP单元13，而该文字信息或语音信息会直接在VOIP单元13上呈现出字幕，进一步也同时呈现语音，而当辨识出辨识请求信息的语言与语音决定信息设定之语言不相同时，依照语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，翻译单元17接收该翻译请求信息，并将该翻译请求信息翻译为所需的语言后，将一翻译的语音及文字信息发送至VOIP单元13，从而在VOIP单元13上成呈现出翻译后的字幕，进一步也同时呈现语音，其中网络通信装置10AU0B可以为手机、个人计算机、笔记型计算机、平板计算机、个人数字助理(Personal Digital Assistant, PDA)等。参考图2，本发明第二实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图2所示，第二实施例与第一实施例的主要差异在于网络通信装置 10AU0B的通信是藉由服务器装置30来执行，第二实施例的应用于网络协议语音的多国语音辨识及翻译幕显像系统2包含网络通信装置10AU0B以及服务器装置30，网络通信装置10A、IOB的结构与第一实施例相同，在此不在赘述，服务器装置30包含一通信单元31，第一实施例与第二实施例的差别在于，网络通信装置IOA的VOIP单元13用以发出一文字信息或一语音信息至通信单元31，再透过通信单元31发送该一文字信息或一语音信息至另一网络通信装置IOB的VOIP单元，接收的方式也是透过通信单元31。参考图3，本发明第三实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图3所示，第三实施例的目的结合了第一实施例与第二实施例，第三实施例的网络通信装置10AU0B可结合了第一实施例的点对点通信方式，以及第二实施例透过通信单元31的方式，而具有两种通信流。参考图4，本发明第四实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图4所示，本发明第四实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统4包含多个网络通信装置20A、20B以及服务器装置32，网络通信装置20A、20B的每一个都包含一设定单元21以及一 VOIP单元23，服务器装置32包含通信单元31、辨识单元33以及翻译单元35，与实施例三的主要差异在于，第四实施例是藉由在服务器装置32上执行辨识及翻译的动作，设定单元21对于VOIP单元23设定所需的语言，发出一语言设定信息至VOIP单元23以及一语音决定信息至服务器装置32的辨识单元33，VOIP单元23用以发出一文字信息或一语音信息至服务器装置32的通信单元31，通信单元31将所接收到的文字信息或语音信息转换为一辨识请求信息并发送至辨识单元33，辨识单元33接收该辨识请求信息，当辨识出辨识请求信息的语言与语音决定信息设定的语言相同时，传送一辨识相同信息至通信单元31，而通信单元会直接将该文字信息或语音信息传送至另一网络通信装置20B的VOIP单元23上呈现出字幕，进一步也同时呈现语音，而当辨识出辨识请求信息的语言与语音决定信息设定的语言不相同时，依照语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，翻译单元35接收该翻译请求信息，并将翻译的语音及文字信息发送至通信单元31，在由通信单元31将翻译的语音及文字信息发送至另一网络通信装置20B的VOIP单元23，从而在VOIP单元23上成呈现出翻译后的字幕，进一步也同时呈现翻译后的语音。参考图5，本发明第五实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图5所示，本发明第五实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统5包含多个网络通信装置22A、22B以及服务器装置34，网络通信装置22A、22B的每一个包含设定单元21、VOIP单元23以及辨识单元25，而服务器装置34包含通信单元31以及翻译单元35，设定单元21对于VOIP单元23设定所需的语言，发出一语言设定信息至VOIP单元23以及一语音决定信息至辨识单元25，网络通信装置22A的VOIP单元23用以发出一文字信息或一语音信息至服务器装置34的通信单元31，通信单元31将所接收到的文字信息或语音信息转换为一辨识请求信息并发送至网络通信装置22B的辨识单元33，辨识单元33接收该辨识请求信息，当辨识出辨识请求信息的语言与语音决定信息设定的语言相同时，传送一辨识相同信息至通信单元31，而通信单元会直接将该文字信息或语音信息传送至另一网络通信装置22B的VOIP单元23上呈现出字幕，进一步也同时呈现语音，而当辨识出辨识请求信息的语言与语音决定信息设定的语言不相同时，依照语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，服务器装置34的翻译单元35接收该翻译请求信息，并将翻译的语音及文字信息发送至通信单元31，在由通信单元31将翻译的语音及文字信息发送至另一网络通信装置22B的VOIP单元23，从而在VOIP单元23上成呈现出翻译后的字幕，进一步也同时呈现翻译后的语音。参考图6，本发明第六实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统的方块示意图。如图6所示，本发明第六实施例应用于网络协议语音的多国语音辨识及翻译幕显像系统6包含多个网络通信装置24A、24B以及服务器装置36，网络通信装置20A.20B的每一个都包含一设定单元21、一 VOIP单元23以及一翻译单元27，服务器装置
32包含通信单元31、以及辨识单元33，设定单元21对于VOIP单元23设定所需的语言，发出一语言设定信息至VOIP单元23以及一语音决定信息至服务器装置6的辨识单元33，网络通信装置24A的VOIP单元23用以发出一文字信息或一语音信息至服务器装置36的通信单元31，通信单元31将所接收到的文字信息或语音信息转换为一辨识请求信息并发送至辨识单元33，辨识单元33接收该辨识请求信息，当辨识出辨识请求信息的语言与语音决定信息设定的语言相同时，传送一辨识相同信息至通信单元31，而通信单元会直接将该文字信息或语音信息传送至另一网络通信装置24B的VOIP单元23上呈现出字幕，进一步也同时呈现语音，而当辨识出辨识请求信息的语言与语音决定信息设定的语言不相同时，依照语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，一网络通信装置24B的翻译单元27接收该翻译请求信息，将翻译的语音及文字信息发送至另一网络通信装置24B的VOIP单元23，从而在VOIP单元23上成呈现出翻译后的字幕，进一步也同时呈现翻译后的语音。本发明的特点在于，能够在常用VOIP直接配合语音/文字及翻译的辨识系统，而使用者收到文字信息或语音信息时，能够藉由辨识单元及翻译单元的辅助，而在自身的VOIP单元以字幕显示设定的语言及文字，因而，世界的各种语言隔阂能够透过本发明应用于网络协议语音的语音辨识及翻译系统而能最小化。
本发明中各种信息可以为数字信号或模拟信号，传递信息的方式包含利用数字串流(Streaming)及封包(Packets)等，而整体系统的架构为定时启动通信协议(SessionInitiation Protocol, SIP)或是各种点对点(peer-to-peer,P2P)通信,例如，匿名点对点通信(Anonymous peer-to-peer),架构点对点通信(Structured peer-to-peer)、未架构点对点通信(Unstructured peer-to-peer)、单纯点对点通信(Pure peer-to-peer)、混合点对点通信(Hybrid peer-to-peer)以及集中化点对点通信(Centralized peer-to-peer)。以上仅作为列举示例，并不作为本发明的限定，本领域普通技术人员能依据本发明的教导及现有技术的结合，来延伸或改良。以上所述内容仅为用以解释本发明的较佳实施例，并非企图据以对本发明做任何形式上的限制，因此，凡有在相同的发明精神下所作有关本发明的任何修饰或变更，皆仍应包括在本发明意图保护的范畴。
权利要求
1.一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，其特征在于，包含多个网络通信装置，所述多个网络通信装置的每一个包含一设定单元，发出一语言设定信息以及一语音决定信息以设定所需的语言；一网络协议语音单元，接收该语言设定信息，并发出一文字信息或一语音信息至另一网络通信装置，或从另一网络通信装置的网络协议语音单元接收一文字信息或一语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息并传送；一辨识单元，接收该语言决定信息及该辨识请求信息，当辨识出该辨识请求信息的语言与该语音决定信息设定的语言相同时，传送一辨识相同信息至该网络协议语音单元，而该文字信息或语音信息会直接在网络协议语音单元上呈现，而当辨识出该辨识请求信息的语言与该语音决定信息设定的语言不相同时，依照该语音决定信息所设定的语言，将该辨识信息转换成为一翻译请求信息并发出；以及一翻译单元，接收该翻译请求信息，并将该翻译请求信息翻译为所需的语言后，将一翻译的语音及文字信息发送至该网络协议语音单元，从而在该网络协议语音单元上成呈现出翻译后的语音及文字。
2.如权利要求I所述的系统，其特征在于，所述多个网络通信装置为手机、个人计算机、笔记型计算机、平板计算机以及个人数字助理的至少其中之一。
3.一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，其特征在于，包含多个网络通信装置；以及一服务器单元，包含一通信单元；其中所述多个网络通信装置的每一个包含一设定单元，发出一语言设定信息以及一语音决定信息以设定所需的语言；一网络协议语音单元，接收该语言设定信息，并发出文字信息或语音信息至该通信单元，或从该通信单元接收来自另一网络通信装置的文字信息或语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息并传送；一辨识单元，接收该语言决定信息及该辨识请求信息，当辨识出该辨识请求信息的语言与该语音决定信息设定的语言相同时，传送一辨识相同信息至该网络协议语音单元，而该文字信息或语音信息会直接在网络协议语音单元上呈现，而当辨识出该辨识请求信息的语言与该语音决定信息设定的语言不相同时，依照该语音决定信息所设定的语言，将该辨识信息转换成为一翻译请求信息并发出；以及一翻译单元，接收该翻译请求信息，并将该翻译请求信息翻译为所需的语言后，将一翻译的语音及文字信息发送至该网络协议语音单元，从而在该网络协议语音单元上成呈现出翻译后的语音及文字。
4.如权利要求3所述的系统，其特征在于，所述多个网络通信装置为手机、个人计算机、笔记型计算机、平板计算机以及个人数字助理的至少其中之一。
5.如权利要求3所述的系统，其特征在于，所述多个网络通信装置的该网络协议语音单元，进一步能发出该文字信息或该语音信息至另一网络通信装置的该网络协议语音单元，并从另一网络通信装置的该网络协议语音单元接收该文字信息或该语音信息。
6.一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，其特征在于，包含多个网络通信装置，该多个网络通信装置包含一设定单元以及一网络协议语音单元，该设定单元，发出一语言设定信息以及一语音决定信息，以设定所需的语言；该网络协议语音单元，接收该语言设定信息，并用以发出一文字信息或一语音信息；以及一服务器装置，包含一通信单元、一辨识单元以及一翻译单元，该通信单元接收该文字信息或该语音信息，并将所接收到的文字信息或语音信息转换为一辨识请求信息，该辨识单元接收该语音决定信息及该辨识请求信息，当辨识出该辨识请求信息的语言与该语音决定信息设定的语言相同时，传送一辨识相同信息至该通信单元，而该通信单元会直接将该文字信息或该语音信息传送至另一网络通信装置的网络通信装置单元上呈现，而当辨识出该辨识请求信息的语言与该语音决定信息设定的语言不相同时，依照该语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出，该翻译单元接收该翻译请求信息，并将翻译的语音及文字信息发送至该通信单元，再由该通信单元将一翻译的语音及文字信息发送至另一网络通信装置的该网络协议语音单元，从而在该网络协议语音单元上成呈现出翻译后的语音及文字。
7.如权利要求6所述的系统，其特征在于，所述多个网络通信装置为手机、个人计算机、笔记型计算机、平板计算机以及个人数字助理的至少其中之一。
8.如权利要求6所述的系统，其特征在于，所述多个网络通信装置的该网络协议语音单元，进一步能发出该文字信息或该语音信息至另一网络通信装置的该网络协议语音单元，并从另一网络通信装置的该网络协议语音单元接收该文字信息或该语音信息。
9.一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，其特征在于，包含多个网络通信装置，所述多个网络通信装置的每一个包含一设定单兀，发出一语言设定信息以及一语音决定信息；一网络协议语音单元，接收该语言设定信息，用以发出及接收一文字信息或一语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息并发出；一翻译单元，接收该翻译请求信息，并将一翻译的语音及文字信息发送至该网络协议语音单元；以及一服务器装置，包含一通信单元以及一辨识单元，该通信单元接收该文字信息或该语音信息，在发送至另一网络通信装置的网络协议语音单元，从而在该网络协议语音单元上成呈现出翻译后的语音及文字，该辨识单元接收该辨识请求信息，当辨识出该辨识请求信息的语言与该语音决定信息的语言相同时，传送一辨识相同信息至该通信单元，而该文字信息或该语音信息会直接在该网络协议语音单元上呈现，而当辨识出该辨识请求信息的语言与该语音决定信息的语言不相同时，依照该语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出至网络通信装置的翻译单元。
10.如权利要求9所述的系统，其特征在于，所述多个网络通信装置为手机、个人计算机、笔记型计算机、平板计算机以及个人数字助理的至少其中之一。
11.如权利要求9所述的系统，其特征在于，所述多个网络通信装置的该网络协议语音单元，进一步能发出该文字信息或该语音信息至另一网络通信装置的该网络协议语音单元，并从另一网络通信装置的该网络协议语音单元接收该文字信息或该语音信息。
12.—种应用于网络协议语音的多国语音辨识及翻译幕显像系统，其特征在于，包含多个网络通信装置，所述多个网络通信装置的每一个包含一设定单兀，发出一语言设定信息以及一语音决定信息；一网络协议语音单元，接收该语言设定信息，用以发出及接收一文字信息或一语音信息，并将所接收的该文字信息或语音信息转换为一辨识请求信息并发出；一辨识单元，接收该辨识请求信息，当辨识出该辨识请求信息的语言与该语音决定信息的语言相同时，传送一辨识相同信息至该网络协议语音单元，而该文字信息或该语音信息会直接在该网络协议语音单元上呈现，而当辨识出该辨识请求信息的语言与该语音决定信息的语言不相同时，依照该语音决定信息所决定的语言，将该辨识信息转换成为一翻译请求信息并发出；以及一服务器装置，包含一通信单元以及一翻译单元，该通信单元接收该文字信息或该语音信息，在发送至另一网络通信装置的网络协议语音单元，从而在该网络协议语音单元上成呈现出翻译后的语音及文字，该翻译单元接收该翻译请求信息，并将一翻译的语音及文字信息发送至该网络协议语音单元。
13.如权利要求12所述的系统，其特征在于，所述多个网络通信装置为手机、个人计算机、笔记型计算机、平板计算机以及个人数字助理的至少其中之一。
14.如权利要求12所述的系统，其特征在于，所述多个网络通信装置的该网络协议语音单元，进一步能发出该文字信息或该语音信息至另一网络通信装置的该网络协议语音单元，并从另一网络通信装置的该网络协议语音单元接收该文字信息或该语音信息。
全文摘要
一种应用于网络协议语音的多国语音辨识及翻译幕显像系统，包含多个网络通信装置，每一个中包含设定单元、网络协议语音单元、辨识单元以及翻译单元，设定单元设定语言，网络协议语音单元发出或接收文字或语音信息，并转换为辨识请求信息，辨识单元辨别辨识请求信息，语言相同时，文字或语音信息呈现在网络协议语音单元上，语言不相同时，将辨识信息转换成为翻译请求信息，翻译单元接收翻译请求信息，并翻译为所需的语言后，将翻译的语音及文字信息发送至网络协议语音单元，以字幕呈现翻译后的语音及文字，而能以本系统减少语言隔阂。
文档编号H04L29/06GK102902666SQ20121010783
公开日2013年1月30日申请日期2012年4月13日优先权日2011年7月26日
发明者郑俨申请人:郑俨

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑俨
技术所有人：郑俨
我是此专利的发明人

上一篇：用于相对颜色质量的自然语言评价的系统的制作方法
上一篇：视频设备远程集中监测系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。