一种实现文本短信语音播放的系统及方法

文档序号：7648903阅读：294来源：国知局

专利名称：一种实现文本短信语音播放的系统及方法
技术领域：
本发明涉及语音短信的实现，尤其涉及的是，一种基于语音库在终端实现文本短信语音播放的系统及方法。
背景技术：
随着移动通信技术的发展，播放语音短消息成为手机终端的一个功能。目前，实现语音短信的方法有很多种，如直接录制语音的方法发送，通过语音网关实现的方法等等。
这些实现方法由于在设计上和实现上都非常复杂，需要传送大量的语音数据，因此在实现上容易出现问题，如不能正确播放，播放语音不完整等等。因此给用户的使用带来了极大的不便。
因此，现有技术存在缺陷，需要改进。

发明内容
本发明的目的在于提供一种实现文本短信语音播放的系统及方法，发送端只需发送文字信息，就可以在接收端实现语音短消息的功能，不需要传送大量的语音数据。
本发明的技术方案如下一种实现文本短信语音播放的方法，其包括步骤101、在终端中设置语音库，在语音库中组织有若干语音文件；102、发送方设置短消息的驱动码，用于标识所述短消息为语音短消息；在终端内设立特征码表，其中设置语音特征码，指向所述语音库的各个语音文件；103、接收方接收到短消息后，判断其中是否包含所述驱动码，如果包含，则执行步骤104，否则按普通文本短消息处理；104、从所述语音库中提取所述短消息对应的语音文件进行播放。
所述的方法，其中，步骤104具体包括201、解析所述短消息，得到所述语音特征码；202、根据所述语音特征码，在所述特征码表中查询得到其指向的语音文件；203、从所述语音库中提取所述语音文件进行播放。
所述的方法，其中，步骤101中，所述语音库中还设置语音基元文件；并且，步骤104还包括204、当终端在语音库中无法匹配到语音文件，则按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件；205、合成语音并播放。
所述的方法，其中，步骤103之前还包括步骤发送短消息时，用户输入所述驱动码，或者，用户选择发送语音短消息的功能，终端自动添加所述驱动码。
一种实现文本短信语音播放的系统，其包括短消息处理模块和播放模块，其中，所述系统还包括驱动码模块、判断模块、提取模块、库管理模块和语音库模块；所述驱动码模块与所述判断模块相连接，用于设置和存储标识所述短消息为语音短消息的驱动码；所述判断模块还分别与所述短消息处理模块、所述提取模块相连接，用于判断接收的短消息中包含所述驱动码，则启动所述提取模块；所述库管理模块分别与所述语音库模块、所述提取模块相连接，用于管理存储在所述语音库模块的语音文件；所述提取模块还与所述播放模块相连接，用于通过所述库管理模块提取所述语音文件，并由所述播放模块播放。
所述的系统，其中，所述库管理模块设置录音单元、查找单元、存储单元、编辑单元中的一个或几个，分别提供给用户对语音库进行操作，所述操作包括对语音文件的录音、查找、存储、编辑中的一个或几个。
所述的系统，其中，所述编辑至少包括增加、删除、替换、修改语音文件其中之一。
所述系统，其中，还包括特征码模块和解析模块，所述特征码模块与所述解析模块相连接，用于设置和存储语音特征码，所述语音特征码指向所述语音库模块的各个语音文件；所述解析模块设置在所述判断模块与所述提取模块之间，用于解析所述短消息，得到所述语音特征码，发送到所述提取模块。
所述系统，其中，所述播放模块还包括语音合成单元，并且，所述语音库还存储有语音基元文件；所述提取模块还用于按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件，发送到所述语音合成单元；所述语音合成单元用于将各个语音基元文件合成语音并播放。
采用上述方案，本发明通过在手机等终端上预存语音数据和语音短消息，在收到播放语音短消息的驱动短消息后，相应播放语音文件；这样，发送端只需发送文字信息，就可以在接收端实现语音短消息的功能；因此具有播放方法简洁、实现简单、易于使用、扩展性好等优点，不需要传送大量的语音数据，有效减轻了网络负担，易于推广应用。

图1为本发明方法的一种实施方式的流程图；图2为本发明系统的第一种实施方式的结构示意图；图3为本发明系统的第二种实施方式的结构示意图；图4为本发明系统的第三种实施方式的结构示意图。
具体实施例方式
以下对本发明的较佳实施例加以详细说明。
如图1所示，本发明提供了一种基于语音库在终端实现文本短信语音播放的方法，其包括步骤
101、在终端中设置语音库，在语音库中组织有若干语音文件；该语音文件可以包括预先录好的真人发音的语句。例如，可以按照某种类别对各种短消息进行分类并且预先存储，形成语音短消息库。
语音库是本发明必须的组成部分，其中存储了语音文件，一份语音文件可以是一段乐曲、一首歌，也可以是用户自定义的一个语音数据文件，例如一段用户录音等等；终端在出厂时可以预先执行步骤101。语音库中可以存储了多个甚至是大量的语音文件。其中，步骤101还可以包括，用户管理所述语音库的语音文件。
102、发送方设置短消息的驱动码，用于标识所述短消息为语音短消息。在发送短消息时，用户可以自行输入所述驱动码；或者，用户选择发送语音短消息的功能时，终端自动添加所述驱动码。对于不同的终端或者厂家，还可以设置不同的驱动码进行识别。在终端内设立特征码表，其中设置语音特征码，指向所述语音库的各个语音文件。
103、接收方接收到短消息后，判断其中是否包含所述驱动码，如果包含，则执行步骤104，否则按普通文本短消息进行处理。当终端接收到的短消息包括了所述驱动码时，终端就按照语音短消息进行处理，这样就可以避免传输包含大量数据的语音文件。
104、从所述语音库中提取所述短消息对应的语音文件进行播放；具体处理中，可以指定语音文件的位置或连接，由终端的播放系统直接调用语音文件进行播放；也可以把语音文件复制到终端的播放系统进行播放；本发明方法对此并无额外的限制。
步骤104具体包括201、解析所述短消息，得到所述语音特征码；202、根据所述语音特征码，在所述特征码表中查询得到其指向的语音文件；203、从所述语音库中提取所述语音文件进行播放。
并且，在步骤101中，所述语音库中还可以设置了语音基元文件；即为各个文字设置了对应的语音信息，可以用于将文字以语音形式播放。
当特征码无法匹配到语音库中的语音文件时，步骤104还包括204、当终端在语音库中无法匹配到语音文件，则按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件；205、合成语音并播放。
简单地说，语音合成的实施已经进入文字-语音转换(TTS)阶段，其功能模块可以简单分为文本分析、韵律建模和语音合成。其中，语音合成的主要功能是根据文本分析、韵律建模的结果，从原始语音库中取出相应的语音基元，利用特定的语音合成技术对语音基元进行韵律特性的调整和修改，最终合成出符合要求的语音。具体地语音合成属于现有技术，本发明在此不再赘述。
在上述本发明方法的基础上，如图2所示，本发明还提供了一种基于语音库在移动终端实现文本短信语音播放的系统，其包括短消息处理模块、播放模块、驱动码模块、判断模块、提取模块、库管理模块和语音库模块；短消息处理模块接收短消息，判断模块判断该短消息属于语音短消息，则启动提取模块，通过库管理模块从语音库模块中找到并提取对应的语音文件，并由所述播放模块进行播放。
其中，在所述驱动码模块设置和存储了标识所述短消息为语音短消息的驱动码；实际应用中，用户或厂家可以自定义、调整所述驱动码。所述驱动码模块也可以作为一个驱动码功能单元，设置在所述判断模块中。
所述判断模块与所述驱动码模块连接，根据接收的短消息是否包含所述驱动码，判断该短消息是否属于语音短消息。
所述库管理模块分别与所述语音库模块、所述提取模块相连接，用于管理存储在所述语音库模块的语音文件；语音库模块具体存储的语音文件如本发明方法中所述，在此不再赘述。具体地说，所述库管理模块设置录音单元、查找单元、存储单元、编辑单元中的一个或几个，分别提供给用户对语音库进行操作，所述操作包括对语音文件的录音、查找、存储、编辑中的一个或几个。分别用于实现语音文件的录音、查找、存储、编辑等各种功能；其中，所述编辑至少包括增加、删除、替换、修改语音文件其中之一，还可以在此基础上实现各种扩充的编辑功能。
所述提取模块还与所述播放模块相连接，用于通过所述库管理模块提取存储在所述语音库模块的语音文件，并由所述播放模块播放。在实际应用中，所述提取模块可以设置为所述播放模块内部的提取单元，用于指向所述语音文件、由所述播放模块调用所述语音文件并播放，这样可以省略文件的提取、复制等开销，提高系统效率。
上述系统的各种实施例中，所述系统还包括特征码模块和解析模块，如图3所示，所述特征码模块与所述解析模块相连接，用于设置和存储语音特征码，所述语音特征码指向所述语音库模块的各个语音文件；所述特征码模块可以管理一张特征码表，该表用于设置和存储语音特征码。在实际应用中，所述特征码模块可以设置为所述解析模块的内部功能单元。
所述解析模块设置在所述判断模块与所述提取模块之间，用于解析所述短消息，得到所述语音特征码，发送到所述提取模块；所述提取模块还用于根据所述语音特征码，提取其指向的语音文件，并由所述播放模块播放。
当然，也可以将所述解析模块和所述判断模块一体设置，将判断模块作为解析模块的一个功能单元，此时，当接收到普通短消息后，解析模块对该条短消息的内容进行解析，分析该条短消息是否是播放语音短消息的驱动短消息，如果是，则交由播放模块播放对应的语音短消息，否则交由短消息处理模块作为普通短消息进行处理。
上述系统的各种实施例中，所述系统的播放模块还包括语音合成单元，并且，所述语音库还用于存储语音基元文件；所述提取模块还用于按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件，发送到所述语音合成单元；所述语音合成单元用于将各个语音基元文件合成语音并播放。
如图4所示，是本发明所述系统的又一种实施方式，其中，所述判断模块内置了驱动码单元，所述解析模块内置了特征码单元，所述播放模块内置了提取单元和语音合成单元；分别实现各项上述功能。
以下对本发明的基于语音库的语音短信方法和系统做出具体说明，主要包括以下步骤(1)目标终端用户开机后库管理模块初始化，初始化语音库。
(2)目标终端用户收到驱动短消息后，由解析模块对该条驱动短消息进行解析，解析出语音短消息的语音特征码。语音特征码主要是起到标示、索引作用，用来从语音库中提取对应文件的。
例如，库管理模块可以维护这样一张特征码表文件编号特征码语音文件名语音文件1 xnkl newyearhappy nyh.mid2. Gnh gnh gnh.mp33. ......
当然，也可以不包括语音文件名的表项。
例如，库文件组织如下Asdjfk.mp3bie.mid......
gnh.mp3......
nv.mmfnvh.mid......
如果解析出语音特征码是gnh，那么查找过程可以是这样的根据语音特征码gnh去查找表文件，可以查到对应文件名为gnh.mp3，再从语音库中提取该文件进行播放。
(3)库管理模块根据语音短消息特征码，从语音库中提取对应的短消息的语音文件。
(4)播放模块对这个语音文件进行播放。
实施例A一台进入CDMA服务网络的终端，收到了一条短消息，内容是“yydxxnkl”，则首先由解析模块对该条短消息进行解析，经过解析模块的分析，发现该条短消息的前缀为“yydx”，识别这条短消息是一条语音短消息的驱动短消息，并解析出这条语音短消息语音特征码为“xnkl”。库管理模块根据“xnkl”这个语音特征码从语音库中找出对应的语音文件，播放模块播放这个语音文件，用户从终端中听到了该条短消息的语音“新年快乐”。同时这条驱动短消息存储在短消息处理模块。是预先设置的，可以进行编辑，如删除，增加，修改等，由库管理模块对语音文件和特征码进行管理。比如说可以设想这样一种实现，语音库的一条记录可以采取下列形式存在编号特征码语音文件名语音文件1 xnkl newyearhappy nyh.mid2. Gnh gnh gnh.mp3另外，库管理模块可由用户通过操作界面激活，然后对其内容进行操作，如修改语音文件名，将上述记录2中的语音文件名gnh改为cjh，再如，可以整条删除一条记录，如把编号为1的记录全部删除掉。
实施例B一台进入GSM服务网络的终端，收到了一条短消息，内容是“祝您节日快乐”，则首先由解析模块对该条短消息进行解析，经过解析模块的分析，发现该条短消息是一条普通短消息，则交由短消息处理模块作为普通短消息进行处理。
实施例C一台CDMA/GSM双模终端在CDMA网络服务内收到了一条短消息，内容是“yydx端午节快乐王二！”，则首先由解析模块对该条短消息进行解析，经过解析模块的分析，发现该条短消息的前缀为“yydx”，识别这条短消息是一条语音短消息的驱动短消息，并解析出这条语音短消息语音特征码为“端午节快乐王二”或“端午节快乐王二！”。
库管理模块根据“端午节快乐王二”这个语音特征码，可以根据特征码表，先从语音库中去寻找对应的语音文件，在未能找到对应的语音文件的情况下，再从语音库中提取语音基元文件，例如端午节、快乐、王、二的语音文件，或者提取每个字的语音基元文件，甚至可以包括标点符号“！”的语音基元文件，各个标点符号具体可以表现为不同时长的停顿等；并通过语音合成，将这些文件合成“端午节快乐王二”的语音文件，由播放模块进行播放。
也可以直接从语音库中提取语音基元文件，并通过语音合成，将这些文件合成“端午节快乐王二”的语音文件，由播放模块进行播放。
在合成语音的时候，还可以根据用户的具体选择，增加各种个性化方案，例如男声、女生、小孩声等等；还可以配上背景音乐，例如重低音、爵士乐等等。对上面的实施例C而言，如果用户自定义王二为男性，则收到其语音短消息时，采用男声说出“端午节快乐王二”，同时可以配上一段乐曲。
在具体实施中，标点符号也可以不作为语音特征码处理；还可以给语音文件，如一段音乐，设置与语音基元文件相区别的语音特征码，便于终端判断是否需要执行语音合成的相关功能，便于提高系统效率，具体实现的方式很多，在此不再赘述。
在存储设备硬件成本大为降低的情况下，采用本发明所述方法和系统，将语音数据存放在终端中，为手机等终端设备播放语音短信提供一种途径，例如可以通过电脑或电话发送文本短信，在手机终端设备接收到一条短消息后，首先分析该条短消息是普通短消息还是语音短消息的驱动短消息，如果该条短消息经过解析确认是语音短消息的驱动短消息，则按照解析的内容从语音库选择该条短消息的对应语音进行播放。通过在手机终端上预存语音数据和语音短消息，在收到播放语音短消息的驱动短消息后，相应播放语音文件；这样，发送端只需发送文字信息，就可以在接收端实现语音短消息的功能；因此具有播放方法简洁、实现简单、易于使用、扩展性好等优点，不需要传送大量的语音数据，有效减轻了网络负担，易于推广应用。
例如，采用本发明方法，当手机或其他终端设备接收到语音短消息的驱动短消息后，可以从短消息语音库中取出该条短消息的语音文件进行播放。
应当理解的是，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
权利要求
1.一种实现文本短信语音播放的方法，其包括步骤101、在终端中设置语音库，在语音库中组织有若干语音文件；102、发送方设置短消息的驱动码，用于标识所述短消息为语音短消息；在终端内设立特征码表，其中设置语音特征码，指向所述语音库的各个语音文件；103、接收方接收到短消息后，判断其中是否包含所述驱动码，如果包含，则执行步骤104，否则按普通文本短消息处理；104、从所述语音库中提取所述短消息对应的语音文件进行播放。
2.根据权利要求1所述的方法，其特征在于，步骤104具体包括201、解析所述短消息，得到所述语音特征码；202、根据所述语音特征码，在所述特征码表中查询得到其指向的语音文件；203、从所述语音库中提取所述语音文件进行播放。
3.根据权利要求2所述的方法，其特征在于，步骤101中，所述语音库中还设置语音基元文件；并且，步骤104还包括204、当终端在语音库中无法匹配到语音文件，则按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件；205、合成语音并播放。
4.根据权利要求1至3任一所述的方法，其特征在于，步骤103之前还包括步骤发送短消息时，用户输入所述驱动码，或者，用户选择发送语音短消息的功能，终端自动添加所述驱动码。
5.一种实现文本短信语音播放的系统，其包括短消息处理模块和播放模块，其特征在于，所述系统还包括驱动码模块、判断模块、提取模块、库管理模块和语音库模块；所述驱动码模块与所述判断模块相连接，用于设置和存储标识所述短消息为语音短消息的驱动码；所述判断模块还分别与所述短消息处理模块、所述提取模块相连接，用于判断接收的短消息中包含所述驱动码，则启动所述提取模块；所述库管理模块分别与所述语音库模块、所述提取模块相连接，用于管理存储在所述语音库模块的语音文件；所述提取模块还与所述播放模块相连接，用于通过所述库管理模块提取所述语音文件，并由所述播放模块播放。
6.根据权利要求5所述的系统，其特征在于，所述库管理模块设置录音单元、查找单元、存储单元、编辑单元中的一个或几个，分别提供给用户对语音库进行操作，所述操作包括对语音文件的录音、查找、存储、编辑中的一个或几个。
7.根据权利要求6所述的系统，其特征在于，所述编辑至少包括增加、删除、替换、修改语音文件其中之一。
8.根据权利要求5至7任一所述系统，其特征在于，还包括特征码模块和解析模块，所述特征码模块与所述解析模块相连接，用于设置和存储语音特征码，所述语音特征码指向所述语音库模块的各个语音文件；所述解析模块设置在所述判断模块与所述提取模块之间，用于解析所述短消息，得到所述语音特征码，发送到所述提取模块。
9.根据权利要求8所述系统，其特征在于，所述播放模块还包括语音合成单元，并且，所述语音库还存储有语音基元文件；所述提取模块还用于按照所述短消息各文字的顺序，从所述语音库中提取对应的各个语音基元文件，发送到所述语音合成单元；所述语音合成单元用于将各个语音基元文件合成语音并播放。
全文摘要
本发明公开了一种实现文本短信语音播放的系统及方法，所述方法包括步骤101、在终端中设置语音库，其中组织有若干语音文件；102、发送方设置短消息的驱动码，用于标识短消息为语音短消息；103、接收方接收到短消息后，判断其中包含驱动码，则执行步骤104；104、从语音库中提取短消息对应的语音文件进行播放。据此，通过在手机终端上预存语音数据和语音短消息，在收到播放语音短消息的驱动短消息后，相应播放语音文件；这样，发送端只需发送文字信息，就可以在接收端实现语音短消息的功能；因此具有播放方法简洁、实现简单、易于使用、扩展性好等优点，不需要传送大量的语音数据，有效减轻了网络负担，易于推广应用。
文档编号H04W4/14GK101094445SQ20071007619
公开日2007年12月26日申请日期2007年6月29日优先权日2007年6月29日
发明者吴传喜申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴传喜
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种手机电视中处理相关信息的方法
上一篇：一种测试多径衰落的方法、装置和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。