一种中文人名播报方法及装置的制造方法

文档序号:9375568阅读:514来源:国知局
一种中文人名播报方法及装置的制造方法
【技术领域】
[0001]本发明涉及移动通讯领域,特别涉及一种中文人名播报方法及相关的装置。
【背景技术】
[0002]词法分析:是计算机科学中将字符序列转换为单词序列的过程。进行词法分析的程序或者函数叫做词法分析器,也叫扫描器。供语法分析器调用。由于汉语不像英文单词是以空格分开的,因此词法分析一般都是结合语义分析技术相结合使用。
[0003]句法分析:所谓句法分析(Parsing)就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。句法分析现在主要的应用在于中文信息处理,如机器翻译等。它是语块分析(chunking)思想的一个直接实现,语块分析通过识别出高层次的结构单元来简化句子的描述。从不同的句子中找到语块规律的一条途径是学习一种语法,这种语法能够解释所找到的分块结构。这属于语法归纳的范畴。
[0004]语音合成(Text To Speech, TTS):语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放。
[0005]目前汉语人名中普遍存在多音字,有些多音字的发音又是姓氏中所独有的,例如,曾(zeng)沈(shen)翟(zhai)单(shan),在一些常用词汇中的读音为曾(ceng)沈(chen)翟(di)单(dan)。另外一些历史人名中有些特殊的发音,例如刘禅(shan),关云长(chang),贾平凹(wa),在一些常用词汇中的读音为禅(chan)长(zhang)凹(ao)。对于姓名的多音字,TTS播报引擎基本上按照常用词汇的发音进行播报,经常播出让人啼笑皆非的效果,例如人名:曾(ceng) —庭。

【发明内容】

[0006]本发明的目的在于提供一种中文人名播报方法及装置,通过对待播报文本字符串中的人名字符串进行多音字读音标识,并按照所标识的多音字读音播报人名字符串,解决中文人名中多音字播报不准确的问题。
[0007]根据本发明的一个方面,提供了一种中文人名播报方法,包括:
[0008]终端侧将含有人名字符串的待播报文本字符串发送至网络侧;
[0009]接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;
[0010]按照所述读音字符串播报所述人名字符串。
[0011]根据本发明的另一个方面,提供了一种中文人名播报方法,包括:
[0012]在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;
[0013]通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;
[0014]将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。
[0015]优选地,在预置的读音数据库中,搜索待播报文本字符串中的人名字符串的步骤之前,还包括:
[0016]网络侧接收来自终端侧的待播报文本字符串;
[0017]对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。
[0018]优选地,所述读音数据库包括历史人名发音知识库和/或姓氏发音知识库,网络侧在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。
[0019]优选地,所述的通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识的步骤包括:
[0020]网络侧在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串;
[0021]将所述读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读曰。
[0022]根据本发明的另一个方面,提供了一种中文人名播报装置,包括:
[0023]终端侧收发模块,用于将含有人名字符串的待播报文本字符串发送至网络侧,并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;
[0024]终端侧播报模块,用于按照所述读音字符串播报所述人名字符串。
[0025]根据本发明的另一方面,提供了一种中文人名播报装置,包括:
[0026]网络侧搜索模块,用于在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;
[0027]网络侧标识模块,用于通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;
[0028]网络侧发送模块,用于将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。
[0029]优选地,还包括:
[0030]网络侧接收模块,用于在所述网络侧搜索模块搜索待播报文本字符串中的人名字符串之前,接收来自终端侧的待播报文本字符串;
[0031]网络侧分析模块,用于对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。
[0032]优选地,所述读音数据库包括历史人名发音知识库和/或姓氏发音知识库,所述网络侧搜索模块在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。
[0033]优选地,所述网络侧标识模块在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串,并将所提取的读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读音。
[0034]与现有技术相比较,本发明的有益效果在于:
[0035]本发明通过文本中的语义解析出人名并标识,从而达到在终端侧TTS播报的时候可以根据标识将人名中的多音字按照正确发音播报的目的。
【附图说明】
[0036]图1是本发明提供的终端侧的中文人名播报方法原理框图;
[0037]图2是本发明提供的终端侧的中文人名播报装置框图;
[0038]图3是本发明提供的网络侧的中文人名播报方法原理框图;
[0039]图4是本发明提供的网络侧的中文人名播报装置框图;
[0040]图5 (a)是本发明实施例提供的历史人名读音知识库图表;
[0041]图5(b)是本发明实施例提供的姓氏读音知识库图表;
[0042]图6是本发明实施例提供的“曾一庭看《三国演义》这部小说,他非常喜欢关云长这个角色。”经过句法分析和语法分析后所得出的两颗语法树;
[0043]图7是本发明实施例提供的中文人名播报流程图。
【具体实施方式】
[0044]以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0045]图1是本发明提供的终端侧的中文人名播报方法原理框图,如图1所示,步骤包括:
[0046]步骤SlOl:终端侧将含有人名字符串的待播报文本字符串发送至网络侧,
[0047]步骤S102:接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串人名字符串。
[0048]步骤S103:按照所述读音字符串播报所述人名字符串。
[0049]为实现对中文人名的正确播报,终端侧利用网络侧对人名字符串进行处理,具体地说,若所述人名中存在多音字,则网络侧对该多音字进行读音标识,从而使得终端侧的语音合成引擎能够按照所标识的读音正确播报所述人名中的多音字。
[0050]图2是本发明提供的终端侧的中文人名播报装置框图,如图2所示,包括终端侧收发模块21和终端侧播报模块22。其中:
[0051]所述终端侧收发模块21将含有人名字符串的待播报文本字符串发送至网络侧,并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;所述终端侧播报模块22按照所述读音字符串播报所述人名字符串。
[0052]图3是本发明提供的网络侧的中文人名播报方法原理框图,如图3所示,步骤包括:
[0053]步骤S301:网络侧收到终端侧的待播报文本字符串后,对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。在预置的读音数据库中,搜索所述人名字符串。若搜索到相应的人名字符串,则说明所述人名中具有多音字。
[0054]所述步骤S301中的读音数据库包括历史人名发音知识库和/或姓氏发音知识库,网络侧在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。
[0055]步骤S302:通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识。
[0056]具体地说,网络侧在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串,并将所述读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读音。
[0057]步骤S303:将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。
[0058]图4
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1