字符串识别方法及装置制造方法

文档序号:6631608阅读:162来源:国知局
字符串识别方法及装置制造方法
【专利摘要】本发明涉及一种字符串识别方法及装置,在一个实施例中所述方法包括以下步骤:获取字符串,所述字符串由多种类型子字符串组成;将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串;判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇;若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及将识别后的所有子字符串合成连贯语音。根据本发明实施例的方法及装置,可以准确识别字符串的含义。
【专利说明】字符串识别方法及装置

【技术领域】
[0001]本发明涉及计算机【技术领域】,特别涉及一种字符串识别方法及装置。

【背景技术】
[0002]现在计算机技术的发展,语音合成也随之出现,语音合成即将任意的文字信息实时转化为标准流畅的语音朗读出来。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都方便用户传送消息以及阅读消息。但是大量字符串都有多种读法,不同的读法也有不同的含义,只有正确的读法才能在合成语音后,表达出恰当含义。因此在语音合成时,准确的识别字符串的词义尤为重要。


【发明内容】

[0003]有鉴于此,本发明提供一种字符串识别方法及装置,可以准确识别字符串的含义。
[0004]一种字符串识别方法,所述方法包括以下步骤:
[0005]获取字符串,所述字符串由多种类型子字符串组成;
[0006]将所述字符串根据所述多种类型的子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串;
[0007]判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇;
[0008]若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及
[0009]将识别后的所有子字符串合成连贯语音。
[0010]一种字符串识别装置,所述装置包括以下模块:
[0011]获取模块,用于获取字符串,所述字符串由多种类型子字符串组成;
[0012]分词模块,用于将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串;
[0013]判断模块,用于判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇;
[0014]处理模块,用于若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及
[0015]合成模块,用于将识别后的所有子字符串合成连贯语音。
[0016]根据上述实施例的方法及装置,通过按照字符串的分类对字符串进行分词,然后逐词进行识别,提闻字符串识别的准确性。
[0017]为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。

【专利附图】

【附图说明】
[0018]图1为一种电子装置的结构框图。
[0019]图2为第一实施例提供的字符串识别方法流程图。
[0020]图3为第二实施例提供的字符串识别方法流程图。
[0021]图4为第三实施例提供的字符串识别方法流程图。
[0022]图5为第四实施例提供的字符串识别方法流程图。
[0023]图6为第五实施例提供的字符串识别方法流程图。
[0024]图7为第六实施例提供的字符串识别装置结构框图。
[0025]图8为第七实施例提供的字符串识别装置结构框图。
[0026]图9为第八实施例提供的字符串识别装置结构框图。
[0027]图10为第九实施例提供的字符串识别装置结构框图。
[0028]图11为第十实施例提供的字符串识别装置结构框图。

【具体实施方式】
[0029]为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的【具体实施方式】、结构、特征及其功效,详细说明如后。
[0030]本发明实施例中涉及一种字符串识别方法及装置,可以用于语音合成中字符串的识别,具体其可用于电子装置中。
[0031]图1为上述电子装置的结构框图。如图1所示,电子装置100包括一个或多个(图中仅示出一个)处理器102、存储器104、RF (Rad1 Frequency,射频)模块106、网络模块108、音频模块110、输入模块112、显示模块114、。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对电子装置100的结构造成限定。例如,电子装置100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。上述的电子装置100的具体实例包括但并不限于手持式计算机、移动电话、媒体播放器、车载设备、个人数字助理及前述装置的各种组合。
[0032]本领域普通技术人员可以理解,相对于处理器102来说,所有其他的组件均属于外设,处理器102与这些外设之间通过多个外设接口 124相耦合。外设接口 124可基于以下标准实现:通用异步接收 / 发送装置(Universal Asynchronous Receiver/Transmitter,UART)、通用输入 / 输出(General Purpose Input Output, GP1)、串行外设接口(SerialPeripheral Interface, SPI)、内部集成电路(Inter-1ntegrated Circuit, I2C),但不并限于上述标准。在一些实例中,外设接口 124可仅包括总线;在另一些实例中,外设接口 124还可包括其他元件,如一个或者多个控制器,例如用于连接液晶显示面板的显示控制器或者用于连接存储器的存储控制器122。此外,这此控制器还可以从外设接口 124中脱离出来,而集成于处理器102内或者相应的外设内。
[0033]存储器104可用于存储软件程序以及模块,如本发明实施例中的字符串识别方法/装置对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的字符串识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至电子装置100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0034]RF模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF模块106可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SM)卡、存储器等等。RF模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communicat1n, GSM)、增强型移动通信技术(Enhanced Data GSM Environment, EDGE),宽带码分多址技术(wideband code divis1nmultiple access, W-CDMA),码分多址技术(Code divis1n access, CDMA)、时分多址技术(time divis1n multiple access, TDMA),无线保真技术(Wireless, Fidelity, WiFi)(如美国电气和电子工程师协会标准IEEE 802.11a, IEEE 802.lib, IEEE802.1Ig和/或IEEE 802.1ln)、网络电话(Voice over internet protocal, VoIP)、全球微波互联接入(Worldwide Interoperability for Microwave Access,W1-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
[0035]网络模块108用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。在一个实例中,上述网络信号为WiFi信号,由于WiFi的工作频率也处于射频的频段内,此时网络模块可具有与RF模块106类似的硬件结构,即可包括天线、射频收发器、数字信号处理器、加密/解密芯片等元件。在一个实例中,上述网络信号为有线网络信号。此时,网络模块108可包括处理器、随机存储器、转换器、晶体振荡器等元件。
[0036]音频电路110、扬声器、声音插孔、麦克风共同提供用户与移动电子装置100之间的音频接口。具体地,音频电路110从处理器102处接收声音数据,将声音数据转换为电信号,将电信号传输至扬声器。扬声器101将电信号转换为人耳能听到的声波。音频电路110还从麦克风处接收电信号,将电信号转换为声音数据,并将声音数据传输给处理器102以进行进一步的处理。音频数据可以从存储器104处或者通过RF模块106、网络模块108获取。此外,音频数据也可以存储至存储器104中或者通过RF模块106及网络模块108进行发送。
[0037]输入单元112可用于接收输入的字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元112可包括按键以及触控表面。按键例如可包括用于输入字符的字符按键,以及用于触发控制功能的控制按键。控制按键的实例包括“返回主屏”按键、开机/关机按键、拍照键等等。触控表面可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控表面上或在触控表面附近的操作),并根据预先设定的程序驱动相应的连接装置。可选的,触控表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器102,并能接收处理器102发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控表面。除了触控表面,输入单元112还可以包括其他输入设备。上述的其他输入设备包括但不限于物理键盘、轨迹球、鼠标、操作杆等中的一种或多种。
[0038]显示模块114用于显示由用户输入的信息、提供给用户的信息以及电子装置100的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。在一个实例中,显示模块114包括一个显示面板。显示面板例如可为一个液晶显示面板(Liquid Crystal Display, LCD)、有机发光二极管(Organic Light-Emitting D1deDisplay, OLED)显不面板、电泳显不面板(Electro-Phoretic Display, EPD)等。进一步地,触控表面可设置于显示面板上从而与显示面板构成一个整体。在另一些实施例中,显示模块114还可包括其他类型的显示装置,例如包括一个投影显示装置。相比于一般的显示面板,投影显示装置还需要包括一些用于投影的部件例如透镜组。
[0039]第一实施例
[0040]图2为本实施例提供的一种字符串识别方法流程图,如图2所示,本实施例的方法包括以下步骤:
[0041 ] 步骤SlO1、获取字符串,所述字符串由多种类型子字符串组成。
[0042]所述字符串可以是由用户即时输入的字符串,也可以是当前电子装置中已有的字符串。在一个实例中,本实施例中的方法用于一款即时通讯工具中,第一用户端与第二用户端之间互相发送字符串,所述获取字符串可以是当前界面接收到的字符串也可以通讯工具历史记录中的字符串。在另一个实例中,本实施例的方法可用于一款翻译软件中,所述字符串可为电子装置接收用户输入的字符串。
[0043]可以知道的是,字符串有多种类型,例如,阿拉伯文,中午,英文,数字,符号及其任意的组合等类型。所述多种类型字符串还对应匹配相应配置文件,所述配置文件用于标记所述预存的字符串类型对应确定目标类型。例如,数字加符号加数字“Number2Punct1n2Number”可以表示为小数,电话号码,数值等。例如,“2.13”,“010-88888888,,。相应配置为:“Number2Punct1n2Number:Decimal, Telephone,,。进一步地,所述配置文件可以更改及增加字符串定义的含义。例如字符串“3,247”属于上述的数字加符号加数字“Number2Punct1n2Number”类型,但是字符串“3,247”不属于配置文件中设置的类型,属于数值。则可在对上述字符串类型的配置文件进行增加目标类型“Numerical”。
[0044]步骤S102、将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串。
[0045]在一个实施方式中,将字符串分为四大类字符串:英文(English),表示汉字(Kanji),符号(Punctuat1n),数字(Number)。上述四类字符串也可以任意组合,例如,English2Number:表示英语加数字的类型,类型长度为2,比如“CA1419”;Number2Punctuat1n2Number:表示数字加符号加数字的类型,类型长度为3,比如,“010-88888888” ;Number2Kanj1:表示数字加汉字的类型,类型长度为2,比如,2014年。可以按照英文(English),表示汉字(Kanji),符号(Punctuat1n),数字(Number)及其组合分
ο
[0046]在一个实例中,将句子“中国移动(0941)3月16日在香港发布2005财年经营业绩”进行分词“中国/移动/ (/0941/) /3月/16日/在/香港/发布/2005/财年/经营/业绩”。进一步地,在进行分词时也将各子字符串标注词性。例如,“中国”标注词性“Kanji”,“3月”标注词性“Numberf Kanji”。通过标注个子字符串的词性,可用于子字符串识别处理时,作为前后子字符串的参照信息。
[0047]步骤S103、判断所述至少一个子字符串是否为单词汇。
[0048]所述单词汇为所述子字符串所属语种中有唯一含义的词汇。即用口语输出时只有唯一的读法。例如,若所述子字符串为“中国”则可以理解的是,“中国”在中文中有唯一含义,则可判定字符串“中国”为单词汇。例如,子字符串“China”在英文中也有唯一含义,也可以判定“China”为单词汇。
[0049]在本发明实施例中,根据上述字符串的四种分类,可以知道的是,若所述子字符串为中文或者英文单词则可以直接识别其含义,一般情况下不存在歧义。例如,“中国”在语音合成时可以直接顺序解读。判断子字符串是否为英文或者中文,若为中英文单词则可以直接读取,不需要再进行含义的识别。若不是中英单词汇,则需要进行歧义的解读,例如“2001
年”可以理解为“两千零一年”也可以解读为“二零零一年”。
[0050]步骤S104、若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理。
[0051]在一种实施方式中,本实施例的方法用于语音合成。语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。为了合成语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。
[0052]对于上述四大类型的组合的字符串可能存在歧义多个含义,同一类型的字符串也可以表示多种类型的内容,则需要对子字符串在当前字符串中的含义进行识别。
[0053]例如,“120”可以表示急救电话读作“幺二零”,也可以表示数值读作“一百二”。贝IJ可根据前后子字符串的意思进行识别,例如在一个实例中,“拨打120急救电话”,则可根据后面字符串“急救电话”判断“ 120”为电话号码。
[0054]“Number2Punct1n2Number”类型可以表示为小数,电话号码,数值等。例如,“2014年/中国/移动/营收/3,247/亿元/人民币”,其中的“3,247”可以根据前后的字符串“亿元”判断为数值。例如,“010-88888888”也是“Number2Punct1n2Number”类型表示电话号码。例如,上述例子中的“2014年”可以表示“两千零十四年”也可以表示“二零一四年”。则可根据前后字符串信息建立匹配模型,通过模型处理,然后选择模型的结果做为最终识别结果。在一个实例中可采用“条件随机场模型(CRF模型)”。所述条件随机场模型具有无向的图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场中,随机变量Y的分布为条件机率,给定的观察值则为随机变量X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构。上述例子中的“2014年”可以根据后面的多个字符串“中国/移动/营收”判断为“二零一四年”,而不是“两千零十四年”。
[0055]例如,对于数字加百分符号有确切的含义,表示百分数。则用通用的规则进行匹配识别。例如,数字加百分号表示百分数。
[0056]例如,字符串“jpg”,“gif”等为图片类型字符。则可以设定默认规则,当出现“BMP”、“ JPG”、“GIF”、“PNG”则识别为图片格式,可直接按照字符串中字母、数字挨个解读。
[0057]步骤S105、将识别后的所有子字符串合成连贯语音。
[0058]将上述识别的字符串转变为可以听得懂的、流利的口语输出。
[0059]进一步地,本实施例的方法,还可以将识别后的字符串语音合成。
[0060]根据本实施例的方法,通过对待是别的字符串进行分词,再对子字符串分别识别处理,提高识别的准确性。
[0061]第二实施例
[0062]本实施例提供一种字符串识别方法,本实施例与第一实施例类似,其不同之处在于,如图3所示,步骤S104具体还包括:
[0063]步骤S201、根据所述子字符串对应的前后字符串的内容识别所述子字符串。
[0064]步骤S202、将识别后的所述子字符串合成语音。
[0065]本实施例的方法可根据前面或后面的子字符串进行识别。根据前后子字符串部分字符串不存在歧义,则可以得出结果。
[0066]例如,“120”可以表示急救电话读作“幺二零”,也可以表示数值读作“一百二”。则可根据前后子字符串的意思进行识别,例如在一个实例中,“拨打120急救电话”,则可根据后面字符串“急救电话”判断“ 120”为电话号码。例如,“2014年/中国/移动/营收/3,247/亿元/人民币”,其中的“3,247”可以根据前后的字符串“亿元”判断为数值。识别出准确的结果再将当前识别的子字符串合成语音。
[0067]根据本实施例的方法,对子字符串进行识别处理时,通过前后的子字符串的信息识别子字符串的含义,避免多含义的字符串干扰,实现较高的准确率。
[0068]第三实施例
[0069]本实施例提供一种字符串识别方法,本实施例与第一实施例类似,其不同之处在于,如图4所示,步骤S104具体还包括:
[0070]步骤S301、建立字符串匹配模型,根据所述匹配模型识别所述子字符串的含义。
[0071]步骤S302、将识别后的所述子字符串合成语音。
[0072]所述多种类型子字符串还对应匹配相应配置文件,所述配置文件用于标记所述预存的字符串类型对应确定目标类型。例如,数字加符号加数字“Number2PunCti0n2Number”可以表示为小数,电话号码,数值等。相应配置为:“Number2Punct1n2Number:Decimal,Telephone,Numerical”。识别字符串时可根据子字符串对应类型的字符串对应匹配的相应配置文件识别。
[0073]例如,“2014年/中国/移动/营收/3,247/亿元/人民币”,其中的“3,247”可以根据前后的字符串“亿元”判断为数值。例如,“010-88888888”也是“Number2Punct1n2Number”类型表示电话号码。例如,上述例子中的“2014年”可以表示“两千零十四年”也可以表示“二零一四年”。则可根据前后字符串信息建立匹配模型,通过模型处理,然后选择模型的结果做为最终识别结果。在一个实例中,可采用“条件随机场模型(CRF模型)”。所述条件随机场模型具有无向的图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场中,随机变量Y的分布为条件机率,给定的观察值则为随机变量X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构。上述例子中的“2014年”可以根据后面的多个字符串“中国/移动/营收”判断为“二零一四年”,而不是“两千零十四年”。可以理解的是,所述匹配模型也可以是其它统计模型,例如隐马尔科夫模型(HMM模型),条件随机场模型(CRF模型),最大熵模型(ME模型)等。最后将识别的字符串合成语音。
[0074]根据本实施例的方法,根据前后信息,部分字符串仍然可能存在歧义,通过建立匹配模型,对比前后文的字符串信息识别当前子字符串的含义,从而进一步提高字符串识别的准确率。
[0075]第四实施例
[0076]本实施例提供一种字符串识别方法,本实施例与第一实施例类似,其不同之处在于,如图5所示,步骤S104具体还包括:
[0077]步骤S401、根据所述子字符串的含义直接识别。
[0078]步骤S402、将识别后的所述子字符串合成语音。
[0079]例如,对于数字加百分符号有确切的含义,表示百分数。则用通用的规则进行匹配识别。例如,数字加百分号表示百分数。
[0080]根据本实施例的方法,对于有直接明确含义的字符串直接识别,节省处理资源,同时也有较高的准确率。
[0081]第五实施例
[0082]本实施例提供一种字符串识别方法,本实施例与第一实施例类似,其不同之处在于,如图6所示,步骤S104具体还包括:
[0083]步骤S501、根据所述子字符串中的可识别字符串按照默认类型进行识别。
[0084]步骤S502、将识别后的所述子字符串合成语音。
[0085]对于一些字符串有对应默认的含义,则可以设置默认的识别规则。
[0086]例如,字符串“jpg”,“gif”等为图片类型字符。则可以设定默认规则,当出现“BMP ”、“ JPG”、“GIF”、“PNG”则识别为图片格式,可直接按照字符串中字母、数字挨个解读。合成语音时则直接按顺序合成字符串中字母、数字的语音。
[0087]根据本实施例的方法,对于部分特殊字符串可直接根据默认的规则进行识别,可定义特殊规则,提高字符串的识别准确率。
[0088]第六实施例
[0089]本实施例提供一种字符串识别装置,如图7所示,本实施例的装置包括:获取模块601、分词模块602、判断模块603、处理模块604、及合成模块605。
[0090]获取模块601,用于获取字符串,所述字符串由多种类型子字符串组成。
[0091]可以知道的是,字符串有多种类型,例如,阿拉伯文,中午,英文,数字,符号及其任意的组合等类型。所述多种类型字符串还对应匹配相应配置文件,所述配置文件用于标记所述预存的字符串类型对应确定目标类型。例如,数字加符号加数字“Number2Punct1n2Number”可以表示为小数,电话号码,数值等。例如,“2.13”,“010-88888888,,。相应配置为:“Number2Punct1n2Number:Decimal, Telephone,,。进一步地,所述配置文件可以更改及增加字符串定义的含义。例如字符串“3,247”属于上述的数字加符号加数字“Number2Punct1n2Number”类型,但是字符串“3,247”不属于配置文件中设置的类型,属于数值。则可在对上述字符串类型的配置文件进行增加目标类型“Numerical”。
[0092]分词模块602,用于将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串。
[0093]在一个实施方式中,将字符串分为四大类字符串:英文(English),表示汉字(Kanji),符号(Punctuat1n),数字(Number)。上述四类字符串也可以任意组合,例如,English2Number:表示英语加数字的类型,类型长度为2,如“CA1419”;Number2Punctuat1n2Number:表示数字加符号加数字的类型,类型长度为3,比如,“010-88888888” ;Number2Kanj1:表示数字加汉字的类型,类型长度为2,比如,2014年。可以按照英文(English),表示汉字(Kanji),符号(Punctuat1n),数字(Number)及其组合分
ο
[0094]在一个实例中,将句子“中国移动(0941)3月16日在香港发布2005财年经营业绩”进行分词“中国/移动/ (/0941/) /3月/16日/在/香港/发布/2005/财年/经营/业绩”。进一步地,在进行分词时也将各子字符串标注词性。例如,“中国”标注词性“Kanji”,“3月”标注词性“Numberf Kanji”。通过标注个子字符串的词性,可用于子字符串识别处理时,作为前后子字符串的参照信息。
[0095]判断模块603,用于判断所述至少一个子字符串是否为单词汇。
[0096]所述单词汇为所述子字符串所属语种中有唯一含义的词汇。
[0097]在本发明实施例中,根据上述字符串的四种分类,可以知道的是,若所述子字符串为中文或者英文单词则可以直接识别其含义,一般情况下不存在歧义。例如,“中国”在语音合成时可以直接顺序解读。判断子字符串是否为英文或者中文,若为中英文单词则可以直接读取,不需要再进行含义的识别。若不是中英单词汇,则需要进行歧义的解读,例如“2001年”可以理解为“两千零一年”也可以解读为“二零零一年”。
[0098]处理模块604,用于若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理。
[0099]对于可能存在歧义的子字符串进行识别,得出准确的结果。
[0100]合成模块605,用于将识别后的所有子字符串合成连贯语音。将上述识别的字符串转变为可以听得懂的、流利的口语输出。
[0101]根据本实施例的装置,通过对待是别的字符串进行分词,对子字符串分别识别处理,提高识别的准确性。
[0102]第七实施例
[0103]本实施例提供一种字符串识别装置,本实施例与第七实施例类似,其不同之处在于,如图8所示,所述装置还包括:
[0104]第一识别单元6041,用于根据所述子字符串对应的前后字符串的内容识别所述子字符串的;
[0105]语音合成单元6042,用于将识别后的所述子字符串合成语音。
[0106]关于本实施例的装置的其他细节,还可进一步参阅第二实施例,在此不再重复。
[0107]根据本实施例的装置,对子字符串进行识别处理时,通过前后的子字符串的信息识别子字符串的含义,避免多含义的字符串干扰,实现较高的准确率。
[0108]第八实施例
[0109]本实施例提供一种字符串识别装置,本实施例与第七实施例类似,其不同之处在于,如图9所示,所述装置还包括:
[0110]第二识别单元6043,用于建立字符串匹配模型,根据所述匹配模型识别所述子字符串的含义。
[0111]语音合成单元6042,用于当所述字符串中的子字符串识别后,将识别后的所述子字符串合成语音。
[0112]关于本实施例的装置的其他细节,还可进一步参阅第三实施例,在此不再重复。
[0113]根据本实施例的装置,根据前后信息,部分字符串仍然可能存在歧义,通过建立匹配模型,对比前后文的字符串信息识别当前子字符串的含义,从而进一步提高字符串识别的准确率。
[0114]第九实施例
[0115]本实施例提供一种字符串识别装置,本实施例与第七实施例类似,其不同之处在于,如图10所示,所述装置还包括:
[0116]第三识别单元6044,用于根据所述子字符串的含义直接识别。
[0117]语音合成单元6042,用于将识别后的所述子字符串合成语音。
[0118]关于本实施例的装置的其他细节,还可进一步参阅第四实施例,在此不再重复。
[0119]根据本实施例的装置,对于有直接明确含义的字符串直接识别,节省处理资源,同时也有较高的准确率。
[0120]第十实施例
[0121]本实施例提供一种字符串识别装置,本实施例与第七实施例类似,其不同之处在于,如图11所示,所述装置还包括:
[0122]第四识别单元6045,用于根据所述子字符串中的可识别字符串按照默认类型进行识别。
[0123]语音合成单元6042,用于将识别后的所述子字符串合成语音。
[0124]关于本实施例的装置的其他细节,还可进一步参阅第五实施例,在此不再重复。
[0125]根据本实施例的装置,对于部分特殊字符串可直接根据默认的规则进行识别,可定义特殊规则,提高字符串的识别准确率。
[0126]此外,本发明实施例还提供一种计算机可读存储介质,其内存储有计算机可执行指令,上述的计算机可读存储介质例如为非易失性存储器例如光盘、硬盘、或者闪存。上述的计算机可执行指令用于让计算机或者类似的运算装置完成上述的字符串识别方法中的各种操作。
[0127]以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
【权利要求】
1.一种字符串识别方法,其特征在于,所述方法包括以下步骤: 获取字符串,所述字符串由多种类型子字符串组成; 将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串; 判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇; 若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及 将识别后的所有子字符串合成连贯语音。
2.如权利要求1所述的字符串识别方法,其特征在于,所述将所述子字符串进行识别具体包括: 根据所述子字符串对应的前后字符串的内容识别所述子字符串; 将识别后的所述子字符串合成语音。
3.如权利要求1所述的字符串识别方法,其特征在于,所述将所述子字符串进行识别具体包括: 建立字符串匹配模型,根据所述匹配模型识别所述子字符串的含义; 将识别后的所述子字符串合成语音。
4.如权利要求1所述的字符串识别方法,其特征在于,所述将所述子字符串进行识别具体包括: 根据所述子字符串的含义直接识别; 将识别后的所述子字符串合成语音。
5.如权利要求1所述的字符串识别方法,其特征在于,所述将所述子字符串进行识别具体包括: 根据所述子字符串中的可识别字符串按照默认类型进行识别; 将识别后的所述字子符串合成语音。
6.如权利要求1-5任意一项所述的字符串识别方法,其特征在于,所述多种类型子字符串包括:英语类型、数字类型、符号类型、汉字类型及其组合。
7.如权利要求6所述的字符串识别方法,其特征在于,所述预多种类型子字符串还对应匹配相应配置文件,所述配置文件用于标记所述预存的字符串类型对应确定目标类型。
8.一种字符串识别装置,其特征在于,所述装置包括以下模块: 获取模块,用于获取字符串,所述字符串由多种类型子字符串组成; 分词模块,用于将所述字符串根据所述多种类型子字符串及其组合的子字符串类型进行分词,将所述字符串分成至少一个子字符串; 判断模块,用于判断所述至少一个子字符串是否为单词汇,所述单词汇为所述子字符串所属语种中有唯一含义的词汇; 处理模块,用于若判断所述子字符串不是单词汇,则将所述至少一个子字符串进行识别处理;以及 合成模块,用于将识别后的所有子字符串合成连贯语音。
9.如权利要求8所述的字符串识别装置,其特征在于,所述识别模块具体包括: 第一识别单元,用于根据所述子字符串对应的前后字符串的内容识别所述子字符串的; 语音合成单元,用于将识别后的所述子字符串合成语音。
10.如权利要求8所述的字符串识别装置,其特征在于,所述识别模块具体包括: 第二识别单元,用于建立字符串匹配模型,根据所述匹配模型识别所述子字符串的含义; 语音合成单元,用于将识别后的所述子字符串合成语音。
11.如权利要求8所述的字符串识别装置,其特征在于,所述识别模块具体包括: 第三识别单元,用于根据所述子字符串的含义直接识别。 语音合成单元,用于将识别后的所述子字符串合成语音。
12.如权利要求8所述的字符串识别装置,其特征在于,所述识别模块具体包括: 第四识别单元,用于根据所述子字符串中的可识别字符串按照默认类型进行识别。 语音合成单元,用于将识别后的所述子字符串合成语音。
13.如权利要求8-12任意一项所述的字符串识别装置,其特征在于,所述多种类型子字符串包括:英语类型、数字类型、符号类型、汉字类型及其组合。
14.如权利要求13所述的字符串识别装置,其特征在于,所述多种类型子字符串还对应匹配相应配置文件,所述配置文件用于标记所述预存的字符串类型对应确定目标类型。
【文档编号】G06F17/27GK104462058SQ201410579684
【公开日】2015年3月25日 申请日期:2014年10月24日 优先权日:2014年10月24日
【发明者】戴强, 刘骁 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1