一种信息处理方法和装置的制造方法_2

文档序号:8923590阅读:来源:国知局
体就是可以发出语音的个体,可以是实际存在的人类个体,也可以是可以发出语音的虚拟人物。
[0060]通信主体的声音数据可以在某一时刻获取某一个主体的声音数据,也可以是在同一时刻获取一个或多个通信主体的声音数据。
[0061]声音数据可以是在与其他通信主体进行通话的过程中实时获取的,或者声音数据可以是存储在电子设备中的与通信主体相关的声音数据,或者声音数据可以是通过电子设备中的录音装置摄录下的录音中包含人物讲话的声音,声音数据也可以来源于某一段包含声音的视频文件中,本申请实施例对声音数据的来源并不限定。
[0062]步骤102,解析所述声音数据获取所述一个或多个通信主体的语音特征,并建立与所述通信主体对应的语音特征集合;
[0063]由于声音数据中可能不仅仅包含通信主体讲话的声音,通过解析该声音数据获取得到通信主体的语音特征,并将一个通信主体相关的所有的语音特征作为与该通信主体对应的语音特征集合,语音特征集合可以通过设定的标识符与通信主体相对应,标识符可以是通信主体的名称等。
[0064]所述语音特征可以包括音色、讲话节奏和/或声纹信息。语音特征是反映讲话人讲话时的语音特征,声纹信息可以是讲话时的具体特征,如重音位置、尾音发音等等。语音特征集合可以是在一次的通话过程中得到,但是由于每次通话中涉及到的语音都是有限的,所以,语音特征集合可以在一个或多个声音数据中获取得到,语音特征集合记录了具有通信主体语音特征的信息,如某一个通信主体对于某一个字的读音,对于某一个短语、成语、俗语等的发音方式。
[0065]步骤103,当所述电子设备中的文本信息满足预设条件时,则依据与所述通信主体对应的语音特征集合,将所述文本信息转换为具有所述通信主体语音特征的语音信息。
[0066]当电子设备接收到了文本信息时,该文本信息可以是其他通信主体通过电子设备发送的,如其他用户发送的短信,或者与其他设备在进行信息交互时获取的,如访问某一网站得到的文本信息,如果接收到的文本信息满足预设条件,那么就可以依据与所述通信主体对应的语音特征集合将文本信息转换为语音信息,在本实施例中,如果文本信息的发送方为预设的通信主体,或者文本信息转换后的语音信息为具有通信主体语音特征的语音信息,则所述文本信息满足预设条件,可以将文本信息转换为语音信息。
[0067]在将文本信息转换为语音信息时,所依据的语音特征集合对应的通信主体与文本信息来源的通信主体可以一致,也可以不一致,如接收到某一用户发送的短信,进行转换所依据的语音特征集合可以是该用户的语音特征集合,也可以是其他通信主体对应的语音特征集合,也可以是依据其他通信主体的语音特征将来自该用户的文本信息转换为具有其他通信主体语音特征的语音信息。
[0068]如电子设备接收到了用户A发来的文本信息,电子设备可以将A的文本信息转换为具有A语音特征的语音信息,也可以将A的文本信息转换为具有B语音特征的语音信息,从而使文本信息转换的灵活性更高。
[0069]在本实施例中,转换后的语音信息是可以通过语音播放出来,或者存储在电子设备本地的存储器中,或者由用户进行选择进行设置,本实施例对语音信息的处理方式并不限定。
[0070]由于语音特征的特殊性,使得文本信息中可能存在并没有对应语音特征的情况,如文本信息中出现了某一个词语,该词语对应的语音特征并不存在,此时,可以使用预先存储的标准的语音特征来转换该词语,使得转换得到的语音信息具有连贯性,不会因为某些语音特征的缺失影响整个文本信息的转换。
[0071]通过上述技术方案,与现有技术相比,本申请可以将文本信息转换为具有通信主体语音特征的语音信息,可以最真实的表达文本信息想要表达的意思,使经过语音转换得到的文本信息具有鲜明的个人语言特点,当仅收听信息时即可判断该信息所对应的来源。
[0072]如图2所示,本申请实施例还提供了一种信息处理方法,应用电子设备,该方法可以包括:
[0073]步骤201,预先设置至少一个与所述通信主体语音相关的关键字;
[0074]本实施例中设置的关键字可以是与通信主体语音相关的关键字,可以针对不同的通信主体可以设置不同的关键字,关键字的选取可以是常用的文字,如汉语中的各种名词、动词和常用字等,英文中的冠词和数字等,由于关键字的选取直接影响到语音特征的提取,关键字的选取可以尽可能多的覆盖通信主体的常用语言,关键字可以是通信主体讲话过程中出现频率较高的字词,或者由于职业的专业性使得通信主体的日常讲话中会经常包含某一特定领域的词汇,那么就可以将这类词汇设置为与该通信主体对应的关键字,另外,关键字的设置需要考虑识别的难易程度,对于汉语中可能出现的多音字,可以针对多音字的使用场景,将多音字出现的词语设置为关键词,而不是将多音字设置为关键字,或者关键字可以是某一成语、俗语等,本申请对关键字的具体形式并不限定,关键字的设定可以为默认的集合,也可以由实际情况进行增加或修改。
[0075]步骤202,获取一个或多个通信主体的声音数据;
[0076]获取声音数据的步骤与上一实施例步骤101类似,本实施例不再赘述。
[0077]步骤203,滤除所述声音数据中的背景噪音,以获得所述通信主体的语音数据;
[0078]在获取到声音数据后,由于声音数据中并不仅仅包含通信主体讲话的声音,可能还存在其他的背景噪音,为了提高语音的识别准确度,在本实施例中,在获取通信主体语音特征时,可以先滤除所述声音数据中的背景噪音,以获得所述通信主体讲话时的语音数据;
[0079]步骤204,判断所述语音数据中是否包含所述关键字;
[0080]将所述语音数据转换为文字;
[0081]比对所述文字与所述关键字,当所述文字中包含与所述关键字相匹配的文字时,表明所述语音数据中包含所述关键字;
[0082]在得到滤除背景噪音的语音数据后,需要对语音数据进行分析,以得到通信主体的语音特征,此时,先判断语音数据中是否包含已经设置的关键字,通过解析语音数据,将语音数据中的语音转换为文字,将转换得到的文字与预先设置的关键字进行比对,如果转换后的文字在关键字一致,则表明语音数据中包含有预先设置的关键字。
[0083]步骤205,当所述语音数据中包含所述关键字时,提取与所述关键字对应的语音特征,并将所述语音数据中与所有与所述关键字对应的语音特征作为所述通信主体的语音特征集合。
[0084]在判断得到语音数据包含有关键字时,由于是否包含关键字的判断过程中,将语音数据转换为了文字,文字对应的语音数据也是确定的,通过与关键字一致的文字所对应的语音数据,提取语音数据中关键字对应的语音特征,得到关键字对应的语音特征,进而通过语音数据中所有与关键字对应的语音特征,得到与通信主体对应的包含有一个或多个语音特征的语音特征集合。
[0085]滤除所述声音数据中的背景噪音,以获得所述通信主体讲话时的语音数据;
[0086]判断所述语音数据中是否包含所述关键字;
[0087]当所述语音数据中包含所述关键字时,提取与所述关键字对应的语音特征,并将所述语音数据中与所有与所述关键字对应的语音特征作为所述通信主体的语音特征集合。
[0088]步骤206,解析所述文本信息包含的文字;
[0089]步骤207,当所述文本信息中的文字包含与所述通信主体对应的关键字时,依据与所述关键字对应的语音特征,将所述文本信息中的关键字转换为具有所述关键字语音特征的语首?目息。
[0090]在解析所述文本信息时,将文本信息中包含的文字与通信主体对应的关键字进行比对,这里的关键字对应的通信主体是文本信息将要转换成的语音信息所对应的通信主体,如文本信息是由通信主体A发送的,转换后的语音信息是具有A的语音特征的,那么就将文本信息中的文字与A对应的关键字进行比对,而如果转换后的语音信息是具有通信主体B的语音特征的,那么就将文本信息中的文字与B对应的关键字进行比对。
[0091]在比对完成后,得到文本信息中的文字包含有相应的通信主体对应的关键字,那么利用关键字对应的语音特征,将文本信息中的相应的文字转换为具有相应语音特征的语音,通过对文本信息中所有文字与关键字的比
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1