一种语音处理方法及终端的制作方法

文档序号:10661113阅读:457来源:国知局
一种语音处理方法及终端的制作方法
【专利摘要】本发明实施例公开了一种语音处理方法,包括:若获取语音数据,识别语音数据并生成相应的显示信息;显示显示信息于终端触控屏上以供用户选择需要编辑的位置;若接收用户在终端触控屏上的操作指令,获取需要编辑的位置;若接收到用户编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。本发明实施例生成了与语音数据对应的显示信息,进而通过对显示信息编辑操作而相对应编辑语音数据,实现了语音的修改处理,本发明实施例还公开了一种终端。
【专利说明】
一种语音处理方法及终端
技术领域
[0001]本发明涉及电子技术领域,尤其涉及一种语音处理方法及终端。
【背景技术】
[0002]现在语音交互为应用非常广泛,用户使用语音交互时,常发生录入的语音没有表达出用户想要表达的内容,想要修改语音内容,现在技术中一般采用将已录入的语音撤回取消,然后用户重新进行录入操作,而无法对已录入的内容进行修改,用户体验效果差。

【发明内容】

[0003]本发明实施例提供一种语音处理方法及终端,可根据修改已获取的语音。
[0004]第一方面,本发明实施例提供了一种语音处理方法,包括若获取语音数据,识别所述语音数据并生成相应的显示信息;显示所述显示信息于终端触控屏上以供用户选择需要编辑的位置;若接收用户在终端触控屏上的操作指令,获取需要编辑的位置;若接收到用户编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。
[0005]另一方面,本发明实施例提供了一种终端,该终端包括识别单元、显示单元、检测单元以及编辑单元,其中识别单元用于若获取语音数据,识别语音数据并生成相应的显示信息数据的语音内容于终端触控屏上,语音数据以语音条展示于终端触控屏上;显示单元用于显示显示信息于终端触控屏上以供用户选择需要编辑的位置;检测单元用于若接收用户在终端触控屏上的操作指令,获取需要编辑的位置;编辑单元用于若接收到用户编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。
[0006]本发明实施例所公开的语音处理方法及终端中,根据与语音数据相对应的显示信息进行编辑操作来修改语音数据,实现了对获取的语音进行修改。
【附图说明】
[0007]为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0008]图1是本发明实施例提供的一种语音处理方法的示意流程图;
[0009]图2是本发明实施例提供的一种终端的触控屏的显示界面;
[0010]图3是本发明实施例提供的一种终端的触控屏的另一显示界面;
[0011 ]图4a是本发明实施例提供的语音数据的第一示意图;
[0012]图4b是本发明实施例提供的语音数据的第二示意图;
[0013]图5是本发明实施例提供的语音数据的第三示意图;
[0014]图6是本发明实施例提供的一种终端的示意性框图;
[0015]图7是本发明实施例提供的一种终端的示意性框图。
【具体实施方式】
[0016]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0017]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或若干个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0018]请参看图1,是本发明实施方式提供的一种语音处理方法的示意流程图,语音处理方法可以运行在智能手机(如Android手机、1S手机等)、平板电脑或电子阅读器等终端。语音处理方法中处理过后的语音数据是可以是重新发送,或者语音处理方法是在所获取的语音数据还未发送之前进行处理,处理后再发送,本发明实施例对此不进行具体的限定。处理方法包括SI OI?SI 04。
[0019]SlOl,若获取语音数据,识别语音数据并生成相应的显示信息。其中显示信息用于在终端触控屏上显示所接收语音数据的语音内容,显示信息与语音数据相对应;若获取语音数据,还将显示与所获取的语音数据相对应的语音条于终端触控屏上,其中语音条用于在终端触控屏上表示获取的语音数据。应当理解,语音数据、语音条以及显示信息为相对应关系。请从参看图2,如图所述,终端触控屏2上包括语音条21以及显示信息22,一个语音条21用于表示一条语音,若用户点击语音条21,将开启语音播发装置,自动播放该条语音的内容;显示信息22用于显示相对应的语音数据的语音内容。显示信息可以如图2所示以文字形式显示语音内容,还可以以图片或者动画等形式显示语音内容,本发明对此不进行具体的限定,本实施例中将以文字形式的显示内容为例进行说明。需要说明的是,本实施例中获取的语音数据为用户通过终端录入的语音数据,具体地,用户通过终端的传声器捕捉声音数据,并将声音数据转换为数据信号的语音数据存储于终端。
[0020]S102,显示显示信息于终端触控屏上以供用户选择需要编辑的位置。
[0021]S103,若接收用户在终端触控屏上的操作指令,获取需要编辑的位置。具体的,触控屏还具有基于触觉和/或能触知的接触从用户接受输入的触摸敏感表面、传感器或一组传感器,因此其可高频检测出用户在触控屏上的操作。如图3所示,用户可以在终端触控屏上滑动选择部分显示信息,被选择的显示信息即为需要编辑的位置,还可以通过点击选择显示信息中一个位置作为插入位置,该插入位置也为需要编辑的位置。应当理解,显示信息与语音数据是相对应的,因此用户在终端触控屏上对显示信息的选择操作来确定需要编辑的位置,同时语音数据中存在与显示信息中所确定需要编辑的位置相对应的需要编辑位置。
[0022]进一步地,若用户选择部分或者全部显示信息而生成需要编辑的位置,该处理方法还包括提供编辑指令以供用户选择,该编辑指令包括但是不限制于为删除、复制、剪切、插入等编辑操作。若用户选择显示信息中的一位置作为插入位置而生成需要编辑的位置,该处理方法还包括显示显示光标于显示信息上所需要编辑的位置,如图3所示,显示光标23设于显示信息22的所需要编辑的位置;处理方法还包括提供编辑指令以供用户选择,该编辑指令包括但是不限制于为插入以及粘贴等操作。应当理解,若显示信息以文字形式展现,可以选择显示信息中的一段或整段文字或者某位置进行编辑操作;若显示信息以图片或者动画形式展现,可以选择显示信息中的部分或者全部的图片、动画或者某位置进行编辑操作。
[0023]S103,若接收到用户的编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。具体的,由于显示信息与语音数据是相对应的,根据用户在显示信息上的编辑指令,相对应的编辑语音数据以实现对已录入的语音的修改。
[0024]应当理解,若编辑指令是删除指令,则响应编辑指令删除需要编辑的位置所对应的语音数据。具体的,如图3所示为用户录入的语音内容为“甲在不在,周末看电影,几点几面呢? ”,相应地,如图4a中所示为“甲在不在,周末看电影,几点几面呢? ”语音对应地存在于终端的语音数据,语音数据和显示信息一一对应,若用户在终端触控屏上选择显示信息中的一段内容如“周末看电影,几点几面呢? ”即该段文字为需要编辑的位置,若用户对显示信息中“周末看电影,几点几面呢? ”该段文字进行删除指令,则将删除需要编辑的位置所对应的语音数据,如图4b所示,图示中的语音数据已删除了 “周末看电影,几点几面呢?”相对应的语音数据。需要说明的是,其他实施例中,若显示信息是图片或者动画,则删除所需要编辑的位置相对应的图片或者动画。
[0025]应当理解,若编辑指令是插入指令,则响应编辑指令开启语音采集装置以采集新的语音;以及根据所述需要编辑的位置将采集的新的语音数据相对应地插入所获取的语音数据中。其中插入新语音数据可以是替换部分或全部获取的原语音数据,也可以是在获取的原语音数据中插入新语音数据,如图3和图4a和图5所示,若用户录入的语音内容为“甲在不在,周末看电影,几点几面呢?”并将其显示于终端触控屏上,图4a所示为相对应的语音数据。若用户想新插入“在哪里见? ”的新语音于原语音中以形成“甲在不在,周末看电影,几点几面呢?在哪里见?”的语音,则接收用户编辑指令后,开启语音采集装置采集用户录入新语音“在哪里见”,并将采集的新语音数据插入到所需要编辑的位置,形成如图5所示的甲在不在,周末看电影,几点几面呢?在哪里见?”的语音数据,实现原语音的修改。
[0026]应当理解,若编辑指令包括粘贴指令、复制指令、剪切指令,则获取需要编辑的位置包括选择部分显示信息生成的第一编辑位置以及选择粘贴位置生成的第二编辑位置。若接收用户复制或者剪切指令,则响应编辑指令对所述第一编辑位置所对应的语音数据进行复制和剪切;以及若接收到与第二位置相对应的粘贴指令,则根据所述第二编辑位置将所复制或剪切的语音数据相应地插入于所获取的语音数据中。
[0027]需要说明的是,若用户选择的编辑指令是插入指令,处理方法还包括根据需要编辑的位置在显示信息或语音条相应地显示语音光标于以供用户开启语音采集装置,如图3所示,语音光标24显示于语音条21上,本实施例中语音光标用于供用户开启语音采集装置,例如用户可通过点击语音光标来开启语音采集装置;其他实施例中,用户可以通过原语音录入方式开启语音采集装置。
[0028]还需要说明的是,对需要编辑的位置所对应的语音数据进行相应的编辑后,处理方法还包括:根据编辑后的语音数据更新相对应的显示信息和语音条。
[0029]上述语音处理方法通过生成了与语音数据对应的显示信息,通过对显示信息的删除、复制、剪切、插入以及粘贴等编辑操作进而相应地编辑语音数据,实现对获取的语音进行修改。
[0030]请参看图6,本发明实施例提供的一种终端,终端100包括在设备和用户之间提供输入接口和输出接口的触控屏,触控屏向用户显示视觉输出,视觉输出可以包括图形、文本、图标、视频和它们的任意组合,触控屏还具有基于触觉和/或能触知的接触从用户接受输入的触摸敏感表面、传感器或一组传感器,因此其可高频检测出用户在触控屏上的操作。该终端100包括接收单元10、识别单元20、处理单元30以及显示单元40。
[0031]其中接收单元10用于获取语音数据、接收用户在终端触控屏上的操作指令以及编辑指令。具体的,本实施例中获取的语音数据为用户通过终端录入的语音数据,具体地,用户通过终端的传声器捕捉声音数据,并将声音数据转换为数据信号的语音数据存储于终端。
[0032]识别单元20用于识别语音数据并生成相应的显示信息。显示信息用于表示所接收语音数据的语音内容于终端触控屏上,显示信息与语音数据相对应,语音数据以语音条的形式展示于终端触控屏上。显示信息可以以文字形式展示语音内容,还可以以图片或者动画等形式展示语音内容,本发明对此不进行具体的限定,本实施例中将以文字形式的显示内容为例进行说明。
[0033]显示单元30用于显示显示信息于终端触控屏上以供用户选择需要编辑的位置。
[0034]检测单元40用于若接收单元10接收用户在终端触控屏上的操作指令,获取需要编辑的位置。
[0035]具体的,用户可以在终端触控屏上滑动选择部分显示信息,被选择的显示信息即为需要编辑的位置,还可以选择显示信息中一个位置作为插入位置,该插入位置也为需要编辑的位置。应当理解显示信息与语音数据是相对应的,因此用户在终端触控屏上对显示信息的选择操作来确定需要编辑的位置,同时语音数据中存在与显示信息中所确定需要编辑的位置相对应的需要编辑位置。
[0036]进一步地,显示单元30还用于提供编辑指令以供用户选择,具体的,若用户选择部分或者全部显示信息而生成需要编辑的位置,则编辑指令包括但是不限制于为删除、复制、剪切、插入等编辑操作;若用户选择显示信息中的一位置作为插入位置而生成需要编辑的位置,该编辑指令包括但是不限制于为插入以及粘贴等操作。
[0037]编辑单元50用于若接收单元10接收到用户的编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。具体的,由于显示信息与语音数据是相对应的,根据用户在显示信息上的编辑指令,编辑单元50相对应的编辑编辑语音数据以实现对已录入的语音的修改。
[0038]若编辑指令是删除指令,编辑单元50响应编辑指令删除需要编辑的位置所对应的语音数据。
[0039]若编辑指令是插入指令,编辑单元50还包括采集单元501和处理单元502,其中采集单元501用于响应编辑指令开启语音采集装置以采集新的语音;处理单元502用于根据所述需要编辑的位置将采集的新的语音数据相对应地插入所获取的语音数据中。其中插入新语音数据可以是替换部分或全部获取的原语音数据,也可以是在获取的原语音数据中插入新语音数据。
[0040]若编辑指令包括粘贴指令、复制指令、剪切指令,检测单元40用于获取需要编辑的位置包括选择部分显示信息生成的第一编辑位置以及选择粘贴位置生成的第二编辑位置。编辑单元50用于若接收单元10接收用户复制或者剪切指令,响应编辑指令对所述第一编辑位置所对应的语音数据进行复制和剪切;以及还用于若接收单元10接收到与第二位置相对应的粘贴指令,则响应编辑指令根据所述第二编辑位置将所复制或剪切的语音数据相应地插入于所获取的语音数据中。
[0041]本实施例中,终端100还包括添加单元60,添加单元60用于若用户选择的编辑指令是插入指令,根据所需要编辑的位置在显示信息或者语音条上相对应地显示语音光标以供用户开启语音采集装置,本实施例中语音光标用于供用户开启语音采集装置;其他实施例中,用户可以通过原语音录入方式开启语音采集装置。
[0042]进一步地,添加单元60还用于根据所需要编辑的位置相应地显示显示光标于显示信息上。
[0043]参见图7,是本发明实施方式提供的另一种终端的示意框图。如图所示的本实施例中的终端200可以包括一个或者若干个处理器201、一个或者若干个输入装置202、一个或者若干个输出装置203以及存储器204。上述处理器201、输入装置202、输出装置203以及存储器204通过总线连接。
[0044]输入装置202用于接收用户操作录入的语音数据。具体实现中,本发明实施例的输入装置202可包括传声器等声音输入装置。
[0045]输出装置203用于对外输出显示信息、语音条、显示光标、语音光标给用户。具体实现中,本发明实施例的输出装置203可包括触控屏等显示器。
[0046]存储器204用于存储带有各种功能的程序数据以及存储用户录入的语音数据,具体实现中,本发明实施例的存储器204可以是系统存储器,比如,挥发性的(诸如RAM),非易失性的(诸如R0M,闪存等),或者两者的结合。具体实现中,本发明实施例的存储器204还可以是系统之外的外部存储器,比如,磁盘、光盘、磁带等。
[0047]处理器201用于调用存储器204中存储的程序数据即执行存储器204存储的指令,并执行如下操作:若获取语音数据,识别语音数据并生成相应的显示信息;显示显示信息于终端触控屏上以供用户选择需要编辑的位置;以及接收用户在终端触控屏上的操作指令,若接收用户在终端触控屏上的操作指令,处理器201还获取需要编辑的位置,以及还接收用户的编辑指令,若接收到用户的编辑指令,则对需要编辑的位置所对应的语音数据进行相应的编辑。
[0048]其中,若编辑指令是删除指令,处理器201响应编辑指令删除需要编辑的位置所对应的语音数据;若编辑指令包括粘贴指令、复制指令、剪切指令,则获取需要编辑的位置包括选择部分显示信息生成的第一编辑位置以及选择粘贴位置生成的第二编辑位置;若接收用户复制或者剪切指令,则响应编辑指令对所述第一编辑位置所对应的语音数据进行复制和剪切;若接收到与第二位置相对应的粘贴指令,则响应编辑指令根据所述第二编辑位置将所复制或剪切的语音数据相应地插入于所获取的语音数据中。此外,若用户选择的编辑指令是插入指令,根据所需要编辑的位置在显示信息或者语音条上相对应地显示语音光标以供用户开启语音采集装置以及根据所需要编辑的位置相应地显示显示光标于显示信息上。
[0049]应当理解,在本发明实施例中,所称处理器201可以是中央第一处理单元(CentralProcessing Unit,CPU),该处理器201还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Applicat1n Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0050]上述终端通过对与语音数据相对应的显示信息的编辑操作,实现了对语音数据的修改,从而实现了对已录入的语音的修改,用户即使录入的语音有误,也不需要撤回重录,提升用户体验好感。
[0051]需要说明的是,本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
[0052]本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
[0053]所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如若干个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
[0054]另外,在本发明各个实施例中的各功能单元可以集成在一个第一处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0055]以上所述,为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
【主权项】
1.一种语音处理方法,其特征在于,包括: 若获取语音数据,识别所述语音数据并生成相应的显示信息; 显示所述显示信息于终端触控屏上以供用户选择需要编辑的位置; 若接收用户在终端触控屏上的操作指令,获取需要编辑的位置; 若接收到用户编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。2.根据权利要求1所述语音处理方法,所述编辑指令包括插入指令,所述对需要编辑的位置所对应的语音数据进行相应的编辑,包括: 开启语音采集装置以采集新的语音数据; 根据所述需要编辑的位置将采集的新的语音数据相对应地插入所获取的语音数据中。3.根据权利要求1所述语音处理方法,所述编辑指令包括粘贴指令、复制指令、剪切指令,若接收用户在终端触控屏上的操作指令,获取需要编辑的位置包括:选择部分显示信息生成的第一编辑位置以及选择粘贴位置生成的第二编辑位置;所述对需要编辑的位置所对应的语音数据进行相应的编辑,包括: 若接收用户复制或者剪切指令,对所述第一编辑位置所对应的语音数据进行复制和剪切; 若接收到与第二位置相对应的粘贴指令,根据所述第二编辑位置将所复制或剪切的语音数据相应地插入于所获取的语音数据中。4.根据权利要求1所述语音处理方法,所述编辑指令包括删除指令,所述对需要编辑的位置所对应的语音数据进行相应的编辑,包括: 删除所述需要编辑的位置所对应的语音数据。5.根据权利要求1所述的语音处理方法,其特征在于,所述处理方法还包括: 显示与所获取的语音数据相对应的语音条; 根据所述需要编辑的位置在所述显示信息或者所述语音条上相对应地显示语音光标以供用户开启语音采集装置。6.一种终端,其特征在于,所述终端包括: 识别单元,用于若获取语音数据,识别所述语音数据并生成相应的显示信息数据的语音内容于终端触控屏上,所述语音数据以语音条展示于终端触控屏上; 显示单元,用于显示所述显示信息于终端触控屏上以供用户选择需要编辑的位置; 检测单元,用于若接收用户在终端触控屏上的操作指令,获取需要编辑的位置; 编辑单元,用于若接收到用户编辑指令,对需要编辑的位置所对应的语音数据进行相应的编辑。7.根据权利要求6所述的终端,其特征在于,若所述编辑指令包括插入指令,所述编辑单元包括: 采集单元,用于开启语音采集装置以采集新的语音; 处理单元,用于根据所述需要编辑的位置将采集的新的语音数据相对应地插入所获取的语音数据中。8.根据权利要求6所述的终端,其特征在于,所述编辑指令包括粘贴指令、复制指令、剪切指令,所述检测单元用于选择部分显示信息生成的第一编辑位置以及选择粘贴位置生成的第二编辑位置;所述编辑单元用于若接收用户复制或者剪切指令,对所述第一编辑位置所对应的语音数据进行复制和剪切;以及还用于若接收到与第二位置相对应的粘贴指令,根据所述第二编辑位置将所复制或剪切的语音数据相应地插入于所获取的语音数据中。9.根据权利要求6所述的终端,其特征在于,所述编辑指令包括删除指令,所述编辑单元用于删除所述需要编辑的位置所对应的语音数据。10.根据权利要求6所述的终端,其特征在于,所述终端还包括添加单元, 所述显示单元,还用于显示与所获取的语音数据相对应的语音条; 所述添加单元,用于根据所述需要编辑的位置在所述显示信息或者所述语音条上相对应地显示语音光标以供用户开启语音采集装置。
【文档编号】H04M1/725GK106027785SQ201610362712
【公开日】2016年10月12日
【申请日】2016年5月26日
【发明人】金妍敏, 肖志龙, 钟婉平
【申请人】深圳市金立通信设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1