一种内容显示方法及终端设备与流程

文档序号:16754475发布日期:2019-01-29 17:13阅读:114来源:国知局
一种内容显示方法及终端设备与流程

本发明实施例涉及终端技术领域,尤其涉及一种内容显示方法及终端设备。



背景技术:

随着终端技术和互联网技术的不断发展,终端设备的应用越来越广,越来越多的用户已经习惯于通过终端设备中的通讯应用程序与他人互相通信。

目前,用户在使用终端设备的通讯应用程序时,可以通过语音输入的方式进行输入。例如,终端设备可以通过语音识别技术识别用户的语音输入,并将识别出的与语音输入对应的内容显示在终端设备的显示屏上。

然而,在上述基于语音输入的内容显示过程中,由于终端设备按照系统默认配置好的风格、格式等显示,因而使得终端设备显示内容的方式比较单调,从而导致终端设备内容的显示效果较差。



技术实现要素:

本发明实施例提供一种内容显示方法及终端设备,以解决现有终端设备按照系统默认方式显示内容导致显示效果较差的问题。

为了解决上述技术问题,本发明是这样实现的:

第一方面,本发明实施例提供了一种内容显示方法,应用于终端设备,该方法包括:获取目标语音信号,该目标语音信号为用户语音输入的信号;并获取目标语音信号的语音特征信息,该语音特征信息包括至少一个语音特征;且根据该语音特征信息,确定目标显示策略,该目标显示策略包括与每个语音特征对应的显示方式;以及识别该目标语音信号的内容,并按照该目标显示策略,显示该目标语音信号的内容。

第二方面,本发明实施例提供了一种终端设备,该终端设备包括获取模块、确定模块、识别模块以及显示模块。获取模块用于获取目标语音信号,并获取该目标语音信号的语音特征信息,该目标语音信号为用户语音输入的信号,该语音特征信息包括至少一个语音特征;确定模块用于根据获取模块获取的语音特征信息,确定目标显示策略,该目标显示策略包括与每个语音特征对应的显示方式;识别模块用于识别获取模块获取的目标语音信号的内容;显示模块用于按照确定模块确定的目标显示策略,显示识别模块识别的目标语音信号的内容。

第三方面,本发明实施例提供了一种终端设备,该终端设备包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述第一方面中的内容显示方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现上述第一方面中的内容显示方法的步骤。

在本发明实施例中,可以获取目标语音信号(该目标语音信号为用户语音输入的信号),并获取该目标语音信号的语音特征信息(该语音特征信息包括至少一个语音特征),且根据该语音特征信息,确定目标显示策略(该目标显示策略包括与每个语音特征对应的显示方式),以及在识别该目标语音信号的内容之后,按照该目标显示策略,显示该目标语音信号的内容。通过该方案,由于可以根据目标语音信号的语音特征信息,确定与该语音特征信息对应的目标显示策略,以用于显示该目标语音信号的内容,因此,对于不同的目标语音信号,根据其语音特征信息确定的目标显示策略也不同。如此,可以使得终端设备以不同的显示策略显示不同目标语音信号的内容,从而使得终端设备显示内容的方式比较丰富,提高了终端设备显示内容的效果。

附图说明

图1为本发明实施例提供的一种可能的安卓操作系统的架构示意图;

图2为本发明实施例提供的内容显示方法的示意图之一;

图3为本发明实施例提供的内容显示方法应用的界面示意图之一;

图4为本发明实施例提供的内容显示方法应用的界面示意图之二;

图5为本发明实施例提供的内容显示方法的示意图之二;

图6为本发明实施例提供的内容显示方法的示意图之三;

图7为本发明实施例提供的终端设备的结构示意图;

图8为本发明实施例提供的终端设备的硬件示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本文中术语“和/或”,是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。本文中符号“/”表示关联对象是或者的关系,例如a/b表示a或者b。

本发明的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一字号和第二字号等是用于区别不同的字号,而不是用于描述字号的特定顺序。

在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本发明实施例的描述中,除非另有说明,“多个”的含义是指两个或者两个以上,例如,多个处理单元是指两个或者两个以上的处理单元等。

本发明实施例提供一种内容显示方法及终端设备,可以获取目标语音信号(该目标语音信号为用户语音输入的信号),并获取该目标语音信号的语音特征信息(该语音特征信息包括至少一个语音特征),且根据该语音特征信息,确定目标显示策略(该目标显示策略包括与每个语音特征对应的显示方式),以及在识别该目标语音信号的内容之后,按照该目标显示策略,显示该目标语音信号的内容。通过该方案,由于可以根据目标语音信号的语音特征信息,确定与该语音特征信息对应的目标显示策略,以用于显示该目标语音信号的内容,因此,对于不同的目标语音信号,根据其语音特征信息确定的目标显示策略也不同。如此,可以使得终端设备以不同的显示策略显示不同目标语音信号的内容,从而使得终端设备显示内容的方式比较丰富,提高了终端设备显示内容的效果。

本发明实施例中的终端设备可以为具有操作系统的终端设备。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本发明实施例不作具体限定。

下面以安卓操作系统为例,介绍一下本发明实施例提供的内容显示方法所应用的软件环境。

如图1所示,为本发明实施例提供的一种可能的安卓操作系统的架构示意图。在图1中,安卓操作系统的架构包括4层,分别为:应用程序层、应用程序框架层、系统运行库层和内核层(具体可以为linux内核层)。

其中,应用程序层包括安卓操作系统中的各个应用程序(包括系统应用程序和第三方应用程序)。

应用程序框架层是应用程序的框架,开发人员可以在遵守应用程序的框架的开发原则的情况下,基于应用程序框架层开发一些应用程序。

系统运行库层包括库(也称为系统库)和安卓操作系统运行环境。库主要为安卓操作系统提供其所需的各类资源。安卓操作系统运行环境用于为安卓操作系统提供软件环境。

内核层是安卓操作系统的操作系统层,属于安卓操作系统软件层次的最底层。内核层基于linux内核为安卓操作系统提供核心系统服务和与硬件相关的驱动程序。

以安卓操作系统为例,本发明实施例中,开发人员可以基于上述如图1所示的安卓操作系统的系统架构,开发实现本发明实施例提供的内容显示方法的软件程序,从而使得该内容显示方法可以基于如图1所示的安卓操作系统运行。即处理器或者终端设备可以通过在安卓操作系统中运行该软件程序实现本发明实施例提供的内容显示方法。

本发明实施例中的终端设备可以为移动终端,也可以为非移动终端。示例性的,移动终端可以为手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、超级移动个人计算机(ultra-mobilepersonalcomputer,umpc)、上网本或者个人数字助理(personaldigitalassistant,pda)等,非移动终端可以为个人计算机(personalcomputer,pc)、电视机(television,tv)、柜员机或者自助机等,本发明实施例不作具体限定。

本发明实施例提供的内容显示方法的执行主体可以为上述的终端设备,也可以为该终端设备中能够实现该内容显示方法的功能模块和/或功能实体,具体的可以根据实际使用需求确定,本发明实施例不作限定。下面以终端设备为例,对本发明实施例提供的内容显示方法进行示例性的说明。

如图2所示,本发明实施例提供一种内容显示方法,该内容显示方法可以包括下述的s200-s203。

s200、终端设备获取目标语音信号。

其中,上述目标语音信号可以为用户语音输入的信号。

本发明实施例中,如果用户通过语音输入与终端设备交互,则用户可以使用终端设备中具有语音识别功能的应用程序(例如语音助手、语音输入法等)输入语音,以触发终端设备采集用户语音输入的语音信号,即上述的目标语音信号。

本发明实施例中,上述用户通过语音输入与终端设备交互的场景可以包括用户通过终端设备中的通讯应用程序,以语音输入的方式进行聊天;用户通过终端设备中的浏览器应用程序,以语音输入的方式进行搜索;用户通过终端设备中的语音助手应用程序,以语音输入的方式与终端设备交互等。

本发明实施例中,以用户和对方用户通过终端设备中的通讯应用程序,以语音输入的方式进行聊天为例,终端设备获取目标语音信号的方式可以包括以下两种可能的实现方式:终端设备可以通过采集用户输入的语音信号的方式获取目标语音信号,以及终端设备可以通过接收对方用户输入的语音信号的方式获取目标语音信号。

可选的,本发明实施例中,上述的s200具体可以通过下述的s200a和s200b实现。

s200a、终端设备接收用户的第一输入。

其中,上述第一输入用于触发终端设备获取语音信号。

s200b、终端设备响应于该第一输入,获取用户输入的目标语音信号。

本发明实施例中,上述第一输入可以包括用户对终端设备的界面(例如通讯应用程序的界面)上的“语音输入”控件的输入,以及用户的语音输入,具体可以根据实际使用需求确定,本发明实施例不作限定。

下面结合图3,以通讯应用程序的界面为例示例性的说明终端设备响应于用户的第一输入,采集用户输入的目标语音信号的方法。

如图3中的(a)所示,用户可以通过对通讯应用程序的界面上的“语音输入”控件输入并输入语音(即上述的第一输入),以触发终端设备采集语音信号。相应地,如图3中的(b)所示,终端设备可以响应于该输入,采集用户输入的语音信号(即目标语音信号),并识别该目标语音信号对应的内容,并且终端设备可以在该界面上显示该内容(例如“逛街,我喜欢,嘿嘿”)。进一步可选的,如图3中的(b)所示,用户可以对终端设备的界面上的“完成”控件输入,以触发终端设备停止采集语音信号。

其中,对于对方用户输入的语音信号,终端设备可以直接接收对方用户输入的语音信号,将接收到的语音信号作为目标语音信号。进而终端设备可以获取该目标语音信号的语音特征信息,再根据该语音特征信息,确定目标显示策略,然后根据该目标显示策略,显示该语音信号对应的内容。

本发明实施例提供的内容显示方法中,终端设备可以响应于用户的第一输入,实时采集用户输入的目标语音信号,从而提升了用户使用终端设备输入语音的便捷性。

s201、终端设备获取目标语音信号的语音特征信息。

其中,上述语音特征信息可以包括至少一个语音特征。

可选的,本发明实施例中,上述至少一个语音特征可以包括以下至少一项:目标语音信号中的语音语气信息、目标语音信号中的语音音量信息、目标语音信号中的语音速度信息、目标语音信号中的语音音调信息、目标语音信号中的语音声调信息。

可以理解,上述列举的各个语音特征均是示例性的列举,即本发明实施例包括但不限于上述列举的各个语音特征。实际实现时,上述语音特征还可以包括其它任意可能的语音特征,具体可以根据实际使用需求确定,本发明实施例不作限定。

本发明实施例中,上述目标语音信号中的语音语气信息可以用于指示目标语音信号表达的情感;示例性的,语音语气信息可以为表示高兴、愤怒、悲伤或者恐惧等情感的语气信息。上述目标语音信号中的语音音量信息可以指示目标语音信号的音量的大小;示例性的,语音音量信息可以包括低音量、中音量和高音量等。上述目标语音信号中的语音速度信息可以用于指示目标语音信号的语音速度信息的快慢;示例性的,语音速度信息可以包括慢速、中速和快速等。上述目标语音信号中的语音音调信息可以用于指示声音振动频率的高低;示例性的,语音音调信息可以包括低频、中频和高频等,通常男性的语音音调(对应于低频)低于女性的语音音调(对应于高频)。上述目标语音信号中的语音声调信息可以用于指示目标语音信号的抑扬顿挫;示例性的,语音声调信息可以包括阴平、阳平、上声和去声平调、升调、降升调和降调。

需要说明的是,上述目标语音信号中的语音语气信息、语音音量信息、语音速度信息、语音音调信息、语音声调信息各自的分类均为示例性的举例说明,具体可以根据实际使用需求确定,本发明实施例不作限定。

s202、终端设备根据语音特征信息,确定目标显示策略。

其中,上述目标显示策略可以包括与每个语音特征对应的显示方式。

本发明实施例中,终端设备可以在采集用户语音输入的目标语音信号并获取目标语音信号的语音特征信息之后,根据该语音特征信息中的每个语音特征,确定与每个语音特征对应的显示方式,从而以得到与该语音特征信息对应的目标显示策略。

可选的,本发明实施例中,上述目标显示策略可以包括以下至少一项:以预设文字字体显示、以预设文字字号显示、以预设文字颜色显示、以预设文字间隔显示、以预设文字笔画宽度显示。

可以理解,上述列举的各个目标显示策略均是示例性的列举,即本发明实施例包括但不限于上述列举的各个目标显示策略。实际实现时,上述语音特征还可以包括其它任意可能的目标显示策略,具体可以根据实际使用需求确定,本发明实施例不作限定。

可选的,本发明实施例中,一个语音特征可以对应一种预设显示方式。具体的,目标语音信号中的语音语气信息、目标语音信号中的语音音量信息、目标语音信号中的语音速度信息、目标语音信号中的语音音调信息、目标语音信号中的语音声调信息等语音特征中的任一项,可以对应于以预设文字字体显示、以预设文字字号显示、以预设文字颜色显示、以预设文字间隔显示、以预设文字笔画宽度显示等预设显示方式中的任一项。上述每个语音特征与预设显示方式的对应关系,具体可以根据实际使用需求确定,本发明实施例不作限定。

具体的,本发明实施例中,终端设备可以预先存储语音特征信息中的每个语音特征与预设显示方式的对应关系。如此,针对终端设备获取的语音特征信息中的每个语音特征,终端设备均可以根据该对应关系,确定与获取的每个语音特征对应的显示方式。

其中,终端设备中可以保存预设的语音特征。如此,终端设备可以在获取目标语音信号中的语音特征信息之后,将语音特征信息中的语音特征与其对应的预设的语音特征进行比较,进而终端设备可以根据比较结果,确定以哪种显示方式显示目标语音信号的内容。

下面以语音语气信息对应于以预设文字颜色显示的显示方式为例进行示例性的说明。

示例性的,假设目标语音信号中的语音语气信息与以预设文字颜色显示的显示方式具有对应关系。例如,语音语气信息“高兴”可以对应于以橙色显示文字,语音语气信息“愤怒”可以对应于以红色显示文字,语音语气信息“悲伤”可以对应于以灰色显示文字,语音语气信息“恐惧”可以对应于以蓝色显示文字。如此,终端设备可以根据语音特征信息中的语音语气信息,确定以哪种文字颜色显示文字,即以哪种文字颜色显示目标语音信号的内容对应的文字。具体的,终端设备可以将目标语音信号中的语音语气信息与预设的语音语气信息进行比较,并根据比较结果确定相应的文字颜色,从而确定以哪种文字颜色显示目标语音信号的内容对应的文字。

可选的,上述语音语气信息与以预设文字颜色显示的显示方式之间的对应关系可以为系统默认设置,也可以由用户自定义设置,具体可以根据实际使用需求确定,本发明实施例不作限定。

需要说明的是,上述语音语气信息与以预设文字颜色显示的显示方式之间的对应关系为示例性的举例说明,具体可以根据实际使用需求确定,本发明实施例不作限定。

下面再以语音音量信息对应于以预设文字字号显示的显示方式为例进行示例性的说明。

示例性的,假设目标语音信号中的语音音量信息与以预设文字字号显示的显示方式具有对应关系。例如,“低音量”可以对应于以第一字号显示,“中音量”可以对应于以第二字号显示,“高音量”可以对应于以第三字号显示。

可选的,“低音量”可以对应于以第一字号显示文字,“中音量”可以对应于以比第一字号大的第二字号显示文字,“高音量”可以对应于以比第二字号大的第三字号显示文字。例如,第一字号、第二字号和第三字号分别可以为字号“8”、字号“12”和字号“16”。即,语音音量越大,则预设文字字号越大,相应地,终端设备显示的文字也就越大。可以理解,上述是以语音音量越大,预设文字字号越大为例示例性说明的。具体实现时,语音音量越大,预设文字字号越小的情况也属于本发明实施例的保护范围。

如此,终端设备可以根据语音特征信息中的语音音量信息,确定以哪种文字字号显示文字,即以哪种文字字号显示目标语音信号的内容对应的文字。具体的,终端设备可以将目标语音信号中的语音音量与预设的语音音量阈值进行比较,并根据比较结果确定相应的文字字号,从而确定以哪种文字字号显示目标语音信号的内容对应的文字。

示例性的,在目标语音信号中的语音音量等于预设的语音音量阈值(例如50db)时(即语音音量信息指示“中音量”),终端设备可以确定以第二字号(例如字号“12”)显示文字。在目标语音信号中的语音音量小于该语音音量阈值时(即语音音量信息指示“低音量”),终端设备可以确定以比第二字号小的第一字号(例如字号“8”)显示文字。在目标语音信号中的语音音量大于该语音音量阈值时(即语音音量信息指示“高音量”),终端设备可以确定以比第二字号大的第三字号(例如字号“16”)显示文字。

可选的,上述语音音量信息与以预设文字字号显示的显示方式之间的对应关系可以为系统默认设置,也可以由用户自定义设置,具体可以根据实际使用需求确定,本发明实施例不作限定。

需要说明的是,上述第一字号、第二字号和第三字号为示例性的举例说明,本发明实施例不限于这三个字号,也不限于上述三个字号的尺寸代表值,上述预设文字字号的数量和尺寸代表值具体可以根据实际使用需求确定,本发明实施例不作限定。

下面又以语音速度信息对应于以预设文字间隔显示的显示方式为例进行示例性的说明。

示例性的,假设目标语音信号中的语音速度信息与以预设文字间隔显示的显示方式具有对应关系。例如,“慢速”可以对应于以第一文字间隔显示,“中速”可以对应于以第二文字间隔显示,“快速”可以对应于以第三文字间隔显示。

可选的,“慢速”可以对应于以第一文字间隔显示文字,“中速”可以对应于以比第一文字间隔小的第二文字间隔显示文字,“快速”可以对应于以比第二文字间隔小的第三文字间隔显示文字。例如,第一文字间隔、第二文字间隔和第三文字间隔分别可以为1.5毫米、1毫米和0.5毫米。即,语音速度越大(即越快),则预设文字间隔越小,相应地,终端设备显示的文字也就紧密。可以理解,上述是以语音速度越大,预设文字间隔越小为例示例性说明的。具体实现时,语音速度越大,预设文字间隔越大的情况也属于本发明实施例的保护范围。

如此,终端设备可以根据语音特征信息中的语音速度,确定以哪种文字间隔显示文字,即以哪种文字间隔显示目标语音信号的内容对应的文字。具体的,终端设备可以将目标语音信号中的语音速度与预设的语音速度阈值进行比较,并根据比较结果确定相应的文字间隔,从而确定以哪种文字间隔显示目标语音信号的内容对应的文字。

示例性的,在目标语音信号中的语音速度等于预设的语音速度阈值(例如120字/分)时,终端设备可以确定以第二文字间隔(例如1毫米)显示文字。在目标语音信号中的语音速度小于该语音速度阈值时,终端设备可以确定以比第二文字间隔大的第一文字间隔(例如1.5毫米)显示文字。在目标语音信号中的语音速度大于该语音速度阈值时,终端设备可以确定以比第二文字间隔小的第三文字间隔(例如0.5毫米)显示文字。

可选的,上述语音速度信息与以预设文字间隔显示的显示方式之间的对应关系可以为系统默认设置,也可以由用户自定义设置,具体可以根据实际使用需求确定,本发明实施例不作限定。

需要说明的是,上述第一文字间隔、第二文字间隔和第三文字间隔为示例性的举例说明,本发明实施例不限于这三个文字间隔,也不限于上述三个文字间隔的数值,上述预设文字字号的数量和数值具体可以根据实际使用需求确定,本发明实施例不作限定。

下面还以语音音调信息对应于以预设文字笔画宽度的显示方式为例进行示例性的说明。

示例性的,假设目标语音信号中的语音音调信息与以预设文字笔画宽度显示的显示方式具有对应关系。例如,“低频”可以对应于以第一文字笔画宽度显示,“中频”可以对应于以第二文字笔画宽度显示,“高频”可以对应于以第三文字笔画宽度显示。

可选的,“低频”可以对应于以第一文字笔画宽度(可称为“加粗体”)显示文字,“中频”可以对应于以比第一文字笔画宽度小的第二文字笔画宽度(可称为“粗体”)显示文字,“高频”可以对应于以比第二文字笔画宽度小的第三文字笔画宽度(可称为“细体”)显示文字。例如,第一文字笔画宽度、第二文字笔画宽度和第三文字笔画宽度分别可以为0.8毫米、0.6毫米和0.4毫米。即,语音音调越高(即频率越大),则预设文字笔画宽度越小,相应地,终端设备显示的文字笔画也就纤细。可以理解,上述是以语音音调越高,预设文字笔画宽度越小为例示例性说明的。具体实现时,语音音调越高,预设文字笔画宽度越大的情况也属于本发明实施例的保护范围。

如此,终端设备可以根据语音特征信息中的语音音调,确定以哪种文字笔画宽度显示文字,即以哪种文字笔画宽度显示目标语音信号的内容对应的文字。具体的,终端设备可以将目标语音信号中的语音音调与预设的语音音调阈值进行比较,并根据比较结果确定相应的文字笔画宽度,从而确定以哪种文字笔画宽度显示目标语音信号的内容对应的文字。

示例性的,在目标语音信号中的语音音调等于预设的语音音调阈值(例如300hz)时,终端设备可以确定以第二文字笔画宽度(例如0.6毫米)显示文字。在目标语音信号中的语音音调低于该语音音调阈值时,终端设备可以确定以比第二文字笔画宽度大的第一文字笔画宽度(例如0.8毫米)显示文字。在目标语音信号中的语音音调高于该语音音调阈值时,终端设备可以确定以比第二文字笔画宽度小的第三文字笔画宽度(例如0.4毫米)显示文字。

可选的,上述语音音调信息与以预设文字笔画宽度显示的显示方式之间的对应关系可以为系统默认设置,也可以由用户自定义设置,具体可以根据实际使用需求确定,本发明实施例不作限定。

需要说明的是,上述第一文字笔画宽度、第二文字笔画宽度和第三文字笔画宽度为示例性的举例说明,本发明实施例不限于这三个文字笔画宽度,也不限于上述三个文字笔画宽度的数值,上述预设文字笔画宽度的数量和数值具体可以根据实际使用需求确定,本发明实施例不作限定。

上述实施例中是以语音语气信息对应于以预设文字颜色显示的显示方式、语音音量信息对应于以预设文字字号显示的显示方式、语音速度信息对应于以预设文字间隔显示的显示方式、语音音调信息对应于以预设文字笔画宽度的显示方式为例进行示例性的说明的。可以理解,本发明实施例中,语音特征信息中的语音特征与预设显示方式的对应关系不限于上述情况,例如语音语调信息可以对应于以预设文字字体显示的显示方式,语音语气信息也可以对应于以预设文字字号显示的显示方式,语音音量信息也可以对应于以预设文字颜色显示的显示方式,语音速度信息也可以对应于以预设文字笔画宽度显示的显示方式、语音音调信息也可以对应于以预设文字间隔的显示方式,具体可以根据实际使用需求确定,本发明实施例不作限定。

本发明实施例中,终端设备可以根据语音特征信息中的每个语音特征,确定与每个语音特征对应的显示方式。进而,得到由各个语音特征对应的显示方式组成的目标显示策略。

s203、终端设备识别目标语音信号的内容,并按照目标显示策略,显示目标语音信号的内容。

本发明实施例中,终端设备可以通过语音识别技术,识别目标语音信号的内容得到文字(即文本),进而终端设备可以按照上述目标显示策略,显示识别目标语音信号的内容得到的文字。

需要说明的是,本发明实施例可以不限定上述s201-s202和s203中终端设备识别目标语音信号的内容的步骤的执行顺序。即本发明实施例可以先执行s201-s202,后执行s203中终端设备识别目标语音信号的内容的步骤;也可以先执行s203中终端设备识别目标语音信号的内容的步骤,后执行s201-s202;还可以同时执行s201-s202和s203中终端设备识别目标语音信号的内容的步骤。可以理解,上述图2是以先执行s201-s202,后执行s203中终端设备识别目标语音信号的内容的步骤为例示意的。

以下再结合图4、以通讯应用程序的界面为例示例性地说明本发明实施例提供的内容显示方法。

图4中的(a)示出了现有的在终端设备中的通讯应用程序的界面上的内容显示方式的示意图。其中,终端设备可以响应于用户的语音输入,识别该语音输入对应的内容并在该界面上显示该内容对应的文字。如图4中的(a)所示,在这种基于语音输入的内容显示过程中,由于终端设备按照系统默认配置好的风格、格式等显示,因而使得终端设备显示内容的方式比较单调,从而导致终端设备显示内容的效果较差。

图4中的(b)示出了本发明实施例提供的在终端设备中的通讯应用程序的界面上的内容显示方式的示意图。如图4中的(b)所示,如果终端设备判断用户小a的语音速度小于预设的语音速度阈值,则终端设备可以确定将用户小a的语音输入对应的内容(例如“嗨,周末一起去逛街,怎么样”)以第一文字间隔(例如1.5毫米)显示。如果终端设备判断用户小b的语音速度大于预设的语音速度阈值,则终端设备可以确定将用户小b的语音信号对应的内容(例如“好啊好啊”)以比第一文字间隔小的第三文字间隔(例如0.5毫米)显示。

如图4中的(b)所示,如果终端设备判断用户小b的语音音量小于预设的语音音量阈值,终端设备可以确定将用户小b的语音信号对应的内容(例如“好啊好啊”)以第一字号(例如字号“8”)显示。如果终端设备判断用户小b的语音音量大于预设的语音音量阈值,终端设备可以确定将用户小b的语音信号对应的内容(例如“不见不散”)以比第一字号大的第三字号(例如字号“16”)显示,即以相对较大的字号显示。

如图4中的(b)所示,如果终端设备判断用户小a的语音音调高于预设的语音音调阈值,终端设备可以确定将用户小a的语音信号对应的内容(例如“哈哈哈,我也是”)以第三文字笔画宽度(例如0.4毫米)显示,即以细体显示。如果终端设备判断用户小b的语音音调低于预设的语音音调阈值,终端设备可以确定将用户小b的语音信号对应的内容(例如“不见不散”)以比第三文字笔画宽度小的第一文字笔画宽度(例如0.8毫米)显示,即以加粗体显示。

此外,如果终端设备判断用户小a的语音语气信息符合预设的语音语气信息(例如表示“高兴”的语气),终端设备可以确定将用户小a的语音信号对应的内容(例如“喜欢”、“哈哈哈”)以预设文字颜色(例如橙色)显示。

相对于图4中的(a)所示的显示内容的方式比较单调的效果,图4中的(b)所示的显示内容的方式比较丰富,改善了终端设备显示内容的效果,从而增强了用户使用终端设备的趣味性。

本发明实施例提供的内容显示方法,可以获取目标语音信号(该目标语音信号为用户语音输入的信号),并获取该目标语音信号的语音特征信息(该语音特征信息包括至少一个语音特征),且根据该语音特征信息,确定目标显示策略(该目标显示策略包括与每个语音特征对应的显示方式),以及在识别该目标语音信号的内容之后,按照该目标显示策略,显示该目标语音信号的内容。通过该方案,由于可以根据目标语音信号的语音特征信息,确定与该语音特征信息对应的目标显示策略,以用于显示该目标语音信号的内容,因此,对于不同的目标语音信号,根据其语音特征信息确定的目标显示策略也不同。如此,可以使得终端设备以不同的显示策略显示不同目标语音信号的内容,从而使得终端设备显示内容的方式比较丰富,提高了终端设备显示内容的效果。

可选的,本发明实施例中,上述至少一个语音特征包括目标语音信号中的语音语气信息。相应地,结合图2,如图5所示,上述的s201具体可以通过下述的s201a和s201b实现。

s201a、终端设备获取目标语音信号的目标语音特征。

其中,上述目标语音特征用于指示目标语音信号中的语音语气信息。

本发明实施例中,目标语音特征可以包括以下中至少一项:目标语音信号中的语音音量信息、目标语音信号中的语音速度信息、目标语音信号中的语音音调信息、目标语音信号中的语音声调信息、目标语音信号中的语音字符信息。

s201b、终端设备根据目标语音特征,获取目标语音信号中的语音语气。

本发明实施例中,终端设备可以在采集用户语音输入的目标语音信号之后,获取目标语音信号的目标语音特征,再根据该目标语音特征获取目标语音信号中的语音语气信息,进而终端设备可以根据目标语音信号中的语音语气信息,确定与该语音语气信息对应的显示方式。

可选的,结合图5,如图6所示,上述的s201b具体可以通过下述的s201b1和s201b2实现。

s201b1、终端设备根据目标语音特征,确定与目标语音特征对应的预设语音特征范围。

s201b2、终端设备将与预设语音特征范围对应的预设语音语气信息确定为目标语音信号中的语音语气信息。

本发明实施例中,如上所述,目标语音信号中的语音语气信息可以为表示“高兴”、“愤怒”、“悲伤”或者“恐惧”等情感的语气信息,这些语音语气信息可以通过以下语音特征中的至少一项来确定:目标语音信号中的语音音量、目标语音信号中的语音速度信息、目标语音信号中的语音音调信息、目标语音信号中的语音声调信息、目标语音信号中的语音字符信息。相应地,终端设备可以根据上述语音特征中至少一项,确定预设语音特征范围,例如“高兴”语音特征范围、“愤怒”语音特征范围、“悲伤”语音特征范围或者“恐惧”语音特征范围。

示例性的,假设目标语音特征为目标语音信号中的语音音量信息、语音速度信息、语音声调信息和语音字符信息,那么终端设备可以根据该目标语音信号中的语音音量信息、语音速度信息、语音声调信息和语音字符信息,确定“愤怒”语音特征范围。例如,如果终端设备确定目标语音信号中的语音音量信息为“高音量”、语音速度信息为“快速”、语音声调信息为阳平(即升调)且语音字符信息符合预设字符信息,则终端设备可以根据这些目标语音特征,确定与该目标语音特征对应的预设语音特征范围为“愤怒”语音特征范围,进而可以将与“愤怒”语音特征范围对应的语音语气信息“愤怒”确定为目标语音信号中的语音语气信息,由此终端设备获取目标语音信号中的语音语气信息。

再示例性的,假设目标语音特征为目标语音信号中的语音音量信息、语音速度信息、语音声调信息和语音字符信息,那么终端设备可以根据目标语音信号中的目标语音特征,确定“悲伤”语音特征范围。例如,如果终端设备确定目标语音信号中的语音音量信息为“低音量”、语音速度信息为“慢速”、语音声调信息为去声(即降调)且语音字符信息符合预设字符信息,则终端设备可以根据这些目标语音特征,确定与该目标语音特征对应的预设语音特征范围为“悲伤”语音特征范围,进而可以将与“悲伤”语音特征范围对应的语音语气信息“悲伤”确定为目标语音信号中的语音语气信息,由此终端设备获取目标语音信号中的语音语气信息。

可以理解,上述的目标语音特征均是示例性的列举,即本发明实施例包括但不限于上述列举的目标语音特征。实际实现时,上述目标语音特征还可以包括其它任意可能的语音特征,具体可以根据实际使用需求确定,本发明实施例不作限定。

本发明实施例提供的内容显示方法中,终端设备可以基于目标语音信号中的不同语音特征,确定目标语音信号中的语音语气信息,从而可以提升终端设备确定语音语气信息的准确性。

如图7所示,本发明实施例提供一种终端设备700,该终端设备700可以包括获取模块701、确定模块702、识别模块703以及显示模块704。

获取模块701,用于获取目标语音信号,并获取该目标语音信号的语音特征信息,该目标语音信号为用户语音输入的信号,该语音特征信息包括至少一个语音特征;确定模块702,用于根据获取模块702获取的该语音特征信息,确定目标显示策略,该目标显示策略包括与每个语音特征对应的显示方式;识别模块703,用于识别获取模块701获取的目标语音信号的内容;显示模块704,用于按照确定模块702确定的该目标显示策略,显示识别模块703识别的该目标语音信号的内容。

可选的,本发明实施例中,上述至少一个语音特征可以包括以下至少一项:上述目标语音信号中的语音语气信息、上述目标语音信号中的语音音量信息、上述目标语音信号中的语音速度信息、上述目标语音信号中的语音音调信息、上述目标语音信号中的语音声调信息。

可选的,本发明实施例中,上述目标显示策略可以包括以下至少一项:以预设文字字体显示、以预设文字字号显示、以预设文字颜色显示、以预设文字间隔显示、以预设文字笔画宽度显示。

可选的,本发明实施例中,上述至少一个语音特征可以包括上述目标语音信号中的语音语气信息。相应地,获取模块701具体用于获取目标语音信号的目标语音特征,并根据该目标语音特征,确定与该目标语音特征对应的预设语音特征范围,且将与该预设语音特征范围对应的预设语音语气信息确定为目标语音信号中的语音语气信息,该目标语音特征用于指示目标语音信号中的语音语气信息。

可选的,本发明实施例中,上述获取模块701,具体用于接收用户的第一输入,并响应于该第一输入,获取用户输入的目标语音信号,该第一输入用于触发终端设备700获取语音信号。

本发明实施例提供的终端设备能够实现上述方法实施例中终端设备实现的各个过程,为避免重复,这里不再赘述。

本发明实施例提供的终端设备,可以获取目标语音信号(该目标语音信号为用户语音输入的信号),并获取该目标语音信号的语音特征信息(该语音特征信息包括至少一个语音特征),且根据该语音特征信息,确定目标显示策略(该目标显示策略包括与每个语音特征对应的显示方式),以及终端设备可以在识别该目标语音信号的内容之后,按照该目标显示策略,显示该目标语音信号的内容。通过该方案,由于可以根据目标语音信号的语音特征信息,确定与该语音特征信息对应的目标显示策略,以用于显示该目标语音信号的内容,因此,对于不同的目标语音信号,根据其语音特征信息确定的目标显示策略也不同。如此,可以使得终端设备以不同的显示策略显示不同目标语音信号的内容,从而使得终端设备显示内容的方式比较丰富,提高了终端设备显示内容的效果。

图8为实现本发明各个实施例的一种终端设备的硬件结构示意图。如图8所示,该终端设备800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、处理器810、以及电源811等部件。本领域技术人员可以理解,图8中示出的终端设备结构并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中,输入单元804,用于采集用户语音输入的目标语音信号;处理器810,用于获取用户输入单元807采集的目标语音信号的语音特征信息,并根据该语音特征信息,确定目标显示策略,且识别用户输入单元807采集的目标语音信号的内容,该语音特征信息包括至少一个语音特征,该目标显示策略包括与每个语音特征对应的显示方式;显示单元806,用于按照处理器810确定的目标显示策略,显示处理器810识别的目标语音信号的内容。

本发明实施例提供一种终端设备,该终端设备可以获取目标语音信号(该目标语音信号为用户语音输入的信号),并获取该目标语音信号的语音特征信息(该语音特征信息包括至少一个语音特征),且根据该语音特征信息,确定目标显示策略(该目标显示策略包括与每个语音特征对应的显示方式),以及终端设备可以在识别该目标语音信号的内容之后,按照该目标显示策略,显示该目标语音信号的内容。通过该方案,由于可以根据目标语音信号的语音特征信息,确定与该语音特征信息对应的目标显示策略,以用于显示该目标语音信号的内容,因此,对于不同的目标语音信号,根据其语音特征信息确定的目标显示策略也不同。如此,可以使得终端设备以不同的显示策略显示不同目标语音信号的内容,从而使得终端设备显示内容的方式比较丰富,提高了终端设备显示内容的效果。

应理解的是,本发明实施例中,射频单元801可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器810处理;另外,将上行的数据发送给基站。通常,射频单元801包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元801还可以通过无线通信系统与网络和其他设备通信。

终端设备800通过网络模块802为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元803可以将射频单元801或网络模块802接收的或者在存储器809中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元803还可以提供与终端设备800执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元803包括扬声器、蜂鸣器以及受话器等。

输入单元804用于接收音频或视频信号。输入单元804可以包括图形处理器(graphicsprocessingunit,gpu)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元806上。经图形处理器8041处理后的图像帧可以存储在存储器809(或其它存储介质)中或者经由射频单元801或网络模块802进行发送。麦克风8042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元801发送到移动通信基站的格式输出。

终端设备800还包括至少一种传感器805,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板8061的亮度,接近传感器可在终端设备800移动到耳边时,关闭显示面板8061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器805还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。

显示单元806用于显示由用户输入的信息或提供给用户的信息。显示单元806可包括显示面板8061,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板8061。

用户输入单元807可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板8071上或在触控面板8071附近的操作)。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器810,接收处理器810发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8071。除了触控面板8071,用户输入单元807还可以包括其他输入设备8072。具体地,其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

进一步的,触控面板8071可覆盖在显示面板8061上,当触控面板8071检测到在其上或附近的触摸操作后,传送给处理器810以确定触摸事件的类型,随后处理器810根据触摸事件的类型在显示面板8061上提供相应的视觉输出。虽然在图8中,触控面板8071与显示面板8061是作为两个独立的部件来实现终端设备的输入和输出功能,但是在某些实施例中,可以将触控面板8071与显示面板8061集成而实现终端设备的输入和输出功能,具体此处不做限定。

接口单元808为外部装置与终端设备800连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元808可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端设备800内的一个或多个元件或者可以用于在终端设备800和外部装置之间传输数据。

存储器809可用于存储软件程序以及各种数据。存储器809可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器809可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器810是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器809内的软件程序和/或模块,以及调用存储在存储器809内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。处理器810可包括一个或多个处理单元;可选的,处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。

终端设备800还可以包括给各个部件供电的电源811(比如电池),可选的,电源811可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外,终端设备800包括一些未示出的功能模块,在此不再赘述。

可选的,本发明实施例还提供一种终端设备,包括如图8所示的处理器810,存储器809,存储在存储器809上并可在处理器810上运行的计算机程序,该计算机程序被处理器810执行时实现上述内容显示方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述内容显示方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,该计算机可读存储介质可以包括只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例公开的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1