一种语音播放方法及装置与流程

文档序号：15761047发布日期：2018-10-26 19:18阅读：182来源：国知局

本申请涉及电子信息领域，尤其涉及一种语音播放方法及装置。

背景技术：

目前，为了提高与用户的互动效果，绝大部分应用(app)提供了接收并显示用户评论的功能。例如，视频类的app，支持用户输入并展示评价视频的语音、文字、或者图片评论。也就是说，用户在评论视频的时候，可以使用语音、文字、或者图片的方式表达自己的想法。

对于语音评论，需要用户点击一条语音评论，语音评论才被触发播放，这样展示语音的方式不够直观和友好，用户体验不佳。

语音评论仅为语音信息的一种示例，目前，app中的语音的播放均需要用户的点击触发。因此，如何改善语音的播放方式，以提高用户的体验，成为目前亟待解决的问题。

技术实现要素：

本申请提供了一种语音播放方法及装置，目的在于解决如何改善语音的播放方式的问题。

为了实现上述目的，本申请提供了以下技术方案：

一种语音播放方法，包括：

将语音对象的标识集中展示，所述语音对象的标识为发布所述语音对象的用户的信息；

依据针对集中展示的所述标识的播放指令，依次播放所述语音对象。

可选的，所述播放所述语音对象包括：

依据预设的语音内容与情感类型的对应关系，确定所述语音对象的情感类型；

使用与所述语音对象的情感类型对应的播放效果，播放所述语音对象，所述播放效果包括以下至少一种：动态效果、音量、语调和语速。

可选的，还包括：

将正在播放的语音对象的标识与其它语音对象的标识区别显示。

可选的，所述将语音对象的标识集中展示包括：

将所述语音对象的标识集中显示在预设的区域；

所述方法还包括：

在所述预设的区域显示播放交互控件；

所述依据针对集中展示的所述标识的播放指令，依次播放所述语音对象包括：

在接收到所述播放交互控件的触发指令后，依次播放所述语音对象。

可选的，所述将语音对象的标识集中展示包括：

将所述语音对象按照排序结果集中展示，所述排序结果包括使用预设的排序方式排序的结果；

所述预设的排序方式包括以下至少一种：

按照所述语音对象的接收时间顺序和所述语音对象之间的关联性进行排序；

按照所述语音对象的接收时间顺序和所述语音对象的情感类型进行排序；

依据交互排序指令，进行排序。

一种语音播放装置，包括：

展示模块，用于将语音对象的标识集中展示，所述语音对象的标识为发布所述语音对象的用户的信息；

播放模块，用于依据针对集中展示的所述标识的播放指令，依次播放所述语音对象。

可选的，所述播放模块具体用于：

依据预设的语音内容与情感类型的对应关系，确定所述语音对象的情感类型；使用与所述语音对象的情感类型对应的播放效果，播放所述语音对象，所述播放效果包括以下至少一种：动态效果、音量、语调和语速。

可选的，所述展示模块还用于：

将正在播放的语音对象的标识与其它语音对象的标识区别显示。

可选的，所述展示模块具体用于：

将所述语音对象的标识集中显示在预设的区域；

所述展示模块还用于：在所述预设的区域显示播放交互控件；

所述播放模块具体用于：在接收到所述播放交互控件的触发指令后，依次播放所述语音对象。

可选的，所述展示模块具体用于：

将所述语音对象按照排序结果集中展示，所述排序结果包括使用预设的排序方式排序的结果；

所述装置还包括：

排序模块，用于按照以下至少一种排序方式对所述语音对象进行排序：按照所述语音对象的接收时间顺序和所述语音对象之间的关联性进行排序；按照所述语音对象的接收时间顺序和所述语音对象的情感类型进行排序；依据交互排序指令，进行排序。

本申请所述的语音播放方法及装置，将语音对象的标识集中展示，并依据针对集中展示的所述标识的播放指令，依次播放语音对象，以营造喧嚣的氛围，因此，能够给用户带来直观新颖的语音播放体验。并且，与现有的用户需要一个一个点击播放语音评论的方式相比，具有更高的播放效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的语音播放方法的应用场景的示例图；

图2为本申请实施例公开的语音播放方法的流程图；

图3为本申请实施例公开的语音播放方法中语音评论集中展示区的示意图；

图4为本申请实施例公开的又一种语音播放方法的流程图；

图5为本申请实施例公开的语音播放装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1为本申请实施例公开的语音播放方法的应用场景的示例，其中，app提供视频，并接收用户对于该视频的评论，app将接收到的评论展示在视频下方的评论区。通常，以接收到评论的时间的先后顺序，在评论区展示评论。

以文本评论和语音评论(图1中未示出)为例，本实施例所述的语音播放方法，目的在于，对语音评论进行集中播放，营造喧嚣的效果，增强语音评论播放的直观性和友好性，以提高用户的体验。

图2所示为本申请的实施例公开的语音播放方法，包括离线训练阶段和应用阶段，具体包括以下步骤：

s201：离线训练语音关联关系模型。

语音关联关系模型的作用为，输出语音段之间的关联性。语音段之间的关联性即为语音段中包括的语音内容之间的关联性。

具体的，可以使用预设的语音训练集，通过训练神经网络，得到语音关联关系模型。即，将语音训练集中的多段语音作为样本输入神经网络，这多段语音之间的关联性为已知，作为神经网络的输出，从而得到神经网络的参数。更为具体的训练方法，可以参见现有技术，这里不再赘述。

s202：离线训练情感模型。

情感模型的作用为，输出语音段的情感类型。其中，情感类型可以预先设置，例如包括兴奋、冷漠、平静等。

可以使用预设的语音训练集，通过训练神经网络，得到情感模型。与上述语音关联关系模型的训练过程类似。更为具体的训练方法，可以参见现有技术，这里不再赘述。

s201和s202构成离线训练阶段，得到的模型在应用阶段使用。需要说明的是，在完成一次离线训练后，可以在应用阶段持续使用训练得到的模型，也可以周期性执行离线训练，以更新应用阶段使用的模型。

下面对应用阶段进行说明。

s203：获取语音评论。

获取语音评论的方式可以参见现有的app获取语音评论的方式，例如，接收用户输入的语音评论，这里不再赘述。

s204：对获取到的语音评论进行排序。

具体的，排序的方式包括以下几种：

1、按照语音评论的接收时间顺序和关联性进行排序：在时间先后顺序的基础上，使用语音关联关系模型，计算语音评论之间的关联性，并按照关联性进行排序。例如，接收时间最早的语音评论作为基准，排在第一位，将与基准的关联性最大的语音评论排在第二位…依次类推(即按照与基准关联性递件的顺序排列基准之外的其它语音评论)。也就是说，排序结果为：基准为第一位，后续的语音评论与基准的关联性递减。

2、按照语音评论的接收时间顺序和情感类型进行排序：使用情感模型，将语音评论划分为几种情感类型，在时间先后顺序的基础上，对几类语音评论进行排序。具体的，按照预先指定的情感类型顺序，排列语音评论，相同的情感类型的语音评论，按照接收时间从早到晚的顺序，进行排序。例如，多个用户发布的语音按照语音排序后为(括号中为app接收到语音评论的时间)：

a：好开心啊2018/1/19:00

b：伤心啊2018/1/110:00

c:开心2018/1/29:10

假设使用情感模型，将语音评论划分为开心类和不开心类，预先指定的情感类型顺序为开心类、不开心类，则上述用户的语音评论排序的结果为acb。

3、依据交互排序指令，进行排序：显示排序交互窗口，接收人工(例如app运营工作人员)在排序交互窗口中的排序操作指令，并按照排序操作指令对语音评论进行排序。

例如，app运营工作人员将vip用户的语音评论排在前面，将非vip用户的语音评论排在后面。

需要说明的是，可以依次执行1、2和3，2的执行对象为执行1后的排序结果，3的执行对象为执行2后的排序结果。或者，也可以不执行3。或者，还可以仅执行1、2和3中的任意一种或任意两种。

s205：按照排序结果，集中展示语音评论的标识。

通常，app仅向注册的用户开放发表评论的权限。用户注册后，通常具有用户名和头像。本实施例中，语音评论的标识以发表语音评论的用户的头像为例。

当然，语音评论的标识并不限于用户的头像，还可以为用户名等用户在app注册的其它信息。

具体的，可以在预设的区域(预设区域可以设置在现有的评论区的周围，例如现有的评论区的上面或下面)，集中展示语音评论的标识。图3为语音评论的标识的展示效果图。

s206：依据播放指令，按照排序结果依次播放语音评论。

按照排序结果播放语音评论的优点在于：如果按照关联性即1进行了排序，则可以按照关联性顺序(例如从高到低的顺序)播放语音评论。如果按照情感即2进行了排序，则可以将同一种情感的语音评论集中在一起播放，例如，先播放赞扬的语音评论，再播放批判的语音评论。进一步可见，排序的目的在于，使得语音评论按照关联性顺序和/或情感类型播放。

具体的，播放指令可以为用户输入的播放指令，例如，在语音评论的标识展示区域，显示虚拟播放按钮(播放交互控件的一个示例)，如图3所示，用户点击播放按钮(用户点击播放按钮，即为用户针对集中展示的标识输入播放指令，也就是针对集中展示的标识对应的语音评论输入播放指令)后，app接收到用户的播放指令(播放交互控件的触发指令的一个示例)，开始按照排序结果播放语音评论。

用户输入的播放指令也可以语音等形式，这里不做限定。

除了用户输入的播放指令之外，播放指令还可以为预设的触发条件触发的指令，例如，界面滚动到能够显示语音评论的标识的展示区，或者，语音评论的标识的展示区位于显示界面的中间位置区域，则确认接收到播放指令。

进一步的，可以依据语音评论的情感类型，使用相应的播放效果播放语音评论，以进一步渲染喧嚣的氛围。播放效果是指播放采用的方式，可以包括动态效果(例如闪动)、音量、语调和语速等方式。可以预先为不同的情感类型设置各自对应的播放效果(例如，开心的评论使用开心的语调)。在播放之前，可以使用前述情感模型，确定语音评论的情感类型，再查询预先设置的情感类型与播放效果之间的对应关系，得到与待播放的语音评论对应的播放效果。

s207：将正在播放的语音评论的标识与其它语音评论的标识区别显示。

区别显示标识是指，显示方式与其它标识不同，例如，将正在播放的语音评论的用户头像放大显示，而没有在播放的语音评论的用户头像保持原状(不放大)显示。该步骤的目的在于，进一步渲染喧嚣的氛围。

需要说明的是，可以使用现有技术确定“正在播放的语音评论的标识”，例如，为语音评论、语音评论的头像均设置唯一的id，在控制语音评论集中显示并且播放时，以语音评论的id为传递参数，因此，可以获知当前正在播放的语音评论的id，进而可以获知与此语音评论的id对应的头像的id，这里不再赘述。

从图2所示的过程可以看出，将语音评论排序后，按照排序结果，将语音评论的标识集中显示，并依次播放语音评论，营造喧嚣的氛围，并进一步的，使用特效播放语音评论并展示语音评论的标识，以进一步渲染喧嚣氛围，因此，能够给用户带来直观新颖的语音评论播放效果，提高用户的使用体验。

并且，与现有的用户需要一个一个点击播放语音评论的方式相比，具有更高的播放效率。

图2所示的方法可以扩展应用到可能存在语音的其它场景，例如聊天app中，用户输入语音消息，本实施例所述的语音播放方法，可以在聊天app中营造出语音播放的喧嚣氛围。

可见，图2所示的方法可以应用在所有支持语音功能的app中，并可概括为图4所示的过程，包括以下步骤：

s401：将语音对象的标识集中展示。

其中，语音对象包括语音评论或者语音消息等以语音方式存在的信息。语音对象的标识为发布语音对象的用户的信息，例如前述发布语音对象的用户的头像。

集中是指把分散的集合在一起。即，集中与分散相对。集中展示是指，将原来分散的语音评论的标识集合在一起展示，例如，现有技术中的语音评论的标识和文字评论的标识按照接收时间的顺序显示，即以时间为顺序，将语音评论的标识和文字评论的标识交叉展示(可能前一条是语音评论的标识，后几条是文字评论的标识)，而本实施例中，将语音评论的标识集合在一起展示。如前所述，可以将语音评论的标识展示在一个区域中，该区域中不包括文字等其它评论的标识。

集中展示出的语音对象的顺序，可以是进行任意排序的结果，也可以是使用图2所示的排序方式进行排序的结果。

s402：依据针对集中展示的所述标识的播放指令，依次播放语音对象。

具体的播放方式可以参见图2所示的方法，这里不再赘述。

需要说明的是，图4所示的过程，可以兼容在现有的app中，并由触发指令触发执行。例如，在视频类app中，某个视频的评论区的顶部，显示“喧嚣”按钮，当用户点击该按钮时，执行图4所示的过程：将对于该视频发表语音评论的头像集中显示，如图3所示，并在集中显示区域显示播放按钮，在用户点击播放按钮后，依次播放语音评论，进一步的，可以按照图2所示的方式，增加播放特效。当用户再次点击“喧嚣”按钮后，提示“喧嚣”功能被关闭，则按照现有技术展示语音评论。

图5所示为本申请实施例公开的一种语音播放装置，包括：展示模块和播放模块，可选的，还可以包括排序模块。

其中，展示模块用于将语音对象的标识集中展示。播放模块用于依据针对集中展示的所述标识的播放指令，依次播放所述语音对象。

具体的，展示模块将所述语音对象的标识集中显示在预设的区域，展示模块还用于：在预设的区域显示播放交互控件。所述播放模块在接收到播放交互控件的触发指令后，依次播放语音对象。

排序模块用于按照前述排序方式对语音对象进行排序，并在展示模块将语音对象按照排序结果集中展示之前，离线训练语音关联关系模型和情感模型，并使用所述语音关联关系模型获得所述语音对象之间的关联性，使用所述情感模型获得所述语音对象的情感类型。

以上各个模块的功能的具体实现，可以参见上述方法实施例，这里不再赘述。

图5所示的装置，可以集成设置在现有的app中，而可以单独以app的形式存在，无论哪种存在形式，均可以提供用户体验更有的语音播放方式。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算设备可读取存储介质中。基于这样的理解，本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算设备(可以是个人计算机，服务器，移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈鹏礼
技术所有人：北京奇艺世纪科技有限公司
我是此专利的发明人

上一篇：大直径K2型接口球墨铸铁管的插接结构的制作方法
上一篇：一种腹透患者复查多功能大容量专用包的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。