进度条的调节方法、装置、终端及存储介质与流程

文档序号：24562171发布日期：2021-04-06 12:11阅读：134来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本公开涉及电子技术领域，特别涉及一种进度条的调节方法、装置、终端及存储介质。

背景技术：

在多媒体文件的播放过程中，如果用户想要回看之前的播放内容，或者观看后面未播放的内容，都需要对进度条进行调节。

目前，相关技术对进度条进行调节时，主要采用如下方法：接收用户发出的语音信号；对语音信号进行解析，得到对应的文本内容；从语法数据库中查找该文本内容对应的调节指令；基于该调节指令对进度条进行调节。

然而，考虑到不同语种之间存在差异，为实现对进度条的调节，需要构建不同语种的语法数据库，增加了进度条的调节成本。

技术实现要素：

本公开实施例提供了一种进度条的调节方法、装置、终端及存储介质，能够降低进度条的调节成本。所述技术方案如下：

根据本公开实施例的第一方面，提供了一种进度条的调节方法，所述方法包括：

在多媒体文件的播放过程中，采集目标用户的音频数据；

从所述音频数据中提取音调数据；

根据所述音调数据，确定所述目标用户的音调变化趋势；

根据所述目标用户的音调变化趋势，对所述多媒体文件的进度条进行调节。

在另一种可能的实现方式中，所述根据所述音调数据，确定所述目标用户的音调变化趋势，包括：

根据所述音调数据中的音调值和采集时间，绘制音调曲线；

根据所述音调曲线的瞬时切线斜率，确定所述目标用户的音调变化趋势。

在另一种可能的实现方式中，所述根据所述音调曲线的瞬时切线斜率，确定所述目标用户的音调变化趋势，包括：

如果所述瞬时切线斜率为正值，确定所述目标用户的音调变化趋势为升调；

如果所述瞬时切线斜率为负值，确定所述目标用户的音调变化趋势为降调。

在另一种可能的实现方式中，所述根据所述目标用户的音调变化趋势，对所述多媒体文件的进度条进行调节，包括：

如果所述目标用户的音调变化趋势为升调，向第一方向调节所述进度条，所述第一方向为将所述进度条上的当前播放内容跳转至未播放内容的方向；

如果所述目标用户的音调变化趋势为降调，向第二方向调节所述进度条，所述第二方向为将所述进度条上的当前播放内容跳转至已播放内容的方向。

在另一种可能的实现方式中，所述根据所述目标用户的音调变化趋势，对所述多媒体文件的进度条进行调节之后，还包括：

如果所述目标用户的音调变化趋势由升调变为降调，将所述进度条的调节方向由所述第一方向切换为所述第二方向；

如果所述目标用户的音调变化趋势由降调变为升调，将所述进度条的调节方向由所述第二方向切换为所述第一方向。

在另一种可能的实现方式中，所述方法还包括：

确定对所述进度条的调节比例；

根据所述调节比例，对所述进度条进行调节。

在另一种可能的实现方式中，所述确定对所述进度条的调节比例，包括：

根据所述瞬时切线斜率的绝对值大小，确定对所述进度条的调节距离。

在另一种可能的实现方式中，所述确定对所述进度条的调节比例，包括：

根据所述音调数据对应的音量值大小，确定对所述进度条的调节比例。

根据本公开实施例的第二方面，提供了一种进度条的调节装置，所述装置包括：

采集模块，用于在多媒体文件的播放过程中，采集目标用户的音频数据；

提取模块，用于从所述音频数据中提取音调数据；

确定模块，用于根据所述音调数据，确定所述目标用户的音调变化趋势；

调节模块，用于根据所述目标用户的音调变化趋势，对所述多媒体文件的进度条进行调节。

在另一种可能的实现方式中，所述确定模块，用于根据所述音调数据中的音调值和采集时间，绘制音调曲线；根据所述音调曲线的瞬时切线斜率，确定所述目标用户的音调变化趋势。

在另一种可能的实现方式中，所述确定模块，用于如果所述瞬时切线斜率为正值，确定所述目标用户的音调变化趋势为升调；如果所述瞬时切线斜率为负值，确定所述目标用户的音调变化趋势为降调。

在另一种可能的实现方式中，所述调节模块，用于如果所述目标用户的音调变化趋势为升调，向第一方向调节所述进度条，所述第一方向为将所述进度条上的当前播放内容跳转至未播放内容的方向；如果所述目标用户的音调变化趋势为降调，向第二方向调节所述进度条，所述第二方向为将所述进度条上的当前播放内容跳转至已播放内容的方向。

在另一种可能的实现方式中，所述装置还包括：

切换模块，用于如果所述目标用户的音调变化趋势由升调变为降调，将所述进度条的调节方向由所述第一方向切换为所述第二方向；

所述切换模块，还用于如果所述目标用户的音调变化趋势由降调变为升调，将所述进度条的调节方向由所述第二方向切换为所述第一方向。

在另一种可能的实现方式中，

所述确定模块，还用于确定对所述进度条的调节比例；

所述调节模块，还用于根据所述调节比例，对所述进度条进行调节。

在另一种可能的实现方式中，所述确定模块，用于根据所述瞬时切线斜率的绝对值大小，确定对所述进度条的调节距离。

在另一种可能的实现方式中，所述确定模块，用于根据所述音调数据对应的音量值大小，确定对所述进度条的调节比例。

根据本公开实施例的第三方面，提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如第一方面所述的进度条的调节方法。

根据本公开实施例的第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如第一方面所述的进度条的调节方法。

本公开实施例提供的技术方案带来的有益效果是：

基于音调变化趋势，对多媒体文件的进度条进行调节。在声学领域，音调通常用于表征声音频率的高低，用户无需说出具体的语音内容，只需发出简单的音频即可，对于不同语种的用户而言，无需构建不同语种对应的语法数据库，大大降低了对进度条的调节成本。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种进度条的调节方法所涉及的实施环境；

图2是本公开实施例提供的一种进度条的调节方法的流程图；

图3是本公开实施例提供的一种进度条的调节方法的流程图；

图4是本公开实施例提供的一种进度条的调节装置结构示意图；

图5示出了本公开一个示例性实施例提供的终端的结构框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

可以理解，本公开实施例所使用的术语“每个”、“多个”及“任一”等，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指对应的多个中的任意一个。举例来说，多个词语包括10个词语，而每个词语是指这10个词语中的每一个词语，任一词语是指10个词语中的任意一个词语。

请参考图1，其示出了本公开实施例提供的进度条的调节方法所涉及的实施环境，该实施环境包括：终端101和服务器102。

其中，终端101可以为智能手机、平板电脑、笔记本电脑、mp3(movingpictureexpertsgroupaudiolayeriii，动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv，动态影像专家压缩标准音频层面4)等。终端101中安装有多媒体文件的播放应用，基于所安装的多媒体文件的播放应用，终端101能够播放多媒体文件。在多媒体文件的播放过程中，终端101可以显示多媒体文件的播放进度，使得用户了解多媒体文件的播放情况。终端101还可以采集用户的音频数据，并从音频数据中提取音调数据，进而根据音调变化趋势，实现对多媒体文件的进度条进行调节。

服务器102为终端101中所安装的多媒体文件的播放应用的后台服务器，该服务器102可提供多媒体文件的播放服务。该服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，本公开实施例不对服务器102的类型作具体的限定。

上述终端101与服务器102可以通过有线或无线通信方式进行直接或间接地连接，本公开实施对此不作具体的限定。

基于图1所示的实施环境，本公开实施例提供了一种进度条的调节方法，参见图2，进度条的调节方法流程包括：

201、在多媒体文件的播放过程中，采集目标用户的音频数据。

其中，多媒体文件包括音频文件、视频文件、图片文件、文本文件或其他类型文件。目标用户为当前观看多媒体文件的用户，在多媒体文件的播放过程中，当该目标用户想要调节播放进度时，该目标用户可以发出“咿呀啊”等简单音频，终端通过麦克风等设备采集该目标用户所发出的音频数据。

202、从音频数据中提取音调数据。

其中，音调是指声音的频率高低，为声音的主观属性之一。音调主要由声音的频率决定，声音的频率越高，表示音调越高，声音的频率越低，表示音调越低。

203、根据音调数据，确定目标用户的音调变化趋势。

其中，音调变化趋势包括升调、降调等。

204、根据目标用户的音调变化趋势，对多媒体文件的进度条进行调节。

其中，多媒体文件的进度条用于表示多媒体文件的处理进度，基于该进度条可以获知多媒体文件已播放比例、当前的播放位置、未播放比例等。

本公开实施例提供的方法，基于音调变化趋势，对多媒体文件的进度条进行调节。在声学领域，音调通常用于表征声音频率的高低，用户无需说出具体的语音内容，只需发出简单的音频即可，对于不同语种的用户而言，无需构建不同语种对应的语法数据库，大大降低了对进度条的调节成本。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

基于图1所示的实施环境，本公开实施例提供了一种进度条的调节方法，以终端执行本公开实施例为例，参见图3，进度条的调节方法流程包括：

301、终端播放多媒体文件。

在本公开实施例中，终端中安装有多媒体文件的播放应用，基于所安装的多媒体文件的播放应用，终端播放多媒体文件。其中，多媒体文件的播放应用可以为音频播放应用、视频播放应用、图像播放应用等任一种。

在多媒体文件的播放过程中，为了便于用户获取当前的播放进度，终端可在播放界面上显示多媒体文件的进度条。该多媒体文件的进度条可在多媒体文件播放的全过程中显示，还可以在检测到用户的触发操作时显示，而其他时间处于隐藏状态，该触发操作可以为对指定区域的点击操作、长按操作、触摸操作等，该指定区域为预先设置的用于触发进度条显示的区域。

302、在多媒体文件的播放过程中，终端采集目标用户的音频数据。

在多媒体文件播放过程中，如果目标用户想要回看之前已经播放的内容，或者观看后面未播放的内容，目标用户可发出咿、哦、啊、呀等简单的音频数据，终端通过麦克风等设备采集目标用户所发出的音频数据，进而基于采集到的音频数据，实现对多媒体文件的进度条的调节。终端在采集目标用户的音频数据时，可以每隔第一预设时间段进行采集，还可以实时采集。其中，第一预设时间段可以为1秒、2秒等。

考虑到多媒体文件的播放场景中可能存在多个用户，终端可以采集到目标用户发出的音频数据，也可以采集到其他用户发出的音频数据，还可以采集播放的多媒体文件的音频数据，由于多媒体文件的音频数据及其他用户发出的音频数据对终端而言为噪音数据，并不是对进度条进行调节的有效数据。为了排除这些数据产生的干扰，在一种可能的实现方式中，当目标用户想要对进度条进行调节时，终端可提示用户佩戴耳机设备，在目标用户佩戴耳机设备的情况下，终端采集该目标用户的音频数据。在另一种可能的实现方式中，终端可以预先采集目标用户的音频数据，并从采集到的音频数据中提取目标用户的音频特征，进而存储该目标用户的音频特征。在多媒体文件的播放场景下，终端采集至少一个用户的音频数据，并从采集到的音频数据中提取至少一个音频特征，进而将提取的至少一个音频特征分别与存储的音频特征进行匹配，如果任一音频特征与存储的音频特征相匹配，则将该匹配的音频特征对应的用户作为目标用户，并继续采集该目标用户的音频数据。

进一步地，终端在采集目标用户的音频数据时，可以获取音频数据的音量大小，从而在后续步骤中可根据音频数据的音量大小确定进度条的调节比例，从而按照该调节比例，对进度条进行调节。

303、终端从音频数据中提取音调数据。

基于所获取到的音频数据，终端对该音频数据进行解析，得到音调数据。该音调数据包括音调值、采集时间等。其中，音调值可采用f表示，采集时间可采用t表示。

304、终端根据音调数据，确定目标用户的音调变化趋势。

在本公开的一个实施例中，终端可基于音调值大小，确定目标用户的音调变化趋势。如果前一时刻的音调值小于后一时刻的音调值，则可确定目标用户的音调变化趋势为升调，如果前一时刻的音调值大于后一时刻的音调值，则可确定目标用户的音调变化趋势为降调。例如，在初始时间终端从采集到的音频数据中提取的音调数据的音调值为20，在1秒时终端从采集到的音频数据中提取的音调数据的音调值为30，则可以确定目标用户的音调变化趋势为升调。

另外，考虑到外界干扰或其他因素导致音频数据可能会发生突变，使得音调在某一时刻可能出现突变，为了提高调节结果的准确性，本公开实施例提供的方法，可以统计音调在第二预设时间段内的变化趋势，进而将该第二预设时间段内的变化趋势作为目标用户的音调变化趋势。其中，第二预设时间段可以为1秒、2秒等，本公开实施例不对第二预设时间段作具体的限定。

在本公开的另一个实施例中，终端可以根据每隔第一预设时间段采集到的音调数据中的音调值和采集时间，以音调值作为纵坐标、采集时间作为横坐标构建直角坐标系，并在所构建的直角坐标系中绘制音调曲线，进而根据音调曲线的瞬时切线斜率，确定目标用户的音调变化趋势。对于音调曲线的瞬时切线斜率，终端可以计算相邻两个采样点的音调值和采集时间，计算相邻两个采样点的切线斜率，进而将相邻两个采样点的斜率作为瞬时切线斜率。如果瞬时切线斜率为正值，可确定目标用户的音调变化趋势为升调，如果瞬时切线斜率为负值，可确定目标用户的音调变化趋势为降调。

305、终端根据目标用户的音调变化趋势，对多媒体文件的进度条进行调节。

终端根据目标用户的音调变化趋势，确定对多媒体的进度条的调节方向，进而按照调节方向，对进度条进行调节。其中，调节方向包括第一方向和第二方向，该第一方向是指将进度条上的当前播放内容跳转至未播放内容的方向，该第二方向是指将进度条上的当前播放内容跳转至已播放内容的方向。该第一方向和该第二方向根据进度条在播放界面的显示位置确定，如果进度条的显示方向为水平方向，例如，显示在播放界面的上侧或下侧，则第一方向可以为向右，第二方向可以为向左；如果进度条的显示方向为竖直方向，例如，显示在播放界面的左侧或右侧，则第一方向为向下，第二方向向上。具体地，如果目标用户的音调变化趋势为升调，终端将进度条上用于指示当前播放位置的图标向第一方向滑动；如果目标用户的音调变化趋势为降调，终端将进度条上用于指示当前播放位置的图标向第二方向滑动。

在本公开的另一个实施例中，随着采集时间的增加，目标用户的音调数据可能发生变化，而随着音调数据的变化，音调变化趋势也将随着改变，相应地，调节方向也将发生变化。例如，如果目标用户的音调变化趋势由音调由升调变为降调，响应于音调的变化，终端将进度条的调节方向由第一方向切换为第二方向；如果目标用户的音调变化趋势由音调由降调变为升调，响应于音调的变化，终端将进度条的调节方向由第二方向切换为第一方向。

在本公开的另一个实施例中，终端除了确定对进度条的调节方向外，还将确定对进度条的调节比例，进而按照确定的调节方向和调节比例，对进度条进行调节。例如，终端确定调节方向为向右方向，调节比例为进度条长度的5％，则按照所确定的调节方向和调节比例，终端通过将用于指示当前播放位置的图标向右移动进度条长度的5％，从而实现对进度条的调节。

终端确定对进度条的调节比例时，包括但不限于如下方式：

在一种可能的实现方式中，终端根据瞬时切线斜率的绝对值大小，确定对进度条的调节比例。终端可以预先设置瞬时切线斜率的绝对值大小与调节比例之间的对应关系，基于所设置的对应关系，当获取到瞬时切线斜率的绝对值时，终端获取该瞬时切线斜率的绝对值对应的调节比例。通常瞬时切线斜率的绝对值越大，进度条的调节比例越大；瞬时切线斜率的绝对值越小，进度条的调节比例越小。如果瞬时切线斜率的绝对值为0，则此时的音调为平调，进度条的调节比例也为0。响应于进度条的调节比例为0，进度条将停止滑动。

在另一种可能的实现方式中，终端根据音调数据对应的音量值大小，确定对进度条的调节比例。终端可以预先设置音量值与调节比例之间的对应关系，基于所设置的对应关系，当获取音调数据对应的音量值大小，终端获取该音量值对应的调节比例。

本公开实施例提供的方法，通过用户实时发出简单的音频数据，提取音调数据，从而实现对进度条的调节。如果用户停止发出音频数据，终端采集不到音频数据，音调曲线将出现截断，此时进度条将停止滑动。

在本公开的另一个实施例中，在对进度条进行调节时，如果进度条上用于指示当前播放进度的图标已经滑动到进度条的任一侧的端点位置，则将当前播放的多媒体文件切换为上一多媒体文件，或者将下一多媒体文件。例如，进度条上用于指示当前播放进度的图标已经向左侧滑动到起点位置，则将当前播放的多媒体文件切换为上一个多媒体文件。又例如，进度条上用于指示当前播放进度的图标已经向右滑动到终点位置，则将当前播放的多媒体文件切换为下一多媒体文件。

本公开实施例提供了一种进度条的调节装置，参见图4，进度条的调节方法流程包括：

采集模块401，用于在多媒体文件的播放过程中，采集目标用户的音频数据；

提取模块402，用于从音频数据中提取音调数据；

确定模块403，用于根据音调数据，确定目标用户的音调变化趋势；

调节模块404，用于根据目标用户的音调变化趋势，对多媒体文件的进度条进行调节。

在另一种可能的实现方式中，确定模块403，用于根据音调数据中的音调值和采集时间，绘制音调曲线；根据音调曲线的瞬时切线斜率，确定目标用户的音调变化趋势。

在另一种可能的实现方式中，确定模块403，用于如果瞬时切线斜率为正值，确定目标用户的音调变化趋势为升调；如果瞬时切线斜率为负值，确定目标用户的音调变化趋势为降调。

在另一种可能的实现方式中，调节模块404，用于如果目标用户的音调变化趋势为升调，向第一方向调节进度条，第一方向为将进度条上的当前播放内容跳转至未播放内容的方向；如果目标用户的音调变化趋势为降调，向第二方向调节进度条，第二方向为将进度条上的当前播放内容跳转至已播放内容的方向。

在另一种可能的实现方式中，该装置还包括：

切换模块，用于如果目标用户的音调变化趋势由升调变为降调，将进度条的调节方向由第一方向切换为第二方向；

切换模块，还用于如果目标用户的音调变化趋势由降调变为升调，将进度条的调节方向由第二方向切换为第一方向。

在另一种可能的实现方式中，

确定模块403，还用于确定对进度条的调节比例；

调节模块404，还用于根据调节比例，对进度条进行调节。

在另一种可能的实现方式中，确定模块403，用于根据瞬时切线斜率的绝对值大小，确定对进度条的调节距离。

在另一种可能的实现方式中，确定模块403，用于根据音调数据对应的音量值大小，确定对进度条的调节比例。

本公开实施例提供的装置，基于音调变化趋势，对多媒体文件的进度条进行调节。在声学领域，音调通常用于表征声音频率的高低，用户无需说出具体的语音内容，只需发出简单的音频即可，对于不同语种的用户而言，无需构建不同语种对应的语法数据库，大大降低了对进度条的调节成本。

图5示出了本公开一个示例性实施例提供的终端500的结构框图。该终端500可以是：智能手机、平板电脑、mp3播放器(movingpictureexpertsgroupaudiolayeriii，动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端500包括有：处理器501和存储器502。

处理器501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器501可以采用dsp(digitalsignalprocessing，数字信号处理)、fpga(field－programmablegatearray，现场可编程门阵列)、pla(programmablelogicarray，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(centralprocessingunit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器501可以集成有gpu(graphicsprocessingunit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器501还可以包括ai(artificialintelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。

存储器502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的进度条的调节方法。

在一些实施例中，终端500还可选包括有：外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地，外围设备包括：射频电路504、显示屏505、摄像头组件506、音频电路507、定位组件508和电源509中的至少一种。

本领域技术人员可以理解，图5中示出的结构并不构成对终端500的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本公开实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如图2或图3所示的进度条的调节方法。该计算机可读存储介质可以是非暂态的。例如，该计算机可读存储介质可以是只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：段小磊
技术所有人：广州酷狗计算机科技有限公司
我是此专利的发明人

上一篇：一种用于包装袋的热熔封口装置的制作方法
上一篇：一种聚天冬氨酸酯聚脲防水结构层的制作方法