歌曲识别方法、装置、终端及存储介质与流程

文档序号:18030303发布日期:2019-06-28 22:35阅读:165来源:国知局
歌曲识别方法、装置、终端及存储介质与流程

本申请实施例涉及终端技术领域,特别涉及一种歌曲识别方法、装置、终端及存储介质。



背景技术:

目前大多数终端中安装有多媒体应用程序。终端可以通过多媒体应用程序播放音视频内容。

通常在第一终端播放音视频内容的过程中,用户可能会对当前播放的音视频内容中的歌曲感兴趣,希望获取到该歌曲的相关信息,比如该歌曲的歌曲名称、专辑名称和歌唱者名称等等。相关技术所提供的一种歌曲识别方法包括:第二终端通过麦克风采集第一终端所播放的音视频内容,第二终端对采集到的音视频内容进行识别,识别出音视频内容中的歌曲。其中,第一终端和第二终端是不同的终端。



技术实现要素:

本申请实施例提供了一种歌曲识别方法、装置、终端及存储介质,可以用于解决相关技术中第一终端所播放的音视频内容中的歌曲需要通过第二终端才能进行识别导致歌曲识别的效率较低的问题。技术方案如下:

根据本申请实施例的第一方面,提供了一种歌曲识别方法,应用于终端中,所述方法包括:

显示第一应用程序的第一用户界面,所述第一用户界面中播放有音视频内容;

在所述第一用户界面上显示音频识别图标,所述音频识别图标为触发对所述音视频内容中的目标歌曲进行识别的入口;

当接收到所述音频识别图标上的第一操作信号时,在所述第一用户界面上显示浮动窗口,所述浮动窗口用于显示所述目标歌曲的介绍性信息。

根据本申请实施例的第二方面,提供了一种歌曲识别装置,应用于终端中,所述装置包括:

第一显示模块,用于显示第一应用程序的第一用户界面,所述第一用户界面中播放有音视频内容;

第二显示模块,用于在所述第一用户界面上显示音频识别图标,所述音频识别图标为触发对所述音视频内容中的目标歌曲进行识别的入口;

第三显示模块,用于当接收到所述音频识别图标上的第一操作信号时,在所述第一用户界面上显示浮动窗口,所述浮动窗口用于显示所述目标歌曲的介绍性信息。

根据本申请实施例的第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如本申请第一方面及其可选实施例任一所述的歌曲识别方法。

根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如本申请第一方面及其可选实施例任一所述的歌曲识别方法。

本申请实施例提供的技术方案带来的有益效果至少包括:

通过显示第一应用程序的第一用户界面,第一用户界面中播放有音视频内容;在第一用户界面上显示音频识别图标,当接收到音频识别图标上的第一操作信号时在第一用户界面上显示识别结果图标,识别结果图标用于指示是否成功识别出音视频内容中的目标歌曲;使得终端能够对自身当前播放的音视频内容中的目标歌曲进行识别,避免了相关技术中第一终端所播放的音视频内容中的歌曲需要通过第二终端才能进行识别导致歌曲识别的效率较低的问题,提高了歌曲识别的准确性和效率。

附图说明

图1是本申请一个示例性实施例提供的终端的结构示意图;

图2是本申请另一个示例性实施例提供的终端的结构示意图;

图3a至图3f是本申请的示例性实施例提供的具有不同触摸显示屏的终端的外观示意图;

图4是本申请一个示例性实施例提供的歌曲识别方法的流程图

图5是本申请一个示例性实施例提供的歌曲识别方法涉及的界面示意图;

图6是本申请另一个示例性实施例提供的歌曲识别方法的流程图;

图7至图11是图6实施例提供的歌曲识别方法在实施时的界面示意图;

图12是本申请一个示例性实施例提供的歌曲识别装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

参考图1和图2所示,其示出了本申请一个示例性实施例提供的终端100的结构方框图。该终端100可以是手机、平板电脑、笔记本电脑和电子书等。本申请中的终端100可以包括一个或多个如下部件:处理器110、存储器120和触摸显示屏130。

处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个终端100内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行终端100的各种功能和处理数据。可选的,处理器110可以采用数字信号处理(digitalsignalprocessing,dsp)、现场可编程门阵列(field-programmablegatearray,fpga)、可编程逻辑阵列(programmablelogicarray,pla)中的至少一种硬件形式来实现。处理器110可集成中央处理器(centralprocessingunit,cpu)、图像处理器(graphicsprocessingunit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责触摸显示屏130所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块芯片进行实现。

存储器120可以包括随机存储器(randomaccessmemory,ram),也可以包括只读存储器(read-onlymemory)。可选的,该存储器120包括非瞬时性计算机可读介质(non-transitorycomputer-readablestoragemedium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等;存储数据区可存储根据终端100的使用所创建的数据(比如音频数据、电话本)等。

以操作系统为安卓(android)系统为例,存储器120中存储的程序和数据如图1所示,存储器120中存储有linux内核层220、系统运行库层240、应用框架层260和应用层280。linux内核层220为终端100的各种硬件提供了底层的驱动,如显示驱动、音频驱动、摄像头驱动、蓝牙驱动、wi-fi驱动、电源管理等。系统运行库层240通过一些c/c++库来为android系统提供了主要的特性支持。如sqlite库提供了数据库的支持,opengl/es库提供了3d绘图的支持,webkit库提供了浏览器内核的支持等。在系统运行库层240中还提供有android运行时库242(androidruntime),它主要提供了一些核心库,能够允许开发者使用java语言来编写android应用。应用框架层260提供了构建应用程序时可能用到的各种api,开发者也可以通过使用这些api来构建自己的应用程序,比如活动管理、窗口管理、视图管理、通知管理、内容提供者、包管理、通话管理、资源管理、定位管理。应用层280中运行有至少一个应用程序,这些应用程序可以是操作系统自带的联系人程序、短信程序、时钟程序、相机应用等;也可以是第三方开发者所开发的应用程序,比如即时通信程序、相片美化程序等。

以操作系统为ios系统为例,存储器120中存储的程序和数据如图2所示,ios系统包括:核心操作系统层320(coreoslayer)、核心服务层340(coreserviceslayer)、媒体层360(medialayer)、可触摸层380(cocoatouchlayer)。核心操作系统层320包括了操作系统内核、驱动程序以及底层程序框架,这些底层程序框架提供更接近硬件的功能,以供位于核心服务层340的程序框架所使用。核心服务层340提供给应用程序所需要的系统服务和/或程序框架,比如基础(foundation)框架、账户框架、广告框架、数据存储框架、网络连接框架、地理位置框架、运动框架等等。媒体层360为应用程序提供有关视听方面的接口,如图形图像相关的接口、音频技术相关的接口、视频技术相关的接口、音视频传输技术的无线播放(airplay)接口等。可触摸层380为应用程序开发提供了各种常用的界面相关的框架,可触摸层380负责用户在终端100上的触摸交互操作。比如本地通知服务、远程推送服务、广告框架、游戏工具框架、消息用户界面接口(userinterface,ui)框架、用户界面uikit框架、地图框架等等。

在图2所示出的框架中,与大部分应用程序有关的框架包括但不限于:核心服务层340中的基础框架和可触摸层380中的uikit框架。基础框架提供许多基本的对象类和数据类型,为所有应用程序提供最基本的系统服务,和ui无关。而uikit框架提供的类是基础的ui类库,用于创建基于触摸的用户界面,ios应用程序可以基于uikit框架来提供ui,所以它提供了应用程序的基础架构,用于构建用户界面,绘图、处理和用户交互事件,响应手势等等。

触摸显示屏130用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作,以及显示各个应用程序的用户界面。触摸显示屏130通常设置在终端130的前面板。触摸显示屏130可被设计成为全面屏、曲面屏或异型屏。触摸显示屏130还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合,本实施例对此不加以限定。其中:

全面屏

全面屏可以是指触摸显示屏130占用终端100的前面板的屏占比超过阈值(比如80%或90%或95%)的屏幕设计。屏占比的一种计算方式为:(触摸显示屏130的面积/终端100的前面板的面积)*100%;屏占比的另一种计算方式为:(触摸显示屏130中实际显示区域的面积/终端100的前面板的面积)*100%;屏占比的再一种计算方式为:(触摸显示屏130的对角线/在终端100的前面板的对角线)*100%。示意性的如图3a所示的例子中,终端100的前面板上近乎所有区域均为触摸显示屏130,在终端100的前面板40上,除中框41所产生的边缘之外的其它区域,全部为触摸显示屏130。该触摸显示屏130的四个角可以是直角或者圆角。

全面屏还可以是将至少一种前面板部件集成在触摸显示屏130内部或下层的屏幕设计。可选的,该至少一种前面板部件包括:摄像头、指纹传感器、接近光传感器、距离传感器等。在一些实施例中,将传统终端的前面板上的其他部件集成在触摸显示屏130的全部区域或部分区域中,比如将摄像头中的感光元件拆分为多个感光像素后,将每个感光像素集成在触摸显示屏130中每个显示像素中的黑色区域中。由于将至少一种前面板部件集成在了触摸显示屏130的内部,所以全面屏具有更高的屏占比。

当然在另外一些实施例中,也可以将传统终端的前面板上的前面板部件设置在终端100的侧边或背面,比如将超声波指纹传感器设置在触摸显示屏130的下方、将骨传导式的听筒设置在终端130的内部、将摄像头设置成位于终端的侧边且可插拔的结构。

在一些可选的实施例中,当终端100采用全面屏时,终端100的中框的单个侧边,或两个侧边(比如左、右两个侧边),或四个侧边(比如上、下、左、右四个侧边)上设置有边缘触控传感器120,该边缘触控传感器120用于检测用户在中框上的触摸操作、点击操作、按压操作和滑动操作等中的至少一种操作。该边缘触控传感器120可以是触摸传感器、热力传感器、压力传感器等中的任意一种。用户可以在边缘触控传感器120上施加操作,对终端100中的应用程序进行控制。

曲面屏

曲面屏是指触摸显示屏130的截面呈弯曲形状且沿平行于截面的方向上的投影为平面的屏幕设计,该弯曲形状可以是u型。可选的,曲面屏是指至少一个侧边是弯曲形状的屏幕设计方式。可选的,曲面屏是指触摸显示屏130的至少一个侧边延伸覆盖至终端100的中框上。由于触摸显示屏130的侧边延伸覆盖至终端100的中框,也即将原本不具有显示功能和触控功能的中框覆盖为可显示区域和/或可操作区域,从而使得曲面屏具有了更高的屏占比。可选的,如图3b所示的例子中,曲面屏是指左右两个侧边42是弯曲形状的屏幕设计;或者,曲面屏是指上下两个侧边是弯曲形状的屏幕设计;或者,曲面屏是指上、下、左、右四个侧边均为弯曲形状的屏幕设计。在可选的实施例中,曲面屏采用具有一定柔性的触摸屏材料制备。

异型屏

异型屏是外观形状为不规则形状的显示屏,不规则形状不是矩形或圆角矩形。可选的,异型屏是指在矩形或圆角矩形的触摸显示屏130上设置有凸起、缺口和/或挖孔的屏幕设计。可选的,该凸起、缺口和/或挖孔可以位于触摸显示屏130的边缘、屏幕中央或两者均有。当凸起、缺口和/或挖孔设置在一条边缘时,可以设置在该边缘的中间位置或两端;当凸起、缺口和/或挖孔设置在屏幕中央时,可以设置在屏幕的上方区域、左上方区域、左侧区域、左下方区域、下方区域、右下方区域、右侧区域、右上方区域中的一个或多个区域中。当设置在多个区域中时,凸起、缺口和挖孔可以集中分布,也可以分散分布;可以对称分布,也可以不对称分布。可选的,该凸起、缺口和/或挖孔的数量也不限。

由于异型屏将显示屏的上额区和/或下额区覆盖为可显示区域和/或可操作区域,使得显示屏在终端的前面板上占据更多的空间,所以异型屏也具有更大的屏占比。在一些实施例中,缺口和/或挖孔中用于容纳至少一种前面板部件,该前面板部件包括摄像头、指纹传感器、接近光传感器、距离传感器、听筒、环境光亮度传感器、物理按键中的至少一种。

示例性的,该缺口可以设置在一个或多个边缘上,该缺口可以是半圆形缺口、直角矩形缺口、圆角矩形缺口或不规则形状缺口。示意性的如图3c所示的例子中,异型屏可以是在触摸显示屏130的上边缘的中央位置设置有半圆形缺口43的屏幕设计,该半圆形缺口43所空出的位置用于容纳摄像头、距离传感器(又称接近传感器)、听筒、环境光亮度传感器中的至少一种前面板部件;示意性的如图3d所示,异型屏可以是在触摸显示屏130的下边缘的中央位置设置有半圆形缺口44的屏幕设计,该半圆形缺口44所空出的位置用于容纳物理按键、指纹传感器、麦克风中的至少一种部件;示意性的如图3e所示的例子中,异型屏可以是在触摸显示屏130的下边缘的中央位置设置有半椭圆形缺口45的屏幕设计,同时在终端100的前面板上还形成有一个半椭圆型缺口,两个半椭圆形缺口围合成一个椭圆形区域,该椭圆形区域用于容纳物理按键或者指纹识别模组;示意性的如图3f所示的例子中,异型屏可以是在触摸显示屏130中的上半部中设置有至少一个小孔46的屏幕设计,该小孔46所空出的位置用于容纳摄像头、距离传感器、听筒、环境光亮度传感器中的至少一种前面板部件。

除此之外,本领域技术人员可以理解,上述附图所示出的终端100的结构并不构成对终端100的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端100中还包括射频电路、输入单元、传感器、音频电路、无线保真(wirelessfidelity,wifi)模块、电源、蓝牙模块等部件,在此不再赘述。

请参考图4,其示出了本申请一个示例性实施例示出的歌曲识别方法的流程图。本实施例以该方法应用于终端中来举例说明。该方法包括:

步骤401,显示第一应用程序的第一用户界面,第一用户界面中播放有音视频内容。

终端的屏幕状态包括竖屏状态和横屏状态。可选的,当终端处于横屏状态时显示第一应用程序的第一用户界面。

可选的,当终端的显示屏为异形屏时,终端在主显示区域上显示第一应用程序的第一用户界面,在辅显示区域不显示内容。或者,终端在显示屏的整个显示区域上显示第一应用程序的第一用户界面。其中,显示屏也称触摸显示屏。

其中,异形屏为设置有缺口区域的不规则形状的屏幕。

可选的,终端的显示屏上包括主显示区域和辅显示区域。主显示区域和辅显示区域是属于同一显示屏上的不同显示区域。主显示区域的第一显示面积大于辅显示区域的第二显示面积。当终端的显示屏为异形屏时,主显示区域是异形屏上呈矩形的显示区域,辅显示区域是异形屏上呈异形形状的显示区域,主显示区域和辅显示区域的合集等于异形屏的整个显示区域。

第一应用程序是位于前台运行的应用程序。在用户使用第一应用程序的过程中,终端在显示屏的整个显示区域上显示第一应用程序的第一用户界面,该第一用户界面为第一应用程序中显示目标内容的程序界面。

第一应用程序为用于播放音视频内容的应用程序。第一应用程序也称多媒体应用程序,第一应用程序可以是视频应用程序,也可以是游戏应用程序。

可选的,音视频内容包括音频内容和/或视频内容。

步骤402,在第一用户界面上显示音频识别图标,音频识别图标为触发对音视频内容中的目标歌曲进行识别的入口。

终端在第一应用程序的第一用户界面上显示音频识别图标。

可选的,音频识别图标是听歌识曲功能的图标,音频识别图标用于触发对音视频内容中的目标歌曲进行识别。

显示音频识别图标的触发方式包括但不限于以下几种可能的实现方式。

在一种可能的实现方式中,当接收到第一用户界面上的第四操作信号时,在第一用户界面上显示音频识别图标。

可选的,当终端接收到第一用户界面上的第四操作信号时,在第一用户界面的第一局部区域上叠加显示音频识别图标。

第四操作信号可以是单击信号、双击信号、长按信号、滑动信号中的至少一种。

可选的,第四操作信号包括:作用在第一用户界面的第一局部区域上的第一滑动信号。示意性的,第一滑动信号的滑动起始位置位于第一局部区域内,第一滑动信号的滑动方向指向终端的显示屏的中间位置。

示意性的,第一用户界面上包括浮标,浮标为触发显示音频识别图标的可操作控件,第四操作信号包括:作用在浮标上的第二滑动信号。比如,第二滑动信号的滑动起始位置位于浮标上,第二滑动信号的滑动方向指向显示屏的中间位置。

可选的,当终端的显示屏为异形屏时,第一局部区域用于表示位于异形屏的缺口区域侧边的区域。可选的,当终端的显示屏为异形屏时,第一局部区域用于表示与异形屏的缺口区域小于第一距离阈值的区域。

第一距离阈值是终端默认设置的,也可以是用户自定义设置的。本实施例对此不加以限定。

可选的,当终端的显示屏为异形屏且终端的显示状态为竖屏状态时,第二操作信号是从异形屏上存在凹陷部分的曲线边向下滑动的至少一个滑动轨迹对应的滑动信号;当终端的显示屏为异形屏且终端的显示状态为横屏状态时,第二操作信号是从异形屏上存在凹陷部分的曲线边向右滑动的至少一个滑动轨迹对应的滑动信号。

比如,当终端的显示屏为异形屏且终端的显示状态为横屏状态时,用户通过一根手指在终端的异形屏的左边缘向右进行滑动操作,对应的,终端接收到的第一操作信号为从异形屏的左边缘向右滑动的1个滑动轨迹对应的信号。

在另一种可能的实现方式中,当在第一用户界面上播放音视频内容的时长超过显示时长阈值时,在第一用户界面上显示音频识别图标。

显示时长阈值是终端默认设置的,或者是用户自定义设置的。本实施例对此不加以限定。

示意性的,当第一应用程序为视频应用程序时,记录视频开始时刻,若当前时刻与视频开始时刻的时差达到显示时长阈值时,在第一用户界面上显示音频识别图标。

需要说明的是,本实施对显示音频识别图标的触发方式不加以限定,下面仅以当接收到第一用户界面上的第二操作信号时,在第一用户界面上显示音频识别图标为例进行说明。

步骤403,当接收到音频识别图标上的第一操作信号时,在第一用户界面上显示浮动窗口,浮动窗口用于显示目标歌曲的介绍性信息。

当终端接收到音频识别图标上的第一操作信号时,在第一用户界面上以浮动窗口的形式显示目标歌曲的介绍性信息。

第一操作信号可以是点击信号、双击信号、长按信号、滑动信号中的至少一种。下面仅以第一操作信号为点击信号为例进行说明。

浮动窗口,又称为顶层窗口或画中画窗口,可以由安卓操作系统中的windowsmanager窗口实现。该浮动窗口可以尽量不遮挡第一用户界面上的主要显示元素。用户可以对浮动窗口中的信息进行操作。

可选的,终端接收浮动窗口的边框或边角上的拖动信号,根据该拖动信号改变浮动窗口的长、宽以及显示比例中的任意一种。

可选的,目标歌曲的介绍性信息包括目标歌曲的歌曲名称、目标歌曲对应的目标专辑的名称,目标专辑的封面信息和目标歌曲的创作人员信息中的至少一种。

需要说明的是,播放音视频内容的设备与识别音视频内容中的目标歌曲的设备为同一终端。即终端用于对该终端所播放的音视频内容中的目标歌曲进行识别。

在一个示意性的例子中,如图5所示,终端通过视频应用程序播放音视频内容,即此时终端在显示屏的整个显示区域上显示视频应用程序的第一用户界面51,第一用户界面51用于显示音视频内容(图中未示出)。终端在第一用户界面51的第一局部区域上显示音频识别图标52。当终端接收到音频识别图标52上的点击信号时,对当前播放的音视频内容中的目标歌曲进行识别,当成功识别出当前播放的音视频内容中的目标歌曲时,在第一用户界面51上显示浮动窗口53,浮动窗口53用于显示目标歌曲的介绍性信息,目标歌曲的介绍性信息包括目标歌曲的歌曲名称“aa”、目标歌曲对应的目标专辑的名称“专辑1”,目标专辑的封面信息54和目标歌曲的歌唱者名称“小周”。

综上所述,本实施例通过显示第一应用程序的第一用户界面,第一用户界面中播放有音视频内容;在第一用户界面上显示音频识别图标,当接收到音频识别图标上的第一操作信号时在第一用户界面上显示识别结果图标,识别结果图标用于指示是否成功识别出音视频内容中的目标歌曲;使得终端能够对自身当前播放的音视频内容中的目标歌曲进行识别,避免了相关技术中第一终端所播放的音视频内容中的歌曲需要通过第二终端才能进行识别导致歌曲识别的效率较低的问题,提高了歌曲识别的准确性和效率。

请参考图6,其示出了本申请一个示例性实施例提供的歌曲识别方法的流程图。本实施例以该歌曲识别方法应用于终端中来举例说明。该歌曲识别方法包括:

步骤601,显示第一应用程序的第一用户界面,第一用户界面中播放有音视频内容。

可选的,终端在显示屏的整个显示区域上显示第一应用程序的第一用户界面。

第一用户界面为第一应用程序中播放有音视频内容的程序界面。可选的,第一应用程序为视频应用程序,第一用户界面为目标音视频内容的视频播放界面。

步骤602,当接收到第一用户界面上的第四操作信号时,在第一用户界面的第一局部区域上叠加显示音频识别图标。

音频识别图标的显示方式包括但不限于以下几种可能的实现方式。

在一种可能的实现方式中,终端在第一用户界面的第一局部区域上叠加显示侧边栏,该侧边栏用于显示音频识别图标。

可选的,侧边栏包括音频识别图标和基础图标。

其中,基础图标包括固定功能的功能图标、第三应用程序的程序图标和快捷工具的工具图标中的至少一种。

示意性的,固定功能包括速记功能、文件传输功能和文件存储功能中的至少一种。第三应用程序为除了第一应用程序以外的其它应用程序。快捷工具包括静音工具、亮度调节工具、截屏工具、录屏工具、挂机工具、参数配置工具、后台清理工具中的至少一种。

比如,当第一应用程序为视频应用程序时,基础图标包括播放图标、暂停图标、音量调节图标、亮度调节图标、截屏图标、录屏图标中的至少一种。

比如,当第一应用程序为游戏应用程序时,基础图标包括挂机图标、虚拟背包图标、虚拟技能图标、静音图标、后台清理图标、截屏图标、录屏图标中的至少一种。

在一个示意性的例子中,如图7所示,终端通过视频应用程序播放音视频内容,即此时终端在显示屏的整个显示区域上显示视频应用程序的第一用户界面51,第一用户界面51用于显示音视频内容(图中未示出)。当终端在第一用户界面51上接收到显示屏的左边缘向右滑动的滑动信号时,终端在第一用户界面51的第一局部区域上叠加显示侧边栏71,该侧边栏71用于显示听歌识曲功能的音频识别图标72。

可选的,终端在侧边栏上显示三个分区,三个分区包括第一分区、第二分区和第三分区。第一分区用于显示固定功能的功能图标,第二分区用于显示快捷工具的工具图标和/或音频识别图标,第三分区用于显示第三应用程序的程序图标。

在另一种可能的实现方式中,终端在第一用户界面的第一局部区域上叠加显示侧边栏,该侧边栏用于显示第一基础图标。当接收到侧边栏上的第二滑动信号时,跟随第二滑动信号在侧边栏中取消对第一基础图标的显示,且在侧边栏中增加对第二基础图标和音频识别图标的显示。

基础图标包括第一基础图标和第二基础图标。由于侧边栏的显示面积有限,终端可以先在侧边栏中显示第一基础图标,当终端接收到侧边栏上的第二滑动信号时,跟随第二滑动信号在侧边栏中取消对第一基础图标的显示,且在侧边栏中增加对第二基础图标和音频识别图标的显示。

也即,终端会跟随第二滑动信号对侧边栏进行滑动显示。该滑动显示包括:将移出侧边栏的第一基础图标进行取消显示、将移入侧边栏的第二基础图标和音频识别图标进行显示、将仍然位于侧边栏中的第一基础图标跟随第二滑动信号改变显示位置。

可选的,终端在侧边栏中显示分页符,该分页符用于提示侧边栏包中存在尚未显示的图标。

需要说明的是,音频识别图标可以是直接显示在侧边栏中的,也可以是跟随滑动信号移入侧边栏中进行显示的,本实施例对此不加以限定。

可选的,当终端在侧边栏显示三个分区,第一分区用于显示固定功能的功能图标,第二分区用于显示快捷工具的工具图标,第三分区用于显示第三应用程序的程序图标时,终端在第二分区中显示分页符,该分页符用于提示第二分区中存在尚未显示的图标。当终端接收到第二分区上的滑动信号时,跟随滑动信号在第二分区中取消对工具图标的显示,且在第二分区中增加对其他工具图标和音频识别图标的显示。

在一个示意性的例子中,如图8所示,终端在显示屏的整个显示区域上显示视频应用程序的第一用户界面51,第一用户界面51用于显示音视频内容(图中未示出)。当终端在第一用户界面51上接收到显示屏的左边缘向右滑动的滑动信号时,终端在第一用户界面51的第一局部区域上叠加显示侧边栏81,该侧边栏81中显示三个分区,第一分区82用于显示固定功能的功能图标(比如图标a和图标b),第二分区83用于显示快捷工具的工具图标(比如图标c和图标d),第三分区84用于显示第三应用程序的程序图标(比如图标e至图标j)时,终端在第二分区83中显示分页符85,该分页符85用于提示第二分区83中存在尚未显示的图标。当终端接收到第二分区83上的滑动信号时,跟随滑动信号在第二分区83中取消对图标c和图标d的显示,且在第二分区83中增加对图标k以及音频识别图标86的显示。

步骤603,当接收到音频识别图标上的第一操作信号时,在第一用户界面上显示第一提示图标,第一提示图标用于指示正在对音视频内容中的目标歌曲进行识别。

可选的,当终端接收到音频识别图标上的第一操作信号时,对音视频内容中的目标歌曲进行识别,在第一用户界面上显示第一提示图标。

可选的,终端在第一用户界面的第二局部区域上显示第一提示图标。

第二局部区域可以是与第一局部区域存在交集的区域,也可以是与第一局部区域不存在交集的区域。可选的,当终端的显示屏为异形屏时,第二局部区域用于表示与异形屏的缺口区域大于第二距离阈值的区域。

第二距离阈值是终端默认设置的,也可以是用户自定义设置的。本实施例对此不加以限定。

在一种可能的实现方式中,当终端接收到音频识别图标上的第一操作信号时,对音视频内容中的目标歌曲进行识别,包括:当终端接收到音频识别图标上的点击信号时,获取位于前台播放的音视频内容;终端获取目标匹配模型,目标匹配模型是用于对样本音视频内容进行训练的模型。终端将音视频内容输入至目标匹配模型中输出得到歌曲标识,歌曲标识用于指示目标歌曲。

当终端的显示屏上同时显示多个页面时,位于前台播放的音视频内容为位于多个页面的最顶端的第一用户界面当前播放的音视频内容;当终端的显示屏上显示一个页面时,位于前台播放的音视频内容为当前显示的第一用户界面中播放的音视频内容。在本申请实施例中,播放音视频内容的设备与识别音视频内容中的目标歌曲的设备为同一终端,避免了相关技术中在终端播放音视频内容之后再手动通过其他设备对音视频内容中的目标歌曲进行识别的情况,也避免了获取到的音视频内容中存在外界噪音的情况,提高了获取到的音视频内容的准确率和效率,进而提高了识别目标歌曲的准确率和效率。

可选的,目标匹配模型是预先训练好的模型。终端获取自身存储的目标匹配模型,或者终端从服务器中获取训练好的模板匹配模型。

目标匹配模型包括但不限于:卷积神经网络(convolutionalneuralnetwork,cnn)模型、深度神经网络(deepneuralnetwork,dnn)模型、循环神经网络(recurrentneuralnetworks,rnn)模型、嵌入(embedding)模型、梯度提升决策树(gradientboostingdecisiontree,gbdt)模型、逻辑回归(logisticregression,lr)模型中的至少一种。

可选的,服务器训练目标匹配模型的过程包括:服务器获取训练样本集,训练样本集包括至少一组样本数据组;服务器对至少一组样本数据组采用误差反向传播算法进行训练,得到目标匹配模型。其中,每组样本数据组包括:样本音视频内容和预先标定的正确歌曲标识。

可选的,服务器对至少一组样本数据组采用误差反向传播算法进行训练,得到目标匹配模型,包括但不限于以下几个步骤:对于至少一组样本数据组中的每组样本数据组,将样本音视频内容输入原始参数模型,得到训练结果;对于每组样本数据组,将训练结果与正确歌曲标识进行比较,得到计算损失,计算损失用于指示训练结果与正确歌曲标识之间的误差;根据至少一组样本数据组各自对应的计算损失,采用误差反向传播算法训练得到目标匹配模型。

可选的,终端通过反向传播算法根据计算损失确定目标匹配模型的梯度方向,从目标匹配模型的输出层逐层向前更新目标匹配模型中的模型参数。

可选的,当终端接收到音频识别图标上的第一操作信号时,对音视频内容中的目标歌曲进行识别,在第一用户界面上显示识别结果图标,识别结果图标用于指示是否成功识别出音视频内容中的目标歌曲。

可选的,识别结果图标包括识别成功图标和识别失败图标中的一种。其中,识别成功图标用于指示成功识别出音视频内容中的目标歌曲。识别失败图标用于指示未识别出音视频内容中的目标歌曲。

可选的,当终端接收到音频识别图标上的第一操作信号时,对音视频内容中的目标歌曲进行识别,若终端识别成功则执行步骤605,若终端识别失败则执行步骤607。

步骤604,若识别成功则将第一提示图标切换显示为识别成功图标,识别成功图标用于指示成功识别出音视频内容中的目标歌曲。

需要说明的是,当识别成功时终端可以在第一用户界面上显示识别成功图标的同时显示浮动窗口,或者,在第一用户界面上显示识别成功图标之后显示浮动窗口,或者直接显示浮动窗口而无需显示识别成功图标。

可选的,若识别成功则终端将第一提示图标切换显示为浮动窗口,或者,终端将第一提示图标切换显示为识别成功图标。本实施例仅以若识别成功则终端将第一提示图标切换显示为识别成功图标为例进行说明。

步骤605,当识别成功图标的显示时长达到第一时长阈值时取消显示识别成功图标。

当识别成功图标的显示时长达到第一时长阈值时,终端自动取消显示识别成功图标。第一时长阈值是终端默认设置的,或者是用户自定义设置的。本实施例对此不加以限定。比如,第一时长阈值为2秒。

步骤606,在第一用户界面上显示浮动窗口,浮动窗口用于显示目标歌曲的介绍性信息。

可选的,终端在取消显示识别成功图标的同时或者在取消显示识别成功图标之后,在第一用户界面上以浮动窗口的形式显示目标歌曲的介绍性信息。

在一个示意性的例子中,基于图8提供的侧边栏81,如图9所示,当终端接收到侧边栏81中音频识别图标86上的点击信号时,在第一用户界面51上显示第一提示图标91和第一提示图标91对应的取消按钮92,第一提示图标91用于指示终端正在对音视频内容中的目标歌曲进行识别,取消按钮92用于指示取消对音视频内容中的目标歌曲的识别。若识别成功则终端将第一提示图标91切换显示为识别成功图标93,该识别成功图标93用于指示终端成功识别出音视频内容中的目标歌曲。当识别成功图标93的显示时长达到2秒时取消显示识别成功图标,在第一用户界面51上显示浮动窗口94,浮动窗口94中显示有目标歌曲对应的信息栏95,该信息栏95包括目标歌曲的歌曲名称“aa”、目标歌曲对应的目标专辑的名称“专辑1”,目标专辑的封面信息96和目标歌曲的歌唱者名称“小周”。

可选的,浮动窗口还显示有收藏控件和/或跳转控件。

示意性的,终端在浮动窗口中以信息栏的形式显示目标歌曲的介绍性信息,该信息栏中还包括目标歌曲对应的收藏控件和/或跳转控件。

在一种可能的实现方式中,浮动窗口还显示有收藏控件。当终端接收到目标歌曲对应的收藏控件上的第二操作信号时,将目标歌曲添加至歌曲收藏夹中。

第二操作信号可以是点击信号、双击信号、长按信号、滑动信号中的至少一种。下面仅以第二操作信号为点击信号为例进行说明。

可选的,目标歌曲对应的收藏控件为用于触发将目标歌曲添加至歌曲收藏夹中的可操作控件。

可选的,歌曲收藏夹为目标音乐应用程序中的目标收藏夹。其中,目标音乐应用程序和目标收藏夹是终端默认设置的,或者是用户自定义设置的。本实施例对此不加以限定。

可选的,当终端接收到目标歌曲对应的收藏控件上的第二操作信号时,将第一显示形式的收藏控件切换为第二显示形式的收藏控件,并将目标歌曲添加至歌曲收藏夹中。第一显示形式用于指示目标歌曲未添加至歌曲收藏夹中,第二显示形式用于指示目标歌曲已添加至歌曲收藏夹中。

示意性的,收藏控件的显示形式包括颜色、形状和动画效果中的至少一种。示意性的,第一显示形式的收藏控件为镂空效果的图标,第二显示形式的收藏控件为填充效果的图标。

在另一种可能的实现方式中,浮动窗口还显示有跳转控件。当终端接收到目标歌曲对应的跳转控件上的第三操作信号时,将第一用户界面切换显示为第二应用程序的第二用户界面,第二用户界面用于播放目标歌曲。

第三操作信号可以是点击信号、双击信号、长按信号、滑动信号中的至少一种。下面仅以第三操作信号为点击信号为例进行说明。

可选的,目标歌曲对应的跳转控件为用于触发将第一用户界面切换显示为第二应用程序的第二用户界面的可操作控件。

第二应用程序为除了第一应用程序以外的其它的多媒体应用程序。第二应用程序为用于播放歌曲的应用程序。第二应用程序可以是视频应用程序,也可以是音乐应用程序。

可选的,当终端接收到目标歌曲对应的跳转控件上的第三操作信号时,在第一用户界面上显示弹出窗口,弹出窗口中显示有用于确认进行跳转显示的确认按钮。当终端接收到确认按钮上的点击信号时,将第一用户界面跳转显示为第二应用程序的第二用户界面。

在另一种可能的实现方式中,浮动窗口还显示有相似歌曲推荐列表,相似歌曲推荐列表包括多个相似歌曲各自对应的介绍性信息、收藏控件和跳转控件中的至少一种,相似歌曲为与目标歌曲相似度高于相似阈值的歌曲。

可选的,在上述终端将音视频内容输入至目标匹配模型中时,得到n个歌曲标识,按照匹配度从高到低的顺序将n个歌曲标识进行排序。终端将排序后的第一个歌曲标识对应的歌曲确定为目标歌曲,将排序后的第二个至第m个歌曲标识各自对应的歌曲确定为相似歌曲。

可选的,相似歌曲推荐列表包括多个相似歌曲各自对应的信息栏,每个信息栏包括该相似歌曲的介绍性信息、收藏控件和跳转控件中的至少一种。

示意性的,相似歌曲的介绍性信息包括相似歌曲的歌曲名称、相似歌曲对应的专辑的名称,相似歌曲对应的专辑的封面信息和相似歌曲的创作人员信息中的至少一种。

可选的,相似歌曲对应的收藏控件为用于触发将相似歌曲添加至歌曲收藏夹中的可操作控件。当终端接收到相似歌曲对应的收藏控件上的第二操作信号时,将相似歌曲添加至歌曲收藏夹中。

可选的,相似歌曲对应的跳转控件为用于触发将第一用户界面切换显示为第二应用程序的第三用户界面的可操作控件。当终端接收到相似歌曲对应的跳转控件上的第三操作信号时,将第一用户界面切换显示为第二应用程序的第三用户界面,第三用户界面用于播放相似歌曲。

在一个示意性的例子中,基于图9提供的浮动窗口94,如图10所示,目标歌曲的信息栏95中还显示有镂空效果的收藏控件97,该浮动窗口94中还显示有相似歌曲推荐列表98,该相似歌曲推荐列表98显示有两个相似歌曲各自对应的信息栏,第一个相似歌曲的信息栏包括该相似歌曲的歌曲名称“bb”、相似歌曲对应的专辑的名称“专辑2”,该专辑的封面信息和该相似歌曲的歌唱者名称“小周”和收藏控件,第二个相似歌曲的信息栏包括该相似歌曲的歌曲名称“cc”、该相似歌曲对应的专辑的名称“专辑2”,该专辑的封面信息和该相似歌曲的歌唱者名称“小周”和收藏控件。当终端接收到目标歌曲对应的收藏控件97上的点击信号时,将第一显示形式的收藏控件97切换为第二显示形式的收藏控件101,并将目标歌曲添加至歌曲收藏夹中。

步骤607,若识别失败则将第一提示图标切换显示为识别失败图标,识别失败图标用于指示未识别出音视频内容中的目标歌曲。

若识别失败则终端将第一提示图标切换显示为识别失败图标。

步骤608,当识别失败图标的显示时长达到第二时长阈值时取消显示识别失败图标。

当识别失败图标的显示时长达到第二时长阈值时终端自动取消显示识别失败图标。

第二时长阈值是终端默认设置的,或者是用户自定义设置的。本实施例对此不加以限定。比如,第二时长阈值为2秒。

步骤609,在第一用户界面上显示用于指示失败原因的提示信息,失败原因包括终端未连接网络或者终端未识别出目标歌曲。

可选的,终端在取消显示识别失败图标的同时或者在取消显示识别失败图标之后显示用于指示失败原因的提示信息。其中,失败原因包括终端未连接网络或者终端未识别出目标歌曲。

在一个示意性的例子中,基于图9提供的第一提示图标91和第一提示图标91对应的取消按钮92,第一提示图标91用于指示终端正在对音视频内容中的目标歌曲进行识别。如图11所示,若识别失败则终端将第一提示图标91切换显示为识别失败图标111,该识别失败图标111用于指示终端未识别出音视频内容中的目标歌曲。当识别失败图标111的显示时长达到2秒时取消显示识别失败图标111,在第一用户界面51上显示浮动窗口112,浮动窗口112中显示有提示信息“请链接网络后重试”,该提示信息用于指示失败原因为终端未连接网络。

综上所述,本申请实施例还通过若识别成功则将第一提示图标切换显示为识别成功图标,识别成功图标用于指示成功识别出音视频内容中的目标歌曲,当识别成功图标的显示时长达到第一时长阈值时取消显示识别成功图标,在第一用户界面上显示浮动窗口;使得当终端识别成功时先将第一提示图标切换显示为识别成功图标,再将识别成功图标切换显示为浮动窗口,进一步丰富了终端的提示效果。

本申请实施例还通过当接收到目标歌曲对应的收藏控件上的第二操作信号时,将目标歌曲添加至歌曲收藏夹中;使得终端通过一步操作即可将目标歌曲进行添加,简化用户在不同的应用程序之间切换时的操作步骤,提高了人机交互效率。

下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。

请参考图5,其示出了本申请一个实施例提供的歌曲识别装置的结构示意图。该歌曲识别装置可以通过专用硬件电路,或者,软硬件的结合实现成为图1中的终端的全部或一部分,该歌曲识别装置包括:第一显示模块1210、第二显示模块1220和第三显示模块1230。

第一显示模块1210,用于显示第一应用程序的第一用户界面,第一用户界面中播放有音视频内容;

第二显示模块1220,用于在第一用户界面上显示音频识别图标,音频识别图标为触发对音视频内容中的目标歌曲进行识别的入口;

第三显示模块1230,用于当接收到音频识别图标上的第一操作信号时,在第一用户界面上显示浮动窗口,浮动窗口用于显示目标歌曲的介绍性信息。

可选的,第三显示模块1230,还用于当接收到音频识别图标上的第一操作信号时,在第一用户界面上显示第一提示图标,第一提示图标用于指示正在对音视频内容中的目标歌曲进行识别;

若识别成功则将第一提示图标切换显示为浮动窗口。

可选的,第三显示模块1230,还用于若识别成功则将第一提示图标切换显示为识别成功图标,识别成功图标用于指示成功识别出音视频内容中的目标歌曲;

当识别成功图标的显示时长达到第一时长阈值时取消显示识别成功图标;

在第一用户界面上显示浮动窗口。

可选的,浮动窗口还显示有收藏控件,该装置还包括第四显示模块,第四显示模块用于当接收到目标歌曲对应的收藏控件上的第二操作信号时,将目标歌曲添加至歌曲收藏夹中。

可选的,浮动窗口还显示有跳转控件,该装置还包括第五显示模块,第五显示模块用于当接收到目标歌曲对应的跳转控件上的第三操作信号时,将第一用户界面切换显示为第二应用程序的第二用户界面,第二用户界面用于播放目标歌曲。

可选的,浮动窗口还显示有相似歌曲推荐列表,相似歌曲推荐列表包括多个相似歌曲各自对应的介绍性信息、收藏控件和跳转控件中的至少一种,相似歌曲为与目标歌曲相似度高于相似阈值的歌曲。

可选的,第二显示模块1220,还用于当接收到第一用户界面上的第四操作信号时,在第一用户界面的第一局部区域上叠加显示音频识别图标。

可选的,第二显示模块1220,还用于当接收到第一用户界面上的第四操作信号时,在第一用户界面的第一局部区域上叠加显示侧边栏,侧边栏包括音频识别图标和基础图标;

其中,基础图标包括固定功能的功能图标、第三应用程序的程序图标和快捷工具的工具图标中的至少一种。

可选的,第三显示模块1230,包括识别单元和显示单元。识别单元,用于当接收到音频识别图标上的第一操作信号时,对音视频内容中的目标歌曲进行识别;显示单元,用于在第一用户界面上显示第一提示图标。

可选的,识别单元,还用于当接收到音频识别图标上的点击信号时,获取位于前台播放的音视频内容;获取目标匹配模型,目标匹配模型是用于对样本音视频内容进行训练的模型;将音视频内容输入至目标匹配模型中输出得到歌曲标识,歌曲标识用于指示目标歌曲。

可选的,识别单元,还用于获取训练样本集,训练样本集包括至少一组样本数据组,每组样本数据组包括:样本音视频内容和预先标定的正确歌曲标识;

对于至少一组样本数据组中的每组样本数据组,将样本音视频内容输入原始参数模型,得到训练结果;

对于每组样本数据组,将训练结果与正确歌曲标识进行比较,得到计算损失,计算损失用于指示训练结果与正确歌曲标识之间的误差;

根据至少一组样本数据组各自对应的计算损失,采用误差反向传播算法训练得到目标匹配模型。

可选的,该装置还包括:第六显示模块。该第六显示模块,用于若识别失败则将第一提示图标切换显示为识别失败图标,识别失败图标用于指示未识别出音视频内容中的目标歌曲。

可选的,该第六显示模块,还用于当识别失败图标的显示时长达到第二时长阈值时取消显示识别失败图标;

在第一用户界面上显示用于指示失败原因的提示信息,失败原因包括终端未连接网络或者终端未识别出目标歌曲。

相关细节可结合参考图4至图11所示的方法实施例。其中,第一显示模块1210、第二显示模块1220和第三显示模块1230还用于实现上述方法实施例中其他任意隐含或公开的与显示步骤相关的功能。

需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本申请还提供一种计算机可读介质,其上存储有程序指令,程序指令被处理器执行时实现上述各个方法实施例提供的歌曲识别方法。

本申请还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个实施例所述的歌曲识别方法。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的歌曲识别方法中全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1