音乐检索方法及装置与流程

文档序号：18465186发布日期：2019-08-17 02:23阅读：413来源：国知局

本发明涉及音乐检索技术领域，具体涉及一种音乐检索方法及装置。

背景技术：

音乐在人们的生活中扮演着十分重要的角色，也有着悠久的历史底蕴，其中，对于大多数人来说，更喜欢直接去听音乐的高潮的部分，一般音乐的高潮部分能够准确地表达传递的情感等信息。也正因此，通常人们在制作ppt或者是宣传片的时候，都会选择加入音乐的高潮部分充当背景音乐，来进一步增添表达的效果。

但是，目前人们在选择背景音乐的时候，大多都是通过音乐软件来下载出对应的整首音乐，然后按照所需的时长进行裁剪，严重的浪费了ppt或宣传片制作的时间，一定程度上降低了工作的效率。

技术实现要素：

有鉴于此，本发明的目的在于提供一种音乐检索方法及装置，以实现直接筛选得到所需音乐时长的目标音乐，省去了裁减时间，提高了工作效率。

为实现以上目的，本发明采用如下技术方案：

一种音乐检索方法，包括：

接收目标音乐的检索信息；所述检索信息包括音乐主题和音乐时长；

基于构建的高潮音乐数据库，筛选与所述音乐主题和所述音乐时长相匹配的候选音乐；

将所述候选音乐按照预设规则显示于目标用户的检索界面，以便所述目标用户从所述候选音乐中选择所述目标音乐作为目标对象的背景音乐。

可选的，上述所述接收目标音乐的检索信息之前，还包括：

采集曲库中每首音乐的全部数据帧对应的完整音频文件，所述完整音频文件包括完整音强数据和/或完整歌词数据；

对所述完整音强数据和/或所述完整歌词数据进行处理，得到所述每首音乐的高潮部分和所述高潮部分对应的时长；

基于所述高潮部分和所述高潮部分对应的时长构建所述高潮音乐数据库。

可选的，上述所述对所述完整音强数据和/或所述完整歌词数据进行处理，得到所述每首音乐的高潮部分和所述高潮部分对应的时长，包括：

获取与所述完整音强数据对应的全部音强峰值；

从所述全部音强峰值选取最大音强峰值；

识别所述最大音强峰值两端的首端音强峰值和末端音强峰值；

比较所述最大音强峰值与所述首端音强峰值的差值，得到首端差值；

比较所述最大音强峰值与所述末端音强峰值的差值，得到末端差值；

若所述首端差值大于首端预设阈值，则所述首端音强峰值对应的时间点为所述音乐高潮部分的起始点；

若所述末端差值大于末端预设阈值，则所述末端音强峰值对应的时间点为所述音乐高潮部分的结束点；

确定所述起始点与所述结束点之间的时间差值作为所述高潮部分对应的时长。

可选的，上述所述对所述完整音强数据和/或所述完整歌词数据进行处理，得到所述每首音乐的高潮部分和所述高潮部分对应的时长，包括：

识别所述完整歌词数据中每句歌词的重复率；

比较所述重复率与预设重复率阈值；

若所述重复率大于所述预设重复率阈值，则所述重复率对应的歌词为所述音乐的高潮部分；

所述歌词开始对应的时间点为所述高潮部分的起始点，所述歌词结束对应的时间点为所述高潮部分的结束点；

确定所述起始点与所述结束点之间的时间差值作为所述高潮部分对应的时长。

可选的，上述所述将所述候选音乐按照预设规则显示于目标用户的检索界面，包括：

将所述候选音乐按照与所述音乐主题的相似程度由高到低的顺序显示于所述目标用户的检索界面，和/或，

将所述候选音乐与按照与所述音乐时长的差值由小到大的顺序显示于所述目标用户的检索界面。

一种音乐检索装置，包括：

接收模块，用于接收目标音乐的检索信息；所述检索信息包括音乐主题和音乐时长；

筛选模块，用于基于构建的高潮音乐数据库，筛选与所述音乐主题和所述音乐时长相匹配的候选音乐；

显示模块，用于将所述候选音乐按照预设规则显示于目标用户的检索界面，以便所述目标用户从所述候选音乐中选择所述目标音乐作为目标对象的背景音乐。

可选的，上述所述音乐检索装置，还包括：

采集模块，用于采集曲库中每首音乐的全部数据帧对应的完整音频文件，所述完整音频文件包括完整音强数据和/或完整歌词数据；

处理模块，用于对所述完整音强数据和/或所述完整歌词数据进行处理，得到所述每首音乐的高潮部分和所述高潮部分对应的时长；

构建模块，用于基于所述高潮部分和所述高潮部分对应的时长构建所述高潮音乐数据库。

可选的，上述所述处理模块具体用于：

获取与所述完整音强数据对应的全部音强峰值；

从所述全部音强峰值选取最大音强峰值；

识别所述最大音强峰值两端的首端音强峰值和末端音强峰值；

比较所述最大音强峰值与所述首端音强峰值的差值，得到首端差值；

比较所述最大音强峰值与所述末端音强峰值的差值，得到末端差值；

若所述首端差值大于首端预设阈值，则所述首端音强峰值对应的时间点为所述音乐高潮部分的起始点；

若所述末端差值大于末端预设阈值，则所述末端音强峰值对应的时间点为所述音乐高潮部分的结束点；

确定所述起始点与所述结束点之间的时间差值作为所述高潮部分对应的时长。

可选的，上述所述处理模块具体用于：

识别所述完整歌词数据中每句歌词的重复率；

比较所述重复率与预设重复率阈值；

若所述重复率大于所述预设重复率阈值，则所述重复率对应的歌词为所述音乐的高潮部分；

所述歌词开始对应的时间点为所述高潮部分的起始点，所述歌词结束对应的时间点为所述高潮部分的结束点；

确定所述起始点与所述结束点之间的时间差值作为所述高潮部分对应的时长。

可选的，上述所述显示模块具体用于：

将所述候选音乐按照与所述音乐主题的相似程度由高到低的顺序显示于所述目标用户的检索界面，和/或，

将所述候选音乐与按照与所述音乐时长的差值由小到大的顺序显示于所述目标用户的检索界面。

本发明的一种音乐检索方法及装置，通过接收目标音乐的检索信息，检索信息包括音乐主题和音乐时长，基于构建的高潮音乐数据库，筛选与音乐主题和音乐时长相匹配的候选音乐，将候选音乐按照预设规则显示于目标用户的检索界面，以便目标用户从候选音乐中选择目标音乐作为目标对象的背景音乐，实现了用户通过音乐主题和音乐时长的方式对音乐进行检索，直接得到想要的与主题和时长的相匹配的目标音乐，然后直接将其应用到所需的ppt或宣传片等文件中，省去了用户裁剪音乐的繁琐操作，既节约了时间，又提高了工作的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的音乐检索方法的一种流程图。

图2是本发明实施例提供的音乐检索方法的另一种流程图。

图3是本发明实施例提供的音乐检索装置的一种结构示意图。

图4是本发明实施例提供的音乐检索装置的另一种结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

图1是本发明实施例提供的音乐检索方法的一种流程图。

如图1所示，本实施例提供的一种音乐检索方法具体可以包括以下步骤：

s101、接收目标音乐的检索信息。

接收目标音乐的检索信息，其中，检索信息包括音乐主题和音乐时长，用户可以直接输入时长来选择所需要的音乐，进入检索界面可以是音乐播放软件的其中一个功能，也可以是单独的一个应用软件，为了使得更好地保证音乐的数量，可以选择将其作为现有音乐播放软件的一个附加功能，作为其中一种检索音乐的方法。

接收目标音乐的检索信息，包括接收用户输入的文字信息、图片信息和语音信息等内容，不管采用任何方式，只要能够有效地捕捉到相关信息即可。最常规的方式为用户直接输入文字内容，例如梦想，30秒，即可完成，也可以设置特殊的符号，比如在查找之前输入@，表示接收到的检索信息即为包含有对应时长的高潮音乐，当然，具体的符号不做强制限定，只要能够实现检索高潮音乐即可。比如语音输入的方式，接收到语音检索信息，然后进行检索，也可以自动识别音乐，从音乐库中查询得到相关音乐；再比如，输入图片，通过图片检索的方式了解到相关音乐内容，进而接收到目标音乐的检索信息。无论采用哪一种方式，其最终实现的是通过用户输入包含音乐主题和音乐时长的检索信息的方式，均属于本发明的保护范围之内。

s102、基于构建的高潮音乐数据库，筛选与检索信息中的音乐主题和音乐时长相匹配的候选音乐。

当接收到用户的检索信息以后，自动在提前构建好的高潮音乐数据库中查询与检索信息中的音乐主题和音乐时长相匹配的音乐，将其定义为候选音乐，在高潮音乐数据库中筛选目标音乐时，可以优先筛选与音乐主题相关的内容，然后在音乐主题的基础上，再进一步地筛选与检索信息中的音乐时长相匹配的目标音乐，进而检索到与目标音乐匹配度最高的候选音乐。

s103、将候选音乐按照预设规则显示于目标用户的检索界面。

候选音乐可能会很多，依次显示于用户的检索界面，其中的预设规则包括：将候选音乐按照与音乐主题的相似程度由高到低的顺序显示于目标用户的检索界面，和/或，将候选音乐与按照与音乐时长的差值由小到大的顺序显示于目标用户的检索界面。也可以设置阈值，将候选音乐按照音乐主题和音乐时长综合的方式显示于用户的检索界面，比如与音乐主题的相似程度为100％，与音乐时长的差值为3秒以内，则优先显示于用户的检索界面。其中，显示的内容包括歌曲名称、高潮部分的时长和歌词内容等相关信息，使得用户更直观地了解到候选音乐的全部信息，以便用户更好地选择所需要的目标音乐，并将目标音乐作为目标对象的背景音乐，其中，该目标对象可以为ppt和/或宣传片。如果没有与音乐时长完全匹配的候选音乐，优先显示时长大于检索信息中的音乐时长的候选音乐。

例如，某老师在上公共课时，整个教学资料的ppt可能很长，达到100多页，很少有整个ppt完全添加着背景音乐，一是影响授课的声音，二是长时间的背景音乐会导致学生麻木，降低学习的积极性。而且即使是拿整首音乐来说通常也有3分钟的时间，当讲到某个重要篇章时若是将整首音乐放入ppt中，直接影响了授课的进度，通常老师在授课时也是选择将整首音乐的高潮部分载入所需的ppt对应的章节中，但是都是提前将整首音乐进行下载，然后再去根据所需要的时间长短来裁剪整首音乐，而在裁剪的过程中，很难保证好高潮部分与时长的完全对应，很大程度上影响了ppt的制作时间。若采用本发明所提供的一种音乐检索方法，直接检索得到目标音乐的高潮部分，完全省去了裁剪的步骤，直接将其载入所要应用的章节中，保证了高效性和准确性。同理，在宣传片的制作过程中，或者是其他需要用到背景音乐的文件制作中，同样的省去了单独再去裁剪音乐的繁琐操作，降低了工作量，有效地提高了工作效率。

本实施例的一种音乐检索方法，通过接收目标音乐的检索信息；检索信息包括音乐主题和音乐时长，基于构建的高潮音乐数据库，筛选与音乐主题和音乐时长相匹配的候选音乐，将候选音乐按照预设规则显示于目标用户的检索界面，以便目标用户从候选音乐中选择目标音乐，实现了用户通过音乐主题和音乐时长的方式对音乐进行检索，直接得到想要的与主题和时长的相匹配的目标音乐，然后直接将其应用到所需的ppt或宣传片等文件中，省去了用户裁剪音乐的繁琐操作，既节约了时间，又提高了工作的效率。

图2是本发明实施例提供的音乐检索方法的另一种流程图。如图2所示，本实施例的音乐检索方法在图1所示实施例的基础上，进一步更加详细地对本发明的技术方案进行描述。如图2所示，本实施例的音乐检索方法具体还可以包括以下步骤：

s201、采集曲库中每首音乐的全部数据帧对应的完整音频文件。

其中，完整音频文件包括完整音强数据和/或完整歌词数据，对音频文件中的所有内容进行采集，更好地保证数据结果的准确性。

s202、对完整音频文件中的完整音强数据和/或完整歌词数据进行处理，得到每首音乐的高潮部分和高潮部分对应的时长。

若通过完整音强数据得到每首音乐的高潮部分和高潮部分对应的时长，可以为：首先获取到与完整音强数据对应的全部音强峰值，将每一个时间点对应的音强峰值全部捕捉到，然后将所有捕捉到的音强峰值进行比较，从全部的音强峰值选取最大音强峰值，而最大音强峰值对应的时间点以及歌词部分为高潮部分的一部分，然后识别最大音强峰值两端的首端音强峰值和末端音强峰值；定义最大音强峰值对应的时间点左侧时间轴的任何一个音强峰值为首端音强峰值，定义最大音强峰值对应的时间点右侧时间轴的任何一个音强峰值为末端音强峰值，得到首端音强峰值和末端音强峰值以后，比较最大音强峰值与多个首端音强峰值的差值，得到首端差值，首端差值有多个，同理，比较最大音强峰值与多个末端音强峰值的差值，得到末端差值，末端差值也有多个，然后分别比较多个首端差值与首端预设阈值的大小，直到得到一个首端音强峰值大于首端预设阈值时，便可以确定此时的首端音强峰值对应的时间点为音乐高潮部分的起始点，同理，若末端差值大于末端预设阈值，则末端音强峰值对应的时间点为音乐高潮部分的结束点，因此，便得到了音乐高潮部分的起始点和结束点，也就确定了起始点与结束点之间的时间差值，该时间差值即为音乐高潮部分对应的时长。

还可以通过对完整歌词数据进行处理，得到每首音乐的高潮部分和高潮部分对应的时长，首先识别完整歌词数据中每句歌词的重复率，通常在一首完整的音乐中，高潮部分是重复率最高的部分，一般都会重复唱3次及以上，比较重复率与预设重复率阈值，预设重复率阈值为固定的值，可以自行进行设定，若重复率大于预设重复率阈值，则重复率对应的歌词为音乐的高潮部分，每一句歌词都去判别它的重复率，也可以不设定阈值，直接筛选重复率最高的歌词即为该首音乐的高潮部分，具体可以根据实际情况进行人为设定，能够准确的得到音乐的高潮部分即可，高潮部分的歌词开始对应的时间点便为高潮部分的起始点，歌词结束对应的时间点便为高潮部分的结束点，确定起始点与结束点之间的时间差值，即为高潮部分对应的时长。

s203、基于每首音乐的高潮部分和高潮部分对应的时长构建高潮音乐数据库。

现有的音乐播放软件的音乐数据库，为整首音乐的数据库，而本发明构建的高潮音乐数据库为，只包含每首音乐的高潮部分，将每首音乐的高潮部分作为单独的文件存储起来，然后接收到检索信息后，直接从高潮音乐数据库中筛选高潮音乐。构建数据库时，首先采集曲库中每首音乐的全部数据帧对应的完整音频文件，包括前奏等所有数据，也包括完整的音强数据和完整的歌词数据，通过上述步骤得到了每首音乐的高潮部分和高潮部分对应的时长，便将其相互匹配的存储在高潮音乐数据库中。数据库还可以包括多个子数据库，例如一个主题一个数据库，梦想主题一个子数据库，爱情主题一个子数据库，也可以是按照时长定义子数据库，20秒内的一个子数据库，20秒到40秒内一个字数据库，其具体的子数据库的分类情况不再进行详细说明，只要采用的是本发明的原理，均属于本发明的保护范围之内。

s204、接收目标音乐的检索信息。

s205、基于构建的高潮音乐数据库，筛选与检索信息中的音乐主题和音乐时长相匹配的候选音乐。

s206、将候选音乐按照预设规则显示于目标用户的检索界面。

关于s204-s206步骤的详细解释，在上述实施例中已经做了详细说明，本实施例中不再进行再次阐述。

其中还可以包括以下步骤：

获取用户从检索界面选取的目标音乐的标识；根据目标音乐的标识，确定目标音乐；将目标音乐作为目标对象的背景音乐。使得清楚地表达出目标音乐选取到应用的整个过程。

图3是本发明实施例提供的音乐检索装置的一种结构示意图。

如图3所示，本实施例的一种音乐检索装置，包括：

接收模块10，用于接收目标音乐的检索信息；检索信息包括音乐主题和音乐时长；

筛选模块20，用于基于构建的高潮音乐数据库，筛选与音乐主题和音乐时长相匹配的候选音乐；

显示模块30，用于将候选音乐按照预设规则显示于目标用户的检索界面，以便目标用户从候选音乐中选择目标音乐作为目标对象的背景音乐。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本实施例的一种音乐检索装置，通过接收模块接收目标音乐的检索信息；检索信息包括音乐主题和音乐时长，然后利用筛选模块基于构建的高潮音乐数据库，筛选与音乐主题和音乐时长相匹配的候选音乐，再通过筛选模块将候选音乐按照预设规则显示于目标用户的检索界面，以便目标用户从候选音乐中选择目标音乐，实现了用户通过音乐主题和音乐时长的方式对音乐进行检索，直接得到想要的与主题和时长的相匹配的目标音乐，然后直接将其应用到所需的ppt或宣传片等文件中，省去了用户再去裁剪音乐的繁琐操作，既节约了时间，又提高了工作的效率。

图4是本发明实施例提供的音乐检索装置的另一种结构示意图。

本实施例的音乐检索装置在图3所示实施例的基础上，进一步更加详细的对本发明的技术方案进行描述。如图4所示，本实施例的音乐检索装置还可以可以包括：

采集模块40，用于采集曲库中每首音乐的全部数据帧对应的完整音频文件，完整音频文件包括完整音强数据和/或完整歌词数据；

处理模块50，用于对完整音强数据和/或完整歌词数据进行处理，得到每首音乐的高潮部分和高潮部分对应的时长；

构建模块60，用于基于高潮部分和高潮部分对应的时长构建高潮音乐数据库。

进一步，在上述实施例的基础上，本实施例中的处理模块50具体用于：

获取与完整音强数据对应的全部音强峰值；

从全部音强峰值选取最大音强峰值；

识别最大音强峰值两端的首端音强峰值和末端音强峰值；

比较最大音强峰值与首端音强峰值的差值，得到首端差值；

比较最大音强峰值与末端音强峰值的差值，得到末端差值；

若首端差值大于首端预设阈值，则首端音强峰值对应的时间点为音乐高潮部分的起始点；

若末端差值大于末端预设阈值，则末端音强峰值对应的时间点为音乐高潮部分的结束点；

确定起始点与结束点之间的时间差值作为高潮部分对应的时长。

进一步，在上述实施例的基础上，本实施例中的处理模块50具体用于：

识别完整歌词数据中每句歌词的重复率；

比较重复率与预设重复率阈值；

若重复率大于预设重复率阈值，则重复率对应的歌词为音乐的高潮部分；

歌词开始对应的时间点为高潮部分的起始点，歌词结束对应的时间点为高潮部分的结束点；

确定起始点与结束点之间的时间差值作为高潮部分对应的时长。

进一步地，在上述实施例的基础上，本实施例的显示模块30具体用于：

将候选音乐按照与音乐主题的相似程度由高到低的顺序显示于目标用户的检索界面，和/或，

将候选音乐与按照与音乐时长的差值由小到大的顺序显示于目标用户的检索界面。

关于上述装置实施例中的相关描述，在对应的方法的实施例中已经进行了详细介绍说明，在装置中不再进行详细阐述。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄瑞阳
技术所有人：黄瑞阳
我是此专利的发明人

上一篇：一种硬质合金棒材的生产工艺的制作方法
上一篇：一种地表水取水井的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。