构建乐谱库的方法和装置与流程

文档序号：11155559阅读：517来源：国知局

本发明涉及网络通信技术领域，特别涉及一种构建乐谱库的方法和装置。

背景技术：

随着网络通信技术的发展，多媒体服务器的功能越来越强大；多媒体服务器向终端从发送歌曲时，不仅可以向终端发送歌曲，还能够向终端发送歌曲的乐谱，以使终端在播放歌曲的同时，在当前播放界面上显示歌曲的乐谱。因此，多媒体服务器向终端发送歌曲的乐谱之前，需要构建乐谱库。

目前，多媒体服务器在构建乐谱库时，多媒体服务器先获取提供乐谱的目标网站的网址，根据该目标网站的网址，从目标网站中爬取包含乐谱的图像。该图像中往往包含该乐谱的歌曲的名称；然后人工从该图像中识别出该乐谱的歌曲的名称。多媒体服务器将该歌曲的名称和包含该乐谱的图像对应关系添加到乐谱库中。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

由于目标网站中包含乐谱的图像往往为用户上传的，该图像中可能包含错误的乐谱，从而导致多媒体服务器构建乐谱库中包含错误的乐谱，也即上述方法构建乐谱库的准确性差。

技术实现要素：

为了解决现有技术的问题，本发明提供了一种构建乐谱库的方法和装置。技术方案如下：

第一方面，本发明实施例提供了一种构建乐谱库的方法，所述方法包括：

从目标网站中爬取乐谱，以及，从所述目标网站中爬取所述乐谱对应的多媒体文件的标识；

根据所述多媒体文件的标识，获取所述多媒体文件；

根据所述乐谱和所述多媒体文件，验证所述乐谱与所述多媒体文件是否匹配；

如果所述乐谱与所述多媒体文件匹配，将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。

可选的，所述根据所述乐谱和所述多媒体文件，验证所述乐谱与所述多媒体文件是否匹配，包括：

根据所述乐谱和所述多媒体文件，通过预设相似度算法，确定所述乐谱和所述多媒体文件之间的相似度；

如果所述相似度超过预设阈值，确定所述乐谱与所述多媒体文件匹配。

可选的，所述根据所述乐谱和所述多媒体文件，通过预设相似度算法，确定所述乐谱和所述多媒体文件之间的相似度之前，所述方法还包括：

获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件，以及，所述每个样本乐谱和每个多媒体文件之间的相似度；

根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件，以及，所述每个样本乐谱和每个多媒体文件之间的相似度，通过迭代算法，对所述预设相似度算法进行优化。

可选的，所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之前，所述方法还包括：

将指定标注信息添加到所述乐谱中，所述指定标注信息用于标注多媒体服务器。

可选的，所述将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中之后，所述方法还包括：

接收终端发送的反馈信息，所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符；

根据所述音符标识，将所述乐谱中待校正的音符修改为所述校正后的音符。

可选的，所述根据所述音符标识，将所述乐谱中待校正的音符修改为所述校正后的音符之前，所述方法还包括：

统计接收所述反馈信息的接收次数；

如果所述接收次数超过预设次数，执行所述根据所述音符标识，将所述乐谱中待校正的音符修改为所述校正后的音符的步骤。

可选的，所述从目标网站中爬取乐谱，包括：

获取所述目标网站的标识，根据所述目标网站的标识，获取所述目标网站中乐谱所在的位置信息；

根据所述目标网站的标识和所述位置信息，在所述目标网站中确定所述位置信息对应的爬取区域；

从所述爬取区域中爬取所述乐谱。

可选的，所述从所述爬取区域中爬取所述乐谱，包括：

从所述爬取区域中爬取包含所述乐谱的图像；

从所述图像中识别出所述乐谱的音符序列和节拍标识，将所述音符序列和所述节拍标识组成所述乐谱。

可选的，所述从所述目标网站中爬取所述乐谱对应的多媒体文件的标识，包括：

从所述目标网站中爬取文字信息，从所述文字信息中提取所述乐谱对应的多媒体文件的标识。

可选的，如果从所述目标网站中没有爬取到所述多媒体文件的标识，所述方法还包括：

根据所述乐谱，从多媒体文件库中选择与所述乐谱匹配的多媒体文件；

将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。

可选的，所述根据所述乐谱，从多媒体文件库中选择与所述乐谱匹配的多媒体文件，包括：

获取所述多媒体文件库中的每个多媒体文件；

根据所述乐谱和所述每个多媒体文件，通过预设相似度算法，确定所述乐谱与所述每个多媒体文件之间的相似度；

根据所述乐谱与所述每个多媒体文件之间的相似度，从所述多媒体文件库中选择相似度满足预设条件的多媒体文件；

将选择的多媒体文件确定为与所述乐谱匹配的多媒体文件。

第二方面，本发明实施例提供了一种构建乐谱库的装置，所述装置包括：

第一爬取模块，用于从目标网站中爬取乐谱；

第二爬取模块，用于从所述目标网站中爬取所述乐谱对应的多媒体文件的标识。

第一获取模块，用于根据所述多媒体文件的标识，获取所述多媒体文件。

验证模块，用于根据所述乐谱和所述多媒体文件，验证所述乐谱与所述多媒体文件是否匹配。

第一添加模块，用于如果所述乐谱与所述多媒体文件匹配，将所述乐谱和所述多媒体文件的标识的对应关系添加到乐谱库中。

可选的，所述验证模块，包括：

第一确定单元，用于根据所述乐谱和所述多媒体文件，通过预设相似度算法，确定所述乐谱和所述多媒体文件之间的相似度；

第二确定单元，用于如果所述相似度超过预设阈值，确定所述乐谱与所述多媒体文件匹配。

可选的，所述装置还包括：

第二获取模块，用于获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件，以及，所述每个样本乐谱和每个多媒体文件之间的相似度；

优化模块，用于根据所述每个样本乐谱、所述每个样本乐谱对应的多媒体文件，以及，所述每个样本乐谱和每个多媒体文件之间的相似度，通过迭代算法，对所述预设相似度算法进行优化。

可选的，所述装置还包括：

第二添加模块，用于将指定标注信息添加到所述乐谱中，所述指定标注信息用于标注多媒体服务器。

可选的，所述装置还包括：

接收模块，用于接收终端发送的反馈信息，所述反馈信息中包括所述乐谱中待校正的音符标识和校正后的音符；

修改模块，用于根据所述音符标识，将所述乐谱中待校正的音符修改为所述校正后的音符。

可选的，所述装置还包括：

统计模块，用于统计接收所述反馈信息的接收次数；

所述修改模块，还用于如果所述接收次数超过预设次数，执行所述根据所述音符标识，将所述乐谱中待校正的音符修改为所述校正后的音符。

可选的，所述第一爬取模块，包括：

第一获取单元，用于获取所述目标网站的标识，根据所述目标网站的标识，获取所述目标网站中乐谱所在的位置信息；

第三确定单元，用于根据所述目标网站的标识和所述位置信息，在所述目标网站中确定所述位置信息对应的爬取区域；

爬取单元，用于从所述爬取区域中爬取所述乐谱。

可选的，所述爬取单元，还用于从所述爬取区域中爬取包含所述乐谱的图像；从所述图像中识别出所述乐谱的音符序列和节拍标识，将所述音符序列和所述节拍标识组成所述乐谱。

可选的，所述第二爬取模块，还用于从所述目标网站中爬取文字信息，从所述文字信息中提取所述乐谱对应的多媒体文件的标识。

可选的，如果从所述目标网站中没有爬取到所述多媒体文件的标识，所述装置还包括：

选择模块，用于根据所述乐谱，从多媒体文件库中选择与所述乐谱匹配的多媒体文件；

第三添加模块，用于将所述乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。

可选的，所述选择模块，包括：

第二获取单元，用于获取所述多媒体文件库中的每个多媒体文件；

第四确定单元，用于根据所述乐谱和所述每个多媒体文件，通过预设相似度算法，确定所述乐谱与所述每个多媒体文件之间的相似度；

选择单元，用于根据所述乐谱与所述每个多媒体文件之间的相似度，从所述多媒体文件库中选择相似度满足预设条件的多媒体文件；

第五确定单元，用于将选择的多媒体文件确定为与所述乐谱匹配的多媒体文件。

本发明实施例中，多媒体服务器从目标网站中爬取乐谱和该乐谱对应的多媒体文件的标识，获取该乐谱对应的多媒体文件，并通过验证该乐谱与该多媒体文件是否匹配，如果该乐谱与该多媒体文件匹配，才将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中，使得多媒体服务器构建的乐谱库中每个乐谱均与该乐谱对应的多媒体文件匹配，提高了多媒体服务器构建乐谱库的准确性。

附图说明

图1是本发明实施例提供的一种构建乐谱库的方法流程图；

图2是本发明实施例提供的一种构建乐谱库的方法流程图；

图3是本发明实施例提供的一种构建乐谱库的装置结构示意图；

图4是本发明实施例提供的一种构建乐谱库的装置结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种构建乐谱库的方法，该方法的执行主体可以为多媒体服务器，该多媒体服务器可以为音频服务器或者视频服务器等，参见图1，该方法包括：

步骤101：从目标网站中爬取乐谱，以及，从目标网站中爬取该乐谱对应的多媒体文件的标识。

步骤102：根据多媒体文件的标识，获取该多媒体文件。

步骤103：根据该乐谱和该多媒体文件，验证该乐谱与该多媒体文件是否匹配。

步骤104：如果该乐谱与该多媒体文件匹配，将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中。

可选的，根据该乐谱和该多媒体文件，验证该乐谱与该多媒体文件是否匹配，包括：

根据该乐谱和该多媒体文件，通过预设相似度算法，确定该乐谱和该多媒体文件之间的相似度；

如果该相似度超过预设阈值，确定该乐谱与该多媒体文件匹配。

可选的，根据该乐谱和该多媒体文件，通过预设相似度算法，确定该乐谱和该多媒体文件之间的相似度之前，该方法还包括：

获取预设数目的样本乐谱、每个样本乐谱对应的多媒体文件，以及，每个样本乐谱和每个多媒体文件之间的相似度；

根据每个样本乐谱、每个样本乐谱对应的多媒体文件，以及，每个样本乐谱和每个多媒体文件之间的相似度，通过迭代算法，对该预设相似度算法进行优化。

可选的，将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中之前，该方法还包括：

将指定标注信息添加到该乐谱中，该指定标注信息用于标注多媒体服务器。

可选的，将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中之后，该方法还包括：

接收终端发送的反馈信息，该反馈信息中包括该乐谱中待校正的音符标识和校正后的音符；

根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符。

可选的，根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符之前，该方法还包括：

统计接收该反馈信息的接收次数；

如果该接收次数超过预设次数，执行根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符的步骤。

可选的，从目标网站中爬取乐谱，包括：

获取目标网站的标识，根据目标网站的标识，获取该目标网站中乐谱所在的位置信息；

根据该目标网站的标识和该位置信息，在该目标网站中确定该位置信息对应的爬取区域；

从该爬取区域中爬取乐谱。

可选的，从该爬取区域中爬取乐谱，包括：

从该爬取区域中爬取包含该乐谱的图像；

从该图像中识别出该乐谱的音符序列和节拍标识，将该音符序列和该节拍标识组成该乐谱。

可选的，从目标网站中爬取该乐谱对应的多媒体文件的标识，包括：

从目标网站中的指定区域爬取文字信息，从该文字信息中提取该乐谱对应的多媒体文件的标识。

可选的，如果从目标网站中没有爬取到该多媒体文件的标识，该方法还包括：

根据该乐谱，从多媒体文件库中选择与该乐谱匹配的多媒体文件；

将该乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。

可选的，根据该乐谱，从多媒体文件库中选择与该乐谱匹配的多媒体文件，包括：

获取多媒体文件库中的每个多媒体文件的多媒体文件；

根据该乐谱和该每个多媒体文件的多媒体文件，通过预设相似度算法，确定该乐谱与该每个多媒体文件之间的相似度；

根据该乐谱与该每个多媒体文件之间的相似度，从该多媒体文件库中选择相似度满足预设条件的多媒体文件；

将选择的多媒体文件确定为与该乐谱匹配的多媒体文件。

本发明实施例提供了一种构建乐谱库的方法，该方法的执行主体可以为多媒体服务器，参见图2，该方法包括：

步骤201：多媒体服务器从目标网站中爬取乐谱，以及，从目标网站中爬取该乐谱对应的多媒体文件的标识。

本步骤可以通过以下步骤2011-2014实现，包括：

步骤2011：多媒体服务器获取目标网站的标识，根据目标网站的标识，获取该目标网站中乐谱所在的位置信息。

多媒体服务器中事先存储一个网站标识列表，该网站标识列表中包括至少一个网站的标识；在本步骤中，多媒体服务器从该网站标识列表中获取一个网站的标识作为目标网站的标识。需要说明的是，如果该网站标识列表中包括多个网站的标识时，多媒体服务器也可以从该网站标识列表中获取多个网站的标识，将每个网站的标识都作为目标网站的标识。

本步骤中，该目标网站中有至少一个乐谱，多媒体服务器预先存储了该目标网站中该至少一个乐谱所在的位置信息和该目标网站的标识的对应关系，因此，多媒体服务器根据目标网站的标识，获取该目标网站中乐谱所在的位置信息的步骤可以为：

多媒体服务器根据该目标网站的标识，从目标网站的标识和该至少一个乐谱所在的位置信息的对应关系中，确定该目标网站中至少一个乐谱所在的位置信息。

其中，该目标网站的标识可以为该目标网站的地址。该乐谱所在的位置信息可以为乐谱在该目标网站的网页中的具体字段位置。

本发明实施例中，多媒体服务器可以将乐谱所在的位置信息存储到位置信息列表中。多媒体服务器定期更新该网站标识列表和该位置信息列表。

步骤2012：多媒体服务器根据该目标网站的标识和该位置信息，在该目标网站中确定该位置信息对应的爬取区域。

多媒体服务器根据该目标网站的标识，确定该目标网站；根据该位置信息，在该目标网站中确定该位置信息对应的爬取区域。

步骤2013：多媒体服务器从该爬取区域中爬取乐谱。

本发明实施例中，多媒体服务器从该爬取区域中爬取的是一张包含该乐谱的图像，多媒体服务器并不能直接读取出该图像中的乐谱包含的音符序列和节拍标识，多媒体服务器还需要对该图像做进一步的处理，才能得到该多媒体服务器能够读取并识别的乐谱，因此，本步骤可以为：多媒体服务器从该爬取区域中爬取包含该乐谱的图像；多媒体服务器从该图像中识别出该乐谱的音符序列和节拍标识，将该音符序列和该节拍标识组成该乐谱。

本步骤中，多媒体服务器从该爬取区域爬取到包含该乐谱的图像后，多媒体服务器可以通过预设的识别算法，识别出该乐谱中每个音符在该图像中的位置，以及该乐谱的节拍标识，根据该乐谱中每个音符在该图像中的位置，将该乐谱包括的多个音符的组合为音符序列，并将该音符序列和该节拍标识组成乐谱。

其中，该音符序列和该节拍标识组成的乐谱可以为电子乐谱，多媒体服务器存储了该电子乐谱中音符序列的声学特征，例如该音符序列对应的音高、旋律等；该预设的识别算法可以根据用户需要设置并更改，本发明实施例对此不做具体限定。例如，该预设的识别算法可以为基于OCR(Optical Character Recognition，光学字符识别)与音符频谱自动识别算法。

步骤2014：多媒体服务器从目标网站中爬取该乐谱对应的多媒体文件的标识。

本发明实施例中，目标网站中还可以包含文字信息，该文字信息中存储了该乐谱对应的多媒体文件的标识，多媒体服务器还可以从该目标网站爬取该文字信息，进而获取该乐谱对应的多媒体的标识。相应的，本步骤可以为：

多媒体服务器从目标网站中指定区域爬取文字信息，从该文字信息中提取该乐谱对应的多媒体文件的标识。

本步骤中，该指定区域可以为该目标网站中该乐谱所在的位置信息的周围区域，例如，该指定区域为该乐谱所在的网页地址中该乐谱所在的当前字段的前一行字段或者后一行字段等。

该多媒体服务器预先存储了该目标网站的指定区域的标识，多媒体服务器获取该指定区域的标识，根据该指定区域的标识，从该指定区域的标识对应的目标网站的指定区域中，获取该文字信息。

其中，该指定区域的标识可以根据用户需要设置并更改，本发明实施例对此不作具体限定，例如，该指定区域的标识可以为该目标网站的地址和该指定区域在网页中的字段。

步骤202：多媒体服务器根据多媒体文件的标识，获取该多媒体文件。

本发明实施例中，多媒体服务器中存储了多个多媒体文件的标识和多媒体文件的对应关系，多媒体服务器根据爬取到的多媒体文件的标识，从多媒体文件的标识和多媒体文件的对应关系中，确定出该多媒体文件的标识对应的多媒体文件。

其中，该多媒体文件的标识可以根据用户需要设置并更改，本发明实施例对此不作具体限定。例如，该多媒体文件的标识可以为该多媒体文件对应的歌曲名称。

本发明实施例提供的一种可能的设计中，如果多媒体服务器从目标网站中没有爬取到该多媒体文件的标识，多媒体服务器无法根据多媒体文件的标识，获取该多媒体文件，对应的，多媒体服务器获取多媒体服务器中存储的多媒体文件库，从该多媒体文件库中获取多个多媒体文件。

步骤203：多媒体服务器根据该乐谱和该多媒体文件，验证该乐谱与该多媒体文件是否匹配。

本步骤中，多媒体服务器获取乐谱和该乐谱对应的多媒体文件之后，为了提高构建的乐谱库中每一个多媒体文件对应的乐谱的准确性，多媒体服务器还可以验证该乐谱与该多媒体文件是否匹配，其中，多媒体服务器可以通过预设相似度算法，计算该乐谱和该多媒体文件之间的相似度，进而验证该乐谱与该多媒体文件是否匹配，具体的，本步骤可以通过以下步骤2031-2032实现。

步骤2031：多媒体服务器根据该乐谱和该多媒体文件，通过预设相似度算法，确定该乐谱和该多媒体文件之间的相似度。

本发明实施例中，该预设相似度算法可以根据用户需要设置并更改，本发明实施例对此不作具体限定，例如，该预设相似度算法可以为基于色度特征和动态时间的卷曲算法。

其中，多媒体服务器根据该预设相似度算法，计算该乐谱和该多媒体文件之间的相似度之前，为了提高根据该预设相似度算法计算出的相似度的准确性，多媒体服务器还可以先对该预设相似度算法进行优化，具体的，多媒体服务器对该预设相似度算法进行优化的步骤可以为：多媒体服务器获取预设数目的样本乐谱、每个样本乐谱对应的多媒体文件，以及，每个样本乐谱和每个多媒体文件之间的相似度；多媒体服务器根据每个样本乐谱、每个样本乐谱对应的多媒体文件，以及，每个样本乐谱和每个多媒体文件之间的相似度，通过迭代算法，对该预设相似度算法进行优化。

需要说明的是，多媒体服务器预先存储了该多个样本乐谱和每个样本乐谱对应的多媒体文件之间的相似度，多媒体服务器对该预设相似度算法进行优化时，多媒体服务器从该多个样本乐谱中，获取预设数目个样本乐谱，并获取每个样本乐谱对应多媒体文件，多媒体服务器通过迭代算法，将该多个样本乐谱和每个样本乐谱对应的多媒体文件代入到该预设相似度算法中，计算该样本乐谱和该多媒体文件之间的相似度，根据该相似度和多媒体服务器中存储的该样本乐谱和该多媒体文件之间的相似度，对该预设相似度算法进行优化。

其中，多媒体服务器根据该相似度和多媒体服务器中存储的该样本乐谱和该多媒体文件之间的相似度，对该预设相似度算法进行优化的步骤可以为：

多媒体服务器获取多媒体服务器中存储的该样本乐谱和该多媒体文件之间的相似度，将该相似度与多媒体服务器中存储的相似度进行比对，根据该相似度和该多媒体服务器中存储的相似度，调整该预设相似度算法的参数，确定出使得该相似度和该多媒体服务器存储的相似度最接近时的参数，并将该参数写入该预设相似度算法中，进而对该预设相似度算法进行优化。

然后，多媒体服务器根据该乐谱和该多媒体文件，通过优化后的预设相似度算法，确定该乐谱和该多媒体文件之间的相似度。

其中，多媒体服务器计算该乐谱和该多媒体文件的相似度时，多媒体服务器通过该多媒体文件的音频信号，根据该乐谱和该音频信号，确定该乐谱和该多媒体文件之间的相似度，因此，本步骤可以为：

多媒体服务器提取该多媒体文件中包括的音频信号，根据该音频信号和该乐谱，将该乐谱和该音频信号代入该优化后的预设相似度算法，计算该乐谱和该音频信号之间的相似度，进而确定出该乐谱和该多媒体文件之间的相似度。

步骤2032：如果该相似度超过预设阈值，多媒体服务器确定该乐谱与该多媒体文件匹配。

本步骤中，多媒体服务器根据该乐谱和该多媒体文件之间的相似度，确定该乐谱和该多媒体文件是否匹配：如果该相似度超过预设阈值，多媒体服务器确定该乐谱与该多媒体文件匹配；如果该相似度不超过预设阈值，多媒体服务器确定该乐谱与该多媒体文件不匹配。

其中，该预设阈值可以根据用户需要设置并更改，本发明实施例对此不做具体限定，例如，该预设阈值可以90％、95％等。

如果该乐谱与该多媒体文件匹配，执行步骤204；如果该乐谱和该多媒体文件不匹配，丢弃该乐谱。

步骤204：如果该乐谱与该多媒体文件匹配，多媒体服务器将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中。

本步骤中，如果该乐谱与该多媒体文件匹配，多媒体服务器将该乐谱和该多媒体文件的标识的对应关系添加到乐谱中之前，多媒体服务器还可以在该乐谱中添加多媒体服务器的版权归属标识，具体过程可以为：多媒体服务器将指定标注信息添加到该乐谱中，该指定标注信息用于标注该多媒体服务器。

本步骤中，该指定标注信息可以根据用户需要设置并更改，本发明实施例对此不做具体限定，例如，该指定标注信息可以为该多媒体服务器的地址或者该多媒体服务器的名称等。

然后，多媒体服务器再将该添加指定标注信息后的乐谱和该多媒体文件的标识的对应关系添加到该乐谱库中。

这样，多媒体服务器根据每个多媒体文件对应的乐谱，构建该多媒体文件库对应的乐谱库。

本发明实施例提供的一种可能的设计中，如果多媒体服务器从目标网站中没有爬取到该多媒体文件的标识，多媒体服务器获取多媒体服务器中存储的多媒体文件库，从该多媒体文件库中获取多个多媒体文件，进而从该多个多媒体文件中选择与该乐谱匹配的多媒体文件，具体过程可以为：

多媒体服务器获取多媒体文件库中的每个多媒体文件；多媒体服务器根据该乐谱和该每个多媒体文件，通过预设相似度算法，确定该乐谱与该每个多媒体文件之间的相似度；多媒体服务器根据该乐谱与该每个多媒体文件之间的相似度，从该多媒体文件库中选择相似度满足预设条件的多媒体文件；多媒体服务器将选择的多媒体文件确定为与该乐谱匹配的多媒体文件。

进而，多媒体服务器将该乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。

本步骤中，多媒体服务器确定该乐谱与该每个多媒体文件之间的相似度的实现方式同步骤203的实现方式一致，此处不再一一赘述。

其中，该预设条件可以根据用户需要设置并更改，本发明实施例对此不做具体限定。例如，该预设条件可以为相似度最高且达到预设阈值。

本发明实施例提供的一种可能的设计中，多媒体服务器将该乐谱录入到该乐谱库中之后，多媒体服务器可以通过以下步骤205，根据终端发送的反馈信息，对该乐谱进行进一步的优化。

步骤205：多媒体服务器接收终端发送的反馈信息，该反馈信息中包括该乐谱中待校正的音符标识和校正后的音符；多媒体服务器根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符。

本发明实施例中，多媒体服务器可以向终端提供终端一个反馈入口，终端向用户显示乐谱时，终端在当前界面提供反馈按钮，用户查看该乐谱时，如果发现该乐谱中存在待校正的音符，可以触发该反馈按钮，在弹出的反馈输入框输入反馈信息，当终端检测到用户在反馈输入框中输入的反馈信息时，终端获取该反馈信息，并通过该反馈入口，向多媒体服务器发送该反馈信息。

其中，该反馈信息中至少包括乐谱中待校正的音符标识，以及校正后的音符，便于多媒体服务器根据该待校正的音符标识，将乐谱中待校正的音符修改为校正后的音符。

本步骤中，多媒体服务器根据该待校正的音符标识，将乐谱中待校正的音符修改为校正后的音符的步骤之前，为了提高校正的准确性，对于每个乐谱，当多媒体服务器接收反馈信息的接收次数超过预设次数时，多媒体服务器才对该乐谱进行校正，因此，

本步骤可以为：多媒体服务器统计接收该反馈信息的接收次数；如果该接收次数超过预设次数，多媒体服务器执行根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符的步骤。

其中，该预设次数可以根据用户需要设置并更改，本发明实施例对此不做具体限定，例如，该预设次数可以10次、35次等。

本发明实施例提供的一种可能设计中，该反馈信息中除包括乐谱中待校正的音符标识，以及校正后的音符以外，该反馈信息还可以包括用户对该乐谱的评论信息，例如，该评论信息可以为用户对该乐谱的点赞评论或者用户输入的文字评论等。多媒体服务器还可以根据用户的评论信息，对该乐谱进行进一步的校正。

本发明实施例提供了一种构建乐谱库的装置，该装置可应用在多媒体服务器上，参见图3，该装置包括第一爬取模块301，第二爬取模块302，第一获取模块303，验证模块304和第一添加模块305。

该第一爬取模块301，用于从目标网站中爬取乐谱；

该第二爬取模块302，用于从该目标网站中爬取该乐谱对应的多媒体文件的标识；

该第一获取模块303，用于根据该多媒体文件的标识，获取该多媒体文件；

该验证模块304，用于根据该乐谱和该多媒体文件，验证该乐谱与该多媒体文件是否匹配；

该第一添加模块305，用于如果该乐谱与该多媒体文件匹配，将该乐谱和该多媒体文件的标识的对应关系添加到乐谱库中。

可选的，该验证模块304，包括：

第一确定单元，用于根据该乐谱和该多媒体文件，通过预设相似度算法，确定该乐谱和该多媒体文件之间的相似度；

第二确定单元，用于如果该相似度超过预设阈值，确定该乐谱与该多媒体文件匹配。

可选的，该装置还包括：

第二获取模块，用于获取预设数目个样本乐谱、每个样本乐谱对应的多媒体文件，以及，该每个样本乐谱和每个多媒体文件之间的相似度；

优化模块，用于根据该每个样本乐谱、该每个样本乐谱对应的多媒体文件，以及，该每个样本乐谱和每个多媒体文件之间的相似度，通过迭代算法，对该预设相似度算法进行优化。

可选的，该装置还包括：

第二添加模块，用于将指定标注信息添加到所述乐谱中，该指定标注信息用于标注多媒体服务器。

可选的，该装置还包括：

接收模块，用于接收终端发送的反馈信息，该反馈信息中包括该乐谱中待校正的音符标识和校正后的音符；

修改模块，用于根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符。

可选的，该装置还包括：

统计模块，用于统计接收该反馈信息的接收次数；

该修改模块，还用于如果该接收次数超过预设次数，执行该根据该音符标识，将该乐谱中待校正的音符修改为该校正后的音符。

可选的，该第一爬取模块301，包括：

第一获取单元，用于获取该目标网站的标识，根据该目标网站的标识，获取该目标网站中乐谱所在的位置信息；

第三确定单元，用于根据该目标网站的标识和该位置信息，在该目标网站中确定该位置信息对应的爬取区域；

爬取单元，用于从该爬取区域中爬取该乐谱。

可选的，该爬取单元，还用于从该爬取区域中爬取包含该乐谱的图像；从该图像中识别出该乐谱的音符序列和节拍标识，将该音符序列和该节拍标识组成该乐谱。

可选的，该第二爬取模块302，还用于从该目标网站中爬取文字信息，从该文字信息中提取该乐谱对应的多媒体文件的标识。

可选的，如果从该目标网站中没有爬取到该多媒体文件的标识，该装置还包括：

选择模块，用于根据该乐谱，从多媒体文件库中选择与该乐谱匹配的多媒体文件；

第三添加模块，用于将该乐谱和选择的多媒体文件的标识的对应关系添加到乐谱库中。

可选的，该选择模块，包括：

第二获取单元，用于获取该多媒体文件库中的每个多媒体文件；

第四确定单元，用于根据该乐谱和该每个多媒体文件，通过预设相似度算法，确定该乐谱与该每个多媒体文件之间的相似度；

选择单元，用于根据该乐谱与该每个多媒体文件之间的相似度，从该多媒体文件库中选择相似度满足预设条件的多媒体文件；

第五确定单元，用于将选择的多媒体文件确定为与该乐谱匹配的多媒体文件。

需要说明的是：上述实施例提供的构建乐谱库装置在构建乐谱库时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的构建乐谱库的装置与构建乐谱库的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图4是本发明实施例提供的一种多媒体服务器的结构示意图；该多媒体服务器400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)422(例如，一个或一个以上处理器)和存储器432，一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中，存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对多媒体服务器中的一系列指令操作。更进一步地，中央处理器422可以设置为与存储介质430通信，在异常注入系统400上执行存储介质430中的一系列指令操作。

异常注入系统400还可以包括一个或一个以上电源426，一个或一个以上有线或无线网络接口450，一个或一个以上输入输出接口454，一个或一个以上键盘456，和/或，一个或一个以上操作系统441，例如Windows Server^TM，Mac OS X^TM，Unix^TM,Linux^TM，FreeBSD^TM等等。

该多媒体服务器400可以用于执行上述实施例提供的构建乐谱库的方法中多媒体服务器所执行的步骤。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘卓;
技术所有人：广州酷狗计算机科技有限公司;
我是此专利的发明人

上一篇：获取数据信息的方法及装置与制造工艺
上一篇：基于Ajax的新闻网页动态数据的抓取方法及系统与制造工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。