获取多媒体文件的方法和装置与流程

文档序号：12666666阅读：146来源：国知局

本发明涉及网络通信
技术领域：
：，特别涉及一种获取多媒体文件的方法和装置。
背景技术：
：：目前，大部分终端都支持音乐软件，并且大部分音乐软件都具有听歌识曲的功能；在用户不知道歌名时，用户可以对着终端哼出想要搜索的歌曲的旋律，终端通过听歌识曲的功能，从多媒体服务器中搜索出该旋律对应的歌曲。终端从多媒体服务器中搜索该旋律对应的歌曲时，终端采集用户输入的语音信号，向多媒体服务器发送该语音信号；多媒体服务器接收终端发送的该语音信号，提取该语音信号的旋律，计算该语音信号的旋律与歌曲库中每个歌曲的旋律之间的匹配度，根据该语音信号的旋律与每个歌曲的旋律之间的匹配度，从歌曲库中选择匹配度最高的歌曲，向终端发送该选择的歌曲。在实现本发明的过程中，发明人发现现有技术至少存在以下问题：由于歌曲库中包括的歌曲数量非常多，多媒体服务器计算该语音信号的旋律与该歌曲库中每个歌曲的旋律之间的匹配度比较耗时，从而导致终端获取歌曲的效率低。技术实现要素：为了解决现有技术的问题，本发明提供了一种获取多媒体文件的方法和装置。技术方案如下：第一方面，本发明实施例提供了一种获取多媒体文件的方法，所述方法包括：接收获取请求，所述获取请求至少携带属性信息和语音信号，所述属性信息用于标识多媒体文件的属性；根据所述属性信息，从第一多媒体文件库中选择与所述属性信息匹配的多媒体文件组成第二多媒体文件库，所述第一多媒体文件库用于存储所述多媒体服务器中的所有多媒体文件；根据所述语音信号，从所述第二多媒体文件库中选择与所述语音信号匹配的目标多媒体文件。在一个可能的设计中，所述获取请求还携带关键词，所述根据所述属性信息，从第一多媒体文件库中选择与所述属性信息匹配的多媒体文件组成第二多媒体文件库，包括：根据所述属性信息和所述关键词，从所述第一多媒体文件库中选择与所述属性信息匹配，且与所述关键词匹配的多媒体文件组成第二多媒体文件库。在一个可能的设计中，所述根据所述语音信号，从所述第二多媒体文件库中选择与所述语音信号匹配的目标多媒体文件，包括：提取所述语音信号的参考旋律，计算所述参考旋律与所述第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度；根据所述参考旋律与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件集合中选择匹配度满足第一预设条件的目标多媒体文件。在一个可能的设计中，所述方法还包括：如果所述第二多媒体文件库中不存在与所述参考旋律之间的匹配度满足第一预设条件的多媒体文件，从所述参考旋律中提取预设数目个音节；计算所提取的音节与所述每个多媒体文件的旋律之间的匹配度；根据所提取的音节与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件库中选择匹配度满足第二预设条件的目标多媒体文件。在一个可能的设计中，所述方法还包括：如果所述第二多媒体文件库中不存在与所述语音信号匹配的目标多媒体文件，发送失败指示。第二方面，本发明实施例提供了一种获取多媒体文件的方法，所述方法包括：获取属性信息和语音信号，所述属性信息用于标识多媒体文件的属性；向多媒体服务器发送获取请求，所述获取请求至少携带所述属性信息和所述语音信号；接收所述多媒体服务器发送的目标多媒体文件。在一个可能的设计中，所述获取请求还携带关键词，所述向多媒体服务器发送获取请求之前，所述方法还包括：获取所述关键词，将所述关键词添加到所述获取请求中。在一个可能的设计中，所述获取所述关键词，包括：如果接收到所述多媒体服务器发送的失败指示，获取所述关键词。第三方面，本发明实施例提供了一种获取多媒体文件的装置，所述装置包括：第一接收模块，用于接收获取请求，所述获取请求至少携带属性信息和语音信号，所述属性信息用于标识多媒体文件的属性；第一选择模块，用于根据所述属性信息，从第一多媒体文件库中选择与所述属性信息匹配的多媒体文件组成第二多媒体文件库，所述第一多媒体文件库用于存储所述多媒体服务器中的所有多媒体文件；第二选择模块，用于根据所述语音信号，从所述第二多媒体文件库中选择与所述语音信号匹配的目标多媒体文件；在一个可能的设计中，所述获取请求还携带关键词，所述第一选择模块，还用于根据所述属性信息和所述关键词，从所述第一多媒体文件库中选择与所述属性信息匹配，且与所述关键词匹配的多媒体文件组成第二多媒体文件库。在一个可能的设计中，所述第二选择模块，包括：第一提取单元，用于提取所述语音信号的参考旋律；第一计算单元，用于计算所述参考旋律与所述第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度；第一选择单元，用于根据所述参考旋律与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件集合中选择匹配度满足第一预设条件的目标多媒体文件。在一个可能的设计中，所述第二选择模块，还包括：第二提取单元，用于如果所述第二多媒体文件库中不存在与所述参考旋律之间的匹配度满足第一预设条件的多媒体文件，从所述参考旋律中提取预设数目个音节；第二计算单元，用于计算所提取的音节与所述每个多媒体文件的旋律之间的匹配度；第二选择单元，用于根据所提取的音节与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件库中选择匹配度满足第二预设条件的目标多媒体文件。在一个可能的设计中，所述装置还包括：第一发送模块，用于如果所述第二多媒体文件库中不存在与所述语音信号匹配的目标多媒体文件，发送失败指示。第四方面，本发明实施例提供了一种获取多媒体文件的装置，所述装置包括：第一获取模块，用于获取属性信息和语音信号，所述属性信息用于标识多媒体文件的属性；第二发送模块，用于向多媒体服务器发送获取请求，所述获取请求至少携带所述属性信息和所述语音信号；第二接收模块，用于接收所述多媒体服务器发送的目标多媒体文件。在一个可能的设计中，所述装置还包括：第二获取模块，用于获取所述关键词；添加模块，用于将所述关键词添加到所述获取请求中。在一个可能的设计中，所述第二获取模块，还用于如果接收到所述多媒体服务器发送的失败指示，获取所述关键词。在本发明实施例中，终端向多媒体服务器发送的获取请求中携带属性信息和语音信号，多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。由于第二多媒体文件库中仅包括与该属性信息匹配的多媒体文件，也即第二多媒体文件库中包括的多媒体文件数量较少，因此，多媒体服务器从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，比较省时间，可以提高获取目标多媒体文件的效率。附图说明图1是本发明实施例提供的一种实施环境的示意图；图2是本发明实施例提供的一种获取多媒体文件的方法流程图；图3是本发明实施例提供的一种获取多媒体文件的方法流程图；图4是本发明实施例提供的一种获取多媒体文件的方法流程图；图5是本发明实施例提供的一种获取多媒体文件的装置结构示意图；图6是本发明实施例提供的一种获取多媒体文件的装置结构示意图；图7是本发明实施例提供的一种获取多媒体文件的装置结构示意图(终端的一般结构)；图8是本发明实施例提供的一种获取多媒体文件的装置结构示意图(多媒体服务器的一般结构)。具体实施方式为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。图1是本公开实施例提供的一种实施环境的示意图，参见图1，该实施环境包括：终端101和多媒体服务器102，终端101与多媒体服务器102之间通过通信网络连接。其中，终端101中运行多媒体服务器102关联的应用，可以基于用户标识登录该应用或者直接登录该应用，从而与该多媒体服务器102进行交互。该应用可以为音频应用或者视频应用等多种应用，该用户标识可以为用户账号、电话号码等，本发明实施例对此不做限定。终端101可以为手机终端、PAD(portableandroiddevice，平板电脑)终端或者电脑终端等。多媒体服务器102可以是一台多媒体服务器，或者由若干台多媒体服务器组成的多媒体服务器集群，或者是一个云计算多媒体服务器中心，本公开实施例对此不做限定；多媒体服务器102可以为视频服务器或者音频服务器。本发明实施例提供了一种获取多媒体文件的方法，该方法应用在多媒体服务器中，参见图2，该方法包括：步骤201：接收获取请求，该获取请求至少携带属性信息和语音信号，该属性信息用于标识多媒体文件的属性。步骤202：根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，第一多媒体文件库用于存储多媒体服务器中的所有多媒体文件。步骤203：根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。在一个可能的设计中，该获取请求还携带关键词，根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，包括：根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库。在一个可能的设计中，根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，包括：提取该语音信号的参考旋律，计算该参考旋律与第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度；根据该参考旋律与每个多媒体文件的旋律之间的匹配度，从第二多媒体文件集合中选择匹配度满足第一预设条件的目标多媒体文件。在一个可能的设计中，该方法还包括：如果第二多媒体文件库中不存在与该参考旋律之间的匹配度满足第一预设条件的多媒体文件，从该参考旋律中提取预设数目个音节；计算所提取的音节与每个多媒体文件的旋律之间的匹配度；根据所提取的音节与每个多媒体文件的旋律之间的匹配度，从第二多媒体文件库中选择匹配度满足第二预设条件的目标多媒体文件。在一个可能的设计中，该方法还包括：如果第二多媒体文件库中不存在与该语音信号匹配的目标多媒体文件，发送失败指示。本发明实施例提供了一种获取多媒体文件的方法，该方法应用在终端中，参见图3，该方法包括：步骤301：获取属性信息和语音信号，该属性信息用于标识多媒体文件的属性。步骤302：向多媒体服务器发送获取请求，该获取请求至少携带该属性信息和该语音信号。步骤303：接收多媒体服务器发送的目标多媒体文件。在一个可能的设计中，该获取请求还携带关键词，向多媒体服务器发送获取请求之前，该方法还包括：获取关键词，将该关键词添加到获取请求中。在一个可能的设计中，获取关键词，包括：如果接收到多媒体服务器发送的失败指示，获取关键词。终端上安装某应用，该应用可以为视频应用或者音频应用。该应用具有听歌识曲的功能；在用户不知道歌名时，用户可以对着终端哼出想要搜索的歌曲的旋律，并向终端输入该歌曲的属性信息；终端采集该旋律的语音信号，向多媒体服务器发送获取请求，该获取请求至少携带该属性信息和该语音信号；多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，向终端发送该目标多媒体文件。由于减少了第二多媒体文件库中包括的多媒体文件的数量，因此可以提高获取目标多媒体文件的效率。为了进一步减少第二多媒体文件库中包括的多媒体文件的数量，用户还可以向终端输入关键词，终端获取用户输入的关键词，将该关键词添加到该获取请求中，从而多媒体服务器根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库，由于进一步减少了第二多媒体文件库中包括的多媒体文件的数量，因此可以进一步提高获取目标多媒体文件的效率。需要说明的是，在本发明实施例中，也可以在终端首次向多媒体服务器发送获取请求时，该获取请求仅携带该属性信息和该语音信号；在多媒体服务器根据该属性信息和该语音信号，在第二多媒体文件库中匹配不出与该语音信号匹配的目标多媒体文件时，也即多媒体服务器识别失败时，终端才获取该关键词，将该关键词添加到该获取请求中。从而多媒体服务器根据该属性信息、该关键词和该语音信号，在第二多媒体文件库中匹配于该语音信号匹配的目标多媒体文件，从而可以提高获取目标多媒体文件的成功率和准确率。参见图4，该方法的处理流程可以包括如下的步骤：步骤401：终端获取属性信息和语音信号，向多媒体服务器发送获取请求，该获取请求至少携带该属性信息和该语音信号，该属性信息用于标识多媒体文件的属性。终端的当前界面中包括听歌识曲的识别按钮，当用户搜索多媒体文件时，用户可以点击该识别按钮；当终端检测到该识别按钮被触发时，显示识别界面，该识别界面中包括属性信息输入框，用户可以在该属性信息输入框中输入待搜索的多媒体文件的属性信息，并对着终端哼出待搜索的多媒体文件的旋律或者将终端移动到其他设备附近，该其他设备当前正在播放该多媒体文件。终端获取用户输入的属性信息，并采集用户输入的或者其他设备播放的语音信号，向多媒体服务器发送获取请求，该获取请求携带该属性信息和该语音信号。属性信息包括性别和/或语种；例如，当多媒体文件为歌曲时，属性信息可以为该歌曲的演唱者的性别和/或该歌曲的语种。演唱者的性别可以为男性或者女性；该歌曲的语种可以为中文或者英文等。则该识别界面中包括性别输入框和语种输入框；用户可以在性别输入框中输入或者选择性别，和/或，在语种输入框中输入或者选择语种；终端获取用户输入或者选择的性别，和/或，获取用户输入或者选择的语种，将该性别和/或语种组成属性信息。为了进一步提高获取多媒体文件的准确性，该识别界面中还可以包括关键词输入框，用户可以在该关键词输入框中输入多媒体文件的关键词；例如，当多媒体文件为歌曲时，用户可以在该关键词输入框中输入歌词。终端获取用户输入的关键词，则将该关键词添加到该获取请求中，也即该获取请求中还携带该关键词。需要说明的是，本发明实施例对终端获取用户输入的属性信息和采集语音信号的顺序不做具体限定；终端可以先获取用户输入的属性信息，再采集用户输入的语音信号；也可以先采集用户输入的语音信号，再获取用户输入的属性信息。当然，终端也可以在获取用户输入的属性信息的同时，采集用户输入的语音信号。步骤402：多媒体服务器接收终端发送的获取请求，根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库。第一多媒体文件库中用于存储多媒体服务器中的所有多媒体文件。第二多媒体文件库用于存储于该属性信息匹配的多媒体文件，且第二多媒体文件库中包括至少一个多媒体文件。如果该获取请求仅携带该属性信息和该语音信号，本步骤可以通过以下步骤(1)至(3)实现，包括：(1)：多媒体服务器接收终端发送的获取请求，从该获取请求中获取该属性信息和该语音信号。如果该获取请求中还携带该关键词，在本步骤中，多媒体服务器还可以从该获取请求中获取该关键词。(2)：多媒体服务器根据该属性信息和第一多媒体文件库中的每个多媒体文件的属性信息，计算该属性信息与第一多媒体文件库中的每个多媒体文件的属性信息之间的匹配度。(3)：多媒体服务器根据该属性信息与第一多媒体文件库中的每个多媒体文件的属性信息之间的匹配度，从第一多媒体文件库中选择满足第三预设条件的多媒体文件组成第二多媒体文件库。第三预设条件可以为匹配度最大，或者匹配度超过第一预设匹配度。其中，第一预设匹配度可以根据需要进行设置并更改，在本发明实施例中，对第一预设匹配度不作具体限定；例如，第一预设匹配度可以为80％或者90％等。需要说明的是，多媒体服务器中还可以事先存储属性信息和多媒体文件库的对应关系，相应的，本步骤可以替换为：多媒体服务器接收终端发送的获取请求，根据该属性信息，从属性信息和多媒体文件库的对应关系中获取该属性信息对应的第二多媒体文件库。进一步地，如果该获取请求不仅携带该属性信息和该语音信号，还携带该关键词，则本步骤可以为：多媒体服务器接收终端发送的获取请求，根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库。多媒体服务器根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库可以通过以下三种实现方式实现。对应第一种实现方式，多媒体服务器根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库的步骤可以为：多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第三多媒体文件库，根据该关键词和第三多媒体文件库中每个多媒体文件的字幕信息，从第三多媒体文件库中选择与该关键词匹配的多媒体文件组成第二多媒体文件库。对应第二种实现方式，多媒体服务器根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库的步骤可以为：多媒体服务器根据该关键词和第一多媒体文件库中每个多媒体文件的字幕信息，从第一多媒体文件库中选择与该关键词匹配的多媒体文件组成第三多媒体文件库，根据该属性信息，从第三多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件。对应第三种实现方式，多媒体服务器根据该属性信息和该关键词，从第一多媒体文件库中选择与该属性信息匹配，且与该关键词匹配的多媒体文件组成第二多媒体文件库的步骤可以为：多媒体服务器根据该属性信息和第一多媒体文件库中的每个多媒体文件的属性信息，计算该属性信息与每个多媒体文件的属性信息之间的相似度，根据该关键词和每个多媒体文件的字幕信息，计算该关键词与每个多媒体文件的字幕信息之间的相似度；对于第一多媒体文件库中的每个多媒体文件，多媒体服务器根据第一预设权重、第二预设权重、该属性信息与该多媒体文件的属性信息之间的相似度，以及，该关键词与该多媒体文件的字幕信息之间的相似度，计算该属性信息和该关键词与该多媒体文件之间的匹配度。按照以上方法获取到该属性信息和关键词分别与第一多媒体文件库中的每个多媒体文件的匹配度，根据该属性信息和关键词分别与第一多媒体文件库中的每个多媒体文件的匹配度，从第一多媒体文件库中选择匹配度满足第四预设条件的多媒体文件组成第二多媒体文件库。第一预设权重为属性信息之间的相似度对应的权重；第二预设权重为关键词之间的相似度对应的权重。则多媒体服务器根据第一预设权重、第二预设权重、该属性信息与该多媒体文件的属性信息之间的相似度，以及，该关键词与该多媒体文件的字幕信息之间的相似度，计算该属性信息和该关键词与该多媒体文件之间的匹配度的步骤可以为：多媒体服务器计算第一预设权重和该属性信息与该多媒体文件的属性信息之间的相似度的乘积，得到第一数值，计算第二预设权重和该关键词与该多媒体文件的字幕信息之间的相似度的乘积，得到第二数值，将第一数值和第二数值的和作为该属性信息和该关键词与该多媒体文件之间的匹配度。第一预设权重和第二预设权重可以相等，也可以不相等；第一预设权重和第二预设权重都可以根据需要进行设置并更改，在本发明实施例中，对第一预设权重、第二预设权重都不作具体限定；例如，第一预设权重为0.5，第二预设权重为0.5；再如，第一预设权重为0.4，第二预设权重为0.6。第四预设条件可以为匹配度最大，或者匹配度超过第二预设匹配度。其中，第二预设匹配度可以根据需要进行设置并更改，在本发明实施例中，对第二预设匹配度不作具体限定；例如，第二预设匹配度可以为80％或者90％等。需要说明的是，该获取请求携带该关键词，从而进一步减少了第二多媒体文件库中包括的多媒体文件的数量，进一步提高了获取目标多媒体文件的效率。步骤403：多媒体服务器根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。本步骤可以通过以下步骤(1)和(2)实现，包括：(1)：多媒体服务器提取该语音信号的参考旋律，计算该参考旋律与第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度。多媒体服务器通过现有任一一种计算旋律之间的匹配度的算法，计算该参考旋律与第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度。例如，将两个旋律包括的音节之间的匹配度作为两个旋律之间的匹配度。则本步骤可以为：多媒体服务器提取该参考旋律包括的音节序列，提取每个多媒体文件的旋律的音节序列，计算该参考序列包括的音节序列与每个多媒体文件的旋律的音节序列之间的匹配度作为该参考旋律与每个多媒体文件的旋律之间的匹配度。(2)：多媒体服务器根据该参考旋律与每个多媒体文件的旋律之间的匹配度，从第二多媒体文件集合中选择匹配度满足第一预设条件的目标多媒体文件。第一预设条件可以为匹配度最大，或者匹配度超过第三预设匹配度。其中，第三预设匹配度可以根据需要进行设置并更改，在本发明实施例中，对第三预设匹配度不作具体限定；例如，第三预设匹配度可以为80％或者90％等。需要说明的是，如果第二多媒体文件库中不存在与该参考旋律之间的匹配度满足第一预设条件的多媒体文件，为了提高获取多媒体文件的成功率，在本步骤中，多媒体服务器可以适当增加匹配算法的模糊度，则具体过程可以通过以下步骤(A)至(C)实现，包括：(A)：如果第二多媒体文件库中不存在与该参考旋律之间的匹配度满足第一预设条件的多媒体文件，多媒体服务器从该参考旋律中提取预设数目个音节。预设数目可以根据需要进行设置并更改，在本发明实施例中，对预设数目不作具体限定；例如，预设数目可以为10或者15等；当然，预设数目还可以根据该参考旋律包括的音节数目进行设置并更改；例如，该预设数目可以为该参考旋律包括的音节数目与预设比值的乘积的上取整或者下取整。预设比例可以根据需要进行设置并更改，在本发明实施例中，对预设比值不作具体限定；例如，预设比值可以为0.8或者0.85等。例如，当该参考旋律包括的音节数目为10，该预设比值为0.8，则预设数目可以为8，则多媒体服务器从该参考旋律中提取8个音节。(B)：多媒体服务器计算所提取的音节与每个多媒体文件的旋律之间的匹配度。多媒体服务器获取每个多媒体文件的旋律包括的音节，根据所提取的音节和每个多媒体文件的旋律包括的音节，计算所提取的音节与每个多媒体文件的旋律之间的匹配度。(C)：多媒体服务器根据所提取的音节与每个多媒体文件的旋律之间的匹配度，从第二多媒体文件库中选择匹配度满足第二预设条件的目标多媒体文件。第二预设条件可以为匹配度最大，或者匹配度超过第四预设匹配度。其中，第四预设匹配度可以根据需要进行设置并更改，在本发明实施例中，对第四预设匹配度不作具体限定；例如，第四预设匹配度可以为80％或者90％等。需要说明的是，多媒体服务器获取的目标多媒体文件可以为一个，也可以为多个。并且，目标多媒体文件可以为视频文件，也可以为音频文件。步骤404：多媒体服务器向终端发送该目标多媒体文件。终端向多媒体服务器发送的获取请求中携带终端的终端标识，多媒体服务器从该获取请求中获取该终端标识，根据该终端标识，向终端发送该目标多媒体文件。在一个可能的实现方式中，为了减少终端的网络资源消耗，多媒体服务器可以不向终端发送该目标多媒体文件，仅向终端发送该目标多媒体文件的标识，在接收到终端发送的下载请求或者播放请求时，才向终端发送该目标多媒体文件。其中，该终端标识和该目标多媒体文件的标识可以根据需要进行设置并更改，在本发明实施例中，对该终端标识和该目标多媒体文件的标识不作具体限定；例如，该终端标识可以为终端的手机号码或者登录该应用的用户标识。该目标多媒体文件的标识可以为该目标多媒体文件的名称或者编号等。需要说明的是，如果第二多媒体文件库中不存在与该语音信号匹配的目标多媒体文件，向终端发送失败指示，该失败指示用于指示识别识别。终端接收多媒体服务器发送的失败指示，显示该失败指示。终端接收到该失败指示后，终端还可以再次向多媒体服务器发送获取请求，该获取请求携带该属性信息、该语音信号和该关键词。步骤405：终端接收多媒体服务器发送的该目标多媒体文件。终端接收多媒体服务器发送的该目标多媒体文件，存储该目标多媒体文件，显示该目标多媒体文件的标识，用户可以点击该目标多媒体文件以触发终端播放该目标多媒体文件；终端检测到该目标多媒体文件被触发时，获取已存储的该目标多媒体文件，播放该目标多媒体文件。需要说明的是，如果在步骤404中多媒体服务器仅向终端发送该目标多媒体文件的标识，则本步骤可以为：终端接收多媒体服务器发送的该目标多媒体文件的标识，显示该目标多媒体文件的标识；用户可以点击该目标多媒体文件的标识以触发终端播放该目标多媒体文件；终端检测到该目标多媒体文件被触发时，向多媒体服务器发送播放请求，该播放请求携带该目标多媒体文件的标识。多媒体服务器接收终端发送的播放请求，根据该目标多媒体文件的标识，获取该目标多媒体文件，向终端发送该目标多媒体文件；终端接收多媒体服务器发送的该目标多媒体文件，播放该目标多媒体文件。在本发明实施例中，终端向多媒体服务器发送的获取请求中携带属性信息和语音信号，多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。由于第二多媒体文件库中仅包括与该属性信息匹配的多媒体文件，也即第二多媒体文件库中包括的多媒体文件数量较少，因此，多媒体服务器从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，比较省时间，可以提高获取目标多媒体文件的效率。本发明实施例提供了一种获取多媒体文件的装置，该装置应用在多媒体服务器中，用于执行以上多媒体服务器执行的步骤；参见图5，该装置包括：第一接收模块501，用于接收获取请求，所述获取请求至少携带属性信息和语音信号，所述属性信息用于标识多媒体文件的属性；第一选择模块502，用于根据所述属性信息，从第一多媒体文件库中选择与所述属性信息匹配的多媒体文件组成第二多媒体文件库，所述第一多媒体文件库用于存储所述多媒体服务器中的所有多媒体文件；第二选择模块503，用于根据所述语音信号，从所述第二多媒体文件库中选择与所述语音信号匹配的目标多媒体文件。在一个可能的设计中，所述获取请求还携带关键词，所述第一选择模块502，还用于根据所述属性信息和所述关键词，从所述第一多媒体文件库中选择与所述属性信息匹配，且与所述关键词匹配的多媒体文件组成第二多媒体文件库。在一个可能的设计中，所述第二选择模块503，包括：第一提取单元，用于提取所述语音信号的参考旋律；第一计算单元，用于计算所述参考旋律与所述第二多媒体文件库中的每个多媒体文件的旋律之间的匹配度；第一选择单元，用于根据所述参考旋律与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件集合中选择匹配度满足第一预设条件的目标多媒体文件。在一个可能的设计中，所述第二选择模块503，还包括：第二提取单元，用于如果所述第二多媒体文件库中不存在与所述参考旋律之间的匹配度满足第一预设条件的多媒体文件，从所述参考旋律中提取预设数目个音节；第二计算单元，用于计算所提取的音节与所述每个多媒体文件的旋律之间的匹配度；第二选择单元，用于根据所提取的音节与所述每个多媒体文件的旋律之间的匹配度，从所述第二多媒体文件库中选择匹配度满足第二预设条件的目标多媒体文件。在一个可能的设计中，所述装置还包括：第一发送模块，用于如果所述第二多媒体文件库中不存在与所述语音信号匹配的目标多媒体文件，发送失败指示。在本发明实施例中，终端向多媒体服务器发送的获取请求中携带属性信息和语音信号，多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。由于第二多媒体文件库中仅包括与该属性信息匹配的多媒体文件，也即第二多媒体文件库中包括的多媒体文件数量较少，因此，多媒体服务器从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，比较省时间，可以提高获取目标多媒体文件的效率。本发明实施例提供了一种获取多媒体文件的装置，该装置应用在终端中，用于执行以上终端执行的步骤；参见图6，该装置包括：第一获取模块601，用于获取属性信息和语音信号，所述属性信息用于标识多媒体文件的属性信息；第二发送模块602，用于向多媒体服务器发送获取请求，所述获取请求至少携带所述属性信息和所述语音信号；第二接收模块603，用于接收所述多媒体服务器发送的目标多媒体文件。在一个可能的设计中，所述装置还包括：第二获取模块，用于获取所述关键词；添加模块，用于将所述关键词添加到所述获取请求中。在一个可能的设计中，所述第二获取模块，还用于如果接收到所述多媒体服务器发送的失败指示，获取所述关键词。在本发明实施例中，终端向多媒体服务器发送的获取请求中携带属性信息和语音信号，多媒体服务器根据该属性信息，从第一多媒体文件库中选择与该属性信息匹配的多媒体文件组成第二多媒体文件库，根据该语音信号，从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件。由于第二多媒体文件库中仅包括与该属性信息匹配的多媒体文件，也即第二多媒体文件库中包括的多媒体文件数量较少，因此，多媒体服务器从第二多媒体文件库中选择与该语音信号匹配的目标多媒体文件，比较省时间，可以提高获取目标多媒体文件的效率。需要说明的是：上述实施例提供的获取多媒体文件的装置在获取多媒体文件时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的获取多媒体文件的装置与获取多媒体文件的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。图7是本发明实施例提供的一种终端的结构示意图。该终端可以用于实施上述实施例所示出的获取多媒体文件的方法中的终端所执行的功能。具体来讲：终端700可以包括RF(RadioFrequency，射频)电路710、包括有一个或一个以上计算机可读存储介质的存储器720、输入单元730、显示单元740、传感器750、音频电路760、传输模块770、包括有一个或者一个以上处理核心的处理器780、以及电源790等部件。本领域技术人员可以理解，图7中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：RF电路710可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器780处理；另外，将涉及上行的数据发送给基站。通常，RF电路710包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(LowNoiseAmplifier，低噪声放大器)、双工器等。此外，RF电路710还可以通过无线通信与网络和其他终端通信。所述无线通信可以使用任一通信标准或协议，包括但不限于GSM(GlobalSystemofMobilecommunication，全球移动通讯系统)、GPRS(GeneralPacketRadioService，通用分组无线服务)、CDMA(CodeDivisionMultipleAccess，码分多址)、WCDMA(WidebandCodeDivisionMultipleAccess,宽带码分多址)、LTE(LongTermEvolution,长期演进)、电子邮件、SMS(ShortMessagingService，短消息服务)等。存储器720可用于存储软件程序以及模块，如上述示例性实施例所示出的终端所对应的软件程序以及模块，处理器780通过运行存储在存储器720的软件程序以及模块，从而执行各种功能应用以及数据处理，如实现基于视频的交互等。存储器720可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端700的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器720还可以包括存储器控制器，以提供处理器780和输入单元730对存储器720的访问。输入单元730可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元730可包括触敏表面731以及其他输入终端732。触敏表面731，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面731上或在触敏表面731附近的操作)，并根据预先设定的程式驱动相应的链接装置。可选的，触敏表面731可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器780，并能接收处理器780发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面731。除了触敏表面731，输入单元730还可以包括其他输入终端732。具体地，其他输入终端732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元740可用于显示由用户输入的信息或提供给用户的信息以及终端700的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元740可包括显示面板741，可选的，可以采用LCD(LiquidCrystalDisplay，液晶显示器)、OLED(OrganicLight-EmittingDiode,有机发光二极管)等形式来配置显示面板741。进一步的，触敏表面731可覆盖显示面板741，当触敏表面731检测到在其上或附近的触摸操作后，传送给处理器780以确定触摸事件的类型，随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中，触敏表面731与显示面板741是作为两个独立的部件来实现输入和输入功能，但是在某些实施例中，可以将触敏表面731与显示面板741集成而实现输入和输出功能。终端700还可包括至少一种传感器750，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板741的亮度，接近传感器可在终端700移动到耳边时，关闭显示面板741和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端700还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。音频电路760、扬声器761，传声器762可提供用户与终端700之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号，传输到扬声器761，由扬声器761转换为声音信号输出；另一方面，传声器762将收集的声音信号转换为电信号，由音频电路760接收后转换为音频数据，再将音频数据输出处理器780处理后，经RF电路710以发送给比如另一终端，或者将音频数据输出至存储器720以便进一步处理。音频电路760还可能包括耳塞插孔，以提供外设耳机与终端700的通信。终端700通过传输模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线或有线的宽带互联网访问。虽然图7示出了传输模块770，但是可以理解的是，其并不属于终端700的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。处理器780是终端700的控制中心，利用各种接口和线路链接整个手机的各个部分，通过运行或执行存储在存储器720内的软件程序和/或模块，以及调用存储在存储器720内的数据，执行终端700的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器780可包括一个或多个处理核心；优选的，处理器780可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器780中。终端700还包括给各个部件供电的电源790(比如电池)，优选的，电源可以通过电源管理系统与处理器780逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源790还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。尽管未示出，终端700还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，终端的显示单元是触摸屏显示器，终端还包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于实施上述实施例中终端所执行操作的指令。图8是本发明实施例提供的一种多媒体服务器的结构示意图；该多媒体服务器800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(centralprocessingunits，CPU)822(例如，一个或一个以上处理器)和存储器832，一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中，存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对多媒体服务器中的一系列指令操作。更进一步地，中央处理器822可以设置为与存储介质830通信，在异常注入系统800上执行存储介质830中的一系列指令操作。异常注入系统800还可以包括一个或一个以上电源826，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口858，一个或一个以上键盘856，和/或，一个或一个以上操作系统841，例如WindowsServerTM，MacOSXTM，UnixTM,LinuxTM，FreeBSDTM等等。该多媒体服务器800可以用于执行上述实施例提供的获取多媒体文件的方法中多媒体服务器所执行的步骤。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。当前第1页1 2 3 当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张斯剑
技术所有人：广州酷狗计算机科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。