搜索音乐和建立索引的方法及装置、搜索结果判断方法

文档序号:9727345阅读:359来源:国知局
搜索音乐和建立索引的方法及装置、搜索结果判断方法
【技术领域】
[0001] 本申请涉及搜索技术领域,特别涉及一种搜索音乐和建立索引的方法及装置、搜 索结果判断方法。
【背景技术】
[0002] 随着计算机技术和多媒体技术的发展,音乐搜索因为能够为广大用户检索到符合 用户意图的音乐信息而被广泛使用。
[0003] 在音乐搜索技术领域中,一首歌曲通常包含多个排列属性,例如歌曲名、艺人名、 专辑名等。用户在进行音乐搜索时,一般按排列属性来构造查询串。通常,一个查询串可能 是与歌曲的一个排列属性匹配,也可能与多个排列属性的组合匹配。另外,用户还可能因为 对要检索的歌曲信息了解不全面而使用不完整的排列属性信息及其组合来构造查询串。
[0004] 现有的搜索音乐的方法通常都建立在倒排索引的基础上,搜索方法与网页搜索方 法类似。
[0005] 现有的搜索音乐的方法一般可以包括:接受用户输入的查询串;对接收到的查询 串进行分词,得到关键词;对每个关键词根据倒排索引获得歌曲标识符并对获得的歌曲标 识符求交集,得到包含每个关键词的候选歌曲;对所述候选歌曲进行排序,并返回排序后的 歌曲。
[0006] 在实现本申请过程中,发明人发现现有技术中至少存在如下问题:考虑到关键词 在查询串中的位置关系对用户搜索意图的影响,现有的搜索音乐的方法仅对查询串中所有 关键词的倒排索引求交集,这种方式返回的搜索结果的精确度仍然有待提升。

【发明内容】

[0007] 本申请实施例的目的是提供一种搜索音乐和建立索引的方法及装置、搜索结果判 断方法,以保证搜索结果符合用户的搜索意图。
[0008] 为解决上述技术问题,本申请实施例提供一种搜索音乐和建立索引的方法及装 置、搜索结果判断方法,是这样实现的:
[0009] -种搜索音乐的方法,包括:接收查询串,对所述查询串进行分词,得到一个或多 个查询词;根据所述查询词从歌曲倒排索引表中查找与所述查询词对应的歌曲标识符,对 各查询词对应的歌曲标识符求交集,得到候选的第一歌曲集合;获取所述候选的第一歌曲 集合中歌曲的排列属性,根据所述查询词在所述歌曲的排列属性中的位置偏移量,对所述 查询串进行分段,得到一个或多个分段文本;将所述分段文本与所述歌曲的排列属性进行 匹配,基于所述匹配结果计算所述查询串与所述歌曲的相关性权重;根据所述查询串与所 述歌曲的相关性权重对所述候选的第一歌曲集合中的歌曲进行排序,得到第二歌曲集合, 设置第二歌曲集合为所述查询串的搜索结果,并返回给用户。
[0010] 一种搜索结果判断方法,包括:对所述查询串进行分词,得到一个或多个查询词; 获取所述候选的歌曲集合中歌曲的排列属性,根据所述查询词在所述歌曲的排列属性中的 位置偏移量,对所述查询串进行分段,得到一个或多个分段文本;对所述候选的歌曲集合中 的歌曲根据预设的第二规则进行判断,确定所述歌曲与查询串的相关程度,得到相关结果 集合。
[0011] -种建立索引的方法,包括:记录歌曲排列属性,设置歌曲标识符;对所述歌曲标 识符对应的所述排列属性进行分词,得到关键词,记录所述关键词在所述排列属性中的位 置偏移量;根据所述关键词、所述歌曲标识符和所述关键词的位置偏移量,生成倒排索引 表。
[0012] -种搜索音乐的装置,包括:查询串分词单元、第一歌曲集合单元、分段文本单元、 歌曲权重单元和排序返回单元;其中,所述查询串分词单元,用于接收查询串,对所述查询 串进行分词,得到一个或多个查询词;所述第一歌曲集合单元,用于根据所述查询串分词单 元中的查询词从歌曲倒排索引表中查找与所述查询词对应的歌曲标识符,对查询词对应的 歌曲标识符求交集,得到候选的第一歌曲集合;所述分段文本单元,用于获取所述第一歌曲 集合单元中歌曲的排列属性,根据所述查询词在所述歌曲的排列属性中的位置偏移量,对 所述查询串进行分段,得到一个或多个分段文本;所述歌曲权重单元,用于将所述分段文本 单元得到的分段文本与所述歌曲的排列属性进行匹配,基于所述匹配结果计算所述查询串 与所述歌曲的相关性权重;所述排序返回单元,用于根据所述歌曲权重单元得到的所述查 询串与所述歌曲的相关性权重对所述候选的第一歌曲集合中的歌曲进行排序,得到第二歌 曲集合,设置第二歌曲集合为所述查询串的搜索结果,并返回给用户。
[0013] -种建立索引的装置,包括:排列属性单元、位置偏移量单元和倒排索引单元;其 中,所述排列属性单元,用于记录歌曲排列属性,设置歌曲标识符;所述位置偏移量单元,用 于对所述排列属性单元中歌曲标识符对应的所述排列属性进行分词,得到关键词,记录所 述关键词在所述排列属性中的位置偏移量;所述倒排索引单元,用于根据所述位置偏移量 单元中的关键词、歌曲标识符和关键词的位置偏移量,生成倒排索引表。
[0014] 由以上本申请实施例提供的技术方案可见,本申请实施例通过计算候选歌曲集合 中歌曲的歌曲权重来对歌曲进行排序,在计算歌曲权重的过程中考虑了查询串中关键词的 位置、歌曲排列属性与查询串的匹配结果、歌曲的热度等,按计算出的歌曲权重进行排序的 搜索结果可以更符合用户的搜索意图。
[0015] 进一步地,本申请实施例还可以通过筛选分段文本数目小于或等于第一预设值的 歌曲,去除排列属性与查询串相关性不强的歌曲,从而减少了计算歌曲权重这一步骤的计 算量,节约了计算资源。
[0016] 进一步地,本申请实施例还可以判断第一歌曲集合中歌曲与查询串的相关程度, 筛选出其中相关程度较高的结果,再进行进一步的排序,可以使得返回给用户的结果更符 合用户的搜索意图,同时可以减少了计算歌曲权重这一步骤的计算量,节约了计算资源。
【附图说明】
[0017] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提 下,还可以根据这些附图获得其他的附图。
[0018] 图1是本申请一种搜索音乐的方法第一实施例的流程图;
[0019] 图2是本申请一种搜索音乐的方法第二实施例的流程图;
[0020] 图3是本申请一种搜索音乐的方法第三实施例的流程图;
[0021] 图4是本申请一种建立音乐倒排索引的方法一个实施例的流程图;
[0022] 图5是本申请一种搜索音乐的装置的一个实施例的模块图;
[0023] 图6是本申请搜索音乐的装置中歌曲权重单元的模块图;
[0024] 图7是本申请搜索音乐的装置中相关结果集合单元的模块图;
[0025] 图8是本申请一种建立倒排索引的装置一个实施例的模块图。
【具体实施方式】
[0026] 本申请实施例提供一种搜索音乐和建立索引的方法及装置、搜索结果判断方法。
[0027] 为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施 例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通 技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护 的范围。
[0028] 现有的搜索音乐的方法仅对查询串中所有关键词的倒排索引求交集,不考虑查询 串中关键词的位置关系,返回的搜索结果中可能包含不符合用户的搜索意图的搜索结果。 例如用户一般不会输入查询串"日子刘德华一起走过的",因此,对于这样的查询串返回的 歌曲中若包含"刘德华"的歌曲"一起走过的日子"将不符合用户的搜索意图。但现有的搜 索音乐的方法仅对所有关键词的倒排索引结果求交集,无论用户输入的查询串格式如何, 交集中出现的歌曲都会被返回,这样可能会返回与用户搜索意图不相关的无关结果。例如, 现有的搜索音乐的方法对查询串"日子刘德一华起走过的"进行分词并对关键词的倒排索 引结果求交集后,可能会返回"刘德华"的歌曲"一起走过的日子"这一不符合用户搜索意 图的结果。
[0029] 下面介绍本申请提供一种搜索音乐的方法实施例。图1是本申请一种搜索音乐的 方法第一实施例的流程图。如图1所示,所述搜索音乐的方法可以包括:
[0030] S110 :接收查询串,对所述查询串进行分词,得到一个或多个查询词。
[0031] 计算机可以接收查询串。计算机可以对所述查询串进行分词得到查询词,具体地, 可以对所述查询串逐字进行分词,所述查询串中包含英文的,可以对所述英文逐单词进行 分词,分词后得到的单字或英文单词可以设置为一个查询词。一个查询串分词后可以得到 一个或多个查询词。
[0032] S120 :根据所述查询词从歌曲倒排索引表中查找与所述查询词对应的歌曲标识 符,对各查询词对应的歌曲标识符求交集,得到候选的第一歌曲集合。
[0033] 根据所述查询词可以从歌曲倒排索引表中查找与所述查询词对应的歌曲标识符 (下文可以简称歌曲ID)。所述歌曲ID可以是编号的形式。所述歌曲ID可以具有唯一性。 所述歌曲ID可以与歌曲的排列属性相对应。所述排列属性可以包括:歌曲名、歌曲别名、艺 人名、艺人别名、专辑名、专辑别名、演唱者等字段中的一种或多种。所述字段可以用于表示 歌曲的一个属性,例如字段"歌曲名"可以表示歌曲名称这一属性。所述排列属性可以是所 述字段的集合。所述排列属性中包含的字段可以按照预设的顺序进行排列。每一个查询词 可以对应一个或多个歌曲ID,所述查询词也可以没有对应的歌曲ID,即在所述歌曲倒排索 引表中没有歌曲ID对应的排列属性中包含该查询词。
[0034] 计算机可以对查询串中每一个查询词对应的歌曲ID求交集,得到的歌曲ID所对 应的排列属性中可以包含根据所述查询串分词后得到的所有的查询词。所述求交集得到的 歌曲ID形成的集合可以设置为候选的第一歌曲集合。
[0035] S130:获取所述候选的第一歌曲集合中歌曲的排列属性,根据所述查询词在所述 歌曲的排列属性中的位置偏移量,对所述查询串进行分段,得到一个或多个分段文本。
[0036] 计算机可以获取所述候选的第一歌曲集合中每一首歌曲的排列属性,并获取各查 询词在其匹配的排列属性中的位
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1