音乐词汇文件索引建立方法及其装置、音乐词汇搜索方法及其系统的制作方法

文档序号:6352659阅读:216来源:国知局
专利名称:音乐词汇文件索引建立方法及其装置、音乐词汇搜索方法及其系统的制作方法
技术领域
本发明涉及音乐搜索,尤其涉及一种音乐词汇文件索引建立方法及其装置、音乐词汇搜索方法及其系统。
背景技术
目前在音乐搜索领域中,传统搜索引擎一般以用户输入的词汇作为搜索关键字, 在索引引擎中直接搜索该词汇的索引文件,然后返回相关结果。对于搜索关键字,就音乐词汇词性层面而言,其一般具有多重词性,如,“棉花糖” 一词既具有单曲词性,也具有艺人词性,即“棉花糖”既可代表某单曲,又可指代某艺人。如果用户输入词汇“棉花糖”,那么返回结果存在两方面的问题,一是结果不够准确,它既包含意为单曲的“棉花糖”,又包括指代艺人的“棉花糖” ;二是结果排序不合理,指代不同语义的“棉花糖”结果数据是无序的。而实际上,如果在某段特定时间内,“棉花糖”是一首比较流行的歌曲,那么大多数用户在搜索时,最希望首先搜索出“棉花糖”这首单曲,而不太会关注“棉花糖”这个艺人,反之亦然。因此这种搜索方式在搜索时就不能针对用户的需求进行个性化的语义搜索。此外,在网络限制和搜索终端限制的领域内,如移动终端,如果不能针对性地进行搜索,大量的搜索结果会降低移动终端的搜索性能,同时也影响用户及时快速地获得自己所需要的搜索结果。

发明内容
为了解决上述问题,本发明的一种目的是提供一种音乐词汇文件索引建立方法及其装置,以使音乐词汇文件索引能够以用户的需求来个性化并准确性地将合适的音乐词汇词性快速简单地调用出来,从而能够进行后续相应的音乐实体调用。为了实现上述目的,本发明提供了一种音乐词汇文件索引建立方法,所述方法适用于具有搜索服务的搜索系统中,包括以下步骤Sl 根据所述搜索系统中用户对某一音乐词汇的搜索日志,将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;S2:将所述音乐词汇的不同词性及其优先级策略更新或增加在所述搜索系统中所设置的音乐词汇字典中;S3 将所述音乐词汇字典中的数据实时同步到所述搜索系统的数据库中;S4:以所述搜索系统数据库中的词性信息为输入,通过所述搜索系统中的索引引擎生成音乐词汇文件索引。根据本发明的一个实施例,其中所述优先级策略为分别对所述音乐词汇的不同词性设置由高到低的优先级,或将所述音乐词汇中具有最高搜索热度和/或最流行的词性设置为最高优先级。
根据本发明的一个实施例,其中所述音乐词汇的词性包括单曲、专辑以及艺人中的至少两种。相应地,本发明还提供一种音乐词汇文件索引建立装置,所述装置设置在具有搜索服务的搜索系统中,所述装置包括词性信息设置模块,用于根据所述搜索系统中用户对某一音乐词汇的搜索日志, 将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;存储模块,用于将所述音乐词汇的不同词性及其优先级策略更新或增加在所述搜索系统中所设置的音乐词汇字典中;同步模块,用于所述音乐词汇字典中的数据实时同步到所述搜索系统的数据库中;索引生成模块,用于以所述搜索系统数据库中的词性信息为输入,通过所述搜索系统中的索引引擎生成音乐词汇文件索引。根据本发明的一个实施例,其中所述词性信息设置模块还包括优先级策略设置模块,用于分别对所述音乐词汇的不同词性设置由高到低的优先级,或将所述音乐词汇中具有最高搜索热度和/或最流行的词性设置为最高优先级。本发明的另一目的是提供一种音乐搜索方法,以使能够针对性快速地获得用户所需要的搜索结果。为了实现上述目的本发明提供一种音乐词汇搜索方法,包括以下步骤Sll 接收用户输入的音乐词汇关键字;S12:通过上述的音乐词汇文件索引建立装置所建立的文件索引,对所述音乐词汇关键字进行搜索,获得所述音乐词汇关键字的词性信息,其中所述词性信息包括所述音乐词汇关键字的不同词性及其优先级策略;S13 根据所述获得词性信息中的优先级策略,调用相应的音乐实体;S14 将结果返回给用户。根据本发明的一个实施例,其中所述优先级策略为分别对所述音乐词汇关键字的不同词性设置由高到低的优先级,或将所述音乐词汇关键字中具有最高搜索热度和/或最流行的词性设置为最高优先级。根据本发明的一个实施例,其中所述步骤S13具体为根据所述音乐词汇关键字中不同词性的由高到低的优先级,调用其相应的音乐实体;或调用所述音乐词汇关键字中具有最高优先级词性的相应音乐实体。本发明还提供一种音乐词汇搜索系统,包括上述音乐词汇文件索引生成装置;音乐词汇字典,用于存储所述音乐词汇文件索引生成装置中的词性信息;数据库,与所述音乐词汇字典同步,用于存储音乐实体以及与所述音乐词汇字典同步的词性信息数据;索引引擎,用于以所述数据库中的词性信息数据为输入生成所述文件索引,并在接收到用户输入的音乐词汇关键字时通过所述文件索引获得所述关键字的词性信息;搜索引擎,用于根据所述索引引擎获得所述关键字的词性信息,在所述数据库中调用相应的音乐实体。
由上述技术方案可知,本发明通过对用户的搜索日志统计(即用户对搜索结果列表中的某一条结果的点击次数统计),同时结合当下的音乐流行趋势,对于音乐词汇进行词性划分及其优先级设置(如一个词汇具有多重词性时)。这样,词性作为基础信息被存储, 丰富了音乐基础信息的完整性,为今后的其他服务提供了良好的数据支持。并且词性随当下的音乐流行趋势而确定,使得搜索更加具有针对性,搜索结果更加合理。


图1为本发明的建立音乐词汇文件索引的方法示意图;图2为本发明的一种音乐词汇文件索引建立方法的流程图;图3为本发明的一种音乐词汇文件索引建立装置的结构框图;图4为本发明的一种音乐词汇搜索方法的流程图;图5为本发明的搜索音乐词汇一种实施例的示意图。
具体实施例方式下面将详细描述本发明的具体实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。本发明适用于具有一般搜索服务的搜索系统,该搜索系统中包括有索引引擎、搜索引擎以及存储有所搜索数据的数据库,本发明的主要构思在于,通过对搜索系统中用户的搜索日志进行统计分析,获得某一音乐词汇的词性信息,从而建立基于词性信息的音乐词汇文件索引,然后在搜索时根据该文件索引,快速地判断出用户所需要的音乐词性,并进而根据该词性,搜索出相应的音乐实体。如上所述,在本发明在提供搜索服务之前,需要预先建立好音乐词汇的文件索引, 而该文件索引是基于音乐词汇的词性信息所生成的,这样本发明所建立的文件索引,能够以用户的需求来个性化并准确地将合适的音乐词汇词性快速简单地调用出来,从而能够进行后续相应的音乐实体调用。具体地,本发明提供一种音乐词汇文件索引建立方法,如图1和图2所示,包括以下步骤步骤Sl 根据搜索系统中用户对某一音乐词汇的搜索日志,将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;一般音乐词汇会具有“单曲”、“专辑”以及“艺人”等不同词性,比如,“棉花糖”在用户的搜索日志或者在当前音乐信息中具有两种词性,单曲词性和艺人词性,也就是说,用户在搜索“棉花糖”时,可能会获得两种结果,一种是“棉花糖”作为单曲时的搜索结果,另一种则是作为“棉花糖”这个艺人的搜索结果;而在用户搜索日志中对这两种词性搜索结果分析表明,“棉花糖”作为单曲词性的搜索点击次数要远远高于其作为艺人词性的点击次数, 因此,本发明先根据搜索系统中的用户搜索日志,获得音乐词汇所具有的不同词性,然后根据这些词性的搜索热度进行搜索优先级的策略设置。对于上述词性的划分及其优先级策略的设置,也可根据音乐词汇不同词性的流行趋势,由音乐专家对所述音乐词汇进行更加专业化的划分,进一步提高所划分的词性的准确性,或者对于某些音乐词汇,在用户的搜索日志中暂时没有分析出所具有的词性,由音乐专家根据这些音乐词汇当前各种词性的流行度,人工设置这些音乐词汇的不同词性及其优先级策略。在设置优先级策略时,可对搜索热度高的词性设置高的优先级,对搜索热度低的词性设置低的优先级,或者将搜索热度最高的词性设置为最优先,如表1中,将音乐词汇的不同词性通过二进制标示出来,在设置优先级时直接将搜索度最高的词性相应的二进制数设置为最高优先级调用出来,比如,“棉花糖”具有单曲和艺人两种词性,其单曲词性标示为 001,其艺人词性标示为100,由于棉花糖的单曲词性比其艺人词性的搜索热度高,因此,将棉花糖的单曲词性标示为最高优先级,也即将其词性优先级策略设置为1,同样,比如,刘德华具有单曲、专辑以及艺人三种词性,其单曲词性表示为001,其专辑词性标示为010,其艺人词性标示为100,而在刘德华的用户搜索日志中分析可知,刘德华作为艺人词性的搜索热度最高,因此将刘德华的艺人词性标示为最高优先级,也即将其词性优先级设置为4 (对应二进制数100),如表1所示表 权利要求
1.一种音乐词汇文件索引建立方法,所述方法适用于具有搜索服务的搜索系统中,其特征在于,所述方法包括以下步骤Sl 根据所述搜索系统中用户对音乐词汇的搜索日志,将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;S2:将包括有所述音乐词汇、所述音乐词汇的不同词性及其优先级策略的词性信息存储在所述搜索系统中所设置的音乐词汇字典中;53将所述音乐词汇字典中的词性信息实时同步到所述搜索系统的数据库中;54以所述搜索系统数据库中的词性信息为输入,通过所述搜索系统中的索引引擎生成音乐词汇文件索引。
2.根据权利要求1所述的音乐词汇文件索引建立方法,其特征在于,所述设置优先级策略为分别对所述音乐词汇的不同词性设置由高到低的优先级,或将所述音乐词汇中具有最高搜索热度和/或最流行的词性设置为最高优先级。
3.根据权利要求1或2所述的音乐词汇文件索引建立方法,其特征在于,所述音乐词汇的词性包括单曲、专辑以及艺人中的至少两种。
4.一种音乐词汇文件索引建立装置,所述装置设置在具有搜索服务的搜索系统中,其特征在于,所述装置包括词性信息设置模块,用于根据所述搜索系统中用户对音乐词汇的搜索日志,将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;存储模块,用于将包括有所述音乐词汇、所述音乐词汇的不同词性及其优先级策略的词性信息存储在所述搜索系统中所设置的音乐词汇字典中;同步模块,用于所述音乐词汇字典中的词性信息实时同步到所述搜索系统的数据库中;索引生成模块,用于以所述搜索系统的数据库中的词性信息为输入,通过所述搜索系统中的索引引擎生成音乐词汇文件索引。
5.根据权利要求4所述的音乐词汇文件索引建立装置,其特征在于,所述词性信息设置模块还包括优先级策略设置模块,用于分别对所述音乐词汇的不同词性设置由高到低的优先级,或将所述音乐词汇中具有最高搜索热度和/或最流行的词性设置为最高优先级。
6.一种音乐词汇搜索方法,其特征在于,所述方法包括以下步骤511接收用户输入的音乐词汇关键字;512通过权利要求4所述的音乐词汇文件索引建立装置所建立的文件索引,对所述音乐词汇关键字进行搜索,获得所述音乐词汇关键字的词性信息,其中所述词性信息包括所述音乐词汇关键字的不同词性及其优先级策略;513根据所述获得词性信息中的词性及其优先级策略,调用相应的音乐实体;S14:将结果返回给用户。
7.根据权利要求6所述的方法,其特征在于,所述步骤S12中所述优先级策略为所述音乐词汇关键字的不同词性具有由高到低的优先级,或所述音乐词汇关键字中具有最高搜索热度和/或最流行的词性具有最高优先级。
8.根据权利要求7所述的方法,其特征在于,所述步骤S13具体为根据所述音乐词汇关键字中不同词性的由高到低的优先级,调用其相应的音乐实体; 或调用所述音乐词汇关键字中具有最高优先级词性的相应音乐实体。
9.一种音乐词汇搜索系统,其特征在于,所述系统包括 权利要求4所述的音乐词汇文件索引生成装置;音乐词汇字典,用于存储所述音乐词汇文件索引生成装置中的词性信息; 数据库,与所述音乐词汇字典同步,用于存储音乐实体以及与所述音乐词汇字典同步的词性信息数据;索引引擎,用于以所述数据库中的词性信息数据为输入生成所述文件索引,并在接收到用户输入的音乐词汇关键字时通过所述文件索引获得所述关键字的词性信息;搜索引擎,用于根据所述索引引擎获得所述关键字的词性信息,在所述数据库中调用相应的音乐实体。
全文摘要
本发明公开了音乐词汇文件索引建立方法及其装置、音乐词汇搜索方法及其系统,其中音乐词汇文件索引建立方法包括以下步骤S1根据所述搜索系统中用户对音乐词汇的搜索日志,将所述音乐词汇划分为不同的词性,并根据搜索热度和/或所述不同词性的流行趋势对所述音乐词汇的不同词性设置优先级策略;S2将包括有所述音乐词汇、所述音乐词汇的不同词性及其优先级策略的词性信息存储在所述搜索系统中所设置的音乐词汇字典中;S3将所述音乐词汇字典中的词性信息实时同步到所述搜索系统的数据库中;S4以所述搜索系统数据库中的词性信息为输入,通过所述搜索系统中的索引引擎生成音乐词汇文件索引。本发明的搜索方法能够快速地获得用户所需要的搜索结果。
文档编号G06F17/30GK102591865SQ20111000186
公开日2012年7月18日 申请日期2011年1月6日 优先权日2011年1月6日
发明者贾海禄 申请人:北京瑞信在线系统技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1