资源搜索方法以及服务器的制造方法

文档序号:10534884阅读:355来源:国知局
资源搜索方法以及服务器的制造方法
【专利摘要】本发明涉及通信技术领域,公开了一种资源搜索方法以及服务器,该方法包括:按照用户意图识别的结果排序搜索到的资源。本发明能够实现将与用户输入的词条相关的所有类型的资源(例如包括视频、应用程序、音频等资源)按照用户的意图排序,例如,如果用户期望的是视频资源,则可以在大量搜索到的资源中,将视频资源排列在最前端,这样用户可以方便、快速地找到自己需要的资源,在节约了时间的同时,也大大提高了用户体验。
【专利说明】
资源搜索方法以及服务器
技术领域
[0001]本发明涉及通信技术领域,具体地,涉及一种资源搜索方法、以及一种服务器。
【背景技术】
[0002]随着网络的发展,用户可以通过关键词搜索在各种搜索引擎上搜索用户感兴趣的资源,例如网页、视频/音频等媒体流、图像、应用程序等。
[0003]但是,在现有技术中搜索一般为单向的垂直搜索,比如应用商店只有app相关搜索,视频播放器只有视频相关搜索。用户进行不同资源类型的搜索,需要打开不同的搜索引擎,这引起了不便,造成用户体验不佳。此外,现有技术中在搜索到资源后并不是按照用户意图进行显示的,因此用户很有可能需要花费一些时间才能在搜索到的大量资源中找到自己期望的资源,这也造成用户体验较差。

【发明内容】

[0004]针对现有技术中存在的现有资源搜索和显示方法不能满足用户需求的技术问题,本发明提供了一种资源搜索方法,该方法包括:根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及按照用户意图识别的结果排序搜索到的资源。
[0005]相对应地,本发明还提供了一种服务器,该服务器包括:资源数据库;以及处理模块,用于根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。
[0006]采用本发明提供的资源搜索方法以及服务器,通过根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别,以及之后按照用户意图识别的结果排序搜索到的资源,能够实现将与用户输入的词条相关的所有类型的资源(例如包括视频、应用程序、音频等资源)按照用户的意图排序,例如,如果用户期望的是视频资源,则可以在大量搜索到的资源中,将视频资源排列在最前端,这样用户可以方便、快速地找到自己需要的资源,在节约了时间的同时,也大大提高了用户体验。
[0007]本发明的其它特征和优点将在随后的【具体实施方式】部分予以详细说明。
【附图说明】
[0008]附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的【具体实施方式】一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0009]图1是根据本发明的一种实施方式的示例服务器的结构示意图;
[0010]图2是根据本发明的一种实施方式的示例服务器的处理模块执行的示例流程图;以及
[0011 ]图3是根据本发明的一种实施方式的资源搜索方法的示例流程图。
[0012]附图标记说明
[0013]10资源数据库 20处理模块 100服务器
【具体实施方式】
[0014]以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0015]下面将举例说明本发明的思想,但应当理解的这些示例为非局限性示例,本发明的保护范围不限于此:
[0016]为了更加清楚地说明本发明的思想,以本发明所提供的示例服务器进行详细地说明。
[0017]图1是根据本发明的一种实施方式的示例服务器的结构示意图,如图1所示,该服务器可以包括:资源数据库10;以及处理模块20,用于根据用户输入的词条在资源数据库10中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。
[0018]为了实现本发明的目的,服务器100首先需要建立资源数据库10,所述资源数据库1可以包括以下词汇中的至少一者:
[0019](I)多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语,例如“剧场版”可以为一个敏感词,并且该敏感词对应的资源类型为视频,即可以将“剧场版,视频”存储在数据库10中;
[0020](2)多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体,例如“花千骨”可以为一个命名实体,并且该命名实体还对应多种资源类型的权重值,例如,视频资源对应权重值为5000,应用程序(app)资源对应权重值为2000,音频资源对应权重值为1500,即可以将“花千骨,视频:5000,app: 2000,音频:1500”存储在数据库10中;再例如“武则天”可以为一个命名实体,并且该命名实体还对应多种资源类型的权重值,例如,视频资源对应权重值为6000,应用程序(app)资源对应权重值为1500,音频资源对应权重值为500,即可以将“武则天,视频:6000,app:1500,音频:500”存储在数据库1中;
[0021](3)多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值,例如“爸爸”和“麻将”可以分别为一个词语,并且所述词语还分别对应多种资源类型的权重值,即可以将“爸爸,视频:6000,app: 1200,音频:3000,,、“麻将,视频:500,app: 2500,音频:O”存储在数据库10中。其中,上述词汇的权重值越大表示与用户意图越相关,并且所述权重值根据TF-1DF(term frequency-1nverse document frequency)算法获得,该算法的计算与现有技术相似,为了不混淆本发明的保护范围,在此不再赘述。
[0022]应当理解的是,上述词汇以及权重值的示例仅用于说明本发明的思想而不用于限定本发明的保护范围,本领域技术人员可以根据实际情况对词汇和权重值进行适当地设定,本发明对此不进行限定。并且,本发明提供的资源数据库优选地包括上述三种词汇,但本领域技术人员也可以根据实际情况选择上述中的任一者及其组合。
[0023]当用户通过客户端设备(例如移动电话、计算机、平板电脑等)输入一个词条时,月艮务器的处理模块20可以根据用户输入的词条在资源数据库10中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。图2是根据本发明的一种实施方式的示例服务器的处理模块执行的示例流程图,如图2所示,具体地:
[0024]所述处理模块20首先执行步骤SI,即将用户输入的所述词条根据分词算法将所述词条分为多个词。优选地,所述分词算法可以为Friso算法等适当地分词算法,所述算法的计算与现有技术相似,为了不混淆本发明的保护范围,在此不再赘述;
[0025]接着,由于上述三种词汇与用户意图之间的相关性是从高到低的,因此为了精确地识别用户意图,首先可以判断分词后的多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一个敏感词是否匹配,即执行步骤S2;
[0026]在所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一个至少一者匹配的情况下(即此时用户输入的词条为包含敏感词),则将用户意图识别为与所述至少一个敏感词所对应的资源类型,即执行步骤S3,并可以显示排序后的资源。其中,当多个词分别与多个敏感词对应时(即两个以上的词在资源数据库中找到与其匹配的敏感词),处理模块20可以将用户意图识别为在资源数据库中第一个搜索到的匹配的敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源;
[0027]反之,在所述多个词与所述资源数据库中的所有敏感词均不匹配情况下(即此时用户输入的词条不包含敏感词),则需要执行步骤S4,即判断所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者是否匹配;
[0028]在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下(即此时用户输入的词条为包含命名实体),则将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源,即执行步骤S5,并可以显示排序后的资源。其中,当多个词分别与多个命名实体对应时(即两个以上的词在资源数据库中找到与其匹配的命名实体),处理模块20可以将计算这些命名实体的资源总权重值,并将用户意图识别为与具有最大资源总权重值的命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源,其中一个命名实体的资源总权值为其对应的多种资源类型的权重值的总和;
[0029]反之,在所述多个词与所述资源数据库中的所有命名实体均不匹配的情况下(SP此时用户输入的词条不包含命名实体),则需要执行步骤S6,即所述处理模块20需要判断所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一者是否匹配;
[0030]在所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一个词语匹配的情况下,则将用户意图识别为与所述至少一个词语所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述资源类型对应的资源,即执行步骤S7,并可以显示排序后的资源。当多个词分别与多个词语对应时(即两个以上的词在资源数据库中找到与其匹配的词语),处理模块20可以对这些词语对应的多种资源类型的权重值进行加权,并按照加权后的权重值显示资源;
[0031]反之,在所述多个词与所述资源数据库中的所有词语均不匹配的情况下(即此时用户输入的词条也不包含任何词语),则执行步骤S8按照默认的顺序排序搜索到的与多个词有关的资源。
[0032]处理模块20可以执行根据用户的输入执行上述步骤S1-S8,并可以按照上述排序显示搜索到的资源,之后可以通过网页发布并推送给客户端设备(例如移动电话、计算机、平板电脑等),这样就可以在客户端设备上显示按照用户意图排序的搜索到的多种资源。
[0033]下面列举一些实际使用时可能出现的实施例来进一步阐明本发明的上述思想,但应该理解的是,这些实施例仅用于说明本发明的思想,本发明并不局限于此,例如本领域技术人员可以在下面实施例的基础上设定各种词汇和用户输入:
[0034]实施例1
[0035]用户输入“**剧场版”,分词后得到的词中“剧场版”是敏感词,服务器100的处理模块20可以执行步骤S1-S3,即将用户意图识别为视频资源,因此,在搜索到资源后,处理模块20将与“**剧场版”相关的视频资源排列在搜索到的资源列表的最前端并推送给客户端设备。当用户输入多个敏感词时,例如用户输入的词条分词后得到“剧场版”和“游戏”,如果先匹配的是敏感词剧场版,则处理模块20可以将用户意图识别为在资源数据库中剧场版所对应的资源类型,并排序搜索到的与所述资源类型对应的资源,反之亦然。
[0036]实施例2
[0037]用户输入“花千骨第五集”,分词后得到的词中“花千骨”是命名实体,服务器100的处理模块20可以执行步骤S1-S5,即将用户意图识别为首先是视频资源、其次是app、然后是音频,因此,在搜索到资源后,处理模块20将与“花千骨第五集”相关的资源按照视频、app、音频的顺序排列并推送给客户端设备。当用户输入多个命名实体时,例如用户输入的词条分词后得到“花千骨”和“武则天”,处理模块20可以计算这两个命名实体的资源总权值,SP如上所述,花千骨在资源数据库中对应的资源类型的权重值分别为视频:5000,app:2000,音频:1500,资源总权值为8500;相似地,武则天在资源数据库中对应的资源类型的权重值分别为视频:6000,app:1500,音频:500,资源总权值为8000,由于花千骨的资源总权值最大,因此处理模块20将用户意图识别为与花千骨所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源,反之亦然。
[0038]实施例3
[0039]用户输入“爸爸回家”,分词后得到“爸爸”为词语“爸爸”(此时分词得到的词“回家”并不是资源数据库10中的词语),即服务器100的处理模块20可以执行步骤S1-S7,即将用户意图识别为词语“爸爸”对应的权重值。即将用户意图识别为首先是视频资源、其次是app、然后是音频,因此,在搜索到资源后,处理模块20将与“爸爸回家”相关的资源按照视频、app、音频的顺序排列并推送给客户端设备。
[0040]实施例4
[0041]用户输入“爸爸麻将”,分词得到词语“爸爸”和“麻将”,即服务器100的处理模块20可以执行步骤S1-S7,即将用户意图识别为词语“爸爸”和“麻将”的权重值的加权。即将用户意图识别为首先是视频资源、其次是app、然后是音频,因此,在搜索到资源后,处理模块20将与“爸爸麻将”相关的资源按照视频、app、音频的顺序排列并推送给客户端设备。
[0042]实施例5
[0043]用户输入“你在哪”,该词条分词得到的词既不是敏感词、命名实体、也不是词语,因此服务器100的处理模块20可以执行步骤S1-S8,即按照默认的顺序排序搜索到的资源并推送给客户端设备。
[0044]图3是根据本发明的一种实施方式的资源搜索方法的示例流程图,如图3所示,该方法可以包括以下步骤:
[0045]步骤1001,根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及
[0046]步骤1002,按照用户意图识别的结果排序搜索到的资源。
[0047]优选地,所述根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别包括:将用户输入的所述词条根据分词算法将所述词条分为多个词;以及根据所述多个词进行资源搜索和用户意图识别。
[0048]优选地,所述资源数据库包括多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语。
[0049]优选地,按照用户意图识别的结果排序搜索到的资源包括:所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一者匹配的情况下,将用户意图识别为与所述至少一个敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源。
[0050]优选地,所述资源数据库包括多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体。
[0051]优选地,按照用户意图识别的结果排序搜索到的资源包括:在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下,将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源。
[0052]优选地,所述资源数据库包括多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值。
[0053]优选地,按照用户意图识别的结果排序搜索到的资源包括:在所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一者的情况下,将用户意图识别为与所述至少一个词语所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述资源类型对应的资源。
[0054]应当理解的是,上述资源搜索方法的各个【具体实施方式】,均已在示例服务器的实施方式中做了详细地说明(如上所述),在此不再赘述。并且,本领域技术人员可以根据本发明的公开选择上述各种实施方式中的任一者,或者选择上述各种实施方式的组合来配置服务器,并且其他的替换实施方式也落入本发明的保护范围。
[0055]采用本发明提供的资源搜索方法以及服务器,能够实现将与用户输入的词条相关的所有类型的资源(例如包括视频、应用程序、音频等资源)按照用户的意图排序,例如,如果用户期望的是视频资源,则可以在大量搜索到的资源中,将视频资源排列在最前端,这样用户可以方便、快速地找到自己需要的资源,在节约了时间的同时,也大大提高了用户体验。
[0056]以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
[0057]另外需要说明的是,在上述【具体实施方式】中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
[0058]此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
【主权项】
1.一种资源搜索方法,其特征在于,该方法包括: 根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及 按照用户意图识别的结果排序搜索到的资源。2.根据权利要求1所述的方法,其特征在于,所述根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别包括: 将用户输入的所述词条根据分词算法将所述词条分为多个词;以及 根据所述多个词进行资源搜索和用户意图识别。3.根据权利要求2所述的方法,其特征在于,所述资源数据库包括多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语。4.根据权利要求3所述的方法,其特征在于,按照用户意图识别的结果排序搜索到的资源包括: 所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一者匹配的情况下,将用户意图识别为与所述至少一个敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源。5.根据权利要求4所述的方法,其特征在于,所述资源数据库包括多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体。6.根据权利要求5所述的方法,其特征在于,按照用户意图识别的结果排序搜索到的资源包括: 在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下,将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源。7.根据权利要求6所述的方法,其特征在于,所述资源数据库包括多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值。8.根据权利要求7所述的方法,其特征在于,按照用户意图识别的结果排序搜索到的资源包括: 在所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一者的情况下,将用户意图识别为与所述至少一个词语所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述资源类型对应的资源。9.一种服务器,其特征在于,该服务器包括: 资源数据库;以及 处理模块,用于根据用户输入的词条在资源数据库中进行资源搜索和用户意图识别;以及用于按照用户意图识别的结果排序搜索到的资源。10.根据权利要求9所述的服务器,其特征在于,所述处理模块具体用于: 将用户输入的所述词条根据分词算法将所述词条分为多个词;以及 根据所述多个词进行资源搜索和用户意图识别。11.根据权利要求10所述的服务器,其特征在于,所述资源数据库包括多个敏感词以及多个敏感词中的每一个敏感词所对应的资源类型,其中所述敏感词为能够标识资源类型的词语。12.根据权利要求11所述的服务器,其特征在于,所述处理模块具体用于: 所述多个词中的至少一者与所述资源数据库中的多个敏感词中的至少一者匹配的情况下,将用户意图识别为与所述至少一个敏感词所对应的资源类型,并排序搜索到的与所述资源类型对应的资源。13.根据权利要求12所述的服务器,其特征在于,所述资源数据库包括多个命名实体以及多个命名实体中的每一个命名实体所对应的多种资源类型的权重值,其中所述命名实体为以名称为标识的实体。14.根据权利要求13所述的服务器,其特征在于,所述处理模块具体用于: 在所述多个词中的至少一者与所述资源数据库中的多个命名实体中的至少一者匹配的情况下,将用户意图识别为与所述至少一个命名实体所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述多种资源类型对应的多个资源。15.根据权利要求14所述的服务器,其特征在于,所述资源数据库包括多个词语以及多个词语中的每一个词语所对应的多种资源类型的权重值。16.根据权利要求15所述的服务器,其特征在于,所述处理模块具体用于: 在所述多个词中的至少一者与所述资源数据库中的多个词语中的至少一者的情况下,将用户意图识别为与所述至少一个词语所对应的多种资源类型的权重值,并按照权重值排序搜索到的与所述资源类型对应的资源。
【文档编号】G06F17/30GK105893427SQ201510887858
【公开日】2016年8月24日
【申请日】2015年12月7日
【发明人】王乙丁
【申请人】乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1