一种搜索方法和装置的制造方法
【专利摘要】本发明公开了一种搜索方法和装置。该方法包括:获取用户输入的搜索词中的规避词;判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词;根据所述最终搜索词进行搜索以生成搜索结果列表。本发明实施例提供一种搜索方法和装置,以优化现有搜索方案,提升搜索结果的合理性。
【专利说明】
一种搜索方法和装置
技术领域
[0001 ]本发明涉及搜索技术领域,尤其涉及一种搜索方法和装置。
【背景技术】
[0002]随着智能时代的到来,智能终端已经成为人们日常生活中不可或缺的工具,智能终端的智能特性,使其显得方便、高效。人们通常可以通过下载并安装不同类型的应用软件来实现不同的生活需求。例如,下载购物类应用软件实现购物的需求。
[0003]现在,不同的用户需求都会对应有大量的应用软件,因此,通常会将各类应用软件集合并设置一个应用市场,用户可以在应用市场中搜索需要的应用软件。用户在搜索应用软件时,通常输入搜索词,后台服务器根据所述搜索词确定搜索结果列表,反馈展示在显示屏上。然而,用户输入的搜索词中,会包含很多非关键的词汇,导致搜索结果列表中出现很多根据非关键的词汇得到的搜索结果,而用户并不需要这些搜索结果。
【发明内容】
[0004]有鉴于此,本发明实施例提供一种搜索方法和装置,以优化现有搜索方案,提升搜索结果的合理性。
[0005]第一方面,本发明实施例提供了一种搜索方法,包括:
[0006]获取用户输入的搜索词中的规避词;
[0007]判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词;
[0008]根据所述最终搜索词进行搜索以生成搜索结果列表。
[0009]第二方面,本发明实施例还提供了一种搜索装置,包括:
[0010]获取模块,用于获取用户输入的搜索词中的规避词;
[0011]判断模块,用于判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词;
[0012]搜索模块,用于根据所述最终搜索词进行搜索以生成搜索结果列表。
[0013]本发明实施例提供的一种搜索方法和装置,通过获取用户输入的搜索词中的规避词,进一步判断是否需要删除所述规避词以得到最终搜索词,根据所述最终搜索词进行搜索以生成搜索结果列表,若判断需要在搜索词中删除规避词,则可以保证最终搜索词中没有需要规避的词汇,即没有非关键词,使得搜索结果列表中没有关于非关键词的搜索结果,更好的满足用户的实际需要,若判断不需要在搜索词中删除规避词,则可以保证最终搜索词的准确性,防止误删的情况,从而保证搜索结果的合理性。
【附图说明】
[0014]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0015]图1为本发明实施例一提供的一种搜索方法的流程图;
[0016]图2为本发明实施例二提供的一种搜索方法的流程图;
[0017]图3为本发明实施例三提供的一种搜索方法的流程图;
[0018]图4为本发明实施例三提供的一种非规避词判断方法的流程图;
[0019]图5为本发明实施例四提供的一种搜索装置的结构示意图。
【具体实施方式】
[0020]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0021 ] 实施例一
[0022]图1为本发明实施例一提供的一种搜索方法的流程图。本实施例提供的搜索方法适用于获取用户输入的搜索词进行搜索的情况。本实施例提供的搜索方法可以由搜索装置执行,所述搜索装置可以由软件和/或硬件来实现,并集成在进行搜索的后台服务器中。参考图1,该搜索方法包括:
[0023]步骤110、获取用户输入的搜索词中的规避词。
[0024]其中,所述规避词为搜索词中非关键词,且规避词的字数不作限定。规避词可以由用于搜索的后台服务器进行设定,也可以获取人为输入的词汇进行设定。具体的设定方式本实施例不作限定,例如,可以根据某一词汇得到搜索结果后被用户选择的次数与该词汇被搜索的次数的比值,将比例低于3%的词汇设定为规避词。进一步的,不同的应用场景,规避词的设定方式可以不同。例如,在网页搜索中,搜索词“微信客户端”中客户端就不能被设定为规避词,在应用下载类的应用软件中搜索时,搜索词“微信客户端”中客户端就可以被设定为规避词。
[0025]示例性的,接收客户端发送的用户输入的搜索词,并确定所述搜索词中的规避词。其中,所述搜索词中可以包含至少一个规避词。
[0026]进一步的,规避词的确定方式可以是将搜索词逐字与预先设定的规避词一一匹配,以确定规避词;确定方式也可以拆分搜索词,将拆分后的各子搜索词与预先设定的规避词一一匹配,以确定规避词。
[0027]步骤120、判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词。
[0028]示例性的,由于有些词汇被设定为规避词,但是在某些情境下,该词汇可能为关键词,若将该词汇作为规避词删除,则会影响搜索结果的准确度。因此需要进一步的判断获取的规避词是否需要删除,若需要删除,就在搜索词中删除该规避词,得到最终搜索词,若不需要删除,就在搜索词中保留该规避词,得到最终搜索词。
[0029]可选的,当搜索词中包含两个以上规避词时,依次判断各规避词是否需要删除,并根据判断结果得到最终搜索词。
[0030]进一步的,判断搜索词中的规避词是否需要删除的方法可以为在特定搜索场景下,根据规避词在搜索词中的位置判断规避词是否需要删除,例如,在音乐搜索场景下,设定“歌手”在搜索词的起始位置时为规避词,则获取用户输入的搜索词为“歌手周杰伦”时,先获取规避词“歌手”,再判断“歌手”是否在搜索词的起始位置,若“歌手”在搜索词的起始位置,则删除“歌手”,确定最终搜索词为“周杰伦”,若搜索词为“2015年十佳歌手”时,先获取规避词“歌手”,再判断“歌手”是否在搜索词的起始位置,若“歌手”不在搜索词的起始位置,则保留“歌手”,确定最终搜索词为“2015年十佳歌手”;判断方法还可以为在特定搜索场景下,结合规避词在搜索词的语境,判断是否需要删除该规避词。
[0031]进一步的,确定最终搜索词为后台服务器的操作,在客户端屏幕的搜索框中显示的仍为用户输入的搜索词。
[0032]步骤130、根据所述最终搜索词进行搜索以生成搜索结果列表。
[0033]示例性的,根据最终搜索词进行搜索,并生成搜索结果列表,将该搜索结果列表反馈给输入搜索词的客户端。该客户端可以将该搜索结果列表显示在屏幕上。
[0034]可选的,生成的搜索结果列表中的各搜索结果可以根据用户选择的次数高低进行排序。
[0035]本发明实施例一提供的一种搜索方法,通过获取用户输入的搜索词中的规避词,进一步判断是否需要删除所述规避词以得到最终搜索词,根据所述最终搜索词进行搜索以生成搜索结果列表,若判断需要在搜索词中删除规避词,则可以保证最终搜索词中没有需要规避的词汇,即没有非关键词,使得搜索结果列表中没有关于非关键词的搜索结果,更好的满足用户的实际需要,若判断不需要在搜索词中删除规避词,则可以保证最终搜索词的准确性,防止误删的情况,从而保证搜索结果的合理性。
[0036]上述实施例的基础上,所述获取用户输入的搜索词中的规避词可以包括:
[0037]获取用户通过应用市场搜索框输入的搜索词中的规避词。
[0038]其中,应用市场为安装在客户端中的应用导航类的应用软件。用户可以通过应用市场搜索并下载应用软件。
[0039]示例性的,获取用户通过应用市场搜索框输入的搜索词,并提取搜索词中的规避词。可选的,当应用场景为应用市场这类应用软件时,应用市场对应的后台服务器设定的规避词可以为“客户端”、“下载”等。具体的,规避词具体的设定规则可以为确定该词汇对应的搜索结果被用户下载的次数与该词汇被搜索的次数的比值,将比值低于一定值的词汇确定为规避词;规避词设定规则也可以由工作人员进行设定。
[0040]实施例二
[0041]图2为本发明实施例二提供的一种搜索方法的流程图。本实施例是在上述实施例的基础上,对获取用户输入的搜索词中的规避词的步骤作进一步的限定。
[0042]进一步的,所述获取用户输入的搜索词中的规避词包括:获取用户输入的搜索词;将所述搜索词与规避词数据库存储的词汇进行匹配以确定至少一个规避词。参考图2,该搜索方法包括:
[0043]步骤210、获取用户输入的搜索词。
[0044]步骤220、将所述搜索词与规避词数据库存储的词汇进行匹配以确定至少一个规避词。
[0045]其中,规避词数据库为预先存储在后台服务器的数据库。不同的后台服务器中规避词数据库存储的词汇可以不相同。进一步的,规避词数据库可以定时进行更新,例如,每3个月更新规避词数据库,或者每I个月更新规避词数据库。
[0046]示例性的,搜索词中可能包含很多词汇,本实施例中优选的匹配方式为将搜索词逐字与规避词数据库中存储的词汇进行匹配,当搜索词中包含规避词数据库中的词汇时,获取搜索词中的该词汇作为规避词。例如,搜索词为“微信客户端”时,规避词数据库中存有“客户”这一词汇,当搜索词与规避词数据库中词汇进行匹配时,就会将“客户”从搜索词中提取出来,确定为该搜索词的规避词。
[0047]步骤230、判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词。
[0048]步骤240、根据所述最终搜索词进行搜索以生成搜索结果列表。
[0049]本发明实施例二提供的一种搜索方法,通过获取用户输入的搜索词,并与规避词数据库进行匹配,以确定搜索词中的规避词,进一步判断是否需要删除所述规避词以得到最终搜索词,根据得到的最终搜索词进行搜索以生成搜索结果列表,若判断需要在搜索词中删除规避词,则可以保证最终搜索词中没有需要规避的词汇,即没有非关键词,使得搜索结果列表中没有关于非关键词的搜索结果,更好的满足用户的实际需要,若判断不需要在搜索词中删除规避词,则可以保证最终搜索词的准确性,防止误删的情况,从而保证搜索结果的合理性。
[0050]实施例三
[0051]图3为本发明实施例三提供的一种搜索方法的流程图。本实施例在上述实施例的基础上,对判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词的步骤作了进一步的限定。
[0052]进一步的,所述判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词包括:确定针对所述规避词在所述规避词数据库中存储的规避类别;在所述搜索词中,判断所述规避词是否满足所述规避类别,若满足,则删除所述规避词,得到最终搜索词,若不满足,则保留所述规避词,得到最终搜索词。参考图3,该搜索方法包括:
[0053]步骤310、获取用户输入的搜索词中的规避词。
[0054]步骤320、确定针对所述规避词在规避词数据库中存储的规避类别。
[0055]具体的,规避类别为规避词在满足该规避类别的条件下,被规避的概率最大。设置规避类别可以保证确定规避词的准确度。
[0056]示例性的,规避词数据库中存储有设定规避的各词汇。进一步的,设定规避的各词汇后,确定各词汇的规避类别,并将规避类别关联存储在规避词数据库中。具体的,得到用户输入搜索词中的规避词后,可以在规避词数据库中查到该规避词对应的规避类别。
[0057]其中,规避类别的设定方式可以为:按照该词汇在搜索词中的位置进行划分;也可以按照词汇的词性进行划分。优选为,按照该词汇在搜索词中的位置进行划分。
[0058]进一步的,若按照词汇在搜索词中的位置进行划分,则规避类别可以包括:前缀去词类别、包含去词类别和后缀去词类别。其中,前缀去词类别为该词汇在搜索词的起始位置时,被设为规避词。包含去词类别为该词在搜索词的中间位置,即该词并不在搜索词的起始位置,也不在搜索词的末尾位置,此时被设为规避词。后缀去词类别为该词汇在搜索词的末尾位置时,被设为规避词。
[0059]步骤330、在所述搜索词中,判断所述规避词是否满足所述规避类别。若满足,则执行步骤340,若不满足,则执行步骤350。
[0060]进一步的,确认规避词数据库中查找到规避词的规避类别后,在用户输入的搜索词中,确定该规避词是否满足在规避词数据库中查到的规避类别。
[0061]步骤340、若满足,则删除所述规避词,得到最终搜索词。跳转执行步骤360。
[0062]例如,在应用市场的场景中,后台服务器的规避词数据库中存有“客户端”,且该词的规避类别为后缀去词类别,若获取搜索词为“微信客户端”,则先确定该搜索词中的规避词“客户端”,进一步判断“客户端”在“微信客户端”中是否满足后缀去词类别,判断结果为满足后缀去词类别,则去掉“客户端”得到最终搜索词“微信”,此时,后台服务器搜索“微信”得到对应的搜索结果列表并反馈给客户端中的应用市场。
[0063]步骤350、若不满足,则保留所述规避词,得到最终搜索词。执行步骤360。
[0064]步骤360、根据所述最终搜索词进行搜索以生成搜索结果列表。
[0065]本发明实施例三提供的一种搜索方法,通过获取用户输入的搜索词中的规避词对应的规避类别,进一步判断是否需要删除所述规避词以得到最终搜索词,若判断需要在搜索词中删除规避词,则可以保证最终搜索词中没有需要规避的词汇,即没有非关键词,使得搜索结果列表中没有关于非关键词的搜索结果,更好的满足用户的实际需要,若判断不需要在搜索词中删除规避词,则可以保证最终搜索词的准确性,防止误删的情况,从而保证搜索结果列表的合理性。
[0066]进一步的,图4为本发明实施例三提供的一种非规避词判断方法的流程图,参考图4,若满足,则删除所述规避词,得到最终搜索词可以包括:
[0067]步骤341、若满足,则判断所述搜索词中是否包含非规避词。若是,则执行步骤342,若否,则执行步骤345。
[0068]具体的,一些规避词在特定的条件下,可能为搜索词中的关键词,不能被规避掉。此时,设定非规避词数据库,用于进一步判断规避词是否需要删除。
[0069]其中,非规避词数据库可以是后台服务器根据数据统计进行设定的。
[0070]示例性的,当搜索词中的规避词满足对应的规避类别时,将搜索词逐字与非规避词数据库进行匹配,以确定搜索词中是否包含非规避词。
[0071]可选的,搜索词中可以包含至少一个非规避词,且非规避词的字数不作限定。
[0072]步骤342、若包含非规避词,则判断所述非规避词中是否包含所述规避词。若包含,则执行步骤343,若不包含,则执行步骤344。
[0073]示例性的,若搜索词中包含非规避词,则说明非规避词不能被删掉,此时,判断非规避词是否包含搜索词中的规避词,其中,该规避词满足规避类别。
[0074]步骤343、若包含所述规避词,则保留所述规避词,得到最终搜索词。
[0075]具体的,若搜索词中的非规避词包含满足规避类型的规避词,则说明该规避词不能被去掉,此时保留该规避词。
[0076]进一步的,非规避词包含规避词可以为非规避词中包含规避词的全部字,也可以为非规避词中包含规避词的部分字。
[0077]例如,在应用市场的场景下,设定规避词为“下载”和“大量”,且规避类别分别为包含去词类别和前缀去词类别,非规避词为“下载器”,若搜索词为“大量歌曲下载器”,先提取并确定规避词“下载”和“大量”满足规避类型,进一步的,确定“大量歌曲下载器”中包含非规避词“下载器”,且“下载器”中包含规避词“下载”,此时保留规避词“下载”,得到最终搜索词为“歌曲下载器”。
[0078]步骤344、若不包含所述规避词,则删除所述规避词,得到最终搜索词。
[0079]步骤345、若不包含非规避词,则删除所述规避词,得到最终搜索词。
[0080]可选的,判断所述搜索词中是否包含非规避词也可以放在确定规避词是否满足规避类别之前,此时,先判断搜索词中是否包含非规避词,且判断各非规避词中是否包含规避词,对于非规避词中不包含的规避词进行规避类别的判断。
[0081]可选的,判断所述搜索词中是否包含非规避词还可以放在获取用户输入的搜索词中的规避词之前,此时,先判断用户输入的搜索词中是否含有非规避词,若含有非规避词,则获取除去非规避词后的搜索词中的各规避词。
[0082]实施例四
[0083]图5为本发明实施例四提供的一种搜索装置的结构示意图。参考图5,所述搜索装置可以包括:获取模块501、判断模块502和搜索模块503。
[0084]其中,获取模块501,用于获取用户输入的搜索词中的规避词;判断模块502,用于判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词;搜索模块503,用于根据所述最终搜索词进行搜索以生成搜索结果列表。
[0085]本发明实施例四提供的一种搜索装置,通过获取用户输入的搜索词中的规避词,进一步判断是否需要删除所述规避词以得到最终搜索词,根据所述最终搜索词进行搜索以生成搜索结果列表,若判断需要在搜索词中删除规避词,则可以保证最终搜索词中没有需要规避的词汇,即没有非关键词,使得搜索结果列表中没有关于非关键词的搜索结果,更好的满足用户的实际需要,若判断不需要在搜索词中删除规避词,则可以保证最终搜索词的准确性,防止误删的情况,从而保证搜索结果的合理性。
[0086]上述各实施例的基础上,所述获取模块501可以包括:搜索词获取单元,用于获取用户输入的搜索词;匹配单元,用于将所述搜索词与规避词数据库存储的词汇进行匹配以确定至少一个规避词。
[0087]上述各实施例的基础上,所述判断模块502可以包括:确定单元,用于确定针对所述规避词在规避词数据库中存储的规避类别;类别判断单元,用于在所述搜索词中,判断所述规避词是否满足所述规避类别,若满足,则删除所述规避词,得到最终搜索词,若不满足,则保留所述规避词,得到最终搜索词。
[0088]上述各实施例的基础上,所述规避类别可以包括:前缀去词类别、包含去词类别、和后缀去词类别。
[0089]上述各实施例的基础上,所述类别判断单元可以包括:第一判断子单元,用于若满足,则判断所述搜索词中是否包含非规避词;第二判断子单元,用于若包含非规避词,则判断所述非规避词中是否包含所述规避词,若包含所述规避词,则保留所述规避词,得到最终搜索词,若不包含所述规避词,则删除所述规避词,得到最终搜索词;删除子单元,用于若不包含非规避词,则删除所述规避词,得到最终搜索词。
[0090]上述各实施例的基础上,所述获取模块501具体可以用于:获取用户通过应用市场搜索框输入的搜索词中的规避词。
[0091]本发明实施例四提供的搜索装置可以用于执行上述任意实施例提供的搜索方法,具备相应的功能和有益效果。
[0092]注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【主权项】
1.一种搜索方法,其特征在于,包括: 获取用户输入的搜索词中的规避词; 判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词; 根据所述最终搜索词进行搜索以生成搜索结果列表。2.根据权利要求1所述的搜索方法,其特征在于,获取用户输入的搜索词中的规避词包括: 获取用户输入的搜索词; 将所述搜索词与规避词数据库存储的词汇进行匹配以确定至少一个规避词。3.根据权利要求1所述的搜索方法,其特征在于,判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词包括: 确定针对所述规避词在规避词数据库中存储的规避类别; 在所述搜索词中,判断所述规避词是否满足所述规避类别,若满足,则删除所述规避词,得到最终搜索词,若不满足,则保留所述规避词,得到最终搜索词。4.根据权利要求3所述的搜索方法,其特征在于,所述规避类别包括:前缀去词类别、包含去词类别、和后缀去词类别。5.根据权利要求3所述的搜索方法,其特征在于,若满足,则删除所述规避词,得到最终搜索词包括: 若满足,则判断所述搜索词中是否包含非规避词; 若包含非规避词,则判断所述非规避词中是否包含所述规避词,若包含所述规避词,则保留所述规避词,得到最终搜索词,若不包含所述规避词,则删除所述规避词,得到最终搜索词; 若不包含非规避词,则删除所述规避词,得到最终搜索词。6.根据权利要求1所述的搜索方法,其特征在于,获取用户输入的搜索词中的规避词包括: 获取用户通过应用市场搜索框输入的搜索词中的规避词。7.一种搜索装置,其特征在于,包括: 获取模块,用于获取用户输入的搜索词中的规避词; 判断模块,用于判断是否需要在搜索词中删除所述规避词,并根据判断结果得到最终搜索词; 搜索模块,用于根据所述最终搜索词进行搜索以生成搜索结果列表。8.根据权利要求7所述的搜索装置,其特征在于,所述获取模块包括: 搜索词获取单元,用于获取用户输入的搜索词; 匹配单元,用于将所述搜索词与规避词数据库存储的词汇进行匹配以确定至少一个规避词。9.根据权利要求7所述的搜索装置,其特征在于,所述判断模块包括: 确定单元,用于确定针对所述规避词在规避词数据库中存储的规避类别; 类别判断单元,用于在所述搜索词中,判断所述规避词是否满足所述规避类别,若满足,则删除所述规避词,得到最终搜索词,若不满足,则保留所述规避词,得到最终搜索词。10.根据权利要求9所述的搜索装置,其特征在于,所述规避类别包括:前缀去词类别、包含去词类别、和后缀去词类别。11.根据权利要求9所述的搜索装置,其特征在于,所述类别判断单元包括: 第一判断子单元,用于若满足,则判断所述搜索词中是否包含非规避词; 第二判断子单元,用于若包含非规避词,则判断所述非规避词中是否包含所述规避词,若包含所述规避词,则保留所述规避词,得到最终搜索词,若不包含所述规避词,则删除所述规避词,得到最终搜索词; 删除子单元,用于若不包含非规避词,则删除所述规避词,得到最终搜索词。12.根据权利要求7所述的搜索装置,其特征在于,所述获取模块具体用于: 获取用户通过应用市场搜索框输入的搜索词中的规避词。
【文档编号】G06F17/30GK105893592SQ201610225941
【公开日】2016年8月24日
【申请日】2016年4月12日
【发明人】周德海
【申请人】广东欧珀移动通信有限公司