一种文本检索方法和装置的制造方法
【专利摘要】本申请提供一种文本检索方法和装置。所述方法包括:在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词;显示所述初始文本中的各个关键词;在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进行检索。通过本申请的技术方案,可以有效提升用户的检索效率以及检索体验。
【专利说明】
一种文本检索方法和装置
技术领域
[0001]本申请涉及信息检索领域,尤其涉及一种文本检索方法和装置。【背景技术】
[0002]随着互联网技术的发展,越来越多的人们通过网络获取信息,比如:用户可以通过移动终端或者PC终端的搜索引擎进行信息检索。在一次信息获取的过程中,用户往往要进行多次检索才能获取到自己想要的信息,如何提升用户的检索效率以及检索体验已成为亟待解决的问题。
【发明内容】
[0003]有鉴于此,本申请提供一种文本检索方法和装置。
[0004]具体地,本申请是通过如下技术方案实现的:
[0005]—种文本检索方法,所述方法包括:
[0006]在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词;
[0007]显不所述初始文本中的各个关键词;
[0008]在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进行检索。
[0009]进一步地,在显示所述初始文本中的各个关键词后,还包括:[〇〇1〇]如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框;
[0011]所述针对显示的多个关键词的检索指令,还包括:
[0012]在通过所述多选框选中多个关键词后输入的检索指令。
[0013]进一步地,在显示所述初始文本中的各个关键词后,还包括:
[0014]如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的删除选项;
[0015]所述针对显示的多个关键词的检索指令,还包括:
[0016]在通过所述删除选项删除一个或多个关键词后输入的检索指令。
[0017]进一步地,所述显示所述初始文本中的各个关键词,包括:
[0018]在确定所述关键词为结果相关词时,显示所述关键词。
[0019]进一步地,所述显示所述初始文本中的各个关键词,包括:根据预设的规则对所述初始文本中的各个关键词进彳丁排序;根据排序结果显不所述关键词。
[0020]进一步地,所述显示所述初始文本中的各个关键词,包括:以不同的显示属性显示所述初始文本中的各个关键词。
[0021]进一步地,所述显示所述初始文本中的各个关键词,包括:
[0022]以不同的颜色高亮显示所述初始文本中的各个关键词。
[0023]进一步地,所述显示属性包括:字体、颜色、背景、边框以及亮度中的一种或多种。
[0024]—种文本检索装置,所述装置包括:
[0025]划分单元,在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词;
[0026]显示单元,显示所述初始文本中的各个关键词;
[0027]检索单元,在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进行检索。
[0028]进一步地,所述装置还包括:
[0029]第一生成单元,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框;
[0030]所述针对显示的多个关键词的检索指令,还包括:在通过所述多选框选中多个关键词后输入的检索指令。
[0031]进一步地,所述装置还包括:
[0032]第二生成单元,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的删除选项;
[0033]所述针对显示的多个关键词的检索指令,还包括:
[0034]在通过所述删除选项删除一个或多个关键词后输入的检索指令。
[0035]进一步地,所述显示单元,具体在确定所述关键词为结果相关词时,显示所述关键 。
[0036]进一步地,所述显示单元,具体根据预设的规则对所述初始文本中的各个关键词进行排序,并根据排序结果显示所述关键词。
[0037]进一步地,所述显示单元,具体以不同的显示属性显示所述初始文本中的各个关键词。
[0038]进一步地,所述显示单元,具体以不同的颜色高亮显示所述初始文本中的各个关键词。
[0039]进一步地,所述显示属性包括:字体、颜色、背景、边框以及亮度中的一种或多种。
[0040]由以上描述可以看出,本申请终端可以将用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词,然后显示所述关键词,以供用户选择,并可以针对用户选中的一个或多个关键词再次进行检索。整个过程无需用户重新输入关键词,进而有效提升用户的检索效率以及检索体验。【附图说明】
[0041]图1是本申请一示例性实施例示出的一种文本检索方法的流程图。
[0042]图2是本申请一示例性实施例示出的一种检索界面示意图。
[0043]图3是本申请一示例性实施例示出的另一种检索界面示意图。
[0044]图4是本申请一示例性实施例示出的另一种检索界面示意图。
[0045]图5是本申请一示例性实施例示出的另一种检索界面示意图。
[0046]图6是本申请一示例性实施例示出的一种终端的结构示意图。
[0047]图7是本申请一示例性实施例示出的一种文本检索装置的结构示意图。【具体实施方式】
[0048] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0049] 在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。 在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0050] 应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当…… 时”或“响应于确定”。
[0051]图1是本申请一示例性实施例示出的一种文本检索方法的流程图。
[0052] 请参考图1,所述文本检索方法可以用于终端中,所述终端包括有:移动终端和PC 终端,所述方法包括以下步骤:
[0053] 步骤101,在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词。
[0054] 在本实施例中,用户可以通过终端中装载的浏览器访问各类搜索引擎,用户也可以通过便携式移动终端中装载的搜索引擎类APP(Applicati〇n,应用软件)来访问所述搜索引擎,本申请对此不作特殊限制。用户可以在所述搜索引擎提供的检索框中输入要检索的文本,然后可以通过点击检索按钮以进行针对该文本的检索。在本申请中,将用户进行首次检索时输入的文本称为初始文本。
[0055] 请参考图2,本申请一种检索界面示意图。用户可以在检索框中输入“2014中国网络营销大趋势白皮书”,然后可以通过点击“Search”按键以对“2014中国网络营销大趋势白皮书”进行检索,其中,文本“2014中国网络营销大趋势白皮书”为初始文本。
[0056] 在本步骤中,在接收到用户针对所述初始文本的检索指令后,对所述初始文本进行分词划分,以得到所述初始文本包含的关键词。具体地,可以根据预先存储的词库对所述初始文本进行分词划分,当然,也可以采用相关技术中提供的分词开源工具,诸如ICTCLAS、 SCWS等,本申请对此不作特殊限制。
[0057] 仍以图2所示的初始文本为例,在本步骤中,可以将初始文本“2014中国网络营销大趋势白皮书”划分为6个关键词,依次为:“ 2014”、“中国”、“网络”、“营销”、“大趋势”以及“白皮书”。
[0058] 步骤102,显不所述初始文本中的各个关键词。
[0059]基于前述步骤101,在通过分词得到所述初始文本包含的关键词后,在本步骤中, 显示所述初始文本中的各个关键词,以便用户选择。优选地,在本步骤中,可以以不同的显示属性显示所述各个关键词,以便于用户识别。所述显示属性可以包括:字体、颜色、背景、 边框以及亮度中的一种或多种。比如:可以以不同的字体显示所述初始文本中的各个关键词,也可以以不同的背景显示所述初始文本中的各个关键词,本申请对此不作特殊限制。
[0060]在本申请一可选的实施例中,可以以不同的颜色高亮显示所述初始文本中的各个关键词。请参考图3,本申请另一种检索界面示意图,如图3所示,可以以不同的颜色高亮显示初始文本“2014中国网络营销大趋势白皮书”所包含的6个关键词。
[0061]进一步地,在本申请另一可选实施例中,在得到所述初始文本包含的关键词后,可以先判断所述关键词是否为结果相关词,如果确定所述关键词为结果相关词,则显示所述关键词。所述结果相关词是会对检索结果产生影响。举例来说,假设所述初始文本为“去长城的路线”,基于步骤101可以将该初始文本划分为4个关键词,依次为:“去”、“长城”、“的” 以及“路线”,其中,关键词“的”不涉及实质内容,其有无不会对检索结果产生影响,所以关键词“的”不是结果相关词,在本实施例中,针对初始文本“去长城的路线”,在步骤102中可以显示关键词“去”、“长城”以及“路线”,对于关键词“的”可以不进行显示。
[0062]较为简单的,在实际的实现中,鉴于结果相关词的数量远远大于类似于“的”这类与结果无关的词的数量,所以开发人员可以预先设置一个结果无关词的列表,在得到所述初始文本包含的关键词后,判断所述关键词是否命中所述结果无关词的列表,然后显示确定未命中所述结果无关词的列表的关键词。在本实施例中,增加对关键词的判断,在确定所述关键词为结果相关词时,显示所述关键词,可以进一步提升用户的检索体验。
[0063]更进一步地,在本申请另一可选实施例中,在得到所述初始文本包含的关键词后, 可以先根据预设的规则对所述关键词进行排序,然后根据排序结果显示所述关键词。比如: 可以按照检索热度由高到低的顺序对所述关键词进行排序,然后根据该排序结果显示所述关键词。当然,本领域技术人员也可以采取其他的规则对所述关键词进行排序,本申请对此不作特殊限制。
[0064]步骤103,在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进行检索。
[0065]基于前述步骤102,在显示所述初始文本中的各个关键词后,用户可以根据需要选择所述初始文本中的一个或者多个关键词继续进行检索。
[0066]在本申请一实施例中,所述针对所述关键词的检索指令包括:选中某一个关键词。 具体地,如果用户需要检索所述初始文本中的某一个关键词,用户可以选中该关键词,终端会基于用户选择的该关键词进行检索。比如:对于PC终端,用户可以通过鼠标等外接设备点击所述关键词以实现对该关键词的检索。对于移动终端,用户可以通过触摸屏点击所述关键词以实现对该关键词的检索,当然,用户还可以通过语音等方式选中所述关键词,本申请对比不作特殊限制。仍以图3所示的关键词为例,如果用户选中关键词“营销”,则终端基于关键词“营销”再次进行检索。
[0067]在本申请另一可选实施例中,所述针对所述关键词的检索指令包括:选中多个关键词后输入的检索指令。具体地,如果用户需要检索所述初始文本中两个或者两个以上的关键词,则用户需要选中所述两个或者两个以上的关键词。请参考图4,本申请另一种检索界面示意图,在显示所述初始文本中的各个关键词以后,如果接收到用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框,以供用户选择。用户可以通过点击等方式选择需要再次进行检索的关键词,并在选好后点击检索按钮以实现对检索指令的输入。假设,用户需要再次检索关键词“网络”和“营销”,则用户选中关键词“网络”和“营销”后,可以生成如图5所示的检索界面示意图,然后用户可以点击“Search”按键,终端会基于关键词“网络”和“营销”再次进行检索。
[0068] 可选的,如果接收到用户点击检索框空白位置的操作,也可以为所述关键词生成对应的删除选项,用户可以通过所述删除选项删除不想检索的关键词,以实现保留需要再次进行检索的关键词。仍以图3所示的检索界面示意图为例,假设,用户需要再次检索关键词“中国”、“网络”、“营销”以及“白皮书”,则用户可以删除关键词“2014”以及“大趋势”,然后点击“Search”按键。当然,本领域技术人员也可以提供其他的方式以供用户选中多个关键词,本申请对此不作限制。
[0069]由以上描述可以看出,本申请终端可以将用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词,然后显示所述关键词,以供用户选择,并可以针对用户选中的一个或多个关键词再次进行检索。整个过程无需用户重新输入关键词,进而有效提升用户的检索效率以及检索体验。
[0070]与本申请文本检索方法的实施例相对应,本申请还提供一种文本检索装置。本申请所述的装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,本申请文本检索装置作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。
[0071]请参考图6和图7,本申请提供一种文本检索装置600,所述装置600可以应用于终端上,包括有:划分单元601、显示单元602、检索单元603、第一生成单元604以及第二生成单元605。
[0072] 其中,所述划分单元601,在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文本包含的关键词。
[0073] 所述显示单元602,显示所述初始文本中的各个关键词。
[0074] 所述检索单元603,在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进行检索。
[0075] 所述第一生成单元604,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框;
[0076] 所述针对显示的多个关键词的检索指令,还包括:在通过所述多选框选中多个关键词后输入的检索指令。
[0077] 所述第二生成单元605,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的删除选项;
[0078] 所述针对显示的多个关键词的检索指令,还包括:在通过所述删除选项删除一个或多个关键词后输入的检索指令。
[0079] 进一步地,所述显示单元602,具体在确定所述关键词为结果相关词时,显示所述关键词。
[0080] 进一步地,所述显示单元602,具体根据预设的规则对所述初始文本中的各个关键词进行排序,并根据排序结果显示所述关键词。
[0081] 进一步地,所述显示单元602,具体以不同的显示属性显示所述初始文本中的各个关键词。
[0082] 进一步地,所述显示单元602,具体以不同的颜色高亮显示所述初始文本中的各个关键词。
[0083]进一步地,所述显示属性包括:字体、颜色、背景、边框以及亮度中的一种或多种。
[0084]上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
[0085]以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
【主权项】
1.一种文本检索方法,其特征在于,所述方法包括:在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所述初始文 本包含的关键词;显示所述初始文本中的各个关键词;在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中的关键词进 行检索。2.根据权利要求1所述的方法,其特征在于,在显示所述初始文本中的各个关键词后, 还包括:如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框;所述针对显示的多个关键词的检索指令,还包括:在通过所述多选框选中多个关键词后输入的检索指令。3.根据权利要求1所述的方法,其特征在于,在显示所述初始文本中的各个关键词后, 还包括:如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的删除选项;所述针对显示的多个关键词的检索指令,还包括:在通过所述删除选项删除一个或多个关键词后输入的检索指令。4.根据权利要求1所述的方法,其特征在于,所述显示所述初始文本中的各个关键词, 包括:在确定所述关键词为结果相关词时,显示所述关键词。5.根据权利要求1所述的方法,其特征在于,所述显示所述初始文本中的各个关键词, 包括:根据预设的规则对所述初始文本中的各个关键词进行排序;根据排序结果显示所述关键词。6.根据权利要求1所述的方法,其特征在于,所述显示所述初始文本中的各个关键词, 包括:以不同的显示属性显示所述初始文本中的各个关键词。7.根据权利要求6所述的方法,其特征在于,所述显示所述初始文本中的各个关键词, 包括:以不同的颜色高亮显示所述初始文本中的各个关键词。8.根据权利要求6所述的方法,其特征在于,所述显示属性包括:字体、颜色、背景、边框以及亮度中的一种或多种。9.一种文本检索装置,其特征在于,所述装置包括:划分单元,在接收到用户的检索指令后,对用户检索的初始文本进行分词划分,得到所 述初始文本包含的关键词;显示单元,显示所述初始文本中的各个关键词;检索单元,在接收到用户针对显示的一个或多个关键词的检索指令后,基于用户选中 的关键词进彳丁检索。10.根据权利要求9所述的装置,其特征在于,所述装置还包括:第一生成单元,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空白位置的操作,则为所述关键词生成对应的多选框;所述针对显示的多个关键词的检索指令,还包括:在通过所述多选框选中多个关键词 后输入的检索指令。11.根据权利要求9所述的装置,其特征在于,所述装置还包括:第二生成单元,在显示所述初始文本中的各个关键词后,如果接收用户点击检索框空 白位置的操作,则为所述关键词生成对应的删除选项;所述针对显示的多个关键词的检索指令,还包括:在通过所述删除选项删除一个或多个关键词后输入的检索指令。12.根据权利要求9所述的装置,其特征在于,所述显示单元,具体在确定所述关键词为结果相关词时,显示所述关键词。13.根据权利要求9所述的装置,其特征在于,所述显示单元,具体根据预设的规则对所述初始文本中的各个关键词进行排序,并根 据排序结果显示所述关键词。14.根据权利要求9所述的装置,其特征在于,所述显示单元,具体以不同的显示属性显示所述初始文本中的各个关键词。15.根据权利要求14所述的装置,其特征在于,所述显示单元,具体以不同的颜色高亮显示所述初始文本中的各个关键词。16.根据权利要求14所述的装置,其特征在于,所述显示属性包括:字体、颜色、背景、边框以及亮度中的一种或多种。
【文档编号】G06F17/30GK105989030SQ201510054321
【公开日】2016年10月5日
【申请日】2015年2月2日
【发明人】江维宇, 韦栋
【申请人】阿里巴巴集团控股有限公司