信息搜索方法及装置的制作方法

文档序号:6438196阅读:136来源:国知局
专利名称:信息搜索方法及装置的制作方法
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息搜索方法及装置。
背景技术
现有技术中,当用户需要解决某个问题时,可以在搜索引擎中输入该问题,搜索引擎搜索与该问题相关的问题,然后再查找这些相关的问题的答案,用户可以通过查找到的这些答案找到解决问题的途径。在信息搜索技术领域中,将用户在搜索引擎中输入的问题称为当前搜索信息,搜索引擎中存储有之前各用户输入的搜索问题,这些问题称为历史搜索信息,每个历史搜索信息都对应至少一个反馈信息(即历史搜索信息的答案),搜索引擎接收到用户输入的当前搜索信息后,分别计算该当前搜索信息与存储的各历史搜索信息之间的相似度,然后选取出相似度较大的一些历史搜索信息,并将选取出的这些历史搜索信息提供给用户。由上可见,现有技术是根据当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息的。用户输入的当前搜索信息一般为短文本,而短文本包含的词量较少,若用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,那么这个历史搜索信息的反馈信息很可能会对用户有帮助,但是如果当前搜索信息和这个历史搜索信息所共同具有的单词较少,那么搜索引擎计算出的相似度就较低,搜索引擎可能不会将该历史搜索信息提供给用户,例如,用户输入的当前搜索信息为“我如何在互联网上下载音乐”,而搜索引擎中存储有历史搜索信息“从网络获取MP3歌曲最便捷的途径”,这两个搜索信息的涵义非常接近,那么“从网络获取MP3歌曲最便捷的途径”这个历史搜索信息的反馈信息很可能会对用户解决问题有帮助,但是这两个搜索信息共同具有的单词只有一个“网”字,那么搜索引擎针对这两个搜索信息计算出的相似度就非常低,从而不会将该历史搜索信息提供给用户,用户也就无法通过该历史搜索信息的答案找到解决问题的途径。因此采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低。

发明内容
本发明实施例提供一种信息搜索方法及装置,用以解决采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。本发明实施例技术方案如下:—种信息搜索方法,该方法包括步骤:获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。一种信息搜索装置,包括:当前搜索信息获得单元,用于获得用户输入的当前搜索信息;关联度确定单元,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;历史搜索信息选取单元,用于根据关联度确定单元确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;历史搜索信息提供单元,用于将历史搜索信息选取单元选取出的历史搜索信息提供给用户。本发明实施例技术方案中,首先获得用户输入的当前搜索信息,然后针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,并将选取出的历史搜索信息提供给用户。由上可见,本发明实施例技术方案在为用户搜索信息时,不再根据用户输入的当前搜索信息与历史搜索信息之间的相似度来选取历史搜索信息,若当用户输入的当前搜索信息和某个历史搜索信息的涵义非常接近,即使共同具有的单词较少,那么该历史搜索信息对应的最佳反馈信息和当前搜索信息也是非常关联的,因此本发明实施例根据当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度来选取历史搜索信息,从而能够全面的为用户搜索历史搜索信息,且有效地提高了搜索的准确性。


图1为本发明实施例一中,信息搜索方法流程示意图;图2为本发明实施例一中,信息搜索方法原理示意图;图3为本发明实施例三中,信息搜索装置结构示意图。
具体实施例方式下面结合各个附图对本发明实施例技术方案的主要实现原理具体实施方式
及其对应能够达到的有益效果进行详细地阐述。实施例一如图1所示,为本发明实施例一提出的信息搜索方法流程示意图,其原理如图2所示,具体处理流程如下:步骤11,获得用户输入的当前搜索信息。用户输入的当前搜索信息一般为短文本信息。步骤12,针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。本发明实施例一提出,可以预先根据预设的各历史搜索信息及对应的反馈信息,对物理模型进行训练,得到该物理模型的模型参数矢量,后续可以直接根据该模型参数矢量,计算当前搜索信息和最佳反馈信息之间的关联度。其中,搜索引擎中存储的每个历史搜索信息均对应至少一个反馈信息,但是只有一个反馈信息是历史搜索信息的最佳反馈信息,该最佳反馈信息与历史搜索信息之间的相关度为1,其他反馈信息与该历史搜索信息之间的相关度为O。历史搜索信息Qi的反馈信息Ki与该历史搜索信息Qi之间的相关度为Lu,当Lu = I时,确认反馈信息Ki为该历史搜索信息Qi的最佳反馈信息,该反馈信息Aj可以记为BAj,当Lij = O时,确认反馈信息Aj不为该历史搜索信息Qi的最佳反馈信息。在对物理模型进行训练时,先选取一定数量具有最佳反馈信息的历史搜索信息以及对应的反馈信息作为训练信息集,针对每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息,然后根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量,根据确定出的各特征向量,对预设的物理模型进行训练。本发明实施例一中,上述物理模型可以但不限于为贝叶斯逻辑回归模型。下面以贝叶斯逻辑回归模型为例,来介绍根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练的过程。将选取的历史搜索信息记为Qi,对应的反馈信息记为Ap历史搜索信息Qi与其对应的反馈信息 之间的特征信息包含文本特征信息和非文本特征信息,其中,文本特征信息如表I所示,非文本特征信息如表2所示。表1:
权利要求
1.一种信息搜索方法,其特征在于,包括: 获得用户输入的当前搜索信息; 针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度; 根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并 将选取出的历史搜索信息提供给用户。
2.如权利要求1所述的方法,其特征在于,针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,具体包括: 获得根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练得到的模型参数矢量; 针对每个历史搜索信息,分别根据获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
3.如权利要求2所述的方法,其特征在于,根据预设的各历史搜索信息及对应的反馈信息对物理模型进行训练,具体包括: 针对预设的每个历史搜索 信息以及该历史搜索信息的每个反馈信息,分别执行: 获取该历史搜索信息与该反馈信息之间的特征信息;并 根据获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量; 根据确定出的各特征向量,对预设的物理模型进行训练。
4.如权利要求2所述的方法,其特征在于,所述物理模型为贝叶斯逻辑回归模型。
5.如权利要求2所述的方法,其特征在于,通过下述方式确定所述当前搜索信息与历史搜索信息对应的最佳反馈信息之间的关联度:
6.如权利要求1所述的方法,其特征在于,根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息,具体包括: 在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息; 将选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信
7.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括: 按照对应的最佳反馈信息的关联度由大到小的顺序,将选取出的历史搜索信息进行排序;并 将排序后的结果提供给用户。
8.如权利要求1所述的方法,其特征在于,将选取出的历史搜索信息提供给用户,具体包括: 针对选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度,并根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度; 按照相似度由大到小的顺序,将选取出的历史搜索信息进行排序;并 将排序后的结果提供给用户。
9.如权利要求8所述的方法,其特征在于,通过下述方式确定当前搜索信息与历史搜索信息之间的相似度:
10.一种信息搜索装置,其特征在于,包括: 当前搜索信息获得单元,用于获得用户输入的当前搜索信息; 关联度确定单元,用于针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度; 历史搜索信息选取单元,用于根据关联度确定单元确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息; 历史搜索信息提供单元,用于将历史搜索信息选取单元选取出的历史搜索信息提供给用户。
11.如权利要求10所述的装置,其特征在于,还包括: 模型训练单元,用于预先根据预设的各历史搜索信息及对应的各反馈信息,对物理模型进行训练,得到模型参数矢量; 关联度确定单元具体包括: 参数矢量获得子单元,用于获得模型训练单元得到的模型参数矢量; 关联度计算子单元,用于针对每个历史搜索信息,分别根据参数矢量获得子单元获得的模型参数矢量,计算所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度。
12.如权利要求11所述的装置,其特征在于,模型训练单元具体包括: 特征信息获取子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别获取该历史搜索信息与该反馈信息之间的特征信息; 特征向量确定子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征信息获取子单元获取的各特征信息,确定该历史搜索信息与该反馈信息之间的特征向量; 模型训练子单元,用于针对预设的每个历史搜索信息以及该历史搜索信息对应的每个反馈信息,分别根据特征向量确定子单元确定出的各特征向量,对预设的物理模型进行训练。
13.如权利要求10所述的装置,其特征在于,历史搜索信息选取单元具体包括:反馈信息选取子单元,用于在各最佳反馈信息中,选取关联度大于规定阈值的最佳反馈信息; 历史搜索信息确认子单元,用于将反馈信息选取子单元选取出的最佳反馈信息对应的历史搜索信息,确认为满足预设条件的历史搜索信息。
14.如权利要求10所述的装置,其特征在于,历史搜索信息提供单元具体包括: 第一排序子单元,用于按照对应的最佳反馈信息的关联度由大到小的顺序,将历史搜索信息选取单元选取出的历史搜索信息进行排序; 第一提供子单元,用于将第一排序子单元排序后的结果提供给用户。
15.如权利要求10所述的装置,其特征在于,历史搜索信息提供单元具体包括: 关联度确定子单元,用于针对历史搜索信息选取单元选取出的每个历史搜索信息,分别确定该历史搜索信息与对应的最佳反馈信息之间的关联度; 相似度确定子单元,用于针对每个历史搜索信息,分别根据该历史搜索信息与对应的最佳反馈信息之间的关联度以及当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度,确定当前搜索信息与该历史搜索信息之间的相似度; 第二排序子单元,用于按照相似度由大到小的顺序,将历史搜索信息选取单元选取出的历史搜索信息进行排序; 第二提供子单元,用于 将第二排序子单元排序后的结果提供给用户。
全文摘要
本发明公开了一种信息搜索方法及装置,该信息搜索方法包括步骤获得用户输入的当前搜索信息;针对预设的每个历史搜索信息,分别确定所述当前搜索信息与该历史搜索信息对应的最佳反馈信息之间的关联度;根据确定出的关联度,在各历史搜索信息中选取出满足预设条件的历史搜索信息;并将选取出的历史搜索信息提供给用户。采用本发明技术方案,解决了采用现有技术中的信息搜索方法为用户搜索到的历史搜索信息不全面,且准确性较低的问题。
文档编号G06F17/30GK103106212SQ20111035956
公开日2013年5月15日 申请日期2011年11月14日 优先权日2011年11月14日
发明者凌俊民, 刘晓峰, 梁耿, 陈阳, 徐俊 申请人:中国移动通信集团广西有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1