搜索方法及装置的制造方法

文档序号:9350009阅读:472来源:国知局
搜索方法及装置的制造方法
【技术领域】
[0001]本发明实施例涉及互联网技术领域,尤其涉及搜索方法及装置。
【背景技术】
[0002]随着网络基础设施的不断升级,为解决信息过载问题,用于为用户提供搜索服务的搜索引擎应用而生。目前,搜索引擎通常会线下预先学习得到用户行为模型,并在线上接收到用户实时输入的搜索语句(Query)后,基于该搜索语句利用用户行为模型进行用户行为理解,进而结合用户行为的理解结果确定出搜索结果。其中,用户行为模型用于预测用户对网页的行为,例如预测用户是否点击网页、浏览网页的时长或者对网页的满意度等。
[0003]然而,现有技术仅是基于用户的属性特征(例如所在地区、年龄、性别、职业)、文本特征(例如输入的历史搜索语句)、对历史搜索结果的搜索行为(例如是否点击、浏览时长)等,来建立用户行为模型。虽然这些特征覆盖广泛、内容丰富,但是并没有从本质上对用户行为进行理解建模,使得建立得到的用户行为模型不够合理,不能很好的理解用户的搜索需求,用户体验较差。

【发明内容】

[0004]本发明实施例提供一种搜索方法及装置,以能够利用较为合理准确的用户行为模型,为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
[0005]—方面,本发明实施例提供了一种搜索方法,该方法包括:
[0006]识别当前用户输入的目标搜索语句所属的意图类别;
[0007]根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
[0008]基于预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
[0009]另一方面,本发明实施例还提供了一种搜索装置,该装置包括:
[0010]意图类别识别单元,用于识别当前用户输入的目标搜索语句所属的意图类别;
[0011]用户行为预测单元,用于根据所述意图类别识别单元识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
[0012]搜索结果输出单元,用于基于所述用户行为预测单元得到的预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
[0013]本发明实施例提供的技术方案,基于历史用户输入的历史搜索语句所属的意图进行用户行为建模,能够深入理解用户行为,使得用户行为模型更为合理准确,进而利用该模型预测线上用户对候选搜索结果的行为,可以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
【附图说明】
[0014]图1是本发明实施例一提供的一种搜索方法的流程示意图;
[0015]图2是本发明实施例四提供的一种搜索方法的流程示意图;
[0016]图3是本发明实施例五提供的一种搜索装置的结构示意图。
【具体实施方式】
[0017]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0018]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0019]随着网络基础设施的日益完善,互联网资源越来越丰富,诸多用户都会有各式各样的搜索需求。为满足该搜索需求,用户通常是有意图地通过搜索框输入相应的搜索语句进行搜索,之后对搜索引擎返回的搜索结果进行诸如点击、浏览、收藏等之类的行为。这些用户行为是与意图动机有密切关联的。
[0020]目前,搜索引擎在接收到任意用户实时输入的搜索语句后,会基于该搜索语句,利用线下预先建立好的用户行为模型,预测用户对各个候选搜索结果的行为结果,进而基于该预测结果从多个候选搜索结果中选择本次要输出的搜索结果。其中,所述行为结果通常是用于表征用户对候选结果满意程度的度量参数值。
[0021]但是在已有技术中,线下对用户行为模型的建立方案,根本不会考虑意图动机这一因素,通过意图分析来进行用户行为理解,而是一味的不分意图地将历史用户在历史搜索语句下的历史搜索结果对应的通用行为特征与通用行为结果,作为训练实例进行建模。所以,已有技术并没有从本质上对用户行为进行理解建模,从而导致建立得到的用户行为模型并不能准确预测用户对候选搜索结果的行为结果,因为用户的行为结果与搜索意图有着密不可分的关系。
[0022]所谓通用行为特征指的是:不包含意图特征的历史用户的行为特征。示例性的,通用行为特征通常可包括如下至少一种特征:用户属性特征(例如包含用户所在地区、年龄、性别、职业等),用户输入特征(例如输入的历史搜索语句),历史搜索结果的文本特征(例如历史搜索结果所对应网页的主题、关键词)等。
[0023]所谓通用行为结果指的是:与意图特征无关的、采用统一的用于表征历史用户对历史搜索结果满意程度的度量参数得到的值。也即,不管历史用户是何意图的搜索动机,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数均相同。例如,对于任何搜索意图而言,度量参数均为历史用户对历史搜索结果的停留时间。但是,在历史用户的搜索意图为信息类意图下,历史用户对所满意的历史搜索结果的停留时间往往较长;而在历史用户的搜索意图为资源下载类意图下,历史用户对所满意的历史搜索结果的停留时间却很短,只有数次下载链接的点击。显然,这些用户行为的特点是与搜索意图有密切关联,不同搜索意图触发的用户行为在对搜索结果满意的情况下的表现是不一致的,因而采用统一的度量参数来表征用户对候选结果满意程度不够细致,相应的也就造成建立的用户行为模型对用户行为的理解力较差,准确度不高。
[0024]有鉴于此,本发明实施例引入意图分析的思想,基于意图特征建立用户行为模型,进而利用该模型预测线上用户对候选搜索结果的行为,以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
[0025]实施例一
[0026]图1是本发明实施例一提供的一种搜索方法的流程示意图。本实施例的方法可以由搜索装置来执行,该装置可通过软件实现,集成于为各式各样的终端设备提供搜索服务的搜索引擎中。参见图1,本实施例提供的搜索方法所包括的操作具体如下。
[0027]S110、识别当前用户输入的目标搜索语句所属的意图类别。
[0028]目标搜索语句为搜索引擎接收到的由终端上的搜索客户端或者浏览器发送的搜索请求中所包含的搜索语句。该搜索语句可以是当前用户以语音输入方式输入的语音搜索信息,或者以文本输入方式输入的文字搜索内容。
[0029]在获取到目标搜索语句后,基于设定的意图类别识别算法,对该搜索语句进行识另IJ,以确定该搜索语句具体属于哪类意图类别。需要说明的是,本实施例并不具体对意图的种类以及个数加以限定。优选的,意图类别包括如下至少一种:寻址类意图(也即查找统一资源定位符的意图)、信息类意图(查询问题的信息或解决办法的意图)和商品类意图(查找商品信息的意图)。示例性的,可预先设定多种意图类别,并建立意图类别与关键词之间的映射关系加以存储。其中,每种意图类别可以同时映射有多个关键词。例如,与寻址类意图具有映射关系的关键词有:“网站”、“网址”等;与彳目息类意图具有映射关系的关键词有:“为什么”、“如何”、“怎样”、“是否”等;与商品类意图具有映射关系的关键词有:“京东”、“淘宝”、“天猫”、“大众点评”等。
[0030]相应的,识别当前用户输入的目标搜索语句所属的意图类别,可具体包括:对当前用户输入的目标搜索语句进行解析,以提取其中所包含的关键词;从预先创建的意图类别与关键词之间的映射关系中,查询与本次提取得到的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1