搜索方法及装置的制造方法_2

文档序号:9350009阅读:来源:国知局
关键词具有映射关系的意图类别,将该意图类别作为目标搜索语句所属的意图类别。
[0031]S120、根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为。
[0032]在本实施例中,可预先创建用户行为模型并进行存储。该用户行为模型根据历史用户的历史搜索语句所属的意图类别确定。示例性的,用户行为模型的创建过程,具体包括:获取历史用户的历史行为数据;识别历史行为数据中的历史搜索语句所属的意图类别;根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型。其中,对历史搜索语句所属意图类别的识别技术,与上述对目标搜索语句所属意图类别的识别技术相同。
[0033]在该示例中,需要预先创建包含有诸多历史用户的历史行为数据的语料库,基于机器学习的方法利用该语料库训练得到用户行为模型。每一个历史用户的历史行为数据可包括:该用户的属性特征数据;该用户输入过的历史搜索语句;搜索引擎根据历史搜索语句所返回的各个历史搜索结果的文本特征数据;该用户对各个历史搜索结果的行为记录,该行为记录可以是对包含如下至少一项内容的记录:是否点击历史搜索结果、在历史搜索结果所对应网页中的停留时长以及是否收藏该网页。
[0034]作为本实施例的一种【具体实施方式】,可线下分别针对各种意图类别,预先创建一个与该意图类别对应的用户行为模型。线上在获取到当前用户输入的目标搜索语句,并识别出其所属的意图类别之后,利用预先创建的本次识别得到的该意图类别所对应的用户行为模型,分别预测当前用户对各个候选搜索结果的行为,以得到行为结果。
[0035]作为本实施例的另一种【具体实施方式】,可线下预先创建一个通用的用户行为模型,在建立该用户行为模型时应增加一维意图特征,其中该特征为用于表征训练实例对应的历史搜索语句所属的意图类别的特征。线上在获取得到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,生成意图特征,而后根据该意图特征利用预先创建的用户行为模型,分别预测当前用户对各个候选搜索结果的行为,以得到行为结果。
[0036]S130、基于预测结果,从候选搜索结果中确定本次输出的搜索结果。
[0037]示例性的,可按照所对应的预测结果,对各个候选搜索结果进行排序;将位于前N(为大于或等于I的自然数)名的候选搜索结果,作为本次输出的搜索结果。
[0038]本实施例提供的技术方案,基于历史用户输入的历史搜索语句所属的意图进行用户行为建模,能够深入理解用户行为,使得用户行为模型更为合理准确,进而利用该模型预测线上用户对候选搜索结果的行为,可以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
[0039]实施例二
[0040]本实施例在上述实施例一的基础上,对用户行为模型的建立进行优化。在本实施例中,每一种意图类别对应一个用户行为模型。具体的,根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型,包括:
[0041]从历史行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中用户行为结果根据历史搜索语句所属的意图类别确定;
[0042]将用户行为特征和用户行为结果作为训练实例,基于机器学习算法建立与历史搜索语句所属的意图类别对应的用户行为模型。
[0043]其中,所提取的用户行为特征,可为已有技术中的通用行为特征中的部分特征或全部特征,例如包括:历史用户的属性特征,输入的历史搜索语句所对应的用户输入特征,以及历史搜索结果的文本特征等。
[0044]所提取的用户行为结果,区别于已有技术中的通用行为结果,为与历史搜索语句所属的意图类别对应的行为结果。在不同意图类别下,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数可相同,也可不同。例如,在信息类意图下,度量参数可以为历史用户对历史搜索结果的停留时间,该时间越长,表明用户越满意;而在资源下载类意图下,度量参数可以为历史用户对历史搜索结果是否点击。
[0045]在获取到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,针对各个候选搜索结果,执行如下操作:确定当前用户在目标搜索语句下的候选搜索结果对应的用户行为特征;利用本次确定的用户行为特征以及预先创建的本次识别得到的该意图类别所对应的用户行为模型,预测当前用户对候选搜索结果的行为,以得到行为结果。
[0046]实施例三
[0047]本实施例在上述实施例一的基础上,对用户行为模型的建立进行优化。在本实施例中,各种意图类别都对应同一个通用的用户行为模型。区别于现有技术,在建立该用户行为模型时应增加一维意图特征。具体的,可将历史搜索语句对应的意图类别作为用户行为模型的一个维度上的特征(简称意图特征),并且将与意图特征对应的、用于表征历史用户对历史搜索结果满意程度的度量参数的值作为用户行为结果,以形成训练实例;进而基于机器学习的方法利用训练实例进行训练,建立通用的用户行为模型。
[0048]根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型,包括:
[0049]从历史搜索行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中用户行为结果根据所述历史搜索语句所属的意图类别确定;
[0050]将用户行为特征、历史搜索语句所属的意图类别特征和用户行为结果作为训练实例,基于机器学习算法建立用户行为模型。
[0051]其中,所提取的用户行为特征,可为已有技术中的通用行为特征中的部分特征或全部特征,例如包括:历史用户的属性特征,输入的历史搜索语句所对应的用户输入特征,以及历史搜索结果的文本特征等。
[0052]所提取的用户行为结果,区别于已有技术中的通用行为结果,为与历史搜索语句所属的意图类别对应的行为结果。在不同意图类别下,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数可相同,也可不同。
[0053]在获取到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,针对各个候选搜索结果,执行如下操作:根据识别结果生成意图特征;确定当前用户在目标搜索语句下的候选搜索结果对应的用户行为特征;利用本次确定的用户行为特征、意图特征以及预先创建的通用的用户行为模型,预测当前用户对候选搜索结果的行为,以得到行为结果。
[0054]实施例四
[0055]图2是本发明实施例四提供的一种搜索方法的流程示意图。本实施例以上述实施例为基础,提供一优选实施例。在本实施例中以寻址类意图、信息类意图和商品类意图这3类意图为例进行介绍,但是本领域的普通技术人员应理解,在实际执行当中,意图类别还可以是其他划分方式,本实施例仅是以示例的方式对本发明提供的技术方案加以解释说明。参见图2,本实施例提供的搜索方法所包括的操作具体如下。
[0056]先是,执行获取多个历史用户的至少一组历史行为数据的操作。其中,每一组历史行为数据对应有:历史用户的属性特征数据;输入的一条历史搜索语句;搜索引擎根据该条历史搜索语句所返回的各个历史搜索结果的文本特征数据;该用户对各个历史搜索结果的行为记录,该行为记录可以是对包含如下至少一项内容的记录:是否点击历史搜索结果、在历史搜索结果所对应网页中的停留时长以及是否收藏该网页。
[0057]然后,执行根据其中所包含的历史搜索语句,对每组历史行为数据进行意图类别划分的操作。具体的,基于预先创建的意图类别与关键词之间的映射关系,识别各条历史搜索语句所属的意图类别;将该历史搜索语句所在历史行为数据划分为本次识别得到的意图类别下的历史行为数据。
[0058]再然后,针对各意图类别下的历史行为数据:从中提取在历史搜索语句下的各历史搜索结果对应的用户行为特征以及用户行为结果,将提取的用户行为特征和用户行为结果作为训练实例,基于机器学习算法进行各意图类别的用户行为建模。其中,用户行为结果根据历史搜索语句所属的意图类别确定。
[0059]进而,得到各意图类别对应的用户行为模型:寻址类意图对应的用户行为模型、信息类意图对应的用户行为模型和商品类意图对应的用户行为模型。
[0060
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1