一种扩展词对的筛选方法及装置的制造方法_4

文档序号:9687445阅读:来源:国知局
段内被第二用户用作搜索依据 的第二查询词对。
[0109] 可选的,第一确定单元用于:
[0110] 针对获得单元31获得的所述至少两个查询词对中的、在特定时间段内仅被单个 用户用作搜索依据的各查询词对分别执行:确定该查询词对在特定时间段内被单个用户用 作搜索依据的次数;并针对获得单元31获得的所述至少两个查询词对中的、在特定时间段 内被至少两个用户用作搜索依据的各查询词对分别执行:确定该查询词对在特定时间段内 分别被各个用户用作搜索依据的次数总和;根据针对获得单元31获得的所述至少两个查 询词对中的、在特定时间段内仅被单个用户用作搜索依据的各查询词对所确定出的次数, W及确定出的各次数总和,确定包含的各查询词在特定时间段内的共现次数小于第一次数 阔值的查询词对。
[0111] 采用本申请实施例提供的该装置,由于可W根据设置的扩展词对必要条件,从包 含的各查询词在特定时间段内的共现次数小于第一次数阔值的查询词对中,选取出作为扩 展词对的查询词,从而即便是在用户行为不够丰富,因而导致包含的各查询词在特定时间 段内的共现次数不小于规定次数阔值的查询词对数量较小的场景下,也可W得到较多的扩 展词对,解决在该场景下按照现有的扩展词对确定方式能够确定出的扩展词对的数量较小 的问题。
[0112] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序 产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产 品的形式。
[0113] 本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提供送些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器W产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。
[0114] 送些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备W特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0115] 送些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤W产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0116] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、 网络接口和内存。
[0117] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/ 或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质 的示例。
[0118] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可W由任何方法 或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模块或其他数据。 计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、 动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电 可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁 性存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按照本文中 的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信 号和载波。
[0119] 还需要说明的是,术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的 包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括郝些要素,而且还包 括没有明确列出的其他要素,或者是还包括为送种过程、方法、商品或者设备所固有的要 素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除在包括所述 要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0120] 本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。 因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的 形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存 储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形 式。
[0121] W上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员 来说,本申请可W有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同 替换、改进等,均应包含在本申请的权利要求范围之内。
【主权项】
1. 一种扩展词对的筛选方法,其特征在于,包括: 获得至少两个查询词对;其中,每个查询词对包含至少一个作为竞价词的查询词; 从所述至少两个查询词对中,确定包含的各查询词在特定时间段内的共现次数小于第 一次数阈值的查询词对; 从确定出的查询词对中,选取符合设置的扩展词对必要条件的查询词对作为扩展词 对。2. 如权利要求1所述的方法,其特征在于,从确定出的查询词对中,选取符合扩展词对 必要条件的查询词对作为扩展词对,包括: 根据确定出的查询词对包含的各查询词在特定时间段内分别被不同用户用作搜索依 据的次数,从确定出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。3. 如权利要求2所述的方法,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值。4. 如权利要求2所述的方法,其特征在于,根据确定出的查询词对包含的各查询词在 特定时间段内分别被不同用户用作搜索依据的次数,从确定出的查询词对中,选取符合扩 展词对必要条件的查询词对作为扩展词对,包括: 根据确定出的查询词对包含的各查询词在特定时间段内分别被不同用户用作搜索依 据的次数,以及确定出的查询词对分别包含的各查询词的查询词单元的重合度,从确定出 的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。5. 如权利要求4所述的方法,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值;且 满足查询词单元重合条件; 其中,单个查询词对包含第一查询词和第二查询词; 所述查询词单元重合条件包括:第一查询词的查询词单元中,至少有一个查询词单元 与第二查询词的查询词单元相同。6. 如权利要求4所述的方法,其特征在于,根据确定出的查询词对包含的各查询词在 特定时间段内分别被不同用户用作搜索依据的次数,以及所述重合度,从确定出的查询词 对中,选取符合扩展词对必要条件的查询词对作为扩展词对,包括: 根据确定出的查询词对包含的各查询词在特定时间段内分别被不同用户用作搜索依 据的次数、所述重合度,以及确定出的查询词对分别包含的各查询词之间的提升度,从确定 出的查询词对中,选取符合扩展词对必要条件的查询词对作为扩展词对。7. 如权利要求6所述的方法,其特征在于,所述扩展词对必要条件包括: 包含的各查询词在特定时间段内被不同用户分别用作搜索依据的次数均大于第二次 数阈值;且 满足查询词单元重合条件;且 包含的查询词之间的提升度的值大于提升度阈值; 其中,单个查询词对包含第一查询词和第二查询词; 所述查询词单元重合条件包括
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1