搜索库生成方法及装置与流程

文档序号:12063133阅读:来源:国知局

技术特征:

1.一种搜索库生成方法,其特征在于,所述搜索库生成方法包括:

建立第一拼音搜索库,所述第一拼音搜索库包括词句的全部拼音组合;

获取用户输入的搜索关键字;

按预设拼音组合规则对所述搜索关键字进行过滤,生成第一搜索拼音组合;

基于所述第一搜索拼音组合,按预设多音字搜索规则对所述第一拼音搜索库进行过滤,生成第二拼音搜索库。

2.根据权利要求1所述的搜索库生成方法,其特征在于,所述按预设拼音组合规则对所述搜索关键字进行过滤,生成第一搜索拼音组合,包括:

获取用户采纳的搜索结果词句;

将所述搜索关键字和所述搜索结果词句建立关联,并生成关联记录;

基于所述关联记录,获取同一个搜索结果词句所对应的所有搜索关键字;

基于所述同一个搜索结果词句所对应的所有搜索关键字,生成第一搜索拼音组合。

3.根据权利要求2述的搜索库生成方法,其特征在于,所述基于所述同一个搜索结果词句所对应的所有搜索关键字,生成第一搜索拼音组合,包括:

基于所述关联记录,统计所述关联记录中同一个搜索关键字关联同一个搜索结果词句的关联次数占比;

过滤所述第一搜索拼音组合中,所述关联次数占比小于预设关联次数占比阈值的搜索关键字,以生成第二搜索拼音组合;

对应的,所述基于所述第一搜索拼音组合,按预设多音字搜索规则对所述第一拼音搜索库进行过滤,生成第二拼音搜索库,包括:

基于所述第二搜索拼音组合对第一拼音搜索库进行过滤,生成第二拼音搜索库。

4.根据权利要求1所述的搜索库生成方法,其特征在于,所述基于第一搜索拼音组合,按预设多音字搜索规则对第一拼音搜索库进行过滤,生成第二拼音搜索库,包括:

删除所述第一拼音搜索库中,除第一搜索拼音组合和预设拼音组合之外的其他拼音组合,以生成第二拼音搜索库。

5.根据权利要求1-4任一项所述的搜索库生成方法,其特征在于,所述建立第一拼音搜索库,所述第一拼音搜索库包括词句的全部拼音组合,包括:

获取词句中的文字个数和多音字个数;

基于所述文字个数和所述多音字个数,获取所述词句的全部拼音组合;

基于词句的全部拼音组合建立第一拼音搜索库。

6.一种搜索库生成装置,其特征在于,所述搜索库生成装置包括:

第一拼音搜索库建立单元,用于建立第一拼音搜索库,所述第一拼音搜索库包括词句的全部拼音组合;

搜索关键字获取单元,用于获取用户输入的搜索关键字;

第一搜索拼音组合生成单元,用于按预设拼音组合规则对所述搜索关键字进行过滤,生成第一搜索拼音组合;

第二拼音搜索库生成单元,用于基于所述第一搜索拼音组合,按预设多音字搜索规则对所述第一拼音搜索库进行过滤,生成第二拼音搜索库。

7.根据权利要求6所述的搜索库生成装置,其特征在于,所述第一搜索拼音组合生成单元包括:

搜索结果词句获取模块,用于获取用户采纳的搜索结果词句;

关联记录生成模块,用于将所述搜索关键字和所述搜索结果词句建立关联,并生成关联记录;

搜索关键字获取模块,用于基于所述关联记录,获取同一个搜索结果词句所对应的所有搜索关键字;

第一搜索拼音组合生成模块,用于基于所述同一个搜索结果词句所对应的所有搜索关键字,生成第一搜索拼音组合。

8.根据权利要求7所述的搜索库生成装置,其特征在于,所述第一搜索拼音组合生成模块,包括:

关联次数占比统计模块,用于基于所述关联记录,统计所述关联记录中同一个搜索关键字关联同一个搜索结果词句的关联次数占比;

第二搜索拼音组合生成模块,用于过滤所述第一搜索拼音组合中,所述关联次数占比小于预设关联次数占比阈值的搜索关键字,以生成第二搜索拼音组合;

对应的,所述第二拼音搜索库生成单元,包括:

第二拼音搜索库生成模块,用于基于所述第二搜索拼音组合对第一拼音搜索库进行过滤,生成第二拼音搜索库。

9.根据权利要求7所述的搜索库生成装置,其特征在于,所述第二拼音搜索库生成单元包括:

第二拼音搜索库生成模块,还用于删除所述第一拼音搜索库中,除第一搜索拼音组合和预设拼音组合之外的其他拼音组合,以生成第二拼音搜索库。

10.根据权利要求6至9任一项所述的搜索库生成装置,其特征在于,所述第一拼音搜索库建立单元包括:

个数获取模块,用于获取词句中的文字个数和多音字个数;

拼音组合获取模块,用于基于所述文字个数和所述多音字个数,获取所述词句的全部拼音组合;

第一拼音搜索库建立模块,用于基于词句的全部拼音组合建立第一拼音搜索库。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1