特殊文字搜索方法以及系统的制作方法

文档序号:6538987阅读:176来源:国知局
特殊文字搜索方法以及系统的制作方法
【专利摘要】本发明涉及一种特殊文字搜索方法,其中该方法包括以下步骤:步骤A、接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集;步骤B、查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集;步骤C、结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。本发明提供的方法可有效丰富用户的搜索结果数据,提高用户体验。
【专利说明】特殊文字搜索方法以及系统
【技术领域】
[0001]本发明涉及通信【技术领域】,尤其涉及一种特殊文字搜索方法及系统。
【背景技术】
[0002]随着互联网的普及,年轻网民为求彰显个性,开始大量使用同音字、音近字、特殊符号来表音的文字,这种文字与日常生活中使用的文字相比有明显的不同并且文法也相当奇异,所以也叫做火星文,意指地球人看不懂的文字。火星文被大量应用在年轻网民的昵称以及博客中,若用户需要搜索该火星文昵称或者博客,只能通过火星文关键字进行搜索才能搜索到与之匹配的昵称或者博客。然而,由于火星文并不是规范的文字,没有统一的编排,每个文字可以有多种组成方式,火星文可以使用同音字、近音字、形近字或者拆字组合来代替正常的汉字,表达自己的思想。如:用拆字组合“走召弓虽”来表示“超强”,用M尔
门者卩i井?又i吾”来表示“你们都讲汉语”;再比如用近音字“什底堤焱腥姣”来表示“什么是火星文”等等。因此,目前在使用正常文字的索引信息搜索数据时,并无法提供与之相应的火星文数据,即使使用火星文索引信息也可能出现搜索偏差较大的情况,导致返回给用户的搜索结果不完善。

【发明内容】

[0003]有鉴于此,本发明提供了一种特殊文字搜索方法以及系统来解决上述问题。
[0004]本发明提供了一种特殊文字搜索方法,其中包括:
[0005]步骤A、接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集;
[0006]步骤B、查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集;所述特殊文字为火星文字、菊花文以及繁体文字中一种或多种;
[0007]步骤C、结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。
[0008]进一步地,所述步骤A与步骤B之间还包括:
[0009]判断所述索引标识信息是否需要进行特殊文字搜索;
[0010]若是,则在预设的正常文字与特殊文字映射关系表项中查找与所述索引标识信息相对应的特殊文字索引信息,并转至步骤C ;
[0011]否则根据正常文字缓存数据集生成结果数据集。
[0012]进一步地,每隔预设时间,更新所述正常文字与特殊文字映射关系表项。
[0013]进一步地,所述步骤C具体包括:
[0014]对所述正常文字缓存数据集以及特殊文字缓存数据集进行合并以及排重处理,生成结果数据集。
[0015]进一步地,所述步骤A进一步包括,
[0016]根据索引标识信息在正常文字库内查找与所述索引标识信息关联的正常文字缓存数据集;
[0017]所述步骤B进一步包括,根据特殊文字索引信息在预设的特殊文字库内查找与所述特殊文字索引信息关联的特殊文字缓存数据集,其中,每隔预设时间,更新所述正常文字库与所述特殊文字库。
[0018]本发明还提供一种特殊文字搜索的系统,其中包括:
[0019]正常文字查找单元,用于接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集;
[0020]特殊文字查找单元,用于查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集;
[0021]结果数据生成单元,用于结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。
[0022]进一步地,所述系统还包括搜索判断单元,
[0023]在正常文字查找单元根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集后,判断所述索引标识信息是否需要进行特殊文字搜索;
[0024]若是,则在预设的正常文字与特殊文字映射关系表项中查找与所述索引标识信息相对应的特殊文字索引信息,并转至结果数据生成单元处理;
[0025]否则根据正常文字缓存数据集生成结果数据集。
[0026]进一步地,每隔预设时间,更新所述正常文字与特殊文字映射关系表项。
[0027]进一步地,所述结果数据生成单元具体用于:
[0028]对所述正常文字缓存数据集以及特殊文字缓存数据集进行合并以及排重处理,生成结果数据集。
[0029]进一步地,所述正常文字查找单元进一步用于,
[0030]根据索引标识信息在正常文字库内查找与所述索引标识信息关联的正常文字缓存数据集;
[0031]所述特殊文字查找单元进一步用于,根据特殊文字索引信息在预设的特殊文字库内查找与所述特殊文字索引信息关联的特殊文字缓存数据集,其中,每隔预设时间,更新所述正常文字库与所述特殊文字库。
[0032]由此可见,本发明提供的特殊文字搜索方法以及系统通过在接收到索引标识信息后,根据索引标识信息分别查找与其关联的正常文字缓存数据集以及特殊文字缓存数据集,最终结合正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集反馈给用户,可有效丰富用户的搜索结果数据,提高用户体验。
【专利附图】

【附图说明】
[0033]图1是本发明实施例中特殊文字搜索系统的逻辑结构示意图;
[0034]图2是本发明实施例中特殊文字搜索方法的工作流程图。
【具体实施方式】
[0035]在日常生活中,火星文被大量应用于年轻网民的昵称以及博客中,若用户需要搜索某火星文昵称或者博客,只能通过火星文关键字进行搜索才能搜索到与之匹配的昵称或者博客。然而,用户在进行搜索时多会使用正常文字进行搜索,且由于火星文字的不规范性,即使使用火星文索引信息进行搜索也不易准确输入与搜索目标一致的索引信息,相应地就无法提供与之对应的火星文数据或者出现搜索结果偏差较大的情况,导致返回给用户的搜索结果不完善。
[0036]由此,本发明提供了一种特殊文字搜索方法,通过在接收到索引标识信息后,根据索引标识信息查找与其关联的正常文字缓存数据集,接着再查找与索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集,最终结合正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。本发明中所述的特殊文字可以为火星文、菊花文或者繁体中文等网络文字,以下以特殊文字为火星文为例对本发明做进一步地阐述。
[0037]请参考图1,本发明提供了一种特殊文字搜索系统,该系统的基本硬件环境包括CPU、内存、非易失性存储器以及其他硬件。所述特殊文字搜索系统可以理解为CPU读取非易失性存储器中对应的计算机程序在内存中运行所形成的,从本质上说其是一个逻辑系统。在本实施方式中,该系统在逻辑层面上包括:正常文字查找单元、特殊文字查找单元以及结果数据生成单元,请参考图2,该系统在运行过程中执行如下处理流程:
[0038]步骤201,正常文字查找单元接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集;
[0039]步骤202,特殊文字查找单元查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集;
[0040]步骤203,结果数据生成单元结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。
[0041]本发明实施例中,在接收到索引标识信息后,首先根据接收到的索引标识信息在正常文字库内查找与其关联的正常文字缓存数据,并将查找到的正常文字缓存数据进行优先级排序,且将重复的缓存数据排除掉后生成有序重组的正常文字缓存数据集。
[0042]接着,根据索引标识信息在正常文字与特殊文字映射关系表项中查找与所述索引标识信息对应的火星文索引信息,并使用火星文索引信息在特殊文字库中查找与其关联的火星文字缓存数据,同时将查找到的火星文字缓存数据进行优先级排序,且将重复的缓存数据排除掉后生成有序重组的火星文缓存数据集。
[0043]
【权利要求】
1.一种特殊文字搜索方法,其特征在于,包括: 步骤A、接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集; 步骤B、查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集;所述特殊文字为火星文字、菊花文以及繁体文字中一种或多种; 步骤C、结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。
2.如权利要求1所述的方法,其特征在于,所述步骤A与步骤B之间还包括: 判断所述索引标识信息是否需要进行特殊文字搜索; 若是,则在预设的正常文字与特殊文字映射关系表项中查找与所述索引标识信息相对应的特殊文字索引信息,并转至步骤C ; 否则根据正常文字缓存数据集生成结果数据集。
3.如权利要求2所述的方法,其特征在于,每隔预设时间,更新所述正常文字与特殊文字映射关系表项。
4.如权利要求1所述的方法,其特征在于,所述步骤C具体包括: 对所述正常文字缓存数据集以及特殊文字缓存数据集进行合并以及排重处理,生成结果数据集。
5.如权利要求1所述的方法,其特征在于,所述步骤A进一步包括,` 根据索引标识信息在正常文字库内查找与所述索引标识信息关联的正常文字缓存数据集; 所述步骤B进一步包括,根据特殊文字索引信息在预设的特殊文字库内查找与所述特殊文字索引信息关联的特殊文字缓存数据集,其中,每隔预设时间,更新所述正常文字库与所述特殊文字库。
6.一种特殊文字搜索的系统,其特征在于,包括: 正常文字查找单元,用于接收索引标识信息,根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集; 特殊文字查找单元,用于查找与所述索引标识信息对应的特殊文字索引信息,并根据特殊文字索引信息查找与所述特殊文字索引信息关联的特殊文字缓存数据集; 结果数据生成单元,用于结合所述正常文字缓存数据集以及特殊文字缓存数据集生成结果数据集。
7.如权利要求6所述的系统,其特征在于,所述系统还包括搜索判断单元, 在正常文字查找单元根据索引标识信息查找与所述索引标识信息关联的正常文字缓存数据集后,判断所述索引标识信息是否需要进行特殊文字搜索; 若是,则在预设的正常文字与特殊文字映射关系表项中查找与所述索引标识信息相对应的特殊文字索引信息,并转至结果数据生成单元处理; 否则根据正常文字缓存数据集生成结果数据集。
8.如权利要求7所述的系统,其特征在于,每隔预设时间,更新所述正常文字与特殊文字映射关系表项。
9.如权利要求8所述的系统,其特征在于,所述结果数据生成单元具体用于:对所述正常文字缓存数据集以及特殊文字缓存数据集进行合并以及排重处理,生成结果数据集。
10.如权利要求6所述的系统,其特征在于,所述正常文字查找单元进一步用于,根据索引标识信息在正常文字库内查找与所述索引标识信息关联的正常文字缓存数据集; 所述特殊文字查找单元进一步用于,根据特殊文字索引信息在预设的特殊文字库内查找与所述特殊文字索引信息关联的特殊文字缓存数据集,其中,每隔预设时间,更新所述正常文字库 与所述特殊文字库。
【文档编号】G06F17/30GK103823874SQ201410069092
【公开日】2014年5月28日 申请日期:2014年2月27日 优先权日:2014年2月27日
【发明者】马宇翔, 李亦峰 申请人:北京六间房科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1