一种搜索方法及数据处理方法、装置及系统的制作方法

文档序号:9826260阅读:217来源:国知局
一种搜索方法及数据处理方法、装置及系统的制作方法
【技术领域】
[0001]本发明涉及搜索技术领域,尤其涉及一种搜索方法及数据处理方法、装置及系统。
【背景技术】
[0002]视频搜索中一个重要的搜索内容是人名搜索,人名搜索效果的好坏,对用户体验会有很大的影响。在视频数据中,会出现人与人的名字相同、人与影视作品的名字相同的情况,如果不做区分,就会出现混淆,导致用户搜不到期望的结果。
[0003]目前,百度、搜库等知名食品网站都支持视频人名搜索。对于同名明星、同名影视作品大多网站都不做区分,只根据文本本身的相关性,把同名但实际不是同一个明星的所有作品和相关资讯放在一起展示。百度、搜库在这方面做的比较好,在用户搜索人名时,通过对搜索得到的相关文档进行聚类,并挖掘人物之间的关系来实现人名的区分,然而,在实际操作中,这种方式仍然不能将相同人名的两个明星的资料完全区分开来,例如:在百度视频里面搜索“大宋佳”时,在热门资讯区域展现的结果实际包含了 “大宋佳”和“小宋佳”的资讯,并不能真正将这两个人的资讯完全区分开来。因此,现有技术中的人名搜索方式难以对同名明星进行有效区分,影响用户的搜索体验。

【发明内容】

[0004]有鉴于此,本发明提供一种搜索方法及数据处理方法、装置及系统,用于对相同名称进行搜索,以有效区分具有同一称谓的数据,使得搜索的数据更加准确,改善用户的搜索体验。
[0005]本发明实施例提供的搜索方法,包括:
[0006]接收用户的搜索请求,所述搜索请求中包含目标名称;
[0007]查找预先设置的同名对应关系,确定与所述目标名称对应的一个唯一标识,所述同名对应关系中包含名称与唯一标识之间的对应关系;
[0008]按照所述唯一标识进行搜索,输出搜索结果,所述搜索结果中的项目的标识中包含所述唯一标识。
[0009]本发明实施例提供的数据处理方法,包括:
[0010]进行名称的数据挖掘,得到所有的相同名称;
[0011]确定与所述所有的相同名称中的每一个名称关联的项目;
[0012]为所述所有的相同名称中的每一个名称设置一个唯一标识,得到同名对应关系,且为与所述名称关联的项目设置与所述名称相同的唯一标识,所述同名对应关系中包含名称与唯一标识之间的对应关系。
[0013]本发明实施例提供的在线搜索系统,包括:
[0014]接收模块,用于接收用户的搜索请求,所述搜索请求中包含目标名称;
[0015]查找模块,用于在所述接收模块接收所述搜索请求之后,查找预先设置的同名对应关系,确定与所述目标名称对应的一个唯一标识,所述同名对应关系中包含名称与唯一标识之间的对应关系;
[0016]输出模块,用于在所述查找模块确定所述唯一标识之后,按照所述唯一标识进行搜索,输出搜索结果,所述搜索结果中的项目的标识中包含所述唯一标识。
[0017]本发明实施例中提供的数据处理装置包括:
[0018]挖掘模块,用于进行名称的数据挖掘,得到所有的同名名称;
[0019]关联模块,用于在所述挖掘模块得到所述所有的相同名称之后,确定与所述所有的相同名称中的每一个名称关联的项目;
[0020]设置模块,用于在所述关联模块确定与所述所有的相同名称中的每一个名称关联的项目之后,为所述所有的相同名称中的每一个名称设置一个唯一标识,得到同名对应关系,且为与所述名称关联的项目设置与所述名称相同的唯一标识,所述同名对应关系中包含名称与唯一标识之间的对应关系。
[0021]从以上技术方案可以看出,本发明实施例具有以下优点:
[0022]在线搜索系统接收用户的搜索请求,该搜索请求中包含目标名称,查找预先设置的同名对应关系,该同名对应关系中包含名称与唯一标识之间的对应关系,确定与该目标名称对应的一个唯一标识,按照该唯一标识进行搜索,输出搜索结果,该搜索结果中的项目的标识中包含该唯一标识。通过预先设置包含名称与唯一标示之间的对应关系的同名对应关系,使得能够通过唯一标识有效的区分相同的名称,且利用目标名称的唯一标识进行搜索,能够获取到包含该唯一标识的所有的项目作为与该目标名称有关联的项目,避免搜索结果出现混淆及不准确的情况,使得搜索结果更加准确,改善用户的搜索体验。
[0023]为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
【附图说明】
[0024]图1为本发明实施例中的服务器的结构的示意图;
[0025]图2为本发明实施例中数据处理方法的实施例的一个示意图;
[0026]图3为本发明实施例中搜索方法的实施例的一个示意图;
[0027]图4为本发明实施例中搜索方法的实施例的另一示意图;
[0028]图5为本发明实施例中数据处理装置的结构的一个示意图;
[0029]图6为本发明实施例中在线搜索系统的结构的一个示意图;
[0030]图7为本发明实施例中在线搜索系统的结构的另一示意图。
【具体实施方式】
[0031]为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的【具体实施方式】、结构、特征及其功效,详细说明如后。
[0032]在本发明实施例中,搜索方法及数据处理方法都是在由服务器执行的,为了更好的理解本发明实施例中的技术方案,请参阅图1,图1为本发明实施例中服务器的结构的示意图。该服务器100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units, CPU) 122 (例如,一个或一个以上处理器)和存储器132,一个或一个以上存储应用程序142或数据144的存储介质130 (例如一个或一个以上海量存储设备)。其中,存储器132和存储介质130可以是短暂存储或持久存储。存储在存储介质130的程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器122可以设置为与存储介质130通信,在服务器100上执行存储介质130中的一系列指令操作。服务器100还可以包括一个或一个以上电源126,一个或一个以上有线或无线网络接口 150,一个或一个以上输入输出接口 158,和/或,一个或一个以上操作系统141,例如Windows ServerTM, Mac OS XTM,UnixTM, LinuxTM, FreeBSDTM 等等。
[0033]在本发明实施例中,在线搜索系统中预先设置了同名对应关系,该同名对应关系中包含名称与唯一标识之间的对应关系,其中,同名对应关系中名称都是具有至少一个相同或者相似的名称的,此外,还预先设置数据库中的项目的唯一标识,使得能够利用唯一标识对具有相同名称进行搜索。
[0034]需要说明的是,本发明是实施例中,通过预先设置同名对应关系的方式对目标名称进行搜索的方法适用于对同名明星,同名影视剧等等的搜索。
[0035]为了更好的理解本发明实施例中的技术方案,下面将介绍进行相同名称搜索之前的数据处理方法,请参阅图2,包括:
[0036]201、进行名称的数据挖掘,得到所有的相同名称;
[0037]在本发明实施例中,数据处理装置将对数据进行离线数据处理,首先是进行名称的数据挖掘,得到所有的相同名称。
[0038]其中,数据处理装置可通过网页爬虫抓取资料库、新闻资料、视频资料等等数据,并进行名称的数据挖掘,得到包含所有名称的名称表,并且除了常规的名称处理流程,还可针对相同名称进行数据挖掘,得到该名称表中的所有的同名名称,其中,同名名称是指在该同名表中每一个名称包含至少一个与该名称相同的名称。
[0039]在本发明实施例中,数据
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1