一种对网页信息条文排序的方法及装置与流程

文档序号:12063825阅读:209来源:国知局
一种对网页信息条文排序的方法及装置与流程

本发明涉及计算机技术领域,尤其涉及一种对网页信息条文排序的方法及装置。



背景技术:

现在网络信息的排名方法基本都是按照竞价或点击量(网络热度)或信任度(网络评价)或者时间顺序来实现的。而用户检索过程中,所获取的结果自然也是采用上述一种排序方式进行排序后的结果。然后,采取不同的方式进行排序,所获取的排序结果自然也是不同的。即获取的排序结果不唯一。这种结果带给用户的信息是紊乱的,具有误导性的。进一步的,如果检索的信息是商业信息,那么,这种结果将还会是不具备公平性的结果。

因此,就需要提出一种真正公平合理,而又不左右用户自己做出判断的排序方法,在摒除金钱等外来因素的情况下,对网页信息条文进行排序。



技术实现要素:

本发明所要解决的技术问题是提供一种能够根据网页信息条文的名称,确定网页信息条文的固定排序顺序,获取真正公平合理,而又不左右用户自己做出判断的排序方法,在摒除金钱等外来因素的情况下,对网页信息条文进行排序。

本发明解决上述技术问题的技术方案如下:

第一方面,本发明实施例提供了一种对网页信息条文进行排序的方法,该方法包括:

接收用户输入的检索信息;

获取与所述检索信息对应的检索结果;

确定所述检索结果对应的网页信息条文所属的语种,其中,所述网页信息条文所属的语种包括一种;

根据所述网页信息条文所属的语种的基础字母排序列表,分别确定每条网页信息条文的第i字的第j个字母在所述基础字母排序列表中的排列顺序;

当确定所述每条网页信息条文的第i字的第j个字母完全不同时,将所述每条网页信息条文的第i字的第j个字母在所述基础字母排序列表中的排列顺序,作为与之对应的网页信息条文的排列顺序;

当确定至少两条网页信息条文的第i字的第j个字母相同时,则将所述至少两条信息条文的第i文字的j+1个字母在所述网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为所述至少两条信息条文的排列排序;

当确定所述至少两条网页信息条文的第i字的所有字母均相同时,则将所述至少两条信息条文的第i+1字的第j个字母在所述网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为所述至少两条信息条文的排列顺序,其中i和j的初始值均为1。

本发明的有益效果是:对检索到结果,依次比较根据网页信息条文中的字所包含的字母在所属的语种的基础字母排序列表中字母的排列顺序,确定每一条网页信息条文的具体排列顺序。一旦网页信息条文的名称固定,那么网页信息条文的排列顺序也是固定不变的。进一步的,该排列顺序是一个不包含任何主观因素,并且摒除一切外来因素的排列顺序,具有公平公正性。避免了用户获取的检索信息是紊乱的,具有误导性的。

进一步,对所述网页信息条文进行排序之后,该方法还包括:

根据所述网页信息条文所属的语种的基础字母排列顺序,对所述网页信息条文进行分组。

采用上述进一步的技术方案的有益技术效果在于,对搜索到的结果进行分组,使用户获取的网页信息条文更加条理清晰。

进一步的,根据所述网页信息条文所属的语种的基础字母排列顺序,对所述网页信息条文进行分组,包括:

将所述网页信息条文中首个文字的首字母相同的网页信息分为一组。

采用上述进一步的技术方案的有益技术效果在于,按照网页条文信息所属的语种的基础字母顺序对网页信息条文进行排序后,可以将首字母为同一字母的网页信息条文分为一组。然后在用户输入首字母时,就可以搜索到与该首字母对应的所有网页信息条文。以便于用户在搜索网页信息条文时,仅获取部分搜索结果。避免了用户设备在显示搜索到的网页信息条文时,篇幅过大的问题。

进一步的,所述网页信息条文所属的语种数量包括至少两种时,按照预定的语种的基础字母排序列表中字母的排列顺序,对所述网页信息条文进行排序;

且当所述网页信息条文中的第一文字所属语种为除所述预定的语种之外的语种时,则对所述网页信息条文进行排序时,不识别所述第一文字。

采用上述进一步的技术方案的有益技术效果在于:当网页信息条文所属的语种数量包括至少两种时,为了不造成排序的混乱,可以按照预定的语种的基础字母排序列表中字母的排列顺序,对网页信息条文进行排序。而且,如果至少两种语种的基础字母排序列表中字母的排列顺序不同,或者基础字母排序列表中字母本身就不相同,则在对网页信息条文排序时,将不会识别除预定的语种之外的其他语种的文字,也即是不将其他语种的文字作为排序时的文字。

进一步的,当所述网页信息条文所属的语种数量包括至少两种时,按照预定的语种的基础字母排序列表中字母的排列顺序,对所述网页信息条文进行排序;当所述网页信息中的第一文字所属语种为除所述预定的语种之外的语种,且所述第一文字所述语种的基础字母排序列表中字母排列顺序与预定的语种的基础字母排序列表中字母的排列顺序相同,则对所述网页信息条文进行排序时,识别所述第一文字。

采用上述进一步的技术方案的有益技术效果在于:当网页信息条文所属的语种数量包括至少两种时,为了不造成排序的混乱,可以按照预定的语种的基础字母排序列表中字母的排列顺序,对网页信息条文进行排序。而且,如果至少两种语种的基础字母排序列表中字母的排列顺序相同,且基础字母排序列表中字母本身就相同,则在对网页信息条文排序时,识别除预定的语种之外的其他语种的文字,也即是将其他语种的文字同样作为排序时的文字。

第二方面,本发明实施例提供了一种对网页信息条文进行排序的装置,该装置包括:

接收单元,用于接收用户输入的检索信息;

获取单元,用于获取与所述检索信息对应的检索结果;

处理单元,用于确定所述检索结果对应的网页信息条文所属的语种,其中,所述网页信息条文所属的语种包括一种;

当确定所述每条网页信息条文的第i字的第j个字母完全不同时,将所述每条网页信息条文的第i字的第j个字母在所述基础字母排序列表中的排列顺序,作为与之对应的网页信息条文的排列顺序;

当确定至少两条网页信息条文的第i字的第j个字母相同时,则将所述至少两条信息条文的第i文字的j+1个字母在所述网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为所述至少两条信息条文的排列排序;

当确定所述至少两条网页信息条文的第i字的所有字母均相同时,则将所述至少两条信息条文的第i+1字的第j个字母在所述网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为所述至少两条信息条文的排列顺序,其中i和j的初始值均为1。

上述方案的有益技术效果在于,对检索到结果,依次比较根据网页信息条文中的字所包含的字母在所属的语种的基础字母排序列表中字母的排列顺序,确定每一条网页信息条文的具体排列顺序,一旦网页信息条文的名称固定,那么网页信息条文的排列顺序也是固定不变的。进一步的,该排列顺序是一个不包含任何主观因素,并且摒除一切外来因素的排列顺序,具有公平公正性。避免了用户获取的检索信息是紊乱的,具有误导性的。

进一步的,处理单元还用于:根据所述网页信息条文所属的语种的基础字母排列顺序,对所述网页信息条文进行分组。

采用上述进一步的技术方案的有益技术效果在于,对搜索到的结果进行分组,使用户获取的网页信息条文更加条理清晰。

进一步的,处理单元具体用于:

将所述网页信息条文中首个文字的首字母相同的网页信息分为一组。

采用上述进一步的技术方案的有益技术效果在于,按照网页条文信息所属的语种的基础字母顺序对网页信息条文进行排序后,可以将首字母为同一字母的网页信息条文分为一组。然后在用户输入首字母时,就可以搜索到与该首字母对应的所有网页信息条文。以便于用户在搜索网页信息条文时,仅获取部分搜索结果。避免了用户设备在显示搜索到的网页信息条文时,篇幅过大的问题。

附图说明

图1为本发明实施例提供的一种对网页信息条文进行排序的方法流程示意图;

图2为本发明实施例提供的一种对网页信息条文进行排序的装置结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透切理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

本发明所提供的一种对网页信息条文进行排序的方法,所适用的应用场景可以包括很多,例如百度搜索、谷歌搜索等等搜索网站,数据库搜索、中国知网等其他搜索平台。具体的对网页信息条文进行排序的方法步骤如下:

图1为本发明实施例提供的一种对网页信息条文进行排序的方法流程示意图。

具体如图1所示,该方法包括:

步骤110,接收用户输入的检索信息。

具体的,用户输入的检索信息可以是文字、声音等信息。该信息可以与检索结果对应的关联信息,或者就是关键字等,这里不做限制。

步骤120,获取与检索信息对应的检索结果。

步骤130,确定检索结果对应的网页信息条文所属的语种。

首先要确定检索结果对应的网页信息条文所属的语种。只有在确定所属的语种的情况下,才可以确定采用哪种语种对应的基础字母排序列表作为排序的基准,按照网页信息条文中的文字所包含的字母在字母列表中的排列顺序,为网页信息条文进行排序。步骤140,根据网页信息条文所属的语种的基础字母排序列表,分别确定每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序。

具体的,如步骤130中所述,只有确定了每条信息条文中文字所包含的字母在字母列表中的排列顺序,才可以确定网页信息条文的排列顺序。其中,在本文中所述的i和j均为大于或者等于1的正整数。且i和j的初始值均为1。

但是,分别确定每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序,还不能够完全确定每条网页信息条文的排列顺序,还需要至少分为以下三种情况,根据不同的情况,分为不同的方法步骤。当然,读者应理解,以下三种情况,每次只能出现一次,非同时出现。

在一种情况中,当确定每条网页信息条文的第i字的第j个字母完全不同时,执行步骤151,将每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序,作为与之对应的网页信息条文的排列顺序。

第二种情况中,当确定至少两条网页信息条文的第i字的第j个字母相同时,执行步骤152,将至少两条信息条文的第i文字的j+1个字母在网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为至少两条信息条文进行排序。第三种情况,当确定至少两条网页信息条文的第i字的所有字母均相同时,执行步骤153,将至少两条信息条文的第i+1字的第j个字母在网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为至少两条信息条文的排列顺序。

当然,对上述第二种情况和第三种情况中所言的至少两条信息条文进行排序,是在按照所述网页信息条文的第i文字的j个字母在网页信息条文所属的语种的基础字母排列顺序的基础上,对至少两条信息条文进行排序。

这里,还要说明的是,当检索到的网页信息条文是中文时,需要按照中文对应的汉语拼音中字母进行排序。

具体而言,这里i和j均从1开始取值,是说首先比较的是每一条网页信息条文中第一个字所包含的第一个字母,例如检索信息为“专利”,而检索的结果包括:“专利网-国家指定专利网-快速授权”,“专利检索网”,“中国专利信息网”,“专利百科”,“官方-专利检索”等等。首先根据检索结果可知,这几个网页信息条文所属的语种均为中文,所以可以按照中文的基础字母排序列表中字母的排列顺序(这里设置中文字母列表的排列顺序和英文字母列表的排列顺序相同,均为a,b,c,d,e,f等等的排列顺序),确定这几个网页信息条文的排列顺序。其中,第一条网页信息条文、第二条网页信息条文、第三条网页信息条文的第一个字均为“专(拼音为zhuan,这里不考虑音阶)”,对应的首个字母为“z”;第四条网页信息条文的第一个字为“中(拼音为zhong)”,但是其首个字母同样为“z”;而第五条网页信息条文的第一个字为“管”,对应的首个字母为“g”。可知,在字母排序列表中,字母“g”是排列在“z”前面的,所以在网页信息条文的排序过程中,将会将“官方-专利检索”排列在第一位。而剩下的几条网页信息条文,需要继续比较每一条网页信息条文中第一个字的第二个字母,其中,同样因为第一条网页信息条文至第四条网页信息条文的第一个字对应的第二个字母为“h”,仍然无法确定其顺序,则分别判断第一条网页信息条文至第四条网页信息条文的第一个字的第三个字母是否相同,其中,第一条网页信息条文至第三条网页信息条文中,第一个字的第三个字母均是“u”。而第四条网页信息条文的第三个字母为“o”,在基础字母排序列表中,o是排在u之前的,所以第四条网页信息条文排在第二位。第一条网页信息条文至第三条网页信息条文中,因为首个字均是“专”,所以,即使对比这三条网页信息条文的首个字所包含的全部字母都不能够确定这三条网页信息条文的排列顺序,那么则需要i递进取值,取值为2。利用上述方法,同样确定这三条网页信息条文的第二个字所包含的全部字母均是相同的,那么i再次递进取值,取值为3。此时,第一条网页信息条文中第三个字为“网(拼音为wang)”,第二条网页信息条文中第三个字为“检(拼音jian)”,第三条网页信息条文的第三个字为“百(拼音bai)”,由此确定,第一条网页信息条文中第三个字的首个字母为w,第二条网页信息条文中第三个字的首个字母为j,第三条网页信息条文中第三个字的首个字母为b。按照基础字母排序列表中字母排序顺序可知,b排在j的前面,j排在w的前面。如此,可以确定第三条网页信息条文排在第三位,第二条网页信息条文排在第四位,第一条网页信息条文排在第五位。

由此,系统会自动根据上述排列顺序,向用户显示最终的搜索结果。

当然,这里还要说明的是,从上文中读者也可以看出,在排序过程中,是以一个“文字”为单元,然后按照该“文字”中字母在基础字母列表中的排列顺序,确定网页信息条文的排序。而非以单个“字母”为单元,进行排序。当然,上述只是说明网页信息条文所属的语种仅包括一种的情况。而如果网页信息条文所属的语种不止包括一种时,则可以分为下述两种情况:

第一种情况,当网页信息条文所属的语种数量包括至少两种时,按照预定的语种的基础字母排序列表中字母的排列顺序,对网页信息条文进行排序,且当网页信息条文中的第一文字所属语种为除预定的语种之外的语种时,则对网页信息条文进行排序时,不识别第一文字。

具体的,在检索过程中,很多情况会出现一条网页信息条文中可能不止包含一种语种的文字,一般可能包含两种。例如包含中文文字和日文文字,因为这两种文字无法使用同一种基础字母排序列表。所以,在对网页信息条文进行排序时,则只采用预定的语种的基础字母排序列表进行排序(例如预定的语种的基础字母排序列表为中文的基础字母排序列表),对于网页信息条文中出现的日文文字,直接跳过,不作为比较的标准。

在另一种情况中,当网页信息条文的语种数量包括至少两种时,按照预定的语种的基础字母排序列表中字母的排列顺序,对网页信息条文进行排序;当网页信息中的第一文字所属语种为除预定的语种之外的语种,且第一文字语种的基础字母排序列表中字母排列顺序与预定的语种的基础字母排序列表中字母的排列顺序相同,则对网页信息条文进行排序时,识别第一文字。

具体的,在检索过程中,获取的网页信息条文所属的语种包含中文文字和英文文字时,因为这两种文字可以使用同一种基础字母排序列表(如上文中所述的基础字母列表为英文字母的排序列表,a,b,c,d……等等)。所以,在对网页信息条文进行排序时,只要将中文文字首先翻译成汉语拼音,然后确定汉语拼音中的字母的排列顺序即可。对于网页信息条文中出现的英文文字,可以把其当作普通的字母即可,同样可以按照此列表进行排序,在排序的过程中,可以将其作为排序的标准,根据字母的排列顺序,对该文字信息条文进行排序。

本实施例提供的一种对网页信息条文进行排序的方法,对检索到结果,依次比较根据网页信息条文中的字所包含的字母在所属的语种的基础字母排序列表中字母的排列顺序,确定每一条网页信息条文的具体排列顺序,由此可以获取一个不包含任何主观因素,并且摒除一切外来因素的排列顺序,具有公平公正性。避免了用户获取的检索信息是紊乱的,具有误导性的。

相应地,本发明实施例还提供了一种对网页信息条文进行排序的装置。图2为本发明实施例提供的一种对网页信息条文进行排序的装置结构示意图。具体如图2所示,该装置包括以下单元:

接收单元201,获取单元202,以及处理单元203。

接收单元201,用于接收用户输入的检索信息。

获取单元202,用于获取与检索信息对应的检索结果。

处理单元203,确定检索结果对应的网页信息条文所属的语种,其中,网页信息条文的语种包括一种;

根据网页信息条文所属的语种的基础字母排序列表,分别确定每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序。

但是,分别确定每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序,还不能够完全确定每条网页信息条文的排列顺序,还需要至少分为以下三种情况,根据不同的情况,处理单元203将执行不同的动作。当然,读者应理解,以下三种情况,每次只能出现一次,非同时出现。

具体的,第一种情况,当确定每条网页信息条文的第i字的第j个字母完全不同时,将每条网页信息条文的第i字的第j个字母在基础字母排序列表中的排列顺序,作为与之对应的网页信息条文的排列顺序。

第二种情况,当确定至少两条网页信息条文的第i字的第j个字母相同时,则将至少两条信息条文的第i文字的j+1个字母在网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为至少两条信息条文的排列排序。

第三种情况,当确定至少两条网页信息条文的第i字的所有字母均相同时,则将至少两条信息条文的第i+1字的第j个字母在网页信息条文所属的语种的基础字母排序列表中的排列顺序,作为至少两条信息条文的排列顺序。其中i和j均为大于或者等于1的正整数,且i和j的初始值均为1。

当然,对上述第二种情况和第三种情况中所言的至少两条信息条文进行排序,是在按照所述网页信息条文的第i文字的j个字母在网页信息条文所属的语种的基础字母排列顺序的基础上,对至少两条信息条文进行排序。

为了使用户获取的网页信息条文更加条理清晰。更为了便于用户在搜索网页信息条文时,仅获取部分搜索结果。避免了用户设备在显示搜索到的网页信息条文时,篇幅过大的问题。因此,在排序之后,处理单元203还可以用于,根据网页信息条文所属的语种的基础字母排列顺序,对网页信息条文进行分组。具体的,可以将网页信息条文中首个文字的首字母相同的网页信息分为一组。

该装置的各部件所执行的功能已经在上述实施例一种对网页信息条文进行排序的方法中做了详细的介绍,这里不再赘述。

本发明实施例提供的一种对网页信息条文进行排序的装置,对检索到结果,依次比较根据网页信息条文中的字所包含的字母在所属的语种的基础字母排序列表中字母的排列顺序,确定每一条网页信息条文的具体排列顺序,由此可以获取一个不包含任何主观因素,并且摒除一切外来因素的排列顺序,具有公平公正性。避免了用户获取的检索信息是紊乱的,具有误导性的。

与上述实施例相对应的,本发明实施例提供了一种系统。

该系统中各部件所执行的功能均已在上述两个实施例中做了详细介绍,这里不再赘述。

读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1