一种基于搜索引擎的搜索结果排序方法及装置的制作方法

文档序号:6614375阅读:134来源:国知局

专利名称::一种基于搜索引擎的搜索结果排序方法及装置的制作方法
技术领域
:本发明涉及搜索引擎领域,特别是涉及一种基于搜索引擎的搜索结果排序方法及装置。
背景技术
:随着搜索引擎技术的不断发展与信息处理技术的进步,人们对搜索引擎的需求也越来越广泛,搜索引擎的种类也呈现多样化发展。目前,主流的搜索引擎分为全文搜索引擎、目录搜索引擎和元搜索引擎。近期,垂直搜索引擎也逐渐进入了人们的视野。在搜索引擎领域,评价一个搜索引擎好坏的重要标准就是能否让用户尽快找到所需的信息,即与用户搜索主题相关的各种信息。近年来,各大搜索引擎在搜索结果的相关性排序上均做了优化。所谓搜索结果的相关性就是指用户搜索词和页面的相关程度。通常,相关性是搜索引擎进行排序的一个重要依据。计算页面相关性的主要方法有google的PageRank、Bharat的HillTop、百度的超链分析等。它们的基本原理就是根据网页的引用情况进行排序。但是由于在中文搜索引擎中存在分词的问题,词典是以搜索词作为查询词的搜索引擎的基础。词典的好坏在一定程度上决定着搜索结果排序的效果。词典过小,会导致过多的无关信息的出现;词典过大,有时会导致部分词搜索结果的主题过少等问题出现。因此如何确定词典,增加新的扩充词典集,使搜索引擎的结果更加准确、更加人性化就随之成为一个备受关注的问题。
发明内容本发明实施例提供一种基于搜索引擎的搜索结果排序方法及装置,使排序结果更加贴近用户的需求。本发明实施例的一种基于搜索引擎的搜索结果排序方法,包括下列步骤对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;确定所述搜索词在各待排序网络资源中的总权重;以及按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。本发明实施例的一种基于搜索引擎的搜索结果排序装置,包括分词单元,用于对用户输入的搜索词进行分词处理;关键词权重确定单元,用于以分词处理所得分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;总权重确定单元,用于确定所述搜索词在各待排序网络资源中的总权重;排序单元,用于按照总权重对所述各待排序的网络资源进行排序;呈现单元,用于向用户呈现排序结果。综上所述,本发明实施例中对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重,并确定所述搜索词在各待排序网络资源中的总权重。由于总权重中考虑了搜索词与关键词的匹配等情况,所以按照总权重对所述各待排序的网络资源进行排序并呈现给用户,可更加贴近用户的需求。图1为本发明实施例的方法步骤流程图;图2为本发明实施例的装置结构示意图;图3为本发明实施例的装置优化结构示意图;图4为本发明实施例的索引示意图;图5为本发明实施例中确定待排序网络资源的示意图;图6为本发明实施例中查询分词权重的示意图。具体实施方式为了使排序结果更加贴近用户的需求,本发明实施例提供了一种基于搜索引擎的搜索结果排序方法及装置,以下分别简要概述。本发明实施例提供的一种基于搜索引擎的搜索结果排序方法,在进行了一些预先设置,用户输入搜索词,并且确定了待排序网络资源之后,参见图l所示,执行下列主要步骤51、对用户输入的搜索词进行分词处理(本步骤也可在确定待排序网络资源之前执行)。52、以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜中的关键词权重。53、确定所述搜索词在各待排序网络资源中的总权重。54、按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。在用户输入搜索词进行搜索之前,预先的设置步骤,具体包括定制关键词词典的步骤以词和词的属性作为基本结构,定制的关键词词典中包括各有效词和每一有效词对应的属性,以及各无效词和每一无效词对应的属性。所述无效词的集合与有效词的集合互为互斥关系,并且一个无效词包含的字符覆盖一个有效词包含的字符。所述词的属性以字符型数字表示,每一位字符分别表示所述词的一种属性。提取关键词的步骤依据关键词词典,按最大匹配原则对每一网络资源的主题信息进行分词处理;根据分词处理所得分词的属性对该分词进行过滤,以提取每一网络资源的主题信息的关键词。其中,以网页的标题作为该网页的主题信息,或者从网页的内容中提取该网页的主题信息,或者以描述下载资源的信息作为主题信息等。建立关键词索引的步骤分别对每一网络资源的主题信息的各关键词采用基础分词词典进行分词处理,并建立关键词的各分词到网络资源的关键词索引。建立资源索引的步骤根据基础分词词典对网络资源的主题信息进行分词处理,并建立网络资源的各分词到网络资源的资源索引。配置权重的步骤根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重;或者根据网络资源的信息(包括但不限于被浏览次数和/或被引用情况和/或被下载次数和/或文件格式,以下不再赘述),为该网络资源配置静态权重,以及根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重。配置的权重可记录在上述资源索引和关^t词索引中。配置权重后在S2中,可将对搜索词进行分词处理所得分词分别在关键词索引中进行查找,以确定每一分词在各待排序网络资源的主题信息的关键词中的分词权重,并将各分词在同一待排序网络资源的主题信息中的分词权重相加,作为搜索词在该待排序网络资源中的关4定词权重。在S3中,可取搜索词在当前待排序网络资源中的关键词权重作为总权重;也可取根据当前待排序网络资源的信息配置的静态权重和搜索词在当前待排序网络资源中的关键词权重,并将该静态权重与关键词权重组合成当前待排序网络资源的总权重;或者以其它相关权重与关键词权重组合成当前待排序网络资源的总权重。在用户输入搜索词进行搜索之后,确定待排序网络资源具体以对搜索词进行分词处理所得分词分别在资源索引中进行查找,以分别确定每一分词所属的网络资源的集合;取各所述集合的交集,作为待排序的网络资源。本发明实施例还提供了一种基于搜索引擎的搜索结果排序装置,参见图2所示,其包括分词单元、关键词权重确定单元、总权重确定单元、排序单元和呈现单元。分词单元,用于对用户输入的搜索词进^f亍分词处理。关键词权重确定单元,用于以分词处理所得分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重。总权重确定单元,用于确定所述搜索词在各待排序网络资源中的总权重。排序单元,用于按照总权重对所述各待排序的网络资源进行排序。呈现单元,用于向用户呈现排序结果。进一步为了提供上述单元所需的信息,参见图3所示,所述装置还包括定制单元、提取单元、关键词索引建立单元、资源索引建立单元、确定单元和配置单元。定制单元,用于以词和词的属性作为基本结构,定制关键词词典;定制的关键词词典中包括各有效词和每一有效词对应的属性,以及各无效词和每一无效词对应的属性。提取单元,用于依据关键词词典,按最大匹配原则对每一网络资源的主题信息进行分词处理;根据分词处理所得分词的属性对该分词进行过滤,以提取每一网络资源的主题信息的关键词。关键词索51建立单元,用于根据基础分词词典分别对每一网络资源的主题信息的各关键词进行分词处理,并建立关键词的各分词到网络资源的关键词索引,以备关键词权重确定单元调用。资源索引建立单元,用于根据基础分词词典对网络资源的主题信息进行分词处理,并建立网络资源的各分词到网络资源的资源索引。找,以分別确定每一分词所属的网络资源的集合;取各所述集合的交集,作为待排序的网络资源。配置单元,用于根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重;或者根据网络资源的信息,为该网络资源配置静态权重,并根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重。配置单元配置权重后,关键词权重确定单元可将对搜索词进行分词处理所得分词分别在关键词索引中进行查找,以确定每一分词在各待排序网络资源的主题信息的关键词中的分词权重,并将各分词在同一待排序网络资源的主题信息中的分词权重相加,作为搜索词在该待排序网络资源中的关键词权重。总权重确定单元可取搜索词在当前待排序网络资源中的关4建词权重作为总权重;也可取根据当前待排序网络资源的信息配置的静态权重和搜索词在当前待排序网络资源中的关键词权重,并将该静态权重与关键词权重组合成当前待排序网络资源的总权重;或者以其它相关权重与关键词权重组合成当前待排序网络资源的总权重。至此,对本发明实施例的方法及装置的概述完毕。以下通过l个实施例进一步详细描述本发明。实施例1、本实施例包括设置步骤、确定待排序网络资源的步骤、计算权重的步骤、排序步骤,以及呈现步骤。其中设置步骤包括关键词词典的定制子步骤、关键词的提取子步骤、建立关键词索引的子步骤、建立资源索引的子步骤,以及权重配置子步骤。101、关^l建词词典的定制。关4定词,即能够标识一个网络资源(网页资源或下载资源)的主题信息的词汇。例如,在搜索引擎中,用户经常会输入软件名称+"下载",电影名+"高清晰"等词组,这里的软件名称和电影名就可以定义为这些词组的关键词。为了有效提取一个网络资源的主题信息的关键词,首先需要建立一个关键词词典。根据用户的日常搜索习惯统计,在影视搜索引擎、音乐搜索引擎以及通用搜索引擎中,用户常常会输入影视名、歌曲名、歌手名等词汇作为搜索词。因此,可以根据目前流行的电影、电视剧、歌曲、歌手、演员等信息建立关键词词典。该词典的基本结构为(词,属性)。其中,属性描述了词的有效性及类别,如是否有效,是否为电影名、歌名、软件名等。本实施例采用以下方式(但不限于该方式)描述属性以一个字节的字符型数字按位描述属性信息,共8位,每一位代表该词的一种属性,l为具有该属性,0为不具有该属性。如"英雄"既可以是电影名又可以是电视剧名,它的属性就可以表示为11100000,各位属性信息参见表1所示<table>tableseeoriginaldocumentpage12</column></row><table>表1其中最高位(即表1所示的第7位)的属性定义如下该位记录了关键词词典中词的有效属性,无效词集合与有效词集合互为互斥关系。无效词集合中的词A在字面上会包含有效词集合中的某个词B,如某电影名"东"这个词为有效词,"东方"、"东门"等为无效词。无效词的优先确定原则为字面上包含某个有效词,但不属于有效词集合,而且不是某个电影名、歌名等可以作为关键词的词汇。102、关键词的提取。针对搜索引擎数据库中的每一网络资源,需要为其主题信息提取相应的关键词。首先采用关键词词典,按最大匹配原则对网络资源的主题信息进行分词,将分词所得结果根据其属性进行过滤。去掉属性为无效的词汇,保留属性为有效的词汇,并以保留的词汇作为该网络资源的主题信息的关键词。例如,关键词词典中有以下一组词东11000000东方00000000东游记10100000东北00000000对如下一组网页标题的4是取结果为影片东的花絮-——东东游记高清晰版——-东游记东北的小路-——对于垂直搜索引擎而言,如对影视搜索引擎,关键词的最后确定还可以根据提取的关键词的其他属性进一步过滤。如对网页标题"龙虎门甄子丹主演"提取的关键词为"龙虎门,,和"甄子丹",但"甄子丹"不是一个影视词汇,而是一个人名,此时就应该将"甄子丹,,这个词过滤。这种过滤方式可以依据搜索引擎的具体搜索类别而确定。103、建立关键词索引。采用基础分词词典(但不限于),分别对每一网络资源的主题信息的各关键词进行分词处理,并建立关键词的各分词到网络资源的关键词索引。例如有如下一批网络资源的主题信息Docl:不能说的秘密全集中文字幕;Doc2:不能说的秘密全集;Doc3:铁三角DVD中文字幕;Doc4:4失三角全集;Doc5:铁三角(主演任达华);Doc6:秘密全集;它们的关键词分别为Docl:不能说的秘密;Doc2:不能说的秘密;Doc3:4失三角;Doc4:4失三角;Doc5:铁三角;Doc6:秘密。对各关键词进行分词处理,得到如下分词不能、说、的、秘密、铁三角。关键词索引的建立情况如下"不能"关联Docl和Doc2;"说',关联Docl和Doc2;"的"关联Docl和Doc2;"秘密,,关联Docl、Doc2和Doc6;"铁三角"关耳关Doc3、Doc4和Doc5。104、建立资源索引(与建立关键词索引之间不分先后)。根据基础分词词典(但不限于)对网络资源的主题信息进行分词处理,并建立网络资源的各分词到网络资源的资源索引。例如有如下一批网络资源的主题信息Docl:不能说的秘密全集中文字幕;Doc2:不能说的秘密全集;Doc3:铁三角DVD中文字幕;Doc4:铁三角全集;Doc5:铁三角(主演任达华);Doc6:秘密全集;分词处理后资源索引的建立情况如下"不能"关联Docl,Doc2;"说,,关联Docl,Doc2;"的"关联Docl,Doc2;"秘密"关联Docl,Doc2,Doc6;"全集"关耳关Docl,Doc2,Doc4,Doc6;"中文"关联Docl,Doc3;"字幕,,关联Docl,Doc3;"铁三角"关联Doc3,Doc4,Doc5;"DVD"关联Doc3;"主演"关联Doc5;"任达华"关联Doc5。105、权重配置。权重配置包括对网络资源的静态权重配置以及对关键词中各分词的权重配置这两部分。其中,网页资源的静态权重由网页的浏览次数、网页来源、网页引用情况等信息确定;下载资源的静态权重由资源的下载次数、文件大小、文件格式等信息确定。例如对某下载资源docidl而言,可以根据docidl的下载次数、docidl的大小等信息确定该下载资源的静态权重为Wl。其中,对关键词中各分词的权重配置包括下列步骤首先根据基础分词词典(但不限于)对关键词进行分词,如关键词"不能说的秘密"被分为四个词,即分词结果为不能、说、的、秘密。其次假设每个关键词的权重均为weight=l,则wordl"不能"所对应的4又重为W11,word2所对应的4又重为W21,word3"的"所对应的4又重为W31,word4"秘密"所对应的权重为W41,并且Wll=W41=l/3,W21=W31=l/4,即各分词权重按分词词长占关4建词词长的比例确定。配置的静态权重和关键词中各分词的权重可加入到上述资源索引和关键词索引中。参见图4所示,在具体实现中所有网络资源的静态权重信息都记录在一起,并且以网络资源对应的docid为索引。Wordl,Word2…Wordn分别记录了该词在各网络资源的主题信息的关键词中的分词权重,并且以关键词所属网络资源的主题信息对应的docid为索引。106、确定待排序网络资源。参见图5所示,当用户输入某个词word作为搜索词进行搜索时,首先对搜索词word采用基础分词词典进行分词处理,得到分词序列wordl,word2,…,wordn。然后在图4所示的资源索引中查找出分词wordk,k=l,2,...,n所对应的docid序歹寸的交集,如docid2,docid4,docid5等,并以docid序列的交集对应的网络资源的交集作为待排序网络资源。107、计算权重。计算各待排序网络资源的总权重,以下以docid2为例。参见图6所示,在关键词索引(参见图4所示)中分别查找word1,word2,...,wordn在docid2所对应的待排序网络资源的主题信息中的分词权重,取出分词权重W12,W22,...,Wn2进行累加,得到搜索词在docid2所对应的待排序网络资源的主题信息中的关键词权重,即Wk(docid)-i:Wmn。如果某个wordk所对应的docid中不含docid2,则其相应的权重为Wk2=0,即该词不是docid2对应的网络资源的主题信息的关键词分词。并且在图4所示的资源索引中取docid2对应的网络资源的静态权重Ws(docid)。最后计算docid2对应的网络资源的总权重W(dodd)。可根据具体情况确定Ws(docid)和Wk(docid)在W(docid)中分别所占的比例,如Ws(dodd)占q1,Wk(docid)占q2,则W(docid)=ql*Ws(docid)+q2*Wk(docid)。108、排序。计算出各待排序网络资源的总权重后,按照总权重由高至低的顺序对所述各待排序网络资源进行排序。当采用上述方案对搜索结果排序后,可以得到比较理想的搜索结果。例如,当用户搜索"秘密预告片"时,若搜索结果中有网页标题l-"秘密预告片",网页标题2-"不能说的秘密预告片",则"秘密预告片"的权重将大于"不能说的秘密预告片"的权重。这是因为"秘密预告片"的关键词为"秘密","不能说的秘密预告片"的关键词为"不能说的秘密",而"预告片"为无效关键词。当对关键词分词后,"不能说的秘密"将会被分为"不能、说、的、秘密"四个词。在关键词索引中,"秘密"在网页标题1的关键词中的权重为weight,在网页标题2的关键词中的权重为weight/3。109、向用户呈现排序结果。将实际总权重最高的网络资源排在最前面,从而使排序结果更加贴近用户的需求。从实施例l中可以看出,ql和q2是可调节的。在特殊情况下,由于提取关键词的原因,有时当用户输入一个字,且该字是一个电影名时,例如"东",该搜索词可能会有许多结果均为关键词"东",这时会导致搜索结果过于单一化,结果显示整页均是有关"东"的电影,这样可能与用户实际想要的结果有一定差距。可以降低q2并升高ql,以针对该特殊情况。综上所述,本发明实施例中对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重,并确定所述搜索词在各待排序网络资源中的总权重。由于总权重中考虑了搜索词与关键词的匹配等情况,所以按照总权重对所述各待排序的网络资源进行排序并呈现给用户,可更加贴近用户的需求。进一步,本发明实施例中提供了设置步骤、确定待排序网络资源的步骤、计算权重的步骤、排序步骤,以及呈现步骤的具体实现方案。其中设置步骤包括关键词词典的定制子步骤、关键词的提取子步骤、建立关键词索引的子步骤、建立资源索引的子步骤,以及权重配置子步骤。更好的支撑了本发明。进一步,本发明实施例1中ql和q2可调节,所以可根据具体情况进行调整,满足用户的各种需求。明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。权利要求1、一种基于搜索引擎的搜索结果排序方法,其特征在于,包括下列步骤对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;确定所述搜索词在各待排序网络资源中的总权重;以及按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。2、如权利要求1所述的方法,其特征在于,在用户输入搜索词进行搜索之前还包括以词和词的属性作为基本结构,定制关键词词典的步骤;定制的关键词词典中包括各有效词和每一有效词对应的属性,以及各无效词和每一无效词对应的属性。3、如权利要求2所述的方法,其特征在于,所述无效词的集合与有效词的集合互为互斥关系。4、如权利要求3所述的方法,其特征在于,一个所述无效词包含的字符覆盖一个有效词包含的字符。5、如权利要求2所述的方法,其特征在于,所述词的属性以字符型数字表示,每一位字符分别表示所述词的一种属性。6、如权利要求2所述的方法,其特征在于,在用户输入搜索词进行搜索之前还包括依据关键:词词典,按最大匹配原则对每一网络资源的主题信息进行分词处理;根据分词处理所得分词的属性对该分词进行过滤,以提取每一网络资源的主题信息的关键词。7、如权利要求1所述的方法,其特征在于,在用户输入搜索词进行搜索之前还包括分别对每一网络资源的主题信息的各关键词进行分词处理;建立关键词的各分词到网络资源的关键词索引。8、如权利要求7所述的方法,其特征在于,还包括配置权重的步骤,其中包括根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重;或者根据网络资源的信息,为该网络资源配置静态权重,并根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重。9、如权利要求8所述的方法,其特征在于,所述网络资源的信息包括被浏览次数和/或被引用情况和/或被下载次数和/或文件格式和/或文件大小。10、如权利要求l所述的方法,其特征在于,将以分词处理所得分词分别在关键词索引中进行查找,以确定每一分词在各待排序网络资源的主题信息的关键词中的分词权重;将各分词在同一待排序网络资源的主题信息中的分词权重相加,作为所述搜索词在该待排序网络资源中的关键词权重。11、如权利要求10所述的方法,其特征在于,所述总权重至少包括搜索词在所述待排序网络资源中的关键词权重。12、如权利要求10所述的方法,其特征在于,确定所述搜索词在各待排序网络资源中的总权重,包括下列步骤取根据当前待排序网络资源的信息配置的静态权重;取所述搜索词在当前待排序网络资源中的关键词权重;将当前待排序网络资源的静态权重与关键词权重组合成当前待排序网络资源的总权重。13、如权利要求12所述的方法,其特征在于,当前待排序网络资源的总权重为W(docid)=ql*Ws(docid)+q2*Wk(docid),其中,docid表示当前待排序的网络资源;ql表示静态权重占总权重的比例;Ws(docid)表示静态权重;q2表示关键词权重占总权重的比例;Wk(docid)表示关键词4又重。14、如权利要求l所述的方法,其特征在于,在用户输入搜索词进行搜索之前还包括根据基础分词词典对网络资源的主题信息进行分词处理;建立网络资源的各分词到网络资源的资源索引。15、如权利要求M所述的方法,其特征在于,确定所述待排序网络资源,包括下列步骤以对搜索词进行分词处理所得分词分别在资源索引中进行查找,以分别确定每一分词所属的网络资源的集合;取各所述集合的交集,作为待排序的网络资源。16、如权利要求l所述的方法,其特征在于,按照总权重由高至低的顺序对所述各待排序的网络资源进行排序,并将排序结果正向呈现给用户。17、一种基于搜索引擎的搜索结果排序装置,其特征在于,包括分词单元,用于对用户输入的搜索词进行分词处理;关键词权重确定单元,用于以分词处理所得分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;总权重确定单元,用于确定所述搜索词在各待排序网络资源中的总权重;排序单元,用于按照总权重对所述各待排序的网络资源进行排序;呈现单元,用于向用户呈现排序结果。18、如权利要求17所述的装置,其特征在于,还包括定制单元,用于以词和词的属性作为基本结构,定制关键词词典;定制的关键词词典中包括各有效词和每一有效词对应的属性,以及各无效词和每一无效词对应的属性。19、如权利要求18所述的装置,其特征在于,还包括提取单元,用于依据关键词词典,按最大匹配原则对每一网络资源的主题信息进行分词处理;才艮据分词处理所得分词的属性对该分词进行过滤,以提取每一网络资源的主题信息的关键词。20、如权利要求17所述的装置,其特征在于,还包括关键词索《1建立单元,用于分别对每一网络资源的主题信息的各关键词进行分词处理,并建立关键词的各分词到网络资源的关键词索引,以备关键词权重确定单元调用。21、如权利要求20所述的装置,其特征在于,还包括配置单元,用于根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重;或者根据网络资源的信息,为该网络资源配置静态权重,并根据关键词的各分词词长占该关键词词长的比例,为各分词分别配置分词权重。22、如权利要求17所述的装置,其特征在于,还包括资源索引建立单元,用于根据基础分词词典对网络资源的主题信息进行分词处理,并建立网络资源的各分词到网络资源的资源索引。23、如权利要求22所述的装置,其特征在于,还包括找,以分别确定每一分词所属的网络资源的集合;取各所述集合的交集,作为待排序的网络资源。24、如权利要求23所述的装置,其特征在于,排序单元按照总权重由高至低的顺序对所述各待排序的网络资源进行排序,则呈现单元将排序结果正向呈现给用户。全文摘要本发明公开了一种基于搜索引擎的搜索结果排序方法及装置,涉及搜索引擎领域,使排序结果更加贴近用户的需求。方法包括对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;确定所述搜索词在各待排序网络资源中的总权重;以及按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。装置包括分词单元、关键词权重确定单元、总权重确定单元、排序单元和呈现单元。文档编号G06F17/30GK101158971SQ20071018727公开日2008年4月9日申请日期2007年11月15日优先权日2007年11月15日发明者刘汉洲申请人:深圳市迅雷网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1