一种搜索方法和系统的制作方法

文档序号:6363611阅读:106来源:国知局
专利名称:一种搜索方法和系统的制作方法
技术领域
本申请涉及网络技术领域,特别是涉及一种搜索方法和系统。
背景技术
一种产品或者商品通常都会有一个品牌。比如运动鞋这种商品,有阿迪达斯品牌的运动鞋,有耐克品牌的运动鞋,有李宁品牌的运动鞋。对于商品的品质来说,品牌无疑是最有力的证据,是服务的保证。随着网络技术的发展,越来越多的用户在网上购买商品,由于缺乏现场体验的环节,所以商品的品牌信息对商品的品质更是尤为重要,因此在电子商务中,系统根据用户的搜索词返回准确的品牌信息显得尤为重要。现有技术中,一种方法是只对商品的标题进行关键词匹配,这样可能产出非用户期望的品牌商品,如搜索阿迪达斯,搜索结果只会给出商品标题中含有阿迪达斯、阿迪、adidas等不同形式关键字的商品,但有可能这个商品的品牌属性却不是阿迪达斯品牌。此夕卜,对于本身是阿迪达斯品牌的商品,但因标题中没有出现阿迪达斯相关的品牌关键词,而容易在搜索排序时漏掉。另一种方法是建立两个单独的引擎,一个是商品的标题引擎,一个是品牌信息引擎,在对用户的搜索词进行分词后,将分词后的查询词分别在标题引擎和品牌信息引擎中进行匹配运算,然后再将两个引擎的计算结果结合起来计算整体的相关度。但假如商品的标题和品牌均被重新编辑了,需要同时增量更新2个引擎的索引,即使只修改了标题或者品牌信息的一个,也需要同时更新2个引擎,这不但需要增加较多的额外计算成本,并且对于在每个引擎中以无定位方式存储商品,那么更新引擎索引时计算成本更加庞大,因此,这种方法处理缓慢,维护成本比较高,硬件成本也比较高,并且不利于快速更新。

发明内容
本申请所要解决的技术问题是提供一种搜索方法和系统,能快速处理返回结果,方便维护,维护成本低。为了解决上述问题,本申请公开了一种搜索方法,包括:对于用户输入的搜索词,获取所述搜索词对应的各查询词;针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段;依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区;根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度;基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。
优选的,所述通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段,包括以下步骤:读取目标对象的标题信息字段区和属性信息字段区;用空白字符替换所述新字段中与第一分隔符相同的字符;将替换后的标题信息字段区和属性信息字段区通过第一分隔符拼接为一个新字段。优选的,根据所述字段中的各分词构建索引通过以下步骤进行:将各目标对象的标识通过第二分隔符与相应的新字段进行对应;对各新字段进行分词操作;以分词操作得到的分词作为索引词,将索引词与相关各目标对象的标识和该索引词在各新字段中位置进行对应。优选的,通过以下步骤确认所述查询词是属于标题信息字段区或者是属于属性信息字段区:根据所述索引词与相关各目标对象的标识的对应关系,查询与标识相应的新字段;将所述索引词在所述新字段中的位置与第一分隔符在所述新字段中的位置进行比较,确认所述索引词对应的查询词是属于标题信息字段区或者是属于属性信息字段区。优选的,通过以下步骤获得所述第一相关度:将各查询词字符串长度除以所在字段区字符串长度,获得各查询词与所在字段区的区间相关度;将各相关度乘以所在字段区的权重并相加,得到搜索词与新字段的第一相关度。优选的,所述的搜索词包括:将用户的输入的关键词作为搜索词;或者,将用户选择的根据该用户的输入词返回的建议词中的一个作为搜索词;其中,所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。优选的,对于用户输入的搜索词,获取所述搜索词的查询词时包括:通过智能纠错引擎对于用户错误输入的搜索词进行纠错。优选的,所述的目标对象包括商品;所述的属性信息包括商品的品牌信息。优选的,基于各新字段与搜索词的总相关度,至少输出一个新字段至用户端时:至少输出一个排序靠前的目标对象;所述目标对象基于相应新字段与搜索词的总相关度进行排序。相应的,本申请公开了一种搜索装置,包括:查询词获取模块,对于用户输入的搜索词,获取所述搜索词对应的各查询词;索引词搜索模块,用于针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段;位置确认模块,用于依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区;
相关度计算模块,用于根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度;输出模块,用于基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。与现有技术相比,本申请包括以下优点:本申请将商品的标题和商品的品牌信息,利用分隔符拼装成新字段,然后再对此新字段进行搜索引擎索引构建,通过本申请可快速返回符合用户的期望的商品结果,并且只需要增量更新一遍索引,在计算文本相关性时,可以一次运算完成,这大大减少计算成本和硬件资源。


图1是本申请一种搜索方法的流程不意图;图2是本申请一种搜索装置的结构示意图。
具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本申请作进一步详细的说明。参照图1,其示出了本申请一种搜索方法的流程示意图,包括:步骤110,对于用户输入的搜索词,获取所述搜索词对应的各查询词。在实际中对于用户输入的搜索词,比如“阿迪达斯三叶草”,获取其查询词,比如“阿迪达斯”、“三叶草”。一般可以对用户输入的搜索词进行分词操作,比如用户输入的搜索词为“阿迪达斯三叶草”,则根据商品的信息和最长匹配原则,则可将上述搜索词分为两个查询词“阿迪达斯”、“三叶草”。在实际中,对于用户错误输入的搜索词,可通过智能纠错引擎进行纠错。比如,用户输入“阿迪大四”那么根据实际的统计分析结果,“阿迪大四”基本上是为了输入“阿迪达斯”,那么智能纠错引擎可将用户输入的“阿迪大四”更正为“阿迪达斯”在进行后续处理。另外,对于用户输入的搜索词,可将用户的输入的关键词作为搜索词。用户直接将自己输入的关键词作为搜索词,比如用户输入“阿迪”,那么用户直接点确认搜索,将该关键词作为输入到搜索引擎的搜索词。或者,可将用户选择的根据该用户的输入词返回的建议词中的一个作为搜索词;其中,所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。比如,用户输入“阿迪”,那么系统可根据实际的统计分析结果返回建议词“阿迪达斯”、“阿迪王”、“阿迪达斯三叶草”等,用户可根据自己的需求选择其中一个建议词做为搜索词最终输入到搜索引擎。步骤120,针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段。在本申请中,优选的,所述的目标对象包括商品;所述的属性信息包括商品的品牌信息。在本申请对用户的输入的搜索词进行处理之前,还包括构建索引,建立搜索引擎的步骤,具体包括:步骤S101,通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成新字段。优选的,通过第一分隔符拼接将目标对象的标题信息字段区和属性信息字段区成新字段通过以下步骤进行:步骤Al,读取目标对象的标题信息字段区和属性信息字段区。实际中,在拼接之前,需要读取数据库中各目标对象的标题信息和品牌信息,在本申请实施例中,所述的目标对象包括商品,所述的属性信息包括商品的品牌信息。步骤A2,用空白字符替换所述新字段中与第一分隔符相同的字符。先读取商品的标题信息字段区和品牌信息字段区,并用空白字符串替换掉标题信息字段区和品牌信息字段区中与第一分隔符相同的字符。第一分隔符为:在文本中隔开品牌信息与标题信息的字符,在实际中的取值可采用不经常出现在商品标题或品牌信息中的符号。比如制表符\t、空格、斜杠、逗号等都比较容易出现在标题或品牌信息中的,因此不宜作为分隔符,而如ctrl+A,ascii码值0x01或&&&之类的,一般不会出现在文本串中,则可将其作为第一分隔符。在实际中,根据上述原则选取第一分隔符后,在商品的标题信息字段区和品牌信息字段区中可能还存在与第一分隔符相同的字符,那么需要将在商品的标题信息字段区和品牌信息字段区中与第一分隔符相同的字符替换掉,以便后续处理。步骤A3,将替换后的标题信息字段区和属性信息字段区通过第一分隔符拼接为一个新字段。假设某一商品的品牌为“三叶草”,标题为“阿迪达斯运动鞋I折甩卖”,第一分隔符为ctrl+A,最终形成的字符串为:三叶草阿迪达斯运动鞋3折甩卖,且记录分隔符的位置为6(位置0-5为三叶草,位置6为分隔符,其余为商品标题信息)。步骤S102,针对所述新字段构建索引,建立搜索引擎。优选的,根据所述字段中的各分词构建索引通过以下步骤进行:步骤BI,将各目标对象的标识通过第二分隔符与相应的新字段进行对应。商品一般通过其标识(一般为数字id)与该商品的新字段进行对应。在实际中,商品存储时的文件格式为商品数字id和新字符串,即auction_id和brand_title两个字段:数字型和字符型。数字型和字符型这2列之间用另外一个分隔符隔(即第二分隔符)开,并且与步骤A3中的第一分隔符必须不一样。并且对于商品的标题信息字段区和品牌信息字段区中与第二分隔符相同的字符替换掉。比如对于前述以ctrl+A为第一分隔符,而第二分隔符采用I I,那么对于下面两个商品的存储格式为:“ 12345 | |三叶草 阿迪达斯运动鞋I折甩卖”“83635789 | |三叶草 2011秋新品板鞋8折包邮”。步骤B2,对各新字段进行分词操作。步骤BI中第二分隔符I I后面的新字段进行分词,分词结果依次为:
“三叶草 阿迪达斯 运动鞋I折甩卖”“三叶草2011秋新品板鞋8折包邮”在实际中,建立索引时对各新字段进行处理时,可根据实际需求分词,比如,对于“三叶草阿迪达斯运动鞋I折甩卖”除了上述分词结果外,还可分出“三叶”、“阿迪”等词。步骤B3,以分词操作得到的分词作为索引词,将索引词与相关各目标对象的标识和该索引词在各新字段中位置进行对应。比如对于前述分词结果建立索引,将商品数字id(aUction_id)跟在索引词后,则建立索引的结果为:三叶草一12345_0,83635789_0阿迪达斯12345_7运动鞋一12345_15I 折一12345_21甩卖12345_242011 秋一83635789_7新品83635789_13板鞋一83635789_178 折一83635789_21包邮一83535789_24索引前面的为索引词,后面的为该分词能够涉及到的商品id,及其分词出现的位置,(对于位置的标注可以采用”或“:”等等),将索引压入到内存中,保证其高速的查询效率。其中,中文字符可记为2个字节。那么,针对上述索引,根据步骤110得到的查询词“阿迪达斯”和“三叶草”,分别用上述两个词查找搜索引擎,结果为:阿迪达斯:12345_7 ;三叶草:12345_0和83635789_0。步骤130,依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区。对搜索结果,计算每个搜索词在字符串的字串索引位置,并与分隔符的位置进行比较,比如前述例子中,品牌信息字段区在前,标题信息字段区在后,那么若查询词对应的索引词在新字段中的位置小于第一分隔符位置,则表明分词存在于品牌信息字段区中,若查询词对应的索引词在新字段中的位置大于第一分隔符位置,则表明分词存在于商品标题信息字段区中。比如前述例子中在索引中的搜索结果为:阿迪达斯:12345_7 ;三叶草:12345_0和83635789_0,根据索引的建立结构即可确定匹配到的商品id和第一分隔符在新字段中的位置。那么“阿迪达斯”在12345对应的新字段中的位置为7,比该新字段中第一分隔符的位置6大,那么搜索词“阿迪达斯”属于12345对应新字段的标题信息字段区;“三叶草”在12345对应的新字段中的位置为0,比该新字段中第一分隔符的位置6小,那么搜索词“三叶草”属于12345对应新字段的品牌信息字段区。步骤140,根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算得到的第一相关度。根据上述步骤对搜索词的各分词的处理结果,综合计算用户输入搜索词是否与品牌信息字段区或标题信息字段区的区间相关度,并计算搜索词与该新字段的总相关度。在实际中可分为以下4类:a)搜索词同时匹配品牌和标题;b)搜索词只匹配品牌;c)搜索词只匹配标题;d)搜索词与品牌和标题均不匹配。优选的,通过以下步骤获得所述第一相关度:步骤Cl,将各查询词字符串长度除以所在字段区字符串长度,获得各查询词与所在字段区的相关度。在实际中,通过length(分词)/length(品牌信息)计算查询词与品牌信息字段区的品牌区间相关度;通过length(分词)/length(标题信息)计算查询词与标题信息字段区的标题区间相关度;其中length(分词)表示查询词的字符串长度,length(品牌信息)表示品牌信息字段区的字符串长度,length(标题信息)表示标题信息字段区的字符串长度。步骤C2,将所述各区间相关度乘以所在字段区的权重并相加,得到搜索词与新字段的第一相关度。在实际中,通过“品牌信息字段区权重*length (分词)/length (品牌信息)+标题信息字段区权重*length (分词)/length (标题信息)”作为商品的总相关度。比如品牌信息字段区权重与标题信息字段区分别为0.3和0.7,那么公式即为:0.3*length (分词)/length (品牌信息)+0.7*length (分词)/length (标题信息)。比如对于前述例子:对于12345 来说,即 0.3*6/6+0.7*8/21 = 0.56对于83635789 来说,即 0.3*6/6+0.7*0/21 = 0.3那么对于“阿迪达斯三叶草”的搜索词来说,“三叶草阿迪达斯运动鞋I折甩卖”的总相关度要高于“三叶草2011秋新品板鞋8折包邮”,也即商品12345的总相关度要高于商品83635789。还可通过其他方式计算搜索词与新字段的相关度,本申请不对其加以限制。其中所述总相关度中包括了所述第一相关度,显然,还可以参考其他内容,如销量、信誉等,最终得到所述总相关度。步骤150,基于各新字段与搜索词的总相关度,至少输出一个新字段对应的目标对象至用户端。在实际中,基于各新字段与搜索词的总相关度,至少输出一个新字段至用户端时,可以是:至少输出一个排序靠前的目标对象;所述目标对象基于相应新字段与搜索词的总相关度进行排序。前述例子中得到各新字段与搜索词的相关度,也即得到各新字段对应的目标对象即商品与搜索词的相关度,那么可将返回用户端的商品及商品信息按照总相关度排序返回。在实际中,对于同一类中的多个商品,还可结合商品的销量,浏览,关注和对应卖家等综合情况进行最终排序,然后再返回给用户端。参照图2,其示出了本申请的一种搜索装置的结构示意图,包括:查询词获取模块210,对于用户输入的搜索词,获取所述搜索词对应的各的查询词;索引词搜索模块220,用于针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段;位置确认模块230,用于依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区;相关度计算模块240,用于根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算得到的第一相关度;输出模块250,用于基于各新字段与搜索词的总相关度,返回至少输出一个新字段对应的目标对象。其中,在基于各新字段与搜索词的总相关度,至少输出一个新字段至用户端时:至少输出一个排序靠前的目标对象;所述目标对象基于相应新字段与搜索词的总相关度进行排序。优选的,将目标对象的标题信息字段区和属性信息字段区通过第一分隔符拼接为一个新字段通过以下模块进行:信息获取模块,用于读取目标对象的标题信息字段区和属性信息字段区;字符替换模块,用空白字符替换所述新字段中与第一分隔符相同的字符;拼接模块,用于通过第一分隔符将替换后的标题信息字段区和属性信息字段区拼接成新字段。优选的,根据所述字段中的各分词构建索引通过以下模块进行:目标对象对应模块,用于将各目标对象的标识通过第二分隔符与相应的新字段进行对应;新字段查询词获取模块,对各新字段进行分词操作;索引构建模块,以分词操作得到的分词作为索引词,将索引词与相关各目标对象的标识和该索引词在各新字段中位置进行对应。优选的,通过以下模块确认所述查询词是属于标题信息字段区或者是属于属性信息字段区:新字段查询模块,用于根据所述索引词与相关各目标对象的标识的对应关系,查询与标识相应的新字段;查询词位置确认模块,用于将所述索引词在所述新字段中的位置与第一分隔符在所述新字段中的位置进行比较,确认所述索引词对应的查询词是属于标题信息字段区或者是属于属性信息字段区。优选的,通过以下模块获得所述总相关度:
字段区相关度计算模块,用于将各查询词字符串长度除以所在字段区字符串长度,获得各查询词与所在字段区的相关度;总相关度计算模块,用于将各相关度乘以所在字段区的权重并相加,得到搜索词与新字段的总相关度。优选的,本申请还包括:智能引擎,用于通过智能纠错引擎对于用户错误输入的搜索词进行纠错。优选的,本申请还包括:建议词引擎,用于根据该用户的输入词返回建议词。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。以上对本申请所提供的一种搜索方法和系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
权利要求
1.一种搜索方法,其特征在于,包括: 对于用户输入的搜索词,获取所述搜索词对应的各查询词; 针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段; 依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区; 根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度;基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段,包括以下步骤: 读取目标对象的标题信息字段区和属性信息字段区; 用空白字符替换所述新字段中与第一分隔符相同的字符; 将替换后的标题信息字段区和属性信息字段区通过第一分隔符拼接为一个新字段。
3.根据权利要求1所述的方法,其特征在于,根据所述字段中的各分词构建索引通过以下步骤进行: 将各目标对象的标识通过第二分隔符与相应的新字段进行对应; 对各新字段进行分词操作; 以分词操作得到的分词作为索引词,将索引词与相关各目标对象的标识和该索引词在各新字段中位置进行对应。
4.根据权利要求3所述的方法,其特征在于,通过以下步骤确认所述查询词是属于标题信息字段区或者是属于属性信息字段区: 根据所述索引词与相关各目标对象的标识的对应关系,查询与标识相应的新字段; 将所述索引词在所述新字段中的位置与第一分隔符在所述新字段中的位置进行比较,确认所述索引词对应的查询词是属于标题信息字段区或者是属于属性信息字段区。
5.根据权利要求1其中之一所述的方法,其特征在于,通过以下步骤获得所述第一相关度: 将各查询词字符串长度除以所在字段区字符串长度,获得各查询词与所在字段区的区间相关度; 将各相关度乘以所在字段区的权重并相加,得到搜索词与新字段的第一相关度。
6.根据权利要求1所述的方法,其特征在于,所述的搜索词包括: 将用户的输入的关键词作为搜索词; 或者,将用户选择的根据该用户的输入词返回的建议词中的一个作为搜索词;其中,所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。
7.根据权利要求1所述的方法,其特征在于,对于用户输入的搜索词,获取所述搜索词的查询词时包括: 通过智能纠错引擎对于用户错误输入的搜索词进行纠错。
8.根据权利要求1所述的方法,其特征在于:所述的目标对象包括商品;所述的属性信息包括商品的品牌信息。
9.根据权利要求1所述的方法,其特征在于,基于各新字段与搜索词的总相关度,至少输出一个新字段至用户端时: 至少输出一个排序靠前的目标对象;所述目标对象基于相应新字段与搜索词的总相关度进行排序。
10.一种搜索装置,其特征在于,包括: 查询词获取模块,对于用户输入的搜索词,获取所述搜索词对应的各查询词; 索引词搜索模块,用于针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段; 位置确认模块,用于依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区; 相关度计算模块,用于根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度; 输出模块,用于基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。
全文摘要
本发明提供了一种搜索方法和系统,涉及网络技术领域。本发明首先利用第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段,然后基于目标对象的新字段构建索引;在构建完成索引后,对于用户的搜索词可基于该索引和第一分隔符计算根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度,然后基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。本发明将商品的标题和品牌信息,利用分隔符拼装成新字段,然后对此新字段进行搜索引擎索引构建,通过本发明可快速返回符合用户的期望的商品结果,并且只需要增量更新一遍索引,在计算文本相关性时,可以一次运算完成,这大大减少计算成本和硬件资源。
文档编号G06F17/30GK103218364SQ201210018149
公开日2013年7月24日 申请日期2012年1月19日 优先权日2012年1月19日
发明者李嘉森 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1