一种通过互联网实现手机显示商品购物比较状态信息的方法

文档序号:7749356阅读:125来源:国知局
专利名称:一种通过互联网实现手机显示商品购物比较状态信息的方法
一种通过互联网实现手机显示商品购物比较状态信息的方
法本发明涉及计算机程序技术领域,具体地说是一种通过互联网实现手机显示商品 购物比较状态信息的方法。国内专利200610060141. 8公开了一种通过商品成交信息实现的比较购物方法, 通过在BTOB,CT0C,拍卖网等非实际价格的商品交易中介平台中下单,通过此平台成功交 易,并在卖家同意公布成交记录消息后,用获得的商品成交信息来实现比较购物的系统方 法。现在的搜索引擎,大部分是通用的搜索引擎,比较购物行业的搜索引擎尚不成熟。本发明的目的就是要解决上述的不足而提供的一种通过互联网实现手机显示商 品购物比较状态信息的方法。为实现上述目的设计一种通过互联网实现手机显示商品购物比较状态信息的方 法,包括互联网计算机提供手机网通信信息的方法,其特征在于该方法用以采集商家商品 数据要求,并依据该要求产生商品比较购物的状态信息数据,该方法包括a.采集商品信 息记录数据要求,其界定该要求所对应互联网电子商务领域B2C商家的商品信息由爬虫技 术将B2C商家的商品抓取并发送到储存器储存;b.根据商品文字编码搜索商品文字的点阵 信息,建立搜索子系统并发送到储存器储存;c.将所述的搜索子系统的商品文字的点阵信 息显示在手机屏幕上进行商品和价格比较,建立购物子系统,并发送到储存器储存。能够接受用户通过浏览器或者手机提交的查询词或者短语,记作q,在一个可以接 受的时间内返回一个和该用户查询匹配的网页信息列表,记作L,这个列表的每一条目至少 包含相关元素商品名称,商品图片地址,商品最高,最低报价。所述的搜索系统包括a.搜索引擎中通常采用倒排索引。即将于目标所有相关联的关键词进行统计建立 索引,根据用户输入的关键词匹配建立索引后的关键词索引文件,找到与关键词有映射关 系最多的目标组织成输出列表L,返回供用户使用;b.索引文件建立时就需要将排序的相关条件同时加入到索引文件中,在用户检索 时根据部同的用户输入,将相应得排序项目与搜索结果进行结合,产生新的关键词和目标 的映射及索引与排序项目的关系列表,输出给用户;c.索引文件保存结构为2进制元文件,基础的保存单位为64位的有符号长整数, 即18位整数,将索引后生成的商品对应用的映射信息,排序项目等信息转换拼接成18位的 整数,减少读取次数,增加搜索时的效率;d.基础的每个索引映射的存储结构如下[Sort X 10][Productid x 8]
[Flag x 1][Seller_Count x 3][MinPrice x 7][MaxPrice x 7][SellerlD x 5][Price x 7][SellerlD x 5][Price x 7]......[-Sort_ID]所述的Sort为某商品的五级分类识别编号,所述的Seller_C0imt为对该商品报 价的商家数量,所述的Seller_ID为报价商家的编号。e.建立商品的数据库存储结构,设有1为分类表,2为商品表,3为商家报价表,生 成的索引结构和保存目录结构。所述的索引结构包括a.在数据库中取得相应数据的数据集合;b.生成索引文件列表,根据商品的关键词进行中文分词,得到关键词索引文件的 文件列表,同时根据商品所在的分类结构编号得到该商品所在的分类和所有父分类的商品 分类编号列表,将基础索引结构依次写入;c.生成商家索引结构需要独立对每个商家的商品进行,选取该商家的所有商品, 生成索引结构,填入商家索引目录的商家对应的索引文件中;d.根据生成的索引文件列表读取索引文件得到将所有内容相加得到索引结构列 表,遍历索引结构列表,根据用户选择的排序项生成倒排索引列表,结构如下[Flag x 1] [Sortltem x 7] [SortID x 4][Productid x 7];e.根据用户的排序选项对输出结果进行了顺序整理;f.对取得的倒排索引列表进行快速排序,其平均时间复杂度为0(n log n),将有 相同商品编号的商品集聚在一起,计算命中数量;g.最后整理输出结构和搜索结果结构,分页后得到用户查询分页的商品编号列 表,进行输出;所述的算法伪码如下void Quicksort (String S, int s, int t) //s, t{int pivotpos ;if (s < t){pivotpos = Partition (S,s,t) ;// 根据起止下标计算 pivot 位置QuiceSort (S,s,pivotpos-1);QuiceSort(S, pivotpos+1, t);}}所述的搜索结果读取结构[Flagx 1] [Sortltem x 7] [SortID x 4] [Productid x7]读取索引文件后将文件中保存的索引内容,根据不同的排序规则,组合出返回的读取结 构数组。所述的搜索结果结构包括Long Count所有搜索结果数量、Long[]Productid每页的搜索结果产品编号、Long[] Sort所有搜索结果的分类名称和分类级别编号。本发明与现有的技术相比,不受时间、地点的限制,通过手机就可以实现商品信息的查询、比较、购买,极大的方便了消费者。

图1为本发明的流程示意图;图2为本发明的索引文件根目录图;下面结合附图和具体实施方式
对本发明作详细描述能够接受用户通过浏览器或者手机提交的查询词或者短语,记作q,例如“诺基 亚”,“摩托罗拉”等,在一个可以接受的时间内返回一个和该用户查询匹配的网页信息列 表,记作L。,这个列表的每一条目至少包含相关元素(商品名称,商品图片地址,商品最高, 最低报价等)。“可以接受的时间”,也就是响应时间。对浏览器或者手机上面软件来说,这个时间 不能太长,通常也就在“秒”这个量级。这是衡量搜务的引擎可用性的一个基本指标,也是 和传统信息检索系统的一个差别。更进一步的,这样的响应时间要求不仅要能满足单个用 户查询,而且要能在系统设计负载的情况下满足所有的用户。也就是说,系统应该在额定吞 吐率的情况下保证秒级响应时间。“匹配”,指的是网页中以某种形式q的形式就是q在其中直接出现。如果一个搜索引 擎就是以百分之百满足这种简单的包含关系为目标,即使实现了也并不就达到了最好的效果。“列表”,这蕴含着一种“序”(rank)。在绝大多数情况下,L数量会比较多,这不仅 是由于信息量大,也由于搜索引擎的查询方式简单。简单,意味着抽象;抽象,意味着有更多 的具体事物可能是它的体现。对于一个长长的列表,很少有用户有耐心都审视一遍(不仅 是因为长,还因为大多数使用搜索引擎的用户通常都是“找到为止”,而不是“不全部到不罢 休”,加上这个列表中和一个用户关心的其实只占很少的比例)。有分析统计表明,用户平均察看返回结果不超过2页。搜索引擎面临大量的用户检索需求,要求搜索引擎在检索程序的设计上要高效, 尽可能的将大运算量的工作在索引建立时完成,使检索运算尽量的少。一般的数据库系统 不能快速响应大量的用户请求,搜索引擎中通常采用倒排索引。即将于目标所有相关联的 关键词进行统计建立索引,根据用户输入的关键词匹配建立索引后的关键词索引文件,找 到与关键词有映射关系最多的目标组织成输出列表L,返回供用户使用。关键词和目标的映射及索引关系参见下表。
产品编号(1)产品名称(诺基亚N95) I拆分(诺基亚|N95) 产品编号(2) 产品名称(诺基亚N73)~~拆分(诺基亚|N73) 产品编号(3) 产品名称(索爱N95) 拆分(索爱|N95)
除了需要有索引关键词和被索引商品的对应关系外,同时需要对输出的搜索结果 列表根据其他检索条件进行排序,比如商品价格的高低,销售商家的数量,产品的新旧等。 这样在索引文件建立时就需要将排序的相关条件同时加入到索引文件中,在用户检索时根 据部同的用户输入,将相应得排序项目与搜索结果进行结合,产生新的列表,输出给用户。关键词和目标的映射及索引与排序项目的关系参见下表 索引文件保存结构为2进制元文件,基础的保存单位为64位的有符号长整数,即 (18位整数)将索引后生成的商品对应用的映射信息,排序项目等信息转换拼接成18位的整数,减少读取次数,增加搜索时的效率。基础的每个索引映射的存储结构如下 其中Sort为某商品的五级分类识别编号,共10位整数,没两位表示一级分类, Productid为商品唯一编号,用来建立关键词和搜索目标的映射关系,Flag项为最高权排 序项,目前使用约束为,为Flag项目赋初始值9,如果为图书音像类商品则减1,如果该商品 没有商家对其报价则减3,如果该商品没有图片信息则减1,累计后作为排序最高权选项正 向排序。Seller_C0imt为对该商品报价的商家数量,作为用户选择的排序项目之一,保存 形式为3位整数。MinPrice为该商品最低的商家报价,作为用户选择的排序项目之一,保存 形式为7位整数。MaxPrice为该商品最高的商家报价,作为用户选择的排序项目之一,保存 形式为7位整数。Seller_ID为报价商家的编号,Price为该商家对该商品的报价,结合在一起 成为一家商家对某商品的报价信息,如果某商品有多家商家对其报价,则写入多个条,以 [-Sort_ID]结尾作为两个索引保存结构的分界。Sort_ID为分类递增编号。具体某商品的索引建立例子参见下表 某商品的数据库存储结构,共3张表,1为分类表,2为商品表,3为商家报价表,生 成的索引结构如下
[101000000]位置为分类级别位置编号
位置为商品编号 Product
[1] [3]位置为商品编号 Seller_ID

位置为商品价格[-2]位置为分类编号索引文件的保存目录结构Search_Buffer目录为搜索结果缓存目录,用户的搜索结果以文件形式进行保存, 当用户再次搜索相同内容时,直接将搜索结构返回给用户,不用再次搜索,节约系统开销。搜索索引文件按分词后的关键词名称进行保存,保存在以该关键词第一个字符命 名的目录中,保存所有包含该关键词的商品的索引结构.搜索条件包含关键词时必须使用关键词索引文件,如果不含关键词,包含商家,分 类时可以按各种组合使用相对应的索引文件,各种搜索条件组合与使用索引文件的对应关 系如下 索引文件建立流程索引文件建立时,先从数据库中读取需要进入索引结构的商品和报价,分类数据, 组织成索引结构,根据商品关键词,商家编号,商品分类等依次写入对应索引文件中。读取商品相关信息生成索引结构,数据结构如下//// 商家报价 Cell//////////////////////////////////public struct C_Seller_Cell{public long Sellerid ;//商家编号public long Price ; //商家 艮价}
Illl 排序 Cell/////////////////////////////////////public struct C_Sort_Cell{ public long Flag ; //排序 Flagpublic long Seller_Count ;//商家数量public long Min_Price ; //最低 艮价public long Max_Price ; //最高 艮价}//// 商品 Cell/////////////////////////////////////public struct C_Product_Cell{public long Product_Id ;//商品编号public long Sort ; //商品分类public long SortID ; //商品分类编号}//// 索引 Cell/////////////////////////////////////public struct C_Cell{public C_Product_Cell pcell ;public C_Sort_Cell scell ;public C_Seller_Cell[]csc ;}public struct C_Index_Cell{public long product_cell ;public long Sort_cell ;public long Sortid ;public long[] seller_cell ;}在数据库中取得相应数据的数据集合,填充如上述数据结构中,生成索引的基础 结构,供程序写入相关索引文件。生成索引文件列表,根据商品的关键词(包括商品的名称,分类名,作者等信息) 进行中文分词,得到关键词索引文件的文件列表,将索引基础结构写入文件列表中的每个 文件,如果列表中包含重复的内容则忽略。同时根据商品所在的分类结构编号得到该商品 所在的分类和所有父分类的商品分类编号列表,将基础索引结构依次写入。生成商家索引结构需要独立对每个商家的商品进行,选取该商家的所有商品,生 成索引结构,填入商家索引目录的商家对应的索引文件中。首先针对用户的输入进行关键词预处理,包括标点符号替换,关键词噪词替换,关 键词同义词替换等操作,完成后对整理后的关键词进行中文分词,得到用户输入词列表。
然后根据用户输入的其他筛选条件配合用户输入词列表生成索引文件读取列表,索引文件和用户输入的关键词的对应关系请参考搜索索引文件的保存目录结构中的相关 内容。然后根据生成的索引文件列表读取索引文件得到将所有内容相加得到索引结构 列表,遍历索引结构列表,根据用户选择的排序项生成倒排索引列表,结构如下[Flag χ 1][SortItem χ 7][SortID χ 4][Productid χ 7]Flag为最高权排序项,记录商品是否包含报价及图片信息。(1位整数)SortItem为用户选择的排序项,如商品价格高低,商家数量等(7位整数,不满的 用O填充)SortID商品的分类编号,搜索结果中不同分类对应商品数量(4位整数)Productid商品编号用来建立关键词和商品的映射。下一步对得到的倒排索引列表进行排序,如果某商品在多个关键词索引中出现, 会被排序整理到相邻的位置,便于统计每个商品的关键词命中数量,同时根据用户的排序 选项对输出结果进行了顺序整理。倒排索引列表排序对取得的倒排索引列表进行快速排序,其平均时间复杂度为 0(n log η),将有相同商品编号的商品集聚在一起,计算命中数量.算法伪码如下void Quicksort (String S, int s, int t) //s, t{int pivotpos ;if (s < t){pivotpos = Partition (S, s,t) ;//根据起止下标计算 pivot 位置QuiceSort (S,s,pivotpos-1);QuiceSort(S, pivotpos+1, t);}}然后遍历排序后的倒排索引列表进行关键词的命中数量及分类商品数量统 计.命中数量和分类商品数量统计遍历排序后的商品编号存贮结构,将不同命中数量的 商品编号存入命中统计数组,数组维度为分词后的输入关键词语数量.同时对每个商品的 分类进行统计,存入分类数组,维度为所有分类数量最后整理输出结构,分页后得到用户查询分页的商品编号列表,进行输出.输出 结构如下public struct GL_SRS_Sorts//分类结构{public string SortName ;//public long SortID ;//分类编号public long Sort ;//分类结构编号public long Count ;//该分类下商品数量
}public struct GL_SRS_Product//商品结构{public string productid ;//商品编号public long type ;//商品类型,0位商品,其他为图书}public struct GL_SRS//搜索返回结构{public List<GL_SRS_Sorts>Sorts ;//搜索结果分类结构public GL_SRS_Product[]product ;//分页输出商品结构public long count ;//搜索结果数量public string keyword ;//搜索关键词public string time_report ; //搜索花费时间
}
权利要求
一种通过互联网实现手机显示商品购物比较状态信息的方法,包括互联网计算机提供手机网通信信息的方法,其特征在于该方法用以采集商家商品数据要求,并依据该要求产生商品比较购物的状态信息数据,该方法包括a.采集商品信息记录数据要求,其界定该要求所对应互联网电子商务领域B2C商家的商品信息由爬虫技术将B2C商家的商品抓取并发送到储存器储存;b.根据商品文字编码搜索商品文字的点阵信息,建立搜索子系统并发送到储存器储存;c.将所述的搜索子系统的商品文字的点阵信息显示在手机屏幕上进行商品和价格比较,建立购物子系统,并发送到储存器储存。
2.如权利要求1所述的一种通过互联网实现手机显示商品购物比较状态信息的方法, 其特征在于能够接受用户通过浏览器或者手机提交的查询词或者短语,记作q,在一个可以 接受的时间内返回一个和该用户查询匹配的网页信息列表,记作L,这个列表的每一条目至 少包含相关元素商品名称,商品图片地址,商品最高,最低报价。
3.如权利要求1所述的一种通过互联网实现手机显示商品购物比较状态信息的方法, 其特征在于a.搜索引擎中通常采用倒排索引,即将于目标所有相关联的关键词进行统计建立索 引,根据用户输入的关键词匹配建立索引后的关键词索引文件,找到与关键词有映射关系 最多的目标组织成输出列表L,返回供用户使用;b.索引文件建立时就需要将排序的相关条件同时加入到索引文件中,在用户检索时根 据部同的用户输入,将相应得排序项目与搜索结果进行结合,产生新的关键词和目标的映 射及索引与排序项目的关系列表,输出给用户;c.索引文件保存结构为2进制元文件,基础的保存单位为64位的有符号长整数,即 18位整数,将索引后生成的商品对应用的映射信息,排序项目等信息转换拼接成18位的整 数,减少读取次数,增加搜索时的效率;d.基础的每个索引映射的存储结构如下[Sort x 10][Productid x 8][Flag x 1][Seller_Count x 3][MinPrice x 7][MaxPrice x 7][SellerlD x 5] [Price x 7][SellerlD x 5] [Price x 7][-Sort_ID]所述的Sort为某商品的五级分类识别编号,所述的Seller_C0imt为对该商品报价的 商家数量,所述的Seller_ID为报价商家的编号。e.建立商品的数据库存储结构,设有1为分类表,2为商品表,3为商家报价表,生成的 索引结构和保存目录结构。
4.如权利要求1所述的一种通过互联网实现手机显示商品购物比较状态信息的方法, 其特征在于a.在数据库中取得相应数据的数据集合;b.生成索引文件列表,根据商品的关键词进行中文分词,得到关键词索引文件的文件列表,同时根据商品所在的分类结构编号得到该商品所在的分类和所有父分类的商品分类 编号列表,将基础索引结构依次写入;c.生成商家索引结构需要独立对每个商家的商品进行,选取该商家的所有商品,生成 索引结构,填入商家索引目录的商家对应的索引文件中;d.根据生成的索引文件列表读取索引文件得到将所有内容相加得到索引结构列表, 遍历索引结构列表,根据用户选择的排序项生成倒排索引列表,结构如下[Flag x 1] [Sortltem x 7] [SortID x 4][Productid x 7];e.根据用户的排序选项对输出结果进行了顺序整理;f.对取得的倒排索引列表进行快速排序,其平均时间复杂度为0(nlog n),将有相同 商品编号的商品集聚在一起,计算命中数量;g.最后整理输出结构和搜索结果结构,分页后得到用户查询分页的商品编号列表,进 行输出。
5.如权利要求4所述的计算命中数量,其特征在于算法伪码如下void Quicksort (String S,int s,int t) // 起止下标为 s,t{int pivotpos ;if (s < t){pivotpos = Partition (S,s,t) ;// 根据起止下标计算 pivot 位置 QuiceSort (S,s,pivotpos-1); QuiceSort(S,pivotpos+1,t);}}
6.如权利要求4 所述的[Flag x 1] [Sortltem x 7] [SortID x 4] [Productid x 7], 其特征在于搜索结果读取结构[Flag x 1] [Sortltem x 7] [SortID x4] [Productid x 7] 读取索引文件后将文件中保存的索引内容,根据不同的排序规则,组合出返回的读取结构数组。
7.如权利要求4所述的搜索结果结构,其特征在于搜索结果结构包括LongCoimt所有 搜索结果数量、LongDProductid每页的搜索结果产品编号、Long[]Sort所有搜索结果的 分类名称和分类级别编号。
全文摘要
本发明涉及计算机程序技术领域,具体地说是一种通过互联网实现手机显示商品购物比较状态信息的方法,其特征在于该方法包括采集商品信息记录数据要求,其界定该要求所对应互联网电子商务领域B2C商家的商品信息由爬虫技术将B2C商家的商品抓取并发送到储存器储存;采集商品信息记录数据要求,其界定该要求所对应互联网电子商务领域B2C商家的商品信息由爬虫技术将B2C商家的商品抓取并发送到储存器储存;将所述的搜索子系统的商品文字的点阵信息显示在手机屏幕上进行商品和价格比较,建立购物子系统,并发送到储存器储存。本发明与现有的技术相比,不受时间、地点的限制,通过手机就可以实现商品信息的查询、比较、购买,极大的方便了消费者。
文档编号H04L29/08GK101859424SQ201010177870
公开日2010年10月13日 申请日期2010年5月18日 优先权日2010年5月18日
发明者任学宁, 刘红星, 王海涛 申请人:上海购龙信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1