购物搜索推荐与告警方法和系统的制作方法

文档序号:6637131阅读:460来源:国知局
购物搜索推荐与告警方法和系统的制作方法
【专利摘要】一种购物搜索推荐与告警方法和系统,涉及互联网【技术领域】。方法的后台预处理阶段,包括:S101,通过爬虫系统向各个购物网站抓取原始信息;S102,将原始信息直接存入以更新数据库中心;S103,根据预定义语义分析模型,得负面评论总数X;S104,计算坑爹率P1;S105,通过预定义语义分析模型计算得正面评论总数Z;S106,计算得到推荐度P3;S107,将坑爹率P1和推荐度P3存入数据中心以更新数据中心;S109,数据中心实时更新后信息通过搜索网站提供给客户端;S110,客户端据此提供的坑爹率P1和推荐度P3,为用户提供浏览。交互式购物搜索推荐系统,包括爬虫系统、预处理中心、数据中心、搜索和结果展示网站。降低用户购物被欺骗风险。
【专利说明】购物搜索推荐与告警方法和系统

【技术领域】
[0001]本发明涉及互联网【技术领域】,特别涉及交互式购物搜索推荐与告警方法和系统。

【背景技术】
[0002]随着互联网购物的高速发展、店铺和平台的不断增加,用户对于商品搜索的要求也不断提高,对商品的质量和服务要求也更加重视。
[0003]现有的购物搜索引擎通过爬虫系统抓取各个购物网站有关商品名称、价格、销量、信誉等这类商品信息和属性,交给处理中心计算商品类别和排序权值(预处理),再将原始的商品信息和属性以及预处理后获得的商品类别和排序权值信息都保存在数据中心,作为搜索网站的搜索源数据向用户提供搜索购物指导。
[0004]如此,目前购物搜索引擎仅停留在比价、比较信誉、销量等简单的相关查询阶段,用户必须自行判断一个商品品质和服务品质,需要大量的浏览商品和阅读评价,为此无法快速选择和购买的适合的商品。随着用户对购物体验和商品质量要求提升,基于现有的搜索方法,用户购买和搜索体验差,难以满足用户需求。


【发明内容】

[0005]本发明的目的在于克服现有技术的不足,公开一种购物搜索推荐与告警方法和系统,当用户输入搜索信息时,系统已不再局限于简单的提供与搜索信息相关的搜索结果,还通过提炼并处理已购买用户评论中对整个购物过程和使用商品时的情绪信息,向用户提供购买建议和风险告警。
[0006]本发明的第一个目的在于提出一种互交式购物搜索及推荐和告警方法,能够自动为用户推荐优质商品和服务,同时给予低质量商品或者服务告警服务,并且减少用户挑选和购买商品时间,降低购买假货概率和遭遇服务态度恶劣商家和/或者快递的概率。为此,本发明给出的技术方案包括后台预处理阶段和购物用户客户端的使用阶段:
[0007]所述后台预处理阶段,包括步骤为:
[0008]S101,通过爬虫系统向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息。所述评论是用户对商品的评价及反馈。
[0009]S102,将商品属性、评论及其对应商家属性这三类原始信息直接存入以更新数据库中心。
[0010]S103,取出S条商品评论,根据预定义语义分析模型,计算得出是否为负面评论,选出负面评论并对数量进行累加,得负面评论总数X。
[0011]S104,根据负面评论和商家属性计算坑爹率Pl。坑爹率Pl公式:P1 = X +S (Pl取值范围均为0-1之间,X负面评论总数,S总评论数)。
[0012]S105,在评论总数S中去除负面评论后,从剩下的评论中,再通过预定义语义分析模型计算得出是否为正面评论,选出正面评论并对数量进行累加,得正面评论总数Z。利用公式计算正面评论比例P2,P2 = Z + S(Z:正面评论总数;S:评论总数)。
[0013]S106,由于公式P2并不能的完全确定商品是否应该被推荐,同时还应引入商品属性得分SgOTdJP商家属性得分S stop为商品购买提供推荐依据。推荐度P3公式:P3 = KbestXP2+KshopX (SshopShopmax) +Kg00ds X (Sgoods + Goodsmax)
[0014]其中:Kstop+Kg(K)ds+Kbest=1,且 K shop, Kg00ds, Kbest, P3 四者取值范围均为[0-1]之间,Kbest:商品正面评论权重系数,K g(K)ds:商品属性权重系数,K stop:商家属性权重系数。
[0015]Sg(K)ds:商品属性得分,由商品的销售量,物品分类粗细度(是否有颜色区分,尺寸区别,适用男女客户区分等信息),是否为品牌,是否为二手货等确定是否加分或者减分,综合计算确定一个值。其中,Goodsmax为商品属性得分最大值。
[0016]Ssh()p:商家属性得分,由商家发货速度,服务态度,商家的资质,店铺规模,用户评论数量,最近销售数量,在行业内评分状况,是否为公司,是否为B2C等确定是否加分或者减分,综合确定一个值。其中,Shopmax为商家属性得分的最大值。
[0017]S107,将预处理后获得的坑爹率P1和推荐度P3也存入数据中心以更新数据中心。
[0018]S108,以上步骤S102以及步骤S107存入的数据,实时更新着数据中心。
[0019]S109,将数据中心实时地更新后的商家属性、商品属性这两类原始信息以及处理后信息(坑爹率P1和推荐度P3)通过搜索网站提供给购物用户客户端。
[0020]S110,客户端程序据此提供的坑爹率P1和推荐度P3,为用户提供浏览。
[0021]所述购物用户客户端的使用阶段,包括步骤为:
[0022]S201,购物用户在客户端输入关键词。其中,搜索词可以是各种语言的字符(如:文字、拼音、符号和/或数字等)中的一种或者它们的组合。
[0023]S202,搜索网站接收关键字。
[0024]S203,搜索网站从数据中心获取与搜索词相关商品属性这类原始信息和处理后的坑爹率P1、推荐度P3。
[0025]S204,搜索网站将商品属性这类原始信息和处理后的坑爹率P1、推荐度P3,提供显示给客户端。
[0026]进一步优化技术方案,所述的坑爹率P1公式优化为:P1 = X + S+Y ;而Y =
(Shopmax-Sshop) +ShopmaxXM。Y用于修正由于评论处理中可能出现的异常结果导致坑爹率数值严重失实旧为[_1,1]之间的常数。
[0027]进一步优化技术方案,在客户端,客户端程序据提供的坑爹率Ρ1和推荐度Ρ3,为用户提供浏览前告警。告警阈值A = Ρ1/Ρ3,超出设定的告警值,即可触发预警,其触发操作为鼠标悬停操作或者点击操作,当用户鼠标悬停和/或点击高警告等级(坑爹率)商品时在周围提供警告提示内容。
[0028]进一步介绍,所述警告,根据负面评论的分类,当用户鼠标悬停和/或点击高警告等级商品时警告提示内容还包括且不限于以下几种提示:
[0029]1、商品质量差,可能是次品或者仿制品。
[0030]2、商家服务态度差。
[0031]3、快递服务差。
[0032]4、商品易损坏。
[0033]5、商品本身是免费的赠品。
[0034]如此,可提示用户此商品是由于质量,商家和/或者快递等方面导致的问题。
[0035]本发明提出了一种交互式购物搜索推荐系统:
[0036]包括爬虫系统,用于向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息。所述评论是用户对商品的评价、反馈。所述购物网站为京东、淘宝等各类购物网站。
[0037]包括预处理中心,通过对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息进行数据处理,得到坑爹率P1、推荐度P3。
[0038]包括数据中心,用于存储对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息,以及存储预处理中心得到的坑爹率P1、推荐度P3,实时更新数据。
[0039]包括搜索和结果展示网站,用于向数据中心获得商品属性、商家属性这两类原始信息,以及预处理得到的坑爹率P1、推荐度P3,并通过客户端网页显示结果。
[0040]本发明通过对商家属性和商品属性及评论进行分析,协助用户解决购物搜索挑选商品无法准确判别包括商品品质和/或卖家服务的整体购物体验问题,降低用户购物被欺骗风险,更好地协助用户快速购买到质量优、价格合适、服务好的商品。本发明旨在提供全新的购物搜索推荐和告警机制,帮助用户在购买前获取购买时可能遇到各种问题,方便选取和购买优质的商品和优质的服务。

【专利附图】

【附图说明】
[0041]图1本发明方法的后台预处理流程图。
[0042]图2基于本发明方法的客户端购物用户使用的流程图。
[0043]图3为本发明系统模型结构图。
[0044]图4实施例上线测试在客户端显示的商品搜索结果“推荐度和坑爹率”网页页面。
[0045]图5实施例上线测试在客户端显示的商品搜索结果“告警”网页页面。

【具体实施方式】
[0046]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或者类似的标号表示相关或者类似的元件或具有相似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0047]本发明中术语:“推荐度”是推荐用户购买的程度,分若干个等级,依次递增或者递减,取值范围是[0,I]。
[0048]本发明中术语“坑爹率”是告警等级,分若干个等级,分若干个等级,依次递增或者递减,取值范围是[0,1]。
[0049]本发明中术语“预定义语义分析模型”在互联网领域为成熟技术,为一种语义算法,根据语义和所处的语境,以及可根据褒义词、贬义词出现在评论中的次数和位置以及句子语气强度,得出用户评论是负面评论、正面评论或者无明显情绪词。可参见相关的文献,例如:“语义成分分析方法及其应用:http: //wenku.baidu.com/view/f2c84dd4b!4e852458fb571f.html ”,“语义特征分析法:http:1Iwm.doc88.com/p-579886825103.html”。
[0050]比如评论中提到:“很差”,“不行”,“不到位”等类似词汇时,确定为负面评论。负面评论可涉及商品质量、商家服务、物流服务等多个方面。
[0051]正面评论也使用预定义语义分析模型,比如评论中提到:“不错”,“很好”,“细心”等类似词汇时,确定为正面评论。
[0052]实施案例
[0053]术语“推荐度P3”是推荐用户购买的程度,分6个等级,分别对应0、0.2,0.4,0.6、
0.8,1(数值越大越值得购买),并以图片的方式显示,其中“O”用一张5个空心图标代替,“0.2”用一张I个实心4个空心图标代替,以此类推,“I”用一张5个实心图标代替;术语“坑爹率P I”是告警等级,分6个等级,分别对应0、0.2、0.4、0.6、0.8、I (数值越大购物风险越高),并以图片的方式显示,其中“O”用一张5个空心图标代替,“0.2”用一张I个实心4个空心图标代替,以此类推,“ I”用一张5个实心图标代替,其中“推荐度P3”和“坑爹率P1”表现形式不限于图标或者数字,此处仅用于方便用户理解的其中一种划分形式和体现方法,而不能理解为表现方式仅为图标,也不能理解为等级仅为0、0.2,0.4,0.6,0.8、1这6个等级。
[0054]如图1所示,后台预处理阶段,包括步骤为:
[0055]S101,通过爬虫系统向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息。所述评论是用户对商品的评价及反馈。
[0056]S102,将商品属性、评论及其对应商家属性这三类原始信息直接存入以更新数据库中心。
[0057]S103,取出S条商品评论,根据预定义语义分析模型,计算得出是否为负面评论,选出负面评论并对数量进行累加,得负面评论总数X。
[0058]S104,根据负面评论和商家属性计算坑爹率Pl。坑爹率Pl公式:P1 = X +S (Pl取值范围均为0-1之间,X负面评论总数,S总评论数)。
[0059]S105,在评论总数S中去除负面评论后,从剩下的评论中,再通过预定义语义分析模型计算得出是否为正面评论,选出正面评论并对数量进行累加,得正面评论总数Z。利用公式计算正面评论比例P2,P2 = Z + S(Z:正面评论总数;S:评论总数)。
[0060]S106,由于公式P2并不能的完全确定商品是否应该被推荐,同时还应引入商品属性得分SgwdJP商家属性得分S stop为商品购买提供推荐依据。推荐度P3公式:P3 = KbestXP2+KshopX (SshopShopmax) +Kgoods X (Sgoods+ Goodsmax)
[0061]其中:KshQp+Kg(K)ds+Kbest=1,且 K shop, Kgoods, Kbest, P3 四者取值范围均为(0-1)之间,Kbest:商品正面评论权重系数,K g(K)ds:商品属性权重系数,K stop:商家属性权重系数。
[0062]Sgwds:商品属性得分,由商品的销售量,物品分类粗细度(是否有颜色区分,尺寸区别,适用男女客户区分等信息),是否为品牌,是否为二手货等确定是否加分或者减分,综合计算确定一个值。其中,Goodsmax为商品属性得分最大值。
[0063]S-^商家属性得分,由商家发货速度,服务态度,商户的资质,店铺规模,用户评论数量,最近销售数量,在行业内评分状况,是否为公司,是否为B2C等确定是否加分或者减分,综合确定一个值。其中,Shopmax为商家属性得分的最大值。
[0064]S107,将预处理后获得的坑爹率Pl和推荐度P3也存入数据中心以更新数据中心。
[0065]S108,以上步骤S102以及步骤S107存入的数据,实时更新数据中心。
[0066]S109,将数据中心实时地更新后的商品属性这一类原始信息以及处理后信息(坑爹率Pl和推荐度P3)通过搜索网站提供给购物用户客户端。
[0067]S110,客户端程序据此提供的坑爹率P1和推荐度P3,为用户提供浏览前告警。客户端程序据此提供的坑爹率P1和推荐度P3,为用户提供浏览前预警:例如当搜索“减肥药”时,排名靠前的品显示坑爹率为“0.4”,用户点击此排名时给予风险警告。
[0068]如图2所示,所述购物用户客户端的使用阶段,包括步骤为:
[0069]图2为根据本发明一个实施例的交互式购物搜索及推荐和告警方法的流程图,购物用户在客户端的使用过程。如图2所示,根据本发明实施例的交互式搜索及推荐方法,包括:
[0070]S201,购物用户在客户端输入关键词。其中,搜索词可以是各种语言的字符(如:文字、拼音、符号和/或数字等)中的一种或者它们的组合。
[0071]S202,搜索网站接收关键字。
[0072]S203,搜索网站从数据中心获取与搜索词相关商品属性这类原始信息和处理后的坑爹率P1、推荐度P3。
[0073]S204,搜索网站将商品属性这类原始信息和处理后的坑爹率P1、推荐度P3,提供显示给客户端。
[0074]S205,客户端程序据此提供的坑爹率P1和推荐度P3,为用户提供浏览前告警,最终购物用户确定购买或者放弃。即当用户鼠标移动到高坑爹率或者点击此结果时,系统向用户发出风险告警。
[0075]推荐度和警告等级使用图标显示,显示方式包括但不限于星星个数和/或者矩形进度条。
[0076]如图3所示,为了能够为用户推荐质量和服务更加优秀的商品,并在可能存在风险时提供有效告警,本发明提出了一种交互式购物搜索推荐和告警系统,
[0077]包括爬虫系统,用于向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息。所述评论是用户对商品的评价、反馈。所述购物网站为京东、淘宝等各类购物网站。
[0078]包括预处理中心,通过对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息进行数据处理,得到坑爹率P1、推荐度P3。
[0079]包括数据中心,用于存储对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息,以及存储预处理中心得到的坑爹率P1、推荐度P3,实时更新数据。
[0080]包括搜索和结果展示网站,用于向数据中心获得商品属性、商家属性这两类原始信息,以及预处理得到的坑爹率P1、推荐度P3,并通过客户端网页显示结果。
[0081]上述各子系统之间通过互联网进行信息通信;硬件方面,都是由多台服务器组成,CPU: 17四核以上,内存:8GB以上,硬盘:1TB以上,主板:华硕1155系列,带宽:20mb以上。
【权利要求】
1.一种购物搜索推荐方法,其特征在于,包括后台预处理阶段和购物用户客户端的使用阶段: 所述后台预处理阶段,包括步骤为: S101,通过爬虫系统向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息; S102,将商品属性、评论及其对应商家属性这三类原始信息直接存入以更新数据库中心; S103,取出S条商品评论,根据预定义语义分析模型,计算得出是否为负面评论,选出负面评论并对数量进行累加,得负面评论总数X ; S104,根据负面评论和商家属性计算坑爹率Pl,坑爹率Pl公式:P1 = X +S (Pl取值范围均为0-1之间,X负面评论总数,S总评论数); S105,在评论总数S中去除负面评论后,从剩下的评论中,再通过预定义语义分析模型计算得出是否为正面评论,选出正面评论并对数量进行累加,得正面评论总数Z ;利用公式计算正面评论比例P2,P2 = Z + S(Z:正面评论总数;S:评论总数); S106,由于公式P2并不能的完全确定商品是否应该被推荐,同时还应引入商品属性得分Sg—和商家属性得分S _为商品购买提供推荐依据;推荐度P3公式:P3 = KbestXP2+KshopX (Sshop — Shopmax) +KgoodsX (Sgoods7Goodsmax) 其中
?Kshop+Kgoods+^best
1,且K


shop? ^goods?

Kbest, P3四者取值范围均为(0-1)之间,Kbest:商品正面评论权重系数,Kgtrads:商品属性权重系数,K sh()p:商家属性权重系数; Sgtrads:商品属性得分,由商品的销售量,物品分类粗细度,是否为品牌,是否为二手货等确定是否加分或者减分,综合计算确定一个值;其中,Goodsmax为商品属性得分最大值; Sstop:商家属性得分,由商家发货速度,服务态度,商家的资质,店铺规模,用户评论数量,最近销售数量,在行业内评分状况,是否为公司,是否为B2C等确定是否加分或者减分,综合确定一个值;其中,Shopmax为商家属性得分的最大值; S107,将预处理后获得的坑爹率Pl和推荐度P3也存入数据中心以更新数据中心; S108,以上步骤S102以及步骤S107存入的数据,实时更新着数据中心; S109,将数据中心实时地更新后的商家属性、商品属性这两类原始信息以及处理后信息(坑爹率Pl和推荐度P3)通过搜索网站提供给购物用户客户端; S110,客户端程序据此提供的坑爹率Pl和推荐度P3,为用户提供浏览; 所述购物用户客户端的使用阶段,包括步骤为: S201,购物用户在客户端输入关键词; S202,搜索网站接收关键字; S203,搜索网站从数据中心获取与搜索词相关商品属性这类原始信息和处理后的坑爹率P1、推荐度P3 ; S204,搜索网站将商品属性这类原始信息和处理后的坑爹率P1、推荐度P3,提供显示给客户端。
2.如权利要求1所述的购物搜索推荐方法,其特征在于,所述的坑爹率Pl公式优化为:Pl = X + S+Y ;而Y = (Shopmax-Sshop) +ShopmaxXM, Y用于修正由于评论处理中可能出现的异常结果导致坑爹率数值严重失实…为(_1,1)之间的常数。
3.如权利要求1所述的购物搜索推荐方法,其特征在于,在客户端,客户端程序据提供的坑爹率Pl和推荐度P3,为用户提供浏览前告警,告警阈值A = P1/P3,超出设定的告警值,即可触发预警。
4.一种交互式购物搜索推荐系统,其特征在于, 包括爬虫系统,用于向各个购物网站抓取商品属性、评论及其对应商家属性这三类原始信息; 包括预处理中心,通过对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息进行数据处理,得到坑爹率P1、推荐度P3 ; 包括数据中心,用于存储对爬虫系统获得的商品属性、评论及其对应商家属性这三类原始信息,以及存储预处理中心得到的坑爹率P1、推荐度P3,实时更新数据; 包括搜索和结果展示网站,用于向数据中心获得商品属性、商家属性这两类原始信息,以及预处理得到的坑爹率P1、推荐度P3,并通过客户端网页显示结果。
【文档编号】G06F17/30GK104462333SQ201410727616
【公开日】2015年3月25日 申请日期:2014年12月3日 优先权日:2014年12月3日
【发明者】肖俊 申请人:上海耀肖电子商务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1