一种获取评价信息方法、装置、设备以及存储介质与流程

文档序号:20017306发布日期:2020-02-25 10:48阅读:146来源:国知局
一种获取评价信息方法、装置、设备以及存储介质与流程

本申请涉及爬取信息技术领域,尤其涉及一种获取评价信息方法、装置、设备以及存储介质。



背景技术:

阅读评价是最常见的获取买家意见的方式,用户可以通过阅读自己想了解的商品的评价,考虑是否购买商品。目前,在用户请求查阅该商品的历史评价时,多数情况下可以采用爬虫技术获取商品的评价,通过获取商品在购物网站上的商品唯一编号,生成评价展示链接,通过所述链接访问服务器获取商品的历史评价,但是,采用这种方式,评价展示链接可能不符合购物网站对应的服务器链接的格式要求,导致使用爬虫技术无法获取商品评价。



技术实现要素:

为了解决现有技术中评价展示链接可能不符合购物网站对应的服务器链接的格式要求,导致使用爬虫技术无法获取商品评价的技术问题,本申请提供了一种获取评价信息方法、装置、设备以及存储介质。

第一方面,本申请提供了一种获取评价信息方法,所述方法包括:

获取目标商品的商品详情页面的页面信息;

根据所述页面信息确定所述目标商品的商品唯一编号;

按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;

基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;

通过所述评价链接访问服务器以获取所述目标商品的历史评价信息。

可选地,按照预设的格式转化关系,将所述商品唯一编号转化为标准编号的步骤,包括:

判断所述商品唯一编号的位数是否小于标准编号的位数;

若所述商品唯一编号的位数小于标准编号的位数,按照预设补位规则对上述唯一编号进行补位,得到商品标准编号,所述商品标准编号的位数与所述标准编号的位数相同。

可选地,所述商品唯一编号包括:商品编号和商品所属店铺的店铺编号,按照预设的格式转化关系,将所述商品唯一编号转化为标准编号的步骤,包括:

按照预设的格式转化关系,将所述商品编号转化为商品的标准编号,将所述店铺编号转化为店铺的标准编号。

可选地,基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接的步骤,包括:

基于所述商品的标准编号和所述店铺的标准编号生成评价链接。

可选地,所述方法还包括:

根据所述页面信息确定所述商品的特征信息;

判断预设数据库中是否存储有所述特征信息;

若预设数据库中存储有所述特征信息,基于所述商品的标准编号和所述店铺的标准编号以及所述特征信息生成评价链接。

可选地,基于所述商品的标准编号和所述店铺的标准编号以及所述特征信息生成评价链接的步骤,包括:

按照预设的拼接顺序,根据所述商品的标准编号和所述店铺的标准编号以及所述特征信息确定评价链接编号;

根据所述评价链接编号生成评价链接。

可选地,根据所述页面信息确定所述目标商品的商品唯一编号的步骤,包括:

利用预设的正则表达式,提取所述页面信息中的所述商品唯一编号。

第二方面,本申请提供了一种获取评价信息装置,包括:

获取模块,用于获取目标商品的商品详情页面的页面信息;

确定模块,用于根据所述页面信息确定所述目标商品的商品唯一编号;

转化模块,用于按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;

生成模块,用于基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;

访问模块,用于通过所述评价链接访问服务器以获取所述目标商品的历史评价信息。

第三方面,本申请提供了一种获取评价信息设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面任一项所述的方法的步骤。

第四方面,本申请提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面任一所述方法。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请通过获取目标商品的商品详情页面的页面信息;根据所述页面信息确定所述目标商品的商品唯一编号;按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;通过所述评价链接访问服务器以获取所述目标商品的历史评价信息的方式,将目标商品的商品唯一编号转化为标准编号,生产标准化评价链接,以展示目标商品的评价,避免因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况,能够保证用户获取到关注商品的评价,优化用户体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种获取评价信息方法流程图;

图2为本申请实施例提供的步骤s103的方法流程图;

图3为本申请实施例提供的步骤s103的另一种方法流程图;

图4为本申请实施例提供的步骤s302的方法流程图;

图5为本申请实施例提供的另一种获取评价信息方法流程图;

图6为本申请实施例提供的一种获取评价信息装置模块示意图。

图标:

01-获取模块;02-确定模块;03-转化模块;04-生成模块;05-访问模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

首先,本发明实施例提供了一种获取评价信息方法,如图1所示,所述方法包括:

步骤s101,获取目标商品的商品详情页面的页面信息;

在本发明实施例中,目标商品可以是用户想要查看评价的商品,商品详情页面可以是商品在购物网站上的页面,页面信息可以是购物网站上商品详情页面的源代码,在实际应用过程中,可以利用爬虫程序,爬取到用户想要了解的商品页面信息,或者采用其他能够获取到页面信息的程序,本发明实施例对此不作具体限定。

步骤s102,根据所述页面信息确定所述目标商品的商品唯一编号;

在本发明实施例中,页面信息可以是商品所在网页的源代码,通过预先设置获取字段的位置,从而完成爬取字段的过程,例如:设置爬取商品唯一编号,在获取到商品详情页面的源代码后,定位字段位置,精确爬取该字段的内容,即获取到所需的目标商品的商品唯一编号。

在本发明实施例中,步骤s102,根据所述页面信息确定所述目标商品的商品唯一编号的步骤,包括:

利用预设的正则表达式,提取所述页面信息中的所述商品唯一编号。

在本发明实施例中,可以通过正则表达式精确获取商品唯一编号,通过预先设置好的正则表达式定位爬取源代码中的固定字段,达到获取所需字段内容的目的,在实际应用过程中,其他具备相同定位爬取功能的技术也可以应用在此,作为定位爬取的方式。

步骤s103,按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;

在本发明实施例中,现有技术中用户请求查阅该商品的历史评价时,多数情况下可以采用爬虫技术获取商品的评价,通过获取商品在购物网站上的商品唯一编号,生成评价展示链接,再通过所述链接访问服务器获取商品的历史评价,但是,采用这种方式,由于商品唯一编号的格式可能不统一,造成评价展示链接可能不符合购物网站对应的服务器链接的格式要求,最终出现使用爬虫技术无法获取商品评价的情况,基于此,本发明实施例将目标商品的商品唯一编号,按预设的格式转化关系,将商品唯一编号转化为为标准编号,生产标准化评价链接,以展示目标商品的评价,避免因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况,能够保证用户获取到关注商品的评价,优化用户体验。

在本发明实施例中,如图2所示,步骤s103,按照预设的格式转化关系,将所述商品唯一编号转化为标准编号,包括:

步骤s201,判断所述商品唯一编号的位数是否小于标准编号的位数;

步骤s202,若所述商品唯一编号的位数小于标准编号的位数,按照预设补位规则对上述唯一编号进行补位,得到商品标准编号,所述商品标准编号的位数与所述标准编号的位数相同。

在本发明实施例中,由于购物网站上可能存在对于商品的编号位数不相同,所以导致根据商品唯一编号生成的链接格式有误,无法链接到商品评价页面,所以首先判断所述商品唯一编号的位数是否小于标准编号的位数,若所述商品唯一编号的位数小于标准编号的位数,则按照预设的格式转化关系可以是按照预设补位规则对上述唯一编号进行补位,得到商品标准编号。例如:获取到的商品唯一编号是九位数字690046274,而标准编号的位数是十二位数字,所以可以对商品唯一编号进行补位,具体补位的数字以及补位的位置可以根据实际情况而定,本发明对此不作具体限定,例如:补位后标准编码可以是十二位数字000690046274,或者十二位数字690046274000,具体补位采用的编码方式可以依据实际情况而定。

步骤s104,基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;

在本发明实施例中,对商品唯一编号进行格式转化之后得到标准编号,根据商品所在网站的网址格式,基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接,例如:不同网站的网址不同,所以需要先确定商品所在网站的域名,再将获取到的商品唯一编码转化为网站要求的标准编码,所以需标准编号为000690046274,则生成的评价链接为:

https://pingjialianjie.com/ajax/review_count/general-000690046274-satisfy.htm,当用户需要查看下一个意向商品时,爬虫程序则爬取该商品的商品唯一编号,按照预设关系将商品唯一编号转化为标准编号,将网址中对应编号部分进行替换,则可以获取用户意向商品的全部评价链接,当用户想获取其他购物网站的商品评价信息时,同理,可对域名进行相应的替换,生成可以到达商品评价页面的评价链接,实现将目标商品的商品唯一编号转化为标准编号,生产标准化评价链接,以展示目标商品的评价的效果,避免因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况。

步骤s105,通过所述评价链接访问服务器以获取所述目标商品的历史评价信息;

在本发明实施例中,本申请通过获取目标商品的商品详情页面的页面信息;根据所述页面信息确定所述目标商品的商品唯一编号;按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;通过所述评价链接访问服务器以获取所述目标商品的历史评价信息的方式,将目标商品的商品唯一编号转化为标准编号,生产标准化评价链接,以展示目标商品的评价,避免因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况,能够保证用户获取到关注商品的评价,优化用户体验。

在本发明提供的又一实施例中,所述商品唯一编号包括:商品编号和商品所属店铺的店铺编号,如图3所示,步骤s103,按照预设的格式转化关系,将所述商品唯一编号转化为标准编号,包括:

步骤s301,按照预设的格式转化关系,将所述商品编号转化为商品的标准编号,将所述店铺编号转化为店铺的标准编号;

相应的步骤s104,基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接,包括:

步骤s302,基于所述商品的标准编号和所述店铺的标准编号生成评价链接。

在本发明实施例中,商品的唯一编码包括购物网站对商品编号得到的商品编号,以及购物网站对商品所属店铺的编号得到店铺编号,在实际应用中,商品的评价链接里可能同时包含有商品编号和店铺编号,例如同时包含商品编号和店铺编号的商品评价链接为:

https://pingjialianjie.com/ajax/review_count/general-000690046274-000000346345-satisfy.htm,其中000690046274为将商品编号按照预设的格式转化关系转化得到商品的标准编号,000000346345为将店铺编号按照预设的格式转化关系转化得到店铺的标准编号,具体转化过程可以参照上述实施例,此处不再赘述,本发明实施例通过,将所述商品编号转化为商品的标准编号,将所述店铺编号转化为店铺的标准编号,再基于符合网址格式要求的标准编号生成商品评价链接,以保证用户能够链接到包含商品评价内容的页面,避免出现因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况。

在本发明实施例中,如图4所示,步骤s302,基于所述商品的标准编号和所述店铺的标准编号以及所述特征信息生成评价链接,包括:

步骤s401,按照预设的拼接顺序,根据所述商品的标准编号和所述店铺的标准编号以及所述特征信息确定评价链接编号;

在本发明实施例中,商品的评价链接里可能同时包含有商品编号和店铺编号,为了保证生成的评价链接能够符合网址格式要求,因此将商品编号按预设格式转化关系转化得到的商品的标准编号,以及将店铺编号按预设格式转化关系转化得到店铺的标准编号,最后将商品的标准编号与店铺的标准编号按照预设的方式进行拼接,例如:000690046274为将商品编号按照预设的格式转化关系转化得到商品的标准编号,000000346345为将店铺编号按照预设的格式转化关系转化得到店铺的标准编号,将商品的标准编号与店铺的标准编号按照预设的方式进行拼接得到000690046274-000000346345评价链接编号,或者000000346345-000690046274评价链接编号,具体拼接方式可以依据实际情况而定,本发明对此不作具体限定。

步骤s402,根据所述评价链接编号生成评价链接。

在本发明实施例中,得到评价链接编号之后,补充购物网站的域名,构成一个完成的能够到达商品评价内容的评价链接,、通过将所述商品编号转化为商品的标准编号,将所述店铺编号转化为店铺的标准编号,生产标准化评价链接,以展示目标商品的评价,避免因网站对商品的编号格式不同,造成使用格式不标准的商品编号生成的评价链接无法被识别的情况,能够保证用户获取到关注商品的评价,优化用户体验。

在本发明实的又一施例中,如图5所示,所述方法还包括:

步骤s501,根据所述页面信息确定所述商品的特征信息;

在本发明实施例中,目标商品可以是用户想要查看评价的商品,商品详情页面可以是商品在购物网站上的页面,页面信息可以是购物网站上商品详情页面的源代码,也可以是其他能够描述商品页面内容的字段,商品的特征信息可以是商品的评价标签-性价比高,一个商品的特征信息可能包含多个商品的标签,例如:a款冰箱的标签是性价比高、价格低以及外观时尚,获取到的特征信息包括:性价比高,价格低,外观时尚。

步骤s502,判断预设数据库中是否存储有所述特征信息;

在本发明实施例中,预设的数据库可以使用户预先设定的,将用户所有感兴趣的商品检索项都添加到数据库中,例如:用户想要搜索关于a款冰箱性价比高、价格低以及外观时尚的相关评价,将冰箱性价比高、价格低以及外观时尚三个标签添加到数据库中。

步骤s503,若预设数据库中存储有所述特征信息,基于所述商品的标准编号和所述店铺的标准编号以及所述特征信息生成评价链接。

在本发明实施例中,如果预设数据库中存储目标商品的特征信息,则代表用户想看到关于商品特征信息描述评价,例如:用户想要搜索关于a款冰箱性价比高、价格低以及外观时尚的相关评价,将冰箱性价比高、价格低以及外观时尚三个标签添加到数据库中,a款冰箱的标签是性价比高、价格低以及外观时尚,此时,预设的数据库中存储的特征信息与a款冰箱的特征信息吻合,则基于所述商品的标准编号和所述店铺的标准编号以及所述特征信息生成评价链接,以便用户查看所关心的标签问题的描述。当商品的特征信息没有预先存储至预设的数据库中时,代表用户所关心的标签,该商品不具备,所以不用根据特征信息生成评价链接,使用户查看不到自己所关心的标签的评价。

在本发明提供的又一实施例中,还提供了一种获取评价信息装置,如图6所示,所述装置包括:

获取模块01,用于获取目标商品的商品详情页面的页面信息;

确定模块02,用于根据所述页面信息确定所述目标商品的商品唯一编号;

转化模块03,用于按照预设的格式转化关系,将所述商品唯一编号转化为标准编号;

生成模块04,用于基于所述标准编号生成用于链接至所述目标商品的历史评价信息的评价链接;

访问模块05,用于通过所述评价链接访问服务器以获取所述目标商品的历史评价信息。

在本发明实施例中所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述实施例具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明提供的又一实施例中,还提供了一种获取评价信息设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一项所述的方法的步骤。

在本发明提供的又一实施例中,还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述实施例中任一所述方法。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1