一种商品数据分类处理及对比技术方法及系统与流程

文档序号:25282738发布日期:2021-06-01 17:30阅读:199来源:国知局
一种商品数据分类处理及对比技术方法及系统与流程

本发明涉及数据处理技术领域,尤其涉及一种商品数据分类处理及对比技术方法及系统。



背景技术:

随着互联网的迅速发展,现今电子商务已经成为重要的经济组成部分,世界上很多国家的消费者已经习惯了通过网络来购买所需物品。不仅亚马逊、阿里巴巴等平台已经发展成为超大型企业,而且传统销售的沃尔玛、苏宁等企业也建立了自己的电商平台。随着电子支付的推广,除了利用这些现有的大型平台,现有很多商家在自己的网站上也建立了自己的电商平台,这样网络上存在着多种格式各样的电商平台,不同平台所采用的网络结构、商品列表页结构和商品展示页结构也有多种样式。类型众多的电商平台给消费者带来了购物的困扰,消费者为了对比某一/某一类商品的品质和价格,需要花费大量的时间在不同的平台之间来回比较。当然消费者也可以通过谷歌或百度等搜索引擎来搜索相关商品的页面,但是现有搜索引擎采用的是商品信息关键词的爬虫技术,搜索出来的结果存在大量的不准确信息,并且结果中存在大量的页面并非为电商的销售页面,消费者无法直接从该页面中直接进行购物。另一方面,作为商家不仅需要在各大平台上建立专属品牌的电商销售端,还需要建立自己的电商平台,每一个平台都需要投入大量的广告费用用于推广,否则在众多品牌当中,消费者很难直接获得直接对接该商家的销售端口。虽然从普通的搜索引擎中也可以搜索到相关的网页信息,但如上所述,这些页面很多并不是销售页面,这样就大大降低了消费者的购物欲望。进一步的,由于商品类别众多,消费者也分成多种群体,从众多商品中挑选符合某一消费者团体的商品也是一种商业模式,在实体经济中体现为各种各样的买手店,买手店的经营基数是商品信息的不对称,从不对称的商品信息中获利。但在互联网经济中,由于商品类别成百倍千倍的增长,而且商品信息透明化,且具有大量的噪音,导致在互联网经济中,买手模式无法得到充分的发挥。买手模式的消失,使消费者直接对接商品信息,消费者将会被大量的商品信息所淹没,两者形成恶性的循环。综上所述,目前,随着电子商务的发展,电子商务平台越来越多,电子商务平台通过网页向用户展示商品。为了追求利益,商家通常会把商品放到不同的电子商务平台上进行销售。互联网电子商务商品的网页繁多杂乱,没有一个统一数据结构的数据库,以方便用户像google、百度收录网页一样,把所有商品类信息收集起来,为提供给用户二次分类检索、筛选、单点浏览提供方便。商城网站的数量不断增加,涉及的内容也越来越丰富,用户需要在上网的时候能够方便快捷地找到自己感兴趣的商品信息。为了适应用户的需求,通过搜索需要快速展示商城页面的商品信息,并给出综合性参考信息。本申请所要解决的技术问题是提供一种商品数据分类处理及对比技术方法及系统,能够解决商品信息分析与对比的问题。



技术实现要素:

基于背景技术存在的技术问题,本发明提出了一种商品数据分类处理及对比技术方法及系统,能够实现商品页面信息快速分析与对比。

本发明提出的一种商品数据分类处理及对比技术方法,包括以下步骤:

选择需要处理的商品类别并导引至商品类别;

监测商品页面中商品的实时动态数据信息;

基于所述实时动态数据信息对所述商品进行信息识别录取;

将所述识别录取的信息生成数据化图表;

将生成后的数据化图表根据搜索关键词对比分类。

进一步地,所述监测商品页面中商品的实时动态数据信息包括:

获取通过商品页面,商品销售数据;

将所述销售数据确定为实时动态数据信息,将所述实时动态数据信息与商品页面相关联,且动态实时更新信息,对所述销售数据按照区间进行修正得到所述商品区间销售数据;将所述区间销售数据确定为所述商品的区间实时动态数据信息,对所述销售数据进行修正包括:对销售数据结合市场因素及关联因素进行匹配及对比。所述商品页面显示的动态数据为销售数据或访问量,所述实时动态数据信息包括监测某一时间段内的实时动态数据信息的变化量和监测相同时间段内的商品显示的动态数据的变化量;比较所述实时动态数据信息的变化量和商品显示的动态数据的变化量,若二者差值超过阈值,则确定商品显示的动态数据不真实。所述商品页面显示的动态数据为销售数据,将所述实时动态数据信息转化为理论购买数量;监测某一时间段内的理论购买数量的变化量;监测相同时间段内商品显示的销售数据的变化量;比较所述理论购买数量和商品显示的销售数据的变化量,若二者差值超过阈值,则确定商品显示的销售数据不真实。

进一步地,所述实时动态数据信息包括热度,基于监测技术获取各商品的实时动态数据信息,根据预先设定热度等级和对应的取值范围,根据实时动态数据信息所在范围确定各商品对应的热度等级;或获取各商品的实时动态数据信息,按照实时动态数据信息的高低确定各商品的热度。

进一步地,所述实时动态数据信息包括精确度,基于监测技术获取各商品的实时动态数据信息以及各商品显示的动态数据;基于相同时间内各商品实时动态数据信息变化量来验证各商品显示动态数据的真实性,并根据所述验证结果确定所述各商品的精确度。

一种商品数据分类处理及对比技术系统包括:

实时动态数据信息监测模块,用于监测商品页面中商品的实时动态数据信息;

信息模块,用于基于所述实时动态数据信息对所述商品进行信息汇总;所述信息模块包括:热度信息单元,用于获取各商品的实时动态数据信息,根据预先设定热度等级和对应的取值范围,根据实时动态数据信息所在范围确定各商品对应的热度等级;或精确度信息单元,用于获取各商品显示的动态数据,基于相同时间内各商品实时动态数据信息变化量来验证各商品显示动态数据的真实性,并根据所述验证结果确定所述各商品的精确度。

处理模块,用于将所述实时动态数据信息关联链接在商品页面中;进一步地,所述处理模块由处理电路组成,所述处理电路包括ic单元及外围电路组成,所述ic单元的vcc端口、v1端口、v2端口均与电源vcc电连接且通过电容c1接地;kbi0端口、kbi1端口、kbi2端口、kbi3端口均与信息模块通信连接;osc1端口和osc2端口之间连接有电阻r1和晶体xtal,osc1端口、osc2端口分别通过电容c2、c3接地;cgmxfc端口通过电阻r2、可变电容vc2接地,cgmxfc端口通过可变电容vc1、可变电容vc2接地,irq端口通过电阻r3接电源vcc,irq端口与脉冲信号一端连接,脉冲信号另一端接地;vss端口和vr端口接地;pta1端口通过电阻r4与电源vcc电连接,pta1端口直接与红外接收模块电连接;pta5、pta6、pta7分别与时钟电路模块的rst端口、i/o端口、sclk端口电连接,时钟电路模块的vcc1端口与电源vcc电连接,vcc2端口通过直流电源接地,gnd端口直接接地;rxd端口和txd端口分别连接rs232通信传输模块和rs485通信传输模块;ptb2端口和ptb3端口直接连接rs485通信传输模块;ptb4端口和ptb5端口直接连接红外发送模块;bp1端口、bp2端口、bp3端口以及fp1端口至fp26端口分别与缓存器存储器传输连接,所述缓存器存储器与lcd传输连接。

进一步地,所述实时动态数据信息监测模块包括:

销售数据统计单元,用于获取通过商品页面、商品销售数据,并将销售数据确定为实时动态数据信息。区间计算单元,将销售数据统计单元获取的商品页面、商品销售数据进行区间计算;

修正单元,对所述销售数据进行修正得到所述商品销售数据确定为所述商品的实时动态数据信息。

进一步地,所述精确度信息单元包括:实时动态数据信息变化量监测单元,用于监测某一时间段内的实时动态数据信息的变化量;

商品显示的动态数据变化量监测单元,用于监测相同时间段内的商品显示的动态数据的变化量,所述商品显示的动态数据包括销售数据或访问量;

信息单元,用于比较所述实时动态数据信息和商品显示的动态数据的变化量,若二者差值超过阈值,则确定商品显示的动态数据不真实。处理单元,将所述实时动态数据信息转化为理论购买数量;

理论购买数量变化量监测单元,用于监测某一时间段内的理论购买数量的变化量。

进一步地,基于商品数据分类处理及对比技术系统的步骤如下:

步骤1:设置抓取的范围、内容以及级数,所述范围表示相关页面可以访问的链接,所述内容表示该链接下的所有内容,所述级数表示访问该链接所含子链接级数上限值s;输入初始链接;

步骤2:建立url队列,所述url队列用于存储要爬取的初始链接,将url种子集添加到所述url队列中;

步骤3:若访问页面数小于访问链接级数上限值s,或者url队列的长度不为零,即url队列不为空,则根据所述初始链接下载对应的页面,否则结束;

步骤4:抽取被新爬取到的链接到list队列中,并计算页面与主题的相关度,然后保存下载到的页面;所述list队列用于存储爬取到的链接;

步骤5:判断页面的内容,若页面的内容大于零,则执行步骤6,否则返回步骤3;

步骤6:判断页面是否与主题相关,若与主题相关,则增加所述页面前向链接的链接值,否则降低所述页面前向链接的链接值;

步骤7:判断url是否在list队列中,若在list队列中,则执行步骤8,否则返回到步骤3;

步骤8:判断url是否在url队列中,若在url队列中,比较url队列的相关系数和list队列的相关系数的大小,两者中较大的取代url队列中的相关系数;否则按照相关系数的大小插入到url队列中;

步骤9:若当前页面相关,则内容为series(page),否则内容为series(page)-1,series(page)指当前页面的内容;

步骤10:从list队列中取出下一条url,然后从步骤7开始执行;

步骤11:算法结束,输出主题相关网页。

本发明提供的一种商品数据分类处理及对比技术方法及系统的优点在于:通过检测商品页面中展示商品的实时状态参数,并对相关数据进行处理后对商品进行信息化,将商品信息生成在数据化图表,为商标提供了一个实时、准确的信息张贴,从而丰富了商品页面的展示信息,帮助用户识别网页中的大量商品,还可以避免用户因为不熟悉而盲目点击商品页面中的商品。在进行信息识别的同时,基于实时信息识别录取和商品自身展示的数据,对商品自身展示数据真实性的检测,并将检测结果作为评价的其中一个参数,从而使商品信息结果更为准确,提高商品信息的价值,方便用户的使用,进一步地,采用专用化设计处理模块,处理模块由处理电路组成,处理电路采用多种传输方式和多通道传输,提高系统的处理效率,使得系统的使用更加高效。

附图说明

图1为一种商品数据分类处理及对比技术方法的流程图;

图2为一种基于商品数据分类处理及对比技术系统结构原理图;

图3为一种基于商品数据分类处理及对比技术系统实现步骤流程图;

图4为一种基于商品数据分类处理及对比技术系统处理模块的电路原理图。

具体实施方式

参考图1,一种商品数据分类处理及对比技术方法,包括以下步骤:

选择需要处理的商品类别并导引至商品类别;

监测商品页面中商品的实时动态数据信息;

基于所述实时动态数据信息对所述商品进行信息识别录取;

将所述识别录取的信息生成数据化图表;

将生成后的数据化图表根据搜索关键词对比分类。

所述监测商品页面中商品的实时动态数据信息包括:

获取通过商品页面,商品销售数据;

将所述销售数据确定为实时动态数据信息,将所述实时动态数据信息与商品页面相关联,且动态实时更新信息,对所述销售数据按照区间进行修正得到所述商品区间销售数据;

将所述区间销售数据确定为所述商品的区间实时动态数据信息,对所述销售数据进行修正包括:对销售数据结合市场因素及关联因素进行匹配及对比。

所述实时动态数据信息包括热度,基于监测技术获取各商品的实时动态数据信息,根据预先设定热度等级和对应的取值范围,根据实时动态数据信息所在范围确定各商品对应的热度等级;或获取各商品的实时动态数据信息,按照实时动态数据信息的高低确定各商品的热度。

所述实时动态数据信息包括精确度,基于监测技术获取各商品的实时动态数据信息以及各商品显示的动态数据;基于相同时间内各商品实时动态数据信息变化量来验证各商品显示动态数据的真实性,并根据所述验证结果确定所述各商品的精确度。

所述商品页面显示的动态数据为销售数据或访问量,所述实时动态数据信息包括监测某一时间段内的实时动态数据信息的变化量和监测相同时间段内的商品显示的动态数据的变化量;比较所述实时动态数据信息的变化量和商品显示的动态数据的变化量,若二者差值超过阈值,则确定商品显示的动态数据不真实。

所述商品页面显示的动态数据为销售数据,将所述实时动态数据信息转化为理论购买数量;监测某一时间段内的理论购买数量的变化量;监测相同时间段内商品显示的销售数据的变化量;比较所述理论购买数量和商品显示的销售数据的变化量,若二者差值超过阈值,则确定商品显示的销售数据不真实。

其中,将实时动态数据信息转化为理论购买数量可以根据对历史数据进行分析来获取。例如,首先确定网页所销售商品类别,基于历史数据分析确定该种类别的商品的购买转化率,根据购买转化率和实时动态数据信息来确定该商品的理论购买数量。其中,购买转化率可以根据对各种特定商品区间销售数据进行采样确定,也可以通过对特定商品的较多历史销售数据通过模型进行训练后确定。

参考图2,一种商品数据分类处理及对比技术系统,包括:

实时动态数据信息监测模块,用于监测商品页面中商品的实时动态数据信息;

信息模块,用于基于所述实时动态数据信息对所述商品进行信息汇总;

处理模块,用于将所述实时动态数据信息关联链接在商品页面中。

所述实时动态数据信息监测模块包括:

销售数据统计单元,用于获取通过商品页面、商品销售数据,并将销售数据确定为实时动态数据信息。区间计算单元,将销售数据统计单元获取的商品页面、商品销售数据进行区间计算;

修正单元,对所述销售数据进行修正得到所述商品销售数据确定为所述商品的实时动态数据信息。

所述信息模块包括:

热度信息单元,用于获取各商品的实时动态数据信息,根据预先设定热度等级和对应的取值范围,根据实时动态数据信息所在范围确定各商品对应的热度等级;或精确度信息单元,用于获取各商品显示的动态数据,基于相同时间内各商品实时动态数据信息变化量来验证各商品显示动态数据的真实性,并根据所述验证结果确定所述各商品的精确度。

所述精确度信息单元包括:

实时动态数据信息变化量监测单元,用于监测某一时间段内的实时动态数据信息的变化量;

商品显示的动态数据变化量监测单元,用于监测相同时间段内的商品显示的动态数据的变化量,所述商品显示的动态数据包括销售数据或访问量;

信息单元,用于比较所述实时动态数据信息和商品显示的动态数据的变化量,若二者差值超过阈值,则确定商品显示的动态数据不真实。处理单元,将所述实时动态数据信息转化为理论购买数量;

理论购买数量变化量监测单元,用于监测某一时间段内的理论购买数量的变化量。

综上所述,本发明通过检测商品页面中展示商品的实时状态参数,并对相关数据进行处理后对商品进行信息化,将商品信息生成在数据化图表,为商标提供了一个实时、准确的信息张贴,从而丰富了商品页面的展示信息,帮助用户识别网页中的大量商品,还可以避免用户因为不熟悉而盲目点击商品页面中的商品。在进行信息识别的同时,基于实时信息识别录取和商品自身展示的数据,对商品自身展示数据真实性的检测,并将检测结果作为评价的其中一个参数,从而使商品信息结果更为准确,提高商品信息的价值,方便用户的使用。

参考图3,一种商品数据分类处理及对比技术系统,对比技术系统步骤如下:

步骤1:设置抓取的范围、内容以及级数,所述范围表示相关页面可以访问的链接,所述内容表示该链接下的所有内容,所述级数表示访问该链接所含子链接级数上限值s;输入初始链接;

步骤2:建立url队列,所述url队列用于存储要爬取的初始链接,将url种子集添加到所述url队列中;

步骤3:若访问页面数小于访问链接级数上限值s,或者url队列的长度不为零,即url队列不为空,则根据所述初始链接下载对应的页面,否则结束;

步骤4:抽取被新爬取到的链接到list队列中,并计算页面与主题的相关度,然后保存下载到的页面;所述list队列用于存储爬取到的链接;

步骤5:判断页面的内容,若页面的内容大于零,则执行步骤6,否则返回步骤3;

步骤6:判断页面是否与主题相关,若与主题相关,则增加所述页面前向链接的链接值,否则降低所述页面前向链接的链接值;

步骤7:判断url是否在list队列中,若在list队列中,则执行步骤8,否则返回到步骤3;

步骤8:判断url是否在url队列中,若在url队列中,比较url队列的相关系数和list队列的相关系数的大小,两者中较大的取代url队列中的相关系数;否则按照相关系数的大小插入到url队列中;

步骤9:若当前页面相关,则内容为series(page),否则内容为series(page)-1,series(page)指当前页面的内容;

步骤10:从list队列中取出下一条url,然后从步骤7开始执行;

步骤11:算法结束,输出主题相关网页。

参考图4,一种商品数据分类处理及对比技术系统,其处理模块由处理电路组成,所述处理电路包括ic单元及外围电路组成,所述ic单元的vcc端口、v1端口、v2端口均与电源vcc电连接且通过电容c1接地;kbi0端口、kbi1端口、kbi2端口、kbi3端口均与信息模块通信连接;osc1端口和osc2端口之间连接有电阻r1和晶体xtal,osc1端口、osc2端口分别通过电容c2、c3接地;cgmxfc端口通过电阻r2、可变电容vc2接地,cgmxfc端口通过可变电容vc1、可变电容vc2接地,irq端口通过电阻r3接电源vcc,irq端口与脉冲信号一端连接,脉冲信号另一端接地;vss端口和vr端口接地;pta1端口通过电阻r4与电源vcc电连接,pta1端口直接与红外接收模块电连接;pta5、pta6、pta7分别与时钟电路模块的rst端口、i/o端口、sclk端口电连接,时钟电路模块的vcc1端口与电源vcc电连接,vcc2端口通过直流电源接地,gnd端口直接接地;rxd端口和txd端口分别连接rs232通信传输模块和rs485通信传输模块;ptb2端口和ptb3端口直接连接rs485通信传输模块;ptb4端口和ptb5端口直接连接红外发送模块;bp1端口、bp2端口、bp3端口以及fp1端口至fp26端口分别与缓存器存储器传输连接,所述缓存器存储器与lcd传输连接,处理电路采用多种传输方式和多通道传输,提高系统的处理效率,使得系统的使用更加高效。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1