多平台电子商务信息聚合方法及系统与流程

文档序号:19496094发布日期:2019-12-24 14:58阅读:287来源:国知局
多平台电子商务信息聚合方法及系统与流程

本发明涉及电子商务信息技术,尤其涉及的是一种可用于多平台跨境电子商务活动的商品发布与维护的信息聚合技术。



背景技术:

当今,随着世界经济一体化和全球化的发展,电子商务对各国的经济发展和社会变迁的影响逐渐增强。我国占据着世界上最多的人口,有着庞大的市场基础和经济活力。早在2010年,我国就已成为全球制造业产出最高的国家。在当前世界范围内电子商务飞速发展的背景下,我国中小企业结合电子商务技术,尤其是跨境电子商务,借用新兴贸易模式来推动我国企业进入国际市场,变得越来越具有现实可行性。我国中小企业利用跨境电子商务进入国际市场,对于扩大我国产品的国际市场份额,拓展外贸营销网络,孕育新的出口竞争优势,转变传统国际贸易的交易方式,促进我国外贸的产业转型和产业升级,提高我国外贸在国际市场中的竞争力具有重要而深远的意义。

所谓跨境电子商务,是指分属不同国家或地区的交易主体,通过电子商务平台完成交易、进行支付结算,并通过跨境物流配送商品,完成交易的一种国际商业贸易活动。其特点有:全球性、即时性和便捷性。2013年我国跨境电商交易规模为3.1万亿元,增长率为31.3%,占进出口贸易总额的11.9%,虽然占比较低,但是随着我国电子商务的全球化,跨境电子商务在我国对外贸易中的地位会越来越高,预计2017年跨境电商在进出口贸易总额中的比例将达到20%左右。

我国政府积极推动跨境电子商务发展,目前已有上海、重庆、杭州、宁波、郑州、深圳前海及青岛等7个城市或地区相继取得了跨境电子商务试点城市。同时,一系列跨境电商政策的密集出台也使我国跨境电子商务的政策环境、法律、法规、标准体系及支撑保障水平等得到了大幅度提升,跨境电子商务发展的势头强劲。

国内中小企业进入国际市场的重要障碍之一是信息获取的高成本,电子商务通过对供应链流程的优化,降低了信息获取的成本,并且提高了企业供应链管理的整体化运作水平,进而管理成本、信息获取成本也大大降低。企业涉足跨境电子商务首先需要对公司自身的电子信息化水平进行建设和维护,在25万左右从事跨境电子商务的中小企业中,只有7000个左右的企业创建了自己的电子信息平台,而其他众多的中小企业依旧需要依靠第三方平台开展对外贸易。然而,海外市场庞大,第三方跨境电子平台众多,其商品信息的发布规范和要求各不相同,信息维护的工作量和专业化程度较高,目前,大多数不同平台的维护需要专业人员手工完成,对于资源有限的小微企业来说,多平台电子商务系统的维护成为了沉重的负担。跨境电子商务管理平台的构建需要整合大量分散异构的信息资源,这些资源可能分布在不同第三方平台系统中,这是一项繁杂而艰巨的任务。如何有效重用不同门户的信息资源,自动构建商品的信息管理维护系统,并对不同平台的商品自动进行发布和维护工作,从而大幅度提高跨境电子商务商品信息管理效率,降低商品在多个第三方跨境电子商务平台的发布和维护成本己成为一个亟待解决的关键技术问题。

目前,跨境电子商务平台众多,主流的平台例如速卖通、亚马逊、ebay、wish、兰亭集势、敦煌、walmart、newegg等,每个平台采用的技术标准、后台数据库各异,对于从事跨境的企业来说,需要分别在不同平台上按照该平台的要求发布商品的信息及描述,并对自己的商品进行动态管理,包括,对同一商品不同平台的信息进行及时同步更新;对某一平台变更的商品描述项目进行重新映射等;对新产品的属性进行编辑以适应每个平台不同的需求并推送至该平台完成商品上货。以往,商品的发布、维护与更新需要人工处理,工作量大、效率低下、容易出错,因此,一些平台发布了数据接口,跨境企业可以通过数据接口进行批次产品的发布与更新,然而,不同平台的接口与数据格式并不相同,对于同时在多个平台进行运营的跨境企业,仍然需要进行大量的人工操作,要实现该过程的计算机自动处理,具体需要解决以下问题:

1)数据的非结构化。在现今的跨境电子商务平台的大部分数据信息中,充斥着大量的非结构化的数据,结构化数据所占的比例还是很低的,这对于数据库的存取是一大难题,只有将这些非结构化数据转化为统一的数据格式的结构化数据。

2)商品最小信息元素之间的映射与组合,各平台之间的数据类项差异,每个平台对于商品的描述类目均不相同,一些属性(例如商品名称)是每个平台的共同属性,有一些则是个别平台独有的,而另一些是虽然各个平台共有,但是描述要求和信息聚合程度不同,因此会有一些差异,还有一些是简单属性组合而成的复杂属性。而跨境企业需要进行商品的统一维护,因此需要建立一个大的包含所有平台属性的商品数据类目,对商品数据进行统一的组织和规划,需要对原始的属性综合集合进行甄别和合并。

3)根据商品所在平台对商品类目集合进行分别批量生成平台商品描述,每个平台的商品描述类目和格式各不相同,需要建立不同平台信息与描述信息集合的动态映射关系,以便根据属性综合集合和目标平台,动态生成目标平台的商品属性列表及内容,以便对不同平台的商品信息进行统一更新和维护。

跨境电子商务活动中,存在着大量依靠第三方平台开展对外贸易的中小企业,该类中小企业技术力量薄弱,人力资源匮乏,上述问题成为影响中小跨境企业迅速扩大产品销售市场的一个急需解决的技术难题。



技术实现要素:

本发明所要解决的技术问题是提供一种多平台电子商务信息聚合方法及系统,克服现有技术中多个跨境电子商务平台商品发布、信息更新时因各平台接口不统一导致的维护工作量大、效率低下、容易出错、不能及时发现平台系统改变而无法进行信息更新等缺陷。

为解决上述问题,本发明提出一种多平台电子商务信息聚合方法,包括以下步骤:

获取各电商平台关于样本商品的页面类目信息;

对获取的同一样本商品在不同电商平台页面上的全部类目信息进行相似度分析,基于相似度分析结果解析出样本商品的最小信息元素,合并最小信息元素得到该样本商品的最小信息元素集合,多个样本商品的最小信息元素集构成综合样本集;

针对各电商平台,以样本商品的最小信息元素集合与从一电商平台获取的类目信息作为训练样本对,进行权重系数取值为0或1的神经网络训练,得到各电商平台的神经网络聚合模型;

根据不同电商平台的所述神经网络聚合模型,输入待聚合商品的最小信息元素集合,经模型计算得到对应电商平台商品页面要求的类目信息。

根据本发明的一个实施例,还包括:

当商品信息变更时,根据更新的最小信息元素集合重新输入到所述神经网络聚合模型,得到各电商平台更新的类目信息,并上传至对应的电商平台。

根据本发明的一个实施例,还包括:

当所监控的电商平台样本商品页面的类目信息发生变化时,进行相似度分析及解析合并得到新的最小信息元素集合,构建目标电商平台的新的样本对,重新训练新的神经网络聚合模型,将待聚合商品的原有的最小信息元素集合输入到更新后的神经网络聚合模型中得到变化后的类目信息,并上传至该目标电商平台。

根据本发明的一个实施例,通过采用聚焦爬虫基于目标数据模式定向抓取各电商平台的相关商品网页资源,以获取各电商平台关于商品的类目信息。

根据本发明的一个实施例,每个神经网络聚合模型是最小信息元素集合到一电商平台的类目信息的映射模型,包括一层输入层、多层或单层隐层、一层输出层,输入节点数根据最小单元信息集合的元素个数确定,隐层层数和节点数根据信息聚合的粒度确定,输出节点数根据相应电商平台的类目数量确定。

根据本发明的一个实施例,采用神经网络反馈校正算法对神经网络聚合模型的参数进行训练和寻优。

根据本发明的一个实施例,所述的进行训练和寻优包括:

采用二进制的ga算法,神经网络聚合模型的权重参数取值为0或1,隐节点和输出节点对输入信息进行加权求和,得到不同信息元素的综合;

比较神经网络聚合模型的输出值与样本对的输出值,根据比较结果对权重参数进行更改,以得到适合每个电商平台的神经网络聚合模型。

根据本发明的一个实施例,神经网络训练包括离线训练模式,包括以下步骤:

a1:随机生成二进制的ga算法的染色体组,选择一初始染色体作为神经网络的初始权重系数取值,并计算适应度值,将初始染色体赋值给历史最优值;

a2:对染色体组进行复制、变异和交叉,得到复制、变异和交叉后的染色体群体合集,分别将其中的染色体作为神经网络的权重系数取值,计算各适应度值;

a3:选择所述各适应度值中最小适应度的染色体,若该最小适应度小于历史最优值,则将对应的染色体赋值给历史最优值,否则保持历史最优值不变,对变异产生的新的染色体集合基于适应度函数采用轮盘赌方式进行筛选,得到下一代的染色体组,等待迭代;

a4:判断历史最优值的染色体应用在神经网络聚合模型中时,所有样本对的模型输出与样本输出是否都相符,若是则结束迭代学习,输出该最优的染色体,否则选择下一代的染色体组返回步骤a2。

根据本发明的一个实施例,神经网络训练还包括在线运行模式,包括以下步骤:

b1:根据目标电商平台选择对应的神经网络聚合模型的权重系数及结构,生成相应的神经网络聚合模型;

b2:输入最小信息元素集合,调用神经网络聚合模型计算目标电商平台的商品页面的类目信息。

本发明还提供一种多平台电子商务信息聚合系统,包括:

平台信息采集模块,用以获取各电商平台关于样本商品的页面类目信息;

信息相似分析整合模块,用以对获取的同一样本商品在不同跨境电商平台页面上的全部类目信息进行相似度分析,基于相似度分析结果解析出样本商品的最小信息元素,合并最小信息元素得到该样本商品的最小信息元素集合,多个样本商品的最小信息元素集构成综合样本集;

聚合模型训练模块,用以针对各电商平台,以样本商品的最小信息元素集合与从一电商平台获取的类目信息作为训练样本对,进行权重系数取值为0或1的神经网络训练,得到各电商平台的神经网络聚合模型;

聚合信息计算模块,用以根据不同电商平台的所述神经网络聚合模型,输入待聚合商品的最小信息元素集合,经模型计算得到对应电商平台商品页面要求的类目信息。

根据本发明的一个实施例,还包括:

聚合模型动态更新模块,用以当商品信息变更时,根据更新的最小信息元素集合重新输入到所述神经网络聚合模型,得到各电商平台更新的类目信息,并上传至对应的电商平台;和/或,用以当所监控的电商平台样本商品页面的类目信息发生变化时,进行相似度分析及解析合并得到新的最小信息元素集合,构建目标电商平台的新的样本对,重新训练新的神经网络聚合模型,将待聚合商品的原有的最小信息元素集合输入到更新后的神经网络聚合模型中得到变化后的类目信息,并上传至该目标电商平台。

采用上述技术方案后,本发明相比现有技术具有以下有益效果:

通过0-1连接权重系数建立神经网络聚合模型,可以有效地进行商品信息基本元素的聚合,快速得到符合各目标电商平台页面的类目信息,可用于面向多平台跨境电子商务的信息聚合;

传统神经网络模型采用连续参数模型和sigmoid函数,本发明为了更好达到信息聚合的目的,特意提出了一种重新设计的神经网络模型,其参数采用0-1整数,转换函数采用加法函数,训练采用2进制ga算法,这些在传统或目前技术中未见述及;

由于整数0-1神经网络聚合模型的引入导致了模型参数不连续问题,而二进制ga的染色体与神经网络聚合模型权重的映射方法和训练方法,有效解决了神经网络聚合模型在样本机上的学习和训练问题;

系统的动态侦测及更新机制,通过动态对商品信息与跨境电商平台页面类目的变化情况进行侦测,一旦检测到变化,立刻进行页面类目内容重新计算或神经网络聚合模型的重新训练,从而解决了传统人工更新模式带来的时间滞后和页面内容更新不同步问题。

附图说明

图1为本发明一实施例的多平台电子商务信息聚合方法的流程示意图;

图2为本发明一实施例的神经网络聚合模型的结构框图;

图3为本发明一实施例的多平台电子商务信息聚合方法的工作原理示意图;

图4为本发明一实施例的离线训练模式的神经网络训练的流程示意图;

图5为本发明一实施例的在线运行模式的神经网络工作的流程示意图;

图6为本发明一实施例的神经网络聚合模型在线动态更新工作流程示意图;

图7为本发明一实施例的神经网络聚合模型权重系数与二进制ga染色体的对应关系。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。

参看图1,本发明实施例的多平台电子商务信息聚合方法,包括以下步骤:

s1:获取各电商平台关于样本商品的页面类目信息;

s2:对获取的全部类目信息进行相似度分析,基于相似度分析结果解析出样本商品的最小信息元素,合并最小信息元素得到该样本商品的最小信息元素集合,多个样本商品的最小信息元素集构成综合样本集;

s3:针对各电商平台,以样本商品的最小信息元素集合与从一电商平台获取的类目信息作为训练样本对,进行权重系数取值为0或1的神经网络训练,得到各电商平台的神经网络聚合模型;

s4:根据不同电商平台的所述神经网络聚合模型,输入待聚合商品的最小信息元素集合,经模型计算得到对应电商平台商品页面要求的类目信息。

各电商平台对自身商品页面的商品属性分类及描述数据会存在或多或少的差异,例如,一电商平台定义的商品的体积,在另一电商平台中则可以定义为长宽高。在步骤s1中,可以通过分别抓取各电商平台的商品页面来获取它们对于商品的不同属性分类及描述数据,当然也可以采用其他方式来获得。换言之,首先要获取各电商平台关于商品的类目信息。类目信息是电商平台对于商品的属性进行分类后的信息,可以包括相应分类的类目及类目内容。

可选的,在步骤s1中,通过采用聚焦爬虫基于目标数据模式定向抓取各电商平台的相关商品网页资源,以获取各电商平台关于商品的类目信息。具体来说,通过控制器,解析器,资源库三部分完成。控制器的主要工作是负责给多线程中的各个爬虫线程分配工作任务。控制器是网络爬虫的中央控制器,它主要是负责根据系统传过来的url链接,分配一线程,然后启动线程调用爬取网页的过程。解析器的主要工作是下载网页,进行页面的处理,主要是将一些js脚本标签、css代码内容、空格字符、html标签等内容处理掉,爬虫的基本工作是由解析器完成,工作内容有:下载网页的功能,对网页的文本进行处理,如过滤功能,抽取特殊html标签的功能,分析数据功能等。资源库是用来存放下载到的网页资源,一般都采用大型的数据库存储,如oracle数据库,并对其建立索引,用来存储网页中下载下来的数据记录的容器,并提供生成索引的目标源。中大型的数据库产品有:oracle、sqlserver等。

在步骤s2中,对在步骤s1中获取的全部类目信息进行相似度分析,基于相似度分析结果解析出各最小信息元素,具体可以是将相似的元素保留一个、不相似的元素全部保留、对合并在一起的元素分解开,例如长宽高元素分解为长、宽、高三个元素,从而得到了商品全部的最小信息元素,合并这些最小信息元素得到最小信息元素集合,作为商品信息的综合样品集,供学习、训练和运行。

在步骤s3中,针对各电商平台,每个电商平台都训练各自的神经网络聚合模型,每次以步骤s2中得到的最小信息元素集合与从一电商平台获取的类目信息作为样本对,进行权重系数取值为0或1的神经网络训练,得到一个电商平台的神经网络聚合模型,对每个电商平台均进行训练从而得到各个电商平台各自的神经网络模型。

每个神经网络聚合模型是最小信息元素集合到一电商平台的类目信息的映射模型,包括一层输入层、多层或单层隐层、一层输出层,输入节点数根据最小单元信息集合的元素个数确定,隐层层数和隐层节点数根据信息聚合的粒度确定,用来实现不同信息之间的综合,输出节点数根据相应电商平台的类目数量(可以理解为类目信息中的数据数量)确定。模型的输入节点数、输出节点数均可根据实际情况进行动态调整,即模型的结构和参数都是动态变化的,以适应商品自身信息和平台页面的维护升级要求。

在一个实施例中,采用神经网络反馈校正算法对神经网络聚合模型的参数进行训练和寻优。训练算法优选采用2进制的ga算法,解决了所采用的非连续参数神经网络模型的反馈学习难题。

具体的,进行训练和寻优可以包括:采用二进制的ga算法,神经网络聚合模型的权重参数取值为0或1,隐节点和输出节点对输入信息进行加权求和,得到不同信息元素的综合;比较神经网络聚合模型的输出值与样本对的输出值,根据比较结果对权重参数进行更改,以得到适合每个电商平台的神经网络聚合模型。

在步骤s4中,训练完成之后,便可进行模型运行,得到各电商平台的类目信息,根据不同电商平台的神经网络聚合模型,输入待聚合商品的最小信息元素集合,经模型计算得到对应电商平台商品页面要求的类目信息。免去了现有技术的人工操作来建立及维护类目信息的表格,运行速度相比人工操作而言得到大大提升,并且准确率大大提高。待聚合商品的最小信息元素集合可以通过对商品厂家提供的商品属性根据样本商品的最小信息元素集合的格式进行划分归总获得,获得之后以后可以继续使用,无需再进行划分归总。

由于商品的信息以及电商平台的商品页面的类目信息会发生变化,因此,需要动态地去进行商品页面类目信息的更新以及聚合模型的更新,并将更新后的电商平台商品页面要求的类目及内容上传至电商平台。

较佳的,多平台电子商务信息聚合方法还可以包括:当商品信息变更时,也就是最小信息元素集合中的元素变更,根据更新的最小信息元素集合重新输入到神经网络聚合模型,得到各电商平台更新的类目信息,并上传至对应的电商平台。

较佳的,多平台电子商务信息聚合方法还可以包括:当所监控的电商平台样本商品页面的类目信息发生变化时(即商品的最小信息元素集与页面类目信息之间的聚合关系发生变化时),进行相似度分析及解析合并得到新的最小信息元素集合,构建目标电商平台的新的样本对,重新训练新的神经网络聚合模型,将待聚合商品的原有的最小信息元素集合输入到更新后的神经网络聚合模型中得到变化后的类目信息,并上传至该目标电商平台。

下面对本发明实施例的方法进一步阐述。

如图2所示,该神经网络聚合模型的输入为商品信息的最小信息元素集合,输出为跨境电商平台商品页面要求的类目信息,神经网络的输入节点个数为商品信息最小信息元素的个数j,输出节点个数为类目信息的条数i,隐节点个数和层数由信息聚合的程度而定,本实施例中,选取隐节点个数为k,隐节点层数选择一层,从输入节点p(p∈[1,2…j])到隐节点q(q∈[1,2…k])的权重系数为ωpq,从隐节点q到输出节点m(m∈[1,2…n])的权重系数为νqm,其中ωpq和νqm的取值均为0或1,即ωpq∈[0,1],νqm∈[0,1],跨境电子商务信息神经网络聚合模型的权重系数均在0和1之中取值,因此可称为整数0-1神经网络。神经网络隐节点与输出的传递函数选用线性加法函数,即隐节点输出yq=σxp*ωpq,yq为第q个隐节点输出,xp为第p个节点输入,输出节点与隐节点类似,传递函数也采用线性加法函数,采用整数0-1神经网络与线性加法函数的目的是为了能够表达通过不同的商品信息最小元素组合,对跨境电商平台商品页面要求的类目信息进行描述。该神经网络训练时,基于二进制ga算法,根据商品信息最小元素与跨境电商平台商品页面要求的信息类目组成的样本对,对神经网络的连接权重参数ωpq和νqm进行训练以得到能够反映不同电子商务页面信息与商品信息最小元素之间组合与映射关系的模型。

神经网络训练可包括离线训练模式。离线训练模式的输入为经过相似度分析及整合后的跨境电商平台商品页面信息最小元素信息集合组成的样本对集合,样本对包括商品最小信息元素集合u和页面的类目信息y,如“背包”和“男”为两个最小元素,则商品的平台名称类目对应内容“男士背包”为该两个最小元素的组合映射结果;在“尺寸”类目里,背包的三个最小信息元素长480mm、高350mm、深150mm共同构成平台页面中的规格类目信息“350mm*480mm*150mm”,不同平台具有不同的映射关系,目前通过专业人员手工完成最小信息到页面类目内容的匹配与组合,而本发明可通过计算机程序自动生成上述组合关系,以便利企业进行相关商品内容和聚合模型的更新。

将同一跨境电商平台获取的上述类目内容和最小元素集合的样本对组成的集合输入到图2中神经网络聚合模型,其中商品信息最小元素集合为输入值,商品页面类目信息为输出值,通过比较判定,若所有样本的模型输出值与商品页面类目信息完全匹配,则误差为零,说明该模型能够真实匹配该电商平台的商品描述映射与组合关系,若有项目不符合,则说明该模型的连接权值还没有训练完成,仍需要ga进行优化,则继续进入迭代优化训练过程,直到在训练样本集上各项模型输出值与商品页面信息类目内容全部符合为止,即得到目标跨境电商平台上从商品信息最小元素集到商品页面信息类目内容的正确映射和组合关系。

具体的,参看图3和图4,离线训练模式的神经网络训练,包括以下步骤a1-a4。

a1:随机生成二进制的ga算法的染色体组,选择一初始染色体作为神经网络的初始权重系数取值,并计算适应度值,将初始染色体赋值给历史最优值。

更具体的,设n为ωpq和νqm的个数总和,即n=p*q+q*m,则ga算法中染色体为一组随机生成的长度为n的二进制码(例如10…01…101…10…1),设染色体组为s=[s1,s2,…,sr-1,sr],r为染色体个数,此例中r=20,按照图7方式一一对应地分配给整数0-1神经网络的权值,然后选择第一个染色体对应的神经网络,计算其适应度值,将其赋给历史最优值sbest。

a2:对染色体组进行复制、变异和交叉,得到复制、变异和交叉后的染色体群体合集,分别将其中的染色体作为神经网络的权重系数取值,计算各适应度值。

更具体的,对全部20个染色体进行标准2进制ga选择、交叉和变异操作,并参照图6将参数映射至整数0-1神经网络。

i、按选择概率p(si)所决定的选中机会,每次从s中随机选中1个染色体并将其复制,共做n次,然后将复制得到的n染色体组成群体s1;

ii、按决定的参加交叉的染色体数c,从s1中随机确定c个染色体,配对进行交叉操作,并用产生的染色体代替原染色体,组成群体s2;

iii、按决定的变异次数m,从s2中随机确定m个染色体,分别进行变异操作,并用产生的新染色体代替原染色体,组成群体s3;

将由s1、s2和s3子集组成的合集映射所得的全新产生的整数0-1神经网络,在样本集上计算适应度值。

a3:选择所述各适应度值中最小适应度的染色体,若该最小适应度小于历史最优值,则将对应的染色体赋值给历史最优值,否则保持历史最优值不变,对变异产生的新的染色体集合基于适应度函数采用轮盘赌方式进行筛选,得到下一代的染色体组,等待迭代。

更具体的,按照适应度函数从小到大排序,选择最小适应度的染色体,如果其适应度比历史最优值sbest还小,则其优于历史最优值sbest,将其赋给历史最优值sbest,否则,保持历史最优值sbest不变,随后对变异产生的新的染色体集合基于适应度函数采用轮盘赌方式进行筛选,得到下一代染色体的染色体组。

a4:判断历史最优值的染色体应用在神经网络聚合模型中时,所有样本对的模型输出与样本输出是否都相符,若是则结束迭代学习,输出该最优的染色体,否则选择下一代的染色体组返回步骤a2。

在一个实施例中,神经网络训练还包括在线运行模式,参看图3和图5,在线运行模式下的神经网络训练包括以下步骤:b1:根据目标电商平台选择对应的神经网络聚合模型的权重系数及结构,生成相应的神经网络聚合模型;b2:输入最小信息元素集合,调用神经网络聚合模型计算目标电商平台的商品页面的类目信息。

在线运行模式即在离线训练模式所得的神经网络聚合模型的基础上,将商品的最小信息元素集合与目标平台的类目信息输入聚合模型,通过计算得到目标跨境电商平台商品页面类目信息。通过该模式,系统可以随时动态的生成目标跨境电商平台商品页面类目信息,与以往依赖人工进行信息整理整合的传统模式相比,可通过计算机自动生成商品页面信息类目内容,大大提高工作效率,降低出错率。

在实际应用中,随着供货商和原材料等不同,有时商品信息需要进行变更,此外,跨境电商平台的页面描述类目会随着跨境电商服务提供商的平台更新而发生变化,人工不能够实时去跟踪这些变化并进行模型和信息的更新,因此,在得到神经网络聚合模型的基础上,通过动态侦测监控商品信息与跨境电商平台样本商品页面类目的变化,对页面类目内容和类目进行动态的优化与调整,如图6所示,其具体流程如下:

(1)监控周期开始,动态获取存储在本地的系统商品最小信息集合与跨境电商平台样本商品页面的类目信息;

(2)对存储在本地的商品最小信息集变化情况进行判断,可以通过比对的方式实现,如果未发生变化,转入步骤(3),如果发生变化,则进行以下处理:

i、将更新的商品最小元素集合重新输入神经网络聚合模型进行计算,得到更新的页面类目信息;

ii、将更新的页面类目信息输出至目标电商平台进行更新;

iii、判断所有平台是否更新完毕,如是,则进入步骤(3),如不是,返回第i步循环执行至该商品在所有电商平台的页面均更新完毕;

(3)对所监控的电商平台样本商品页面的类目信息变化情况进行判断,如果未发生变化,转回步骤(1)进入下一监测周期,如果发生变化,则进行以下处理:

i、获取变化平台的商品页面信息构建新学习样本;

ii、对目标平台神经网络聚合模型进行重新训练;

iii、将待聚合商品的原有最小信息元素集合输入到更新后的神经网络聚合模型进行计算,获得聚合关系变化后的商品页面类目信息,并上传至目标跨境电商平台,转回步骤(1)进入下一监测周期。

本发明还提供一种多平台电子商务信息聚合系统,包括:

平台信息采集模块,用以获取各电商平台关于样本商品的页面类目信息;

信息相似分析整合模块,用以对获取的同一样本商品在不同跨境电商平台页面上的全部类目信息进行相似度分析,基于相似度分析结果解析出样本商品的最小信息元素,合并最小信息元素得到该样本商品的最小信息元素集合,多个样本商品的最小信息元素集构成综合样本集;

聚合模型训练模块,用以针对各电商平台,以样本商品的最小信息元素集合与从一电商平台获取的类目信息作为训练样本对,进行权重系数取值为0或1的神经网络训练,得到各电商平台的神经网络聚合模型;

聚合信息计算模块,用以根据不同电商平台的所述神经网络聚合模型,输入待聚合商品的最小信息元素集合,经模型计算得到对应电商平台商品页面要求的类目信息。

根据本发明的一个实施例,还包括:

聚合模型动态更新模块,用以当商品信息变更时,根据更新的最小信息元素集合重新输入到所述神经网络聚合模型,得到各电商平台更新的类目信息,并上传至对应的电商平台;和/或,用以当所监控的电商平台样本商品页面的类目信息发生变化时(即商品的最小信息元素集与页面类目信息之间的聚合关系发生变化时),进行相似度分析及解析合并得到新的最小信息元素集合,构建目标电商平台的新的样本对,重新训练新的神经网络聚合模型,将待聚合商品的原有的最小信息元素集合输入到更新后的神经网络聚合模型中得到变化后的类目信息,并上传至该目标电商平台。

关于本发明多平台电子商务信息聚合系统的具体内容可以参看前述多平台电子商务信息聚合方法部分的描述,具体不再赘述。

本发明虽然以较佳实施例公开如上,但其并不是用来限定权利要求,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1