数据迁移方法及装置的制造方法_3

文档序号:8339643阅读:来源:国知局
作具体限定。
[0095]其中,对于数据结构,以电子商务平台为例,数据结构包括商品的类目字段、品名字段等,比如一个数据结构包括的数据结构字段有:类目名称、商品名称、商品价格等。
[0096]由于不同的平台数据结构字段可能不相同,因此,为了实现不同数据结构之间数据的平滑迁移,本实施例预先配置有第一平台与第二平台之间商品数据结构字段之间的映射关系,并由此形成第一字段映射关系表,可以参考图2a所示,该第一字段映射关系表中记录了第一平台的数据与第二平台的数据中数据结构字段之间的映射关系,比如,图2a中,第一平台的字段A与第二平台的字段I相对应,等等。
[0097]在获取到第一平台的数据包后,解析模块202通过解析该数据包得到该数据包的数据结构字段,以便匹配模块203根据该数据结构字段查找第一字段映射关系表进行匹配,判断当前第一平台与第二平台的数据结构是否相同或相似,即能否匹配上,若两者能够匹配,则认为第一平台与第二平台的数据结构相同或相似,适合数据迁移,并作为后续进一步匹配判断的依据。
[0098]当在第一字段映射关系表中未找到与第一平台的数据结构字段相对应的第二平台数据结构字段时,则认为匹配失败,系统可以提示用户当前操作无法完成数据迁移,当然也可以采用其他方式来完成数据的迁移。
[0099]当匹配成功后,匹配关联模块204采用预设的匹配关联规则将所述数据包与第二平台进行匹配关联。具体地,本实施例可以采用自动匹配,或者自动匹配加人工匹配的方式来实现第一平台数据包与第二平台的匹配关联,实现不同字段之间商品数据的平滑迁移,以提高数据迁移效率,降低用户操作成本。
[0100]其中,自动匹配可以采用相似度匹配、建立数据模型、用户操作记忆等方法,以智能处理不同平台不同数据结构、不同类目结构和不同属性结构场景下,不同字段之间商品数据的平滑迁移。
[0101]以电子商务平台为例,其中,类目结构与属性结构两者属于上下级关系,类目结构中包括商品类目字段下的各个子类目或属性字段等;
[0102]属性结构包括商品的各个属性信息,比如手机类目下手机的型号等。
[0103]在将第一平台的数据包与第二平台进行匹配关联后,通过转换迁移模块205根据关联结果将数据包转换并迁移至第二平台。
[0104]如图2b所示,由于数据包中可能存在不同类目的商品,因此,作为一种较佳实施方式,可以采用分批处理,比如,可以优先处理商品数量最多的类目,再处理商品数量次多的类目,以此类推,直至数据迁移完毕。
[0105]更为具体地,如图8所示,上述匹配关联模块204可以包括:解析单元2041、匹配单元2042及关联单元2043,其中:
[0106]解析单元2041,用于解析所述数据包,获取所述数据包的类目结构字段;
[0107]匹配单元2042,用于将所述数据包的类目结构字段与预设的第二字段映射关系表进行匹配;
[0108]关联单元2043,用于当匹配成功时,将数据包中匹配的类目结构字段与所述第二平台对应类目结构字段进行关联;当匹配未成功时,采用相似度方法获取所述数据包中类目结构字段与所述第二平台中对应的类目结构字段的相似度,并判断该相似度是否达到第一设定阈值,若是,则将数据包中匹配的类目结构字段与所述第二平台对应类目结构字段进行关联。
[0109]进一步地,所述关联单元2043,还用于当相似度未达到第一设定阈值时,采用预先建立的数学模型获取所述数据包中类目结构字段与所述第二平台中对应的类目结构字段的关联次数;将关联次数最高且关联次数达到设定的第二阈值的两类目结构字段进行关联。
[0110]进一步地,所述关联单元2043,还用于当获取的所述关联次数未达到设定的第二阈值时,采用用户操作记忆的方法向用户展示所述第二平台中最近预定时间用户使用的类目结构字段,供用户选择关联,并将关联记录写入所述数据模型中;和/或展示所述第二平台中当前用户的类目结构字段供用户选择关联,并将关联记录写入所述数据模型中;和/或展示所述第二平台中所有类目结构字段供用户选择关联,并将关联记录写入所述数据模型中。
[0111]进一步地,所述关联单元2043,还用于对关联后的类目结构字段中的属性结构字段进行匹配关联。
[0112]具体地,为了实现不同类目结构字段之间的匹配关联,本实施例还预先配置了第一平台与第二平台之间商品数据类目字段之间的映射关系,并由此形成第二字段映射关系表。
[0113]在实现不同类目结构字段之间的匹配关联时,首先通过解析第一平台的数据包获取该数据包的类目结构字段,然后将获取的数据包的类目结构字段与预设的第二字段映射关系表进行匹配,判断数据包里的商品类目字段是否已经和当前第二平台存在映射关系,若是,则匹配成功,当匹配成功时,将数据包中匹配的类目结构字段与第二平台对应类目结构字段进行关联。
[0114]当匹配未成功时,则采取以下方案将第一平台数据包内的商品类目字段与当前第二平台相对应商品类目字段进行匹配:
[0115]采用相似度匹配方法校验当前第二平台是否有类目结构字段与数据包内类目结构字段相似度达到第二平台所设置阀值(即本实施例所称第一设定阈值),若有,则将数据包中匹配的类目结构字段与第二平台对应类目结构字段进行关联;若没有,则可以采用数据模型或者人工匹配的方式来实现两平台不同类目结构字段之间的匹配关联。
[0116]具体地,在本实施例中,作为一种实现方式,当采用相似度方法获取的数据包中类目结构字段与第二平台中对应的类目结构字段的相似度未达到第一设定阈值时,可以通过预先建立的数据模型来实现两平台不同类目结构字段之间的匹配关联。比如,记录第一平台用户选择数据包内商品类目字段A与第二平台字段B的关联次数,若该关联次数达到第二平台所设置的阀值(即本实施例所称第二设定阈值)且高于商品类目字段A与第二平台其他字段关联的次数,则自动将这两个字段进行关联。由此,基于上述原理预先建立数学模型,后续通过该预先建立的数据模型来实现两平台不同类目结构字段之间的匹配关联。
[0117]当然,若该关联次数未达到第二平台所设置的第二设定阀值时,也可以采用其他方法比如用户操作记忆的方法或者人工匹配方法来实现两平台不同类目结构字段之间的匹配关联。
[0118]具体地,比如可以采用用户操作记忆的方法展示用户最近常用类目供用户选择关联,并将其关联记录自动记录到数据模型中,以便后续可以依据此更新后的数据模型进行两平台不同类目结构字段之间的匹配关联。
[0119]进一步地,比如还可以展示该用户店铺的所经营类目供用户选择,并将其关联记录自动记录到数据模型中,以便后续可以依据此更新后的数据模型进行两平台不同类目结构字段之间的匹配关联。
[0120]更进一步地,比如还可以展示平台所有类目供用户选择,并将其关联记录自动记录到数据模型中,以便后续可以依据此更新后的数据模型进行两平台不同类目结构字段之间的匹配关联。
[0121]此外,还可以结合属性结构字段来实现两平台不同属性结构字段之间的匹配关联。
[0122]其中,不同属性结构字段之间的匹配关联的具体实现方案,可以采用与上述不同类目结构字段之间的匹配关联的方案相似的方案,即可以采用相似度匹配、建立数据模型、用户操作记忆等方法,或者还可以结合人工匹配方法等,在此不再赘述。
[0123]本实施例通过上述方案,在迁移第一平台的数据包时,通过对该数据包进行解析,获取该数据包的数据结构字段,将该数据包的数据结构字段与预设的第一字段映射关系表进行匹配;当匹配成功后,采用预设的匹配关联规则将所述数据包与第二平台进行匹配关联,根据关联结果将数据包转换并迁移至第二平台,由此可以有效的解决由于不同平台数据结构字段不同而导致的无法智能导入数据的问题,而且提高了数据迁移效率,降低了用户操作成本。
[0124]如图9所示,本发明第二实施例提出一种数据迁移装置,在上述第一实施例所示的基础上,还包括:
[0125]模型建立模块199,用于根据用户操作习惯建立所述数据模型。
[0126]配置模块200,用于配置所述第一平台与第二平台之间的第一字段映射关系表和第二字段映射关系表。
[0127]本实施例与上述第一实施例的区别在于,本实施例还包括建立数据模型以及配置相应的字段映射关系表的方案。
[0128]其中,在建立数据模型时,可以基于用户的操作习惯或历史操作记录来建立数据模型,比如,记录第一平台用户选择数据包内商品类目字段A与第二平台字段B的关联次数,若该关联次数达到第二平台所设置的阀值且高于商品类目字段A与第二平台其他字段关联的次数,则自动将这两个字段进行关联。由此,基于上述原理建立数学模型,后续通过该建立的数据模型来实现两平台不同类目结构字段或者不同属性结构字段之间的匹配关联。该数学模型还可以根据后续的不断学习而更新。
[0129]对于字段映射关系表的建立,则可以根据用户选择或者实际经验,分别建立记录第一平台与第二平台之间商品数据结构字段之间映射关系
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1