数据处理方法、装置、介质以及电子设备与流程

文档序号:19740993发布日期:2020-01-18 05:12阅读:171来源:国知局
数据处理方法、装置、介质以及电子设备与流程

本公开涉及数据处理技术,尤其是一种数据处理方法、数据处理装置、存储介质以及电子设备。



背景技术:

较大标的物(如房产等)的流转,通常会涉及到较为复杂的流转程序。随着社会的发展,需要对较大标的物的流转进行管理。

然而,由于不同地区(如不同城市)对较大标的物的流转程序的规定不尽相同,使一定区域(如同一国家多个省份等)范围内的标的物流转的统一管理,具有一定的难度。如何降低标的物流转的统一管理难度,提高标的物流转数据管理的智能化程度,是一个值得关注的技术问题。



技术实现要素:

为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种数据处理方法、数据处理装置、存储介质以及电子设备。

根据本公开实施例的一个方面,提供一种数据处理方法,包括:获取标的物的流转信息;从所述流转信息中获取数据采集环节所包含的采集信息项;将所述采集信息项提供给数据分类模型,经由所述数据分类模型根据预设的各流转采集环节各自包含的环节特征值,确定所述采集信息项所属的流转采集环节;将所述数据采集环节及其所包含的采集信息项对应的采集内容,作为所述采集信息项所属的流转采集环节及其采集信息。

在本公开一实施方式中,所述将所述采集信息项提供给数据分类模型,包括:根据预设信息词典,确定所述采集信息项对应的流转项名称;将所述采集信息项对应的流转项名称,提供给数据分类模型。

在本公开又一实施方式中,所述经由所述数据分类模型根据预设的各流转采集环节各自包含的环节特征值,确定所述采集信息项所属的流转采集环节,包括:所述数据分类模型对所述采集信息项与所述预设的各流转采集环节各自包含的环节特征值分别进行匹配处理;所述数据分类模型根据匹配处理的结果,确定所述采集信息项所属的流转采集环节。

在本公开再一实施方式中,所述数据分类模型根据匹配处理的结果,确定所述采集信息项所属的流转采集环节,包括:在所述数据分类模型确定所述采集信息项与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,所述数据分类模型将所述多个预设的流转采集环节均作为所述采集信息项所属的流转采集环节;或者,在所述数据分类模型确定所述采集信息项与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,所述数据分类模型根据预设条件,将所述多个预设的流转采集环节中的部分流转采集环节,作为所述采集信息项所属的流转采集环节。

在本公开再一实施方式中,所述方法还包括:根据多个流转样本中的数据采集环节所包含的采集信息项,建立所述数据分类模型。

在本公开再一实施方式中,所述根据多个流转样本中的数据采集环节所包含的采集信息项,建立所述数据分类模型,包括:根据预设信息词典,确定所述多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称;根据所述多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称,确定不同流转样本中的包含相同流转项名称的各数据采集环节;为所述不同流转样本中的包含相同流转项名称的各数据采集环节设置流转采集环节,并根据所述相同流转项名称设置所述流转采集环节的环节特征值,以建立数据分类模型。

在本公开再一实施方式中,所述方法还包括:将多个流转信息所包含的所有采集信息项划分为多个主体类别中;根据所述主体类别所包括的各采集信息项所属的流转采集环节,确定所述主体类别对应的流转采集环节。

根据本公开实施例的另一个方面,提供一种数据处理装置,包括:获取流转信息模块,用于获取标的物的流转信息;获取采集信息项模块,用于从所述获取流转信息模块所获取到的流转信息中获取数据采集环节所包含的采集信息项;确定流转采集环节模块,用于将所述获取采集信息项模块所获得的采集信息项提供给数据分类模型,经由所述数据分类模型根据预设的各流转采集环节各自包含的环节特征值,确定所述采集信息项所属的流转采集环节;转换处理模块,用于将所述数据采集环节及其所包含的采集信息项对应的采集内容,作为所述采集信息项所属的流转采集环节及其采集信息。

在本公开一实施方式中,所述确定流转采集环节模块包括:第一子模块,用于根据预设信息词典,确定所述获取采集信息项模块所获得的采集信息项对应的流转项名称;第二子模块,用于将所述第一子模块获得的采集信息项对应的流转项名称,提供给数据分类模型。

在本公开又一实施方式中,所述数据分类模型进一步用于:对所述采集信息项与所述预设的各流转采集环节各自包含的环节特征值分别进行匹配处理,并根据匹配处理的结果,确定所述采集信息项所属的流转采集环节。

在本公开再一实施方式中,在所述数据分类模型确定所述采集信息项与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,所述数据分类模型将所述多个预设的流转采集环节均作为所述采集信息项所属的流转采集环节;或者,在所述数据分类模型确定所述采集信息项与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,所述数据分类模型根据预设条件,将所述多个预设的流转采集环节中的部分流转采集环节,作为所述采集信息项所属的流转采集环节。

在本公开再一实施方式中,所述装置还包括:模型建立模块,用于根据多个流转样本中的数据采集环节所包含的采集信息项,建立所述数据分类模型。

在本公开再一实施方式中,所述模型建立模块包括:第三子模块,用于根据预设信息词典,确定所述多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称;第四子模块,用于根据所述第三子模块确定出的多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称,确定不同流转样本中的包含相同流转项名称的各数据采集环节;第五子模块,用于为所述不同流转样本中的包含相同流转项名称的各数据采集环节设置流转采集环节,并根据所述相同流转项名称设置所述流转采集环节的环节特征值,以建立数据分类模型。

在本公开再一实施方式中,所述装置还包括:划分主体类别模块,用于将多个流转信息所包含的采集信息项划分为多个主体类别;确定流转采集环节模块,用于根据所述划分主体类别模块划分出的主体类别所包括的各采集信息项所属的流转采集环节,确定所述主体类别对应的流转采集环节。

根据本公开实施例的再一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述数据处理方法。

根据本公开实施例的又一方面,提供了一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述数据处理方法。

基于本公开上述实施例提供的一种数据处理方法和装置,通过利用数据分类模型,可以快捷的确定出标的物的流转信息中的采集信息项所属的流转采集环节,因此,即便是不同地区/不同时间对标的物的流转程序的规定不尽相同,本公开也可以对不同地区/不同时间的流转信息进行有效管理。由此可知,本公开提供的技术方案有利于提高标的物的流转信息的可管理性,从而有利于提高标的物的流转信息的管理效率。

下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。

参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:

图1为本公开的数据采集环节所包含的采集信息项的一实施例的示意图;

图2为本公开的数据采集环节所包含的采集信息项的另一实施例的示意图;

图3为本公开的数据处理方法一个实施例的流程图;

图4为本公开的建立数据分类模型一个实施例的流程图;

图5为本公开的数据处理装置一个实施例的结构示意图;

图6为本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。

应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。

还应理解,在本公开实施例中,“多个”可以指两个或者两个以上,“至少一个”可以指一个、两个或两个以上。

还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。

另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。

还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。

终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

本公开概述

在实现本公开的过程中,发明人发现,较大标的物的流转程序通常会随着地区的变化以及时间的变化而变化。

例如,标的物(如房屋)在城市a的流转程序包括n(假定n为大于2的整数)个数据采集环节,即数据采集环节a1、数据采集环节a2、……以及数据采集环节an;而相同标的物(如房屋)在城市b的流转程序包括m(假定m为大于2的整数,且m不等于n)个数据采集环节,即数据采集环节b1、数据采集环节b2、……、以及数据采集环节bm。另外,数据采集环节a1所包含的采集信息项与数据采集环节b1、b2、……以及bm各自包含的采集信息项可以分别存在差异,数据采集环节a2所包含的采集信息项与数据采集环节b1、b2、……以及bm各自包含的采集信息项可以分别存在差异,……,数据采集环节an所包含的采集信息项与数据采集环节b1、b2、……以及bm各自包含的采集信息项可以分别存在差异。

再例如,为了简化流转程序,标的物(如房屋)在城市a的流转程序所包括n1(假定n1为大于2的整数)个数据采集环节,被变化为n2(假定n2为小于n1的整数)个数据采集环节。变化前的数据采集环节所包含的采集信息项与变化后的数据采集环节所包含的采集信息项存在差异。

在需要对标的物在城市a的流转情况和标的物在城市b的流转情况,进行统一管理的情况下,如果能够获知标的物在城市a的流转信息中的各数据采集环节分别对应标的物在城市b的流转信息中的哪些数据采集环节,并获知标的物在城市a的各数据采集环节中的各采集信息项分别对应标的物在城市b的各数据采集环节中的哪些数据采集环节,则有利于实现对标的物在城市a的流转情况和标的物在城市b的流转情况的统一管理。同样的,在城市数量更多或者地区数量更多或者统一管理周期内标的物的流转程序发生变化等情况下,则会更加显著的有利于实现对标的物的流转情况的统一管理。

示例性概述

本公开提供的数据处理技术,通常应用于对标的物流转的管理应用中。下面对本公开的数据处理技术的应用进行举例说明。

假定标的物(如房屋等)在城市a和城市b中均存在包含有较多环节的流转程序。例如,标的物(如房屋)在城市a的流转程序包括n(假定n为大于2的整数)个数据采集环节,即数据采集环节a1、数据采集环节a2、……、以及数据采集环节an;而标的物(如房屋)在城市b的流转程序包括m(假定m为大于2的整数,且m可以不等于n)个数据采集环节,即数据采集环节b1、数据采集环节b2、……、以及数据采集环节bm。

假定数据采集环节a1包含的采集信息项的数量为xa1,数据采集环节a2所包含的采集信息项的数量为xa2,……,以此类推,数据采集环节an所包含的采集信息项的数量为xan。xa1、xa2、……、以及xan可以不完全相同。数据采集环节a1、数据采集环节a2、……以及数据采集环节an各自包含的采集信息项如图1中的各表项所示。

假定数据采集环节b1包含的采集信息项的数量为xb1,数据采集环节b2所包含的采集信息项的数量为xb2,……,以此类推,数据采集环节bm所包含的采集信息项的数量为xbn。xb1、xb2、……、以及xbm可以不完全相同。数据采集环节b1、数据采集环节b2、……以及数据采集环节bm各自包含的采集信息项如图2中的各表项所示。

由于数据采集环节a1、数据采集环节a2、……、以及数据采集环节an,分别对应数据采集环节b1、数据采集环节b2、……以及数据采集环节bm中的哪些内容并不明确,且数据采集环节a1、数据采集环节a2、……、以及数据采集环节an各自包含的采集信息项,分别对应数据采集环节b1、数据采集环节b2、……及数据采集环节bm各自包含的采集信息项中的哪些内容并不明确,因此,在需要对任一流转采集环节中的任一采集信息项的采集内容进行统计时,往往会存在无法执行统计操作的现象。

本公开提供的数据处理技术,可以确定出数据采集环节a1、数据采集环节a2、……、数据采集环节an、数据采集环节b1、数据采集环节b2、……以及数据采集环节bm各自所属的流转采集环节。另外,本公开提供的数据处理技术还可以将各数据采集环节各自包括的各采集信息项各自对应的采集内容,作为流转采集环节中的相应项的采集信息。这样,可以便捷的实现针对某一个流转采集环节中的某一项内容的统计操作。

示例性方法

图3为本公开的数据处理方法一个实施例的流程示意图。如图3所示,该实施例的方法包括步骤:s300、s301、s302以及s303。下面对各步骤分别进行说明。

s300、获取标的物的流转信息。

本公开中的标的物可以是指动产或者不动产。例如,标的物可以为房屋或者交通工具(如船只或者飞行器等)等。本公开中的标的物的流转可以是指用于确定标的物的权利方(例如,所有方、持有方、占有方或者租用方等)的程序。本公开中的标的物的流转过程通常较为复杂,例如,标的物的流转过程通常包括较多程序节点。

本公开中的标的物的流转信息可以包括:在标的物的流转过程中,在经过每一个程序节点时,所采集到的信息。本公开中的一个程序节点可以认为是流转过程中的一道手续或者一道程序等。本公开中的标的物的流转信息可以是标的物的全部流转过程的流转信息,也可以是标的物的部分流转过程的流转信息。

s301、从上述流转信息中获取数据采集环节所包含的采集信息项。

本公开中的数据采集环节可以认为是标的物的流转过程中的程序节点。由于标的物的流转过程中的每一道程序节点,均需要记录相应的信息,因此,每一道程序节点均需要采集相应的信息,而且,在通常情况下,一个标的物的流转过程中的不同程序节点所需要采集的信息不完全相同。例如,一个标的物的一个流转过程中的任意两个程序节点所需要采集的信息不存在相同内容;再例如,一个标的物的一个流程过程中的任意两个程序节点所需要采集的信息中的部分内容相同,其他部分内容不相同。

本公开中的采集信息项可以认为是采集的信息的项目名称,例如,持有方可以认为是一个采集信息项,而采集到的持有方的具体名称(如张三)是持有方这一采集信息项的采集内容。再例如,持有时间可以认为是另一个采集信息项,而采集到的持有时间的具体时间(如2018.7.1)是持有时间这一采集信息项的采集内容。再例如,持有方式可以认为是再一个采集信息项,而采集到的持有方式的具体方式(如独占)是持有方式这一采集信息项的采集内容。

通常情况下,本公开中的一个数据采集环节通常包含多个采集信息项,且一个数据采集环节所包含的所有采集信息项通常与其他数据采集环节所包含的所有采集信息项不完全相同。

本公开可以从流转信息中获取一个数据采集环节所包含的各采集信息项,也可以一次性的从流转信息中获取多个数据采集环节各自包含的各采集信息项。

s302、将上述采集信息项提供给数据分类模型,经由数据分类模型根据预设的各流转采集环节各自包含的环节特征值,确定采集信息项所属的流转采集环节。

本公开中的数据分类模型是指用于确定输入的采集信息项所属的流转采集环节的模型。也就是说,数据分类模型可以对采集信息项进行分类处理,一个类对应一个流转采集环节。本公开中的数据分类模型,是预先利用多个流转样本建立的。数据分类模型的建立过程可以参见下述实施例中针对图4的描述。

本公开可以将一个数据采集环节所包含的所有采集信息项作为一组输入,提供给数据分类模型。在一次性的从流转信息中获取多个数据采集环节各自包含的各采集信息项的情况下,可以为每一个数据采集环节所包含的所有采集信息项分别形成一组输入,并将多组输入,顺序提供给数据分类模型。

在本公开的数据分类模型中,预先设置有多个流转采集环节,且每一个流转采集环节均预先设置有环节特征值。本公开中的流转采集环节可以认为是标的物的流转过程中的标准程序节点或者规范程序节点等。本公开可以利用建立数据分类模型,来设置标的物的流转所涉及到的流转采集环节。

本公开中的环节特征值用于描述流转采集环节的特征。各流转采集环节各自包含的环节特征值,通常是在数据分类模型的建立过程中设置的。

本公开中的数据分类模型可以通过对流转采集环节所包含的环节特征值与输入的采集信息项的比对分析,确定输入的采集信息项所属的流转采集环节。

s303、将数据采集环节及其所包含的采集信息项对应的采集内容,作为上述采集信息项所属的流转采集环节及其采集信息。

本公开可以建立数据采集环节与上述采集信息项所属的流转采集环节之间的对应关系,并建立数据采集环节所包含的采集信息项的采集内容与上述采集信息项所属的流转采集环节的采集信息之间的对应关系。

本公开通过利用数据分类模型,可以快捷的确定出标的物的流转信息中的采集信息项所属的流转采集环节,因此,不论是不同地区对标的物的流转程序的规定不尽相同,还是同一地区在不同时间对标的物的流转程序的规定不尽相同,本公开均可以对不同地区/不同时间的流转信息进行有效管理。由此可知,本公开提供的技术方案有利于提高标的物的流转信息的可管理性,从而有利于提高标的物的流转信息的管理效率。

在一个可选示例中,本公开可以先将采集信息项进行转换处理(如名称标准化处理等),并将转换处理后的采集信息项提供给数据分类模型。具体的,本公开可以先根据预设信息词典,确定出一数据采集环节所包含的各采集信息项各自对应的流转项名称,然后,将该数据采集环节所包含的各采集信息项各自对应的流转项名称,提供给数据分类模型。

可选的,本公开中的预设信息词典可以是预先根据多个流转样本所包含的各数据采集环节各自包含采集信息项设置的。例如,本公开可以获取多个流转样本中所包含的所有数据采集环节各自包含的所有采集信息项,从而获得多个采集信息项,然后,对获得的所有采集信息项进行同含义分析处理(例如,关键词提取以及关键词匹配处理等),从而可以将具有相同含义的不同采集信息项汇聚在一起,本公开可以为汇聚在一起的具有相同含义的所有采集信息项设置一个流转项名称,并在信息词典中设置该流转项名称与汇聚在一起的所有采集信息项的对应关系,例如,本公开可以将流转项名称作为信息词典中的标准名称,并将汇聚在一起的所有采集信息项作为该标准名称的别名。

可选的,为汇聚在一起的具有相同含义的所有采集信息项设置一个流转项名称的一个例子:从汇聚在一起的具有相同含义的所有采集信息项中选取一个采集信息项,将选取出的采集信息项作为流转项名称。另一个例子,从汇聚在一起的具有相同含义的所有采集信息项中选取部分采集信息项(如两个或者三个采集信息项),对选取出的各采集信息项中的部分内容进行组合,形成一个流转项名称。

本公开通过利用信息词典对采集信息项进行转换处理,并将转换处理获得的流转项名称作为输入信息,提供给数据分类模型,有利于使数据分类模型能够更便捷的确定出采集信息项所属的流转采集环节,从而有利于提高数据处理的效率。

可选的,本公开中的各流转采集环节均预先设置有环节特征值,环节特征值可以包括至少一个关键字(keyword)。每一个关键字可以包括至少一个词或者至少一个字。本公开可以将一个流程采集环节所包含的所有采集信息项,作为该流程采集环节的环节特征值。

在一个可选示例中,本公开中的数据分类模型确定采集信息项所属的流转采集环节的过程的一个例子可以为:数据分类模型对输入的采集信息项与预设的各流转采集环节各自包含的环节特征值分别进行匹配处理;数据分类模型根据匹配处理的结果,确定采集信息项所属的流转采集环节。例如,数据分类模型可以根据数据采集环节所包含的所有采集信息项与一个流转采集环节所包含的环节特征值是否完全匹配或者部分匹配等匹配处理的结果,确定采集信息项所属的流转采集环节。

一个具体的例子,数据分类模型在判断出输入的一个数据采集环节所包含的所有采集信息项与一个流转采集环节所包含的所有环节特征值完全匹配的情况下,可以确定输入的上述采集信息项属于该流转采集环节。例如,假定数据采集环节a包含两个采集信息项,即采集信息项a1和采集信息项a2,如果该数据采集环节a中的采集信息项a1和采集信息项a2与流转采集环节b所包含的所有环节特征值完全匹配,则可以确定该数据采集环节a属于该流转采集环节b,该数据采集环节a所包含的所有采集信息项均属于该流转采集环节b。

另一个具体的例子,数据分类模型在判断出输入的一个数据采集环节所包含的部分采集信息项与多个流转采集环节各自包含的所有环节特征值分别完全匹配(例如,一部分采集信息项与一个流转采集环节包含的所有环节特征值完全匹配,另一部分采集信息项与另一个流转采集环节包含的所有环节特征值完全匹配)的情况下,数据分类模型可以确定输入的采集信息项属于上述多个流转采集环节。例如,该数据采集环节的一部分采集信息项属于一个流转采集环节,另一部分采集信息项属于另一个流转采集环节等。例如,假定数据采集环节a包含三个采集信息项,即采集信息项a1、采集信息项a2以及采集信息项a3,如果该数据采集环节a中的采集信息项a1和采集信息项a2与流转采集环节b所包含的所有环节特征值完全匹配,且该数据采集环节a中的采集信息项a2和采集信息项a3与流转采集环节c所包含的所有环节特征值完全匹配,则可以确定数据采集环节a既属于流转采集环节b,又属于流程采集环节c,数据采集环节a中的采集信息项a1和采集信息项a2属于流转采集环节b,而数据采集环节a中的采集信息项a2和采集信息项a3属于流转采集环节c。

再一个具体的例子,数据分类模型在判断出输入的一个数据采集环节所包含的部分采集信息项与多个流转采集环节所包含的所有环节特征值分别完全匹配(例如,一部分采集信息项与一个流转采集环节包含的所有环节特征值完全匹配,另一部分采集信息项与另一个流转采集环节包含的所有环节特征值完全匹配)的情况下,数据分类模型可以根据预设条件,从多个预设的流转采集环节中选取出部分流转采集环节(如选取出一个流转采集环节),并确定输入的采集信息项属于上述选取出的流转采集环节。其中的预设条件可以根据实际需求设置。例如,假定数据采集环节a包含三个采集信息项,即采集信息项a1、采集信息项a2以及采集信息项a3,如果该数据采集环节a中的采集信息项a1和采集信息项a2与流转采集环节b所包含的所有环节特征值完全匹配,且该数据采集环节a中的采集信息项a2和采集信息项a3与流转采集环节c所包含的所有环节特征值完全匹配,则可以根据预设条件,从流转采集环节b和流转采集环节c中选取出一个流程采集环节,如流转采集环节b,则确定数据采集环节a属于流转采集环节b。

针对输入的一个数据采集环节所包含的部分信息项与多个流转采集环节所包含的所有环节特征值分别完全匹配的情况,本公开中的数据分类模型通过采用相应的处理方式,来确定数据采集环节所包含的采集信息项所属的流转采集环节,有利于提高数据分类模型的数据处理灵活性,从而有利于提高数据处理的可适用范围。

在一个可选示例中,本公开中的根据多个流转样本中的数据采集环节所包含的采集信息项,建立数据分类模型的一个过程可以如图4所示。

图4中,s400、根据预设信息词典,确定多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称。

也就是说,本公开可以对多个流转样本中的多个数据采集环节各自包含的所有采集信息项进行转换处理(如名称标准化处理等),从而可以建立各采集信息项与流转项名称之间的对应关系,即获得各采集信息项的新名称。流转样本可以包括:同样的标的物在多个地区的流转信息样本;流转样本也可以包括:同样的标的物在同一地区不同时间的流转信息样本等。

s401、根据多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称,确定不同流转样本中的包含相同流转项名称的各数据采集环节。

可选的,对于多个流转样本中的任一流转样本(下述称为第一流转样本)中的任一数据采集环节(下述称为第一数据采集环节),本公开可以将该第一数据采集环节所包含的所有采集信息项(如转换后的流转项名称,下述称为第一采集信息项集合)与其他流转样本(下述称为第二流转样本)中的数据采集环节(下述称为第二数据采集环节)所包含的所有采集信息项(下述称为第二采集信息项集合)进行匹配,并根据匹配结果确定第一流转样本与第二流转样本中的包含相同采集信息项的数据采集环节。例如,如果第一流转样本中的第一采集环节的第一采集信息项集合与第二流转样本中的第二采集环节的第二采集信息项集合完全匹配,则认为第一流转样本中的第一数据采集环节与第二流转样本中的第二数据采集环节包含有相同流转项名称。利用上述处理方式可以获得多个流转样本中的包含相同流转项名称的所有数据采集环节。

s402、为不同流转样本中的包含相同流转项名称的各数据采集环节设置流转采集环节,并根据相同流转项名称设置流转采集环节的环节特征值,以建立数据分类模型。

可选的,本公开可以将包含相同流转项名称的各数据采集环节中的其中一个数据采集环节的名称,作为流转采集环节的名称。本公开中的流转采集环节的名称也可以与包含相同流转项名称的各数据采集环节的名称均不相同。本公开可以将各数据采集环节所包含的相同流转项名称作为流转采集环节的环节特征值。本公开也可以对各数据采集环节所包含的相同流转项名称进行处理(如提取关键词处理等),并将处理后获得的信息作为流转采集环节的环节特征值。

本公开采用上述方式,可以利用流转样本自动便捷的建立数据分类模型,避免了利用人工对流转样本进行分析处理的现象,从而有利于提高数据处理的自动化程度。

在一个可选示例中,在减少当事人办理标的物流转的时间等需求中,往往需要确定出哪些流转采集环节可以集中在一起办理。本公开可以将多个流转信息所包含的所有采集信息项划分为多个主体类别,这样,本公开可以根据主体类别所包括的各采集信息项所属的流转采集环节,确定出主体类别对应的流转采集环节。进一步的,本公开可以根据主体类别对应的所有流转采集环节,确定出可以合并的流转采集环节。例如,本公开可以利用上述方法确定出主体类别为银行信息的所有采集信息项(如银行支行名称、银行编号以及银行利率等),然后,通过确定银行支行名称、银行编号以及银行利率等所有采集信息项各自所属的流转采集环节,确定出银行信息这一主体类别所对应的所有流转采集环节,本公开根据确定出的所有流转采集环节,可以为银行设置相应的业务流程,从而有利于使当事人在银行一次性的办理标的物流转所涉及到的银行操作的所有手续,从而有利于提高当事人办理标的物流转的效率。

示例性装置

图5为本公开的数据处理装置一个实施例的结构示意图。该实施例的装置可用于实现本公开上述各方法实施例。如图5所示,该实施例的装置包括:获取流转信息模块500、获取采集信息项模块501、确定流转采集环节模块502以及转换处理模块503。可选的,本公开的装置还可以包括:模型建立模块504、划分主体类别模块505以及确定流转采集环节模块506中的至少一个。

获取流转信息模块500用于获取标的物的流转信息。获取流转信息模块500具体执行的操作可以参见上述方法实施例中针对s300的相关描述,在此不再详细说明。

获取采集信息项模块501用于从获取流转信息模块500所获取到的流转信息中获取数据采集环节所包含的采集信息项。获取采集信息项模块501具体执行的操作可以参见上述方法实施例中针对s301的相关描述,在此不再详细说明。

确定流转采集环节模块502用于将获取采集信息项模块501所获得的采集信息项提供给数据分类模型,经由数据分类模型根据预设的各流转采集环节各自包含的环节特征值,确定采集信息项所属的流转采集环节。

可选的,本公开中的确定流转采集环节模块502可以包括:数据分类模型5021、第一子模块5022和第二子模块5023。其中的第一子模块5022用于根据预设信息词典,确定获取采集信息项模块501所获得的采集信息项对应的流转项名称。其中的第二子模块5023用于将第一子模块5022获得的采集信息项对应的流转项名称,提供给数据分类模型5021。

可选的,数据分类模型5021可以对第二子模块5023输入的采集信息项对应的流转项名称与预设的各流转采集环节各自包含的环节特征值分别进行匹配处理,并根据匹配处理的结果,确定采集信息项所属的流转采集环节。例如,在数据分类模型5021确定第二子模块5023输入的采集信息项对应的流转项名称与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,数据分类模型5021将多个预设的流转采集环节均作为采集信息项所属的流转采集环节。再例如,在数据分类模型5021确定第二子模块5023输入的采集信息项对应的流转项名称与多个预设的流转采集环节所包含的环节特征值均匹配的情况下,数据分类模型5021可以根据预设条件,将多个预设的流转采集环节中的部分流转采集环节,作为采集信息项所属的流转采集环节。

确定流转采集环节模块502以及其包含的子模块具体执行的操作,可以参见上述方法实施例中针对s302的相关描述,在此不再详细说明。

转换处理模块503用于将数据采集环节及其所包含的采集信息项对应的采集内容,作为采集信息项所属的流转采集环节及其采集信息。转换处理模块503具体执行的操作,可以参见上述方法实施例中针对s303的相关描述,在此不再详细说明。

模型建立模块504用于根据多个流转样本中的数据采集环节所包含的采集信息项,建立数据分类模型5021。可选的,该模型建立模块504可以包括:第三子模块5041、第四子模块5042以及第五子模块5043。

第三子模块5041可以用于根据预设信息词典,确定多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称。

第四子模块5042可以用于根据第三子模块5041确定出的多个流转样本中的各数据采集环节分别包含的各采集信息项各自对应的流转项名称,确定不同流转样本中的包含相同流转项名称的各数据采集环节。

第五子模块5043可以用于为第四子模块5042确定出的不同流转样本中的包含相同流转项名称的各数据采集环节设置流转采集环节,并根据上述相同流转项名称设置流转采集环节的环节特征值,以建立数据分类模型。

模型建立模块504以及其包含的子模块具体执行的操作,可以参见上述方法实施例中针对图4的描述,在此不再详细说明。

划分主体类别模块505用于将多个流转信息所包含的采集信息项划分为多个主体类别。

确定流转采集环节模块506,用于根据主体类别所包括的各采集信息项所属的流转采集环节,确定主体类别对应的流转采集环节。本公开中的主体类别对应的所有流转采集环节,可以用于流转采集环节的合并。例如,本公开的装置可以利用划分主体类别模块505确定出主体类别为银行信息的所有采集信息项(如银行支行名称、银行编号以及银行利率等),然后,利用确定流转采集环节模块506确定银行支行名称、银行编号以及银行利率等所有采集信息项各自所属的流转采集环节,从而本公开的装置可以确定出银行信息这一主体类别所对应的所有流转采集环节,本公开的装置根据确定出的所有流转采集环节,可以为银行设置相应的业务流程,从而有利于使当事人在银行一次性的办理标的物流转所涉及到的银行操作的所有手续,有利于提高当事人办理标的物流转的效率。

示例性电子设备

下面参考图6来描述根据本公开实施例的电子设备。图6示出了根据本公开实施例的电子设备的框图。如图6所示,电子设备61包括一个或多个处理器611和存储器612。

处理器611可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备61中的其他组件以执行期望的功能。

存储器612可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器,例如,可以包括:随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器,例如,可以包括:只读存储器(rom)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器611可以运行所述程序指令,以实现上文所述的本公开的各个实施例的数据处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中,电子设备61还可以包括:输入装置613以及输出装置614等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备613还可以包括例如键盘、鼠标等等。该输出装置614可以向外部输出各种信息。该输出设备614可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图6中仅示出了该电子设备61中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备61还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的数据处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的数据处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1