数据生成方法和装置的制造方法

文档序号:10724953阅读:460来源:国知局
数据生成方法和装置的制造方法
【专利摘要】本发明公开了一种数据生成方法,所述数据生成方法包括以下步骤:根据预置关键词在数据库中查找到对应的数据;将查找到的数据按预置关键词划分为对应的序列;根据预置关键词对应的数据规则生成所述序列中空缺数据。本发明还公开了一种数据生成装置。本发明能够补齐数据中空缺数据。
【专利说明】
数据生成方法和装置
技术领域
[0001 ]本发明涉及数据处理技术领域,尤其涉及一种数据生成方法和装置。
【背景技术】
[0002]数据的自动生成在数据查漏、数据修复和软件测试等领域有着广泛的应用。常见的实际数据其表示往往是同义而不同形式的。比如,“I层I号”和“I楼2号”实际上是同一个类型的表达,但分别用了带“层”和“楼”的形式来表达。同时在实际应用时用户可能在数据库记录数据时将相同属性的数据记录在其他属性中。这就让自动化数据生成前,对现有数据的规律难于捕捉。

【发明内容】

[0003]本发明的主要目的在于提出一种数据生成方法和装置,旨在实现自动补全空缺数据。
[0004]为实现上述目的,本发明提供的一种数据生成方法,所述数据生成方法包括以下步骤:
[0005]根据预置关键词在数据库中查找到对应的数据;
[0006]将查找到的数据按预置关键词划分为对应的序列;
[0007]根据预置关键词对应的数据规则生成所述序列中空缺数据。
[0008]可选地,所述根据预置关键词在数据库中查找到对应的数据的步骤之前还包括:
[0009]建立预置关键字和序列的对应关系;
[0010]将查找到的数据按预置关键词划分为对应的序列的步骤包括:
[0011]根据预置关键字和序列的对应关系将查找到的数据划分为对应的序列。
[0012]可选地,所述根据预置关键词对应的数据规则生成所述序列中空缺数据的步骤包括:
[0013]识别所述序列中各个数据的含义,获得识别结果;
[0014]根据所述识别结果获得对应的数据规则;
[0015]根据所述数据规则生成所述序列中空缺数据。
[0016]可选地,根据所述识别结果获得对应的数据规则的步骤还包括:
[0017]根据所述识别结果将每个序列拆分为至少一个组;
[0018]分别计算每个组的阈值;
[0019]获得每个序列中各组的阈值的交集,作为数据规则;
[0020]根据所述数据规则生成所述序列中空缺数据的步骤包括:
[0021]根据每个序列中各组的阈值的交集获得该序列的补集;
[0022]将所述补集作为空缺数据。
[0023]可选地,所述方法还包括:
[0024]将同一序列的数据中含义相近关键词替换为同一关键词。
[0025]此外,为实现上述目的,本发明还提供一种数据生成装置,所述数据生成装置包括:
[0026]查找模块,用于根据预置关键词在数据库中查找到对应的数据;
[0027]划分模块,用于将查找到的数据按预置关键词划分为对应的序列;
[0028]生成模块,用于根据预置关键词对应的数据规则生成所述序列中空缺数据。
[0029]可选地,所述数据生成装置还包括:
[0030]建立模块,用于建立预置关键字和序列的对应关系;
[0031]所述划分模块还用于根据预置关键字和序列的对应关系将查找到的数据划分为对应的序列。
[0032]可选地,所述生成模块包括:
[0033]识别单元,用于识别所述序列中各个数据的含义,获得识别结果;
[0034]获得单元,用于根据所述识别结果获得对应的数据规则;
[0035]生成单元,用于根据所述数据规则生成所述序列中空缺数据。
[0036]可选地,所述获得单元包括:
[0037]拆分子单元,用于根据所述识别结果将每个序列拆分为至少一个组;
[0038]计算子单元,用于分别计算每个组的阈值;
[0039]获得子单元,用于获得每个序列中各组的阈值的交集,作为数据规则;
[0040]所述生成单元还用于根据每个序列中各组的阈值的交集获得该序列的补集;将所述补集作为空缺数据。
[0041]可选地,所述数据生成装置还包括:
[0042]替换模块,用于将同一序列的数据中含义相近关键词替换为同一关键词。
[0043]本发明通过根据预置关键词在数据库中查找到对应的数据;将查找到的数据按预置关键词划分为对应的序列;根据预置关键词对应的数据规则生成所述序列中空缺数据。通过上述方式,本发明根据关键词在数控库中查找对应的数据,从而可以避免用户将在数据库记录数据时将相同属性的数据记录在其他属性中,同时还根据查找到的数据生成序列,根据关键词对应的数据规则补齐序列中的空缺数据。
【附图说明】
[0044]图1为本发明数据生成方法第一实施例的流程示意图;
[0045]图2为本发明实施例中根据预置关键词对应的数据规则生成所述序列中空缺数据的一种流程示意图;
[0046]图3为本发明实施例中根据所述识别结果获得对应的数据规则的一种流程示意图
[0047]图4为本发明数据生成方法第二实施例的流程示意图;
[0048]图5为本发明数据生成装置第一实施例的流程示意图;
[0049]图6为本发明实施例中生成模块的细化功能模块示意图;
[0050]图7为本发明实施例中获得单元的细化功能模块示意图;
[0051 ]图8为本发明数据生成装置第二实施例的流程示意图。
[0052]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0053]应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0054]本发明提供一种数据生成方法。
[0055]参照图1,图1为本发明数据生成方法第一实施例的流程示意图。
[0056]在本实施例中,该数据生成方法包括:
[0057]步骤S10,根据预置关键词在数据库中查找到对应的数据;
[0058]一般用户在数据库中存储信息时,会给数据库中相同类型的数据建立多个列,每个列都会建立对应不同的属性,即相同属性的内容会在同一列,比如房屋编号通常为同一列。同时数据库中每列分别定义其类型,比如数值类型、字符类型、指针类型和空类型等,数据库中属性相同的列通常有多个。从而使得属性相同的列至少为一个,如果按照属性进行划分,则按照属性划分的列中可能存在形式不同或者表示的含义完全不相同的内容,比如查找属性为文本类型的列,可能会查到名称、备注等等,因此可能导致查找结果不准确。
[0059]本实施例中根据关键词,具体地,本实施例事先在数据库中建立预置关键词和序列的对应关系。在数据库中存储有多个关键词,相近的关键词对应为同一序列。比如楼、层对应同一序列。具体实施中为提高划分序列的正确性,还可以在查找到对应数据后检测查找到的数据中是否包含对应形式的内容,从而避免查到的内容为不需要的内容。
[0060]根据预置的关键词在数据库中进行查询,查找到包括预置关键词对应的数据,进一步地,还可以根据判断查找到的数据中是否包含对应形式的内容,从而提高查找的数据的正确性。
[0061]步骤S20,将查找到的数据按预置关键词划分为对应的序列;
[0062]根据步骤SlO查找到的数据,按照实现预置的预置关键词和序列的对应关系,将查找到的数据划分为对应的序列。举例来说,假设查找到数据库中存在数据包括:I楼2号、2楼I号和3楼3号,则将些数据划分为同一序列。
[0063]步骤S30,根据预置关键词对应的数据规则生成所述序列中空缺数据。
[0064]根据步骤S20中划分的同一序列,根据每个序列中对应的关键词所对应的数据规贝1J,对该序列进行补空,生成对应的空缺数据。比如同一个数据中包括的多个属性中,用户可能在其他的属性列填写了另一个属性的数据,使得另一属性的数据则为空,具体地,在备注信息列写入了地址信息或者楼层信息,使得地址信息栏为空,则将备注信息中的地址信息或者楼层信息填写到地址信息栏。
[0065]本发明通过根据预置关键词在数据库中查找到对应的数据;将查找到的数据按预置关键词划分为对应的序列;根据预置关键词对应的数据规则生成所述序列中空缺数据。通过上述方式,本发明根据关键词在数控库中查找对应的数据,从而可以避免用户将在数据库记录数据时将相同属性的数据记录在其他属性中,同时还根据查找到的数据生成序列,根据关键词对应的数据规则补齐序列中的空缺数据。
[0066]参照图2,图2为本发明实施例中根据预置关键词对应的数据规则生成所述序列中空缺数据的一种流程示意图。
[0067]基于本发明数据生成方法第一实施例,步骤S30可以包括:
[0068]步骤S31,识别所述序列中各个数据的含义,获得识别结果;
[0069]步骤S32,根据所述识别结果获得对应的数据规则;
[0070]步骤S33,根据所述数据规则生成所述序列中空缺数据。
[0071]本实施例中为提高补充数据的正确性,不同的序列中关键词不同所对应的数据规则也会有所区别,可以事先根据不同的序列设置不同的数据规则,然后可以在划分不同的序列时,可以根据所述数据的属性和所述数据的内容识别划分的各个序列中各个数据的含义,获得对应的识别结果,然后根据对应的识别结果根据预先设置的数据规则获得对应的数据规则,进而根据所述数据规则生成对应序列中的空缺数据。比如在数据库中的序号列,其数据一般都是从递增整数,即序号列为1,2,3....进行排序,此时该序列的规则为递增的整数序列,根据该规则生成对应的空缺数据。
[0072]参照图3,图3为本发明实施例中根据所述识别结果获得对应的数据规则的一种流程不意图。
[0073]基于本发明数据生成方法第二实施例,步骤S32可以包括:
[0074]步骤S321,根据所述识别结果将每个序列拆分为至少一个组;
[0075]步骤S322,分别计算每个组的阈值;
[0076]步骤S323,获得每个序列中各组的阈值的交集,作为数据规则;
[0077]由于查询到的数据中可能存在含义不相同的数据,比如有些地名可能表示名字,从而需要采取的数据规则不同。为提高空缺数据的正确性,本实施例中根据识别结果将每个序列中数据拆分为至少一个组,然后分别计算获得的每个组的阈值,再获得每个序列中各组的阈值的交集,作为数据规则,比如查找到的数据包括:1A3,2A1,3B3,识别出其分别代表的含义为表示楼层和房间编号,则其各组的数值变化遵循自然数递交规则,字母按照A-Z增加,将其划分为3个组,各组的阈值分别为[I,3 ]、[ A,B ]和[I,3 ],交集则为{I Al,IA2,I A3,IBl,1B2,1B3,2A1,2A2,2A3,2B1,2B2,2B3,3A1,3A2,3A3,3B1,3B2,3B3}。
[0078]步骤S33可以包括:
[0079]步骤S331,根据每个序列中各组的阈值的交集获得该序列的补集;
[0080]步骤S332,将所述补集作为空缺数据。
[0081]然后在所查询到的数据中确定其中的空缺数据,根据上述获得的每个序列中各组的阈值的交集,获得该序列的补集,将补集作为空缺数据,写入对应的空缺位置,从而对数据进修复。
[0082]参照图4,图4为本发明数据生成方法第三实施例的流程示意图。
[0083]基于本发明数据生成方法第一实施例,所述数据生成方法可以包括:
[0084]步骤S40,将同一序列的数据中含义相近关键词替换为同一关键词。
[0085]为了统一数据,方便用户查看,本实施例中还将修复完成后的数据中各个序列的数据中相近的关键词替换为同一关键词,比如将楼、层同一替换为楼。
[0086]本发明进一步提供一种数据生成装置。
[0087]参照图5,图5为本发明数据生成装置第一实施例的流程示意图。
[0088]在本实施例中,该数据生成装置包括:
[0089]查找模块10,用于根据预置关键词在数据库中查找到对应的数据;
[0090]—般用户在数据库中存储信息时,会给数据库中相同类型的数据建立多个列,每个列都会建立对应不同的属性,即相同属性的内容会在同一列,比如房屋编号通常为同一列。同时数据库中每列分别定义其类型,比如数值类型、字符类型、指针类型和空类型等,数据库中属性相同的列通常有多个。从而使得属性相同的列至少为一个,如果按照属性进行划分,则按照属性划分的列中可能存在形式不同或者表示的含义完全不相同的内容,比如查找属性为文本类型的列,可能会查到名称、备注等等,因此可能导致查找结果不准确。
[0091]本实施例中还可以包括建立模块(图未示),用于建立预置关键字和序列的对应关系;
[0092]本实施例中根据关键词,具体地,本实施例事先在数据库中建立预置关键词和序列的对应关系。在数据库中存储有多个关键词,相近的关键词对应为同一序列。比如楼、层对应同一序列。具体实施中为提高划分序列的正确性,还可以在查找到对应数据后检测查找到的数据中是否包含对应形式的内容,从而避免查到的内容为不需要的内容。
[0093]根据预置的关键词在数据库中进行查询,查找到包括预置关键词对应的数据,进一步地,还可以根据判断查找到的数据中是否包含对应形式的内容,从而提高查找的数据的正确性。
[0094]划分模块20,用于将查找到的数据按预置关键词划分为对应的序列;
[0095]所述划分模块20还用于根据预置关键字和序列的对应关系将查找到的数据划分为对应的序列。
[0096]根据查找到的数据,按照实现预置的预置关键词和序列的对应关系,将查找到的数据划分为对应的序列。举例来说,假设查找到数据库中存在数据包括:I楼2号、2楼I号和3楼3号,则将些数据划分为同一序列。
[0097]生成模块30,用于根据预置关键词对应的数据规则生成所述序列中空缺数据。
[0098]根据划分模块20划分的同一序列,根据每个序列中对应的关键词所对应的数据规贝1J,对该序列进行补空,生成对应的空缺数据。比如同一个数据中包括的多个属性中,用户可能在其他的属性列填写了另一个属性的数据,使得另一属性的数据则为空,具体地,在备注信息列写入了地址信息或者楼层信息,使得地址信息栏为空,则将备注信息中的地址信息或者楼层信息填写到地址信息栏。
[0099]本发明通过根据预置关键词在数据库中查找到对应的数据;将查找到的数据按预置关键词划分为对应的序列;根据预置关键词对应的数据规则生成所述序列中空缺数据。通过上述方式,本发明根据关键词在数控库中查找对应的数据,从而可以避免用户将在数据库记录数据时将相同属性的数据记录在其他属性中,同时还根据查找到的数据生成序列,根据关键词对应的数据规则补齐序列中的空缺数据。
[0100]参照图6,图6为本发明实施例中生成模块的细化功能模块示意图
[0101]基于本发明数据生成装置第一实施例,生成模块30可以包括:
[0102]识别单元31,用于识别所述序列中各个数据的含义,获得识别结果;
[0103]获得单元32,用于根据所述识别结果获得对应的数据规则;
[0104]生成单元33,用于根据所述数据规则生成所述序列中空缺数据。
[0105]本实施例中为提高补充数据的正确性,不同的序列中关键词不同所对应的数据规则也会有所区别,可以事先根据不同的序列设置不同的数据规则,然后可以在划分不同的序列时,可以根据所述数据的属性和所述数据的内容识别划分的各个序列中各个数据的含义,获得对应的识别结果,然后根据对应的识别结果根据预先设置的数据规则获得对应的数据规则,进而根据所述数据规则生成对应序列中的空缺数据。比如在数据库中的序号列,其数据一般都是从递增整数,即序号列为1,2,3....进行排序,此时该序列的规则为递增的整数序列,根据该规则生成对应的空缺数据。
[0106]参照图7,图7为本发明实施例中获得单元的细化功能模块示意图
[0107]基于本发明数据生成装置上述实施例,获得单元32包括:
[0108]拆分子单元321,用于根据所述识别结果将每个序列拆分为至少一个组;
[0109]计算子单元322,用于分别计算每个组的阈值;
[0110]获得子单元323,用于获得每个序列中各组的阈值的交集,作为数据规则;
[0111]所述生成单元33还用于根据每个序列中各组的阈值的交集获得该序列的补集;将所述补集作为空缺数据。
[0112]由于查询到的数据中可能存在含义不相同的数据,比如有些地名可能表示名字,从而需要采取的数据规则不同。为提高空缺数据的正确性,本实施例中根据识别结果将每个序列中数据拆分为至少一个组,然后分别计算获得的每个组的阈值,再获得每个序列中各组的阈值的交集,作为数据规则,比如查找到的数据包括:1A3,2A1,3B3,识别出其分别代表的含义为表示楼层和房间编号,则其各组的数值变化遵循自然数递交规则,字母按照A-Z增加,将其划分为3个组,各组的阈值分别为[I,3 ]、[ A,B ]和[I,3 ],交集则为{I Al,IA2,I A3,IBl,1B2,1B3,2A1,2A2,2A3,2B1,2B2,2B3,3A1,3A2,3A3,3B1,3B2,3B3}。
[0113]然后在所查询到的数据中确定其中的空缺数据,根据上述获得的每个序列中各组的阈值的交集,获得该序列的补集,将补集作为空缺数据,写入对应的空缺位置,从而对数据进修复。
[0114]参照图8,图8为本发明数据生成装置第二实施例的流程示意图
[0115]基于本发明数据生成装置第一实施例,所述数据生成装置可以包括:
[0116]替换模块40,用于将同一序列的数据中含义相近关键词替换为同一关键词。
[0117]为了统一数据,方便用户查看,本实施例中还将修复完成后的数据中各个序列的数据中相近的关键词替换为同一关键词,比如将楼、层同一替换为楼。
[0118]以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
【主权项】
1.一种数据生成方法,其特征在于,所述数据生成方法包括以下步骤: 根据预置关键词在数据库中查找到对应的数据; 将查找到的数据按预置关键词划分为对应的序列; 根据预置关键词对应的数据规则生成所述序列中空缺数据。2.如权利要求1所述的数据生成方法,其特征在于,所述根据预置关键词在数据库中查找到对应的数据的步骤之前还包括: 建立预置关键字和序列的对应关系; 将查找到的数据按预置关键词划分为对应的序列的步骤包括: 根据预置关键字和序列的对应关系将查找到的数据划分为对应的序列。3.如权利要求1所述的数据生成方法,其特征在于,所述根据预置关键词对应的数据规则生成所述序列中空缺数据的步骤包括: 识别所述序列中各个数据的含义,获得识别结果; 根据所述识别结果获得对应的数据规则; 根据所述数据规则生成所述序列中空缺数据。4.如权利要求3所述的数据生成方法,其特征在于,所述根据所述识别结果获得对应的数据规则的步骤还包括: 根据所述识别结果将每个序列拆分为至少一个组; 分别计算每个组的阈值; 获得每个序列中各组的阈值的交集,作为数据规则; 根据所述数据规则生成所述序列中空缺数据的步骤包括: 根据每个序列中各组的阈值的交集获得该序列的补集; 将所述补集作为空缺数据。5.如权利要求1所述的数据生成方法,其特征在于,所述方法还包括: 将同一序列的数据中含义相近关键词替换为同一关键词。6.一种数据生成装置,其特征在于,所述数据生成装置包括: 查找模块,用于根据预置关键词在数据库中查找到对应的数据; 划分模块,用于将查找到的数据按预置关键词划分为对应的序列; 生成模块,用于根据预置关键词对应的数据规则生成所述序列中空缺数据。7.如权利要求6所述的数据生成装置,其特征在于,所述数据生成装置还包括: 建立模块,用于建立预置关键字和序列的对应关系; 所述划分模块还用于根据预置关键字和序列的对应关系将查找到的数据划分为对应的序列。8.如权利要求6所述的数据生成装置,其特征在于,所述生成模块包括: 识别单元,用于识别所述序列中各个数据的含义,获得识别结果; 获得单元,用于根据所述识别结果获得对应的数据规则; 生成单元,用于根据所述数据规则生成所述序列中空缺数据。9.如权利要求8所述的数据生成装置,其特征在于,所述获得单元包括: 拆分子单元,用于根据所述识别结果将每个序列拆分为至少一个组; 计算子单元,用于分别计算每个组的阈值; 获得子单元,用于获得每个序列中各组的阈值的交集,作为数据规则; 所述生成单元还用于根据每个序列中各组的阈值的交集获得该序列的补集;将所述补集作为空缺数据。10.如权利要求6所述的数据生成装置,其特征在于,所述数据生成装置还包括: 替换模块,用于将同一序列的数据中含义相近关键词替换为同一关键词。
【文档编号】G06F17/30GK106095825SQ201610380315
【公开日】2016年11月9日
【申请日】2016年5月31日
【发明人】张锐
【申请人】深圳市永兴元科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1