数据校验方法和装置的制造方法

文档序号:9887622阅读:532来源:国知局
数据校验方法和装置的制造方法
【技术领域】
[0001]本发明涉及数据处理技术领域,特别涉及一种数据校验方法和装置。
【背景技术】
[0002]在一些数据处理系统中需要对用户输入的数据进行校验,以避免因用户输入错误的数据影响后续数据处理。例如,对于大数据应用来说,数据的采集是系统不可缺少的组成部分。例如,在大数据分析系统中,数据的采集位于系统的最前端,也是后续分析和展示的基础。因此,数据的有效性直接关系到后续的分析和处理。
[0003]然而,对于数据采集系统来说,如何确定用户的输入数据或者采集数据是否正确,十分困难。目前大多系统只是对采集数据做一个非常粗范的有效性检查,例如,对数据格式(如只能输入数字或者小数格式),或者对数据取值范围进行限定。但是,对于一些采集指标,比如:经济指标等,由于季节因素或者其他因素等,指标取值波动变化较大。如果对指标的取值范围定义过小,会引起误报,如果取值范围定义过大,又会因范围过大导致无法准确检测到用户输入的错误数据。
[0004]特别是在指标多、需要用户手动输入数据的情况,输入数据的准确性更加难以保证。因此,如何对用户输入的数据进行一个有效性的校验,是一个有待解决的难题。

【发明内容】

[0005]本发明旨在至少在一定程度上解决上述技术问题。
[0006]为此,本发明的第一个目的在于提出一种数据校验方法,能够提高数据校验的精度,提高输入数据的可靠性。
[0007]本发明的第二个目的在于提出一种数据校验装置。
[0008]为达上述目的,根据本发明第一方面实施例提出了一种数据校验方法,包括以下步骤:接收用户输入的数据,并获取所述用户输入的数据的业务类型;根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;根据所述预测算法预测所述业务类型对应的输入区间;判断所述用户输入的数据是否在所述输入区间之中;如果不在所述输入区间之中,则确定所述用户输入的数据异常。
[0009]本发明实施例的数据校验方法,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
[0010]本发明第二方面实施例提出了一种数据校验装置,包括:接收模块,用于接收用户输入的数据,并获取所述用户输入的数据的业务类型;选择模块,用于根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;预测模块,用于根据所述预测算法预测所述业务类型对应的输入区间;判断模块,用于判断所述用户输入的数据是否在所述输入区间之中;确定模块,用于当所述用户输入的数据不在所述输入区间之中时,确定所述用户输入的数据异常。
[0011]本发明实施例的数据校验装置,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
[0012]本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0013]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0014]图1为根据本发明一个实施例的数据校验方法的流程图;
[0015]图2为根据本发明一个实施例中训练预测算法的示意图;
[0016]图3为根据本发明一个具体实施例的数据校验方法的流程图;
[0017]图4为根据本发明另一个实施例的数据校验方法的流程图;
[0018]图5为根据本发明一个实施例的数据校验装置的结构示意图;
[0019]图6为根据本发明另一个实施例的数据校验装置的结构示意图。
【具体实施方式】
[0020]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0021]在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0022]下面参考附图描述根据本发明实施例的数据校验方法和装置。
[0023]图1为根据本发明一个实施例的数据校验方法的流程图。
[0024]如图1所示,根据本发明实施例的数据校验方法,包括:
[0025]SlOl,接收用户输入的数据,并获取用户输入的数据的业务类型。
[0026]数据录入系统可提供输入界面,输入界面中可包括与不同业务对应的输入框。当用户在输入框中输入数据时,可根据输入框对应的业务类型确定用户输入的数据的业务类型。
[0027]S102,根据业务类型选择对应的预测算法,其中,预测算法是根据业务类型的历史输入数据训练得到的。
[0028]具体地,可根据业务类型在预先建立的算法库中查找对应的预测算法。
[0029]其中,算法库中存储了预先分别针对各个业务类型训练的预测算法。因此,可根据用户输入的数据的业务类型从算法库中选择对应的预测算法。
[0030]在本发明的实施例中,还可包括训练上述预测算法的过程。图2为根据本发明一个实施例中训练预测算法的示意图。
[0031]具体地,首先可分别获取各个业务类型对应的历史输入数据。由于各个业务类型对应的历史输入数据具有不同的取值特征,因此,可根据各个业务类型对应的的数据特征选择相应的预测算法。对于一种业务类型,可根据该业务类型对应的历史输入数据分析出该业务类型的输入数据的数据特征,即输入数据的取值随时间的变换规律。例如,随时间变化不大、取值较稳定的特征,或者周期性变化特征,或者季节性变换特征等。
[0032]进而,可根据各个业务类型对应的数据特征,分别选择适合该数据特征的时间序列算法。举例来说,对于输入数据变化不大、取值区间较稳定的业务类型,可选择简单序时平均数法;而对于具有周期性变换或季节性变化特征的业务类型,则可选择季节趋势预测法。
[0033]然后,对于各个业务类型,可从各自的历史输入数据中选择一部分数据作为训练数据,并根据各个业务类型的训练数据分别进行训练,以得到各个业务类型对应的时间序列算法的算法参数。
[0034]最后,对于各个业务类型,从各自的历史输入数据中选择一部分数据作为验证数据,并根据各个业务类型的验证数据验证各自对应的时间序列
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1