一种基于数据深度学习的数据完善方法以及系统与流程

文档序号:37260064发布日期:2024-03-12 20:38阅读:12来源:国知局
一种基于数据深度学习的数据完善方法以及系统与流程

本技术涉及数据处理技术的领域,尤其是涉及一种基于数据深度学习的数据完善方法以及系统。


背景技术:

1、数据处理是系统工程和自动控制的基本环节,数据处理的基本目的是从大量、杂乱无章和难以理解的数据中,抽取并推导出对于特定的人们来说是有价值和有意义的数据。

2、相关技术中,金融纠纷多元化解机制利用ocr采集和结构化数据抽取技术,实现立案全过程的信息自动采集、多重校验和自动录入等功能,在案件审核过程中,人员需要将新出现的数据录入案件信息中。

3、针对上述中的相关技术,发明人认为:在案件审核过程中,不断有新的数据产生,人员需要查询案件信息,将新数据与案件信息中的数据对照后,将新数据标准化后录入案件信息中,从而完善案件信息,导致数据的完善过程不方便,还有改进的空间。


技术实现思路

1、为了使数据完善过程更加方便,本技术提供一种基于数据深度学习的数据完善方法以及系统。

2、第一方面,本技术提供一种基于数据深度学习的数据完善方法,采用如下的技术方案:

3、一种基于数据深度学习的数据完善方法,包括

4、获取当前新增数据检测信息,新增数据检测信息携带人员档案信息;

5、根据新增数据检测信息和人员档案信息确定案件类型信息,并根据新增数据检测信息确定当前流程信息;

6、判断流程信息所对应的流程是否与预设的基准流程信息所对应的流程一致;

7、若流程信息所对应的流程与基准流程信息所对应的流程不一致,则继续获取新增数据检测信息;

8、若流程信息所对应的流程与基准流程信息所对应的流程一致,则获取当前关键词检测信息;

9、判断关键词检测信息所对应的关键词是否与预设的基准关键词一致;

10、若关键词检测信息所对应的关键词与基准关键词不一致,则继续获取新增数据检测信息;

11、若关键词检测信息所对应的关键词与基准关键词一致,则获取当前数据类型检测信息,根据数据类型检测信息所对应的数据类型以处理新增数据检测信息所对应的新增数据,生成录入数据信息;

12、将录入数据信息作为辅助理解数据和新增数据检测信息共同录入预设的案件数据库中。

13、通过采用上述技术方案,根据人员档案信息、案件类型信息、流程信息以及关键词检测信息将新增数据检测信息匹配至对应人员的对应案件,从而提高数据录入的方便性和准确性。根据数据类型对新增数据进行处理,使新增数据与案件的相关性高,且使新增数据检测信息更加简洁,使录入数据信息作为辅助理解数据帮助人员理解新增数据检测信息,进而使人员方便理解新增数据检测信息。

14、可选的,数据类型包括文本类,根据数据类型检测信息所对应的数据类型以处理新增数据检测信息所对应的新增数据,生成录入数据信息的方法包括:

15、根据数据类型检测信息确定所对应的数据类型为文本类;

16、根据预设的形式数据库中所存储的形式更正信息和新增数据检测信息进行分析以匹配出与新增数据检测信息所对应的形式更正信息,以形式更正信息对新增数据检测信息进行更正,并发出审核提示;

17、获取当前质检结果检测信息;

18、判断质检结果检测信息所对应的质检结果是否为通过质检;

19、若质检结果检测信息所对应的质检结果为通过质检,则以形式更正信息对新增数据检测信息进行更正;

20、若质检结果检测信息所对应的质检结果不为通过质检,则保留新增数据检测信息;

21、获取当前专业名词检测信息;

22、判断专业名词检测信息所对应的专业名词是否与预设的基准专业名词一致;

23、若专业名词检测信息所对应的专业名词与基准专业名词不一致,则以基准专业名词替换专业名词检测信息所对应的专业名词,并生成专业文本信息;

24、若专业名词检测信息所对应的专业名词与基准专业名词一致,则不进行替换,并生成专业文本信息;

25、根据预设的精简数据库中所存储的精简文本信息和专业文本信息进行分析以匹配出与专业文本信息所对应的精简文本信息,并将精简文本信息录入案件数据库中。

26、通过采用上述技术方案,对文本类的新增数据检测信息,通过对文本进行质检和专业名词替换,使新增数据检测信息高度凝练简洁,进而提高录入数据的专业性。通过对格式符合的新增数据检测信息进行文本精简,从而去除繁杂内容,使文本更加精炼,进而提高数据录入的速度,提高人员理解新增数据检测信息的方便性。

27、可选的,数据类型还包括语音类,根据数据类型检测信息所对应的数据类型处理新增数据检测信息所对应的新增数据,生成录入数据信息的方法还包括:

28、根据数据类型检测信息确定所对应的数据类型为语音类;

29、获取当前音色检测信息;

30、根据预设的音色数据库中所存储的音色检测信息和所属人信息进行分析以匹配出与音色检测信息所对应的所属人信息;

31、获取当前方言检测信息;

32、判断方言检测信息所对应的方言是否与预设的基准方言信息所对应的方言一致;

33、若方言检测信息所对应的方言与基准方言信息所对应的方言一致,则根据预设的普通话数据库中所存储的方言检测信息和普通话信息进行分析以匹配出与方言检测信息所对应的普通话信息;

34、若方言检测信息所对应的方言与基准方言信息所对应的方言不一致,则生成普通话信息;

35、根据预设的文本数据库中所存储的普通话信息和语音文本信息进行分析以匹配出与普通话信息所对应的语音文本信息,并将所属人信息所对应的所属人标注在语音文本信息所对应的语音文本上以生成精准语音文本信息,将精准语音文本信息与普通话语音信息进行匹配并录入案件数据库中。

36、通过采用上述技术方案,对于语音类的新增数据检测信息进行方言检测,并将方言转换为普通话,从而使语音更加方便理解。对新增数据检测信息进行音色检测,从而判断出语音的所属人,将转换为普通话的语音进行文本识别,并将所属人标注在识别的文本中生成精准语音文本信息,将精准语音文本信息和普通话语音信息匹配后录入案件数据库中,提高后续人员理解案件数据的准确性。

37、可选的,根据数据类型检测信息确定所对应的数据类型为语音类,则对新增数据检测信息的处理方法还包括:

38、获取当前语音存储检测信息和当前文本存储检测信息;

39、判断语音存储检测信息所对应的存储空间值是否大于文本存储检测信息所对应的存储空间值;

40、若语音存储检测信息所对应的存储空间值大于文本存储检测信息所对应的存储空间值,则将精准语音文本信息录入案件数据库中;

41、若语音存储检测信息所对应的存储空间值不大于文本存储检测信息所对应的存储空间值,则将普通话语音信息录入案件数据库中。

42、通过采用上述技术方案,对比语音的存储空间值和语音转化的文本的存储空间值,选择存储空间值较小的数据类型进行存储,进而提高处理后的新增数据检测信息的录入速度。

43、可选的,数据类型还包括图片类,根据数据类型检测信息所对应的数据类型处理新增数据检测信息所对应的新增数据,生成录入数据信息的方法还包括:

44、根据数据类型检测信息确定所对应的数据类型为图片类;

45、获取当前图片质量检测信息;

46、判断图片质量检测信息所对应的图片质量是否与预设的基准图片质量信息所对应的图片质量一致;

47、若图片质量检测信息所对应的图片质量与基准图片质量信息所对应的图片质量一致,则生成精准图片信息;

48、若图片质量检测信息所对应的图片质量与基准图片质量信息所对应的图片质量不一致,则对图片质量进行修正,并生成精准图片信息;

49、框选出精准图片信息所对应的图片中与案件相关的特征部位信息,并获取当前特征部位比例检测信息;

50、判断特征部位比例检测信息所对应的比例值是否大于预设的基准比例信息所对的比例值;

51、若特征部位比例检测信息所对应的比例值大于基准比例信息所对的比例值,则将精准图片信息录入案件数据库中;

52、若特征部位比例检测信息所对应的比例值不大于基准比例信息所对的比例值,则对精准图片信息所对应的图片进行裁剪,直至特征部位比例检测信息所对应的比例值大于基准比例信息所对的比例值,并将裁剪后的精准图片信息录入案件数据库中。

53、通过采用上述技术方案,对于图片类的新增数据检测信息进行修正,提高图片的质量,在人员后续查询案件数据时更加方便理解案件。通过框选出图片中的特征部位,并使特征部位在图片中占据的比例不小于录入要求的比例,从而使录入的图片与案件更加相关,进而提高录入的数据与案件的相关性。

54、可选的,若特征部位比例检测信息所对应的比例值大于基准比例信息所对的比例值,将精准图片信息录入案件数据库中的方法包括:

55、获取当前图片颜色检测信息和当前特征部位颜色检测信息;

56、计算图片颜色检测信息所对应的rgb数值与特征部位颜色检测信息所对应的rgb数值的差,并将差定义为撞色系数信息;

57、判断撞色系数信息所对应的撞色系数值是否处于预设的基准撞色系数区间内;

58、若撞色系数信息所对应的撞色系数值未处于基准撞色系数区间内,则将精准图像信息录入案件数据库中;

59、若撞色系数信息所对应的撞色系数值处于基准撞色系数区间内,则根据预设的颜色数据库中所存储的图片颜色检测信息和显色信息进行分析以匹配出与图片颜色检测信息所对应显色信息,并将显色信息所对应的颜色修正至特征部位信息中以生成显色图片信息,并将显色图片信息录入案件数据库中。

60、通过采用上述技术方案,将图片的颜色与特征部位的颜色进行对比,特征部位的颜色未与图片颜色撞色,则直接录入,若特征部位颜色与图片颜色撞色,则改变特征部位的颜色,使特征部位显色,从而使特征部位在图片中更加明显,进而使人员后续理解案件数据时更加方便。

61、可选的,若特征部位比例检测信息所对应的比例值大于基准比例信息所对的比例值,将精准图片信息录入案件数据库中的方法还包括:

62、获取当前图片存储检测信息;

63、判断图片存储检测信息所对应的存储空间值是否大于预设的基准图片存储信息所对应的存储空间值;

64、若图片存储检测信息所对应的存储空间值不大于基准图片存储信息所对应的存储空间值,则将精准图片信息录入案件数据库中;

65、若图片存储检测信息所对应的存储空间值大于基准图片存储信息所对应的存储空间值,则将精准图片信息所对应的图像进行灰度化,以生成灰度图片信息;

66、根据预设的标注数据库中所存储的标注样式信息和特征部位信息进行分析以匹配出与特征部分信息所对应的标注样式信息,根据标注样式信息对灰度图片信息进行标注以生成标注图片信息,并将标注图片信息录入案件数据库中。

67、通过采用上述技术方案,通过对比图片的存储空间值和基准存储空间值,从而判断出图片的存储空间值是否过大导致图片的录入速度慢,使存储空间值大的图片灰度化,从而降低图片的存储空间值,进而提高图片类新增数据检测信息录入的速度。将标注样式信息标注在灰度图片信息上,将生成的标注图片信息录入案件数据库中,进而使人员查询数据时方便理解数据。

68、可选的,数据类型还包括视频类,根据数据类型检测信息所对应的数据类型处理新增数据检测信息所对应的新增数据,生成录入数据信息的方法还包括:

69、根据数据类型检测信息确定所对应的数据类型为视频类;

70、根据预设的剪辑规则将新增数据检测信息进行裁剪以生成若干视频片段信息;

71、获取当前视频片段相关性检测信息;

72、判断视频片段相关性检测信息所对应的相关系数值是否大于预设的基准相关性信息所对应的相关系数值;

73、若视频片段相关性检测信息所对应的相关系数值不大于基准相关性信息所对应的相关系数值,则舍弃该视频片段信息并检测下一视频片段信息;

74、若视频片段相关性检测信息所对应的相关系数值大于基准相关性信息所对应的相关系数值,则获取当前音频时间检测信息和当前特征音频时间检测信息;

75、计算特征音频时间检测信息所对应的时间值与音频时间检测信息所对应的时间值的商,并将商定义为音频相关性检测信息;

76、判断音频相关性检测信息所对应的相关系数值是否大于基准相关性信息所对应的相关系数值;

77、若音频相关性检测信息所对应的相关系数值不大于基准相关性信息所对应的相关系数值,则去除视频片段信息所对应视频的音轨,以生成静音视频片段信息,并将静音视频片段信息录入案件数据库中;

78、若音频相关性检测信息所对应的相关系数值大于基准相关性信息所对应的相关系数值,则将视频片段信息录入案件数据库中。

79、通过采用上述技术方案,对于视频类的新增数据检测信息,按照剪辑规则将视频分成视频片段信息,通过判断视频片段信息的相关性,舍弃相关性低的视频片段信息,从而降低视频片段信息占据的存储空间值,进而提高视频片段信息录入的速度。通过判断特征音频时间与音频时间之比,从而判断音频的相关性,将视频片段信息去除音轨,从而生成静音视频片段信息,降低视频片段信息占据的存储空间值,将相关性满足录入需求的静音视频片段信息录入数据库,进而提高视频类的新增数据检测信息的速度。

80、可选的,若音频相关性检测信息所对应的相关系数值大于基准相关性信息所对应的相关系数值,将视频片段信息录入案件数据库的方法包括:

81、根据预设的取帧规则对视频片段信息进行取帧;

82、获取当前视频静止帧检测信息,并框选出视频静止帧检测信息中的特征检测信息和痕迹帧检测信息;

83、根据预设的模型数据库中所存储的特征检测信息和模型信息进行分析以匹配出与特征检测信息所对应的模型信息,并以模型信息替换特征检测信息以生成模型帧信息;

84、根据预设的编辑规则对模型帧信息和痕迹帧检测信息进行编辑合成,以生成简易动画信息,并将简易动画信息录入案件数据库中。

85、通过采用上述技术方案,按照取帧规则对视频片段进行取帧,框选出静止帧检测信息中的特征检测信息,将特征检测信息模型化生成模型信息,将模型信息和痕迹帧检测信息编辑合成为动画信息,从而降低视频片段信息占据的存储空间值,进而提高视频片段信息的录入速度。

86、第二方面,本技术提供一种基于数据深度学习的数据完善系统,采用如下的技术方案:

87、一种基于数据深度学习的数据完善系统,包括:

88、获取模块,用于获取新增数据检测信息、关键词检测信息、数据类型检测信息、质检结果检测信息、专业名词检测信息、音色检测信息、方言检测信息、语音存储检测信息、文本存储检测信息、图片质量检测信息、特征部位比例检测信息、图片颜色检测信息、特征部位颜色检测信息、图片存储检测信息、视频片段相关性检测信息、音频时间检测信息、特征音频时间检测信息、视频静止帧检测信息;

89、存储器,用于存储如上述任一项的一种基于数据深度学习的数据完善方法的程序;

90、处理器,存储器中的程序能够被处理器加载执行且实现如上述任一项的一种基于数据深度学习的数据完善方法。

91、通过采用上述技术方案,通过获取一系列影响到新增数据检测信息录入的信息,通过处理器加载并执行存储器中存储的数据完善方法的程序,从而对新增数据检测信息进行处理,从而使新增数据检测信息更快录入案件数据库中,并使人员理解案件数据库中的新增数据检测信息更加方便。

92、综上所述,本技术包括以下至少一种有益技术效果:

93、1.通过人员档案信息、案件类型信息、流程信息以及关键词检测信息将新增数据检测信息匹配至对应人员的对应案件,从而降低将新增数据检测信息匹配至对应案件的错误率,进而提高新增数据检测信息录入的方便性和准确性;

94、2.通过判断数据类型检测信息,根据数据类型检测信息对新增数据检测信息进行处理,使处理后的新增数据检测信息作为辅助理解数据和新增数据检测信息共同录入案件数据库中,进而提高人员后续理解新增数据检测信息的方便性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1