数据与检验指标间匹配性的量化方法、装置、设备及介质与流程

文档序号:37716503发布日期:2024-04-23 11:47阅读:11来源:国知局
数据与检验指标间匹配性的量化方法、装置、设备及介质与流程

本发明属于数据验证,具体涉及一种数据与检验指标间匹配性的量化方法、装置、设备及介质。


背景技术:

1、科研数据是在科研活动中产生的有价值的、数字形式的数据集合,包括通过调查、观察实验等科研活动直接获取的原始数据,经清洗、加工、统计学处理后的预支撑论文数据,以及直接支撑论文结论的最终数据等。统计学检验指标是指利用统计学算法或软件对论文原始数据进行统计学处理得到的统计量及p值。科研数据及统计学检验指标间匹配性不足是指违反科研数据及统计学检验指标间固有特征或关联规律的情况。

2、近些年,世界各国都加大了科学研究的资助力度,促进了科研人员职业化、规模化发展,科研竞争与评价,客观上使学术不端及科研数据造假日渐增多,科研数据学术不端呈上升趋势。科研数据造假很难评估的原因是其具有很强的专业性,信息约束和专业壁垒客观存在,不能通过文献、文本比对进行技术化编码加工和智能化信息计量。我国科研数据学术不端最主要的影响因素是数据审查,其次是数据学术不端检测技术。科研数据及统计处理结果的真实、准确是论文结论科学性的基础,科研数据的真实性是判断科研价值、反映学术不端的重要指标,针对科研数据造假的无能为力,就更无法约束各类学术欺诈和学术不端的肆意发展。因此,科技期刊编辑部需要加强稿件科研数据的科学性、真实性、准确性的审查;而期刊编辑部要求所有涉及科研数据及统计学处理的大量来稿均提供原始数据,并安排编辑人员重复计算、统计学处理进行审查,不具可执行性。

3、现有学术不端检软件及平台的构建,都是基于文献文本对比评估论文的相似度、抄袭率,协助期刊编辑部对来稿进行评价。尚无用于稿件科研数据及统计学检验指标间匹配性的量化审验计算方法。已有研究都以案例分析的形式分享了审验科研数据及统计学检验指标间匹配性不足的经验,判断很是依赖编辑的人工经验,难以推广应用,且均未涉及到量化审验,不能用于量化判断科研数据及统计学检验指标间匹配性不足。稿件中展示的科研数据及统计处理指标数值均是科学约数后的数值,采用约数后的数值通过现有统计软件、程序、平台进行审验,不能完全反映科学约数前的数值及统计处理结果,亦无法实现量化判断科研数据及统计学检验指标间的匹配性不足的目的。


技术实现思路

1、本发明的目的是提供数据与检验指标间匹配性的量化方法、装置、设备及介质,用以解决现有技术中实现量化判断稿件展示科研数据及统计学检验指标间的匹配性的问题。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,本发明提供了一种数据与检验指标间匹配性的量化方法,所述方法包括:

4、获取待审验表单数据;

5、基于待审验表单数据确定量化审验指标和待量化审验指标;

6、基于预设模型分别确定量化审验指标的假设值和待量化审验指标的假设集合;

7、基于假设值确定与量化审验指标匹配的待量化审验指标的验证集合;

8、基于假设集合和验证集合,得到量化审验指标与待量化审验指标之间的匹配结果。

9、优选地,所述待审验表单数据包括:统计指标和统计指标对应的指标数值,所述统计指标包括:比值比的95%置信区间的上限和下限、偏回归系数、标准误差、统计量、p值和指数倍数。

10、优选地,基于待审验表单数据确定量化审验指标和待量化审验指标,包括:

11、根据统计学规律在比值比的95%置信区间的上限和下限、偏回归系数、标准误差、统计量和指数倍数中选取一项或多项作为量化审验指标;根据统计学规律在比值比的95%置信区间的上限和下限、偏回归系数、标准误差、统计量、p值和指数倍数中选取一项作为待量化审验指标。

12、优选地,所述量化审验指标的假设值包括:量化审验指标对应的数值的最小值和最大值;

13、所述预设模型的表达式为:

14、x(min)=x-a;

15、x(max)=x+a;

16、式中,x(min)为量化审验指标对应的数值的最小值,x(max)为量化审验指标对应的数值的最大值,x为选取的量化审验指标对应的数值,a为量化审验指标对应的数值保留预设位数且预设位数的后一位数为定值的小数。

17、优选地,所述统计指标还包括:z值、两组独立样本的均数、标准差与t值、单因素方差分析统计量f值和独立样本x2值;

18、基于待审验表单数据确定量化审验指标和待量化审验指标,包括:

19、根据统计学规律在z值、两组独立样本的均数、标准差与t值、单因素方差分析统计量f值和独立样本x2值中选取一项作为量化审验指标,以p值作为待量化审验指标。

20、优选地,所述匹配结果包括:量化审验指标与待量化审验指标之间不匹配或量化审验指标与待量化审验指标之间的匹配判断无效;基于假设集合和验证集合,得到量化审验指标与待量化审验指标之间的匹配结果,包括:

21、计算假设集合与验证集合的交集;

22、判断交集是否为空集,若交集为空集时,量化审验指标与待量化审验指标之间不匹配;若交集不为空集时,量化审验指标与待量化审验指标之间的匹配判断无效。

23、优选地,所述方法还包括:

24、在量化审验指标与待量化审验指标之间不匹配时,对待量化审验指标对应的指标数值进行标记;

25、将标记后的待量化审验指标对应的指标数值进行推送显示。

26、第二方面,本发明提供了一种数据与检验指标间匹配性的量化装置,用于实现上述的数据与检验指标间匹配性的量化方法,所述方法包括:

27、数据获取模块,用于获取待审验表单数据;

28、第一确定模块,用于基于待审验表单数据确定量化审验指标和待量化审验指标;

29、第二确定模块,用于基于预设模型分别确定量化审验指标的假设值和待量化审验指标的假设集合;

30、第三确定模块,用于基于假设值确定与量化审验指标匹配的待量化审验指标的验证集合;

31、结果验证模块,用于基于假设集合和验证集合,得到量化审验指标与待量化审验指标之间的匹配结果。

32、第三方面,本发明提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的数据与检验指标间匹配性的量化方法。

33、第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的数据与检验指标间匹配性的量化方法。

34、有益效果:

35、本发明的量化方法在判定科研数据及统计学指标间匹配性不足的阳性预测值可高达100%,可以及早发现大部分存在违反科研数据及统计检验指标间关联规律的稿件,可以作为期刊编辑部提出退修、退稿的重要依据,减少后续更严格原始数据重新统计学处理审验的工作量,加快稿件审阅,提高编辑部工作效率。



技术特征:

1.一种数据与检验指标间匹配性的量化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据与检验指标间匹配性的量化方法,其特征在于,所述待审验表单数据包括:统计指标和统计指标对应的指标数值,所述统计指标包括:比值比的95%置信区间的上限和下限、偏回归系数、标准误差、统计量、p值和指数倍数。

3.根据权利要求2所述的数据与检验指标间匹配性的量化方法,其特征在于,基于待审验表单数据确定量化审验指标和待量化审验指标,包括:

4.根据权利要求2所述的数据与检验指标间匹配性的量化方法,其特征在于,所述量化审验指标的假设值包括:量化审验指标对应的数值的最小值和最大值;

5.根据权利要求2所述的数据与检验指标间匹配性的量化方法,其特征在于,所述统计指标还包括:z值、两组独立样本的均数、标准差与t值、单因素方差分析统计量f值和独立样本x2值;

6.根据权利要求1所述的数据与检验指标间匹配性的量化方法,其特征在于,所述匹配结果包括:量化审验指标与待量化审验指标之间不匹配或量化审验指标与待量化审验指标之间的匹配判断无效;基于假设集合和验证集合,得到量化审验指标与待量化审验指标之间的匹配结果,包括:

7.根据权利要求6所述的数据与检验指标间匹配性的量化方法,其特征在于,所述方法还包括:

8.一种数据与检验指标间匹配性的量化装置,用于实现权利要求1-7中任一项所述的数据与检验指标间匹配性的量化方法,其特征在于,

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述的数据与检验指标间匹配性的量化方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述的数据与检验指标间匹配性的量化方法。


技术总结
本发明属于数据验证技术领域,公开了一种数据与检验指标间匹配性的量化方法、装置、设备及介质,所述方法包括:获取待审验表单数据;基于待审验表单数据确定量化审验指标和待量化审验指标;基于预设模型分别确定量化审验指标的假设值和待量化审验指标的假设集合;基于假设值确定与量化审验指标匹配的待量化审验指标的验证集合;基于假设集合和验证集合,得到量化审验指标与待量化审验指标之间的匹配结果。本发明可以及早发现大部分存在违反科研数据及统计检验指标间关联规律的稿件,可以作为期刊编辑部提出退修、退稿的重要依据,减少后续更严格原始数据重新统计学处理审验的工作量,加快稿件审阅,提高编辑部工作效率。

技术研发人员:罗智玮,罗永华
受保护的技术使用者:罗永华
技术研发日:
技术公布日:2024/4/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1