一种临床试验数据验证方法、装置、可读存储介质及设备与流程

文档序号:30074434发布日期:2022-05-18 02:54阅读:124来源:国知局
一种临床试验数据验证方法、装置、可读存储介质及设备与流程

1.本发明涉及数据处理技术领域,尤其涉及一种临床试验数据验证方法、装置、计算机可读存储介质及设备。


背景技术:

2.随着信息化技术的发展,传统临床试验的数据处理工作或多或少的得到了效率上的提升。例如:在合并用药和不良事件的识别上,都在逐渐引入ai(artificial intelligence,人工智能)技术在信息化电子源数据中进行自动识别,并最终通过人工进行二次确认的方式,完成全部的事件录入。但是受限于整个过程必须要符合gcp(药品临床试验管理规范)的要求,数据需要经过多个步骤的处理,再加上大量的医学逻辑依然需要人工二次确认,从而导致数据文件需要流转于不同的角色之间进行过程的处理。数据处理过程中容易因拷贝问题、网络问题和人工失误等造成数据丢失和篡改,并且数据丢失和篡改等情况难以察觉。由此,将容易造成数据经过多个过程处理之后的结果数据与源数据不一致的问题,并且发现结果数据与源数据不一致的情况下,无法及时准确查找到结果数据与源数据不一致都原因。
3.目前主要是依靠人工抽样以统计学的方式进行验证,或借助it技术开发一些值比对算法进行比对验证,但是,人工抽样非常不客观,抽样验证结果无法代表全局是否被修改。而基于比对算法只能基于值的修改去验证,复杂度高,复用率低。


技术实现要素:

4.本发明实施例为了解决上述问题,创造性地提供一种临床试验数据验证方法、装置、计算机可读存储介质及设备。
5.根据本发明第一方面,提供了一种临床试验数据验证方法,所述方法包括:接收对初始数据进行处理得到的至少一个过程数据、得到所述过程数据的数据处理记录和采用预设算法对所述数据处理记录进行加密得到的记录编码;将记录编码与所述记录编码的父编码作为一个映射进行存储,得到数据链,其中,所述父编码为与所述记录编码相对应的数据处理记录的前一数据处理记录的记录编码;在接收到数据验证请求的情况下,根据所述数据链对过程数据和数据处理记录进行验证。
6.根据本发明一实施方式,所述记录编码为通过以下操作对所述数据处理记录进行加密得到:生成针对所述数据处理记录的随机值;对所述数据处理记录的多个字段和所述随机值进行加密,得到所述记录编码。
7.根据本发明一实施方式,所述将记录编码与所述记录编码的父编码作为一个映射进行存储,得到数据链,包括:将对所述初始数据进行第一次处理得到的过程数据记录为第1过程数据d1,相应的,将对所述初始数据进行第一次处理的数据处理操作记录为第1数据处理记录r1,对所述第1数据处理记录得到第1记录编码code1,所述第1记录编码code1的父编码记录为空null;将对所述初始数据进行第n次数据处理得到的过程数据记录为第n过程
数据dn,相应的,将对所述初始数据进行第n次数据处理的数据处理操作记录为第n数据处理记录rn,对所述第n数据处理记录得到第n记录编码coden,所述第n记录编码的父编码为code(n-1),其中n为大于1的正整数;如此,将coden以及coden的父编码code(n-1)作为数据链的第n映射yn进行存储。
8.根据本发明一实施方式,所述数据验证请求携带能够需要验证的结果数据的数据标识,其中,所述结果数据为根据所述初始数据进行多次数据处理得到所述结果数据的多个过程数据中的最后一个过程数据;相应的,所述在接收到数据验证请求的情况下,根据所述数据链对过程数据和数据处理记录进行验证,包括:在接收到数据验证请求的情况下,确定与所述数据标识相对应的所述结果数据;确定得到所述结果数据的数据处理记录;采用所述预设算法对所述数据处理记录进行加密处理,得到记录编码;根据所述记录编码是否存在于所述数据链中,对所述结果数据进行验证,得到验证结果。
9.根据本发明一实施方式,所述根据所述记录编码是否存在于数据链,对所述结果数据进行验证,得到验证结果,包括:若所述记录编码不存在于所述数据链中,则判定所述结果数据本身为非原生数据。
10.根据本发明一实施方式,所述根据所述记录编码是否存在于数据链,对所述结果数据进行验证,得到验证结果,包括:若所述记录编码存在于所述数据链中,则按照从所述结果数据到所述初始数据的顺序,依次对多个过程数据进行验证,得到完整的验证结果。
11.根据本发明一实施方式,所述若所述记录编码存在于所述数据链中,则按照从所述结果数据到所述初始数据的顺序,依次对多个过程数据进行验证,得到完整的验证结果,包括:若针对一个过程数据的记录编码不存在于所述数据链中,则判定所述过程数据本身为非原生数据;所针对所有过程数据的记录编码均存在于所述数据链中,直至验证数据链中包括多个过程数据相对应的记录编码,判定从所述初始数据到所述结果数据的所有过程数据均为未被篡改的原生数据。
12.根据本发明第二方面,还提供了一种临床试验数据验证装置,所述装置包括:接收模块,用于接收对初始数据进行处理得到的至少一个过程数据、得到所述过程数据的数据处理记录和采用预设算法对所述数据处理记录进行加密得到的记录编码;数据链生成模块,用于将记录编码与所述记录编码的父编码作为一个映射进行存储,得到数据链,其中,所述父编码为与所述记录编码相对应的数据处理记录的前一数据处理记录的记录编码;验证模块,用于在接收到数据验证请求的情况下,根据所述数据链对过程数据和数据处理记录进行验证。
13.根据本发明第三方面,还提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的临床试验数据验证方法。
14.根据本发明第四方面,还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上所述的临床试验数据验证方法。
15.本发明实施例临床试验数据验证方法、装置、计算机可读存储介质及设备。接收对初始数据进行处理得到的过程数据、以及得到过程数据的数据处理记录和采用预设算法对数据处理记录进行加密得到的记录编码,并将记录编码与该记录编码的父编码作为一个映射进行存储,得到数据链,其中,父编码为与该记录编码相对应的数据处理记录的前一数据
处理记录的记录编码,进一步的,在接收到数据验证请求的情况下,根据数据链对过程数据和数据处理记录进行验证。由此,可以对结果数据本身和得到结果本身的数据处理记录进行双重验证,在数据处理和交付过程中及时准确发现人工失误或恶意篡改等数据不可信问题,有效解决了传统的数据验证方法对数据篡改或错误的验证过程带来的高成本、低效率、片面性以及验证结果不可靠的问题。
16.需要理解的是,本发明的教导并不需要实现上面的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
17.通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
18.在附图中,相同或对应的标号表示相同或对应的部分。
19.图1示出了本发明实施例提供的一种临床试验数据验证方法的实现流程示意图;
20.图2示出了本发明实施例提供的一种临床试验数据验证方法的具体应用示例的实现流程示意图;
21.图3示出了本发明实施例提供的一种临床试验数据验证方法的具体应用示例中数据链结构示意图;
22.图4示出了本发明实施例提供的一种临床试验数据验证装置的组成结构示意图;
23.图5示出了本发明实施例提供的一种设备的组成结构示意图。
具体实施方式
24.下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
25.下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
26.这里首先对本发明实施例提供的一种临床试验数据验证方法的应用场景进行简单说明,本发明实施例提供的临床试验数据验证方法能够应用于多个用户按照一定顺序对原始数据进行数据处理得到结果数据的情况下,对每一用户得到的过程数据或最终得到的结果数据进行验证。例如:原始数据为d0,用户1对d0进行数据处理得到过程数据d1,用户1对d0进行的数据处理记录可以记为数据处理记录r1,用户2对过程数据d1进行数据处理得到过程数据d2,用户2对d1进行的数据处理记录可以记为数据处理记录r2,由此,得到多个过程数据以及每一过程数据相对应的数据处理记录。中心服务器能够接收到需要进行数据处理的原始数据d0、用户对d0进行数据处理的得到的过程数据d1和d2、用户进行数据处理的数据处理记录r1和r2以及对r1和r2进行数据加密处理得到的记录编码code1和code2等。
27.需要说明的是,以上仅仅是对本发明实施例提供的一种临床试验数据验证方法的应用场景的示例性说明,并不用于对其应用场景进行限定。另外,应用场景描述以及下文中
示出的用户的编号、数据处理记录的标识和过程数据的标识,以及用户对数据进行数据处理的顺序等也仅仅是为了较为清楚的描述方案实施过程,并不用于对方案形成限定。并且,由于结果数据即为某一次数据处理之后得到的过程数据,因此,在本发明实施例的具体描述中,将结果数据视为一个特殊的过程数据。
28.图1示出了本发明实施例提供的一种临床试验数据验证方法的实现流程示意图。
29.参考图1,本发明实施例临床试验数据验证方法,至少包括如下操作流程:操作101,接收对初始数据进行处理得到的至少一个过程数据、得到过程数据的数据处理记录和采用预设算法对数据处理记录进行加密得到的记录编码;操作102,将记录编码与记录编码的父编码作为一个映射进行存储,得到数据链,其中,父编码为与记录编码相对应的数据处理记录的前一数据处理记录的记录编码;操作103,在接收到数据验证请求的情况下,根据数据链对过程数据和数据处理记录进行验证。
30.在操作101中,接收对初始数据进行处理得到的至少一个过程数据、得到过程数据的数据处理记录和采用预设算法对数据处理记录进行加密得到的记录编码。
31.在本发明这一实施方式中,记录编码为通过以下操作对数据处理记录进行加密得到:生成针对数据处理记录的随机值,并对数据处理记录的多个字段和随机值进行加密,得到记录编码。
32.举例说明,用户1对初始数据d0进行数据处理,得到过程数据d1,用户1对初始数据d0进行的数据处理记录可以记为r1。预设算法可以是散列加密算法。首先生成一个针对数据处理记录r1的随机数,进一步的根据该数据处理记录的全部信息和所生成的随机数,利用md5(信息摘要算法)生成一个记录,将该记录编码记为code1,该记录编码code1为该数据处理记录r1的唯一编码,记录编码也可以称为hash_code(哈希编码)。具体的,参考如下表1所示,数据处理记录r1包括4个字段,根据4个字段的所有信息和针对r1生成的随机数16,可以生成code1。由此,针对所有的数据处理记录均可以生成相应的记录编码。
33.字段1字段2字段3字段4随机数记录编码a1b1c1d116code1a2b2c2d223code2
………………
anbncndn19coden
34.在操作102中,将记录编码与记录编码的父编码作为一个映射进行存储,得到数据链,其中,父编码为与记录编码相对应的数据处理记录的前一数据处理记录的记录编码。
35.在本发明这一实施方式中,可以将对初始数据进行第一次处理得到的过程数据记录为第1过程数据d1,相应的,将对初始数据进行第一次处理的数据处理操作记录为第1数据处理记录r1,对第1数据处理记录得到第1记录编码code1,第1记录编码code1的父编码记录为空null。将对初始数据进行第n次数据处理得到的过程数据记录为第n过程数据dn,相应的,将对初始数据进行第n次数据处理的数据处理操作记录为第n数据处理记录rn,对第n数据处理记录得到第n记录编码coden,第n记录编码的父编码为code(n-1),其中n为大于1的正整数。如此,将coden以及coden的父编码code(n-1)作为数据链的第n映射yn进行存储。
36.举例说明,初始数据d0经过多个用户对多个处理步骤之后生成结果数据dn,其中,对d0的第一次处理步骤可以记为第一个数据处理记录r1,采用操作101的预设算法对r1进
行数据加密得到记录编码code1。由于第一个数据处理记录r1之前没有其他数据记录,故这里将第1记录编码code1的父编码记录为空null。进一步的,对d1的第进行数据处理得到过程数据d2的操作步骤记为对d0的第二个数据处理记录r2,同样的,采用操作101的预设算法对r2进行数据加密得到记录编码code2,第二个数据处理记录r2的前一数据处理记录为r1,r1相对应的记录编码为code1。因此,记录编码code2的父编码为code1。由此,将code1与其父编码作为一个映射y1,code2与其父编码code1作为一个映射y2注册至数据链中。同样的,将所有数据处理记录rn的记录编码coden以及coden的父编码code(n-1)作为数据链的第n映射yn进行存储。数据链的结构参考下文图3。
37.在操作103中,在接收到数据验证请求的情况下,根据数据链对过程数据和数据处理记录进行验证。
38.在本发明这一实施方式中,数据验证请求携带能够需要验证的结果数据的数据标识,其中,结果数据为根据初始数据进行多次数据处理得到结果数据的多个过程数据中的最后一个过程数据。相应的,在接收到数据验证请求的情况下,可以确定与数据标识相对应的结果数据,并由此确定得到结果数据的数据处理记录。进一步的,采用与操作101中相同的预设算法对数据处理记录进行加密处理,得到记录编码,根据记录编码是否存在于数据链中,即可完成对结果数据进行验证,得到验证结果。
39.若根据数据处理记录生成的记录编码不存在于数据链中,则判定结果数据本身为非原生数据。
40.举例说明,如果初始数据d0,对d0进行第一次数据处理,得到d1,对d1进行数据处理得到d2,若正常对d2再进行数据处理得到d3,d0、d1、d2和d3均为被篡改过,将d0、d1、d2和d3称为原生数据。如果在对d2进行正常的数据处理之后,原本得到的数据为d3,数据处理记录r3为根据数据处理过程生成的数据处理记录。此时,将自动对数据处理记录r3进行数据加密处理,生成记录编码code3。并将d3、r3和code3发送至中心服务器。
41.但是,如果某用户对得到d3之后对d3中的个别数据进行了手动修改或者d3被不法分子进行了恶意篡改,得到d3’,并将d3’作为一个过程数据发送至数据中心,那么得到数据d3’的数据处理记录为r3’。这里,在需要对d3’进行数据验证的情况下,针对得到数据d3’的数据处理记录为r3’,采用操作101中相同的预设算法进行数据加密,得到记录编码code3’。经过比对,数据链中不存在记录编码code3’,则判定d3’为非原生数据。
42.在本发明这一实施方式中,若记录编码存在于数据链中,则按照从结果数据到初始数据的顺序,依次对多个过程数据进行验证,得到完整的验证结果。
43.进一步的,若针对一个过程数据的记录编码不存在于数据链中,则判定过程数据本身为非原生数据;所针对所有过程数据的记录编码均存在于数据链中,直至验证数据链中包括多个过程数据相对应的记录编码,判定从初始数据到结果数据的所有过程数据均为未被篡改的原生数据。
44.本发明实施例临床试验数据验证方法,接收对初始数据进行处理得到的过程数据、以及得到过程数据的数据处理记录和采用预设算法对数据处理记录进行加密得到的记录编码,并将记录编码与该记录编码的父编码作为一个映射进行存储,得到数据链,其中,父编码为与该记录编码相对应的数据处理记录的前一数据处理记录的记录编码,进一步的,在接收到数据验证请求的情况下,根据数据链对过程数据和数据处理记录进行验证。由
此,可以对结果数据本身和得到结果本身的数据处理记录进行双重验证,在数据处理和交付过程中及时准确发现人工失误或恶意篡改等数据不可信问题,有效解决了传统的数据验证方法对数据篡改或错误的验证过程带来的高成本、低效率、片面性以及验证结果不可靠的问题。
45.图2示出了临床试验数据验证方法的具体应用示例的实现流程示意图。
46.参考图2,本发明实施例临床试验数据验证方法,至少包括如下操作流程:
47.操作201,获取初始数据d0。
48.操作202,发送对d0进行数据处理得到的过程数据d1、数据处理记录1、随机数r1、对数据处理记录1进行加密得到的编码code1、code1父节点null。
49.操作203,发送对过程数据d1进行处理得到的过程数据d2、数据处理记录2、随机数r2、对数据处理记录2进行加密得到的编码code2、code2父节点code1。
50.操作204,发送对过程数据d(n-1)进行处理得到的过程数据dn、数据处理记录n、随机数rn、对数据处理记录3进行加密得到的编码coden、coden父编码code(n-1)。
51.操作205,将coden以及coden的父编码code(n-1)作为数据链的第n映射yn进行存储,形成如图3所示的数据链。
52.操作206,服务器接收任一用户或第三方监管发送的数据验证请求,数据验证请求中携带需要验证的结果数据dn(结果数据可以是任一过程数据dn,n∈1-n)的数据标识,数据标识用于表示本次数据验证需要验证哪一个结果数据。
53.操作207,响应于数据验证请求,确定得到结果数据的最近一个数据处理记录n对应的编码coden。
54.操作208,根据数据链中是否存在编码coden,对数据dn进行验证,得到验证结果。操作208包括操作209和操作210。
55.操作209,若数据链中存在编码coden,则依次验证code(n-1)、code(n-2)
……
直至验证数据链中包括coden~code1的所有数据,判定r1~rn的整个数据处理记录准确,过程数据d1~dn均未被篡改。
56.操作210,若数据链中不存在编码coden,则判定编码coden相对应的数据处理记录rn被篡改过。
57.操作211,反馈验证结果至发出验证请求的任一用户或第三方监管。
58.其中,操作201~211的具体实现过程与图1所示实施例中操作101~103的具体实现过程相类似,这里不再赘述。
59.如图4所示,为本发明临床试验数据验证装置的一个具体实施例。本实施例装置,即用于执行图1~3方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。参考图4,本发明实施例提供一种临床试验数据验证装置,装置40包括:接收模块401,用于接收对初始数据进行处理得到的至少一个过程数据、得到
60.过程数据的数据处理记录和采用预设算法对数据处理记录进行加密得到的记录编码;数据链生成模块402,用于将记录编码与记录编码的父编码作为一个映射进行存储,得到数据链,其中,父编码为与记录编码相对应的数据处理记录的前一数据处理记录的记录编码;验证模块403,用于在接收到数据验证请求的情况下,根据数据链对过程数据和数
据处理记录进行验证。
61.图5是本发明实施例提供的一种设备的结构示意图。在硬件层面,该设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该设备还可能包括其他业务所需要的硬件。
62.处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
63.存储器,用于存放执行指令。具体地,执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器,并向处理器提供执行指令和数据。
64.在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成临床试验数据验证装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的临床试验数据验证方法。
65.上述如本发明图4所示实施例提供的临床试验数据验证装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
66.结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
67.本发明实施例还提出了一种可读介质,该可读存储介质存储有执行指令,存储的执行指令被电子设备的处理器执行时,能够使该电子设备执行本发明任一实施例中提供的临床试验数据验证方法,并具体用于执行如图1~图3所示的方法。
68.前述各个实施例中的电子设备可以为计算机。
69.本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
70.本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分
互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
71.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
72.以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1