通用型临床试验电子数据获取系统和获取方法

文档序号:10489211阅读:494来源:国知局
通用型临床试验电子数据获取系统和获取方法
【专利摘要】本发明涉及一种通用型临床试验电子数据获取系统和获取方法,通过客户端系统生成受试者随机号和药物号,并完成试验阶段信息采集以及试验后的随访数据采集,使得贯穿整个试验过程的数据采集全部实现电子化,减少大量人工劳动,大大提高了获取试验数据的效率和精度,且通用型强。
【专利说明】通用型临床试验电子数据获取系统和获取方法
[0001 ] 本申请是申请号为201310338578.3的分案申请;
[0002]原申请的申请日为:2013年8月6日;
[0003]原申请的发明名称为:一种通用型临床试验电子数据获取系统和获取方法。
技术领域
[0004]本发明涉及通用型临床试验电子数据获取系统通用型临床试验电子数据获取系统。
【背景技术】
[0005]在临床研究或药品临床试验中,往往要收集病患者的病例报告表,而临床研究或药品临床试验中所用于统计分析的病例报告表必须是电子病例报告表。目前,在大多数临床研究数据中心中,还是通过手工录入的方式将纸质病例报告表内容输入计算机中形成电子病例报告表,对临床数据进行统计分析。为了保证数据的准确性,通常需要经过两次录入甚至三次录入,并对各次录入的数据进行比较以期纠正因人工录入过程中引入的数据错误。由于数据管理中间过程有大量的人工干预,工作效率有限,数据发生错误的可能性也会成倍地增加,而为了消除这种错误,又不得不增加更多的人力。
[0006]中国专利CN102968572A公开了一种骨科病例信息采集系统及其获取方法,其中,所述骨科病例信息采集系统包括纸质病例扫描采集模块、电子病例自动转换模块、骨科影像采集模块和病例信息共享平台;其中,所述的纸质病例扫描采集模块包括:扫描模块、图像处理机文字识别模块、数据存数模块和数据传输接口,所述的扫描模块包括高速扫描仪,扫描模块将病人的纸质病例信息转换为图像信息,图像处理及文字识别模块为文档扫描软件,将扫描的图像信息转换成电子病例文本;所述的电子病例自动转换模块包括:HL7资源模块、HL7对照模块、HL7转换模块、HL7应用接口模块和HL7信息发送接受模块;所述的骨科影像采集模块包括:采集模块、存储模块和数据传输接口。所述的病例信息共享平台包括:纸质病例信息接口、电子病例信息接口、骨科影像信息数据接口、数据处理模块、数据存数模块和数据共享模块。所述骨科病例信息获取方法包括如下步骤:(I)通过纸质病例扫描采集模块采集纸质骨科病例信息;(2)通过电子病例自动转换模块采集骨科电子病例信息;
(3)通过骨科影像采集模块采集骨科影像信息;(4)将上述步骤采集的信息通过互联网传输给病例信息共享平台;(5)数据共享平台收集、整理病例信息,并提供给医生和病人查询。上述技术方案虽然能够将纸质病例转换为电子病例,但是没有对转换后的电子病例进行校验,一旦所转换的电子病例中存在因转换而造成的信息错误,则该错误就不能被校验出来。当在治疗或研究过程中,若用于医生、病人以及研究人员所查询的电子病例中存在错误的信息,则会对病人在治疗过程中造成为误诊、对临床研究或药品临床试验造成试验数据不准确。
[0007]而且,具体到药物试验,不仅要采集试验阶段的电子病例信息,还需要采集试验结束后一定时间内受试者信息、上述专利文献中,仅仅采集试验阶段的电子病例信息,导致信息采集不全,无法全面评估试验效果;而且无法实现全过程试验数据获取的自动化,导致现有试验过程中数据获取效率低下和精确度差。

【发明内容】

[0008]本发明所要解决的技术问题是现有技术中无法实现全过程试验数据获取的自动化带来的效率低下和精确度差的技术问题,从而提供一种通用型临床试验电子数据获取系统和获取方法。
[0009]为解决上述技术问题,本发明是通过以下技术方案实现的:
[0010]一种通用型临床试验电子数据获取系统,包括客户端系统、应用服务器和数据库服务器;其中,所述客户端系统在试验开始前用于访问所述应用服务器,实现受试者随机号分配;所述客户端系统在试验过程中用于访问所述应用服务器,实现受试者药物号分配;所述客户端系统同时负责在试验过程中采集试验数据并在试验结束后收集随访数据,并将采集到的所述试验数据和收集到的随访数据发送给应用服务器,所述应用服务器接收所述试验数据和随访数据并在处理后发送给所述数据库服务器存储。
[0011 ]所述客户端系统包括扫描装置,
[0012]所述扫描装置,用于通过扫描试验阶段的纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述应用服务器;
[0013]所述应用服务器包括识别装置;
[0014]所述识别装置,接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一 OCR模块、第二OCR模块和校验模块,其中,
[0015]所述第一OCR模块,对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块;
[0016]所述第二OCR模块,具有与所述第一 OCR模块不同的识别算法,对所述第一 OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块;
[0017]所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元,
[0018]所述电子病例报告表对比单元,接收所述第一OCR模块和所述第二 OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一 OCR模块和所述第二 OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元;
[0019]所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出至所述数据库服务器存储;
[0020]所述校验模块还包括语法检查单元和第二核对单元,
[0021]所述语法检查单元,接收所述第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元;
[0022]所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
[0023]所述校验模块还包括随机截取校验单元和第三核对单元,其中,
[0024]所述随机截取校验单元进一步包括随机截取模块和数据库,
[0025]所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为关键词语、关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出;
[0026]所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储;
[0027]所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
[0028]所述客户端系统包括联网计算机,所述联网计算机用于访问应用服务器,并按照所述应用服务器上的提示录入受试者信息,并将录入的所述受试者信息发送给所述数据库服务器存储;
[0029]所述应用服务器进一步包括分配随机号模块,所述分配随机号模块用于从数据库服务器中读取所述受试者信息并根据所述受试者信息,调用随机分配算法将每个所述受试者随机分配到不同的组,并为每个所述受试者分配随机号,最后将分配的随机号通过所述联网计算机反馈给所述研究者,并将分配的所述随机号存储至所述数据库服务器中。
[0030]所述客户端系统还包括电话机,所述电话机与应用服务器相连;
[0031]所述应用服务器进一步包括:
[0032]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,发出提示语音提示研究者逐项输入受试者信息,其中,所述受试者信息包括分配给所述受试者的随机号;并接收研究者输入的所述受试者信息,然后将接收到的所述受试者信息存储到所述数据库服务器中;
[0033]给药物号模块,读取所述受试者信息并根据所述受试者信息,为每个所述受试者分配药物号,并将分配的药物号通过所述语音应答模块和电话机反馈给所述研究者。
[0034]所述客户端系统还包括电话机,所述电话机与应用服务器相连;所述应用服务器,还进一步包括:
[0035]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过按键输入受试者身份识别号以及通过语音依次输入对受试者随访问题的答案信息,并将接收到的受试者身份识别号和对受试者随访问题的答案信息输出;
[0036]语音识别模块,接收所述语音应答模块发送的所述受试者身份识别号和对所述受试者随访问题的答案信息,并对所述受试者随访问题的答案信息进行语音识别,将识别后的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。
[0037]同时,提供一种通用型临床试验电子数据获取方法,包括如下步骤,
[0038]试验前阶段,通过客户端系统访问应用服务器,并实现随机号分配;
[0039]在试验过程中,通过客户端系统访问应用服务器,并实现受试者药物号分配;通过客户端系统采集试验数据并发送给应用服务器;
[0040]试验结束后,通过客户端系统采集随访数据并发送给应用服务器;
[0041]所述应用服务器接收所述客户端系统发送的数据并处理后存储至数据库服务器。
[0042]所述客户端系统按照如下步骤采集试验数据;
[0043]S0:扫描试验阶段的纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送;
[0044]S1:接收病例报告表图像,并对所述对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出;
[0045]S2:接收步骤SI中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤SI中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出;
[0046]S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出;
[0047]S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出至数据库服务器存储。
[0048]还包括以下语法检查的步骤:
[0049]S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出;
[0050]S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
[0051 ]在所述语法检查步骤之后还包括短语核对的步骤:
[0052]S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出;
[0053]S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
[0054]所述步骤S61中的数据库按照以下步骤生成:
[0055]S5’ 1:将预先确定的关键词语及关键语句存储到数据库;
[0056]S5 ’ 2:记录所述随机短语访问数据库的次数,若次数超过预定的η次,则将所述随机短语作为关键词语或者关键语句存储到所述数据库中。
[0057]还包括如下步骤:
[0058]S20:试验结束后通过电话机访问应用服务器;
[0059]S21:所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过按键输入受试者身份识别号以及通过语音依次输入对受试者随访问题的答案信息,并将接收到的受试者身份识别号和对受试者随访问题的答案信息输出;
[0060]S22:接收所述受试者身份识别号和对所述受试者随访问题的答案信息,并对所述受试者随访问题的答案信息进行语音识别,将识别后的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。
[0061 ]本发明的上述技术方案相比现有技术具有以下优点:
[0062](I)本发明所述的一种通用型临床试验电子数据获取系统和获取方法,通过客户端系统生成受试者随机号和药物号,并完成试验阶段信息采集以及试验后的随访数据采集,使得贯穿整个试验过程的数据采集全部实现电子化,减少大量人工劳动,大大提高了获取试验数据的效率和精度,且通用型强。
[0063](2)本发明所述的一种通用型临床试验电子数据获取系统和获取方法,通过扫描装置采集试验数据图像即电子病例报告表,对采集的电子病例报告表使用两种不同的识别算法进行OCR识别,对识别结果不一致的内容再进行人工核对。保证大部分识别和核对工作通过OCR算法和校验模块和步骤自动实现,少数识别后不一致的内容再由人工进行核对,及时发现错误并进行人工核对,保证了采集的数据准确性,同时,也提高了数据采集系统的自动化程度和数据采集速度,便于工业化实施。同时,考虑到整个试验系统既需要采集试验阶段数据,又需要获取试验结束后一定时间内的随访数据,本发明的通用型临床试验电子数据获取系统和获取方法进一步通过电话机和应用服务器采集随访数据,适应了试验结束后受试者正常生活带来的不便于到指定地点提供随访数据的缺陷,通过分布在不同地区并且已经普遍使用的电话机访问所述应用服务器,完成随访数据的二十四小时不间断采集,保证随访数据不流失。无需任何额外的硬件设备,所述应用服务器可以在同一时间完成多个不同受试者随访数据的采集,省时省力。
[0064](3)本发明所述的一种通用型临床试验电子数据获取系统和获取方法,所述校验模块还包括语法检查单元,能够对所述第一暂态电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。所述校验模块还包括随机截取校验单元,能够随机对所述第二暂态电子病例报告表中的语句进行截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为所述关键词语及关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语处标记并对其进行人工核对,将人工核对后的终态电子病例报告表输出。本发明能够对第二暂态电子病例报告表中语句的准确性进行校验,有效增加了系统的识别准确性。
【附图说明】
[0065]为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明,其中,
[0066]图1是本发明一个实施例的通用型临床试验电子数据获取系统的框架图;
[0067]图2是本发明一个实施例的通用型临床试验电子数据获取方法的部分流程图。
【具体实施方式】
[0068]实施例1
[0069]本发明一个实施例的通用型临床试验电子数据获取系统,包括客户端系统、应用服务器和数据库服务器;其中,所述客户端系统在试验开始前用于访问所述应用服务器,实现受试者随机号分配;所述客户端系统在试验过程中用于访问所述应用服务器,实现受试者药物号分配;所述客户端系统同时负责在试验过程中采集试验数据并在试验结束后收集随访数据,并将采集到的所述试验数据和收集到的随访数据发送给应用服务器,所述应用服务器接收所述试验数据和随访数据并在处理后发送给所述数据库服务器存储。
[0070]实施例2
[0071]参见图1所示,作为本发明一个实施例的通用型试验数据采集系统,在上述实施例的基础上,所述客户端系统包括用于采集试验阶段中的试验数据的扫描装置、用于在试验前阶段用于分配受试者的随机号的联网计算机、用于在试验阶段分配药物号的电话机和用于在试验结束后采集随访数据的电话机,一般,用于在试验阶段分配药物号的电话机和用于在试验结束后采集随访数据的电话机为分布在不同物理地点的不同电话机,其中,
[0072]试验开始前,所述联网计算机用于访问应用服务器,并按照所述应用服务器上的提示录入受试者信息,并将录入的所述受试者信息发送给所述数据库服务器存储;
[0073]所述应用服务器进一步包括分配随机号模块,所述分配随机号模块用于从数据库服务器中读取所述受试者信息并根据所述受试者信息,调用随机分配算法将每个所述受试者随机分配到不同的组,并为每个所述受试者分配随机号,最后将分配的随机号通过所述联网计算机反馈给所述研究者,并将分配的所述随机号存储至所述数据库服务器中。
[0074]在试验过程中,所述电话机与应用服务器相连;
[0075]所述应用服务器进一步包括:
[0076]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,发出提示语音提示研究者逐项输入受试者信息,其中,所述受试者信息包括分配给所述受试者的随机号;并接收研究者输入的所述受试者信息,然后将接收到的所述受试者信息存储到所述数据库服务器中;
[0077]给药物号模块,读取所述受试者信息并根据所述受试者信息,为每个所述受试者分配药物号,并将分配的药物号通过所述语音应答模块和电话机反馈给所述研究者。
[0078]试验过程中,所述扫描装置,用于通过扫描试验阶段中的纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述识别装置,所述扫描装置可以为扫描仪、照相机等电子设备。
[0079]所述应用服务器包括识别装置,所述识别装置用于接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一 OCR模块、第二 OCR模块和校验模块,其中,
[0080]所述第一OCR模块,采用第一 OCR算法对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块。所述的病例报告表为临床研究或药品临床试验中的原始数据在和法律文件,其具有一定的格式及项目,所述的项目中的全部或部分需要受试人员在纸质病例报告表中手工填写。本发明针对经过受试人员填写后的所述病例报告表图像进行0CR(0ptical Character Recognit1n光学字符识别)来得到电子病例报告表,完成纸质数据项电子数据的转化。所述OCR模块能够根据算法来分析文字的形态特征,判断文字的标准编码,并按照通用格式存储为计算机文本文件,现有的OCR技术已经能够处理印刷质量比较差的字符或较为一般的手写体字符。
[0081]所述第二OCR模块,采用第二 OCR算法对所述第一 OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块。所述第一OCR算法和第二OCR算法不同。所述第一OCR模块和第二OCR模块分别根据不同算法对同样的所述病例报告表图像进行识别,能够使病例报告表图像在不同算法下得到所述第一电子病例报告表和所述第二电子病例报告表,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
[0082]所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元。
[0083]所述电子病例报告表对比单元,接收所述第一OCR模块和所述第二 OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一 OCR模块和所述第二 OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元。
[0084]所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出。所述的暂态报告表既可以作为本发明最后的输出数据输出至所述数据服务器中存储,也可以作为其他模块输入数据以进行进一步的数据校正,校正后的获得的终态报告表为最终输出系统的电子病例报告表输出至所述数据服务器中存储。
[0085]试验结束后,受试者使用电话机与应用服务器相连;相应地所述应用服务器进一步包括:
[0086]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过按键输入受试者身份识别号以及通过语音依次输入对受试者随访问题的答案信息,并将接收到的受试者身份识别号和对受试者随访问题的答案信息输出。
[0087]语音识别模块,接收所述语音应答模块发送的所述受试者身份识别号和对所述受试者随访问题的答案信息,并对所述受试者随访问题的答案信息进行语音识别,将识别后的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。
[0088]实施例3
[0089]作为本发明其他实施例的通用型试验数据采集系统,上述实施例中用于完成受试者随机号分配的联网计算机被电话机代替,其中,电话机,与应用服务器相连;
[0090]应用服务器,进一步包括:
[0091 ]数据库,用于存储系统数据;
[0092]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,发出提示语音提示研究者逐项输入受试者信息;并接收研究者输入的所述受试者信息,然后将接收到的所述受试者信息存储到所述数据库中;
[0093]分配随机号模块,读取所述受试者信息并根据所述受试者信息,调用随机分配算法将每个所述受试者随机分配到不同的组,并为每组的每个所述受试者分配随机号,并将分配的随机号通过所述语音应答模块和电话机反馈给所述研究者。
[0094]实施例4
[0095]当然,作为本发明其他实施例的通用型试验数据采集系统,在上述实施例的基础上,上述实施例中用于完成受试者药物号分配的电话机被联网计算机代替,所述电话机与应用服务器相连。
[0096]所述应用服务器相应地进一步包括:
[0097]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,发出提示语音提示研究者逐项输入受试者信息,其中,所述受试者信息包括分配给所述受试者的随机号;并接收研究者输入的所述受试者信息,然后将接收到的所述受试者信息存储到所述数据库中。
[0098]给药物号模块,读取所述受试者信息并根据所述受试者信息,为每个所述受试者分配药物号,并将分配的药物号通过所述语音应答模块和电话机反馈给所述研究者。
[0099]实施例5
[0100]作为本发明其他实施例的通用型试验数据采集系统,在上述实施例的基础上,上述实施例中用于采集试验数据的所述扫描装置可以为电话或者联网计算机代替,用于采集试验过程中数据,并将采集的试验数据发送给应用服务器,由所述应用服务器处理后发送至数据库服务器存储,同样能实现本发明的目的,属于本发明的保护范围。
[0101]实施例6
[0102]作为一种【具体实施方式】,上述实施例中用于采集随访数据的电话机被联网计算机取代,所述联网计算机用于远程访问应用服务器,并根据所述应用服务器的提示输入受试者身份识别号以及逐条录入对受试者随访题目的答案信息。
[0103]应用服务器,接收所述联网计算机发送的所述受试者身份识别号和对所述受试者随访问题的答案信息,并将接收到的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。
[0104]数据库服务器,与所述应用服务器相连,接收所述应用服务器输出的所述受试者随访问题的答案信息和所述受试者身份识别号并对应存储。
[0105]实施例7
[0106]作为本发明其他实施例的通用型试验数据采集系统,在上述任一实施例的基础上,所述客户端系统还包括用与完成受试者招募的电话机,所述电话机进一步包括:
[0107]话筒,用于输入语音并将输入的语音发送给加密模块;
[0108]加密模块,接收所述话筒输入的语音并进行加密后发送给应用服务器;
[0109]所述应用服务器进一步包括:
[0110]语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过语音输入应招者信息,并将接收到的应招者信息发送给解密模块;
[0111]解密模块,接收所述语音应答模块发送的应招者信息并进行解密后发送给语音识别丰旲块;
[0112]语音识别模块,接收所述解密模块发送的解密后的所述应招者信息,并对所述应招者信息进行语音识别,将识别后的所述应招者信息输出至数据库服务器存储;
[0113]数据库服务器,与所述应用服务器相连,接收所述应用服务器输出的所述应招者信息并对应存储。
[0114]本发明所述的一种通用型临床试验电子数据获取系统,通过客户端系统生成受试者随机号和药物分配号,并完成试验阶段信息采集以及试验后的随访数据采集,使得贯穿整个试验过程的数据采集全部实现电子化,通用型强。
[0115]进一步地,本发明所述的一种通用型临床试验电子数据获取系统,通过扫描装置采集试验数据图像即电子病例报告表,对采集的电子病例报告表使用两种不同的识别算法进行OCR识别,对识别结果不一致的内容再进行人工核对。保证大部分识别和核对工作通过OCR算法和校验模块和步骤自动实现,少数识别后不一致的内容再由人工进行核对,及时发现错误并进行人工核对,保证了采集的数据准确性,同时,也提高了数据采集系统的自动化程度和数据采集速度,便于工业化实施。同时,考虑到整个试验系统既需要采集试验阶段数据,又需要获取试验结束后一定时间内的随访数据,本发明的通用型临床试验电子数据获取系统和获取方法进一步通过电话机和应用服务器采集随访数据,适应了试验结束后受试者正常生活带来的不便于到指定地点提供随访数据的缺陷,通过分布在不同地区并且已经普遍使用的电话机访问所述应用服务器,完成随访数据的二十四小时不间断采集,保证随访数据不流失。无需任何额外的硬件设备,所述应用服务器可以在同一时间完成多个不同受试者随访数据的采集,省时省力。
[0116]实施例8
[0117]作为本发明的其他实施例,在上述实施例的基础上,所述校验模块还包括语法检查单元和第二核对单元。所述语法检查单元,接收所述电子病例报告表对比单元输出的第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元。所述语法检查单元,能够对所述第一暂态电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。
[0118]所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。
[0119]实施例9
[0120]作为本发明的其他实施例,在上述包括校验模块的实施例的基础上,所述校验模块还包括随机截取校验单元和第三核对单元。其中,所述随机截取校验单元进一步包括随机截取模块和数据库。
[0121]所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语搜索的关键字在所述数据库中进行搜索查询,若所述随机短语为数据库中存储的关键词语、关键语句的全部或一部分,则认为随机截取校验正确,将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出。
[0122]所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储,所述的关键词语及关键语句为中医药辞典、现代汉语辞典等专业工具书中的词语及语句。
[0123]所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
[0124]本发明能够对所述第二暂态电子病例报告表中词语及语句的准确性进行校验,有效增加了系统的识别准确性。
[0125]作为其他更优选的实施例,在上述实施例的通用型临床试验电子数据获取系统的基础上,所述语音识别模块进一步包括至少两个语音识别单元和一个校验单元,其中,至少两个所述语音识别单元应用的语音识别算法不同,经过多个所述语音识别单元识别结果相同的内容可认为识别结果准确,直接输出至数据库服务器存储;经过多个所述语音识别单元识别结果不同的内容可能识别错误,对该部分内容进行突出显示,后续对该突出显示的内容进行人工核对后再输出至数据库服务器存储,保证采集的随访数据的准确性。进而保证所述通用型数据采集系统采集的所有数据的准确性。同样,作为本发明其他实施例,所述识别装置可以包括两个以上的OCR模块,同样能实现本发明的目的,属于本发明的保护范围。
[0126]实施例10
[0127]—种通用型临床试验电子数据获取方法,包括如下步骤:
[0128]试验前阶段,通过客户端系统访问应用服务器,并实现随机号分配。
[0129]在试验过程中,通过客户端系统访问应用服务器,并实现受试者药物号分配;通过客户端系统采集试验数据并发送给应用服务器。
[0130]试验结束后,通过客户端系统采集随访数据并发送给应用服务器;
[0131]所述应用服务器接收所述客户端系统发送的数据并处理后存储至数据库服务器。
[0132]实施例11
[0133]作为本发明所述的一种通用型临床试验电子数据获取方法,在上述实施例的基础上,如图2所示,所述试验数据采集的步骤具体包括:
[0134]S0:扫描纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送。
[0135]S1:接收病例报告表图像,并对所述对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出。
[0136]S2:接收步骤SI中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤SI中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出。
[0137]S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出。
[0138]S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为终态病例报告表输出至数据库服务器存储。
[0139]本发明所述的识别方法能够在大大提高纸质病例报告表转换为电子病例报告表的工作效率的同时,有效减少错误电子病例报告表的输出,提高了临床病例报告表识别系统的识别准确性和识别速度。所述步骤SI和步骤S2分别根据不同算法对所述纸质病例报告表进行识别,能够使病例报告表图像在不同算法下得到所述第一电子病例报告表和所述第二电子病例报告表,能够增加所述电子病例报告表对比单元对所述第一电子病例报告表和所述第二电子病例报告表进行比较的准确性。
[0140]实施例12
[0141]作为本发明其他实施的通用型临床试验电子数据获取方法,在上述通用型临床试验电子数据获取方法的实施例的基础上,,在所述步骤S4之后还包括语法检查的步骤。
[0142]S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出。
[0143]S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。所述语法检查步骤能够对所述第一电子病例报告表或所述第二电子病例报告表中的语句进行语法检查,进一步增加了系统的识别精度。
[0144]实施例13
[0145]作为本发明其他实施的通用型临床试验电子数据获取方法,在上述通用型临床试验电子数据获取方法的实施例的基础上,所述语法检查步骤之后还包括短语核对的步骤,
[0146]S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出。
[0147]S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。
[0148]本实施例能够对第二暂态电子病例报告表中语句的准确性进行校验,有效增加了系统的识别准确性。
[0149]实施例14
[0150]作为本发明其他实施的通用型临床试验电子数据获取方法,在上述包括步骤S61的通用型临床试验电子数据获取方法的实施例的基础上,所述步骤S61中的数据库按照以下步骤生成:
[0151]S5 ’ 1:将关键词语及关键语句预先存储到数据库。
[0152]S5 ’ 2:记录所述随机短语访问数据库的次数,若次数超过预定的η次,则将所述随机短语作为关键词语或者关键语句存储到所述数据库中。该步骤能够根据识别出的关键词语及关键语句及时的对所述数据库中的关键词语及关键语句进行系统的自动补充,具有实时更新适用性强的优点。
[0153]显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
【主权项】
1.一种通用型临床试验电子数据获取系统,其特征在于,包括客户端系统、应用服务器和数据库服务器;其中,所述客户端系统在试验开始前用于访问所述应用服务器,实现受试者随机号分配;所述客户端系统在试验过程中用于访问所述应用服务器,实现受试者药物号分配;所述客户端系统同时负责在试验过程中采集试验数据并在试验结束后收集随访数据,并将采集到的所述试验数据和收集到的随访数据发送给应用服务器,所述应用服务器接收所述试验数据和随访数据并在处理后发送给所述数据库服务器存储;其中, 所述客户端系统还包括电话机,所述电话机与应用服务器相连; 所述应用服务器,还进一步包括: 语音应答模块,在所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过按键输入受试者身份识别号以及通过语音依次输入对受试者随访问题的答案信息,并将接收到的受试者身份识别号和对受试者随访问题的答案信息输出; 语音识别模块,接收所述语音应答模块发送的所述受试者身份识别号和对所述受试者随访问题的答案信息,并对所述受试者随访问题的答案信息进行语音识别,将识别后的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。2.根据权利要求1所述的一种通用型临床试验电子数据获取系统,其特征在于,所述客户端系统包括扫描装置, 所述扫描装置,用于通过扫描试验阶段的纸质病例报告表生成病例报告表图像,并把所述病例报告表图像发送给所述应用服务器; 所述应用服务器包括识别装置; 所述识别装置,接收所述扫描装置发送的病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到电子病例报告表;所述识别装置进一步包括第一 OCR模块、第二 OCR模块和校验模块,其中, 所述第一 OCR模块,对病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表传输给所述校验模块; 所述第二 OCR模块,具有与所述第一 OCR模块不同的识别算法,对所述第一 OCR模块识别的所述病例报告表图像进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表传输给所述校验模块; 所述校验模块,用于对电子病例报告表进行校验,其进一步包括电子病例报告表对比单元和第一核对单元, 所述电子病例报告表对比单元,接收所述第一 OCR模块和所述第二 OCR模块发送的第一电子病例报告表、第二电子病例报告表,对所述第一 OCR模块和所述第二 OCR模块发送的电子病例报告表进行比较校验,经过比较校验后,若所述第一电子病例报告表和所述第二电子病例报告表一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表的形式输出;否则将所述第一电子病例报告表、所述第二电子病例报告表中不一致的内容进行标记后输出给所述第一核对单元; 所述第一核对单元,接收所述电子病例报告表对比单元标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出至所述数据库服务器存储。3.根据权利要求2所述的一种通用型临床试验电子数据获取系统,其特征在于,所述校验模块还包括语法检查单元和第二核对单元, 所述语法检查单元,接收所述第一暂态电子病例报告表,对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出;否则将所述电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出给所述第二核对单元; 所述第二核对单元,接收所述语法检查单元发送的经过语法错误标记的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。4.根据权利要求3所述的一种通用型临床试验电子数据获取系统,其特征在于,所述校验模块还包括随机截取校验单元和第三核对单元,其中, 所述随机截取校验单元进一步包括随机截取模块和数据库, 所述随机截取模块,接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在所述数据库中进行查询,若所述随机短语为关键词语、关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则将所述电子病例报告表中截取的随机短语进行标记后输出; 所述数据库,用于接收关键词语及关键语句并将接到的所述关键词语及关键语句存储; 所述第三核对单元,接收所述随机截取模块发送的标记后的所述第二暂态电子病例报告表,并对其进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。5.根据权利要求1-4任一所述的一种通用型临床试验电子数据获取系统,其特征在于,所述客户端系统包括联网计算机,所述联网计算机用于访问应用服务器,并按照所述应用服务器上的提示录入受试者信息,并将录入的所述受试者信息发送给所述数据库服务器存储; 所述应用服务器进一步包括分配随机号模块,所述分配随机号模块用于从数据库服务器中读取所述受试者信息并根据所述受试者信息,调用随机分配算法将每个所述受试者随机分配到不同的组,并为每个所述受试者分配随机号,最后将分配的随机号通过所述联网计算机反馈给研究者,并将分配的所述随机号存储至所述数据库服务器中。6.—种通用型临床试验电子数据获取方法,其特征在于,包括如下步骤, 试验前阶段,通过客户端系统访问应用服务器,并实现随机号分配; 在试验过程中,通过客户端系统访问应用服务器,并实现受试者药物号分配;通过客户端系统采集试验数据并发送给应用服务器; 试验结束后,通过客户端系统采集随访数据并发送给应用服务器; 所述应用服务器接收所述客户端系统发送的数据并处理后存储至数据库服务器;其中, 试验结束后还包括如下步骤: S20:试验结束后通过电话机访问应用服务器; S21:所述电话机与所述应用服务器建立连接后,根据系统预先录制的提示语音,提示通过按键输入受试者身份识别号以及通过语音依次输入对受试者随访问题的答案信息,并将接收到的受试者身份识别号和对受试者随访问题的答案信息输出; S22:接收所述受试者身份识别号和对所述受试者随访问题的答案信息,并对所述受试者随访问题的答案信息进行语音识别,将识别后的所述受试者随访问题的答案信息和与之对应的所述受试者身份识别号输出至数据库服务器存储。7.根据权利要求6所述的一种通用型临床试验电子数据获取方法,其特征在于,所述客户端系统按照如下步骤采集试验数据; SO:扫描试验阶段的纸质病例报告表以生成病例报告表图像,并将所述病例报告表图像发送; S1:接收病例报告表图像,并对所述病例报告表图像进行图像、文字识别处理得到第一电子病例报告表,将所述第一电子病例报告表输出; S2:接收步骤SI中识别的所述病例报告表图像,并对所述病例报告表图像用不同于步骤SI中的识别算法进行图像、文字识别处理得到第二电子病例报告表,将所述第二电子病例报告表输出; S3:接收所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表进行比较校验;若所述第一电子病例报告表和所述第二电子病例报告表内容一致,则将所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出;否则将所述第一电子病例报告表和所述第二电子病例报告表中不一致的内容进行标记后输出; S4:接收标记后输出的所述第一电子病例报告表和所述第二电子病例报告表,并对所述第一电子病例报告表和所述第二电子病例报告表中标记的不一致的内容进行人工核对更正,将人工核对更正后的所述第一电子病例报告表或所述第二电子病例报告表作为第一暂态电子病例报告表输出至数据库服务器存储。8.根据权利要求7所述的一种通用型临床试验电子数据获取方法,其特征在于,还包括以下语法检查的步骤: S51:接收所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表中的语句进行语法检查,若语法检查结果正确则将所述暂态病例报告表作为第二暂态电子病例报告表输出;否则将所述第一暂态电子病例报告表中经过语法检查不正确的地方进行语法错误标记后输出; S52:接收语法错误标记后输出的所述第一暂态电子病例报告表,并对所述第一暂态电子病例报告表上语法错误标记的内容进行人工核对,将人工核对后的所述第一暂态电子病例报告表作为第二暂态电子病例报告表输出。9.根据权利要求8所述的一种通用型临床试验电子数据获取方法,其特征在于,在所述语法检查步骤之后还包括短语核对的步骤: S61:接收所述第二暂态电子病例报告表,对所述第二暂态电子病例报告表中的语句进行随机截取得到随机短语,并将所述随机短语在预定的数据库中进行查询,若所述随机短语为所述数据库中存储的关键词语或关键语句的全部或一部分,则将所述第二暂态电子病例报告表作为终态电子病例报告表输出;否则,对所述第二暂态电子病例报告表中截取的所述随机短语进行短语核对错误标记后输出; S62:接收短语核对错误标记后输出的所述第二暂态电子病例报告表,并对所述第二暂态电子病例报告表中短语核对错误标记的所述随机短语进行人工核对,将人工核对后的所述第二暂态电子病例报告表作为终态电子病例报告表输出。10.根据权利要求9所述的一种通用型临床试验电子数据获取方法,其特征在于,所述步骤S61中的数据库按照以下步骤生成: S5 ’ 1:将预先确定的关键词语及关键语句存储到数据库; S5 ’ 2:记录所述随机短语访问数据库的次数,若次数超过预定的η次,则将所述随机短语作为关键词语或者关键语句存储到所述数据库中。
【文档编号】G06Q50/22GK105844088SQ201610158254
【公开日】2016年8月10日
【申请日】2013年8月6日
【发明人】刘保延, 何丽云, 文天才, 吕晓颖
【申请人】中国中医科学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1