智能化受试者凭证文件隐私保护与高效转录方法及其系统与流程

文档序号:37003933发布日期:2024-02-09 12:49阅读:16来源:国知局
智能化受试者凭证文件隐私保护与高效转录方法及其系统与流程

本发明属于临床实验,尤其是涉及一种智能化受试者凭证文件隐私保护与高效转录方法及其系统。


背景技术:

1、传统临床实验中,受试者凭证文件可能包含个人隐私信息,例如身份证号、姓名等。这些敏感信息的泄露可能导致严重的隐私问题,甚至引发法律责任。随着临床实验的不断推进,为避免导致严重的隐私问题,受试者凭证文件的处理成为了一个不容忽视的环节。

2、传统处理受试者凭证文件的方式主要是人为进行的,例如,由专门的负责人接收用户上传的受试者凭证文件,将受试者凭证文件中的信息进行提取并转录至临床实验管理数据库中。在这个过程中,首先受试者凭证文件会暴露在所有负责人面前,存在较高的受试者信息泄露风险;其次,在完成录入以后,传统方案中,对受试者凭证文件的处理方式是不加密保存在文件库中的,任何人都可以轻易拿到原始文件,这又提升了信息泄露风险;最后,转录过程需要负责人从受试者凭证文件中提取信息,需要消耗大量的人力资源,而由于这个过程耗费了大量工作人员的时间和精力,所以需要更多的工作人员负责处理,而这就增加了信息泄露的风险。

3、目前市面上虽然有一些敏感词汇过滤方案,但是存在行业属性不兼容的问题,例如,市面上的黄政暴词汇过滤软件并不适用于本方案的临床试验凭证文件的方案。而且简单的敏感词过滤并不能同时解决隐私、工作量和转录准确性等问题


技术实现思路

1、本发明的目的是针对上述问题,提供一种智能化受试者凭证文件隐私保护与高效转录方法及其系统。

2、一种智能化受试者凭证文件隐私保护与高效转录方法,该方法包括:

3、s1.接收受试者上传的受试者凭证文件;

4、s2.对所述受试者凭证文件进行区域划分得到转录区域和其他区域;

5、s3.对转录区域进行转录信息识别和提取;

6、对其他区域进行隐私信息识别;

7、s4.对受试者凭证文件的隐私信息部分进行隐私化处理,以在用户请求时向用户发返回打码后的受试者凭证文件;

8、s5.根据当前受试者身份将提取的转录信息转录至实验管理数据库。

9、通过上述过程实现了一种能够同时实现受试者凭证文件隐私保护和高效将其转录至实验管理数据库的方案,并且通过先分区,再分别处理的方式,能够简化处理步骤,通过更简单的过程,更低的算力同时实现隐私保护和高效转录的目的。

10、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s2中,通过如下方式进行区域划分:

11、检测受试者凭证文件,识别文件中的文本区域和边界框;

12、得到至少两个文本区域;

13、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s2中,通过使用经过训练的ocr模型检测受试者凭证文件并识别文件中的文本区域和边界框;

14、通过使用经过训练的自然语言处理模型、文本检测模型或规则库匹配算法中的任意一种或多种的组合判断各文本区域属于转录区域还是其他区域。

15、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s3中,通过如下方式对转录区域进行转录信息识别和提取:

16、通过ocr模型对转录区域进行文本布局分析;

17、ocr识别进行文字、字段、段落的提取;

18、对识别的文本进行坐标建系;

19、基于坐标系对识别出的文本进行k-v结构化处理,k为项目名称,v为对应的指标项值;

20、通过上述方案,能够有效提高转录信息处理的效率。

21、步骤s3中,通过如下方式对其他区域进行隐私信息识别:

22、文本预处理,去除多余的符号;

23、文本分词,使用nlp技术对经过预处理后的文本进行字、词划分;

24、语法分析,基于经过训练的模型和规则库匹配敏感词汇;

25、信息提取,对匹配到的敏感词汇进行文本提取;

26、准确性校验,对提取的敏感信息进行业务校验。

27、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,所述的受试者凭证文件为jpg格式、png格式、pdf格式中的任意一种;

28、所述的隐私信息包括受试者姓名、年龄、住址、身份证号码、性别、送检科室、检验医生中的任意一种或多种信息;

29、所述的隐私化处理为对隐私部分进行打码处理。

30、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s1中,接收到受试者上传的受试者凭证文件后,将所述的受试者凭证文件进行加密处理;

31、步骤s4中,对受试者凭证文件的隐私部分隐私化处理后,将经过隐私化处理和加密处理的受试者凭证文件保存至待处理数据库。

32、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,本方法还包括,将所述的受试者凭证文件保存至待处理数据库后通知对应工作人员进行处理;

33、步骤s4中,将对转录区域进行处理得到的v-k结构信息与相应的凭证文件一同保存至待处理数据库;

34、步骤s5中,接收到针对受试者凭证文件的处理请求时,向工作人员展示经过隐私化处理的受试者凭证文件,以及为工作人员提供系统提取的k-v结构信息;

35、在工作人员基于受试者凭证文件确认k-v结构信息无误后根据受试者身份信息将转录信息存储至实验管理数据库。

36、通过上述技术方案,在隐私处理的过程中同步进行转录处理,工作人员进行处理时能够实现快速响应,避免批量处理过程中漫长的加载过程,提高工作人员批量处理的效率。

37、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s5之后还包括:

38、转录成功后,将转录结果反馈至上传受试者凭证文件的受试者端。

39、在上述的智能化受试者凭证文件隐私保护与高效转录方法中,步骤s5之后还包括:

40、转录信息转录以后,通知下一审批流程的相关人员进行凭证文件的审批;

41、每一步审批通过以后均自动通知下一审批流程的相关人员;

42、所有审批流程通过以后跳转至第三方支付系统以向相应受试者发放此凭证文件相关补助。

43、通过上述方案,可以实现上传、转录、审核、补助发放流程无障碍高效运作,有效提高实验过程这一环节的效率。

44、一种智能化受试者凭证文件隐私保护与高效转录系统,该系统连接于实验管理数据库和待处理数据库,并通过所述的方法实现受试者凭证文件的隐私保护和高效转录。

45、本发明的优点在于:

46、1、通过对凭证文件进行区域划分的方式划定隐私区域,然后对隐私区域进行隐私处理,可与转录处理工作同步进行,划分隐私区域的同时划分出转录区域,从而快速对转录区域进行信息识别和提取,提高系统处理的效率,减少系统同时实现隐私处理和转录处理的算力消耗;

47、2、通过隐私和转录同步处理的方式,使处理人员在进行处理时能够得到快速响应,提高处理人员批量处理的效率;

48、3、通过自动化打码和加密等技术,确保在凭证文件的处理过程中,敏感信息得到充分的保护,避免信息泄露风险;

49、4、通过智能化的自动化系统,快速而准确地将凭证文件信息转录到系统中,从而提高操作效率和数据的可靠性;

50、5、通过引入自动化的凭证文件处理系统,此发明有望优化资源利用,释放人力资源以从事更有价值的工作,如实验的设计和分析,从而提升实验整体效益;

51、6、不仅能够有效保护受试者的隐私信息,提高操作效率和准确性,还能优化资源利用并简化操作流程,为临床实验管理带来切实可行的创新解决方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1