一种NeeS电子文档的eCTD转换方法、系统和存储介质与流程

文档序号:33507269发布日期:2023-03-18 03:20阅读:127来源:国知局
一种NeeS电子文档的eCTD转换方法、系统和存储介质与流程
一种nees电子文档的ectd转换方法、系统和存储介质
技术领域
1.本发明涉及信息技术领域,尤其涉及一种nees电子文档的ectd转换方法、系统和存储介质。


背景技术:

2.在电子化材料替代纸质材料申报的背景下,ich推行了ectd电子通用技术文档的标准申报格式,并在全球多个国家及地区开始普及ectd格式。ectd是电子化的一种药品申报格式,为药品的质量、安全和有效性方面的通用文件。这是制药企业向药物监管机构进行信息传输的一种形式,其内容需满足通用技术文件(ctd)的要求。申请者首先要将各类资料、数据、实验数据等进行撰写,然后根据相关法规要求构建ectd结构化文档,再由申报负责人通过事先建立好的电子传输通道将申报文件提交至药监部门。在整个过程中,便捷、高效、规范、环保是其主要特点,因此ectd因其在药品注册申报环节中的诸多优势而受到各国国家药审部门的青睐。而伴随着ectd技术的发展,先前的nees方式进行申报(非ectd的电子化提交)也逐步被替换,急需将原有的大量nees方式文档快捷高效的转换成ectd文档,来满足后续使用ectd格式的需求。


技术实现要素:

3.本发明针对现有技术中的不足,提供了一种nees电子文档的ectd转换方法,包括如下步骤:
4.s1,选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹,将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中;
5.s2,进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本,创建区域骨干文件;
6.s3,寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置;
7.s4,分别寻找第二模块内容文件夹、第三模块内容文件夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,添加活性成分、产品、辅料、适应症、研究信息特定目录,生成目标国家法规版本的ectd格式序列文件。
8.优选的,所述原始文件夹包括区域法规文件夹、活性成分文件夹、产品文件夹、辅料文件夹、研究文件夹、适应症文件夹。
9.优选的,所述步骤s3还包括:寻找第一模块内容文件夹的所有目录下存放有实体文档的路径,过滤掉不具有实体文档的空目录,依次对各实体文件匹配对应的ectd规范生成叶标签,用md5进行校验并添加各属性。
10.优选的,所述nees电子文档的ectd转换方法还包括:
11.s5,复制ectd格式序列文件作为待更换的原版本序列文件,识别待更换的原版本
序列文件中的国家法规版本信息,使用目标法规的版本格式建立目标法规文件体系的空白目录,所述目标法规文件体系中包含树形父子节点关系,保留待更换的原版本序列文件并识别原版本文件体系,建立原版本文件体系与目标法规文件体系的一对一文件映射;将原版本序列文件中的实体文件从原版本文件体系中抽离,重新绑定至目标法规文件体系,并生成新的文件路径。
12.优选的,所述步骤s5还包括:
13.s51,识别待更换的原版本序列文件中的国家法规版本信息,所述国家法规版本信息包括国家编号和版本编号,所述原版本序列文件中包括骨架文件和多个模块内容文件夹;
14.s52,使用目标法规的版本格式建立目标法规文件体系的空白目录,所述目标法规文件体系中包含树形父子节点关系,保留待转换的原版本序列文件并识别原版本文件体系,建立原版本文件体系与目标法规文件体系的一对一文件映射;
15.s53,完成文件映射后,将原版本序列文件中的实体文件从原版本文件体系中抽离,重新绑定至目标法规文件体系,并生成新的文件路径。
16.本发明还公开了一种nees电子文档的ectd转换系统,包括:分类模块,用于选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹,将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中;文件创建模块,用于进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本,创建区域骨干文件;信息补入模块,用于寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置;文件生成模块,用于分别寻找第二模块内容文件夹、第三模块内容文件夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,添加活性成分、产品、辅料、适应症、研究信息特定目录,生成目标国家法规版本的ectd格式序列文件。
17.优选的,所述原始文件夹包括区域法规文件夹、活性成分文件夹、产品文件夹、辅料文件夹、研究文件夹、适应症文件夹。
18.优选的,所述信息补入模块还被配置为寻找第一模块内容文件夹的所有目录下存放有实体文档的路径,过滤掉不具有实体文档的空目录,依次对各实体文件匹配对应的ectd规范生成叶标签,用md5进行校验并添加各属性。
19.本发明还公开了一种nees电子文档的ectd转换装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一所述方法的步骤。
20.本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述方法的步骤。
21.本发明公开的nees电子文档的ectd转换方法、系统和存储介质,通过选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹后将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中;然后进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本创建区域骨干文件;然后寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置;再分别寻找第二模块内容文件夹、第三模块内容文件
夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,生成目标国家法规版本的ectd格式序列文件,从而实现根据设定预设规则将nees电子文档转换成ectd格式材料。
22.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
23.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
24.图1为本实施例公开的nees电子文档的ectd转换方法的流程示意图。
25.图2为本实施例公开的澳大利亚的m1法规目录模板示例。
26.图3为一实施例公开的步骤s5的具体流程示意图。
27.图4为本实施例公开的一序列的目录示意图。
具体实施方式
28.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
30.为满足上述nees转换ectd需求,本实施例公开了一种nees电子文档的ectd转换方法,如附图1所示,该方法包括如下步骤:
31.步骤s1,选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹,将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中。其中原始文件夹包括区域法规文件夹、活性成分文件夹、产品文件夹、辅料文件夹、研究文件夹、适应症文件夹。
32.具体的,ectd目录格式主要有这几类需要进行转换:m1区域法规目录、活性成分目录、产品目录、辅料目录、研究目录、适应症目录。本步骤通过预设的定义规则来命名文件夹,使得后续导入程序可以根据文件夹名称进行识别和自动生成不同类型的目录。根据需要转换的国家,下载对应的目录格式,例如附图2所示的为澳大利亚的m1法规目录模板。下面为一些预设规则示例。
33.【国家编号】@【ectd版本编号】:系统自动到m1目录下匹配此规则。au代表针对澳大利亚的ectd申报。@用作分割符号。3.1表示文档试用的ectd版本,不同版本对应的编号及目录名称识别规则不同,系统根据国家和版本自动切换。
34.【编号】-【目录名称】:通过目录编号及名称,如100-correspondence,来规划对应文档需放置的目录。此目录与系统目录自动对应,可以自动将目录下文件放置ectd中。
35.【国家编号】-envelope:通过国家编号,识别对应的信封信息。
36.【信封字段】@【信封字段值】:通过信封字段@信封值得方式,将ectd信封信息补充完整。这个目录允许多层嵌套。
37.【活性成分】@【活性成分缩写】#【生产商】@【生产商缩写】:系统自动到m23-introduction,m32-body-of-data的子目录中匹配此规则,如“布洛芬@ibuprofen#明度智云@mdzy”,用来辨识活性成分是布洛芬,生产商是明度。#号后面的非必填。
38.【产品】@【产品缩写】#【生产商】#【剂型】:系统自动到m23-introduction,m32-body-of-data的子目录中匹配此规则。#号后面的非必填。
39.【辅料】@【辅料缩写】:系统自动到m32p5-control-of-drug-product的子目录中匹配此规则。
40.【适应症】@【适应症缩写】:系统自动到m27-clinical-summary,m53-clinical-study-reports的子目录中匹配此规则。
41.【研究编号】@【研究名称】#【研究类别1】#【研究类别2】:系统自动到m4和m5对应的研究的父目录中,如m4211-primary-pharmacodynamics,m5311-bioavailability-study-reports等目录匹配此规则。#号后面的非必填。若有多个研究类别,则会创建多条记录。研究也根据国家有做区分,如中国、美国,需要系统自动生成stf等格式文件和dataset数据集,欧盟则根据目录名称自动创建扩展节点。
42.经过上述目录整理阶段,相应的文件以及按照作用和类别放置到不同目录中了。
43.步骤s2,进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本,创建区域骨干文件。
44.具体的,进入m1目录,根据规则解析【国家编号】@【ectd版本编号】国家及法规版本,创建au-region.xml文件,并生成《m1-au》标签(其他国家类似)。
45.步骤s3,寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置。
46.在本实施例中,该步骤s3还包括:寻找第一模块内容文件夹的所有目录下存放有实体文档的路径,过滤掉不具有实体文档的空目录,依次对各实体文件匹配对应的ectd规范生成叶标签,用md5进行校验并添加各属性。
47.具体的,寻找m1的所有目录下面有文件的路径,过滤掉空目录。根据【编号】-【目录名称】匹配对应的ectd规范,如100-correspondence则生成《m1-0-correspondence》,1001-cover则生成《m1-0-1-cover》,对应的文件cover.pdf则生成《leaf》标签,系统自动用md5进行校验,并添加各种属性。重复此步骤直到au-region.xml文件包含所有目录和文件。
48.步骤s4,分别寻找第二模块内容文件夹、第三模块内容文件夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,添加活性成分、产品、辅料、适应症、研究信息特定目录,生成目标国家法规版本的ectd格式序列文件。按照前述方式,寻找m2、m3、m4、m5中对应的规则目录,添加【活性成分】、【产品】、【辅料】、【适应症】、【研究】等特定目录。
49.在本实施例中,该nees电子文档的ectd转换方法还包括如下内容。
50.步骤s5,复制ectd格式序列文件作为待更换的原版本序列文件,识别待更换的原版本序列文件中的国家法规版本信息,使用目标法规的版本格式建立目标法规文件体系的空白目录,所述目标法规文件体系中包含树形父子节点关系,保留待更换的原版本序列文
件并识别原版本文件体系,建立原版本文件体系与目标法规文件体系的一对一文件映射;将原版本序列文件中的实体文件从原版本文件体系中抽离,重新绑定至目标法规文件体系,并生成新的文件路径。
51.在本实施例中,如附图3所示,该步骤s5还可包括如下内容。
52.步骤s51,识别待更换的原版本序列文件中的国家法规版本信息,所述国家法规版本信息包括国家编号和版本编号,所述原版本序列文件中包括骨架文件和多个模块内容文件夹。确定原始资料的国家法规及版本号。附图4为待转换的目标序列文件的通常的目录格式,既准备升级的原始资料文件,包含骨架文件index.xml和模块内容文件夹m1-m5等。
53.在本实施例中,该步骤s51可以包括如下内容。
54.在原版本序列文件的第一模块内容文件夹内查询在区域文件夹中是否存在区域骨架文件,若存在则识别所述骨架文件中带有的国家编号和版本编号,否则在第一模块内容文件夹内的工具文件夹中寻找dtd或xsd格式文件,并从该dtd或xsd格式文件中识别国家编号和版本编号。
55.如果未检索到工具文件夹中的dtd/xsd格式文件或未识别出国家编号和版本编号,则根据带有国家特征内容的目录或文件恢复对应的区域骨架文件,并再次识别国家编号和版本编号。将识别获取的国家编号和版本编号,匹配系统数据库中对应的受支持转换的目标法规版本。
56.步骤s52,使用目标法规的版本格式建立目标法规文件体系的空白目录,所述目标法规文件体系中包含树形父子节点关系,保留待转换的原版本序列文件并识别原版本文件体系,建立原版本文件体系与目标法规文件体系的一对一文件映射。
57.具体的,该步骤可以包括:
58.使用目标法规的版本格式建立目标法规体系内的各空白文件夹和支撑文件,所述空白文件夹中包含多个模块内容文件夹,使用树形结构定义各空白文件夹的父子级关系并确定兄弟间先后顺序。具体的,先使用目标法规的版本格式如us-ver3.3,建立目标法规体系的空白目录如模块内容文件夹m1-m5、和其他必须文件如util内的格式定义文件,使用树形结构定义体系文件的父子级关系,并严格确定兄弟间先后顺序。
59.保留待转换的原版本序列文件并通过读取目录文件和区域骨架文件识别原版本文件结构体系,所述原版本文件结构体系包括文件夹信息、叶节点属性和上下级关系。
60.将原版本文件结构体系一对一映射到目标法规文件结构体系中,若无法完成全部映射则获取无法映射的第一文件夹属性,查询现行法规数据库中记录的关联第一文件夹的结构调整记录,对相关文件夹对应修改后再次进行关系映射。其中该步骤中包括多次关系映射过程,具体如下:
61.将原版本文件结构体系内各文件夹分别映射到目标法规文件结构体系中,若目标法规文件结构体系中存在与原版本文件结构体系中的原始文件夹名称和路径位置相同的目标文件夹,则该原始文件夹映射成功。如果原版本文件结构体系中存在无法映射的第一文件夹,查询法规历史数据库中记录的第一文件夹在原法规版本至目标法规版本间的结构调整记录。根据所述结构调整记录查找并获取对应的系统文件调整规则,对第一文件夹和/或相关文件夹按对应系统文件调整规则进行修改,对修改后形成的第二文件夹进行再次关系映射。
62.如果结构调整记录中包含第一文件夹和关联文件夹的合并记录,则获取合并记录中关联文件夹信息和合并后的目标文件夹信息,根据系统文件调整规则中的合并规则对第一文件夹和关联文件夹进行合并后映射到目标文件夹。
63.在本实施例中,如果结构调整记录中包含对第一文件夹的拆分记录,则提取目标法规文件结构体系中未实现映射的各文件夹名称的映射关键词,将各映射关键词与第一文件夹名称和/或第一文件夹内各文档名称进行匹配,获取包含在第一文件夹名称或其内部文档名称中的关键词对应的多个目标文件夹,作为所述第一文件夹的映射目标。
64.如果结构调整记录中包含对第一文件夹的取消记录,则识别第一文件夹名称和内部各文档名称并提取对应的匹配关键词,并根据所述匹配关键词在数据库中查询获取联想关键词,将所述匹配关键词和联想关键词分别与目标法规文件体系中未实现映射的各文件夹名称进行匹配,若匹配成功则将其作为所述第一文件夹的映射目标。
65.步骤s53,完成文件映射后,将原版本序列文件中的实体文件从原版本文件体系中抽离,重新绑定至目标法规文件体系,并生成新的文件路径。在文件映射结束后,将原版本序列文件中的实体文件即原始格式的文件从原先的树形结构体系内抽离,绑定目标文件的树形结构体系,并生成新的文件路径。识别原始index.xml的leaf标签,抽离文件的基本属性如title、operation、id等。直到所有文件解析完毕,则将在系统内生成对应的目录和文件节点,并记录原始文件的相关属性。当原始序列导入后,系统支持手动调整位置有误的文件,并重新配置其关联关系。如果有多个序列文件需要导入,如0000,0001,0002等,则按顺序依次参考如上各实施例中步骤进行版本转换或升级来导入。上述通过建立原版本文件体系与目标法规文件体系的一对一文件映射;在完成文件映射后将原版本序列文件中的实体文件从原版本文件体系中抽离,重新绑定至目标法规文件体系并生成新的文件路径,实现了采用不同版本的ectd电子申报材料在不同法规版本间的兼容转换。
66.本实施例公开的nees电子文档的ectd转换方法,通过选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹后将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中;然后进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本创建区域骨干文件;然后寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置;再分别寻找第二模块内容文件夹、第三模块内容文件夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,添加活性成分、产品、辅料、适应症、研究信息特定目录,生成目标国家法规版本的ectd格式序列文件。实现根据设定预设规则将nees电子文档转换成ectd格式材料。
67.在另一实施例中,还公开了一种nees电子文档的ectd转换系统,包括:分类模块,用于选择需要转换的国家并下载对应的国家法规版本模板,根据预设定义规则建立和命名各原始文件夹,将待转换的nees电子文档按照作用和类别分别放入各原始文件夹中;文件创建模块,用于进入国家法规模板的第一模块内容文件夹目录,根据规则解析所述国家及法规版本,创建区域骨干文件;信息补入模块,用于寻找第一模块内容文件夹中的信封信息规则目录,并解析信封目录中的文档,补入至区域骨干文件内的信封信息填写位置;文件生成模块,用于分别寻找第二模块内容文件夹、第三模块内容文件夹、第四模块内容文件夹、和第五模块内容文件夹中对应的规则目录,添加活性成分、产品、辅料、适应症、研究信息特
定目录,生成目标国家法规版本的ectd格式序列文件。
68.在本实施例中,原始文件夹包括区域法规文件夹、活性成分文件夹、产品文件夹、辅料文件夹、研究文件夹、适应症文件夹。
69.在本实施例中,信息补入模块还被配置为寻找第一模块内容文件夹的所有目录下存放有实体文档的路径,过滤掉不具有实体文档的空目录,依次对各实体文件匹配对应的ectd规范生成叶标签,用md5进行校验并添加各属性。
70.需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的nees电子文档的ectd转换系统而言,由于其与实施例公开的对nees电子文档的ectd转换方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
71.在另一些实施例中,还提供了一种nees电子文档的ectd转换装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述各实施例中描述的nees电子文档的ectd转换方法的各个步骤。
72.其中nees电子文档的ectd转换装置可包括但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是nees电子文档的ectd转换装置的示例,并不构成对nees电子文档的ectd转换装置设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述nees电子文档的ectd转换装置设备还可以包括输入输出设备、网络接入设备、总线等。
73.所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述nees电子文档的ectd转换装置设备的控制中心,利用各种接口和线路连接整个nees电子文档的ectd转换装置设备的各个部分。
74.所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述nees电子文档的ectd转换装置设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
75.所述nees电子文档的ectd转换装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个nees电子文档的ectd转换方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实
体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
76.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
77.总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1