一种图像数据仓库管理方法

文档序号:6584678阅读:188来源:国知局
专利名称:一种图像数据仓库管理方法
技术领域
本发明属于图像处理技术领域,涉及图像数据仓库管理方法。
背景技术
计算技术的发展以及计算机硬件性能的提高极大的促进了模式识别、人工智能、 数据挖掘以及图像处理等研究领域的发展,使得机器学习可以在超大样本训练集上进行, 从而获得更具特异性和敏感性的分类特征以及识别结果。随着机器学习训练样本集的增大,对样本集数据仓库的管理也将是至关重要的问 题,它将直接影响数据的存储以及检索提取的效率,如果没有高效的数据仓库管理方法,将 无疑为后续针对数据仓库的机器学习研究设置了巨大的瓶颈。根据马尔的视觉理论,人获取的外部信息70% -80%来自人的视觉系统(也即是 图像),因此模式识别的主要研究问题之一是针对图像内容的理解。例如在计算机人脸识别 问题的研究中,图像数据仓库中往往需要存储大量不同的人群(种)、在不同的角度和光照 条件以及不同的表情的图像数据;在针对医疗图像的研究中,针对某个组织结构或者某种 病变的研究,也往往需要不同医学成像模式(比如计算机断层成像、磁共振成像等)、在不 同成像参数以及在不同发育阶段/病程的图像资料。因此,针对图像的研究内容势必涉及 规模巨大的图像数据仓库以及与数据仓库匹配的图像数据仓库管理方法。现有的图像数据仓库管理方法都缺少高效的数据存储以及检索获取方式。如美 国国家标准与技术研究所公布的人脸数据仓库(http://faCe. nist. gov/),该数据仓库 是以数据信息组成文件名的方式实现数据分类与查找,由于图像数据的属性信息只存在 于文件名中,该方法限制了查找的高效性和数据属性描述的可扩展性;再如由美国国家生 物影像与生物工程研究所等单位发起的老年痴呆病的神经影像研究计划(http://www. adni-info. org/),大量的医学图像数据存储在服备器端,检索i寸稈都是通i寸服备器端的计 算机程序完成,这种方式无疑增加了服务器的负担,尤其是外部访问量增大时,这种检索速 度的影响将尤为明显。因此总的归纳起来,目前已有图像数据仓库管理方法存在以下不足1.针对图像数据的描述方案不能方便的随意扩展,使其不能满足基于图像数据的 科学研究对图像数据描述特征属性多样性的需求;2.影像图像数据的存储以及编号不能反映图像数据之间的关联性,比如不同时间 点或者不同图像采集模式所得到的图像数据之间的关系,不能很好的得到体现;3.图像数据在服务器上的上传和下载过程都在服务器端完成,这种设计增加了服 务器端的负担,影响了针对数据仓库的上传、检索和下载速度;4.当用户需要从众多图像数据检索结果中有选择性的下载部分结果时,没有很好 的选择性的批量下载的方法。因此,针对计算机图像处理研究的背景需求,以及目前已有图像数据仓库管理方 法的不足,我们提出了一种新的图像数据仓库管理方法。

发明内容
为了解决现有技术中图像数据仓库检索效率不高、存储/检索关键词扩展性不 好,以及数据与数据之间关联不明确的问题,本发明目的是提出一种基于文本的可扩展、可 以高效存储/检索/下载的图像数据仓库管理方法。为达成所述目的,本发明提供一种图像数据仓库的管理方法,是利用基于文本的 图像数据描述信息,对影像图像数据仓库进行快速高效的管理,该管理过程包括图像数据 图像数据描述文件的生成、图像数据的上传、图像数据的关键词检索和图像数据的下载;该 方法分成图像数据上传和图像数据下载两路工作,实现的步骤如下其中图像数据上传包括步骤sul 客户端启动图像数据上传操作准备上传新图像数据,并连接到将要操 作的服务器;步骤SU2 利用锁对所操作服务器的图像数据仓库进行加锁的操作,如果加锁操 作成功,使得同一时刻只有一个客户端具有对图像数据仓库进行更改性操作的权限;如果 加锁操作不成功,客户端不具有对图像数据仓库进行更改性操作的权限;步骤SU3 客户端用更改性操作的权限对图像数据仓库进行更改性操作,由客户 端客先从服务器端下载索引文件,把客户端索引文件和服务器的索引文件的时间属性进行 比对,如果比对的时间属性一致,客户端的图像数据索引文件与服务器的索引文件内容相 同,如果比对的时间属性不一致,则用服务器端的索引文件覆盖客户端的索引文件,用于保 证所有的更改性操作是在最新的图像数据仓库进行;最后在客户端上形成的图像数据索引 文件;步骤su4:客户端先输入新采集图像数据的名称,客户端会在客户端的索引文件 中检索该名称是否已经存在,得到检索结果,由客户端的用户判断新采集的图像数据与服 务器端已有的图像数据是否有关联性;如果没有关联性,将直接对新采集图像数据进行累 积编号为RCCM(X1X2X3X4. . . xn+l)_sMRI ;如果存在相关性,针对检索结果中列举的已有的相 关联的图像数据,客户端的用户根据新采集图像数据的名称选择该新采集图像数据的第 k次采集,然后在已有编号后再加上被试采集次数后缀k,生成新采集图像数据的编号为 RCCMXlx2x3x4. . . xn_sMRI_k,式中,RCCM表示数据所属单位,xix2x3x4. . . xn表示已有数据编号, 其中n和k为自然数,sMRI是图像数据中图像类型的缩写,因此不同领域的不同图像类型 该缩写会相应的不同;步骤su5 以对新采集图像数据生成的RCCM(X1X2X3X4. . . xn+l)_sMRI或 RCCMXlx2x3x4. . . xn_sMRI_k编号为新采集图像数据的描述文件开头,并生成用户对图像数据 仓库检索所需要的关键词及其键值,关键词表示数据一种特征的类别、与关键词对应的键 值表示该特征的类别对应的属性值,生成的新图像数据描述文件是纯文本文件;步骤SU6 客户端用户把新采集图像数据描述文件放入该新采集图像数据所在的 文件夹,然后把该文件夹一起上传到服务器端的图像数据仓库;步骤SU7 服务器端图像数据有新图像数据上传后,服务器端根据本次更新所在 的客户端的用户指令相应的更新该图像数据仓库的索引文件,图像数据仓库索引文件的更 新过程就是检索该图像数据仓库中用户指定的时间内的所有存在更新的目录以及该目录
5中对应的图像数据的描述文件,得到被更新的新描述文件,再分别提取被更新的新描述文 件以及对应的存放路径并与该服务器端已有的索引文件进行比较,如果存在图像数据编号 重复,则用被更新的新描述文件及其路径覆盖服务器端已有的索引文件的相应内容;如果 编号不重复,则把被更新的新描述文件及其路径添加到服务器端已有的索引文件中,从而 得到整个图像数据仓库的被更新的新索引文件,至此,更新图像数据仓库索引文件完毕;步骤SU8 把步骤su2中设置的锁打开,客户端释放对服务器端的控制权限,使得 其它用户对该服务器数据仓库有更新权限,从而对图像数据仓库解锁;其中图像数据下载包括步骤sdl 客户端的用户启动图像数据下载操作,并连接到将要操作的服务器;步骤sd2 客户端的用户把客户端的图像数据索引文件与服务器端的图像数据索 引文件进行同步操作,在客户端生成最新的索引文件,使得客户端的图像索引文件与服务 器端的图像数据索引文件内容完全相同,从而保证用户的检索过程在最新的图像数据仓库 上进行;步骤sd3 用户在客户端得到了最新的索引文件后,输入要检索的关键词和键值 进行搜索,得到满足关键词键对的图像数据目录列表;步骤sd4 客户端的用户对图像数据目录列表中的图像进行预览,以确定搜索的 结果是否为自己预期的结果;步骤sd5 在搜索得到的图像数据目录列表中,采用文件夹复选框复选所有需要 的图像数据,对所需要的图像数据进行批量下载。其中,所述加锁和解锁的操作是在图像数据仓库入口设置一个命名为“加锁”的布 尔变量,当该布尔变量为“真”时,该图像数据仓库暂时被加锁而不能被另外用户同时访问; 当所述更改性操作结束,图像数据上传完成时,该布尔变量被设置为“假”,则图像数据仓库 处于“解锁”状态。其中,所述的客户端的图像数据索引文件与服务器的索引文件内容相同是当存在 有多个不同的图像数据仓库时,客户端的图像数据索引文件是由所有的图像数据仓库的索 引文件组成。其中,所述图像数据描述文件是用户把上述图像数据编号以及关键词键值对手 写成图像数据描述文件,或者是设计表格让用户填表,然后让计算机程序语言成图像数据 描述文件。其中,所述需要的关键词表示不同领域采集图像数据根据实际需求对关键词的描 述有所不同,用户按照关键词键值的书写规则扩充关键词键值键值对,用以扩展针对新 来采集图像数据的关键词的描述能力,从而生成针对新采集图像数据的描述文件。其中,所述同步操作就是把各个图像数据仓库的图像数据索引文件下载到客户 端,然后根据这些索引文件生成统一的一个总体索引文件,该总体索引文件是各图像数据 索引文件拼接而成。其中,所述文件夹复选框复选所有需要的图像数据,当客户端的用户也许需要所 有结果中的多个结果,这时用户复选中搜索到的所需要的结果,进行一次性下载。本发明的有益效果a,图像数据描述文件中图像数据之间关联性的描述方法。不同批次采集的图像数据往往具有时间/和空间点上的关联性,本发明以对数据进行多段编号的方式实现不同批 次图像数据之间的关联性描述;生成的图像数据的编号形式为RCCMX1X2X3X4. . . xn_sMRI_k, 式中,RCCM表示数据所属单位,XlX2X3X4...Xn表示一级数据编号,其中n,k为自然数,sMRI 是图像数据中图像类型的缩写,因此不同领域的不同图像类型该缩写会相应的不同;如果 两组数据编号的X1X2X3X4. xn字段相同,则表明它们之间有一级关联,如果sMRI字段也相 同,则表明它们有二级关联,最后字段k表示在前述所有类别属性相同情形下的第k次数据 采集;b,图像数据由客户端上传至服务器端的过程,用户不用设置/记录图像数据在服 务器端存储的实际路径,这个路径将在图像数据仓库索引文件生成的过程中由该发明方法 自动识别。某一图像数据仓库被更新后,该发明方法会相应的更新该图像数据仓库的索引 文件。该过程就是检索该仓库中的所有目录以及该目录中对应图像数据的描述文件。分别 提取所有描述文件以及对应的存放路径,得到整个图像数据仓库的索引文件。当然,实际 操作中,服务器端的索引文件在每次更新的时候并不需要对整个图像数据仓库进行全程扫 描,只需要对本次更新操作所涉及的图像数据进行遍历即可,这种局部扫描可以通过检查 文件夹的“时间”属性来完成,比如设计成仅仅扫描2小时以内更新过的文件夹。c,针对每个图像数据仓库独立的生成该仓库的图像数据索引文件,然后在客户端 生成统一的镜像文件。用户每次对图像数据仓库进行检索时,需要先把本地图像数据索引 文件和服务器端的索引文件进行同步操作。该方法用以保证用户每次的图像数据检索操作 都是在本地进行,从而从根本上减轻了服务器端的负担,保证了检索的效率。同步操作就 是把各个图像数据仓库的图像数据索引文件下载到本地客户端,然后根据这些索引文件生 成统一的一个总体索引文件,该总体索引文件可以是各图像数据索引文件直接简单拼接而 成。d,整个检索过程都是基于关键词进行,关键词可以随时进行更新和调整,尤其是 对于新添加的图像数据,用户可以根据需要重新设置关键词,从而保证了图像数据管理方 法具有很好的可扩展性。例如,基于影像的神经精神疾病的研究常涉及关键词如附图4和 附图6所示,当然用户可以随时添加新的“关键词键值”对来满足对新入组图像数据的特 征描述需求。


图1是本发明方法总体流程示意图。其中左侧框表示需要对图像数据仓库进行读 /写操作的用户,SU*表示整个图像数据上传过程的各步骤编号,sd*表示整个图像数据下 载过程的各步骤编号。图2是本发明方法生成图像数据序号流程图。图3是本发明客户端图像数据索引文件与服务器端图像数据索引文件同步过程 的示意图。图4是本发明方法客户端图像数据索引文件组织结构示意图。图5是本发明方法检索结果以含有复选框的树状形式显示,以方便用户对所需结 果的批量下载。
图6是图像数据示例描述文件。
具体实施例方式为了便于对本发明的理解,下面结合附图详细说明本发明技术方案中所涉及的各 个细节问题。应指出的是,所描述的实施例对本发明不起任何限定作用。下面介绍本发明的实施例,本发明实施例仅举例应用于医学影像学数据图像数据 管理的系统。但本发明实施例不仅限于此,应用于其他技术领域在此不再赘述。应用于医学影像学数据图像数据管理的系统,针对医学影像数据图像数据的临床 应用研究,包括疾病分析(老年痴呆、精神分裂症等),以及行为研究,如大脑思维活动的原 理、智商与脑区的关系等,它们都是根据影像数据图像数据在统计学意义上得出的统计结 论,因此这些研究所面临的一个重要的平台问题就是海量数据图像数据仓库的管理,包括 影像数据图像数据的存储、检索、或者统计等。如图1框图,描述了整个发明系统架构和流程。步骤SU*表示用户对图像数据仓库进行图像数据上传更新等操作过程的各步骤, sd*表示用户从图像数据仓库检索下载所需图像数据操作过程的各步骤。步骤su2和su8 是对所操作的图像数据库进行加锁和解锁的操作,这是为了实现对同一个图像数据仓库只 能同时有一个用户进行更改性操作,目的是为了保证图像数据存储描述的唯一性。在对图 像数据仓库进行更改性操作的开始对该仓库进行加锁,该操作完成后对该仓库进行解锁, 从而释放更改性操作权限。步骤sul 用户启动图像数据上传到图像数据仓库的操作;步骤su2 利用数字锁对所操作的图像数据库进行加锁和解锁的操作;,通过在图 像数据仓库入口设置一个命名为“加锁”的布尔变量,当该布尔变量为“真”时,该图像数据 仓库暂时被加锁而不能被另外用户同时访问;当上述更改性操作结束,图像数据上传完成 时,该布尔变量被设置为“假”,处于“解锁”状态,使得同一时刻只有一个用户对图像数据仓 库进行更改性操作;步骤SU3 同步操作让用户使用的客户端的图像数据索引文件与服务器端的索引 文件保持同步,用于保证所有的更改性操作是在最新的图像数据仓库进行。同步操作就是 把各个图像数据仓库的最新的图像数据索引文件下载到本地客户端,然后根据这些索引文 件生成统一的一个总体索引文件,该总体索引文件可以是各图像数据索引文件直接简单拼 接而成;同样地,服务器端的图像数据仓库在每次更新后都要对该服务器端的图像数据索 引文件进行更新操作,这将产生步骤su3中客户端索引文件更新的源。服务器端的索引文 件在每次更新的时候并不需要对整个图像数据仓库进行全程扫描,只需要对本次更新操作 所涉及的图像数据进行遍历即可,这种局部扫描可以通过检查文件夹的“时间”属性来完 成,比如设计成仅仅扫描2小时以内更新过的文件夹。这种设计思想能很好的保持客户端 和服务器端的图像数据始终同步,也避免了用户在每次连接图像数据仓库的时候进行临时 更新索引文件而造成的长时间等待,尤其是在图像数据仓库比较大的时候,这种等待时间 将不可忽视。最后在客户端上形成的图像数据索引文件如图4所示,表明了图像数据编号、 路径,以及其它与配置文件相关的信息。详细的操作流程在图3中有具体说明,在下面的章 节中也将有详细介绍。步骤su4是对待上传的图像数据进行唯一性编号,该编号既要考虑唯一性,也要 考虑某些图像数据之间的关联性,比如为了开展针对某一慢性疾病在连续时间点上的跟踪
8研究,可能会涉及该被试者的多次图像数据采集,这些图像数据间的关联性要从编号上能 够体现,使得用户在使用图像数据时能对图像数据属性一目了然。该发明方法采用了分段 编码的方式,具体在图2中有详细描述,在接下来的分部介绍中也会进一步详细说明。步骤su5是图像数据描述文件的生成,它将会产生用户所需要的关键词及其键 值,这是针对图像数据仓库检索的基础。这类关键词是根据发明者所在研究组近10年的经 验设计的,而且具有很好的可扩展性。考虑到随着科学技术的发展,新的神经精神疾病以及 新的参数指标都会涌现出来,这样只需要简单的按照“关键词键值”的书写规则进行扩充 即可。步骤su6中,当生成了与图像数据相关联的图像数据编号以及图像数据描述文件 以后,用户便可以连同图像数据一起上传到图像数据仓库,并且,在理论上,上传时用户并 不需要关心图像数据具体的存放位置,因为服务器端在更新其索引文件时会自动检查图像 数据的具体存放路径。图像数据下载过程是相对简单的。用户首先需要经过步骤sd2,把客户端的图像数 据索引文件同服务器端的图像数据索引文件进行同步,使得保证用户的检索过程是在最新 的图像数据仓库上进行的。然后通过步骤sd3输入要检索的关键词和键值进行搜索,通过 步骤sd4进行预览,最后步骤sd5下载所需要的结果。为了方便用户对所需要的图像数据 进行批量下载,发明方法设计了文件夹复选框,可以复选所有需要的结果来批量下载。图5 中有搜索结果示意图。图2-图5分别解释了图1中几个重要步骤的示例操作过程。用户上传图像数据到图像数据仓库只需要简单的填写一个图像数据描述文件即 可;同样的,用户查询并下载所需要的图像数据,也只需要键入自己所期望的关键词即可, 并且下载之前还能方便的预览所检索到的图像。本发明医学影像图像数据管理的方法,它 集成了图像数据的上传、图像数据序号生成、图像数据描述文件的生成、图像数据检索、图 像数据预览以及图像数据下载等系列操作过程;用户在上传图像数据时,不需要考虑具体在服务器上的存储位置,可以随意存放 在服务器中,该系统会根据上传图像数据自带的文件自动生成检索索引,方便用户进行高 效的检索;用户在上传图像数据时,该发明方法会根据用户输入的被试者姓名进行本地图像 数据索引文件查询,核实在图像数据仓库里是否有同一个被试者的图像数据,然后详细列 举出这些图像数据的描述文件,提醒该上传图像数据是否是同一个被试所在不同时间点上 的连续采集(例如针对某疾病病人的跟踪随访),让用户决定是否对图像数据进行关联性 编号;如果是,系统将对该图像数据生成用户可以识别的二级编号;图像数据描述文件文件中有一个专门的“备注”分区,标识为“#描述区”,这是为 了满足影像图像数据的多样性的需求,例如,有的图像数据是针对某个具体的实验任务设 计进行的,可以在此部分进行描述,系统同样可以根据关键词检索;图像数据描述文件的生成可以通过一个简单的操作界面进行,而且大部分内容都 是可以通过下拉菜单直接选择;界面中的填写内容按照临床扫描的格式进行了分区,直观 明了 ;图像数据检索的关键词可以是关键词选项(item),也可以是关键特征词(keyword);后者主要是针对” #描述区”进行;图像数据搜索查询可以是在本机上进行,也可以是在拥有登录(下载)权限的远 程FTP上进行;为了实现从图像数据仓库的高速下载,系统开启了多线程设置。当然,这需要对方 图像数据仓库服务器允许使用多线程下载;系统会对根据关键词检索到的结果以树状目录显示,并且用户可以实时预览图像 数据图像及对应的图像数据描述文件;在搜索结果的树状目录中,用户可以在某个文件夹上鼠标右键选择“单层下载”或 者“递归下载”,从而实现只下载该级目录中的子文件或者递归下载该目录下的所有文件及 子文件夹内容;为了方便批量下载搜索结果中的多个文件夹的图像数据,系统在所有的文件夹节 点上会设置复选框(checkbox),使得用户可以方便的下载所有选中的内容;为了提高图像数据关键词检索效率,避免每次针对服务器检索检索都在远程的 FTP上进行,用户可以选择在本地硬盘上生成数据描述索引文件,由于都是纯文本文件,所 以并不占用过多的硬盘空间;针对医学影像处理的研究往往会涉及大量的影像学图像数据,尤其是针对临床应 用,通常会采用大样本的影像图像数据,包括大群体的被试,或者单个被试的多个时间点的 图像数据采集。因此这就迫切的需要一个图像数据仓库管理的软件系统,来解决包括图像 数据的存储、检索、预览以及下载等系列操作过程。本发明为了解决上述问题而提出,研究组在研究积累上总结出来的图像数据管理 系统。该系统主要分为三部分图像数据上传、图像数据检索以及图像数据下载。图像数据上传图像数据上传部分主要解决相应图像数据描述文件的生成,由于上传过程并不需 要用户考虑图像数据在服务器上的存储位置,图像数据的检索过程主要就是依据索引文件 进行。该索引文件中不但包含了常规数字成像和交换格式(以下简称DIC0M)头文件中的 主要信息,例如用户姓名,联系方式以及一些扫描参数等,而且包含了针对医学影像研究更 有用的专门信息,例如被试的病理以及病程,是否服药,智商(以下简称IQ),实验室设计以 及被试的行为或情感量表评分等,由于这些信息在基于影像的疾病研究或者行为分析中起 到核心作用,所以这类图像数据描述文件往往比DIC0M头文件更具有研究价值。图像数据描述文件的生成也包含图像数据编号(序号)的生成,该序号与图像数 据是一一对应的。医学影像图像数据分析中,常常会涉及针对某一被试的跟踪随访,比如对 阿尔茨海默病(AD)的研究,从正常人(Normal),发展为轻度认知损害(MCI),再到AD,这个 过程通常会持续多年的时间,从MCI发展到AD大约是3年至5年的时间,这期间人脑在影 像学上会有许多相应的结构以及功能上的变化,比如脑皮层厚度以及复杂度的变化,海马 体部分的膨胀或者萎缩,脑区功能上的活动变化或者功能连接变化。因此整个研究过程将 会多次对被试进行脑影像扫描,包括结构磁共振(sMRI),功能磁共振(fMRI),以及扩散磁 共振(dMRI)等。这些图像数据在影像学上是相互独立的,但在疾病的研究上却又是相互补 充和验证的。所以,我们所产生的图像数据编号既要表示对某图像数据的唯一标识,又要表 明图像数据之间的连贯性。
我们采用三段式对图像数据进行编号。对于新采集的数据,我们先先按照被试者 的姓名查找是否有重名,如果不存在重名,则直接在主编号上加1,在加上成像模式作为第 二字段的编号;如果存在重名,则数据录入者要根据列举的重名结果判断本次数据采集是 否跟已有数据相关,若不相关,则跟上述不重名情形一样处理;若相关则根据已有数据判断 本次新数据是否为随访序列,且为序列采集中的第几次采集,这个次数值作为第三字段编 号,第二字段编号仍为本次采集的成像模式。因此,归结起来,假如被试为张三,他的第二次结构磁共振影像图像数据编号可能 是RCCM00035_sMRI_2,第一个字段为总独立图像数据数量编号(RCCM为计算医学中心, Research Center for ComputationalMedicine。该前缀用户可以预设定),第二字段为扫 描图2示出系统生成图像数据序号流程图。第三字段为该人该模态的第几次扫描图像数据。在某些时候,尤其是正常人对照 扫描实验的时候,假如为张三,也许张三不是第一次参与sMRI扫描,但前后的目的并不是 做不同时间点上的对比实验,因此第一字段编号并不会相同,虽然为同一个人,但图像数据 意义上却是独立的。也就是说,我们的图像数据编号不是以人来区分的,而是以图像数据的 独立性来区分的,这将在接下来的图像数据检索使用中发挥关键意义。这也是整个系统设 计的基本思想。归纳起来,图像数据编号的产生可以按照图2中生成图像数据序号的流程 实施。图像数据描述文件约定以“#”开头的行为说明字段,为用户对图像数据或者关键 词段的补充说明。该部分可以不遵循“关键词键值”的书写规则,按照用户需求以及描述 习惯随意书写,也应该尽量出现所要表达的含义的常用关键词。为了进一步方便图像数据采集者填写图像数据描述文件,该系统readme.txt填 写界面采用多种解决方案来减少工作量。首先,系统大量采用下拉菜单,比如疾病类型,扫 描参数等,用户只需从下拉菜单选择即可;另外,系统采用临时记忆方式,这样对于同一批 次扫描的被试,较多的信息可能都是相同的,比如都是盲人,或者实验目的设计等,因此用 户在同一批次扫描中,基本只需要填写一个被试,其它的大部分信息都可以自动生成。另 外,在每个填写区都有相应的简单说明,提示了该区域该如何填写。图像数据检索图像数据的检索是针对对应图像数据描述文件进行的,也基本分为两种类型。第 一种是根据关键词选项及键值搜索,比如年龄选项,年龄43 (按具体年龄),或者年龄 35-50 (按年龄区间);另一种是关键词描述搜索,比如功能磁共振影像(以下简称fMRI)实 验中的任务决策(Decision Making),所涉及的描述性的关键词可能包括“金钱”、“回报”或 者“三个月,,等,这些关键词都会出现在关键词描述区,ftdescription,用来描述本次图像数 据采集的初衷,它们也是针对人脑做任务决策研究的根本依据。为了提高搜索效率,该发明方法可以使得整个搜索过程在客户端的图像数据描述 文件上进行,这就需要对远程的图像数据描述文件(或者本地分散存储的图像数据描述文 件)建立本地索引。同步后的本地索引文件将会以图4的描述格式出现。在图像数据的上传及下载过程必须先把客户端的数据描述文件与服务器端的数 据描述文件同步。在上传数据时,先对数据仓库进行加锁,使得本次更新性的操作具有独占 的权限,其它用户无法同时更改数据仓库。更新完毕(上传或修改)数据仓库后,再在服务器端重新生成新的数据描述文件,该索引文件供下次针对该数据库的上传或下载操作时使 用。同样地,用户在从数据仓库下载数据时,启动数据仓库管理程序连接到数据服务器后, 首先把客户端的数据描述文件与服务器端的数据端的数据描述文件同步,然后再进行检索 下载等操作。概括起来,客户端图像数据索引文件与服务器图像数据索引文件通过图3所 示过程同步。该索引文件由各个服务器在图像数据被更新后生成相应的新的版本,图像数据更 新包括有新的图像数据上传、图像数据移动目录以及图像数据删除等操作;用户在连接到 服务器后,会自动同步该新的版本并添加到自己本地的搜索索引上。这种设计模式既保证 了服务器与客户端很好的图像数据同步更新关系,也避免了用户在客户端等待索引文件生 成的时间。搜索关键词的个数及字段设置可以根据用户需求自由设置。图4客户端索引文件组织结构示意图。该文件包括数据编号,存储路径,以及针 对该数据的描述信息,包括本次数据数据采集的协调负责人和采集时间,被试者的姓名、性 别、联系方式等。关键词选定后的检索结果以树状目录显示给用户,用户可以对DIC0M图像及相应 的图像数据描述文件进行预览,分别同时位于不同的窗口,查看确认其是否为自己需要的 图像数据。并且图像的预览也会有不同的辅助工具,比如灰度窗口调节以及缩放等。图像数据下载图像数据下载主要针对远程图像数据服务器图像数据管理设计的。下载部分设计 了多线程下载下载方式,用户可以根据自己的网络带宽以及图像数据服务器的限制要求自 由选择线程数,用以最大化下载速度。另外,在目录下载上,系统在每个目录上设置了 “选 中,,(checkbox)复选框,图5、检索结果以含有复选框的树状形式显示,以方便批量下载。最后用户可以把 所有已经选中的复选框进行批量下载,这完全符合医学影像图像数据分析中批量对比实验 的需求。其效果如图5所示。另外,对于单个目录下载,系统也设置了单层目录下载以及该目录以及其所有子 目录的递归下载。该发明系统的主要创新之一是图像数据结构的设计以及分类。我们把检索信息分 成五类扫描任务简介,被试通用信息,被试临床信息,扫描机器参数以及实验设计描述,每 一项包含的具体信息如下。扫描任务简介。包含此次扫描的总体协调负责人、时间、地址以及放射医生。被试通用信息。包含被扫描者姓名、性别、联系方式以及左/右利手。被试以及整个实验的通用信息,这些信息在常规的DIC0M文件里都有。接下来的 几个框图里描述的就是跟临床研究关系紧密的临床信息,DIC0M文件不能满足这些需求。图 6中是图像数据示例描述文件。被试临床信息。包含是否有疾病以及疾病种类,智商、年龄、教育程度,以及各种疾 病的相关参数信息。扫描机器参数。包含各种模态扫描对应的临床扫描参数。实验设计描述。包含该次实验的设计初衷,包括实验设计(让被试看图片,或者答题等),以及所要研究的基本问题。 以上所述,仅为本发明中的具体实施方式
,但本发明的保护范围并不局限于此,任 何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在 本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
权利要求
一种图像数据仓库的管理方法,其特征在于,是利用基于文本的图像数据描述信息,对影像图像数据仓库进行快速高效的管理,该管理过程包括图像数据图像数据描述文件的生成、图像数据的上传、图像数据的关键词检索和图像数据的下载;该方法分成图像数据上传和图像数据下载两路工作,实现的步骤如下其中图像数据上传包括步骤su1客户端启动图像数据上传操作准备上传新图像数据,并连接到将要操作的服务器;步骤su2利用锁对所操作服务器的图像数据仓库进行加锁的操作,如果加锁操作成功,使得同一时刻只有一个客户端具有对图像数据仓库进行更改性操作的权限;如果加锁操作不成功,客户端不具有对图像数据仓库进行更改性操作的权限;步骤su3客户端用更改性操作的权限对图像数据仓库进行更改性操作,由客户端客先从服务器端下载索引文件,把客户端索引文件和服务器的索引文件的时间属性进行比对,如果比对的时间属性一致,客户端的图像数据索引文件与服务器的索引文件内容相同,如果比对的时间属性不一致,则用服务器端的索引文件覆盖客户端的索引文件,用于保证所有的更改性操作是在最新的图像数据仓库进行;最后在客户端上形成的图像数据索引文件;步骤su4客户端先输入新采集图像数据的名称,客户端会在客户端的索引文件中检索该名称是否已经存在,得到检索结果,由客户端的用户判断新采集的图像数据与服务器端已有的图像数据是否有关联性;如果没有关联性,将直接对新采集图像数据进行累积编号为RCCM(x1x2x3x4...xn+1)_sMRI;如果存在相关性,针对检索结果中列举的已有的相关联的图像数据,客户端的用户根据新采集图像数据的名称选择该新采集图像数据的第k次采集,然后在已有编号后再加上被试采集次数后缀k,生成新采集图像数据的编号为RCCMx1x2x3x4...xn_sMRI_k,式中,RCCM表示数据所属单位,x1x2x3x4...xn表示已有数据编号,其中n和k为自然数,sMRI是图像数据中图像类型的缩写,因此不同领域的不同图像类型该缩写会相应的不同;步骤su5以对新采集图像数据生成的RCCM(x1x2x3x4...xn+1)sMRI或RCCMx1x2x3x4...xn_sMRI_k编号为新采集图像数据的描述文件开头,并生成用户对图像数据仓库检索所需要的关键词及其键值,关键词表示数据一种特征的类别、与关键词对应的键值表示该特征的类别对应的属性值,生成的新图像数据描述文件是纯文本文件;步骤su6客户端用户把新采集图像数据描述文件放入该新采集图像数据所在的文件夹,然后把该文件夹一起上传到服务器端的图像数据仓库;步骤su7服务器端图像数据有新图像数据上传后,服务器端根据本次更新所在的客户端的用户指令相应的更新该图像数据仓库的索引文件,图像数据仓库索引文件的更新过程就是检索该图像数据仓库中用户指定的时间内的所有存在更新的目录以及该目录中对应的图像数据的描述文件,得到被更新的新描述文件,再分别提取被更新的新描述文件以及对应的存放路径并与该服务器端已有的索引文件进行比较,如果存在图像数据编号重复,则用被更新的新描述文件及其路径覆盖服务器端已有的索引文件的相应内容;如果编号不重复,则把被更新的新描述文件及其路径添加到服务器端已有的索引文件中,从而得到整个图像数据仓库的被更新的新索引文件,至此,更新图像数据仓库索引文件完毕;步骤su8把步骤su2中设置的锁打开,客户端释放对服务器端的控制权限,使得其它用户对该服务器数据仓库有更新权限,从而对图像数据仓库解锁;其中图像数据下载包括步骤sd1客户端的用户启动图像数据下载操作,并连接到将要操作的服务器;步骤sd2客户端的用户把客户端的图像数据索引文件与服务器端的图像数据索引文件进行同步操作,在客户端生成最新的索引文件,使得客户端的图像索引文件与服务器端的图像数据索引文件内容完全相同,从而保证用户的检索过程在最新的图像数据仓库上进行;步骤sd3用户在客户端得到了最新的索引文件后,输入要检索的关键词和键值进行搜索,得到满足关键词键对的图像数据目录列表;步骤sd4客户端的用户对图像数据目录列表中的图像进行预览,以确定搜索的结果是否为自己预期的结果;步骤sd5在搜索得到的图像数据目录列表中,采用文件夹复选框复选所有需要的图像数据,对所需要的图像数据进行批量下载。
2.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述加锁和解锁的操作 是在图像数据仓库入口设置一个命名为“加锁”的布尔变量,当该布尔变量为“真”时,该图 像数据仓库暂时被加锁而不能被另外用户同时访问;当所述更改性操作结束,图像数据上 传完成时,该布尔变量被设置为“假”,则图像数据仓库处于“解锁”状态。
3.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述的客户端的图像数 据索引文件与服务器的索引文件内容相同是当存在有多个不同的图像数据仓库时,客户端 的图像数据索引文件是由所有的图像数据仓库的索引文件组成。
4.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述图像数据描述文件 是用户把上述图像数据编号以及关键词键值对手写成图像数据描述文件,或者是设计表 格让用户填表,然后让计算机程序语言成图像数据描述文件。
5.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述需要的关键词表示 不同领域采集图像数据根据实际需求对关键词的描述有所不同,用户按照关键词键值的 书写规则扩充关键词键值键值对,用以扩展针对新来采集图像数据的关键词的描述能力, 从而生成针对新采集图像数据的描述文件。
6.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述同步操作就是把各 个图像数据仓库的图像数据索引文件下载到客户端,然后根据这些索引文件生成统一的一 个总体索引文件,该总体索引文件是各图像数据索引文件拼接而成。
7.根据权利要求1所述图像数据仓库管理方法,其特征在于,所述文件夹复选框复选 所有需要的图像数据,当客户端的用户也许需要所有结果中的多个结果,这时用户复选中 搜索到的所需要的结果,进行一次性下载。
全文摘要
本发明公开一种图像数据仓库管理方法,是利用基于文本的图像数据描述信息,对图像数据仓库进行高效管理,该管理过程包括图像数据索引文件的生成、上传、关键词检索及图像数据的下载;该方法分成图像数据上传和下载两路工作,客户端用户在对图像数据仓库的上传操作中,利用加锁的方式使该用户在当前时间成为对该仓库具有唯一更改性操作权限的用户。整个上传及下载操作都是通过数据描述文件进行,该描述文件记录了所有图像数据的分字段编号、存储路径及各种属性的详细信息。客户端与服务器端保持同样的图像数据描述文件,使得用户对图像数据进行的检索操作都能在客户端进行,从而减轻网络以及服务器端的压力,从根本上提高了数据仓库管理的效率。
文档编号G06F17/30GK101876992SQ20091023778
公开日2010年11月3日 申请日期2009年11月17日 优先权日2009年11月17日
发明者刘冰, 刘勇, 宋明, 左年明, 蒋田仔 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1