基因信息存储装置、基因信息检索装置、基因信息存储程序、基因信息检索程序、基因信息...的制作方法_5

文档序号:9438956阅读:来源:国知局
生成部340通过处理装置,使用在S502中生成的编码差异信息、和存储在用户密钥存储部320内的用户密钥生成检索查询。然后,检索查询生成部340将生成的检索查询发送到数据中心400。
[0246]此时,还发送用户自身的组名和用户名。另外,为了验证组名和用户名的可靠性,还进行操作检索终端的用户的用户认证。
[0247](S504:加密标签提取处理)
[0248]检索请求处理部440通过处理装置,从存储在加密数据存储部430内的全部加密标签中取得能够利用在S503中与检索查询一起发送的组名和用户名进行检索的全部加密标签。并且,检索请求处理部440从访问权限存储部460取出相应的组名和用户名的用户能够访问的患者ID的列表,将所取得的加密标签缩小到仅包括与该患者ID对应的加密标签。
[0249]另外,访问权限存储部460具有图24所示的访问权限管理表,将组名和用户名作为访问者信息,确定与可以检索的患者基因组序列对应的患者ID,输出与该患者ID对应的加密标签即可。
[0250](S505:—致判定处理)
[0251]检索请求处理部440通过处理装置,对在S504中被缩小范围的加密标签进行隐匿检索方式的一致判定处理,判定加密标签内包含的差异信息是否与由在S503中发送的检索查询内包含的差异信息指定的条件一致。
[0252]隐匿检索方式的一致判定处理只能实施I个加密标签与I个检索查询的比较。因此,对在S504中取得的全部加密标签实施一致判定处理。然后,确定与判定处理的结果为被判定为一致的加密标签相关联的管理编号。
[0253](S506:加密数据取得处理)
[0254]检索请求处理部440从加密数据存储部420取得与在S505中确定的管理编号对应的全部加密数据,将其与对应的患者ID —起发送到检索装置300。
[0255](S507:加密数据解密处理)
[0256]数据解密部360通过处理装置,使用存储在用户密钥存储部320内的加密用用户密钥,对在S506中从数据中心400接收到的加密数据执行加密方式的解密处理来进行解密。数据解密部360对接收到的全部加密数据实施该处理。
[0257]通过以上的步骤,检索装置300可以从用户接收想要检索的差异信息,从数据中心400取得与该差异信息一致的加密数据,对其进行解密来阅览患者基因组序列。并且,还可以根据需要,将与加密数据对应的患者ID发送到数据中心400,获得对应的电子病历等。
[0258]如上所述,在实施方式I的基因检索系统10中,使用隐匿检索方式对患者基因组进行加密并保管在数据中心400内,并且检索请求也使用隐匿检索技术进行加密并对数据中心400委托检索。因此,在数据中心400,尽管无法知道患者基因组的具体内容,也可以提供检索服务。
[0259]并且,人类基因组信息是由30亿碱基构成的非常庞大的数据。因此,如果将人类基因组信息全部作为标签,则可能由于加密而进一步使数据尺寸增加,导致成为存储盘容量和网络容量的负担的原因。
[0260]然而,在实施方式I的基因检索系统10中,由于缩小范围至与一般公开的基准基因组序列的差异信息,将其做成标签,因而可以大幅削减存储盘使用量和网络容量。
[0261]并且,在实施方式I的基因检索系统10中,通过使SNV的位置信息、可靠性等数值信息分块化,由此使用一致检索实现了通过隐匿检索难以实现的范围检索。因此,也可以应对在基因组检索中利用的范围检索。
[0262]特别是,在图10所示的SNV的位置信息中,各块重复。也就是说,块I和块2从位置5000到10000重复,块2和块3从位置10000到15000重复。由此,在检索时指定的范围是5000以下的情况下,使用全部块进行检索,在检索时指定的范围是10000以下的情况下,若仅使用奇数块进行检索,则能够更高速地进行处理。
[0263]并且,在实施方式I的基因检索系统10中,即使在指定了染色体编号和位置信息等多个检索条件的情况下,也不单独进行条件的一致判定,而使用内积基分级谓词加密一并判定全部检索条件是否成立。因此,服务器不知晓部分性地检索命中的情况,安全性高。
[0264]并且,在实施方式I的基因检索系统10中,与加密数据一起还包含患者ID。因此,可以从作为检索结果获得的患者ID导出关联的电子病历等信息。因此,在发生相应的碱基变异的情况下,也能够研究其与怎样的病相关联。
[0265]并且,在实施方式I的基因检索系统10中,在对患者基因组序列的差异信息进行加密时,标签ID分层结构和解密者ID分层结构包含组名和用户名。因此,能够限制可以进行检索和/或解密的研究者和医生。例如,若将“A制药公司”指定为组名,将通配符指定为用户名,则可以将该患者的信息限定于A制药公司的职员。并且,通过将无论是组名还是用户名都作为通配符进行加密,则只要是在该系统中登记的医生或研究者,都可以利用该患者的信息。
[0266]并且,在实施方式I的基因检索系统10中,与基于加密的访问控制不同,数据中心400保管访问权限管理表,也能够进行基于该信息的访问控制。因此,可以根据来自患者的期望,细致管理“仅能阅览基因组序列”或者“能够阅览病历”等。也就是说,由于根据该信息判定是否允许从患者基因组序列的检索请求,因而极其细致的访问控制成为可能。
[0267]并且,在实施方式I的基因检索系统10中,针对检索者的用户密钥包含组名和/或用户名。因此,通过确认根据该用户密钥生成的检索查询内包含的组名和/或用户名,也能够进行认证。
[0268]另外,在上述说明中,示出了以公司为单位进行访问限制的情况的例子。然而,该访问控制的单位仅是一例。例如,也可以输入医生、护士等国家资格的条件,也可以建立是否是国家项目的参加者的标志。这些ID分层结构仅是一例,因而也可以追加各种要素,或者删除各种要素。
[0269]并且,在上述说明中,设想了如下这样的情况:国家对唯一的密钥管理服务器100进行管理,作为医生的代理进行基因组分析的序列操作者利用加密装置200。然而,可以根据利用系统,灵活变更系统结构。例如,从序列操作者接收到检测结果的医生也可以操作加密装置200对患者基因组序列进行加密。
[0270]并且,在上述说明中,在检索装置300内保管用户密钥,还实施检索查询生成和加密数据的解密。然而,为了进一步提高安全性,也可以使用IC卡等器件而不是检索装置300来实施用户密钥的管理。在该情况下,由IC卡安全地管理用户密钥,因而实现了安全性的提尚。
[0271]并且,在上述说明中,检索终端利用的隐匿检索用用户密钥作为在SNV信息、SV信息、NC信息等的检索中可以共同使用的密钥来生成。然而,也可以是,由于各差异信息的长度不同,因而不使用共同的隐匿检索用用户密钥,而根据用途单独生成SNV信息隐匿检索用用户密钥、SV信息隐匿检索用用户密钥、NC信息隐匿检索用用户密钥等隐匿检索用用户密钥。在该情况下,由于隐匿检索用用户密钥的长度为最适于各信息的长度的长度,因而运算时间高速化。
[0272]并且,在上述说明中,在表示组名和用户名时使用了 “A制药公司”、“田中”等文字串进行表述。这是以实施例容易理解作为优先考虑的,实际上,也可以不仅利用文字串,还可以利用编号等ID。染色体编号等其他要素也一样。
[0273]并且,在上述说明中,示出作为隐匿检索方式或加密方式使用内积基分级谓词加密的情况的例子。然而,若是具有相同功能的加密,则无需限于内积基分级谓词加密。并且,隐匿检索方式和加密方式也可以利用不同的方式。
[0274]并且,在上述说明中,在用户ID存储部150中,还可以管理用户过去的属性信息。这只有在管理上需要的情况下才实施即可,也可以仅管理当前时刻的属性信息。
[0275]并且,在上述说明中,示出假定全员共同使用I个基准基因组序列来实施的情况。然而,还能够使用不同的基准基因组来实施。在该情况下,还能够在进行加密时针对全部的基准基因组序列生成差异信息,将与任意一个基准基因组序列的差异信息作为检索查询,还能够在进行加密时生成与一个基准基因组序列的差异信息,在进行检索的情况下将与所有的基准基因组序列的差异信息作为检索查询。
[0276]并且,在上述说明中,关于需要位置信息、可靠性、CNV增益等范围检索的信息,可以通过进行分块化而通过关键字的完全一致进行判定。然而,由于设想了想要检索的范围根据用途而不同的情况,因而不一定需要通过完全一致实现检索。例如,也可以在加密时指定属于块10的同时,在检索时如指定“块10或块11”那样将多个块指定为检索范围。
[0277]并且,在上述说明中,设定了密钥管理服务器100只有I台的情况。然而,用作隐匿检索方式或加密方式的内积基分级谓词加密还能够对密钥管理服务器100进行分层化并分散为多个来运用。因此,这里,还能够将密钥管理服务器100分层化为多个来运用。
[0278]并且,在上述说明中,示出将SNV信息、SV信息、NC信息作为差异信息进行加密的例子。然而,还能够根据相同的构造对所述以外的差异信息进行加密。
[0279]图25是示出密钥管理服务器100、加密装置200、检索装置300和数据中心400的硬件结构的一例的图。
[0280]如图25所示,密钥管理服务器100、加密装置200、检索装置300和数据中心400具有执行程序的CPU 911 (Central Processing Unit (中央处理单元),也称为中央处理装置、处理装置、运算装置、微处理器、微计算机、处理器)。CPU 911经由总线912与ROM 913、RAM 914、LCD 901 (Liquid Crystal Display,液晶显示器)、键盘 902 (K/B)、通信板 915、磁盘装置920连接,并控制这些硬件器件。也可以是光盘装置、存储卡读写装置等存储装置,而取代磁盘装置920 (固定磁盘装置)。磁盘装置920经由预定的固定磁盘接口连接。
[0281]ROM 913、磁盘装置920是非易失性存储器的一例。RAM 914是易失性存储器的一例。ROM 913、RAM 914和磁盘装置920是存储装置(存储器)的一例。并且,键盘902、通信板915是输入装置的一例。并且,通信板915是通信装置的一例。而且,IXD 901是显示装置的一例。
[0282]在磁盘装置920或ROM 913等中存储有:操作系统921 (OS)、窗口系统922、程序组923和文件组924。程序组923的程序由CPU 911、操作系统921、窗口系统922执行。
[0283]在程序组923内存储有在上述的说明中执行作为以下等所说明的功能的软件、程序和其他程序,即,“主密钥生成部110”、“用户密钥生成部130”、“数据收发部140”、“基准基因取得部210”、“对象基因输入部220”、“差异信息生成部240”、“差异信息编码部250”、“数据加密部260”、“加密标签生成部270”、“带标签加密数据生成部280”、“差异信息输入部310”、“差异信息编码部330”、“检索查询生成部340”、“基因信息取得部350”、“数据解密部360”、“保管请求处理部410”、“检索请求处理部440”。程序由CPU 911读出并执行。
[0284]在文件组924内,作为“文件”、“数据库”的各项目存储有在上述说明中存储在“密钥存储部120”、“用户ID存储部150”、“公开参数存储部230”、“用户密钥存储部320”、“加密数据存储部420”、“加密标签存储部430”、“公开参数存储部450”、“访问权限存储部460”等中的信息、数据、信号值、变量值、参数。“文件”、“数据库”被存储在存储盘、存储器等存储介质内。存储在存储盘、存储器等存储介质内的信息、数据、信号值、变量值、参数经由读写电路由CPU 911读出到主存储器、高速缓冲存储器内,用于提取、检索、参照、比较、运算、计算、处理、输出、打印、显示等CPU 911的动作。在提取、检索、参照、比较、运算、计算、处理、输出、打印、显示的CPU 911的动作期间,信息、数据、信号值、变量值、参数被暂时存储在主存储器、高速缓冲存储器、缓冲存储器内。
[0285]并且,上述说明中的流程图的箭头部分主要表示数据和信号的输入输出,数据和信号值被记录在RAM 914的存储器、其他的光盘等存储介质、IC芯片内。并且,数据和信号通过总线912、信号线、线缆、其他传送介质、电波被在线传送。
[0286]并且,在上述说明中作为“?部”进行说明的也可以是“?电路”、“?装置”、“?设备”、“?单元”、“功能”,并且也可以是“?步骤”、“?进程”、“?处理”。并且,作为“?装置”进行说明的也可以是“?电路”、“?设备”、“?单元”、“功能”,并且也可以是“?步骤”、“?进程”、“?处理”。而且,作为“?处理”进行说明的也可以是“?步骤”。即,作为“?部”进行说明的也可以使用存储在ROM 913内的固件
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1