基因信息存储装置、基因信息检索装置、基因信息存储程序、基因信息检索程序、基因信息...的制作方法_4

文档序号:9438956阅读:来源:国知局
或对数据主体进行加密的加密方式。这里,由于需要可以指定多个检索关键字的隐匿检索方式,因而使用利用上述的内积基分级谓词加密的隐匿检索方式。同样,加密方式也使用利用上述的内积基分级谓词加密的加密方式。
[0171]并且,主密钥生成部110决定隐匿检索方式的利用方法。这里,决定标签ID的分层结构。例如,如图15所示,标签ID由3要素构成,由存储能够检索的用户所属的组的组名的组名栏、存储姓名等的用户名栏、以及存储患者基因组序列的差异信息的差异信息栏构成。在检索时,采用这样的规则:只有在判定为组名、用户名、差异信息全部一致的情况下,才视为检索选中。
[0172]同样,主密钥生成部110决定用于对数据主体进行加密的加密方式的利用方法。这里,决定解密者ID的分层结构。例如,如图16所示,解密者ID由2个要素构成,由存储能够解密的用户所属的组的组名的组名栏、和存储姓名等的用户名栏构成。在解密时,采用这样的规则:只有组名、用户名全部一致的才可以解密。
[0173](S103:用户ID存储处理)
[0174]用户ID存储部150构建保管用户ID的用户ID信息数据库。用户ID信息数据库存储有:生成用户密钥所需的信息、和在加密装置200对数据进行加密时用于确定对方的组名/用户名所需的信息。
[0175]例如,如图17所示,在用户ID信息数据库内存储有:组名即公司名、用户名即姓名、部门信息、有效期间等。并且,在用户ID信息数据库内也可以不仅存储最新的状况,而且存储全部过去的历史记录。
[0176](S104:主密钥生成处理)
[0177]主密钥生成部110通过处理装置,执行隐匿检索方式的主密钥生成算法,生成隐匿检索用主密钥和隐匿检索用公开参数。同样,主密钥生成部110通过处理装置,执行加密方式的主密钥生成算法,生成加密用主密钥和加密用公开参数。
[0178]以下,将隐匿检索用主密钥和加密用主密钥总称为主密钥,将隐匿检索用公开参数和加密用公开参数总称为公开参数。
[0179](S105:主密钥存储处理)
[0180]密钥存储部120将主密钥生成部110生成的主密钥和公开参数存储在存储装置内。
[0181](S106:公开参数公开处理)
[0182]数据收发部140将密钥存储部120存储的公开参数经由网络500对加密装置200、检索装置300和数据中心400进行公开。
[0183]另外,所公开的公开参数在加密装置200中,被存储在公开参数存储部230内,在检索装置300中,被存储在用户密钥存储部320内,在数据中心400中,被存储在公开参数存储部450内。
[0184]通过以上的步骤,基因检索系统10的设置完成。
[0185]另外,在系统运用中,每当有用户的人事异动、入职、退职时,在S103中所生成的用户ID信息数据库进行内容维护。
[0186]图18是示出用户密钥发布处理流程的流程图。
[0187]用户密钥发布处理主要是由密钥管理服务器100和检索装置300执行的处理,在追加了新用户的情况下,在用户所属的组名改变时等执行。
[0188](S201:用户ID取得处理)
[0189]用户密钥生成部130从用户ID存储部150保持的用户ID信息数据库中取得发布用户密钥的用户的组名和用户名。
[0190](S202:用户密钥生成处理)
[0191]用户密钥生成部130通过处理装置,生成在生成检索查询中使用的隐匿检索用用户密钥、和用于对加密数据进行解密的加密用用户密钥。
[0192]在隐匿检索方式中,有必要在生成隐匿检索用用户密钥时指定标签ID分层结构。这里,将在S201中取得的组名设定在组名栏,同样将用户名设定在用户名栏,将差异信息以之后进行检索的用户可以进行设定的方式指定为能够转让的要素,从而可以生成隐匿检索用用户密钥。
[0193]同样,在加密方式中,有必要在生成加密用用户密钥时指定解密者ID分层结构。这里,将在S201中取得的组名指定给组名栏,同样将用户名指定给用户名栏,从而可以生成加密用用户密钥。
[0194]将如上所述所生成的隐匿检索用用户密钥和加密用用户密钥总称为用户密钥。
[0195](S203:用户密钥发送处理)
[0196]数据收发部140将在S202中生成的用户密钥发送到检索装置300。
[0197](S204:用户密钥接收处理)
[0198]用户密钥存储部320接收在S203中发送的用户密钥,将其存储在存储装置内。
[0199]图19是示出患者基因组序列的加密处理流程的流程图。
[0200]患者基因组序列的加密处理主要是由加密装置200和数据中心400执行的处理,是在对患者基因组序列进行加密并保管在数据中心400内时执行的。
[0201](S301:差异信息提取处理)
[0202]基准基因取得部210取得例如在互联网上公开的基准基因组序列。并且,对象基因输入部220通过输入装置,输入患者基因组序列。
[0203]差异信息生成部240通过处理装置,将患者基因组序列与基准基因组序列进行比较,从而生成SNV、SV、NC等差异信息。作为生成该差异信息的方法,公知有ChIP - seq法或者RNA - seq法或者MeDIP — seq法或者变异分析法或者亚硫酸氢盐法(bisulfitemethod)等,使用这些一般的方法。
[0204](S302:用户决定处理)
[0205]数据加密部260使操作加密装置200的用户输入能够对加密数据进行解密的用户的组名和用户名。同样,加密标签生成部270输入能够检索加密数据的用户的组名和用户名。
[0206]这里输入的组名和用户名无需是一个,在能够解密或检索的用户有多名的情况下也可以输入多个。另外,这里利用的隐匿检索方式和加密方式也能够接受意味着作为组名和用户名谁都可以的通配符。
[0207](S303:数据加密处理)
[0208]数据加密部260通过处理装置,使用在S302中输入的能够解密的组名和用户名,对在S301中输入的患者基因组序列进行加密。
[0209]具体而言,数据加密部260随机生成对话密钥(sess1n key),利用该对话密钥,使用AES、CamelIia(注册商标)等公共密钥加密对患者基因组序列进行加密,生成加密数据主体。接着,数据加密部260将在S302中输入的能够解密的组名和用户名分别指定为解密者ID分层结构的组名和用户名,将其作为加密用公开密钥,使用在S102中决定的加密方式对对话密钥进行加密,生成加密对话密钥。然后,数据加密部260通过使上述2个加密结果(加密数据主体和加密对话密钥)进行组合,生成加密数据。
[0210]所生成的加密数据的数据结构由图20的标号603部分表示。另外,在S302中接收到多个组名和用户名的情况下,有必要针对组名和用户名的各组生成加密对话密钥。
[0211](S304:差异信息编码处理)
[0212]差异信息编码部250通过处理装置,依照在SlOl中决定的编码方法对在S301中生成的各差异信息进行编码,生成编码差异信息。并且,差异信息编码部250使从用户输入患者ID,将其包含在编码差异彳目息内。
[0213](S305:加密标签生成处理)
[0214]加密标签生成部270对编码差异信息进行加密而生成加密标签。
[0215]具体而言,加密标签生成部270通过处理装置,将在S302中输入的能够检索的组名和用户名指定为标签ID分层结构的组名和用户名,将在S304中编码的编码差异信息指定给差异信息栏,使用隐匿检索方式对随机数值进行加密而生成加密标签。并且,加密标签生成部270使随机数值在平文的状态下包含在加密标签内。
[0216]另外,由于上述处理是针对I个差异信息的处理,因而针对各编码差异信息来实施该处理。例如,针对SNV、SV、NC的各编码差异信息来实施。并且,在S302中输入了多个组名和用户名的组的情况下,针对组名和用户名的各组生成加密标签。
[0217](S306:保管委托处理)
[0218]带标签加密数据生成部280通过处理装置,使在S303中生成的加密数据、在S305中生成的加密标签和在S304中输入的患者ID结合而生成带标签加密数据(图20的标号601)。然后,带标签加密数据生成部280将所生成的带标签加密数据发送到数据中心400
并委托保管。
[0219]此时,为了使带标签加密数据在数据中心400中容易保管,带标签加密数据生成部280将在S302中输入的能够进行解密的组名和用户名与能够进行检索的组名和用户名一起发送。在图20所示的带标签加密数据的结构中,将能够进行解密的组名和用户名与能够进行检索的组名和用户名包含在带标签加密数据内。
[0220](S307:加密数据保管处理)
[0221]保管请求处理部410通过处理装置,对从加密装置200接收到的带标签加密数据进行分解,取出加密数据、多个加密标签和患者ID。然后,保管请求处理部410使加密数据存储部420保管加密数据和患者ID。
[0222]另外,加密数据存储部420按带标签加密数据内包含的每个组名和每个用户名分开保管加密数据,再对保管的加密数据赋予管理编号,可以在之后根据管理编号唯一地确定加密数据。在加密数据与多个组名和用户名相关联的情况下,使加密数据与各组名和用户名相关联地进行保管。在与多个组名和用户名相关联的情况下,存储仅一个加密数据,另外仅保管参照信息,从而能够节约存储盘容量。
[0223]图21是示出加密数据的保管例的图。如图21所示,保管请求处理部410将组名是“A制药公司”且用户名是(通配符)的加密数据与患者ID和管理编号汇总管理,再将组名是“B医院”且用户名是的加密数据与患者ID和管理编号汇总管理。并且,在有对A制药公司和B医院的双方公开的数据的情况下,例如使患者ID和加密数据主体与管理编号OOOOOl相关联地进行保管,在管理编号100002中除了患者ID以外,还将参照管理编号000001的指针作为加密数据来保管。
[0224](S308:加密标签保管处理)
[0225]保管请求处理部410使加密数据存储部430保管在S307中取出的多个加密标签以及对应的加密数据的管理编号和患者ID。加密数据存储部430按带标签加密数据内包含的各组名和各用户名分开保管加密标签、管理编号和患者ID。
[0226]图22是示出患者的电子病历的加密处理流程的流程图。
[0227]患者的电子病历的加密处理主要是由加密装置200和数据中心400执行的处理,在对电子病历进行加密并保管在数据中心400内时来执行。
[0228](S401:用户决定处理)
[0229]数据加密部260使操作加密装置200的用户输入能够对电子病历进行解密的用户的组名和用户名。
[0230]这里输入的组名和用户名无需是一个,在能够解密的用户有多名的情况下也可以输入多个。
[0231](S402:数据加密处理)
[0232]数据加密部260使用户输入患者ID和电子病历。然后,数据加密部260通过处理装置,使用在S401中输入的组名和用户名,对电子病历进行加密。具体的加密方法由于与在S303中对患者基因组序列进行加密的流程相同,因而省略详情。
[0233](S403:保管委托处理)
[0234]数据加密部260将在S402中生成的加密数据与表示是谁的电子病历的患者ID以及能够进行解密的用户的组名和用户名一起发送到数据中心400并委托保管。
[0235](S404:加密数据保管处理)
[0236]保管请求处理部410使从加密装置200接收到的加密数据与患者Id相关联地保管在加密数据存储部420内。
[0237]图23是不出检索处理流程的流程图。
[0238]检索处理是主要由检索装置300和数据中心400执行的处理,在取得由数据中心400保管的加密患者基因组序列时执行。
[0239](S501:差异信息输入处理)
[0240]差异信息输入部310使操作检索装置300的用户输入包含将与基准基因组序列的差异信息作为检索关键字的检索请求。
[0241]这里输入的差异信息无需如从患者基因组提取出的差异信息那样指定全部要素,例如仅指定染色体编号、或者仅指定位置信息等即可。
[0242](S502:差异信息编码处理)
[0243]差异信息编码部330通过处理装置,对在S501中输入的差异信息进行编码,生成编码差异信息。该处理由于与步骤S304的处理相同,因而省略详情。不过,需要注意的一点是,将未指定的要素设定为
[0244](S503:检索查询生成处理)
[0245]检索查询
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1