基因信息存储装置、基因信息检索装置、基因信息存储程序、基因信息检索程序、基因信息...的制作方法_2

文档序号:9438956阅读:来源:国知局
所述基准基因取得部取得的基准基因与所述基因输入部输入的对象基因进行比较,生成差异信息;数据加密部,其对所述对象基因进行加密,生成加密基因;加密标签生成部,其生成嵌入了所述差异生成部生成的差异信息的加密标签;以及数据存储部,其使所述存储装置相关联地存储所述数据加密部生成的加密基因和所述加密标签生成部生成的加密标签,所述基因信息检索装置具有:差异信息输入部,其输入要检索的基因信息与所述基准基因之间的差异信息作为所述检索关键字;检索查询生成部,其生成嵌入了所述差异信息输入部输入的差异信息的检索查询;以及基因信息取得部,其将所述检索查询生成部生成的检索查询发送到所述数据管理装置,取得包含所述差异信息的基因信息。
[0040]发明效果
[0041]根据本发明,在蓄积于数据库中的基因信息和检索索引即标签、与被用作检索关键字的基因信息中的任意一方都进行了加密的状态下,可以从数据库中提取包含检索关键字的基因信息。因此,基因信息处于完全对第三者隐蔽的状态。
[0042]特别是,根据本发明,将与基准基因的差异信息作为检索索引和检索关键字。因此,检索索引的数量较少即可,可以高速进行检索。
【附图说明】
[0043]图1是基因检索系统10的结构图。
[0044]图2是密钥管理服务器100的结构图。
[0045]图3是加密装置200的结构图。
[0046]图4是检索装置300的结构图。
[0047]图5是数据中心400的结构图。
[0048]图6 是使用内积基分级谓词加密(hierarchical predicate encrypt1n forinnerproducts)的加密方式的说明图。
[0049]图7是使用内积基分级谓词加密的隐匿检索方式的说明图。
[0050]图8是示出初始设定处理流程的流程图。
[0051]图9是已编码的SNV信息的结构图。
[0052]图10是SNV信息中的位置信息的分块化的说明图。
[0053]图11是SNV信息中的可靠性的分块化的说明图。
[0054]图12是已编码的SV信息的结构图。
[0055]图13是SV信息中的CNV增益的分块化的说明图。
[0056]图14是已编码的NC信息的结构图。
[0057]图15是标签ID的分层结构的说明图。
[0058]图16是解密者ID的分层结构的说明图。
[0059]图17是用户ID信息数据库的说明图。
[0060]图18是示出用户密钥发布处理流程的流程图。
[0061]图19是示出患者基因组序列的加密处理流程的流程图。
[0062]图20是带标签加密数据的说明图。
[0063]图21是示出加密数据的存储示例的图。
[0064]图22是示出患者的电子病历的加密处理流程的流程图。
[0065]图23是不出检索处理流程的流程图。
[0066]图24是访问权限管理表的说明图。
[0067]图25是示出密钥管理服务器100、加密装置200、检索装置300、数据中心400的硬件结构的一例的图。
【具体实施方式】
[0068]实施方式I
[0069]图1是基因检索系统10的结构图。
[0070]基因检索系统10具有:密钥管理服务器100、多个加密装置200、多个检索装置300以及数据中心400 (数据管理装置)。密钥管理服务器100、加密装置200、检索装置300和数据中心400经由网络500连接。
[0071]密钥管理服务器100是如下这样的服务器:生成加密用用户密钥和隐匿检索用用户密钥等的用户密钥,发给加密装置200和/或检索装置300。另外,加密用用户密钥是用于对加密数据进行解密的密钥,隐匿检索用用户密钥是用于隐匿检索的密钥。
[0072]加密装置200是用于对保管在数据中心400的信息进行加密的终端。加密装置200主要是由医院的医师、基因组解读中心的员工或患者等用户利用的终端。
[0073]检索装置300是用于检索并取得保管在数据中心400中的信息的终端。检索装置300主要由制药公司等研究者、医院的医师等用户利用。
[0074]数据中心400是保管从患者收集到的基因组信息、记载有患者的病历的电子病历等的服务器。数据中心400根据来自患者、医师、研究者等用户的请求提供检索/阅览基因组信息、电子病历等的服务。
[0075]网络500是例如互联网那样的公众线路网。
[0076]图2是密钥管理服务器100的结构图。
[0077]密钥管理服务器100具有:主密钥生成部110、密钥存储部120、用户密钥生成部130、数据收发部140和用户ID存储部150。
[0078]主密钥生成部110通过处理装置生成由利用隐匿检索的用户全体共同利用的公开参数,并生成成为生成用户密钥的基础的主密钥。
[0079]密钥存储部120将主密钥生成部110生成的主密钥、公开参数存储在存储装置内。
[0080]用户密钥生成部130通过处理装置,使用唯一分配给用户的用户ID,根据主密钥生成用户密钥。
[0081]数据收发部140将公开参数经由网络500发送到加密装置200、检索装置300和数据中心400。并且,数据收发部140将用户密钥经由网络500发送到检索装置300。并且,数据收发部140根据用户请求,将用户ID对加密装置200、检索装置300、数据中心400的用户进行发送。
[0082]用户ID存储部150将各用户的用户ID存储在存储装置内。用户ID是用户的姓名、部门、登录ID、邮件地址等属性信息。用户ID存储部150也可以不仅存储当前时刻的属性信息,而且也存储过去的属性信息作为历史记录。
[0083]图3是加密装置200的结构图。
[0084]加密装置200具有:基准基因取得部210、对象基因输入部220、公开参数存储部230、差异信息生成部240、差异信息编码部250、数据加密部260、加密标签生成部270以及带标签加密数据生成部280。
[0085]基准基因取得部210取得一般公开的预定的基因组序列作为基准基因组序列(基准基因)。
[0086]对象基因输入部220取得保管在数据中心400中的患者基因组序列(对象基因)。并且,对象基因输入部220取得患者基因组序列以及表示该患者基因组序列的患者的患者ID0
[0087]公开参数存储部230接收密钥管理服务器100生成的公开参数,将其存储在存储装置内。
[0088]差异信息生成部240通过处理装置,将患者基因组序列与基准基因组序列进行比较,生成多个差异信息。
[0089]差异信息编码部250通过处理装置,将差异信息生成部240生成的各差异信息编码成适于在加密的状态下进行检索的形式而生成编码差异信息。关于适于在加密的状态下进行检索的形式,将在后面描述。
[0090]数据加密部260通过处理装置,对对象基因输入部220输入的患者基因组序列进行加密,生成加密数据(加密基因)。
[0091]加密标签生成部270通过处理装置,对差异信息编码部250生成的编码差异信息进行加密,生成加密标签。
[0092]带标签加密数据生成部280通过处理装置,将数据加密部260生成的加密数据、加密标签生成部270生成的多个加密标签、以及患者ID相结合,而生成带标签加密数据。带标签加密数据生成部280委托数据中心400保管所生成的带标签加密数据。
[0093]图4是检索装置300的结构图。
[0094]检索装置300具有:差异信息输入部310、用户密钥存储部320、差异信息编码部330、检索查询生成部340、基因信息取得部350以及数据解密部360。
[0095]差异信息输入部310通过输入装置输入作为检索关键字包含与基准基因组序列的差异息的检索请求。
[0096]用户密钥存储部320将公开参数和密钥管理服务器100单独分配给用户的用户密钥存储在存储装置内。
[0097]差异信息编码部330具有与差异信息编码部250相同的功能。差异信息编码部330通过处理装置,将差异信息输入部310输入的检索请求内包含的差异信息编码成适于在加密的状态下进行检索的形式,而生成编码差异信息。
[0098]检索查询生成部340通过处理装置,根据用户密钥存储部320存储的用户密钥和公开参数、以及差异信息编码部330生成的编码差异信息,生成检索查询(search query)。
[0099]基因信息取得部350将检索查询生成部340生成的检索查询经由网络500发送到数据中心400。然后,基因信息取得部350从数据中心400经由网络500接收被加密的包含检索请求内包含的差异信息(或者包含类似的差异信息)的患者基因组序列的加密数据。并且,基因信息取得部350接收加密数据和患者ID。
[0100]数据解密部360通过处理装置,使用用户密钥存储部320存储的用户密钥对从数据中心400接收到的加密数据进行解密,取得患者基因组序列。
[0101]图5是数据中心400的结构图。
[0102]数据中心400具有:保管请求处理部410、加密数据存储部420、加密标签存储部430、检索请求处理部440、公开参数存储部450以及访问权限存储部460。
[0103]保管请求处理部410从加密装置200接收带标签加密数据。保管请求处理部410分析接收到的带标签加密数据,分解成加密数据、多个加密标签以及患者ID。保管请求处理部410将共同的管理编号分配给分解后的加密数据和各加密标签,将加密数据与患者ID以及管理编号一起发送到加密数据存储部420,将各加密标签与患者ID和管理编号一起发送到加密标签存储部430。
[0104]加密数据存储部420将从保管请求处理部410接收到的加密数据与患者ID和管理编号相关联地存储在存储装置内。
[0105]加密标签存储部430将从保管请求处理部410接收到的加密标签与患者ID和管理编号相关联地存储在存储装置内。
[0106]检索请求处理部440从检索装置300接收检索查询。检索请求处理部440通过处理装置,对接收到的检索查询和加密数据存储部430存储的加密标签进行比较处理。通过该比较处理,判定加密标签内包含的患者基因组序列的差异信息是否符合由检索查询内包含的患者基因组序列的差异信息(检索请求)指定的条件。之后,检索请求处理部440从加密数据存储部420取得与检索选中的加密标签相关联的加密数据,将其回送到检索装置300。另外,与加密标签相关联的加密数据是附有与加密标签相同的管理编号的加密数据。
[0107]公开参数存储部450接收密钥管理服务器100生成的公开参数,并将其存储在存储装置内。
[0108]访问权限存储部460对患者允许对谁公开患者基因组序列进行管理。
[0109]对在基因检索系统10中利用的加密方式进行说明。
[0110]在基因检索系统10中,使用:在非专利文献2等中记载的被称为内积基分级谓词加密(hierarchical predicate encrypt1n for inner products)的加密方式、和在同样使用内积基分级谓词加密的加密的状态能够进行关键字检索的隐匿检索方式。
[0111]图6是使用内积基分级谓词加密的加密方式的说明图。
[0112]该加密方式由主密钥生成算法、密钥生成算法、转让密钥生成算法、加密算法和解密算法构成。
[0113]最开始,使用主密钥生成算法生成加密用主密钥和加密用公开参数。加密用主密钥是用于生成解密用户的加密用用户密钥的密钥。加密用公开参数是在加密时使用的公开信息,广泛分发给进行加密的用户。
[0114]另外,在该处理时,有必要事先决定条件式的结构,将该条件式作为参数来提供。在非专利文献2等现有的内积基分级谓词加密的文献中,记载的不是提供条件式的结构,而是提供在将条件式作为矢量来表述的情况下的维数,然而从容易理解的观点出发,这里设为提供条件式。以下相同。
[0115]接着,使用密钥生成算法,发布根据加密用条件式对解密用户分发的加密用用户密钥。加密用条件式决定解密用户可以对具有怎样属性的文件进行解密,该条件被描述为使用“与”(AND) / “或” (OR)的逻辑运算的条件式。
[0116]接着,使用加密算法对数据进行加密。此时,指定附加给加密数据的加密用属性,将该加密用属性嵌入到加密数据内。
[0117]最后,使用解密算法,对加密数据进行解密。在解密时,指定加密用用户密钥,然而仅有被赋予了满足嵌入到加密用用户密钥内的条件式的加密用属性的加密数据可以解密。关于不满足条件式的加密数据,全部无法解密。
[0118]另外,在内积基分级谓词
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1