基因信息存储装置、基因信息检索装置、基因信息存储程序、基因信息检索程序、基因信息...的制作方法_3

文档序号：9438956阅读：来源：国知局

加密中，还存在密钥转让(key delegat1n)的特征。这是在生成加密用用户密钥时仅设定条件式的一部分，使条件式的一部分处于未指定状态。对该未指定的条件式追加设定条件式的构造是密钥转让。
[0119]具体而言，使用转让密钥生成算法，指定对加密用用户密钥追加设定的加密用追加条件式，生成加密用转让密钥。该加密用转让密钥与加密用用户密钥一样可以用于加密数据的解密。
[0120]稍微改变说法，在密钥生成算法中，发布解密用户的属性信息被设定为密钥属性的加密用用户密钥。并且，在加密算法中，生成能够进行解密的用户的属性信息被设定为加密属性的加密数据。于是，在解密算法中，只有在被设定于加密用用户密钥内的密钥属性与被设定于加密数据内的加密属性对应的情况下，才可以使用加密用用户密钥对加密数据进行解密。
[0121]并且，在转让密钥生成算法中，对加密用用户密钥进一步追加设定属性信息，生成能够仅对能够使用该加密用用户密钥解密的加密数据的一部分进行解密的下位加密用用户密钥。
[0122]图7是使用内积基分级谓词加密的隐匿检索方式的说明图。
[0123]该隐匿检索方式由主密钥生成算法、密钥生成算法、转让密钥生成算法、加密标签生成算法和一致判定算法构成。
[0124]最开始，使用主密钥生成算法生成隐匿检索用主密钥和隐匿检索用公开参数。隐匿检索用主密钥是用于生成检索用户的隐匿检索用用户密钥的密钥。隐匿检索用公开参数是在检索时使用的公开信息，被广泛分发给进行检索的用户。
[0125]另外，关于条件式的描述，与加密方式相同。
[0126]接着，使用密钥生成算法，发布根据隐匿检索用条件式对检索用户分发的隐匿检索用用户密钥。隐匿检索用条件式仅决定如下这样的构造:指定由检索用户可以对具有怎样属性的文件进行检索，而且，可以使用怎样的条件式指定检索关键字。该条件被描述为使用“与”(AND)/ “或”(OR)的逻辑运算的条件式。检索关键字自身可以之后通过转让密钥生成算法进行设定。
[0127]接着，使用加密标签生成算法，生成在检索处理中使用的加密标签。首先生成任意的随机数值，为了限制允许检索的用户而决定属性，并决定关键字。将随机数值、属性和关键字作为输入，使用加密标签生成算法来生成加密标签。具体而言，使用加密算法对随机数值进行加密，将加密随机数和随机数值的组合作为加密标签。
[0128]接着，使用转让密钥生成算法生成检索查询。具体而言，通过针对隐匿检索用用户密钥中的值未被指定的部分嵌入检索关键字，使得之后可以指定关键字，来生成检索查询。该检索查询对应于加密方式的加密转让密钥。
[0129]最后，使用一致判定算法，进行接收到的检索查询和加密标签的两者中包含的关键字是否相同的一致判定。具体而言，从加密标签中取出加密随机数，使用与加密用转让密钥相当的检索查询进行解密。然后，在解密结果与加密标签内包含的随机数值相同的情况下，即，在使用检索查询正确地进行了解密的情况下，判定为关键字相同。原因是因为，若检索查询(相当于加密用转让密钥)内包含的关键字与在生成加密随机数时指定的关键字不相同，则无法正确对随机数值进行解密。
[0130]与上述的加密方式一样，稍许改变说法，在密钥生成算法中，发布检索用户的属性信息被设定为密钥属性的隐匿检索用用户密钥。并且，在加密算法中，生成作为加密属性被设定了能够进行检索的用户的属性信息和关键字的加密数据。在转让密钥生成算法中，对隐匿检索用用户密钥进一步追加设定检索关键字作为密钥属性，生成检索查询。
[0131]于是，在解密算法中，只有在被设定于检索查询内的密钥属性信息与被设定于加密标签内的属性信息对应的情况下，才可以使用加密标签对随机数值进行解密。也就是说，只有在被设定于检索查询内的用户的属性信息与被设定于加密标签内的用户的属性信息对应、并且被设定于检索查询内的检索关键字与被设定于加密标签内的关键字对应的情况下，才可以使用加密标签对随机数值进行解密。
[0132]对基因检索系统10的处理进行说明。
[0133]基因检索系统10执行初始设定处理、用户密钥发布处理、加密处理和检索处理。另外，加密处理包含有:患者基因组序列的加密处理和患者的电子病历的加密处理。
[0134]图8是示出初始设定处理流程的流程图。
[0135]初始设定处理是由密钥管理服务器100执行的处理，是在利用基因检索系统10之前执行一次的处理。
[0136](S101:编码方法决定处理)
[0137]主密钥生成部110通过处理装置，决定对患者基因组序列的差异信息进行编码的方法。在决定该进行编码的方法时，还对如何进行检索的检索式加以考虑。
[0138]作为主要的差异信息，有:SNV(Single Nucleotide Variant，单核苷酸变异)、SV (Structural Variants，结构变异)和NC (Novel Contig，新重叠群)。因此，以这3个为例，对该编码方法和检索方法进行说明。
[0139]图9是已编码的SNV信息的结构图。
[0140]SNV信息示出在基因组序列中变化了一个碱基的情况。SNV信息由患者ID、染色体编号、位置信息、置换信息1、置换信息2和可靠度构成。
[0141]患者ID是为了与另外管理的电子病历相对应而分配的识别编号。患者ID是与病历相对应的编号即可，因而也可以不仅分配在医院赋予给患者的识别编号，而且在病历保管时随机分配编号，并设定该值。
[0142]染色体编号是检测出SNV的染色体的编号。在人的基因组的情况下，设定了例如1、2、…、22、X、Y、M 等值。
[0143]位置信息是与检测出SNV的位置相关的信息。位置由示出时碱基序列的第几个的数值表示，在人的基因组的情况下为I至30亿左右的值。一般，位置等数值信息的检索是指定范围来检索。然而，由于在上述的隐匿检索方式中，范围检索实施困难，因而通过进行分块化来实现高速化。例如，图10示出在检索时指定的范围一般被抑制为5000以下的情况下的编码方法。在位置7777检测出SNV的情况下，考虑为块I和块2为相应的位置，对位置信息设定“ I ”和“2”这两个值。
[0144]置换信息I和置换信息2是表示基因组信息的变化的信息。其值是如下这样决定的:例如在由G表示的碱基作为SNV插入的情况下表记为“G追加”，在由A表示的碱基消失的情况下表记为“A删除”等。有两个置换信息是因为，例如在由G表示的碱基变化为由A表示的碱基的情况下，在置换信息I中作为G删除来表示，在置换信息2中作为A追加等来表不。
[0145]可靠性是表示该SNV信息的可靠性的信息，由O至100的实数来表示。这也与位置信息一样，进行分块化来实现检索的高速化。例如与图11 一样，以10%为单位对可靠性进行区分，设定其对应的值。例如，在可靠性是7.44%的情况下，设定为对应的块的值为O。
[0146]在检索的情况下，从上述的患者ID到可靠性的值中、指定若干个作为条件想要指定的值，并且未指定的场所指定视为与任何值都一致的“*”(通配符)，从而生成差异信息(检索请求)。然后，针对SNV信息的各要素，决定在加密标签与检索查询之间全部一致的情况下检索选中的规则。
[0147]并且，还决定各要素在怎样的条件下一致。
[0148]例如，在指定了患者ID的情况下，将患者ID相同的要素视为一致。染色体编号也一样，指定想要检索的染色体编号，将相同的视为一致。在位置信息的情况下，在想要检索例如7000?12000的范围的情况下，确定块2作为包含该范围的块，在检索式中指定“2”。并且，在与作为SNV信息的位置信息所设定的2个值中的任一方相同的情况下，视为一致。在置换信息的情况下，利用与SNV信息中指定的值相同的规则，设定想要进行检索的值，在两者相同的情况下，视为一致。可靠性也一样，在指定了相同值的情况下，视为一致。
[0149]如以上所述，决定SNV信息的编码方法、和能够怎样实施检索的方式。
[0150]图12是已编码的SV信息的结构图。
[0151]SNV信息表示I个碱基发生变化，而SV信息表示连续的多个碱基序列发生变化。SV信息由以下构成:患者ID、染色体编号、开始位置信息、结束位置信息、变异类别、CNV增益、重组染色体编号、重组染色体开始位置信息、重组染色体结束位置信息、分类ID(插入序列)、版本(插入序列)、染色体编号(插入序列)、开始位置信息(插入序列)和结束位置信息(插入序列)。
[0152]患者ID、染色体编号由于与图9所示的SNV相同，因而省略说明。
[0153]开始位置信息是表示变化开始的位置的信息。按照与SNV信息的位置信息相同的步骤使位置信息分块化，设定表示块的值。
[0154]结束位置信息是表示变化结束的位置的信息。按照与SNV信息的位置信息相同的步骤使位置信息分块化，设定表示块的值。
[0155]变异类别是表示SV的类别的信息。例如，设定了表示基因序列的重复次数的追加/削减的“CNV增益”或“CNV损失”、表示碱基序列的反转的“Invers1n”、表示碱基序列的大规模插入的“Insert1n”、表示碱基序列的大规模缺损的“Delet1n”、表示与其他染色体的重组的“重组”等的值。
[0156]CNV增益是在作为变异类别设定有“CNV增益”和“CNV损失”的情况下利用的。关于CNV增益，在作为变异类别设定了“CNV增益”的情况下表示重复次数增加几次，在设定了“CNV损失”的情况下表示重复次数减少几次的信息。由于该值也包含整数值，因而进行分块化并设定值。例如，在如图13所示决定了进行分块化的规则且CNV增益是15的情况下，设定对应的块的编号“3”。
[0157]重组染色体编号是在作为变异类别指定了 “重组”的情况下利用的。重组染色体编号设定了被重组的其他染色体的编号。能够设定的值与染色体编号相同。
[0158]重组染色体开始位置信息和重组染色体结束位置信息是在作为变异类别指定了“重组”的情况下利用的。重组染色体开始位置信息和重组染色体结束位置信息由于表示与其他染色体中的哪个碱基序列发生了重组，因而是表示其他染色体中的重组的开始位置和结束位置的信息。能够设定的值与开始位置信息和结束位置信息相同。
[0159]分类ID(插入序列)是在作为变异类别指定了“Insert1n”的情况下利用的。分类ID(插入序列)设定有表示所插入的碱基序列是其他哪种生物的碱基序列的编号。
[0160]版本(插入序列)是用于表示决定上述分类ID所使用的基因组数据库的版本的数值。
[0161]染色体编号(插入序列)、开始位置信息(插入序列)和结束位置信息(插入序列)是表示插入了其他生物的哪个部分的碱基序列的信息，所设定的值利用与染色体编号、开始位置信息、结束位置信息相同的方法进行编码。不过，由于基因组序列的长度根据生物种类而不同，因而优选的是按每个分类ID准备不同的块的区分方法。
[0162]并且，在检索的情况下，从上述的患者ID到结束位置信息(插入序列)的值中、指定若干个作为条件想要指定的值，并且未指定的场所指定视为与任何值都一致的(通配符)，从而生成差异信息(检索请求)，根据该差异信息生成检索查询。然后，针对SV信息的各要素，决定在加密标签与检索查询之间全部一致的情况下检索选中的规则。
[0163]并且，还决定各要素在怎样的条件下一致。
[0164]患者ID、染色体编号与SNV信息的情况相同。开始位置信息、结束位置信息、重组染色体开始位置信息、重组染色体结束位置信息、开始位置信息(插入序列)和结束位置信息(插入序列)可以与SNV信息的位置信息同样处理。变异类别将想要检索何种种类的变异类别指定为检索查询，将设定了相同值的SV信息视为一致。CNV增益在想要检索例如位于10至30之间的数值的情况下，指定其对应的块的编号“3”。并且，在与SV信息内包含的CNV增益相同的情况下，视为一致。重组染色体编号、染色体编号(插入序列)可以与染色体编号同样处理。对于分类ID、版本，在检索查询内包括想要检索的分类ID和版本，在与SV信息相同的情况下视为一致。
[0165]如上所述，决定SV信息的编码方法和怎样能够实施检索的方式。
[0166]图14是已编码的NC信息的结构图。
[0167]NC信息表示无法映射到基准基因组的碱基。碱基无法映射到基准基因组，在很多情况下认为是由于感染了病毒等而检测出特殊的基因组的情况。因此，NC信息除了患者ID以外，还由以下构成:分类ID (插入序列)、版本(插入序列)、染色体编号(插入序列)、开始位置信息(插入序列)和结束位置信息(插入序列)。
[0168]值的设定方法和检索方法由于与SV信息相同，因而省略说明。
[0169](S102:方式决定处理)
[0170]主密钥生成部110通过处理装置，决定要利用的隐匿检索方式和/

完整全部详细技术资料下载

当前第3页1 2 3 4 5 6