1.一种分析个体两类状态的免疫差异的方法,其特征在于,包括,
获取第一测序数据和第二测序数据,
所述第一测序数据为第一类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第一读段,
所述第二测序数据为第二类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第二读段,
所述淋巴细胞基因组的至少一部分包括CDR3序列的至少一部分;
分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接,获得第一拼接序列和第二拼接序列;
将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对,获得第一CDR3序列和第二CDR3序列,所述多种CDR3参考序列包括V基因参考序列、D基因参考序列和J基因参考序列中的至少两种;
比较第一CDR3序列和第二CDR3序列中的各种VJ组合亚型的使用频率的差异,确定差异具有统计意义的VJ组合亚型对第一类状态和第二类状态的区分效果,
第一CDR3序列中的VJ组合亚型的使用频率为支持该VJ组合亚型的第一CDR3序列的种类数目与支持所有VJ组合亚型的第一CDR3序列的种类总数的比值,
第二CDR3序列中的VJ组合亚型的使用频率为支持该VJ组合亚型的第二CDR3序列的种类数目与支持所有VJ组合亚型的第二CDR3序列的种类总数的比值。
2.权利要求1的方法,其特征在于,所述第一测序数据包括多对第一读段对,每对第一读段对由两个第一读段组成,
所述第二测序数据包括多对第二读段对,每对所述第二读段对由两个第二读段组成,
进行所述拼接依据有重叠的第一读段或第二读段,以及第一读段对或者第二读段对中一对读段对中的两个读段之间的距离。
3.权利要求1的方法,其特征在于,所述多种CDR3参考序列包括V基因参考序列和J基因参考序列,
所述将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对,包括,
将所述第一拼接序列和第二拼接序列分别与所述多种CDR3参考序列进行比对,获得第一比对结果和第二比对结果,
所述第一比对结果包括能够与至少一种V基因参考序列和至少一种J基因参考序列都比对上的第一拼接序列,
所述第二比对结果包括能够与至少一种V基因参考序列和至少一种J基因参考序列都比对上的第二拼接序列,
基于所述第一比对结果,确定其中的第一拼接序列上的CDR3序列的起始位置,
基于所述第二比对结果,确定其中的第二拼接序列上的CDR3序列的起始位置,
分别将第一比对结果中的第一拼接序列上的CDR3序列起始位置之后的部分和第二比对结果中的第二拼接序列上的CDR3序列起始位置之后的部分与所述多种CDR3参考序列进行重新比对,获得第一重新比对结果和第二重新比对结果。
4.权利要求3的方法,其特征在于,所述重新比对的比对条件设置为,
与所述V基因参考序列的TRB基因参考序列区进行所述重新比对所允许的错配碱基数为0,与所述V基因参考序列的IGH基因参考序列区进行所述重新比对所允许的错配碱基数为2,和/或
与所述J基因参考序列的TRB基因参考序列区进行所述重新比对所允许的错配碱基数为0,与所述J基因参考序列的IGH基因参考序列区进行所述重新比对所允许的错配碱基数为2。
5.权利要求3的方法,其特征在于,在获得第一重新比对结果和第二重新比对结果后,还包括,
分别对所述第一重新比对结果和所述第二重新比对结果进行过滤,以获得所述第一CDR3序列和所述第二CDR3序列,其中包括,分别去除第一重新比对结果和第二重新比对结果中的符合以下描述至少之一的拼接序列,
其所属CDR3序列种类的拼接序列的支持数为1,
未能比对上V基因参考序列或者J基因参考序列,
比对上所述CDR3参考序列的假基因参考序列区,
比对上V基因参考序列和J基因参考序列,且比对上二者的方向相反,
无法确定其上的CDR3的起始位置,
含终止密码子,
不含开放阅读框。
6.权利要求1的方法,其特征在于,所述差异具有统计意义的VJ组合亚型包括以下至少之一:TRBV19&TRBJ1-1、TRBV25-1&TRBJ1-1、TRBV25-1&TRBJ1-4、 TRBV25-1&TRBJ2-1、TRBV27&TRBJ1-4、TRBV6-2&TRBJ1-1、TRBV6-3&TRBJ1-1、TRBV6-6&TRBJ1-1、TRBV6-9&TRBJ1-1和TRBV7-9&TRBJ2-3。
7.权利要求1-6任一方法,其特征在于,还包括,
比较第一高频CDR3序列比例和第二高频CDR3序列比例的差异,确定差异具有统计意义且能够区分所述第一类状态和所述第二类状态的高频CDR3序列比例的数值范围,
所述第一高频CDR3序列比例为所述第一CDR3序列种类数中高频CDR3序列种类数所占的比例,
所述第二高频CDR3序列比例为所述第二CDR3序列种类数中高频CDR3序列种类数所占的比例,
所述第一高频CDR3序列为在所述第一CDR3序列中频率不小于0.05%的CDR3序列,
所述第二高频CDR3序列为在所述第二CDR3序列中频率不小于0.05%的CDR3序列;和/或
比较第一CDR3序列和第二CDR3序列中的各种V亚型的使用频率的差异,确定差异具有统计意义的V亚型对第一类状态和第二类状态的区分效果,
第一CDR3序列的V亚型的使用频率为支持该V亚型的第一CDR3序列的种类数目与支持所有V亚型的第一CDR3序列的种类总数的比值,
第二CDR3序列中的V亚型的使用频率为支持该V亚型的第二CDR3序列的种类数目与支持所有V亚型的第二CDR3序列的种类总数的比值;和/或
比较第一CDR3序列和第二CDR3序列中的各种V合并亚型的使用频率的差异,确定差异具有统计意义的V合并亚型对第一类状态和第二类状态的区分效果,
第一CDR3序列中的V合并亚型的使用频率为支持该V合并亚型的第一CDR3序列的种类数目与支持所有V合并亚型的第一CDR3序列的种类总数的比值,
第二CDR3序列中的V合并亚型的使用频率为支持该V合并亚型的第二CDR3序列的种类数目与支持所有V合并亚型的第二CDR3序列的种类总数的比值。
8.权利要求7的方法,其特征在于,所述第一高频CDR3序列为在所述第一CDR3序列中频率不大于0.5%的CDR3序列,
所述第二高频CDR3序列为在所述第二CDR3序列中频率不大于0.5%的CDR3序列。
9.权利要求7的方法,其特征在于,所述确定差异具有统计意义的V亚型对第一类状态和第二类状态的区分效果,包括,
利用主成分分析方法确定能够区分开第一状态和第二状态的V亚型,以及
利用ROC分析确定所述能够区分开第一状态和第二状态的V亚型对第一状态和第二状态的区分效果;
和/或,
所述确定差异具有统计意义的V合并亚型对第一类状态和第二类状态的区分效果,包括,
利用主成分分析方法确定能够区分开第一状态和第二状态的V合并亚型,以及
利用ROC分析确定所述能够区分开第一状态和第二状态的V合并亚型对第一状态和第二状态的区分效果;
和/或,
所述确定差异具有统计意义的VJ组合亚型对第一类状态和第二类状态的区分效果,包括,
利用主成分分析方法确定能够区分开第一状态和第二状态的VJ组合亚型,以及
利用ROC分析确定所述能够区分开第一状态和第二状态的VJ组合亚型对第一状态和第二状态的区分效果。
10.一种辅助确定个体状态的方法,其特征在于,包括,
提取待测个体的淋巴细胞中的核酸;
对所述核酸中的CDR3序列进行捕获;
对捕获得的核酸进行序列测定,获得测序结果,所述测序结果包括多个读段;
对所述测序结果中的读段进行拼接,获得拼接片段;
将所述拼接片段分别与多种CDR3基因参考序列进行比对,获得CDR3序列,所述CDR3参考序列包括V基因参考序列、D基因参考序列和J基因参考序列中的至少两种;
基于获得的CDR3序列,确定待测个体的各种VJ组合亚型的使用频率,
所述VJ组合亚型的使用频率为支持该VJ组合亚型的CDR3序列的种类数目与支持所有VJ组合亚型的CDR3序列的种类总数的比值;
比较所述VJ组合亚型的使用频率与其对应阈值的差异,以辅助确定个体状态,所述阈值的确定包括利用权利要求1-9任一方法。