本发明属于生物信息学领域,涉及一种基于多实例学习的人体免疫状态预测方法。
背景技术:
1、t细胞是人体免疫系统的重要组成部分之一,它的功能是识别抗原并与抗原相结合,t细胞受体则在该过程中扮演了重要角色,因此t细胞受体可以直接反映人体的免疫状态。
2、 大多数基于t细胞受体序列的人体免疫状态预测方法都只关注人体的某一条t细胞受体序列,而忽略它们之间的联系。基于多实例学习的检测方法则可以充分考虑序列之间的相关性,但现有方法大多直接移植于传统多实例学习, 而传统多实例学习的包分类方法过于简单,无法对人体免疫状态进行准确的预测。
技术实现思路
1、为了克服上述困难,本发明提出了一种基于多实例学习的人体免疫状态预测方法。本方法将多个人体内的t细胞受体序列视为实例,将人体免疫状态视为包,充分考虑t细胞受体序列与人体免疫状态之间的关系,在包分类模块中使用卷积神经网络避免了传统多实例学习无法充分考虑实例与包之间关系的问题。
2、一种基于多实例学习的人体免疫状态预测方法,包括实例评分模块的构建、包分类模块的构建、模型训练三个步骤,其具体步骤如下:
3、步骤1、使用三个并行的卷积神经网络模块和一个全连接层组成一个实例评分模块,用于获得每条t细胞受体序列的评分;
4、步骤2、使用三个并行的卷积神经网络模块和一个全连接层组成一个包分类模块;
5、步骤3、使用人体的免疫状态作为标签,人体的t细胞受体序列作为输入对整个模型进行训练。
6、一种基于多实例学习的人体免疫状态预测方法,步骤1实现过程如下:
7、在构建实例评分模块时,使用pytorch 的nn.conv2d、nn.relu、nn.batchnormalization、nn.dropout构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用nn.linear函数构建一个全连接层。
8、一种基于多实例学习的人体免疫状态预测方法,步骤2实现过程如下:
9、在构建包分类模块时,使用pytorch 的nn.conv1d、nn.relu、nn.batchnormalization、nn.dropout构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用nn.linear函数构建一个全连接层。
10、一种基于多实例学习的人体免疫状态预测方法,步骤3实现过程如下:
11、将步骤1和步骤2构建的模块组成完整模型,以t细胞受体序列作为输入,在输入到实例评分模块前,将数据的包数量和实例数量进行合并,合并后的维度作为批处理量输入到模型中。在实例评分模块得到了每条实例的评分后,把批处理量重新拆分为包数量和实例数量,并以包数量作为批处理量输入到包分类模块中,最终得到模型对各个包的预测结果。
1.一种基于多实例学习的人体免疫状态预测方法,其特征在于,将多个人体内的t细胞受体序列视为实例,将人体免疫状态视为包,充分考虑t细胞受体序列与人体免疫状态之间的关系,可以对人体免疫状态进行直接预测,在包分类模块中使用卷积神经网络避免了传统多实例学习无法充分考虑实例与包之间关系的问题,该方法包括实例评分模块的构建、包分类模块的构建、模型训练三个步骤,其具体步骤如下:
2.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,通过并行的卷积神经网络模块来提取序列在不同维度的特征,可以对序列做出更为准确的评分,实例评分模块的构建的实现过程如下:
3.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,使用卷积神经网络来提取各个实例之间的关系,更好根据实例评分来对包进行分类,包分类模块的构建的实现过程如下:
4.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,通过维度的变化实现实例和包的转化,使得模型可以提取实例特征,也可提取实例与包之间的联系特征,模型训练的实现过程如下: