一种基于权重支持率的高通量筛选数据噪声抑制方法和装置的制造方法

文档序号:8299340阅读:449来源:国知局
一种基于权重支持率的高通量筛选数据噪声抑制方法和装置的制造方法
【技术领域】
[0001] 本发明涉及计算机计算生物学领域,特别涉及计算生物学中,尤其涉及一种基于 权重支持率的高通量筛选数据噪声抑制方法和装置。
【背景技术】
[0002] 近年来,组合化学的长足发展使得短时间合成大量化合物成为可能,且遗传学 研宄,如人类基因组计划等,使靶蛋白数量以几何级数增加。传统小规模实验方法难以处 理飞速增长的蛋白质分子,无法对其相互作用网络进行全面探索;导致对高通量筛选(High ThroughputScreening)技术迫切需求。高通量筛选技术,根据待测样品的合成路线,包括 液相和固相筛选;根据筛选目标物,包括纯蛋白受体亲合性筛选、酶活性筛选、细胞活性筛 选等。高通量筛选技术主要包括放射性染料筛选、荧光筛选、闪烁接近化验、酶连接免疫吸 收剂化验、细胞功能筛选小鼠显型表型遗传学等方法。
[0003] 高通量筛选技术具备很高的执行效率,对比小规模实验方法,能减少筛选单位的 数量,并自动化重复工作,同时还能简化筛选过程和降低筛选成本。但是,高通量筛选技术 也存在自身的不足,即测定的高通量筛选数据存在较多的噪声,对数据的参考价值构成影 响。因此,如何对高通量筛选数据中的噪声数据进行抑制,是计算生物学领域的一个重点研 宄问题。
[0004] 现有高通量筛选数据噪声抑制方法主要包括基于知识的方法、基于信息整合的方 法、基于重复实验的方法和基于高通量数据网络拓扑结构的方法。其中,基于知识的方法和 基于信息整合的方法需要对涉及靶蛋白的性质进行进一步的分析,导致很大的工作量和分 析成本;基于重复试验的方法则需要重复进行传统小规模实验或者高通量筛选实验,同样 会耗费巨大的人力物力成本。基于高通量网络拓扑结构的方法,其主要优势在于只需要获 得高通量筛选数据,即可构建蛋白质相互作用网络,并根据对蛋白质相互作用网络拓扑结 构的分析结果实现对高通量筛选数据进行噪声抑制的目的。但是,基于高通量网络拓扑结 构的方法在处理稀疏的蛋白质相互作用网络时,其性能会急剧降低。然而,受实际成本限 制,现有的高通量筛选数据,其对应的蛋白质网络,往往是比较稀疏的。因此,如何对应稀疏 蛋白质相互作用网络的高通量筛选数据进行噪声抑制,是计算生物学领域的一个关键技术 问题。

【发明内容】

[0005] 本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于权 重支持率的高通量筛选数据噪声抑制方法和装置。
[0006] 为了实现本发明的上述目的,本发明提供了一种一种基于权重支持率的高通量筛 选数据噪声抑制方法,其关键在于,包括如下步骤:
[0007]S1,数据转化模块接收服务器采集的高通量筛选数据,将其转化为蛋白质相互作 用矩阵,将得到的蛋白质相互作用矩阵存入数据存储模块;
[0008] S2,数据存储模块存储由数据转化模块转化的蛋白质相互作用矩阵以及存储构造 的权重矩阵和权重支持率矩阵;
[0009] S3,执行模块根据数据存储模块所存储的蛋白质相互作用矩阵,执行权重矩阵构 造过程和权重支持率矩阵构造过程,并将构造完成的权重矩阵和权重支持率矩阵存入数据 存储模块;
[0010] S4,噪声抑制模块根据数据存储模块存储的蛋白质相互作用矩阵、权重矩阵和权 重支持率矩阵,执行高通量筛选数据抑制过程,并将经过噪声抑制的高通量筛选数据输出 至服务器。
[0011] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S1包括:
[0012] S1-1,接收服务器采集的高通量筛选数据;
[0013] S1-2,根据高通量筛选数据对应的蛋白质集合P,构造|P|行,|P|列的空白相互作 用矩阵Y;
[0014] S1-3,对蛋白质二元组(a,b),根据高通量筛选数据,对Y中对应元素ya,b和yb,a 进行设置,其中a、b分别为蛋白质二元组数据,对所有蛋白质,进行从1?|P|的编号,然后 对于Y,其行号和列号对应蛋白质编号,所以ya,b和yb,a对应的都是编号为a和b的蛋白质 二元组间的相互作用关系;
[0015] S1-4,判断是否已处理完所有的蛋白质二元组,若处理完毕,则执行S1-5,否则,执 行S1-3 ;
[0016] S1-5,将得到的蛋白质相互作用矩阵Y存储至数据存储模块的相互作用矩阵存储 单元。
[0017] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S2包括:
[0018] S2-1,相互作用矩阵存储单元存储数据转化模块转化的蛋白质相互作用矩阵;
[0019] S2-2,权重存储单元存储执行模块根据蛋白质相互作用矩阵构造的权重矩阵数 据,将存储的权重矩阵构造数据发送到噪声抑制模块;
[0020] S2-3,权重支持率存储单元存储根据蛋白质相互作用矩阵构造的权重支持率矩阵 数据,将存储的权重支持率矩阵构造数据发送到噪声抑制模块。
[0021] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S3包括:
[0022] S3-1,权重计算单元根据数据存储模块的蛋白质相互作用矩阵执行权重矩阵构造 过程,并将构造完成的权重矩阵存入数据存储模块的权重矩阵存储单元;
[0023] S3-2,权重支持率计算单元根据数据存储模块的蛋白质相互作用矩阵,执行权重 支持率矩阵构造过程,并将构造完成的权重支持率矩阵存入数据存储模块的权重支持率矩 阵存储单元。
[0024] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S3-1还包 括:
[0025] S3-A,从数据存储模块的相互作用矩阵存储单元中取出相互作用矩阵Y;
[0026] S3-B,根据相互作用矩阵Y的蛋白质集合P,构造|P|行,|P|列的空白权重矩阵 W;
[0027] S3-C,根据相互作用矩阵Y,对蛋白质集合P中的每个蛋白质a,以相互作用矩阵Y 的对应行向量ya作为其特征向量;
[0028]S3-D,对蛋白质二元组(a,b),根据其特征向量yJPyb,对权重矩阵W,计算权重 wa,b;
[0029]S3-E,判断已处理完所有的蛋白质二元组(a,b);
[0030] S3-F,将权重矩阵W存储至数据存储模块的权重矩阵存储单元。
[0031] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S3-2还包 括:
[0032]S3_a,从数据存储模块的相互作用矩阵存储单元中取出相互作用矩阵Y;
[0033]S3_b,根据相互作用矩阵Y的蛋白质集合P,构造|P|行,|P|列的空白权重支持率 矩阵S,和|P|行,|P|列空白支持度矩阵R;
[0034] S3-c,根据相互作用矩阵Y,对蛋白质集合P中的每个蛋白质a,以相互作用矩阵Y 的对应行向量ya中的非零元素对应的蛋白质集合,作为其支持近邻集合P(a);
[0035]S3_d,对蛋白质二元组(a,b),根据其支持近邻集合P(a)和P(b),对权重矩阵W,计 算支持度矩阵R中对应的支持度元素ra,b;
[0036]S3_e,判断是否已处理完毕所有的蛋白质二元组,若处理完毕,则执行步骤S3_f, 否则,执行S3-d;
[0037]S3_f,对于支持度矩阵R中的所有已知元素,计算支持度均值rAV(;;
[0038] S3_g,根据支持度均值!^%,计算支持度均值入;
[0039]S3_h,对蛋白质二元组(a,b),根据支持度矩阵R中的对应支持度元素ra,b和支持 度均值A,对权重支持率矩阵S,计算权重支持率sa,b;
[0040] S3-i,判断已处理完毕所有的蛋白质二元组,若处理完毕,则执行S3-j,否则,执行 S3-h;
[0041] S3-j,将权重支持率矩阵S存储至数据存储模块的权重支持率矩阵存储单元。
[0042] 所述的基于权重支持率的高通量筛选数据噪声抑制方法,优选的,所述S4还包 括:
[0043] S4-A,从数据存储模块的相互作用矩阵存储单元中取出相互作用矩阵Y;
[0044] S4-B,从数据存储模块的权重矩阵存储单元中取出权重矩阵W;
[0045] S4-C,从数据存储模块的权重支持率矩阵存储单元中取出权重支持率矩阵S;
[0046] S4-D,根据相互作用矩阵Y对应的蛋白质集合P,对于Y中的所有元素,初始化均赋 值为〇,初始化|P|行,|P|列的反应
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1