一种新的融合核苷酸二联体结构信息和物理化学特性的rna序列表示方法_2

文档序号:9471812阅读:来源:国知局
-0. 02 -0. 07 -0. 04 -0. 12 -0. 03 -0. 06 0. 23 0. 00 0. 23 -0. 10 -0. 03 0. 04 -0. 19 0. 03 0. 14 0. 12 -0. 14 -0. 06 -0. 08 -0. 04 -0. 05 -0. 02 -0. 06 0. 02 -0. 01 0. 06 -0. 03 0. 08 0. 05 0.08 0.03 0.07 -0.06 -0.02 -0.16 -0.11 0.08 0.03 0.00 0.13 0.00 -0.08 -0.01 -0.20 0.13 -0.07 0.16 0.13 0.05 0.11 -0.14 -0.10 -0.01 0.12 -0.03 0.05 0.01 0.02 0.02 0.08 0.00 -0.08 -0.05 0.01 0.12 -0.05 0.11 -0.06 0.10 0.09 -0.05 -0. 09 0. 01 -0. 02 -0. 03 0. 01 -0. 02 -0. 12 -0. 02 0.化 0. 00 0. 10 -0. 10 -0. 02 -0. 06 -0. 02 0. 08 0. 01 -0. 14 -0. 02 -0. 04 0. 09 -0. 03 -0. 02 0. 11 -0. 19 -0. 07 -0. 07 -0. 03 0. 06 0. 00 0. 03 0. 03 -0. 12 -0. 03 -0. 10 0. 01 0. 18 -0. 13 0. 00 0. 08 -0. 03 0. 12 0. 01 -0. 08 0. 09 0. 04 0. 13 0. 06 -0. 08 -0. 17 0. 06 -0. 07 0. 26 0. 24 -0. 36 0. 04 0.05 -0.18 -0.11 0.06 -0.15 0.03 0.04 0.02 0.03 -0.04 0.01 0.14 -0.10 0.04 0.42 0.22 -0.05 -0.:M 0.12 -0.21 -0.17 0.11 -0.18 0.08 0.01 0.00 0.00 -0.04 0. 02 0. 07 -0. 02 0. 02 -0. 16 0. 04 0.00 0.06 0.04 -0.07 0.12 -0.04 0.04 -0.11 -0.02 0.10 -0.02 -0.02 -0.03 -0. 05 0. 07 -0. 07 -0. 13 -0. 27 0. 06 0. 26 -0. 09 -0. 04 0. 18 0. 08 0. 16 -0. 08 0. 09 0. 00 -0. 02 0. 05 -0. 03 -0. 04 0. 07 0. 02] (5) 根据公式(12)将PCM矩阵进行转换,数值投影到0-255区间后,转换成二维图像, 取图像的几何矩作为描述RNA序列的整体特征 首先对PCM矩阵进行投影,使其参数范围在0-255之间,得到二维的图像如附图1所 示,然后根据公式(13-15)计算得到图像的3种几何矩的参数,我们可W得到1X3维的特 征向量:
(6)将上述所得到的描述RNA序列特征因子结合,最终得到RNA序列的离散向量描述方 法。
[0018] 筑::'|沒姑'Aiita(>(义W,煤=[-1.21 0.32 -0.62 -1.20 0.31 -0.39 -0.76 0.11 0.16 -0.88 0.11 -0.05 -1.08 0.09 0.05 -1.18 0.08 -0.11 -0.78 0.25 0.11 -0.92 0.23 -0.17 -0.72 0.02 -0.06 -0.67 0.28 0.06 -0.22 -0.20 0.22 0.11 -0.05 -0.09 0.17 0.07 0.19 0.25 0.04 0.25 -0.09 -0.07 -0.09 -0.08 -0.13 0.11 -0. 17 0. 18 0. 25 -0. 06 0. 24 0. 25 -0. 23 -0. 36 0. 07 -0. 21 -0. 17 -0. 20 0. 10 -0. 10 -0. 16 0. 05 0. 03 -0. 02 0. 00 0. 04 0. 14 -0.:M -0. 07 -0. 03 0. 23 0. 36 -0. 18 0. 30 -0. 22 0. 03 0. 25 -0. 04 -0. 13 -0. 04 -0. 12 0. 05 -0. 12 -0. 03 0. 14 -0. 06 -0. 09 0. 03 -0.01 0.01 -0.01 0.00 0.09 -0.04 -0.22 0.16 0.03 0.09 0.30 -0.19 0.27 0.11 0. 27 -0. 18 -0. 09 0. 07 0. 05 0. 01 -0. 07 0. 06 0. 16 0. 15 -0. 09 -0. 22 0. 00 -0. 01 -0. 16 -0. 24 -0. 20 0. 02 0. 02 -0. 16 0. 13 0. 03 0. 06 0. 16 0. 28 -0. 19 -0. 09 -0. 15 -0. 15 -0. 28 -0. 06 0. 00 -0. 06 -0. 07 -0. 11 -0. 06 -0. 13 0. 15 0. 01 0. 07 0. 03 -0. 02 -0. 02 -0. 05 -0. 01 -0.化-0. 02 0. 23 -0. 13 -0. 08 0. 17 0. 15 -0. 01 0. 13 0. 01 -0. 22 0.22 -0.31 0.03 0.26 0.08 -0.02 0.19 0.28 0.26 -0.06 0.11 0.03 -0.19 -0.12 0. 07 -0. 16 -0. 03 -0. 10 -0. 01 0. 07 0. 03 0. 03 -0. 04 0. 04 0. 00 0. 00 0. 06 0. 18 -0. 13 0. 20 -0. 18 -0. 13 0. 00 -0. 16 0. 14 0. 24 -0. 14 -0. 17 -0. 04 -0. 04 0. 01 0. 07 -0. 05 0. 15 0. 08 -0. 13 -0. 06 0. 04 0. 12 -0. 05 0. 06 -0. 03 -0. 09 -0. 10 0. 27 0. 02 0. 27 0. 02 -0. 11 -0. 06 -0. 07 0. 15 0. 24 -0. 16 -0. 18 -0. 04 -0. 02 -0. 07 -0. 02 0. 10 -0. 06 0. 11 -0. 17 0. 06 -0. 25 -0. 02 -0. 07 -0. 04 -0. 12 -0. 03 -0. 06 0. 23 0. 00 0. 23 -0. 10 -0. 03 0. 04 -0. 19 0. 03 0. 14 0. 12 -0. 14 -0. 06 -0. 08 -0. 04 -0. 0日-0. 02 -0. 06 0.02 -0.01 0.06 -0.03 0.08 0.05 0.08 0.03 0.07 -0.06 -0.02 -0.16 -0.11 0.08 0.03 0.00 0.13 0.00 -0.08 -0.01 -0.20 0.13 -0.07 0.16 0.13 0.05 0.11 -0.14 -0. 10 -0. 01 0. 12 -0. 03 0. 05 0. 01 0. 02 0. 02 0. 08 0. 00 -0. 08 -0. 05 0. 01 0. 12 -0. 05 0. 11 -0. 06 0. 10 0. 09 -0. 05 -0. 09 0. 01 -0. 02 -0. 03 0. 01 -0. 02 -0. 12 -0. 02 0. 25 0. 00 0. 10 -0. 10 -0. 02 -0. 06 -0. 02 0. 08 0. 01 -0. 14 -0. 02 -0. 04 0. 09 -0. 03 -0. 02 0. 11 -0. 19 -0. 07 -0. 07 -0. 03 0. 06 0. 00 0. 03 0. 03 -0. 12 -0. 03 -0. 10 0. 01 0. 18 -0. 13 0. 00 0. 08 -0. 03 0. 12 0. 01 -0. 08 0. 09 0. 04 0. 13 0. 06 -0. 08 -0. 17 0.06 -0.07 0.26 0.24 -0.36 0.04 0.05 -0.18 -0.11 0.06 -0.15 0.03 0.04 0.02 0.03 -0.04 0.01 0.14 -0.10 0.04 0.42 0.22 -0.05 -0.:M0.12 -0.21 -0.17 0.11 -0. 18 0. 08 0. 01 0. 00 0. 00 -0. 04 0. 02 0. 07 -0. 02 0. 02 -0. 16 0. 04 0. 00 0. 06 0. 04 -0. 07 0. 12 -0. 04 0. 04 -0. 11 -0. 02 0. 10 -0. 02 -0. 02 -0. 03 -0. 05 0. 07 -0. 07 -0. 13 -0. 27 0. 06 0. 26 -0. 09 -0. 04 0. 18 0. 08 0. 16 -0. 08 0. 09 0. 00 -0. 02 0. 05 -0. 03 -0. 04 0. 07 0. 02 253. 98 6508. 77 2098. 61] 采用此方法能改进现有RNA序列描述方法,将此方法用于RNA属性类型预测及RNA修 饰位点的位预测中,相关预测器预测成功率提高6%。
[0019] W上所述仅为本发明的较佳实施例而已,并不用W限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种新的融合核苷酸二联体结构信息和物理化学特性的RNA序列表示方法,其特征 在于包括以下步骤: (1) 基于核苷酸二联体物理化学性质构成RNA序列的物理化学矩阵PCM,该矩阵是一个 10 > (L-I)的矩阵,其中L为序列长度,10为采用了 10种核苷酸二联体物理化学性质; (2) 对PCM矩阵中的每一行数据采用灰色模型GM(2, 1)进行建模得到描述每行序列整 体特征的3个参数a's、. 0? .p,10行共30个参数; (3) 对PCM矩阵中每行数值序列计算其自相关因子,得到10 :?I个参数,这里 3、、丄.4,这些参数描述了RNA序列的局部特征; (4) 对PCM矩阵中各行计算其互相关因子,得到10篇9I:个参数,这些参数描述了 序列的局部信息; (5) 将PCM矩阵进行转换,数值投影到0-255区间后,转换成二维图像,取图像的几何矩 作为描述RNA序列的整体特征; (6) 将上述所得到的描述RNA序列特征因子结合,最终得到RNA序列的离散向量描述方 法。2. 根据权利要求1所述的RNA序列表示方法,其特征在于:所述RNA序列可以用下式 表ZK:I表示序列第i个位置上的核苷酸,L为序列长度。3. 根据权利要求2所述的RNA序列表示方法,其特征在于:所述物理 化学性质包括:六种结构属性和四种其它种类属性,所述六种结构属性为:4. 根据权利要求3所述的RNA序列表示方法,其特征在于:所述RNA序列根据核苷酸 二联体物理化学性质转换成的物理化学矩阵PCM为:5.根据权利要求1所述的RNA序列表示方法,其特征在于:所述方法用于RNA属性类 型预测及RNA修饰位点的预测中,相关预测器的预测成功率提高4-7%。
【专利摘要】本发明提供一种新的融合核苷酸二联体结构信息和物理化学特性的RNA序列表示方法,将核苷酸二联体结构信息和其它物理化学特性构建RNA序列物理化学矩阵PCM,此矩阵含有RNA序列结构信息和序列顺序信息。通过对矩阵中的每行数据建立灰色模型并计算其自相关因子和行与行之间的互相关因子得到序列局部信息,将PCM转换成二维图像,计算其图像几何距得到序列全局信息。将所得到的描述序列局部信息和全局信息的因子相结合,得到RNA序列离散向量描述模型。本方法用于RNA属性类型预测及RNA修饰位点的位预测中,能明显提高相关预测器的预测成功率,具有广阔的运用前景。
【IPC分类】G06F19/18
【公开号】CN105224825
【申请号】CN201510720436
【发明人】肖绚, 刘子
【申请人】景德镇陶瓷学院
【公开日】2016年1月6日
【申请日】2015年10月30日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1