数据处理方法、数据处理装置及数据处理程序与流程

文档序号:38026563发布日期:2024-05-17 13:01阅读:10来源:国知局
数据处理方法、数据处理装置及数据处理程序与流程

本发明涉及一种从混入有来自于非肿瘤细胞的信号的数据中提取来自于肿瘤细胞的信号的数据处理方法、数据处理装置及数据处理程序。


背景技术:

1、关于从混入有来自于非肿瘤细胞的信号的数据中提取来自于肿瘤细胞的信号的技术,例如在专利文献1中记载了用于利用荧光检查和/或除去样品中的物质的装置及方法。并且,在非专利文献1中记载了考虑有可能混入的细胞的大分类的无参考的信号分解技术,在非专利文献2中记载了通过参考库的方法,并根据分取的免疫细胞的测量数据来制作参考。

2、以往技术文献

3、专利文献

4、专利文献1:日本特表2009-537827号公报

5、非专利文献

6、非专利文献1:“a reference profile-free deconvolution method to infercan cer cell-intrinsic subtypes and tumor-type-specific stromal profiles”、liwang等人,[检索于2021年9月22日]、互联网(https://genomemedicine.biomedcentral.com/track/pdf/10.1186/s13073-020-0720-0.pdf)

7、非专利文献2:“methylresolver-a method for deconvoluting bulk dnamethylation profiles into known and unknown cellcontents”、douglas arneson等人,[检索于2021年9月22日]、互联网(https://www.nature.com/articles/s42003-020-01146-2.pdf)


技术实现思路

1、发明要解决的技术课题

2、本发明的技术所涉及的一个实施方式提供一种能够从混入有来自于非肿瘤细胞的信号的数据中高精度地提取来自于肿瘤细胞的信号的数据处理方法、数据处理装置及数据处理程序。

3、用于解决技术课题的手段

4、为了实现上述目的,本发明的第1方式所涉及的数据处理方法由具备处理器的数据处理装置执行,其中,处理器执行如下工序:输入工序,输入测量包含肿瘤细胞及一种以上的已知的非肿瘤细胞的样品而获得的第1dna图谱数据;信号除去工序,除去混入所输入的第1dna图谱数据中的来自于非肿瘤细胞的信号而获取来自于肿瘤细胞的信号;及输出工序,输出来自于肿瘤细胞的信号作为样品的dna图谱特征量。

5、第2方式所涉及的数据处理方法在第1方式中,处理器在输入工序中获取由dna序列和/或修饰限定且反映细胞和/或组织的特性的信息作为第1dna图谱数据。

6、第3方式所涉及的数据处理方法在第2方式中,处理器获取关于dna的甲基化状态、dna的突变信息、基因表达量中的至少任一个的测量值作为信息。

7、第4方式所涉及的数据处理方法在第1至第3方式中的任一个中,处理器进行如下处理:在输入工序中,输入第2dna图谱数据,所述第2dna图谱数据与第1dna图谱数据不同且针对有可能混入第1dna图谱数据中的已知的非肿瘤细胞种类按每个细胞种类分取;及在信号除去工序中,根据第2dna图谱数据来制作由非肿瘤细胞种类的典型模式构成的典型模式矩阵,使用第1dna图谱数据和典型模式矩阵,将第1dna图谱数据分解为每个非肿瘤细胞种类的信号,从进行了分解的结果的残差中除去真正的残差来计算与来自于肿瘤细胞的信号对应的残差,对计算出的残差进行增减以获取来自于肿瘤细胞的信号。

8、第5方式所涉及的数据处理方法在第4方式中,处理器进行如下处理:在将m、n及k设为正整数的情况下,针对k种细胞种类,受理关于m个特征量的n个样品作为第2dna图谱数据,根据受理的第2dna图谱数据来制作k种m维的典型模式向量,并将k种典型模式向量进行连结来制作m行k列的典型模式矩阵。

9、第6方式所涉及的数据处理方法在第4或第5方式中,处理器使用线性回归的方法进行分解。

10、第7方式所涉及的数据处理方法在第6方式中,处理器使用最小二乘法的方法或稳健线性回归的方法作为线性回归的方法。

11、第8方式所涉及的数据处理方法在第1至第7方式中的任一个中,处理器通过使用了已知的典型模式矩阵中的一部分的典型模式矩阵的半参考库的方法进行分解。

12、第9方式所涉及的数据处理方法在第6或第7方式中,处理器提取通过线性回归的方法回归的结果的残差,并对提取到的残差进行基于dna图谱特征量的性质的后处理。

13、第10方式所涉及的数据处理方法在第9方式中,处理器通过将计算出的残差除以输入的第1dna图谱数据中的肿瘤的存在比率来进行增减。

14、第11方式所涉及的数据处理方法在第4至第10方式中的任一个中,处理器进行如下处理:在信号除去工序中,通过将表示第1dna图谱数据的矩阵矩阵分解为表示细胞种类的混合比率的混合比率矩阵和相对于混合比率矩阵的典型模式矩阵来获取来自于肿瘤细胞的信号,根据获取到的信号来重构dna图谱特征量。

15、第12方式所涉及的数据处理方法在第11方式中,处理器使用特异值分解的方法或非负值矩阵分解的方法进行矩阵分解。

16、第13方式所涉及的数据处理方法在第1至第3方式中的任一个中,处理器进行如下处理:在信号除去工序中,使用通过与矩阵分解不同的方法计算出的第1dna图谱数据中的肿瘤的存在比率来获取来自于肿瘤细胞的信号,并根据获取到的信号来重构dna图谱特征量。

17、第14方式所涉及的数据处理方法在第13方式中,处理器使用机器学习的方法来获取来自于肿瘤细胞的信号。

18、第15方式所涉及的数据处理方法在第11至第14方式中的任一个中,处理器进行如下处理:使用与获取到的来自于肿瘤细胞的信号对应的混合比率矩阵来重构包含来自于肿瘤细胞的信号的成分的样品的dna图谱特征量,通过将重构后的dna图谱特征量除以dna图谱特征量中的肿瘤的存在比率来进行增减。

19、为了实现上述目的,第16方式所涉及的数据处理装置具备处理器,其中,处理器执行如下处理:输入处理,输入测量包含肿瘤细胞及多种已知的非肿瘤细胞的样品而获得的第1dna图谱数据;信号除去处理,除去混入所输入的第1dna图谱数据中的来自于非肿瘤细胞的信号而获取来自于肿瘤细胞的信号;及输出处理,输出来自于肿瘤细胞的信号作为样品的dna图谱特征量。第16方式所涉及的数据处理装置可以具备执行与第2至第15方式相同的处理的结构。

20、为了实现上述目的,本发明的第17方式所涉及的数据处理程序使计算机执行数据处理方法,其中,数据处理方法包括:输入工序,输入测量包含肿瘤细胞及多种已知的非肿瘤细胞的样品而获得的第1dna图谱数据;信号除去工序,除去混入所输入的第1dna图谱数据中的来自于非肿瘤细胞的信号而获取来自于肿瘤细胞的信号;及输出工序,输出来自于肿瘤细胞的信号作为样品的dna图谱特征量。第17方式所涉及的数据处理程序可以具备执行与第2至第15方式相同的处理的结构。并且,这些方式的数据处理程序的计算机可读取的非临时性记录介质也包含在本发明的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1