可测定合适特征量的选择方法、可测定合适特征量的选择程序及可测定合适特征量的选择装置与流程

文档序号:37980788发布日期:2024-05-13 12:39阅读:27来源:国知局
可测定合适特征量的选择方法、可测定合适特征量的选择程序及可测定合适特征量的选择装置与流程

本发明涉及一种可测定合适特征量的选择方法、可测定合适特征量的选择程序及可测定合适特征量的选择装置,尤其涉及一种能够测定所选择的特征量的可测定合适特征量的选择方法、可测定合适特征量的选择程序及可测定合适特征量的选择装置。


背景技术:

1、根据给定特征量预测或判别给定样本的特性的问题是最近的机器学习等中处理的中心课题。例如,在基因分析领域中,存在基于dna(deoxyribonucleic acid:脱氧核糖核酸)甲基化模式的多类癌症分类问题等。

2、其中,存在被称为特征量选择的问题,在该特征量选择中,存在多数个成为候选的特征量,从其中预先选择少数个。但是,在实际应用中,并不是仅选择特征量即可,而有时另外要求对所选择的特征量进行其测定手段(测头)的设计。

3、例如,在基因分析问题中,进行如下步骤:根据由微阵列或测序仪等测定出多数个基因(特征量)所得的数据集,选择对癌症等样本特性所需要的标记基因,对其设计pcr(polymerase chain reaction:聚合酶链锁反应)引物(测头)。作为这种设计引物的方法,通常进行选择特征量并设计对其的测头这样的步骤。

4、例如,在下述的非专利文献1中公开有一种根据序列数据总括实施标记选择及引物设计的方法。并且,在专利文献1中公开有一种根据对特征量的引物导出预测读取(read)并决定特征量集的方法。

5、以往技术文献

6、非专利文献

7、非专利文献1:emese meglecz et al.,“a user-friendly program to selectmicrosatellite markers and design primers from large sequencing projects”,bioinformatics,volume 26,issue 3,1february 2010,pages 403-404

8、专利文献

9、专利文献1:日本特表2019-528729号公报


技术实现思路

1、发明要解决的技术课题

2、在非专利文献1中所记载的方法中,根据序列数据选择适当的标记,且对其设计引物并将其提示给用户,并没有考虑所选择的标记的引物的设计失败的可能性。专利文献1中所记载的方法限定于改善效率或用于多个目标,并没有提及任何关于引物设计的内容。并且,没有关于将预测读取反映到特征量集的决定中的具体手段的说明,专利文献1的方法也没有考虑引物的设计失败的可能性。

3、引物的设计并不总是成功,当成功率低时,必须再次进行特征量的选择。并且,当特征量的组合效果大时,若无法进行所选择的特征量的测头的设计,则无法实施所选择的特征的组合,从而无法实现所假设的预测及判别的性能。

4、本发明是鉴于这样的情况而完成的,其提供一种当需要进行特征量选择和测头设计时,通过将这些协调来选择可测定的特征量的可测定合适特征量的选择方法、可测定合适特征量的选择程序及可测定合适特征量的选择装置。

5、用于解决技术课题的手段

6、为了实现本发明的目的,本发明所涉及的可测定合适特征量的选择方法,其用于预测或判别样本的特性,并选择可测定的特征量的可测定合适特征量,该可测定合适特征量的选择方法具有如下工序:数据集输入工序,输入记录有多个特征量的值的样本组的数据集;特征量候选提取工序,从数据集中提取特征量候选;特征量选择候选提取工序,选择预测或判别样本的特性的特征量,并提取特征量选择候选;测头设计工序,设计能够测定特征量的测头,并提取测头的设计上成功的特征量作为可测定特征量;及测头设计结果通知工序,将测头设计工序的测头的设计的成功或失败的结果反馈给特征量选择候选提取工序或将可测定特征量通知给特征量选择候选提取工序;对特征量候选或可测定特征量进行特征量选择候选提取工序,对特征量候选或特征量选择候选进行测头设计工序,在特征量选择候选提取工序或测头设计工序中,从特征量候选中选择能够设计测头且预测或判别样本的特性的可测定合适特征量。

7、根据本发明的一方式,优选如下:在特征量选择候选提取工序中,从特征量候选中选择一个或多个特征量,并提取特征量选择候选,在测头设计工序中,对特征量选择候选进行测头的设计,在测头设计结果通知工序中进行如下步骤中的至少任一个:当根据测头设计工序的结果判断为测头的设计失败时,将判断为失败的特征量反馈给特征量候选,并将其从特征量候选中删除;当根据测头设计工序的结果判断为测头的设计成功时,将判断为成功的特征量作为可测定合适特征量,将可测定合适特征量反馈给特征量选择候选提取工序,并控制特征量选择候选提取工序的条件;及将可测定合适特征量反馈给测头设计工序,并控制测头设计工序的条件;重复特征量选择候选提取工序及测头设计工序,直至能够选择所期望的数量的可测定合适特征量。

8、根据本发明的一方式,优选如下:对特征量候选进行测头设计工序,将判断为测头的设计成功的特征量作为可测定特征量候选,在测头设计结果通知工序中,将可测定特征量候选通知给特征量选择候选提取工序,在特征量选择候选提取工序中,进行提取直至能够从可测定特征量候选中选择所期望的数量的可测定合适特征量。

9、根据本发明的一方式,优选如下:特征量选择候选提取工序具有如下工序:第1特征量选择候选提取工序,用制约弱的第1特征量选择手段提取特征量选择候选;及第2特征量选择候选提取工序,用制约强的第2特征量选择手段提取特征量选择候选;对特征量候选进行第1特征量选择候选提取工序来提取第1特征量选择候选,对第1特征量选择候选进行测头设计工序来将判断为测头的设计成功的特征量作为可测定特征量选择候选,在测头设计结果通知工序中,将可测定特征量选择候选通知给第2特征量选择候选提取工序,在第2特征量选择候选提取工序中,进行提取直至能够从可测定特征量选择候选中选择所期望的数量的可测定合适特征量。

10、根据本发明的一方式,优选如下:测头设计工序具有如下工序:第1测头设计工序,用制约弱的第1测头设计手段进行特征量的测头的设计;及第2测头设计工序,用制约强的第2测头设计手段进行特征量的测头的设计;对特征量候选进行第1测头设计工序来将判断为测头的设计成功的特征量作为可测定特征量候选,在测头设计结果通知工序中,将可测定特征量候选通知给特征量选择候选提取工序,对可测定特征量候选进行特征量选择候选提取工序来提取可测定特征量选择候选,对可测定特征量选择候选进行第2测头设计工序来提取判断为测头的设计成功的特征量作为可测定合适特征量,进行提取直至能够选择所期望的数量的可测定合适特征量。

11、根据本发明的一方式,优选如下:在特征量选择候选提取工序中,针对特征量候选或可测定特征量,通过从多个特征量选择手段中选择的一个特征量选择手段选择特征量选择候选,对特征量候选或特征量选择候选进行基于从多个测头设计手段中选择的一个测头设计手段的测头设计工序,选择判断为测头的设计成功的特征量作为可测定特征量候选,在测头设计结果通知工序中,将可测定特征量候选通知给特征量选择候选提取工序,该可测定合适特征量的选择方法具有任意地重复特征量选择候选提取工序和测头设计工序的重复工序,通过重复工序阶段性地选择能够进行测头的设计的可测定合适特征量。

12、根据本发明的一方式,优选如下:特征量选择候选提取工序在重复工序中以从制约弱到强的顺序进行,测头设计工序在重复工序中以从制约弱到强的顺序进行。

13、根据本发明的一方式,优选如下:特征量为基因的信息,测头为基因测定手段。

14、根据本发明的一方式,优选如下:基因的信息为dna甲基化位点的信息,基因测定手段为引物。

15、根据本发明的一方式,优选如下:预测或判别样本的特性的问题为判定样本属于n类中的哪一类的多类分类问题。

16、为了实现本发明的目的,本发明所涉及的可测定合适特征量的选择程序使计算机执行上述记载的可测定合适特征量的选择方法。

17、为了实现本发明的目的,本发明所涉及的可测定合适特征量的选择装置,其用于预测或判别样本的特性,并选择可测定的特征量,该可测定合适特征量的选择装置具备处理器,处理器具有如下处理:数据集输入处理,输入记录有多个特征量的值的样本组的数据集;特征量候选提取处理,从数据集中提取特征量候选;特征量选择候选提取处理,选择预测或判别样本的特性的特征量,并提取特征量选择候选;测头设计处理,设计能够测定特征量的测头,并提取测头的设计上成功的特征量作为可测定特征量;及测头设计结果通知处理,将测头设计处理的测头的设计的成功或失败的结果反馈给特征量选择候选提取处理或将可测定特征量通知给特征量选择候选提取处理;对特征量候选或可测定特征量进行特征量选择候选提取处理,对特征量候选或特征量选择候选进行测头设计处理,在特征量选择候选提取处理或测头设计处理中,从特征量候选中选择能够设计测头且预测或判别样本的特性的可测定合适特征量。

18、根据本发明的一方式,优选如下:在特征量选择候选提取处理中,从特征量候选中选择一个或多个特征量,并提取特征量选择候选,在测头设计处理中,对特征量选择候选进行测头的设计,在测头设计结果通知处理中进行如下步骤中的至少任一个:当根据测头设计处理的结果判断为测头的设计失败时,将判断为失败的特征量反馈给特征量候选,并将其从特征量候选中删除;当根据测头设计处理的结果判断为测头的设计成功时,将判断为成功的特征量作为可测定合适特征量,将可测定合适特征量反馈给特征量选择候选提取处理,并控制特征量选择候选提取处理的条件;及将可测定合适特征量反馈给测头设计处理,并控制测头设计处理的条件;重复特征量选择候选提取处理及测头设计处理,直至能够选择所期望的数量的可测定合适特征量。

19、根据本发明的一方式,优选如下:对特征量候选进行测头设计处理,将判断为测头的设计成功的特征量作为可测定特征量候选,在测头设计结果通知处理中,将可测定特征量候选通知给特征量选择候选提取处理,在特征量选择候选提取处理中,进行提取直至能够从可测定特征量候选中选择所期望的数量的可测定合适特征量。

20、发明效果

21、根据本发明,当需要进行特征量选择和测头设计时,能够选择可测定的特征量即可测定合适特征量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1