一种生物测序序列快速修剪方法及系统

文档序号:29868146发布日期:2022-04-30 16:23阅读:来源:国知局

技术特征:
1.一种生物测序序列快速修剪方法,其特征在于,包括:获取待修剪的生物测序序列;对所述生物测序序列进行读操作、修剪操作以及写操作;其中,基于生产者—消费者模型对所述读操作、修剪操作以及写操作进行解耦,实现异步执行;且所述生物测序序列的格式化过程从读操作中转移到修剪操作中。2.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述读操作、修剪操作以及写操作分别采用独立的线程进行实现,其中,读线程和写线程均设置有一个,所述修剪线程设置有一个或多个。3.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述读操作用于通过读线程对所述生物测序序列按照块方式进行读取,并将读取的块对象存储入第一数据队列中。4.如权利要求3所述的一种生物测序序列快速修剪方法,其特征在于,所述块对象的创建引入数据池思想,仅创建预设数量的块对象进行重复使用。5.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述修剪操作用于通过修剪线程从所述第一数据队列中获取数据,对所述生物测序序列进行格式化,去除生物测序序列中低质量碱基序列和接头序列;同时将处理后的序列存储入第二数据队列中。6.如权利要求5所述的一种生物测序序列快速修剪方法,其特征在于,在所述修剪线程中获取接头序列包括:将所述生物测序序列中的每个碱基作为一个字符;基于向量寄存器,采用若干次位运算获得预设长度序列数据中接头序列的位置。7.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述写操作用于通过写线程从所述第二数据队列中获取处理后的生物测序序列,并进行存储。8.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述读操作、修剪操作以及写操作所对应的线程仅创建一次,直到处理任务完成后进行销毁。9.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述格式化具体包括按照fastq格式进行数据解析。10.一种生物测序序列快速修剪系统,其特征在于,包括:数据获取单元,其用于获取待修剪的生物测序序列;数据处理单元,其用于对所述生物测序序列进行读操作、修剪操作以及写操作;其中,基于生产者—消费者模型对所述读操作、修剪操作以及写操作进行解耦,实现异步执行;且所述生物测序序列的格式化过程从读操作中转移到修剪操作中。

技术总结
本发明提供了一种生物测序序列快速修剪方法及系统,其属于生物信息技术领域,所述方案包括:获取待修剪的生物测序序列;对所述生物测序序列进行读操作、修剪操作以及写操作;其中,基于生产者—消费者模型对所述读操作、修剪操作以及写操作进行解耦,实现异步执行;且所述生物测序序列的格式化过程从读操作中转移到修剪操作中。转移到修剪操作中。转移到修剪操作中。


技术研发人员:刘卫国 王明凯 殷泽坤 张浩
受保护的技术使用者:山东大学
技术研发日:2022.03.28
技术公布日:2022/4/29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1