本发明实施例涉及芯片,具体涉及一种样本污染检测方法、装置、系统及相关设备。
背景技术:
1、核酸检测是一种病毒核酸检测技术,通过确定检测样本(下称样本)中是否存在外来入侵的病毒的核酸,来确定样本是否被病毒感染,而当检测结果表明核酸“阳性”时,则认为样本中有病毒存在。
2、然而,样本在制作过程中具有被污染的风险,例如,样本中混入了其他样本的dna等。被污染的样本(下称污染样本)若不能及时发现,会对核酸检测的核酸检测结果产生干扰,甚至造成检测结果错误,例如使核酸检测结果呈现假阳性等。
3、因此,如何判断样本是否被污染,进而为样本的核酸检测结果的准确度提供依据,成为了本领域技术人员亟待解决的技术问题。
技术实现思路
1、有鉴于此,本发明实施例提供一种样本污染检测方法、装置、系统及相关设备,简单直接的判断样本是否被污染,进而为检测样本的核酸检测结果的准确度提供依据。
2、为实现上述目的,本发明实施例提供如下技术方案。
3、第一方面,本发明实施例提供一种样本污染检测方法,包括:
4、获取样本的核酸信息;
5、计算所述样本在预设位点的突变基因型频率值baf;其中,所述预设位点为多个,且在无污染样本中,所述预设位点中的纯合位点的比例大于第一比例;
6、根据所述预设位点的baf,确定所述预设位点中的纯合位点;
7、计算所述纯合位点在预设位点中所占的比例,若所述纯合位点所占的比例小于所述第一比例,则所述样本为污染样本。
8、可选的,若所述样本为污染样本,所述方法还包括:计算所述污染样本的污染值。
9、可选的,所述计算所述污染样本的污染值,包括:
10、根据所述预设位点的baf,对所述预设位点进行排序,得到位点序列;
11、去除所述位点序列中的纯合位点,得到第一位点序列;
12、以所述第一位点序列中预设位置中的位点为标定位点,根据所述标定位点的baf,计算所述样本的污染值;
13、其中,所述预设位置为自位点序列端点顺延第一预设个数后得到的位置;所述第一预设个数基于所述预设位点中,杂合基因型污染纯合位点在所述预设位点中的比例计算得到。
14、可选的,所述根据所述预设位点的baf,确定所述预设位点中的纯合位点,包括:
15、获取第一阈值;
16、在所述预设位点的baf小于所述第一阈值时,以所述预设位点为纯合位点。
17、可选的,若所述纯合位点所占的比例大于或等于所述第一比例,则所述样本为待定样本;所述方法还包括:
18、若所述样本为待定样本,判断所述待定样本是否为低污染样本。
19、可选的,所述判断所述待定样本是否为低污染样本,包括:
20、根据所述预设位点的baf,对所述预设位点进行排序,得到位点序列;
21、去除所述位点序列中,baf大于或等于预设值的位点,得到第二位点序列;其中,所述预设值大于所述第一阈值,且小于或等于所述第一阈值的5倍;
22、以所述第二位点序列中的位点为待处理位点,获取所述待处理位点的邻近碱基的baf;其中,所述邻近碱基为邻近所述待处理位点的第二预设个数的碱基;
23、计算所述待处理位点和所述待处理位点的邻近碱基的差异显著性,若所述待处理位点和所述待处理位点的差异参数在预设范围,则所述待定样本为低污染样本。
24、可选的,若所述待定样本为低污染样本,所述方法还包括:计算所述低污染样本的污染值;
25、所述计算所述低污染样本的污染值,包括:
26、以所述第二位点序列中,baf最高的第三预设个数的待处理位点为有效位点,确定所述有效位点的baf的中位值,并以所述中位值为污染值;
27、其中,所述第三预设个数可以基于纯合污染纯合位点占总纯合位点比例计算得到。
28、可选的,所述计算所述样本在预设位点的突变基因型频率值baf的步骤中,还计算所述预设位点的邻近碱基的baf;
29、所述获取所述待处理位点的邻近碱基的baf,具体为,获取所述预设位点中,所述待处理位点的邻近碱基的baf。
30、可选的,所述预设位点基于位点的一个或多个因素选取得到;选取所述预设位点的因素包括:位点的杂合率、位点的baf、位点的baf波动范围、位点的噪音水平、位点的捕获性能和相邻位点的间距。
31、可选的,所述获取样本的核酸信息,包括:
32、获取样本在测试设备的测试数据;
33、对所述测试数据进行拆分和回帖处理,得到核酸数据;
34、对所述核酸数据进行排序和去重,得到所述核酸信息。
35、第二方面,本发明实施例提供一种样本污染检测装置,包括:
36、信息获取模块,用于获取样本的核酸信息;
37、第一计算模块,用于计算所述样本在预设位点的突变基因型频率值baf;其中,所述预设位点为多个,且在无污染样本中,所述预设位点中的纯合位点的比例大于第一比例;
38、纯合位点确定模块,用于根据所述预设位点的baf,确定所述预设位点中的纯合位点;
39、第二计算模块,用于计算所述纯合位点在预设位点中所占的比例,若所述纯合位点所占的比例小于所述第一比例,则所述样本为污染样本。
40、第三方面,本发明实施例提供一种样本污染检测系统,所述样本污染检测系统被配置为执行本发明实施例提供的样本污染检测方法。
41、第四方面,本发明实施例提供一种计算机设备,包括至少一个存储器和至少一个处理器;所述存储器存储一条或多条计算机可执行指令,所述处理器调用所述一条或多条计算机可执行指令,以执行本发明实施例提供的样本污染检测方法。
42、第五方面,本发明实施例提供一种存储介质,所述存储介质存储一条或多条计算机可执行指令,所述一条或多条计算机可执行指令用于执行本发明实施例提供的样本污染检测方法。
43、本发明实施例提供的样本污染检测方法、装置、系统及相关设备,所述方法包括:获取样本的核酸信息;计算所述样本在预设位点的突变基因型频率值baf;其中,所述预设位点为多个,且在无污染样本中,所述预设位点中的纯合位点的比例大于第一比例;根据所述预设位点的baf,确定所述预设位点中的纯合位点;计算所述纯合位点在预设位点中所占的比例,若所述纯合位点所占的比例小于所述第一比例,则所述样本为污染样本。
44、可以看出,本发明实施例通过计算预设位点中纯合位点的比例,确定所述样本是否为污染样本,从而简单直接的判断样本是否被污染,进而可以为检测样本的核酸检测结果的准确度提供依据。
45、在优选示例中,本发明实施例还进一步在样本为污染样本时,计算污染样本的污染值,进而精确地判断样本的污染程度,进一步为检测样本的核酸检测结果的准确度提供更精确的依据。
46、并且,在进一步的优选示例中,本发明实施例还进一步在样本为低污染样本时,进一步进行针对低污染样本的检测和计算,进而避免样本污染程度低造成漏检,同时还能精确地判断低污染样本的污染程度,进一步为检测样本的核酸检测结果的准确度提供更精确的依据。