分类: 基因组测序

VCF文件中GT:AD:DP:GQ:PL的各含义如下:

GT:genotype,表示这个样本的基因型,对于一个二倍体生物来说,GT值表示的是这个样本在这个位点所携带的两个等位基因的类型,0表示跟REF一样;1表示跟ALT一样,0/0表示纯合且跟REF一致;0/1表示杂合,两个allele一个是ALT一个是REF;1/1表示纯和且都为ALT;

AD:allele depth,对应两个以逗号隔开的值,这两个值分别表示覆盖到REF和ALT碱基的reads数,相当于支持REF和支持ALT的测序深度;

DP:depth of coverage,覆盖到这个位点的总的reads数量,相当于这个位点的深度;

GQ:Quality of the assigned genotype,表示最可能的基因型的质量值;

PL:Normalized Phred-scaled likelihoods of the possible genotypes,对应3个以逗号隔开的值,这三个值分别表示该位点基因型是0/0,0/1,1/1的没经过先验的标准化Phred-scaled似然值(L)。如果转换成支持该基因型概率(P)的话,由于L=-10lgP,那么P=10^(-L/10),当L值为0时,P=10^0=1。因此,这个值越小,支持概率就越大,也就是说是这个基因型的可能性越大。

最近文章
XML 地图