群体数据中的allele frequency相关问题

1. vcf中INFO列往往有两种allele frequency的信息。 AF以及MLEAF。前者是allele frequency后者是maximum likelihood expectation for allele frequency。
一般GATK出来的结果如果不适用GATK annotator,只会自动输出MLEAF。
vcf header中关于MLEAF的描述如下:
##INFO=<ID=MLEAF,Number=A,Type=Float,Description="Maximum likelihood expectation (MLE) for the allele frequency (not necessarily the same as the AF), for each ALT allele, in the same order as listed">
问题在于这二者有何区别?
2. 因为人是二倍体,一个正常的人的vcf变异文件除了含有genotype的信息,应该还含有phasing的信息。Phasing通常使用的软件有beagle和shapit2。
问题是phasing之后的allele frequency和原本的相比差别有多大?
 
已邀请:

要回复问题请先登录注册