RNA-Seq中,RPKM是如何计算的?它和FPKM的区别又是什么?两者该如何选择?

已邀请:

YellowTree - 泛基因发起人,Ph.D,关注基因组学发展

赞同来自: admin huangshujiabgi huangzhuming

其实无论是FPKM还是RPKM,它们存在了原则上的内伤,已经不建议使用了。对于这一点,我也将其写成了一个比较系统的回答:基因组学技术之(二)—— 为什么说FPKM/RPKM是错的,希望对你有帮助。

huangzhuming - 神补刀,漫画控

赞同来自: admin

这是在知因上看到的一个回复:
 

F是fragments,R是reads,如果是pair-end测序,每个fragments会有两个reads,FPKM只计算两个reads能比对到同一个转录本的fragments数量,而RPKM计算的是可以比对到转录本的reads数量(即不管是不是两个reads是不是能比到同一个转录本上)。如果是single-end测序,二者FPKM和RPKM是一致的。

一个fragments的两个reads比到不同的转录本的情况是不多见的,可能是比对错误也可能是发生了转录本的融合什么的。多数情况下二者使用情形差不多,如果希望找转录本融合之类的变异可以用二者差异来

如果是不带biological replicates的RNA-seq结果,由于不能做t-test,而RNA测序reads分布符合负二项分布,不建议采用RPKM或者FPKM直接比较寻找差异表达基因,而是利用基于负二项分布模型的软件(如DESeq和edgeR),用原始的可比对的reads数进行计算


 
出处:http://www.knowgene.com/question/8488

要回复问题请先登录注册