网站建站网站网站建设实训经验总结
web/
2025/9/30 23:30:27/
文章来源:
网站建站网站,网站建设实训经验总结,phpcms中英文网站模板,视频网站文案测序深度#xff08;Sequencing Depth#xff09;是指#xff1a;测序得到的碱基总量#xff08;bp#xff09;与基因组#xff08;转录组或测序目标区域大小#xff09;的比值#xff0c;是评价测序量的指标之一。
测序深度的计算公式为#xff1a;
测序深度 Sequencing Depth是指测序得到的碱基总量bp与基因组转录组或测序目标区域大小的比值是评价测序量的指标之一。
测序深度的计算公式为
测序深度 L × N/ G
L读段(reads)长度N读段数目G测序目标区域大小
覆盖度coverage是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在测序最终拼接组装获得的序列往往无法覆盖所有的区域这部分未覆盖的区域就称为Gap。值得注意的是sequencing coverage指的就是depth of sequencing coverage也就是sequencing depth反映了一个区域平均被多少个reads测到。
举个例子
假设对一段2000 bpG测序目标区域大小的目标序列进行单端测序得到1000条readsN读段数目每条reads 200bpL读段长度测序后把所有的reads比对到目标区域后若2000bp的目标区域中有1800bp的位置至少有1个read覆盖到而剩余的200bp没有任何read覆盖到 可见测序深度与覆盖度是成正相关的。
而不同实验对于测序量的需求与目标区域的大小、突变类型和疾病模型等是密切相关的。
对于全基因组测序WGS来说人类全基因组大约3G健康人一般需要测到30X即获得90G有效数据要可靠地检测基因组中的单核苷酸多态性singlenucleotide polymorphism, SNP和插入缺失标记insertion-deletion, INDEL至少需要测到35X产生105G的有效测序数据 [1]而从头基因组测序de novo genome sequencing需要拼装基因组最佳测序深度为50X [2]。
人类基因中大约有180,000个外显子占人类基因组的1%约30MB。对于全外显子测序WES来说由于目标区域的异质性增加以及探针50%的捕获效率需要更大的平均读取深度才能获得与WGS相同的覆盖范围覆盖89.6-96.8的目标碱基需要测到80X [1]。健康人的WES一般测到100X获得6G数据其中3G有效数据。
对于高异质性的细胞群或组织样本比如肿瘤WGS需要70-100XWES需要160-200X。
RNA测序RNA-seq应用更广阔现在已经在不同条件下的许多细胞和组织类型中进行了大量的RNA-seq实验但是很少有关于RNA-seq测序深度的明确指南这是因为测序要求通常取决于所研究的生物学问题以及所测定的转录组的大小和复杂性。
单细胞真核生物和细菌等具有较简单的转录组转录潜能也较低。如4 M reads可以检测到80的酵母基因。
哺乳动物拥有数以万计的基因许多基因还包含不同亚型并且具有不同的表达水平。在RNA-seq分析中基因或转录本丰度通常表示为RPKM1。ENCODE2曾利用H1人胚胎干细胞做过评估若研究对象是RPKM10的基因每个样本测到36 M reads就可以准确定量80的基因表达。然而对于低表达水平的基因FPKM10要测到80 M reads才能准确定量。所以如果需要在整个转录组准确定量所有基因包括lncRNA基因那么样本需要测到80M以上如果只是研究表达量高的转录本的整体表达变化那么每个样品36 M reads就足够了。
如果RNA-seq的目标是发现新的稀有的转录本如noncoding RNA或mRNA新的可变剪接考虑到这些转录本的低表达和建库方案产生的偏差估计需要超过400 M reads。 https://zhuanlan.zhihu.com/p/74558512
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/84708.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!