没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
# 从头学习转录组之**FastQC数据质控报告的详细解读**
接下来将会更新几期转录组分析的内容,包括无参转录组,有参转录组。感兴趣可以关注一下。
1. **Basic Statistics(基本信息)**
![Basic Statistics](https://cdn.liguocheng.top//uPic/geBOmr.png)
- Encoding: 测序平台编号,现在Sanger/ Illumina 1.8以上都是Phred 33编码
- Total sequences: reads数量
- Sequence length: 测序长度
- **%GC: GC含量:** 需要**重点关注**,可以帮助区别物种以及污染等,动物40%-60%都可以。
**2. Per base sequence quility**:每个测序read上各碱基质量
![Per base sequence quility**](https://cdn.liguocheng.top//uPic/E347Ae.png)
- 横轴:测序序列的1-40个碱基;正常为100,200或者250bp
- 纵轴:质量得分,score = -10 * log10(error),例如错误率error为1%,那么算出的score就是20
- **箱线图boxplot**:对每一个碱基的质量的统计。箱子上面的须(up bar)为90%分位数,下面的须(down bar)为10%分位数,箱子中的红线为中位数即50%分位数,箱子顶(upside)为75%分位数,箱子低(downside)为25%分位数。这个boxplot的意义:一是看数据是否具有对称性;二是看数据分布差异,这里主要利用了第二点。bar的跨度越大,说明数据越不稳定。
- 蓝色的线将各个碱基的质量平均值连接起来
- **解释一下:图中蓝线的走势为何先高后低?**因为目前采用的边合成边测序使用的是化学方法促使链由5'向3'延伸,也就是利用了DNA聚合酶。刚开始测序,合成反应还不是很稳定,但是酶的质量还很好,所以会在高质量区域内有一定的波动(这里的1-30bp),后来稳定了,但是随着时间的推移,酶的活力逐渐下降,特异性也变差,所以越往后出错几率越大。
- 一般能用的数据都要求至少Q20,也就是下四分位(10%分位数)的质量值要大于20。
- 二代测序,最好是达到**Q20的碱基要在95%以上(最差不低于90%)�
点击阅读更多
资源评论
西西里的小裁缝
- 粉丝: 34
- 资源: 292
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Java语言对Nginx、Tomcat、Webserver和Mycat的深度学习与设计源码
- 基于Go语言的Linux基础工具设计源码
- 基于Python的疾病中心医药知识图谱构建与问答系统设计源码
- Java 基础入门指南:为新手小白准备的详细教程.pdf
- 基于Vue的uniapp组件库设计源码收集与整理
- 毕业设计这是一个基于Vue和Node.js的轻量级点餐系统.zip
- 基于Python和DRF框架的meiduo_mall电子商务平台设计源码
- 基于Java语言的Android开发学习笔记设计源码
- 小程序开发基础入门指南:为新手小白准备的详细教程.pdf
- 基于Java开发的OhosCarrouselLayout 3D旋转木马布局设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功