没有合适的资源?快使用搜索试试~ 我知道了~
编程实战题目录01:生信编程很简单02:人类基因组的外显子区域的长度03: hg19基因组序列的一些探究04: hg38每条染色体的基因、转录本分布05: 多个
资源详情
资源评论
资源推荐
编
程
实
战
题
目
录
01:生信编程很简单
02:人类基因组的外显子区域的长度
03: hg19基因组序列的一些探究
04: hg38每条染色体的基因、转录本分布
05: 多个同样行列式文件的合并
06: 根据GTF画基因的多个转录本结构
07: 下载最新版的KEGG信息,并且解析好
08: 写超几何分布检验
09: ID转换
10: 根据指定染色体及坐标得到序列
11: 根据指定染色体及坐标得到位置信息
12: 把文件内容按照染色体分开写出
13: JSON格式数据的格式化
14: 多个探针对应一个基因,取平均值、最大值
15: 把counts矩阵转换成RPKM矩阵
16: 对有临床信息的表达矩阵批量做生存分析
17: 对多个差异分析结果直接取交集并集
18: 根据GTF格式的基因注释文件得到人所有基因的染色体坐标
01
:
生
信
编
程
很
简
单
题
目
对
FASTQ
的
操
作
5,3段截掉几个碱基
序列长度分布统计
FASTQ 转换成 FASTA
统计碱基个数及GC%
对
FASTA
的
操
作
取互补序列
取反向序列
DNA to RNA
大小写字母形式输出
每行指定长度输出序列
按照序列长度/名字排序
提取指定ID的序列
随机抽取序列
高
级
难
度
根据坐标取序列
多文件合并
根据ID列表取序列
GTF文件探索
简并碱基的引物序列还原成多条序列
snp进行注释并格式化输出
下
载
安
装
bowtie2
(
内
含
测
试
数
据
)
cd~/biosoft
mkdirbowtie&&cdbowtie
wgethttps://sourceforge.net/projects/bowtie‐bio/files/bowtie2/2.2.9/bowtie2‐2.2.9‐linux‐
x86_64.zip
unzipbowtie2‐2.2.9‐linux‐x86_64.zip
1
2
3
4
02
:
人
类
基
因
组
的
外
显
子
区
域
的
长
度
题
目
下载人类外显子的坐标文件,编写代码统计外显子区域的长度。
测
试
数
据
Rbioconductor的TxDb.Hsapiens.UCSC.hg19.knownGene包
NCBI数据库:ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/
R
实
现
代
码
示
例
rm(list=ls())
a=read.table(choose.files(),sep='\t',stringsAsFactors=F,header=T)#选择你下的CCDs文件
tmp<‐apply(a[1:100,],1,function(gene){#取前100行数据分析调试
#gene=a[3,]
x=gene[10]#Column10外显子坐标位置列
if(grepl('\\]',x)){#判断x中是否存在有]这样的符号,如果有就利用正则替换掉。
x=sub('\\[','',x)
x=sub('\\]','',x)
#这个时候得到的对象还是像这样的“880073‐880179,880436‐880525……”
tmp<‐strsplit(as.character(x),',')[[1]]#我们先从逗号开始分割成小块
start<‐as.numeric(unlist(lapply(tmp,function(y){#取开始位点
strsplit(as.character(y),'‐')[[1]][1]
})))
end<‐as.numeric(unlist(lapply(tmp,function(y){#取结束位点
strsplit(as.character(y),'‐')[[1]][2]
})))
gene_d<‐data.frame(gene=gene[3],#将基因名,染色体,开始、结束位点绑定为数据框
chr=gene[1],
start=start,
end=end
)
return(gene_d)#返回数据框
}
})
tmp_pos=c()#构造一个空的向量
lapply(tmp[1:10],function(x){#取前10个list文件计算调试
#print(x)
if(!is.null(x)){
apply(x,1,function(y){
#print(y)
for(iinas.numeric(y[3]):as.numeric(y[4]))#y[3]为坐标起点,y[4]为终止坐标,历编
tmp_pos<<‐c(tmp_pos,paste0(y[2],"‐",i))
})
}
})
length(tmp_pos)#计算exon的长度
length(unique(tmp_pos))#计算去重后的exon的长度
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
剩余33页未读,继续阅读
稚气筱筱
- 粉丝: 14
- 资源: 320
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0