没有合适的资源?快使用搜索试试~ 我知道了~
COMRAD-MPI:使用并行计算压缩大型基因组数据集-开源
需积分: 15 0 下载量 64 浏览量
2021-05-29
04:46:48
上传
评论
收藏 18KB DOCX 举报
温馨提示
试读
1页
COMRAD-MPI 是一种并行计算算法,用于减少压缩基于 COMRAD 算法的大型基因组数据集的计算时间。 它通过提供一种压缩大型 DNA 数据集的方法来捕获大型基因组中的长距离重复冗余。 三个阶段——替换、清理和霍夫曼编码已使用消息传递库并行化。
资源详情
资源评论
资源推荐
Future Advancements:
When the input data les are increased correspondingly the memory usage
is also increased. An alternate method for making it memory ecient is to
implement lock free hash table at the master node for the generation of
dictionary so that memory utilization can be drastically reduced. Similarly,
the most frequent k-mers can be identied using Bloom lters for the
creation of dictionary that improves the repeat identication in large
genomic dataset. These improvements were not included in the present
study but will be explored in the future.
0
5
10
15
20
25
30
35
40
Plant Genome Data set
Memory in GB
Sl
no
Dataset
Descriptio
n Genomes
1 Dataset1 Malus domestica , Zeamays
2 Dataset 2 Malus domestica , Zeamays, solanum lycopersicum
3
Dataset 3
Malus domestica , Zeamays, solanum
lycopersicum,Citrussinensis
4
Dataset 4
Malus domestica , Zeamays, solanum
lycopersicum,Citrussinensis, Oryzabrachyantha,
5
Dataset 5
Malus domestica , Zeamays, solanum
lycopersicum,Citrussinensis, Oryzabrachyantha,
Fragaria vesca
6
Dataset 6
Malus domestica , Zeamays, solanum
lycopersicum,Citrussinensis, Oryzabrachyantha,
Fragaria vesca, Arabidopsis thaliana
Figure 1: Memory Usage of Parallel computing approach for
Genome Compression during the experiment with Plant Genome
Data set.
长迦
- 粉丝: 34
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0