影响matlab速度的代码表测试
该存储库提供了一个协作空间,用于指定磁盘上文件格式的要求,示例和测试,这些文件格式用于存储由单细胞RNA测序分析产生的表达矩阵。
当前,这些数据使用多种格式,包括通用格式(例如CSV)和专门为该域设计的格式(例如Loom)。
如果您想添加想法或开始讨论,请打开问题或进行公关!
可以在此找到通知此仓库的相关文档,并在整个存储库中进行链接。
我们会不时开会,这是我们的服务,随时与我们联系!
目标
对现有或将来的格式可能满足或可能不满足的要求进行分类
提供这些示例的示例数据集和加载脚本(跨语言)
提供可根据要求评估格式性能的测试套件
要求
在许多讨论中,需求大致分为两类,存档(长期存储)和分析(每天与R或Python等分析软件一起使用)。
如所写,其中一些是明确的要求(例如,自我描述),而其他一些则是不同格式(例如大小和速度)沿其变化的尺寸。
档案馆
具有长期阅读和解析文件的能力(它是否取决于可能会更改的API或语言功能?)
自描述(文件中包含语义吗?)
大小(尤其是压缩后)
分析
部分IO(可以在不加载整个文件的情况下读取文件的某些部分吗?)
加载基因的子
评论0
最新资源