没有合适的资源?快使用搜索试试~ 我知道了~
转换:用于对从DC提取的数据实施转换的Python代码
共53个文件
py:19个
yaml:9个
json:7个
需积分: 0 0 下载量 172 浏览量
2021-02-12
02:28:08
上传
评论
收藏 158KB ZIP 举报
温馨提示
该存储库的目标是提供独立的代码,使任何人都可以执行端到端ETL,从DC开始到最终可以上传到BQ的.jsonl文件结束。 转换和合并代码还会生成有关数据问题的日志,然后可以将这些日志传送到DC。 转换流 带有注释的示例患者数据,解释数据的协调,记录和合并 原始案例文件: , , , 安装 克隆存储库并安装 git clone git@github.com:CancerDataAggregator/transform.git pip install -e . 要么 git clone https://github.com/CancerDataAggregator/transform.git pip install -e 从DC提取原始JSONL extract-*程序用于从DC提取数据。 例如, extract-gdc用于从GDC提取数据。 使用extract-gdc -h获取使用信
资源推荐
资源详情
资源评论
收起资源包目录
transform-main.zip (53个子文件)
transform-main
flow.puml 2KB
.gitattributes 93B
.github
workflows
gdc-pull-test.yml 677B
tests.yml 2KB
overallflow.png 104KB
cdatransform
transform
main.py 2KB
__init__.py 0B
validate.py 3KB
lib.py 2KB
gdclib.py 4KB
schema2transform.py 800B
__init__.py 0B
extract
gdc-case-list.txt 110B
pdc-case-list.txt 110B
__init__.py 0B
pdc.py 5KB
lib.py 432B
pdc_query_lib.py 1KB
gdc.py 7KB
lib.py 312B
version.py 26B
setup.py 1KB
README.md 4KB
docs
pdc_example.yml 3KB
tests
integration
check-pdc-pull.py 1KB
check-gdc-pull.py 1KB
gdc-case-list.txt 110B
pdc.files-per-sample-dict.json.gz 133B
pdc-case-list.txt 110B
gdc-transform.yml 76B
gdc.samples-per-file.jsonl.gz 133B
__init__.py 0B
small
gdc.d90249dc-40e8-449e-a24a-6d461f29f632.hand-transf.json 2KB
Readme.md 772B
gdc.d90249dc-40e8-449e-a24a-6d461f29f632.transf.json 10KB
gdc.d90249dc-40e8-449e-a24a-6d461f29f632.orig.json 9KB
steps
gdc_pdc_TCGA-E2-A10A_merged.yaml 4KB
gdc_TARGET_case2_harmonized.yaml 3KB
pdc_QC1_aggregated.yaml 2KB
gdc_TCGA-E2-A10A_aggregated.yaml 2KB
pdc_QC1_case1_harmonized.yaml 1KB
gdc_TARGET_case2.json 20KB
pdc_QC1_case1.json 104KB
gdc_TARGET_case1.json 575B
extract.sh 682B
pdc_TCGA-E2-A10A_aggregated.yaml 1KB
gdc_TARGET_case1_harmonized.yaml 1KB
pdc_QC1_case2.json 104KB
pdc_QC1_case2_harmonized.yaml 1KB
gdc_TARGET_aggregated.yaml 3KB
test_validate.py 2KB
gdc-transform.yml 76B
.gitignore 100B
共 53 条
- 1
资源评论
Dilwanga
- 粉丝: 29
- 资源: 4681
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- java理财小助手APP源码数据库 SQLITE源码类型 WebForm
- redisio cookbook 的开发存储库.zip
- 基于JSP(MVC模式)和MySQL的网上图书购物系统课程设计
- NTC热敏电阻温度与阻值换算小工具
- RedisDesktopManager Windows 版本.zip
- redis-full-check 用于比较两个 redis 是否有相同的数据 支持 redis 2.x 到 7.x 版本(不支持 Redis Modules) .zip
- Redis 集群的代理 .zip
- 一个字符串小游戏设计实现
- Redis 集群的 Dockerfile(redis 3.0+).zip
- Redis 集群代理.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功