肿瘤肿块Hibernate量化
该库包含跨TCGA癌症的肿瘤大量Hibernate量化的工作流程。
目录
Apobec富集分析
该文件夹包含用于确定肿瘤大量Hibernate和衰竭程序如何预测APOBEC突变特征丰富的代码。
ApobecEnrich_define.R:运行tSNE和期望最大化聚类的迭代,以创建Apobec突变签名富集标签,并将其与已建立的Apobec富集得分进行比较。
RandomForest_100sims.R:从平衡的APOBEC富集/非富集样本中创建100个随机森林,评估模型的整体预测能力,并详述基因重要性。
RandomForest_exemplary.R:使用如上所述的方法创建一个随机森林,并进行进一步的可视化,包括与归一化的PLG表达(图4F)和相应的多维比例图(图4G)关联。 最后,运行Wilcoxon测试以确定富含Apobec的样品/未富集的样品之间