没有合适的资源?快使用搜索试试~ 我知道了~
肝癌转移相关基因预后模型的建立与验证.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 177 浏览量
2022-12-15
14:20:11
上传
评论 1
收藏 908KB DOCX 举报
温馨提示
试读
21页
肝癌转移相关基因预后模型的建立与验证.docx
资源推荐
资源详情
资源评论
肝细胞肝癌(hepatocellular carcinoma, HCC)是原发性肝癌中最常见的类型,约占
75%~80%。2018 年全球的新发病例约 84.1 万,居恶性肿瘤第六位,约 78.2 万死亡病例,
居恶性肿瘤的第四位,发病率和死亡率有逐年增长的趋势
[1]
。在中国,肝细胞肝癌发病率
和死亡率分别位居恶性肿瘤的第四位和第三位,恶性程度极高
[2]
。目前,临床上肝癌的治
疗手段以外科手术为主,辅以介入治疗、放化疗及靶向药、免疫治疗的多学科综合治疗。
尽管治疗方式众多,由于复发与转移等因素的影响,肝癌患者的预后较差,5 年生存率低
于 18%
[3-4]
。在临床诊疗过程中,TNM 分期是评估患者预后情况的经典方法,但由于只能
从宏观层面对患者预后进行分析,有一定的局限性。随着医疗水平的提高,基因检测、分
子靶向治疗等深入临床,分子水平的预后评判方法是目前的一个研究热点
[5]
。
转移是一个涉及多步骤的复杂生物学过程,是癌细胞从原发部位向外扩散、侵袭的过
程,具有直接浸润、淋巴道转移及血行转移等形式
[6]
。文献[7-8]发现,转移是肝细胞肝癌
的主要生物学特征之一,也是其预后不良的主要原因。近年来,随着高通量测序以及生物
信息技术的发展,已有越来越多的肝癌预后模型被建立,以协助判断 HCC 患者的预后
[9-
11]
,但暂时还没有关于转移相关基因的预后模型的报道。因此,本文基于转移相关基因数
据集,结合肝细胞癌(the cancer genome atlas, TCGA)的转录组数据和临床数据,构建关于转
移相关基因的预后预测模型,并验证该模型的准确性和特异性,以在 HCC 的预后预测中
发挥作用,对肝癌的临床诊疗工作有一定的指导作用。
1. 材料与方法
1.1 数据来源
从 TCGA 数据库下载了 374 例 HCC 肿瘤样本和 50 例癌旁样本,ICGC 数据库下载了
243 例 HCC 肿瘤样本和 202 例癌旁样本,临床信息分别包含年龄、性别、病理分期及患者
的生存时间和生存状态。随后,将临床信息不全及生存时间小于 30 天的 HCC 样本删除。
从人类癌症转移数据库(the human cancer metastasis, HCMDB)下载了转移相关的基因
[12]
,其
中有 1905 个基因在 TCGA 数据集有表达值,用于风险模型的进一步构建。
1.2 差异分析及功能注释分析
利用“Wilcoxon”秩和检验对转移相关的 HCC 表达矩阵进行差异表达分析,设定筛选
标准为|log
2
(FC)| > 2,FDR < 0.05。采用“pheatmap”包绘制了差异表达的火山图和热图。使
用“clusterProfiler”包对差异表达的转移相关基因进行基因本体(gene ontology, GO)功能注释
和京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes, KEGG)通路富集分
析,设定矫正后 P < 0.05 作为富集条件。进行蛋白质互作网络构建,并利用 Cytoscape 软
件可视化互作网络。最后,通过网络节点基因筛选 TCGA 数据集和 ICGC 数据集共同的互
作基因。
1.3 风险预后模型的构建及验证
首先,结合 HCC-TCGA 样本的生存时间和生存状态,利用单因素 Cox 分析方法和
Kaplan-Meier 筛选有预后意义的转移相关基因。随后,为降低模型的拟合度,使用 Lasso
回归对单因素结果进行筛选。最后,将 Lasso 回归结果进行随机分组,分为 TCGA 训练集
(n=172)和 TCGA 验证集(n=171),采用多因素 Cox 分析对 TCGA 训练集构建了预后模型。
随后,按照风险评分公式计算每位患者的风险评分,根据患者风险评分的中位值,将
TCGA 训练集和验证集、ICGC 验证集的患者分为高风险组和低风险组。采用
“survival”“survminer”包及“time ROC”软件包,分别绘制模型的预后生存曲线、风险评分曲
线及时间依赖性受试者工作曲线(receiver operator characteristic, ROC)以评估模型的准确性
和特异性。结合患者的临床信息,采用单因素和多因素 Cox 分析各数据集的风险值是否可
作为 HCC 的独立预后因子。最后,采用人类蛋白图谱数据库(the human protein atlas,
HPA)
[13]
对模型基因的临床组织表达水平进行了验证。
1.4 统计学分析
采用 R 软件进行统计分析和图形绘制。差异分析采用“Wilcoxon”秩和检验,模型构建
采用 Cox 分析和 Lasso 回归分析,生存分析采用 Kaplan-Meier 分析,P < 0.05 为差异具有
统计学意义。
2. 结 果
2.1 差异表达分析和功能富集分析
通过差异表达分析,获得了 222 个差异表达基因,其中 39 个上调基因,182 个下调基
因,如图 1a 和 1b 所示。将筛选获得的差异基因进行 GO 功能注释和 KEGG 通路富集分
析,发现差异表达的转移基因主要参与调节上皮细胞增生,胶原分解代谢以及间质发育等
生物学过程,其产物主要参与染色体固缩,转录调节复合体等细胞组分,发挥信号转导受
体激活和生长因子激活等生物学分子功能,如图 2a 所示。KEGG 通路富集分析表明差异表
达的转移相关基因主要参与了细胞因子−细胞因子受体相互作用通路,IL-17 和 Hippo 信号
通路,如图 2b 所示。随后,为了进一步了解差异基因的相互关系,构建了蛋白质互作网络
(protein-protein interaction networks, PPI)。通过分析,获得蛋白质互作网络,删除了部分单
个存在的基因节点。采用 Cytoscape 软件进行蛋白质网络的可视化,共获得了 194 个节点
基因,其中红色表示上调基因,蓝色表示下调基因,如图 2c 所示。其中 Generatio 是指富
集到这个 GO 条目的基因数目比上所有富集分析的基因数目。
图 2 功能富集分析和构建蛋白质互作网络
下载: 全尺寸图片 幻灯片
2.2 构建转移相关的多基因预后模型
基于蛋白质互作网络的节点基因,采用单因素 Cox 和 Kaplan-Meier 分析获得了 53 个
预后相关的转移基因,如表 1 所示。为降低模型的拟合度,采用 Lasso 回归分析对预后相
关的转移基因进一步筛选,如图 3a 和 3b 所示,将筛选结果随机分组。TCGA 训练集纳入
多因素 Cox 分析,构建了包含 4 个转移相关基因的多基因预后模型,如图 3c 所示。
2.3 该预后模型对 HCC 患者预后的影响
根据模型公式分别计算 TCGA 训练集,TCGA 验证集及 ICGC 验证集的风险评分,风
险评分=0.36×STC2 表达值+0.23×CDCA8 表达值+0.20×CTHRC1 表达值+0.22×HOXD9 表达
值。
表 1 经单因素 Cox 筛选得到的 53 个转移相关基因
基因名称
风险比
风险比 95%置信区间上限
风险比 95%置信区间下限
P
ADAM12
1.244
1.099
1.407
0.001
KRT20
1.109
1.030
1.194
0.006
剩余20页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3677
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功