load GSE2034_ma2;
[p,t]=mattest(ma2(:,co==0),ma2(:,co==1)); %%对两组病人进行 t-test
res=[ma2_geneId t p];
res=sortrows(res,3); %按照 t-test 的 p-value 从小到大排序,这样,排在前面的基因是最
差异表达的基因
xlswrite('t_test_result.xlsx',res); %%将结果写到 excel 文件
数据:在 GSE2034_ma2.mat; 在 matlab 中,可通过 load GSE2034_ma2.mat 加载到内存中。
该数据来源于 NCBI GEO,包含了 286 个乳腺癌病人的转录组数据,以处理好。其中的变
量分别为:
ma2: 13698*286,每一列为一个病人的转录组数据,每一行为一个基因在所有病人中的表
达值。
ma2_geneId: 13698*1,为 13698 个基因的基因 ID
co:286×1,为 286 个病人的预后信息,1 为预后差,0 为预后好,其它值为中间状态,做
分类时中间状态值的样本可删除。这 286 个数据与 286 个病人的数据一一对应。
anno: 286*6,为这 286 个病人的其它临床信息,第五列为雌激素受体状态。