论文研究-基于超图的多模态特征选择算法及其应用 .pdf

所需积分/C币:15 2019-08-24 20:06:49 895KB .PDF
收藏 收藏
举报

基于超图的多模态特征选择算法及其应用,彭瑶,祖辰,目前机器学习算法已经被广泛应用到脑疾病的诊断中。医学影像数据由于样本珍贵,并且特征维数往往远大于已有样本数目,在实际应用
山国武花论文在丝 其中wm表示第m个模态的回归系数向量,所有模态的系数向量都来自个系数矩阵 W=Lw1,…,Wnm…,WM]∈R×M,M表示模念数目。在()式中,‖Wl2表示矩阵W的21 范数,定义如下:‖W‖2n=∑z1|w4,其中v表示矩阵w的第行。是正则化系数,控制 着()式中两项的相对权重。 巴21范数w2:可以看作是矩阵W的每一行的2范数之和。多任务特征选择利用了任务 之间的相关信息,不同任务的变量之间有相似的稀疏模式。21范数将不同模态的同一特征 的权重联合起来,使待一部分共冋特征能够被联合选择岀来ε多任务特征选择模型最后得到 的权重矩阵Ⅵ的多行元素都为零,这就是“组稀疏”性。多任务特征选择模型中,当只有 个任务时,就退化成了模型 超图学习 在机器学习问题中,我们常常假定研究的物体之间存在成对的关系,这种关系可以很自 然地用图来表示。在传统图中,顶点表示物体,如果两个顶点之问有联系,就用条边来连 接。图可以是有向或者无向的,这取决于物体之间的成对关系是对称还是非对称的。 但是,在许多实际问题中,物体之间在更复杂的关系,无法用成对关系来表示。因此, 研究者们提出使用超图对三者及三者以上的关系进行刻画。在超图中,一条超边可以连接两 个及以上的顶点(超边实际上是顶点集的子集),传统图只是超图的一个特例而已 这样,我们就可以用超图来对更复杂的关系(如高阶关系)进行建模 如图 左侧所示,蓝色顶点分别被不同的超边包含,每条超边可以包含两个以上的顶点。特别是当 超边中所包含的顶点数目为时,该超边退化为普通边。目前,超图学习已经被广泛地应用 于许多实际应用中。 15 c1 c2 c3 11 n100 2 0 0 1 13 0 1 H 图超图模型 令G(V,E,a)表示一个超图,其中V表示顶点的集合,E表示超边的集合,a表示各超边 权重的集合。这里,每一条超边e(=1,…,N)都被赋予了一个权重a(e)。对于超图G,它 的关联矩阵H用于表示各顶点之间的关系,具体地,矩阵H的第珩,第j的元素若是,则 表示超图的第涤条超边包含第i个顶点,若是,则表示不包含,如图右侧所示。矩阵H定 义如下: ifv∈ if¢e () 山国武花论文在丝 在关联矩阵的基础上,各顶点的度和各超边的度分别被定义如下 ∑ U, EE 6()-=∑ H(u,e) 另外,我们令Dn和D分别表示各对角线元素为顶点的度和超边的度的对角矩阵,令A表 示各超边权重的对角知阵,即Aa=a(e)。研究人员提出了多种计算超图拉普拉斯矩阵的方 法,大致叫以分为两类,第一种方法是在原始的超图上构建一个简单图,如星肜扩展 第二种方汯是类比简单图拉普拉斯矩阵来定义超图拉普拉斯矩阵。上述的两种方法都很 相似。在本文中,我们采用提出的超图拉普拉斯矩阵计算方法,即我们定义半正定矩阵 Ln=I-⊙ () 为超图的拉普拉斯矩阵,其中为单位矩阵,6=Dn12 HADTHTD132 超图的构建在超图学习中是最关键的一步。根据中提出的方法,我们采用算法 来构建超图。具体来说,我们扣每个顶点看作是个中心,计算出中心点与其他顶点的欧式 距离,再把中心点与距亡最近的k个顶点连接起米,就构成了一条超边。给定N个样本,我 们就能构建出N条超边。在本文中,我们将每条超边的权重都赋值为,即a(e)=1。 基于超图的多模态特征选择 根据超图拉普拉斯矩阵,我们的超图正则化项定义如下 Q=wXXw () 直观上,公式()表示我们想要保留在原始特征空间中的数据结构信息,这种高阶结构信 息都通过超图拉普拉斯矩阵反映出来。我们对每一个模态的样本都构建一个超图,保留每 个模态的晑阶结构信息。在多任务特征选择的目标公式中加入超图止则化项,就构成了基 于超图的多模态特征选择的目标公式 22r-XmWwmll2i+ill.2+ KwiXF LAX, W,+ Hwi xi Lix2w? 其中,W=[w,w2,Lm表示第m个模态的超图拉普拉斯矩阵。()式中的第一项表示训 练集上的经验误差,第二项表示e2,范数,最后两项表示超图正则化项。 在我们的模型中,不仪用多仼务特征选择保证了不同模态相同脑区的特征被选中,考虑 了模态之间的关系,还利用了超图拉普拉斯矩阵Lh保留同模态样本之间的高阶结构信息。 现有的多模态特征选择算法,都只考虑了样本之间的成对关系,而忽略了样本之间的高阶关 系 优化算法 目前已有许多方法可以对目标公式()进行求解例如 和算法等。本文中, 山国武花论文在丝 我们采用算法来求解我们的问题。将()式中的目标函数分为光滑项 r0)=yxmw+时xx十wg吗 () 和非光滑项 g(W)=λw‖2 我们用卜面这个函数来近似∫(W)+(W) QW0)=f(W)+<wwe.vf()>+2|w;+g( 其中,‖1是 范数,Vf(W()是f(W)在第k次迭代点W()处的梯度,是步长。 算法的更新步骤是 1 w k+1)=argmin w-U(K):+g(W) 其中,可以通过线性搜索米得到,Uk)=W()-2vf(W( 算法的关键就是如何有效地计算更新步骤。研究表明这个问题可以分解成d个独 立的子问题,而这些子问题的解我们可以很容易得到。 另外,根据提出的方法,我们可以通过Q()来计算2(WW(),Q()定义如下: ()=W+mk(h(.J(k1) 其中,nk= (1-yk.1)y , yK 这个算法的收敛速度可以达到O(m),其中K是最大迭代次 Yk-1 多核支持向量机 多核支持向量杋可以有效地对多模态的数据进行融合,并对阿尔茨海默症进行分类 给定训练集,第m个模态的核函数为km(xm,xm)=中n(xm)中(xm),对多模态核函数进行融 合以后,可以得到k(x2,x)=∑ M Bmk(xm,xm),由此可以得到多核支持向量机的对偶形式 max a L aia; viy;)Bmkm( m=1 t.〉ayz=0,0≤a1≤C,i=1, 其中,N为训练样本总数。 给定一个新的测试样本x0,决定样本标签的决策函数定义如下: 山国武花论文在丝 f(x°) ston y Bnkm(xm,x m)+b 在本文中,我们用 工具包来实现分类器,核函数用线性核,Bm通 过网格搜索在训练集上进行交叉验证得到 实验及结果分析 本文在标准数据集的个样本上进行了实验,其中包括名阿尔茨海默症() 患者,名轻度认知功能障碍患者( ),其中轻度认知障碍 包含名转换病人(即在个月内 转换为 )和名不转 换病人(即在个月内不从转换为 ),名正常人( )。我们采用了和两种医学图像数据,标注出每个样木的和图像的 个感兴趣的区域(脑区),并计算出样木的每个感兴趣区域的图像灰质组织体积, 对图像计算出相应感兴趣区域的强度均值。这样,我们就得到了图像的个特 征和图像的个特征。我们在数据集上进行了三组实验,分别为 在本实验中,我们采用了十折交叉验证方法验证所提出的方法的效果。县体来说,将整 个样本集平均地划分为份。在每一次的交叉验证实验中,都取其中的份作为训练集, 剩下的一份作为测试集。这样独立进行次实验,以消除随机划分数据集所引入的偏差。 将次分类的精度取平均得到最终的分类精度。日标公式中最优的参数值元κ以及多核分 类器中的n,通过在训练集上再进行一次十折交叉验证来寻找。用 工具包,并 选择线性核函数来实现分类器。最后,我们计算出分类的精度()、敏感性() 和特异性()来评价各方法的性能 我们还将本文中提出的方法与现有的三种多模态分类方法进行了对比。第·种方法是 不经过特征选择,直接进行多模态融合分类(用 来衣示);第二种方法是将 的维特征和的维特征直接拼接起米,构成一个维的特征向量,再用方 法在该特征向量上进行特征选择,最后用进行分类( 第三种方法是将 和连接成维的特征向量,再用进行特征选择,最后用在选择出来 的特征上进行分类( 实验结果 以及 的分类结果如衣所示。我们可以看到,本文所提出的方法 分类性能最好。在 的实验中,提出的方法能达到 的精度,而在其他三种方 法中,精度最髙的是 达到的 。此外,本文提出的方法敏感性达到了 也就是能将更多的患者准确地识别出来。在 的实验中,本文提出的方法, 能达到 的精度,而在其他三种方法中,精度最高的是达到的 此外, 本文提出的方法敏感性也能达到 。在该组实验中,敏感性与特异性的差别较人,如 表所示,我们得到的敏感性较高,但是特异性较低。在医学诊断中,误将一个患者诊断为 忙常人和误将一个正常人诊断为患者所付出的代价是不一样的。我们能得到较高的敏感性也 山国武花论文在丝 就是能尽可能少地将患者诊断为正常人,以免因为误诊而耽误治疗。 表 实验结果 的实验结果如表所示。我们可以看到,木文的方法能在分类中能 达到 的精度,而其他三种方法中,精度最高的是达到的 表 实验结果 此外我们对三组实验结果的精度、敏感性、特异性的标准差进行了计算,本文提出的 方法得到的实验结果的标准差也比较小,说明了该方法较其他方法更加稳定。 表分类中最常被选中的个脑区 分类中最常被选中的个脑区图示 由于每次交叉验证中所选择的脑区不尽相同,我们统计出了最常被选中的个脑区, 如表、图所示。其中所选中的脑区如海马体是与长期记忆非常相关的大脑区域,与已知 的 相关文献一致,再例如杏仁核与三角部额下回也证明是与有关的脑区 山国武花论文在丝 结论 本文提出了一种基于超图的多模态特征选择方法,将不同成像技术得到的医学图像数据作为 不同的模态,进行多任务特征选择,保证不同模态的同一脑区同时被选中,同时通过加入超 图正则化项来保留冋一模态样本之间的高阶结构信息,这样能选择岀史只有判别性的脑区 分类实验结果也让明了该方法的有效性。但是,本实验没有考虑到超边的权重信息,可能会 丢失掉些信息,在今后的工作中,尝试对超边的权重进行优化,尽可能地少丢失信息,以 达到更好的实验结果 参考文献 林树无简述阿尔茨海默病沈驲医学院学报 刘丽萍阿尔茨海默症病理学研究进展中国临床康复 周志华机器学习清华大学出版社 () 山国武技论文在丝 程流泉蔡幼铨 病杏仁核海马结构休积的 测量中华放射学杂志 程流泉蔡幼铨 病杏仁核海马结构伾积的测量中华放射学杂志

...展开详情
试读 9P 论文研究-基于超图的多模态特征选择算法及其应用 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    img
    • 至尊王者

      成功上传501个资源即可获取

    关注 私信 TA的资源

    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于超图的多模态特征选择算法及其应用 .pdf 15积分/C币 立即下载
    1/9
    论文研究-基于超图的多模态特征选择算法及其应用 .pdf第1页
    论文研究-基于超图的多模态特征选择算法及其应用 .pdf第2页
    论文研究-基于超图的多模态特征选择算法及其应用 .pdf第3页

    试读已结束,剩余6页未读...

    15积分/C币 立即下载 >