论文研究-基于G-ICA的组织样本分类算法.pdf

所需积分/C币:6 2019-09-11 547KB .PDF
评分

利用加入了分类指导信息的ICA(Guide Independent components analysis,G-ICA),在已知样本中提取隐藏在样本基因表达数据中与组织分类密切相关的各种表达模式,根据这些模式对未知组织样本进行分类。试验结果表明,该方法提高了组织样本的分类能力,其计算复杂度低、收敛快,具有较强的稳定性。
1262010,46(31) Computer Engineering and Applications计算机工程与应用 表1UCI上的试验结果 (%) 类别NB算法K- Means算法K-NN算法SvM算法 CMCBOB算法 MASWOD算法G-ICA算法 类别 类别2 58.6 类别392.8 80.5 78.3 80.5 94.3 4.3 95.1 类型情况,则可以通过两两类别间的信噪比,通过某种计算规析数据,可以取与样本数量相等或更多的基因,之后得到 则来衡量,比如取平均值等。初始化W时,对于第g个基因,令:G-CA的输入数据,即人小为pxM的表达矩阵; SnR(g) ,i=0,1,…,q (9) (4)根据式(8)计算分离矩阼W的初始值W; snR(g) (5)对pxM中的每个样本:把样本各分量值及W代入 即基因g的信噪比在所有基因信噪比中所占的比例,表明了式(3),计算得出对应表达源值y; 这个基因在这个样本集中的分类能力。可以看出,通过W计 (6)根据式(5)及(6)计算W1; 算出来的基因表达源各分量值是相等的,也就是说,在训练W (⑦7)根据式(7)调整W的实际值; 之前,无法通过基囚表达源来对组织样本进行分类。 (8)若所有样本迭代完则转(10),否则转(5); 每对所有样本进行一次训练后,即对W进行过N次迭代 (9)若当前W满足式(10)则退出,否则转(5)。 后,若W满足既定条件,则退出,否则重新迭代。本文设定的 条件是算法收敛并且收敛到指定程度,即: 4试验分析 1-ykp)s∑(1-ykp)2 先用标准UCI数据集(htp:/ WWIcS. uci. edu/~ mlearn k=0,1,,,N (10) MLRepository. htm1)测试本文方法的分类能力。已经有研究 ∑(1-ylk)≤a 者利用分类能力很好地组合分类器(例如 MASWOD,CMC BOB等)对这个数据集进行了分类,同时把单分类器的分类 其中/是样本整体训练次数,a是一个预先设定的值,可以根能力列了出来(见表1)。UC1有8080个样本,分为三类,由于 据样本的实际情况来定,是训练样本k对应的实际类标号。样本比较多,因此不采用留一循环校验的方法,而是取其中任 如果满足这个条件,那么第汁+1次迭代后就退出,当前W即为意7000个作为训练集余下的作为测试集。由于这是标准的 所求。 分类数据集,试验中仅仅计算了SNR,并未通过SNR去筛选 综上所述,提出的GCA算法在CA的基础上做了两处特征,经过训练集的15次迭代,试验结果如表1。 修改:一是简化迭代过程;二是引入分类指导信息。显然,也 由表1可以看出,本文GICA的分类准确度和组合分类 只有引入分类指导信息,才能以文中的方式简化迭代过程,否器 CMCBOB相当(注:本文所提的算法为单分类器算法) 则不能保证不会对分类准确度产生非常大的奂面影响,毕竟说明其分类能力强,另外,组合分类器需要训练各个单分类器 CA是在盲源信号分离的基础上产生和发展的。在基于基之后再组合,比较而言本文算法具有更低的计算复杂度。 因表达数据的样本分类研究领域中,训练数据本来就有类別 公共的结肠癌数据集共有62个样小、2000个基因,样本 信息,这些信息也是此领城中前期作者的研究成果,不利用分为两个类别,包含样本数分别为22、40;公共的急性白血病 它们既是一种数据资源的浪费,同时还会增加分类的困难程数据集则有72个样本、7129个基因,两个类别中样本数分 度(即以复杂的方法迭代),甚至可能会因为缺少指导信息而别为2547。文献[1)基于ICA的方法PCR(惩罚性独 降低最终的分类准确度。由此可见,GCA在降低计算复杂立分量回归算法)对这两个数据集进行了分类预测试验,预测 度的同时还能提高样本分类的准确度,文中的实验也证实了结果包含在表2屮。应用本文方法到两个数据集,训练集及 这一点。 测试集的划分与文献[保持一致,使用SNR在结肠癌数据 32算法描述 集筛选出150个基因,在急性白血病数据集上筛选出500个基 对于一个包含N个基因及M个样本的基因表达矩阵因后,分别迭代不同的次数,所得试验结果如表2。 N×M 表2癌症集上的试验结果 (%) (1)把各基因表达值屮心化。即令 结肠癌数据 白血病数据 g=8:-l2,}=0,1,…,M (11) 使用方法 训练集测试集训练集测试集 其中g是基因g在第个样本中的表达值,2是g在所有样本 P-ICR9363±2058595±5.1698.08±2.069465±2.89 中的平均表达值 04+2.63 (2)对中心化后的表达数据进行白化。这里通过对g的 由表2可以看出,本文方法的训练精确度要高于PICR 协方差矩阵进行奇异值分解(SVD)进行,即假设: (另一种基于ICA的基因分类方法),随着迭代次数的增加,精 E{g·g}=EDE (12)确度还会増加到100%,如果是随机划分,测试集的预测准确 那么被白化后的g的表达g为 度会与精确度成线性正比关系增长ε除了预测准确度比文献 /-=8 s(13)高外,文献.用的是利用指导信息对迭代结进行惩 罚的优化方法,而本文则直接把指导信息融入到迭代过程,收 (3)根据式(7)计算每个基因白化后的表达g倍噪比敛得比PCR快,从试验结果变化范围也可以看出来 SNR(g),然后取信噪比相对较人的一部分基囚作为GICA分 (下转156页)

...展开详情
立即下载 最低0.43元/次 身份认证VIP会员低至7折
举报 举报 收藏 收藏
分享
629KB
论文研究-基于g-h分布度量银行操作风险.pdf

论文研究-基于g-h分布度量银行操作风险.pdf,  根据银行操作风险厚尾性的特点, 采用具有厚尾特点的 g-h 分布度量了银行的操作风险. 在实际运用中根据 g-h 分布定义, 修正了 Tukey 分位数估计; 依据操作风险的高频低危和低频高危的特性, 提出了损失区间法确定损失次数参数. 在 g-h 分布特性的基础上, 得出了 g-h 分布的随机和的在险值. 利用我国银行公开披露的操作风险

2019-09-20 立即下载
469KB
论文研究-基于G-M法和重要抽样法的PLP强度函数的Bayesian预测分析.pdf

论文研究-基于G-M法和重要抽样法的PLP强度函数的Bayesian预测分析.pdf,  在多种无信息先验下, 将Gibbs抽样与Metropolis-Hastings算法混合的方法和重要抽样法应用于幂律过程强度函数的Bayesian预测分析, 简化Bayesian分析同时还能方便地给出强度函数及其函数的Bayes估计和区间分析. 所给预测方法不仅能预测幂律过程的未来强度, 同样适用于当前强

2019-09-20 立即下载
569KB
论文研究-基于G学习的无人机3D路径规划 .pdf

基于G学习的无人机3D路径规划,熊俊逸,毛治力,本文主要研究无人机路径规划中的学习策略,解决实时无人机在大场景中的路径规划问题,从而得到更加合理的航路。探讨传统增强学习

2019-08-16 立即下载
547KB
论文研究-基于G-ICA的组织样本分类算法.pdf

利用加入了分类指导信息的ICA(Guide Independent components analysis,G-ICA),在已知样本中提取隐藏在样本基因表达数据中与组织分类密切相关的各种表达模式,根据这些模式对未知组织样本进行分类。试验结果表明,该方法提高了组织样本的分类能力,其计算复杂度低、收敛快,具有较强的稳定性。

2019-09-11 立即下载
236KB
论文研究-基于G.729的VoIP系统设计 .pdf

基于G.729的VoIP系统设计,胡欠欠,李钢,本文利用G.729语音编码算法和RTP协议,实现了在网络上实时传输语音数据和视频画面的功能。文章分别描述了不同功能模块的设计过程,�

2019-08-15 立即下载
206KB
论文研究-基于G729音频编解码的VOIP在ARM上的实现 .pdf

基于G729音频编解码的VOIP在ARM上的实现,董传霄,徐惠民,VOIP(Voice over Internet Protocol)是一套通过语音编解码器将声音讯号经过压缩之后,进行封装、传输到目的地址,然后由接收端进行数据包的��

2019-08-23 立即下载
646KB
论文研究-基于.pdf

论文研究-基于.pdf,  将决策行为引入排队模型中, 以顾客追求利益最大化为出发点, 研究空竭服务、多重休假Geom/G/1排队模型中顾客的优化止步策略. 在不可见排队的前提下, 基于"收益-成本"结构, 采取均值分析的方法, 构建顾客个人和顾客总体的收益函数, 进而, 在不同参数范围内, 分析并确定出顾客均衡策略和社会最优策略. 最后, 通过数值模拟完善结论.

2019-09-20 立即下载
585KB
论文研究-基于多重休假的min(.pdf

论文研究-基于多重休假的min(.pdf,  运用全概率分解技术和拉普拉斯变换工具,研究了基于服务员多重休假的min(N,V)-策略M/G/1排队系统,其中N是预设的休假终止的门限值.讨论了从任意初始状态出发队长的瞬态分布,获得了队长瞬态分布的拉普拉斯变换的递推表达式和稳态队长分布的递推表达式,同时求出了附加队长分布的显示表达式.进一步讨论了当休假时间V分别服从负指数分布和定长分布P{V=T

2019-09-20 立即下载
591KB
论文研究-基于本体的飞机舵面结构故障诊断方法.pdf

论文研究-基于本体的飞机舵面结构故障诊断方法.pdf,  从系统工程的角度分析了飞机系统的复杂性,将飞机族的概念引入到飞机的本体建模中,并以舵面故障诊断过程为研究对象, 首先用Protégé建立了飞机本体的领域知识模型,然后将单故障和组合故障的诊断知识列为本体中的SWRL规则,最后利用 JESS推理出 新知识得出诊断结果,实现了用本体来选择修复方案的过程.该方法能够实现复杂系统的建模及故障诊

2019-09-20 立即下载
599KB
论文研究-基于偏好序的抗操作和抗自亏双边匹配方法.pdf

论文研究-基于偏好序的抗操作和抗自亏双边匹配方法.pdf,  针对基于偏好序的双边匹配问题,提出了具有抗操作和抗自亏性的匹配方法.具体地,首先,给出了稳定匹配方案和帕累托有效匹配方案的定义,以及匹配方法的抗操作性和抗自亏性定义.然后,通过借鉴经典G-S算法的思想,设计了确定最优匹配方案的IG-S算法.进一步地,讨论IG-S算法的特点,并证明了IG-S算法的合理性.最后,通过一个算例表明所提方

2019-09-20 立即下载
1.04MB
论文研究-基于模块性指标的动态网络社群结构探测方法.pdf

论文研究-基于模块性指标的动态网络社群结构探测方法.pdf,  针对节点增加的动态网络,提出一种对应的动态网络社群结构探测算法CD(Community Structure Detection Algorithm for Dynamic Networks).CDD算法依据节点加入引起模块性指标变化的情况,对网络节点进行社群划分, 从而可以发现网络社群结构随时间的动态变化过程.利用计算机生成数据

2019-09-20 立即下载
445KB
论文研究-基于3G网络的无线视频传输系统设计 .pdf

基于3G网络的无线视频传输系统设计,陈为刚,王涛,本文设计并实现了基于3G网络的无线视频传输系统。提出了一种适用于实时无线视频传输的基于用户数据报协议(User Datagram Protocol,UDP)

2019-08-15 立即下载
393KB
论文研究-基于3G网络的移动P2P视频直播技术研究 .pdf

基于3G网络的移动P2P视频直播技术研究,陈晓云,邢乔金,随着3G网络的快速发展,移动流媒体服务的需求迅速增长。由于移动网络带宽远达不到互联网的带宽,流媒体业务的增长将增加网络延迟�

2019-08-15 立即下载
536KB
论文研究-基于改进的G-P算法的相空间嵌入维数选择.pdf

对混沌时间序列相空间重构中嵌入维数的选择进行了研究,针对饱和关联维数算法(G-P算法)存在的四点不足,提出了一种计算最佳嵌入维数的改进算法。通过对邻域半径区间的自适应选择,采用均匀变化步长的方式;对无标度区间利用基于BDS统计限定范围的快速自动判定法进行识别,实现了系统维数的自动计算;针对原算法存在的重复运算、繁杂计算问题,从算法原理和程序结构上进行了改良,大大加快求解速率。在理论分析的基础上,用新算法进行试验,仿真结果表明设计的算法对嵌入维数的选择更准确更高效。

2019-09-08 立即下载
716KB
论文研究-基于能量优化G.pdf

给出了一种在能量优化意义下构造G2连续保形插值三次参数样条曲线的方法。具体步骤如下:(1)以曲线应变能最小为目标构造目标函数,通过解线性方程组,求出优化意义下的每个插值点处的最优切矢方向;(2)用文中给出的简易公式求出各插值点的曲率,进而计算出插值点处的切矢模长,使曲线满足G2连续、保形插值的条件;(3)用Hermite插值方法求出相邻两插值点间的曲线。实验结果显示了方法的有效性。

2019-09-06 立即下载
291KB
论文研究-基于3G网络的用户数据采集系统控制平面研究 .pdf

基于3G网络的用户数据采集系统控制平面研究,郭晨钟,罗汉文,第三代移动通信网络的建立使得许多曾经植根于以太网的业务和应用在新的领域大展拳脚。为了在无线网络中实现数据挖掘以此获取更多

2019-08-22 立即下载
225KB
论文研究-基于Oracle 10g的JAVA存储过程应用研究 .pdf

基于Oracle 10g的JAVA存储过程应用研究,张楠,,介绍了Oracle和存储过程,在对JAVA存储过程和PL/SQL存储过程的比较分析的基础上, 探讨了JAVA存储过程在Oracle 10g中的应用,详细阐述了JAVA�

2019-08-16 立即下载
668KB
论文研究-基于Oracle10g的实体化视图复制研究 .pdf

基于Oracle10g的实体化视图复制研究,霍东方,,该文以分布式数据库应用为背景,介绍了运用Oracle实体化视图复制实现远程信息分布式处理的方案;详细论述了与实体化视图复制相关的��

2019-08-17 立即下载
2.04MB
论文研究-基于多样化业务需求的多态路由模型研究.pdf

针对结构固定僵化、功能单一的传统路由机制不能有效适应多样化业务需求这一问题,提出了一种路由功能与业务需求自适配的多态路由模型,为支持多样化业务需求提供个性化定制路由服务,并设计实现了多态路由原型系统。该系统采用可编程路由器软件开源控制平台Quagga、可编程NetFPGA-10G平台作为控制平面和数据平面,通过虚拟化技术以及灵活可编程的数据平面结构实现多种路由协议的共存,并基于NetFPGA-10G平台设计实现了多态路由原型系统。测试实验证明,多态路由系统在保证业务的服务质量方面有很大提升,支持业务定制个性化的路由服务路径,并且转发速率、丢包率以及传输带宽等性能都有提高。

2019-07-22 立即下载
36.76MB
Twitter手机端安装包--Android

Android手机Twitter客户端,很多时候下载特别慢,希望对你有帮助。

2017-09-29 立即下载
img
  • 至尊王者

    成功上传501个资源即可获取

关注 私信 TA的资源

上传资源赚积分,得勋章
相关内容推荐