2012研究生数学建模A题优秀论文
基因识别问题及其算法实现
针对基因识别问题,本文基于DNA 序列的3 周期这一性质,首先给出了DNA
序列功率和信噪比的快速算法并讨论了不同物种基因类型的阈值确定方法;在
此基础上,本文建立了基于背景噪声抑制和频谱平滑的SNR 频谱预处理模型,
经过预处理后的频谱不仅大幅度抑制了背景噪声,同时保留了SNR 频谱的模式
特征。在编码序列识别上,本文对经典的EPND 预测算法进行了改进,使用改进
的EPND 算法对经过预处理后频谱进行基因识别,实验结果显示这种基因识别模
型具有优异的基因识别性能,比传统直接使用基于滑动窗口DFT 的EPND 识别算
法在敏感度、特异性等评价指标上提高了2%-12%左右(不同指标提高程度不同);
最后本文将提出的基因识别模型用于6 个未知DNA 序列(gene6)的编码区预测。