论文研究-确定时间序列分段点的方法研究.pdf

所需积分/C币:44 2019-09-11 09:25:05 540KB .PDF
29
收藏 收藏
举报

现有的时间序列分段线性表示一般把局部极值点作为分段点,但是局部极值点并不能完全刻画时间序列的状态变化,根据时间序列线性分段的基本思想,提出在确定局部极值点的基础上引入斜率差值大的分段点,以便得到较高的拟合精度。新的分段点通过比较相邻序列段的斜率实现,斜率差值越大,该点的状态改变越明显。实验证明该方法拟合误差小,有很好的实用性。
462010,46(13) Computer Engineering and Applications计算机工程与应用 始序列之间的近似程度。拟合误差的数值说明了序列点与拟合 表2相同压缩率下不同PLR表示的拟合误差 直线段离散的程度,同时也反映了分段表示的准确性。拟合误 序列名称PLR- WE PLR- IP PLR-CP该文方法 差越大,说明直线段拟合越差,分段效果不理想。为了验证算法 1.52 3.2 Chaot 1.76 1.63 0.49 的有效性,采用来自不同领域时间序列数据的随机样本,计算 Powerplay 1.07 1.11 不同PLR算法下的拟合误差,从而比较算法的性能,同时所选 Earthquack 3. 48 1.80 时间序列长度不一,保证了选取数据的一般性,数据集描述如 Ocean 0.31 0.38 0.24 表1所示。 Leleccum 0.64 0.98 Tide 3. 0.29 2.22 表1时间序列数据 Burst 0.32 0.89 0.90 0.07 序列名称序列长度 Speech 1021 段点的准确性和完全性,两类分段点的寻找确定能够很好地描 1800 explant 2400 述时间序列的状态特征;算法的普遍性,适合于具有各种特征 4096 的时间序列 4097 Leleceum 4320 5小结 8746 Burst 9382 时间序列分段线性表示是进行具体数据挖掘工作的基础 和前提,分段点的选择和确定是保证PLR模型准确的第一要 42实验方法 素。把极值点和斜率差值大的点都作为时间序列分段点来考 选择以下3种PLR方法作为比较的对象 虑,提高了分段的精确性。极值点是通过时间序列的趋势转折 (1)基于PA的分段线性表示算法: Keogh等人提出时点确定,斜率差值大的分段点是通过计算并比较相邻序列段的 间序列的PAA表示方法,用等宽度窗口分割时间序列,每个窗斜率实现的。经实验证明,提出的算法能够提高分段的精度和 口内的时间序列用窗口平均值来表示,称为 PLR-WE。 准确度,使分段后的直线段能够较好地拟合原时间序列,从而 (2)基于重要点的PR表示Pl和Fik提出了基于重为时间序列挖掘的模式提取做好充足的准备。 要点的分段方法,称为PLR-P。 (3)Xao等人提出基于特征点的PIR表示:提取时间序列参考文献 的特征点作为时间序列的分段点,通过连接这些特征点,得到 [l Prat K B, Fink ESearch for patterns in compressed time series[JI 时间序列的分段线性表示,称为PLR_CP。 International Journal of Image and Graphics, 2002, 2(1): 89-106 对于算法性能的评价指标,主要考察4种PLR表示方法21 Perng C s, Wang h, Zhang s r, et al. Land marks: a new model 与原时间序列之间的拟合误差。在相同压缩率下,采用上文定 for similarity based pattern querying in time series databases[Cy/ 义的拟合误差公式计算,然后对结果进行比较,拟合误差越小, Proceedings of the 16th International Conference on Data Engi- 说明算法性能越好。 neering. San Diego: Ieee. 2000: 33-42 43实验结果及分析 3]肖辉,胡运发基于分段时间弯曲距离的时间序列挖掘小计算机研 对表1的数据集分别采用上面的3种PLR表示及该文的 究与发展,2005,42(1):72-78 方法来计算拟合误差,并且拟合误差在相同的压缩率下计算4贾彭涛林卫时间序列的自适应误差约束分段线性表示计算机 (该文算法可以通过改变d值大小来相应调节压缩率)。 工程与应用,2008,44(5):10-13 [5]Keogh E. The UCR time series data mining archive[D]. Irvine, CA 从表2可以看出,在这8条时间序列中,该文提出的算法 USA: Department of Information and Computer Science, University 在绝大多数时间序列数据上拟合误差都是最小,即使在 Elec of California. 2002 cum数据集上不是最小值,但与最小值也非常接近,可以认为 16 Ge X, Smyth P Deformable Markov model templates for time-series 对这类序列也是有效的 pattern matching Cy/Proceedings of the 6th ACM SIGKDD Int I Con 实验结果表明,提出的算法不仅性能良好,而且适应性也 ference on Knowledge discovery and Data Mining. Boston: ACM 很广泛。这主要是因为该算法相较于其他算法有以下优点:分 Press,2000:8l-90

...展开详情
试读 3P 论文研究-确定时间序列分段点的方法研究.pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-确定时间序列分段点的方法研究.pdf 44积分/C币 立即下载
1/3
论文研究-确定时间序列分段点的方法研究.pdf第1页

试读结束, 可继续阅读

44积分/C币 立即下载