论文研究-基于量化特征的价格操纵行为监测模型研究.pdf

所需积分/C币:10 2019-09-20 20:09:20 2.79MB .PDF
收藏 收藏
举报

论文研究-基于量化特征的价格操纵行为监测模型研究.pdf,  价格操纵通常不包括明显的非法行为(诸如散布金融谣言和控制股权的供需),而是通过看似合法的报单、撤单等交易行为来实现.本文提出了一种基于隐马尔可夫模型的市场价格操纵监测模型系统:首先,基于三类典型的市场价格操纵实例,分析市场价格操纵行为模式的内在特性,利用小波变换和梯度分析作为特征抽取工具,抽取关键特征模式,量化操纵行为的特征模式,
第11期 姚远.等:基于量化特征的价格操纵行为监测模型研究 2723 案例的基础上确定监测过程的逻辑框架;第三部分对基本的价格操纵行为的特征进行界定,利用小波变换和 梯度分析作为特征抽取工具,抽取关键特征模式,并量化操纵行为的特征模式;第四鄙分引入带有异常状态 的自适应隐马尔可夫模型,建立市场价格操纵模型;第五部分对带有异常状态的自适应隐马尔可夫模型的价 格操纵监测进行绩效评估;第六部分对全文进行总结,并进一步提出潜在的改进方法和未来的研究方向 2文献回顾及问题的提出 21价格操纵 近年来,国内外学者对价格操纵行为与监测进行了大量的理论与实证硏究.欧盟2012年指出价格操纵 行为作为交易化操纵的一种重要类型有许多不同的表现形式13. Culling, Johar和Lil,Tse,Lin和 Ⅴ Incent15研究结果均指岀价格操纵中一种主要的表现形式是利用虚假指令( ramping)炒高价格,即操纵者 通过提交优于最佳盘中价格的虚假指令,制造该股票的交易活跃程度,吸引投资者的注意力,诱使投资者和 操纵者紧随虚假指令之后的反方冋向交易真实指令,当真正指令被交易后:前一个虚假指令即被撤销.操纵者 用吸引投资者注意的虚假指令诱使市场盘口宽度和深度发生改变,当这种改变能够给市场操纵者带来足够潜 在收益时,他们便会交易真实指令,撤销虚假指令 美国金融业监管局2012年9月通报了一个通过频繁挂撤虚假指令的价格操纵的典型案例.该案例利 用塞单( quote stuffing)高频挂撤虚假指令,通过增加流动性成功推高盘口买入价格6.9基点,减少盘囗买 卖价差87.5%,操纵者因此从中获利,整个操纵过程仅仅持续了819ms,而虚假指令被取消的时间只持续了 767ms.在欧洲和美国许多主要的交易市场中,塞单是占主导地位的市场价格操纵策略之一[516.这种策略 使用高频、海量的挂撤指令淹没市场,每条指令都扮演利润的诱饵,误导其他合法投资者的交易决策,从中获 取巨大潜在利益.塞单与其他价格操纵策略相比的最大特点是包含更多的虚假挂单,并且能够在更短的时间 内撤销. Cumming,Zhan和 Aitken17指出操纵者从操纵行为中获取利润的方式也不尽相同,通常有三种典型 方式通过在操纵价格时点的快速翻转减持多头头寸来获得利润;通过操纵价格从不同的两种市场获利(交 叉市场操纵;通过操纵股票的收盘价获利(收盘价操纵). Carolo和 Putin[18对收盘价操纵进行了实证研 究结果显示在收盘价操纵案例中,收益率、利差和交易量均明显增加,并博接下来的第二个交易日出现价格 回复 综上所述,所有价格操纵形式均会以一种形式表现出来,即向市场投放虚假指令,利用价格转移获利 22价格操纵监测 与市场操纵行为的研究相比,关于市场操纵行为监测方法以及模型的研究甚少Ogit等19分别使用基 于人工神经网络的逻辑回归模型和支持向量机模型,监测伊斯坦布股票市场的交易型操纵行为.Diaz等2 利用美国证券交易委员会(SEC)通报的市场操纵案例,使用线性逻辑回归方法建模监测操纵行为.这两篇文 献使用的模型均是结合操纵期间股票所涉及到的相关信息和事件,对比市场操纵行为和正常交易在不同时期 的市场回报率、流动性、波动性变化来区分正常交易和操纵交易.从异常偏离正常市场统计学特性的交易行 为数据中鉴别潜在操纵行为.我国,崔哓健等21以操纵案例为样本,应用逻辑回归刻画出期货市场操纵风 险的特征,利用数据挖掘技术寻找合适的操纵预誉指标并设定阀值.熊熊等2利用逻辑回归模型建立了股 指期货操纵事件的预警模型,并选取香港恒生指数期货操纵时段和对应的非操纵时段,进行了实证检验 尽管以上文献利用实际市场操纵案例数据对模型进行了评估和检验,从不同时期的市场回报率、流动性、 波动性变化中鉴別潜在的操纵行为,但多数情况下,这些异常变化是由经济周期、市场指数、某些政策性事 件引起的,并非操纵行为引起的所以,在此基础上建立的监测模型对于市场上不寻常的、但合法行为的判断 就容易出现错误20.因此,数据特征变化和操纵行为的监测方法之间就产生了认知上的差距 Mongkolnavin和 Tirapat2在泰国债券市场提出了一个简单的基于相关性规则的监测方法,假设交易 时间随机,即无论交易者是谁,其正常交易行为的时间间隔都是随机的,由此判别任何一个交易者与交易行 为之间的线性相关都可能是一种非正常的价格操纵.该方法是对泰国债券市场现有监测系统的一个补允,但 仅能识别交易化操纵的某些特定类型.由于国内目前对于股价操纵行为多采用有指导的监测技术,不能有效 监测到未被发现或新型的异常类型,王欣24等运用分位数回归模型结合变点检验,对中国证券市场的异常 交易行为进行研究,使用无指导的监测技术,不考关于正常和异常行为的历史先验信息 2724 系统工程理论与实践 第36卷 监测技术供应商 Smarts集团2009年设计了一种监测收盘价操纵的算法,并被纳斯达克OMX用于协 助监管机构和经纪商进行交易操纵监测.该算法根据市场历史价格变化嘔度监测市场收盘价是否被操纵,预 警警报的阀值设置为历史价格变化的直方图分布的99%上,如果收盘价和15分钟以前的价格大于阀值,那 么就会触发市场操纵预警警报. Aitken, Harris和il25利用该算法对市场效率和市场操纵之间的关系进行 了实证研究和分析,结果显示操纵行为严重影响资本市场效率.这种算法虽然简单直观,为日前的行业研究 提供了有效的参考.Iee等26量化了具有诱导性的虚假指令的特征,即指令价格高过盘口价格至少6.9基 点或指令大小至少是前一日平均指令大小的两倍,并利用韩国市场数据进行操纵行为的实证分析 就目前而言,文献[25]和[26是现有唯一对操纵策略分析和数量化建模的研究成果,而量化建模正是本 文的硏究重点本文通过抽取价格操纵行为的关键特征,昇定、分析操纵行为和普通交易行为的区别和联系, 量化操纵行为旳特征模式,提岀市场价格操纵监测的新模型——基于自适应隐马尔可夫模型的市场价格操 纵监测模型 3价格操纵特征抽取模块 31价格操纵特征分析 本文提岀一种带有异常状态的白适应马尔可夫的价格操纵监测模型,该模型由“特征提取模块¨和“监 测模型模块”组成.该模型从盘口买卖价格震荡中提取岀操纵行为的特征信息(“特征提取模块”),并应用特 征信息构造和训练“监测模型模块” Hautsch和 Huang27指出资本市场微观结构中的市场冲击是价格操纵依赖的理论基础,.市场冲击指交 易者利用白身交易行为对当前交易资产价格产生影响28.文献27研究结果显示高于盘口买价仅5个基点 的报价可诱使市场的最佳盘∏价格增加5.95个基点.对于正常交易者来说,能够准确估计和降低市场冲击 成本非常重要2.对于市场操纵者来说,市场冲击效应正是他们用来牟取利润的理论支持27 价格 845卖指令成 盘口卖价101.35 交价格101.32 真实卖指令价格10132 10131---- -1一内被取消,导致盘口买 虚假买指令在767毫秒 价从101.31降至101.24 盘口买价101.24 1:0:325961:08:32.59611:08:325961:0832.59时间 (a)锯齿特征 价格 67.0 2011年12月14日,WEB 股票价格在1秒内飙升 3%,并在3秒内恢复原值 66.5- 660 15:53 15:54 (b)脉冲特征 价格 2154 2012年7月13日,CAPC股 票盘卖价由于频繁挂单撤 销在1秒内呈现小方波震荡 21495}- 214.5 14:19:32 14:19:34时间 (c)方波特征 图1三种市场冲击获取利润机制 第11期 姚远.等:基于量化特征的价格操纵行为监测模型研究 2725 图1给出操纵者通过三种不同的市场冲击获取利润.图1(a)给出价格操纵行为中的塞单如何利用市场 冲击从中牟利的过程.操纵者先提交盘口价格的大额卖指令,随后连续提交价格略高于最新盘口价的虚假买 指令,由此制造买方盘冂活跃的假象,诱使更多买家进入盘冂交易,一旦被误导的父易者选择高价买入,操纵 者则执行之前提交的大额卖指令,其它虚假买指令则被立即取消,导致标的资产的盘口买价断崖震荡到原始 水平.为了降低虚假交易指令被其他投资者发现并交易的风险,连续的虚假提交指令和快速撤销指令通常发 生在一个极短的时间内.Te等15和Ian29均研究了图1(a)中显示出虚假交易指令对市场的盘口买价产 生的锯齿状震荡影响 类似地,由于市场冲击效应的存在,虚假指令也能引起盘口价格的非正常震荡.与塞单不同的是,该策略 通过提交优于最佳盘口价格的单一、大额虚假指令(高于当前盘口买价/或者低于当前盘口卖价)误导市场, 在这种策略作用下,被操纵的盘口买价和卖价可以在微小的时间间隔内连续翻转.图1(c)中的小方差波动叮 以看作是虚假指令的一种形式图1(b)中显示的是方差的显著波动,这种巨大脉冲波动比较少见,因为在如 泛欧NC这样的交易市场通常规定在一定的时间间隔内当价格上升至超过2%时暂停交易27.而在文献 29中,这种巨大的脉冲波动也被认为是典型的操纵行为之 图1中盘口买卖价格所呈现的锯齿波、图1(a)、脉冲波动(图1(b)、方差波图1(c)表示市场中可能 存在异于正常的交易行为,这些行为的特征和价格操纵行为相似.因此,监测价格操纵行为就可以转化为监 测盘口买卖价格序列异常波动的问题.在实际操纵中,这些波动模式常以各种方式混合出现5.美国证券 交易委员会刚于2013年4月针对异常波动的交易行为发布了股市波动规则,指出价格操纵行为通常发生 在一个交易日内的时间间隔中.因此,本文仅监测一天内的盘口买卖价格序列中的异常情况 金融资产价格通常遵从均值回归过程,即价格山长期均衠价值和随机振荡两部分值叠加而成.均衡价值 代表市场长期走热,其变化过程相对缓慢,常被认为是价格中的低频部分,而随机震荡则是价格中的高频部 分如果价格操纵行为引起的盘口价袼波动被看做是均衡价格附近的短期小幅高频振荡(图1(a)中6.9bps 和图1(c)中18.6bs)、那么,分析价格数据中的高频部分就可以监测价格操纵行为.因此,本文利用信号处 理领域中的连续小波变换把价格中的低频部分即长期均衡走勢分量去掉,保留价格中的高频震荡,用以表示 价格操纵行为,并在此基础上构建监测模型. 3.2价格操纵特征抽取 在信号处理领域,有三种常用的信号分解方法:经验模态分解( empirical mode decomposition,EMD), 连续小波变换( continuous wavelet transform,CWT)和同步压缩转换( synchrosqucczcd transform,SST) EMD的应用受限于低频率分辨率对临界频率的依赖限制.CWT理论上可以把任何信号通过平移和变换表 示为一组母(原始)小波的线性叠加,可以实现不同时点、不同频带上信号的分解、CWT与傅里叶变换不同 的是,傅里叶变换不考时域信息,只描述信号的频率信息,而CwT的时频局部化特性则通过尺度和位移 参数描述了各个时域点内的频域信息.SST扩展了CWT,通过进一步计算小波系数的一阶导数(瞬时频率 重新分配小波系数. arabian,Took和 Mandic31把ST用作一个带通滤波器从交易价格中除去高频信息 本文采用CWT方法分解价格序列中的低频和高频部分,抽取和分析价格时间序列中的特征.CWT用 母小波各级近似系数和细节系数的缩放和平移的线生组合来表示原始信号,其中,近似系数向量代表数据信 号中的低频成分,细节系数向量代表数据信号的高频成分. Haven,Li和Shen2使用细节系数的硬阈值滤 波方法去除金融数据的噪声,即数据中的高频部分.本文反向使用细节系数的硬阈值滤波方法来去除低频成 分抽取高频成分,阈值以外的小波系数被设置为0.即: Tm,nif|Tm,n≤A 0 if 式(1)中,Tm,m表示细节系数,m和m分别表示小波函数的尺度和位移参数,λ表示固定阀值小波分 解和逆阀值滤波过程包括三个步骤: 1)通过离散小波变换,计算小波系数向量{Tmn,m-1,a,…,T,n}; 2)选择一个阈值入,对系数向量应用公式(1)滤波 3)用滤波后的小波系数重构数据. 为简易模型,本文把图1中的三种典型的价格操纵行为—锯齿波(图1(a)、方差波(图1(c)、脉冲 波(图1(b)归纳为价格波动的两种特殊模式:显著的脉冲(图1(b))或者短期震荡(图1a)和图1(c)中的 2726 系统工程理论与实践 第36卷 锯齿波和方差波) 如前文分析,价格操纵行为引起的盘口价格短期震荡与高频部分紧密相关,我们以 Symlets小波作为母 小波函数进行小波变换,抽取价格P中的高频鄙分(用尸表示)来对应短期震荡.计算原始价格及其短期 震荡的梯度dP/dt和dP/dt,dP/dt代表盘口价格的变化率,即原始价格的显著脉冲:dP/dt代表盘口价 格小幅高频振荡率,两者均作为市场操纵行为的特征被抽取出来.从金融的角度来看,P和P1分别代表盘 口原始价格和去除低频长期走势后的价格特征,无论价格操纵形式如何多样,P和P这两个本质特征都紧 密伴随着价格操纵活动的存在,呈现不寻常的脉冲或密集的方波震荡.因此,上述四个变量P、P、dP/dt 和dβ/dt包含了所有可能描述价格操纵的行为(脉冲,密集锯齿以及方波震荡).综上所述,“特征抽取模块 包括使用小波变换分离数据的高频模块以及相应的梯度计算,见图2,其中 1)Pt表示原始盘口价格 2)Pt表示原始价格的短期震荡; 3)dP/dt表示原始价格变化率; 4)dP/dt表示短期震荡变化率 股票价格及其“均衡值” 短期震荡 股票价格 均衡值 diet/il 100 150 200 150 200 (a)股票价格及其均衡价格 (b)短期振荡 股票价格梯度 短期震荡梯度 0.5 05 淀 據军 05 100 150 200 时同01 200 c)原始股价的梯度 d)短期振荡的梯度 图2小波过滤股票价格的例子 图2表示一个盘∏价格完成特征抽取后输出的例子.盘∏原始价格P的均衡值(图2(a)中虚线所示) 被去除后短期振荡被抽取出来(如图2(b).P和P的梯度分别如图2()和2(d)所示 4价格操纵监测模型 完成价格特征抽取之后,这一部分建立价格操纵监测模型.金融数据通常是非平稳的,金融市场中任何异 常事件都可能直接引起所抽取的数据特征出现非平稳的变化趋势,即抽取特征的分布会随时间的推移变化, 这些非平稳性特征均可能是由图1所示的一些操纵交易行为引起的.因此,监测模型第一步首先需要确定所 抽取特征的分布,再建立监测模型 41高斯混合模型(GMM)和隐马尔可夫模型(HMM) 未知变量的概率密度函数通常可用GMM来近似.一个GMM由M个高斯分布的加权组成,表达式为 ()=∑9(x.∑) 其中是个D维连续值向量,t2(=1,2…,M)表示混合权重,g(xl2,∑a)(=1,2,…,M)表示各个变 量的高斯密度分布.每个密度分布对应一个D-变量高斯函数.本文建立的价格操纵监测模型中,价格抽取 第11期 姚远.等:基于量化特征的价格操纵行为监测模型研究 2727 特征的概率密度函数由GMM得到.GMM抽取特征的概率密度由M个高斯分布按不同权重叠加而成,任 何一个时间点的价格概率密度由M个分布中的某几个决定,随着时间点的变化,决定当前价格概率密度的 髙斯分布可能会相应改变.概率密度分布的瞬时变化与观察到的特征相关联,潜在的价格操纵行为则由特征 序列而非单个时刻的单一值决定.因此,可以根据决定当前的价格概率密度的不同高斯分布来监测市场价格 变化的规律. 一般而言隐马尔可夫模型(HMM)在监测问题中的应用被分两类:“特征建模”和“异常检测”“特征建 模”是基亍被监测的行为数据建立模型,当被监测数据与模型相匹配时,则触发监测报警,如Wang, Mehrabi 和 Kannatey- Sibyl3y,(Guo等834;“异常检测”与之相反,仅基于正常的行为建模,当被监测数据与模型不 匹配时触发监测报警,如 Ycung和Ding), Clifton等86 山于市场操纵的监管规则以及被披露的价格操纵行为的数据和案例非常少,因此,我们使用“异常检测” 进行价格操纵监测,即检测背离常规行为的单个或一系列数据点.首先建立正常交易行为的模型,当市场行 为与正常交易行为模型不匹配时,系统将触发警报.但使用“异常检測ˆ进行价格操纵监测时将岀现两个难 题:1)异常检测使用HMM时,通不能确定是何种类型的异常行为以及这种异常行为的概率密度函数;2) 价格的概率密度函数通常基于非平稳的金耐时间序列 为了解决这些间题,本文设计了一种带有异常状态的改进的自适应HMM,并在下面两个部分进行介绍 4,2带异常状态的隐马尔可夫模型( HMMAS) 假设盘口价格序列包含T个时间点,图3给出了特征抽取模块所抽取的特征.即P、dP/lt、B和 dP/dt.令F(t-1,2,…,T)表示时刻t的价格特征向量,时刻t的四个预处理特征-[FO,P,F,F2 分別表示原始价格、原始价格的梯度、短期波动、短期波动的梯度的特征向量. 所抽取的四个特征的概率密度函数由GMM计算求得.每个特征的概率密度函数都可能由多个高斯函 数的线性叠加构成,其分布变化可通过检测当前的观测值来判断是由哪些高斯函数混合决定.用高斯分量表 示市场交易行为的隐含状态,把直接分析时间序列的问题简化为对隐含状态的转换分析,即使用隐马尔可夫 模型对所抽取的特征建模. 基于特征概率密度分布的变化分析状态转换,本文使用 Smart集团的行业监测算法:99%的累积分布 即为异常行为的阀值,即当P(F)≥9%时,数据被视为正常的,因此需要确定每个特征的最高和最低05% 频率值.在训练和构造HMM模型时生成虚拟的异常状态 123 2 35 ∽OEtO=0 00200400 040206200400 Time PDF TIme (a)股票价(右)和概率密度函数(左 (b)短期振荡(右)和概率密度函数(左) 15 15 a0.5 画05 o05 0.5 g-05 -05 0.5 05 1.5 os-120040 PDF (c)原始股价梯度(右)和概率密度函数(左)(d)短期振荡娣度(右)和概率密度函数(左) 其中数据米溟于微软股票数据2012年6月12日的原始股价、短期振荡、原始股价梯度和振荡梯度的概率密度曲线的绘制, 1概率密度函数;2函数的组件;3阀值) 图3GMM特征抽取的例子 2728 系统工程理论与实践 第36卷 图3以微软股票2012年6月12日数据为例子.显示了一个由GMM得到的价格序列所抽取的四个特 征及四个特征所对应的概率密度函数.两个临界阈值为(虚线所示)0.5%和99.5%的累积概率,来区分正常 和异常的波动状态区域以图3(a)为例,价格(小圆圈所示)的概率密度函数包含三个高斯分布(实线所示) 99%累积分布部分被视为正常状态,在最大和最小05%积累分布以外部分被视为异常状态.通过这样的方 式,原始价格的概率密度函数可以划分为四个部分:三个高斯分布对应于三个正常状态,其余最大和最小的 部分对应于异常状态.这四个状态即为价格特征的四个隐含状态,如图4所示,这里用{f,j=1,2,3,4} 表示原始价格的隐含状态,其特征抽取表达式F°∈{门9,。=1,2,3,4} S4 图4由正常状态S1,S2,S3和异常状态S4序列的变化生成的HMM模型 同样.图3(b)、图3()和图3(d)显示另外三组特征的概率密度函数分别包含两种隐含状态(一种正常 状态和一种异常状态)定义{f0,1g=1,2},{f,=1,2}和{f3,ig=1,2}分别表示为原始价格梯度、 短期小振荡和短期小幅振荡梯度的隐含状态由此可以得到另外三个特在抽取表达式FB∈{。n},F∈ {f}和F∈{f},其中jg,,y={1,2} 基于上述讨论,我们把四个特征的隐含状态量化为 HMMAS模型对应的4×2×2×2=32个隐含状态, 表示为S={S},S=%,fm0,f,f其中={1,2,…,32},o={1,2,3,4,y3,3g={1,2其中 每种隐含状态都是某些特征状态的合成,当所有特征状态都属于正常状态,相应的隐含状态则表示正常交易 行为:如果有一个特征属于异常,相应的隐含状态则表示异常交易行为.因此,在32个隐含状态中,3种状态 是正常的,其余29个都是异常的 基于对图1的讨论,使四种隐含状态对应前述的价格操纵特征.如利用瞬时大量指令误导市场凶操纵行 为(塞单)等通常直接导致价格短期振荡和原价(f和)梯度的显著变化,但不会导致价格的大幅度波 动;而虚假指令等,往往会直接导致价格较大幅度的波动、而非短期瞬时的震荡.因此,为简化模型,本文根据 特征状态将29种异常状态可以重新组合成三科操纵行为状态 1)塞单:有异常梯度特征的状态 2)虚假指令:有异常价格特征(原价和波动)的状态; 3)其他异常:所有特征均为异常的状态 通过重新组合,32种隐含状态进一步简化为仅包括3种正常状态和3种异常状态.这种状态转换机制 完整描述了市场操纵行为的各种情况组合,为交易行为引发的状态转移提供了一种有效方式.通过这种方式, 市场交易行为特征引发的盘口价格波动特征的瞬时动态就由隐含状态的转移而决定,传统的HMM就被扩展 成为包括异常状态的模型,即 HMMAS.解决了4.1中提出的“异常检测”进行价格操纵监测时出现的第1) 个难题 图5(a)表示了基于传统HMM的监测系统的基本结构特征向量S2=[fn,f,f,从市场中观 测(抽取模块计算)得到(图5中表示)特定观察量口特定隐藏状态(图中x表示)所产生,而任一时刻 隐臧状态x只由前一时刻的状态x1-1决定(马尔可夫性质)因此,对于任一特定特征向量y序列,使用 Ⅴ viterbi算法,通过状态转换概率和输出概率,计算得到产生该特征向量y序列的隐含状态x的序列,如图 5(b)所示:当观察到序列{v:t=0,1,…,T},使用Ⅴ iterbi算法得到最有可能产生这一序列的隐含状态序 列{x;,t=0,1,…,T},当隐含状态序列由异常状态所构成,则可以认为当前市场上观察到变化可能由价格 操纵策略导致. 第11期 姚远.等:基于量化特征的价格操纵行为监测模型研究 2729 正常状态 异常状态 隐藏状态 虚假 状态 塞单 观察状态 y 隐含状态的抽取 y-1 (b)隐含状态的生成 图5基于传统HMM的监测系统的基本结构 43自适应隐马尔可夫模型( AHMMAS) 由于金融时间序列的非平稳性,盘口价格概率密度函数的均值和方差会随着时间的摧移发生变化.为∫ 监测价格操纵过程中价格时间序列的非平稳性, HMMAS引入了一种自适应机制— AHMMas.这种自适 应机制使用当前数据之前长度为ω的滑动窗冂中的数据来训练构造模型.在监测过程中,滑动窗向前滑动 保持最近的w个数据点,如果当前滑动窗口对应的v数据点与之前观测到的样本数据之间产生显著差异 那么 AhMMas将会基于最新滑动窗内的数据重新进行训练和构造.模型中加入自适应机制后解决了4.1 中提出的“异常检测”进行价格操纵监测时岀现的第2)个难题 价格 5000 PDE 0.5 价格 价格 价格 图6不同的概率密度函数对应的非平稳变化(2012年6月12日苹果股票价格) 本文使用t-检验模块作为 AHMMAS的后处理模块,用来检测滑动窗口更新后的数列与先前的数列之 间显著性水平为1%的统计差异.图6给出了2012年6月12口苹果股票价格P,t-1,2,…,5000 可以发现其是一个非平稳的时问序列如果时间窗口的长度设置为=1670,那么这三个窗口为P,t 1,……,1670,P,t=1671,…,3240和P,t=3241,,500(如图6中显示的三个部分) 价 lu-l tu t uh+I tw+L-I tw 时间 训练窗 ;∈ 一-- 4n--> 测试序列 图7价格操纵监测系统的自适应机制 2730 系统工程理论与实践 第36卷 图7给出 AHMMAS的自适应机制过程.模型最初的训练构造基于样本窗口F,t∈[to,t-1],其中to 和t-1分别作为v窗口中数据的开始和结束点.对窗口之后的新数据点tu使用模型进行监测,如果监测 通过,即新数据不包含任何市场操纵行为,那么新数据点就会被用米更新窗∏,并进行t检验.如图7所示, 滑动窗每次滑动,窗口中的数据都进行一次t检验,如图中滑动窗从t2滑动到tn3后,新数据点t+L如 果是正常交易数据,则加入滑动窗,用来代替滑动窗中最早的数据点t构造的新滑动窗数据,再次应用t检 验进行检测.由于本文的研究范围是当日的价格操纵行为,所以样本窗口被设置成一天 44价格操纵监测算法 AIIMMAS价格操纵行为监测算法如下 1)对特定的样本数据E,选择滑动窗口长度ω;选择E价格时间序列PB,t;∈[to,…,t-1]; 2)使用小波变换和梯度计算方法计算P.的四个特征,获得特征向量F1=[F2,FC,F,F1 3)构建 AHMMas监测模型:首先使用GMM和相应的异常阀值设置来分别计算F,F,FE,F四 个持征向量的概率密度函数;如42节所描述,把四个特征的隐含状态量化为 HMMAS模型对应的隐含状 态,通过状态转换机制把隐含状态进一步简化为仅包括正常状态和异常状态; 4)使用观测到的特征和隐含状态训练 AHMMAS模型; 5)如果训练序列没有被重构,选择一个长度为L的监测序列,先前的序列则被替代为P,t∈[t tu+L-1],使用步骤3计算该序列的四个特征向量,带入 AHMMAS模型用来监测某种状态出现的概率 6)如果监测出状态属于异常状态,则触发预警机制,并指出异常状态属于价格操纵中的哪一种(如4.2 中划分的三类:塞单、虚假指令、以及“其他异常”),及该种状态出现的概率 7)如果监测出状态属于正常状态,则滑动窗口,tm+L-中的价格序列将使用白适应机制来对模型进 行更新(两个滑动窗口数据如果存在统计差异则需要更新),如果模型需要更新,那么算法将回到步骤1重新 开始 8)如果模型不需要更新测试序列将使用新的数据P,t∈[tu+1,tm+L],算法将回到步骤5重新开始 图7显示了样本窗∏的頂始状态和测试序列,以及价格操纵过程期间每一个滑动窗∏.图7中 AHMMAS 模型由数据tn1=PE,t;∈[0,tu-l]来进行训练.第一个测试序列被构造为t=P,t;∈tn,tm+L-1].如 果监测表明行为正常,那么自适应机制之后就会检查更新后的样本窗口tn=PE,t1∈t,tm+L-1和原 始的窗口l1n之间的数据差别.如果不需要重新创建模式,训练窗口会滑动至tm3,一个新的l测试序列 会被构造出来,用新的数据点t+L代替除去t点.同样,如果没有监测到异常,更新后的样本窗口数据 t3=P,t∈[t+1,tu+]和最初的样本窗口tnl中的数据就会开始进行适应性监测.对输入的所有数据 流,这种监测和更新过程会反复进行下去 5实验和评价 本部分对 AHMMAs进行评价.“异常检测”算法的性能评价往往依赖大量标记( belled)数据.标记 数据是行业专家基于巳勺的行业经验对数据的类别(例如正常交易行为或价格操纵行为)做出正确标记的数 据集.在现实中,标记数据集往往很难获得,一方面因为有些数据集的发生情况很罕见,难以在发生时获取现 场数据,例如航空发动机的失效数据,核反应堆运转的失效数据等;另一方面囚为有些数据集由于经济、信息 安全等因素不便于公开,比如一些反恐案例中的犯罪活动的特征数据等.本文所使用的金融市场价格操纵案 例数据就是此类欻据,各国监管部门虽然会公布操纵案例,却很少公开操纵行为的细节数据.在缺乏大量真 实市场苿例数据的情况下,只能模拟现有操纵案例数据的特征,随机生成大量仿寘操纵数据,把仿真的操纵 数据插入到市场真实交易数据中,构建实验数据集.对构建的数据集进行监测模型评估,类似的方法在佥融 界7及学术界均被使用过38,3 5.1实验评价设计 51.1实验数据的选择和构建 本文使用的实验数据包括两类 第一类数据来自真实市场,本文选取七只具有代表性的股票:纳斯达克的谷歌( GOOGLF),微软(M- CROSOFT),英特尔,苹果及伦敦证券交易所的ARM,巴克莱银行和沃达丰.选择这些数据的原因是因为它 们具有相对较高的成交量和价格波动,这些特征往往会增加价格操纵的可能性②627.数据集包括5个交易

...展开详情
试读 16P 论文研究-基于量化特征的价格操纵行为监测模型研究.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
weixin_38744270 欢迎大家使用并留下宝贵意见
2019-09-20
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分,得勋章
最新推荐
论文研究-基于量化特征的价格操纵行为监测模型研究.pdf 10积分/C币 立即下载
1/16
论文研究-基于量化特征的价格操纵行为监测模型研究.pdf第1页
论文研究-基于量化特征的价格操纵行为监测模型研究.pdf第2页
论文研究-基于量化特征的价格操纵行为监测模型研究.pdf第3页
论文研究-基于量化特征的价格操纵行为监测模型研究.pdf第4页

试读结束, 可继续读1页

10积分/C币 立即下载 >