论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf

所需积分/C币:10 2019-09-20 20:56:53 1.45MB .PDF
2
收藏 收藏
举报

论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf,  准备金及其风险边际对保险公司的偿付能力具有决定性影响.均值回归模型在非寿险准备金评估中的应用较为普遍,但需要通过Bootstrap等方法计算准备金的风险边际.分位回归模型可以一次性求得准备金及其风险边际的预测值,所以在非寿险准备金评估中具有独特的应用价值.基于GB2(Generalized Beta type 2)分布建立了一种
第3期 孟生旺,等:基于参数化分位回归模型的非寿险准备金评估 605 地下水位和流量之间的关系进行了分析;Dong等1分别基于ALD分布、幂帕累托分布、GB2分布建立 了参数化分位回归模型进行非寿险未决赔款准备金的预测;而Su16基于GLD分布建立了一种更加灵活的 参数化分位回归模型,并将其用于多种不同类型的数据分析中 本文采用第二种方法构建了一种基于GB2分布的参数化分位回归模型,并将其应用于非寿险未决赔款 准备金及其风险边际的预测本文的主要工作可以概括如下 第一,本文改进了Dong等15的部分研究结果.本文基于GB2分布构建参数化分位回归模型,直接在 GB2分布的尺度参数和形状参数中引入事故年和进展年作为解释变量,而非采用Dong等15提出的间接 对GB2的均值引入解释变量的方法.采用第一种参数引入方式,无需假设GB2分布均值的存在性,使得模 型参数不受-<1/σ<τ的限制,简化了渐近方差的表达式,降低了模型的计算难度;通过同时对形状参数 引入解释变量,增加了模型的灵活性 第二,本文从贝塔分布出发,推导了GB2分布的密度函数和分布函数,并借助分布函数的单调性和分位 数的定义,给出了推广后的基于GB2分布的分位数表达式(13).将文献15关于GB2分布的分位数表达 式(22)中形状参数σ的取值范围由大于零的实数域推广到了非零实数域,进一步扩展了文献151中表达式 (22)的应用范围 第三,本文采用极大似然法估计方法,通过 Nelder-Mead优化算法求解参数的极大似然估计值.由于极 大似然估计结果严重依赖初试赋值,从而使得参数佧计结果陷入局部最优.为了解决这一问题,我们采用分 段随机赋值的方式,求解参数的全局最优佔计值.最后,借助分位函数的表达式:并通过 Delta方法求解分位 数估计的标准误和置信区间 第四,基于一组实际赔款数据进行实证研究,将本文的方法与现有方法进行比较研究,检验了新方法的 实际应用价值 2GB2参数化分位回归模型 21GB2分布 GB2分布定义在非负实数上其密度函数为7 T(v+r) o(y/ e:(y1o,p,T)=()r(7)1+(y)1 (4) 其中,μ>0为尺度参数;σ∈R为形状参数;υ和τ分别为偏度与峰度参数,且满足>0、σ>0.当参数 ,v和分别满足-<1/0<T和-<2/0<T时,GB2分布的均值和方差存在,且为 E(Y B(u+1/0,7-1/ B Var(Y=E(y B(v,T)B(+2/,T-2/a) (v+1/,T-1/) 其中、B(x,yg)为贝塔函数,定义为 B T(T I(a+y 图1展示了GB2(σ,,v,丌)密度函数的丰富形态,可以看出,GB2分布可以刻画尖峰、厚尾、左偏、石 偏和对称等各种类型的数据.这使得GB2分布适合一般保险业务和长尾保险业务的准备金评估 GB2分布不仅具有灵活的密度函数,许多常见分布还是它的特例.图2给出」在给定参数取值或参数取 极限的情况下,GB2包括的一些常见分布18,其中三参数的分布有对数t分布、广义伽玛分布、第二类型叭 塔分布、Burr分布;二参数的分布有对数柯西分布、对数正态分布、威布尔分布、伽玛分布、F分布、 Lomax 分布、对数逻辑斯特分布;一参数的分布有半正态分布、瑞利分布、指数分布、卡方分布、半t分布 在图2中,①表示b=/,p=/2,b=v/2;②表示a=0,D=0.5,③表示a=0,b=v,p=0.5 n=v/2.关于GB2分布的进一步研究可参见本文后面列示的参考文献[1921 606 系统工程理论与实践 第38卷 GB2(0.01,10,10,0.01) GB2(1O,105.0.01) meege 0.0 0.2 0.40.60.81.0 40 GB2(10,105,5) GB2(10,10,1.5,2000 3. 4.0 5.0 图1GB2密度函数的形态 GB2分布 0 q 1 1 对数t广义伽第二类型 类型12 类型3 分布」玛分布」贝塔分布Bur分布Bur分布 05 p 乎∞∠q=V2 p=1 对数柯对数正威布尔 伽玛 F布 Lomax 对数逻辑 西分布态分布 分布 分布 0分布 斯特分布 h=2 2 q→ 半正态 瑞利 指数 卡方 半t 分布 分布 分布」 分布 分布 图2GB2分布与其它分布的关系 22基于GB2的参数化分位回归模型 假设在(0,1)区间取值的随机变量Z服从贝塔分布,其密度函数为 fz(2|,7) T(U+T) (1-z) 如果对随机变量Z进行如下单调变换: 则可以求得随机变量Y=g(z)的密度函数为: )=/z(z|v,T) o=ror (1 dy 1+(y/p) T(v+7) 1 (y/y r()r(7)[1+(y/ 1+(y/ 1+(y/ T(U+7) 上式就是GB2分布的密度函数,换言之,GB2分布是以塔分布的推广15.当a>0时,g1(y)关于y 为单调递增函数;当σ<0时,g-1(y)关于y为单调递减函数根据函数的单调性与导数之间的关系,经化 简后,可得GB2分布的密度函数与贝塔分布的密度函数之间存在以下关系 de >0 B2(y| 0, A, u,T)=fEta( v,T).g(y 第3期 孟生旺,等:基于参数化分位回归模型的非寿险准备金评估 607 对等式(8)两端关于y在(0,x)积分,可得GB2的累积概率分布函数为 Bet sds=h FGB2(3 0, u,v, T) z /1a(od=1-ham(|),n< 对于给定的分位数水平m,我们将GB2分布的分位函数表示为Qy(m),则由式(9)和分位数的定义可 得 (Qy()/ Y <0 同理由分位数的原始定义,可以将贝塔分布的分位数表示为Fata(u|v,T),即 WV,T)V, 最后,结合式(10)与式(11),以及贝塔分布函数的单调性可得 (Qy()/) 1+(Qy()/) seta (u v, r) (12) (Qy()/) 1+(Qx()/) Bet 对式(12)进行化简,可以得到GB2分布的分位数Qx()为 1+Fr(ul v,T >0 Qy(a) (13) 0 L1,T 考虑到不同观察个体的尺度参数μ和形状参数σ可能不同,同时,满足p>0、σ∈R且不等于0.因 此,我们考虑对GB2分布的这两个参数以如下方式引入解释变量 (2) e tik (x)=+∑ (15) 其中,、x;=(x1,……,x;s)为解释变量;a0,a1,…,a、与,月1,…,1为相应的回归系数因此,在GB2分布 假设下的分位回归模型可以表示为 Beta (u l v,T a(x2)>0 1+F=(u|v,T) U ,T, (1 (:) , 1+F Beta 23参数估计 本文用极大似然法估计模型参数.GB2分布的对数似然函数可以表示为 ∑}-logB(+lg(,)+σ( g +7)·log1+ g lyi 考虑到GB2分布的偏度参数v和峰度参数τ均大于0,为了避免在参数估计过程中出现负值,可以对 和7进行如下变换 exp(Tl 对l分别关于回归系数αo,α1,…,αs、角,β1,…,3以及分布参数v、η求偏导,并分别令其等于0,可得: 608 系统工程理论与实践 第38卷 ∑{-m+(m+) v;/(x;)( 0. ao 1+1/y(;)(x) ik+(+7)·x (a c, 0 1+|y/1(x2 a(r ∑ v+ pg 1+{yz/1(x) al g(T ∑ D r-(+7)·xz log ) 1+[v/(x) lC 00l01 (1+7)r(1 (x2) 00 (n1)∑ r(+7)r(u) +o(i). log log1+ u(a aa aT T'U+T I(T) o(ai exp(Tl log1+ 0. U71b7 T(+7)T(T) 其中,k∈{1,…,s},r∈{1,……,t};xk表示式(14)中第i个观测对象的第k个协变量;x表示式(15)中 第i个观测对象的第r个协变量 本文采用 Nelder-Mead优化算法求解参数的极大似然估计值22.在极大似然什计过程中,参数估计结 果对初值的依赖很强,选择不当的初值可能导致参数佔计结果为局部最优·.为了得到全局最优的参数佔计值, 本文釆取如下方法选择初值: 第1步(=(1U…∪(n2 第2步(61,…,6mn)∈θs,1<8≤m 第3步Oo= arginase,ce{ arginase, ee,[(O)} 第一步,将参数θ的取值区域θ划分为m个区域;第二步,在每个区域中随机生成m。个元素(θ1,…,Bm); 第三步,遍历各区域、各元索,选取使得【(θ)达到最大的值,即为我们最终赋给 Nelde-Mead优化算法的初 值 2.4非寿险未决赔款准备金评估 非寿险未决賠款准备金评估通常使用增量赔款或累积赔款的流量三角形数据.增量赔款的流量三角形 数据格式如表1所示.将每个事故年的增量赔款按照进展年的顺序逐年累加,即可得到每个事故年的累积赔 款数据 表1增量赔款的流量三角形 进展年 事故年 J-1,J k !/k,J+1-k yK 在表1中,3表示事故年k发生的赔案在第j个进展年的增量赌款;第k行表示发生在事故年k的 增量赔款:第j列表示在进展年j的增量赔款.用K和J分别表示事故年和进展年的总数,通常情况下 K=J.已经支付的增量赔款数据是已知的,可以记为 D={kk+j≤K+1 尚未支付的增量赔款数据是未知的,可以记为 {yk;|K+1<k+j≤2K} 未决赔款准备金评估的核心工作就是用上三角的已付增量赔款数据来预测下三角的未付增量赔款 第3期 孟生旺,等:基于参数化分位回归模型的非寿险准备金评估 为了简化表述,下面用σ表示流量三角形中的未付增量赔款数据,用;表示相应的解释变量.流量三 角形中的解释变量主要包括进展年和事故年,它们都是分类变量 若将GB2分位回归模型中的参数估计值记为9=(a0,01,…,as,3n,B1,…,B,D,),则对于给定的分 位数水平U,流量三角形中第i个未付增量赔款的预测值可以表示为 (|,分 (x; a(x:)>0 Q:(u,0,D,合,x;)= 1+FBeta(ulv,T (e FBeta (l-u l ,(x)<0 本文采用下述随机模拟的方法计算未决赔款准备金的75%分位数 1)根据参数的极大似然估计值6=(a0,a1 A,1,…,A,D,分),求得下三角各元素的分布GB2n、(y 2)用下三角中每个元素的分布GB2n(y1,,,),模拟该元素对应位置上的未决赔款 3)将下三角的未决赔款模拟值相加,即得未决赔款准备金的一次随机模拟值 4)将上述步骤重复5000次,即可得到未决赔款准备佥的5000次随机模拟值,并由此可以求得未决赔款 准备金的75%分位数为221396. 准备金的分位数预测值的标准误可以用式(18)进行估计14 x(/2() T (18 00 其中,T表示矩阵的转置;θ=(a0,a1,…,as,,n,…,A,v,T)表示分位回归模型的参数;Q(u)/00表示 分位数预测值关于模型参数求偏导;工(0)是关于模型参数θ的 Fisher信息矩阵;-1(6)表示 Fisher信息 矩阵的逆.根据 Fisher信息矩阵的定义,工(6)的第行j列元素为 021 L 其中,63和03分别为参数6的第个和j个元素; Fisher信息矩阵了()的维度为(s+t+4)×(s+t+4) 同时将式(16)、(17)代入式(18),对Q(u)关于参数6求偏导有 0Q(n)00(n)Q()0(n)0(n),a?(a)a( 06 aco aak 00 0 将参数的极大似然估计值b=(a0,a1,…,as,B0,31…,Bn,i,)代入式(18),即可得到未决赔款准备金 预测值Q(u|p,a,D,,m)的标准误 3实例分析 31数据描述 表2给出了本文中涉及的流量三角形増量赔款数据.本文的数据来自以色列某保险公司1978至1995年 增量索赔数据.关于概述的进一步描述,可参见Chan等或Dong等5.23.其中,上三角有171个已知的观测 值,表示已付增量赔款.为了便于计算,这里我们沿用文献15]的做法,将原始数据中两个赔款金额为0的数 据替换成了0.01.已知增量赔款数据的均值、中位数、标准差、偏度、峰度分别为:4459.74、3871.00、3472.64、 0.57、-0.41 图3给出了不同事故年、进展伻的増量赔款及其变化趋势.结合表2中的实际数据不难发现,该流量三 角形中的増量赔款数据存在一些异常值譬如,从图3的左图中,可以发现第7个事故年和第7个进展年对 应的增量赔款为11920,第15个事故年和第4个进展年对应的增量赔款为15546,明显偏大 观察数据中的异常值可能增大模型参数的估计误差,导致准备金的预测结果出现偏差,因此,在痄备金 评估中.选择稳健的估计方法显得尤为重要.与通常使用的广义线性模型相比,分位回归模型不易受到异常 值的影响.所以本文使用GB2分位回归模型估计未决赔款准备金及其风险边际,并与GB2分布假设下的均 值回归模型进行比较 610 系统工程理论与实践 第38卷 表2增量赔款数据 事故年 进展年 3 789101112131415161718 133238332957210172763138553252443321883331996923110.014052937614 237851034283078492839357714041721106515635259250420610 31677998987461022885725787385514151612626117258943817337031 452888089128391182975606383411830161575198526452663845115 5229498691024213808877554192424159741491296917295428359 63600751482479327858442454096321620145931188691368 736427394983897336377488411920418844921760944921 8 24635033698077226702783455793622130030691370 9226759596175705181026339697843963107903 02009370052986885647775705855575|3871 1118605282364075385157576668622572 122313517531060661014992655262 1323144487411270001116310057 1426073952822878959317 1525955403657915546 16315549747961 1726265704 182827 1357911131517 1357911131517 进展年 事故年 图3增量赔款随着事故年和进展年的变化趋势 3.2模型建立 对于表Σ中的增量赔款数据,可以应用各种损失分布进行拟合.表3比较了几种常见分布的拟合优度 其中,AIC、 G. deviance、SBC和 P deviance都是进行模型比较的信息量准则,这些统计量的值越小,表示 相应的模型越好24.从表3可以看出,(B2分布的拟合效果明显优于其它分布,为此,下面将主要探讨基于 HB2分布的参数化分位凹归模型,并将其应用于未决赔款准备金及其风险边际的预测 表3不同分布的拟合优度比较 分布 AlC G deviance SBC P deviance 指数分布52150.1 55.2 50.1 伽玛分布 478 43.8 54. 43.8 对数正态分布1873183.3 193.6 183.3 威布尔分布 53.3 49.3 59.6 493 GB2分布 0 20.6 注:为了便于比较,表3中的每个数值都减去了它们的最小值(3165.7) 基于GB2分布建立了下述5个预测模型: 模型1E(Y)=exp(a;+月). 该模型是在GB2分布假设下的均值回归模型,仅在GB2分布的均值配(Yx)中引入事故年和进展年作 为解释变量,其中Y表示第讠个事故年和第j个进展年对应的增量赔款,a;表示第讠个事故年的效应,月 第3期 孟生旺,等:基于参数化分位回归模型的非寿险准备金评估 611 表示第j个进展年的效应 模型2p41=exp(z+6) 该模型是在GB2分布假设下的分位回归模型,但仅在尺度参数μ中引入事故年和垯展年作为解释变量. 模型3;4x=exp(a;+月),Oi=%+T 该模型是在GB2分布假设下的分位回归模型,在尺度参数和形状参数a中同时引入事故年和进年 作为解释变量.其中,a;和a;分别表示事故年和进展年在尺度参数中的效应,和分别表示事故年和进 展年在形状参数中的效应 模型4p2;=exp(az+月),x=T; 该模型是在GB2分布假设下的分位回归模型,在尺度参数中引入事故年和进展年作为解释变量,在 形状参数σ中引入进展年作为解释变量 模型5p=CxP(a1+月),Oiy= 该模型是在GB2分布假设下的分位回归模型,在尺度参数u中引入事故年和进展年作为解释变量,在 形状参数σ中引入事故年作为解释变量.在对尺度参数μ和形状参数σ引入解释变量时根据排列组合法, 还应存在别的类型的模型,由于不影响最终的结论,这里我们就不一一穷举各类型模型. 表4不同樸型的拟合效果比较 模型1模型2模型3模型4模型5 WAIC 2965.15 2964.19 3122.57 295887 2985.73 P WAIC 26.85 26.11 69.45 86.85 LPPD 1455.73-1455.98-1402.03-1409.981406.01 P WAIC_1 19.87 19.44 125.83 62.41 73.53 在表4中,WAC称为广泛适用的信息准则,与ALC和D类似,是对模型拟合效果和复杂程度进行综 合评价的统计指标,该统计量的值越小,表示相应的模型越好. P WAIC和 P WALO_1是对模型有效参数个 数的两种估计结果,反映模型的复杂程度;LPPD是对数似然函数的值,反映模型的拟合效果,其值越大,拟 合效果理想.关于WAIC、PWAC、PWAC1和LPPD的定义及其统计性质,可参见文献[25] 首先,匕较统计量LPPD可知,模型3、模型4、模型5拟合效果相对较奷,且模型3、模型4、模型5 三者之间的LPPD比较接近,没有明显差別.其次,比较模型的复杂程度 P WAIC和 P WAIC-两个统计 量,模型4明显小亍模型3、模型5.最后,通过比较模型拟合效果和复杂程度的综合评价WAIC统计量可 知,模型4的wAIC最小,相对拟合效果最理想.综上述,我们最终采用模型4对GB2分布中的尺度参数μ 引入事故年和进展年作为解释变量,而对形状参数a引入进展年作为解释变量.结合图3可知,索赔数据的 中心化趋势受事故年和进展年的影响;相对于事故年因素的影响.进展年因素对素赔数据的变化程度的影响 更明显.数据自身呈现的这一特点,和模型4是相吻合的 33结果分析 基于2.3节的分析结果,夲节主要应用模型4对表2中的数据走行实证分析.在保险公司的偿付能力管 理中,通常使用准备金的75%分位数作为计算准备金风险边际的依据.基于GB2分位回归模型,很容易求 得准备金的75%分位数.譬如,在本例中,应用GB2分位回归模型对各个事故年累计赔款的75%分位数的 预测值如图4所示.在该图中,每一条曲线表示一个事故年的累计赔款的75%分位数,该曲线随着进展年的 增加而增加,到达最后一个进展年时,就得到了最终赔款的75%分位数 图5给出∫各个事故年截上最近一个进展年的累计赔款观察值,以及应用GB2分位回归求得的75% 分位数预测值.其中,深色部分最高值代表实际累计赔款额;浅色部分最高值代表模型的理论预测值.从图 5可以看出,除了第12个事枚年外,其它事故年的累计赌款的75%分位数预测值均大于它们的实际观察值, 且所有事故年累计赔款的75%分位数预测值之和大于累计赔款的观察值之和这表明,使用准备金预测值的 75%分位数计算风险边际,足以覆盖实际赔款的随机波动. 表5在不同的分位数水平下,计算了各个事故年的准备金预测值及其总和.在50%分位数水平下的预 测值类似于传统广义线性模型的预测值,可以作为准备金的点估计值使用,而在其它较高分位数水平下的预 612 系统工程理论与实践 第38卷 测值都大于50%分位数水平下的预测值,超过部分就是所谓的风险边际.在75%分位数水平下计算的风险 边际如表5的最后一栏所示,从各个事故年来看,准备金关于分位水平呈现单调递增的规律,和前文中得到 的关于参数化分位回归具有分位线非交叉的结论是相符的 e1-1 ■一■一■一■一■一■ 分5晋14 停=影三得≡母≡寻=哥=导=器=== 糕目 事故年 图4各个事故年在不同进展年的累计赔款 囗累计赔款预测值目累计賠款观测值 图5累计赔款的观察值及其75%分位数预测值 表5准备金及其风险边际的预测值 事故年 分位数水平 50 55% 60% 65 70% 75% 风险边际 63874 72565 2100605106671113044120086128425139098 157747167257177251 188291 201368218102 224309237833252043 86337310132 85823 300127318222337235358241383120414959114832 352980374262396623 421328 450589 488034 135054 411103435889461932490705 524784 568395157292 454164481546510317542104579752627931173767 501989532254564055 599190 640803 694055 192066 0 5404.35730860725 645080 689880 747211 206776 582050617142654015694753743002804748 222698 12616201653352692388735517786597851965235764 13655861695403736952 782856 837224 906799 250939 14700010742214786560 835554 893581 967841 267831 15 786194833594883399 938426 10035981086999300806 16 829817879848932417 990496 10592841147314317496 17877727930646986250104768311204421213554335827 18 9251459809221039530110428211809721279114353970 合计90733079620345101951391083018811582321125448453471537

...展开详情
试读 12P 论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
weixin_38743506 欢迎大家使用并留下宝贵意见
2019-09-20
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

    成功上传501个资源即可获取
关注 私信
上传资源赚积分or赚钱
    最新推荐
    论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf 10积分/C币 立即下载
    1/12
    论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf第1页
    论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf第2页
    论文研究-基于参数化分位回归模型的非寿险准备金评估.pdf第3页

    试读结束, 可继续读1页

    10积分/C币 立即下载 >