广义线性模型及其在汽车保险定价中的应用(136页)PPT.rar
已下载:3 次 是否免费: 否 上传时间:2015-03-09
主要内容
1 GLM 基本理论简介
2 模拟数据的建模分析
2.1 索赔频率模型
2.2 索赔强度模型
2.3 纯保费模型
3 应用案例:车损险数据
GLM 基本理论简介
线性回归模型:
分布假设:正态分布
方差:常数
连接函数:恒等
广义线性模型:
分布假设:指数分布族
方差:可变
连接函数:log,logit,……
指数分布族的密度函数:
均值和方差分别为:
指数分布族的性质:关于数据合并是封闭的。如果两个风险类别 Y1 和 Y2 的均值相同,离散参数也相同,权重分别为 w1 和 w2,则它们的加权平均值Y=(w1*Y1+w2*Y2)/(w1+w2)仍然服从原指数分布族,权重为 w1+w2。
车险定价中常用的指数分布族(Tweedie 分布类):
方差函数:
正态分布: p = 0
泊松分布: p = 1
伽马分布: p = 2
逆高斯分布: p = 3
复合泊松分布: 1 < p < 2 (狭义的 Tweedie 分布),是一种混合型分布(离散 + 连续)
注:0 < p < 1 不存在分布,其他情况都有对应的分布,但应用较少。
Tweedie 分布类的性质:关于尺度变换是封闭的,即如果Y 服从某个 Tweeedie 分布类,则 cY 也服从同一个 Tweedie分布类(c 是正常数) 。
例:索赔强度模型可以使用不同的货币单位。
索赔频率模型可以使用不同的风险单位(如车年,车月) 。
泊松分布的生成机理(满足下述 3 条性质的分布是泊松分布) :
发生一次索赔的概率与时间区间的长度近似成正比,即近似为t ??。
(2) 在很小的时间区间发生两次及其以上索赔的概率几乎为零。
(3) 在不相交的两个时间区间发生的索赔次数相互独立。
泊松分布的性质:
泊松分布的应用:
(1) 描述个体保单的索赔次数。
(2) 描述同质性保单组合中随机个体保单的索赔次数。
例: 假设每份保单的索赔次数服从参数为 0.4 的泊松分布, 则从 100份同质性保单组合中随机抽取一份保单的索赔次数仍然服从参数为 0.4 的泊松分布。即任意一份个体保单的索赔次数分布为: