广义线性模型:发展与应用(40页)PPT.rar
已下载:0 次 是否免费: 否 上传时间:2012-01-04
主要内容
基本的广义线性模型:理论与应用
模型评价
费率约束
广义线性模型的推广与应用
分布假设的推广
GAM与GAMLSS(GAM for Location, Scale and Shape)
神经网络与回归树
应用案例
基本GLM:理论与应用
分布假设:
正态
泊松、负二项:索赔频率
伽马、逆高斯:索赔强度
Tweedie:纯保费
二项:续保率
连接函数:
恒等:加法模型
对数:乘法模型,预测值大于零
logit:预测值在(0,1)区间
Tweedie、泊松和伽马的比较:
Tweedie:
泊松:p=1
伽马:p=2
参数估计:
b 极大似然估计(迭代加权最小二乘估计)。
离散参数f:矩估计还是极大似然估计?
模型评价1:偏差
近似服从自由度为n - p的卡方分布。除泊松外,效果不是很好。
对于嵌套模型,偏差之差近似服从 p - q 的卡方分布,近似效果较好。
注:有时(如SAS)称fD为偏差,称D为尺度偏差。
固定参数f,极大化似然函数等价于最小化偏差函数。
模型评价2:残差
Pearson残差
Anscobe残差
Deviance残差:
若分布假设是合理的,标准化处理后近似服从标准正态分布(下页图示)。
若偏差di的绝对值大于1,说明对这个观察值的拟合效果较差。