没有合适的资源?快使用搜索试试~ 我知道了~
Logistic模型及建模作业流程概述.doc
0 下载量 50 浏览量
2022-11-23
23:23:22
上传
评论
收藏 579KB DOC 举报
温馨提示
试读
11页
Logistic模型及建模作业流程概述.doc
资源推荐
资源详情
资源评论
Logistic 模型及建模步骤概述
1. Logistic 模型介绍
1.1 问题提出
在商业及金融领域中,存在这么一类问题,问题中需要被解释目标量通常能够用 YES
或 NO 两种取值来表示,如:
卖出了商品为 YES,未卖出商品为 NO;
用户对超市此次宣传活动做了响应为 YES,没有任何响应为 NO;
信用卡持卡人本月逾期付款为 YES,按时还款了为 NO;
等等;
对于这类问题分析,我们不能够采取标准线性回归对其进行建模分析,是因为
目标变量二元分布违反了线性回归关键假设
模型目标是给出一个(0,1)之间概率,而标准线性回归模型产生值是在这个范围
之外
1.2 Logistic 模型
对于上述问题,我们提出了 logistic 模型:
�
��
�
i
ii
x
P
P
��
)
1
ln(
�
�
�
�
i
ii
x
e
P
P
��
1
�
�
�
�
�
�
i
ii
i
ii
x
x
e
e
P
��
��
1
Logistic 模型能够确保:
i
x
值在- ¥和+ ¥之间;
估量出来概率值在 0 和 1 之间;
和事件 odds(
)1/( ppodds ��
)直接相关;
能够很好地将问题转化为数学问题,而且模型结果轻易解释;
1.3 Logistics 回归假设
概率是自变量 logistics 函数
这么得到概率似乎没有实际意义,只是反应一个趋势,
xx
n
���
������
110
比较大
时 p 就会比较大
取 log 值得到:
logodds
这么能够线性化,我们把这模型称为‘linear in the log-odds’
模型假设:
1) 没相关键变量被忽略,不包含使得系数有偏相关变量
2) 不包含外来变量,包含不相关变量会增加参数估量标准误差,不过却不会使得
系数有偏。
观察值独立
自变量观察值没有误差
1.4 最大似然准则
抛一枚硬币 10 次,结果以下: T H T T T H T T T H
假设结果 独 立 , 考 虑 得 到 结 果 概 率 , P(T H T T T H T T T H) =
P(T)P(H)P(T)P(T)P(T)P(H)P(T)P(T)P(T)P(H)=P(H)3 [1-P(H)]
7
,假如我们能计算出参数 P(H)
值,就能得到掷硬币结果概率数值。
假如我们已知掷硬币结果,怎样得到 P(H)值呢?
)exp(1
)exp(
110
110
nn
nn
xx
xx
p
���
���
�������
������
�
nn
xx
p
p
���
�������
�
�
�
�
�
�
�
�
�
110
1
log
假设 P=P(H),y=硬币头像一面朝上次数,n=掷硬币次数
似然函数给出了掷硬币结果似然值,它是 P 函数;
最大似然估量指出 P 最好估量值是使得似然函数最大值。
为了简化计算,替换最大化 L(P),我们对 L(P)取 log 值,然后取最大值,log 是单调递
增函数,这么使得 L(P)最大 P 值也是使得 log(L(P))最大值。
最大化 log 似然函数,使:
解出 P 值:
1.5 将最大似然估量用于 logistics 回归
令 Y=(y
1
,y
2
,y
3
,…,y
n
)是随机变量(Y
1
,Y
2
,Y
3
,…..Y
n
)一组样本值,
然 后 似 然 函 数 能 够 写 成
�
�
�
��
n
i
y
i
y
i
ii
YL
1
1
)1()(
��
where
iI
YP
�
�� )1(
,不过假如样本值不独立话,此步骤就存在问
题。
对似然函数取 log 值,得:
�
�
�
��
n
i
y
i
y
i
ii
Yl
1
1
))1(log()(
��
�
�
�
�
�
n
i
i
y
i
y
i
i
i
1
))1(
)1(
log(
�
�
�
yny
PPyPL
�
�� )1()|(
yny
PPYPL
�
�� )1()|(
n
y
P �
ˆ
剩余10页未读,继续阅读
资源评论
zzzzl333
- 粉丝: 676
- 资源: 7万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功