机器学习项目设计报告
设
计
题
目
:
多
元
线
性
回
归
——
信
用
卡
客
户
价
值
预
测
学
生
信
息
:
软
工
206
雷
德
友
2000770017
软
工
206
彭
煜
2000770113
软
工
201
杨林
2000770143
编
写
日
期
:
2022.6.20
一、背景
这里以信用卡客户的客户价值为例来解释客户价值预测的具体含义:
客户价值预测就是指预测客户在未来一段时间内能带来多少利润,其利润可能来自信用卡的年费、取现手续费、分期
手续费、境外交易手续费等。分析出客户价值后,在进行营销、电话接听、催收、产品咨询等各项业务时,就可以针
对高价值客户提供区别于普通客户的服务,以进一步挖掘这些高价值客户的价值,并提高他们的忠诚度。
二、研究问题
该题用于进行多元线性回归分析,以研究客户价值与历史贷款金额、贷款次数、学历、月收入和性别之间的关系。通
过构建回归模型,预测和评估客户价值。
三、采用的技术路线
代码使用了Python编程语言,并借助一些常用的数据处理和分析库,如:
四、设计方案
(
1
)
pandas
(
读
取
的
Excel
文
件
数
据
,
用
于
数
据
处
理
和
分
析
)
(
2
)
matplotlib
(
绘
制
数
据
可
视
化
图
形
,
例
如
折
线
图
、
散
点
图
等
)
(
3
)
statsmodels
(
用
于
执
行
统
计
模
型
的
拟
合和
推
断
,
包
括
回
归
分
析
、
时
间
序
列分
析
等
)
。
(
4
)
scikit-learn
库
中
的
LinearRegression
模
型
进
行
线
性
回
归建
模
和
预
测
。
1
2
3
4
(
1
)
代
码
通过
pd.read_excel()
函
数
读
取
Excel
文
件
中
的
数
据
,
并
进
行
数
据
处
理
。
(
2
)
将
所
有
数
据
随
机
分割出
20%
,
用
于
模
型
的
预
测
数
据
。
(
3
)
从
所
有
数
据
中
选
取
特
定
的
列
作
为
自
变
量
和
因
变
量
,
分别
存
储
在
X
和
Y
变
量
中
。
(
4
)
利
用
数
据
进
行
多
元
线
性
回
归
模
型
的
拟
合
,
得
到
回
归
模
型
。
(
5
)
使
用
拟
合
的
模
型
对
自
变
量
进
行
预
测
,
并
绘
制
真
实
值
和
预
测
值
的
散
点
图
。
(
6
)
计
算
回
归
模
型
的
系
数
和
常
数
项
,
并
构
造
多
元
线
性
回
归
方
程
的
表
达
式
。
1
2
3
4
5
6