R 语言数据分析及绘图代码
1 线性回归分析
回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,
其值通过实验收集。 另一个变量称为响应变量,其值来自预测变量。
在线性回归中,这两个变量通过一个等式相关联,其中这两个变量的指数(幂)是 1。数学上,当绘制为图形
时,线性关系表示直线。任何变量的指数不等于 1 的非线性关系产生曲线。
线性回归的一般数学方程为 -
y = ax + b
以下是使用的参数的描述 -
y - 是响应变量。
x - 是预测变量。
a 和 b - 叫作系数的常数。
一、建立回归的步骤
一个简单的线性回归例子:是否能根据一个人的已知身高来预测人的体重。要做到这一点,我们需要有一
个人的身高和体重之间的关系。
创建线性回归关系的步骤是 -
进行收集高度和相应重量观测值样本的实验。
使用 R 中的 lm()函数创建关系模型。
从所创建的模型中找到系数,并使用这些系数创建数学方程。
获取关系模型的摘要,以了解预测中的平均误差(也称为残差)。
为了预测新人的体重,请使用 R 中的 predict()函数。
输入数据样本
以下是表示观察结果的样本数据 -
# Values of height151, 174, 138, 186, 128, 136, 179, 163, 152, 131
# Values of weight.63, 81, 56, 91, 47, 57, 76, 72, 62, 48
二、lm()函数
该 lm()函数创建预测变量与响应变量之间的关系模型。
语法
线性回归中 lm()函数的基本语法是 -
lm(formula,data)
评论0