R 语言数据分析案例
在 R 语言中,数据分析是一个广泛且多样的领域,涵盖了数据清洗、探索性数据分析、可视
化、统计建模和预测等各个方面。
案例一,该案例涉及读取数据、数据清洗、探索性数据分析(EDA)和数据可视化。
1. 数据准备
假设我们有一个关于汽车数据集(例如 mtcars 数据集,它是 R 语言内置的一个小型数据集),
我们将使用它来进行数据分析。
2. 数据读取与加载
对于 mtcars 数据集,我们不需要额外读取,因为它已经内置在 R 中了。但如果你有一个外
部数据集(如 CSV 文件),你可以使用 read.csv()函数来读取它。
r
# 直接使用内置的 mtcars 数据集
data <- mtcars
3. 数据清洗
在这个简单的案例中,我们不需要进行复杂的数据清洗,但通常这可能包括处理缺失值、异
常值、数据转换等。
4. 探索性数据分析(EDA)
我们将进行一些基本的 EDA,例如查看数据集的前几行、总结性统计量、数据分布等。
r
# 查看数据集的前几行
head(data)
# 查看数据集的维度
dim(data)
# 计算各列的均值、标准差等
summary(data)
# 绘制 mpg(每加仑英里数)的直方图
hist(data$mpg, main = "Histogram of MPG", xlab = "Miles per Gallon")
# 绘制 mpg 与 hp(马力)的散点图
plot(data$mpg, data$hp, main = "MPG vs Horsepower", xlab = "Miles per Gallon", ylab =
"Horsepower")
5. 数据可视化(进阶)