install.packages("psych")
install.packages("corrplot")
library(psych)
library(corrplot)
library(ggplot2)
setwd("D:/新建文件夹/大数据班/[探索性数据分析]第三讲 课件+作业")
getwd()
data=read.csv("D:/新建文件夹/大数据班/2017《大数据统计基础》考试题/手机问卷数据.csv")
mydata=data[,-c(1:2)]
mydata1=mydata[,-c(23:32)]
head(mydata1)
#描述分析
summary(mydata)
mydata2=mydata[-c(107:424),]
hist(mydata2$q29,col="yellow",xlab=" ",ylab="年龄频率",main=" ")
hist(mydata2$q30,col="pink",xlab=" ",ylab="专业频率",main=" ")
hist(mydata2$q31,col="lightblue",xlab=" ",ylab="学历频率",main=" ")
#因子分析
#第一步:绘制碎石图
par(mfrow=c(1,1))
fa.parallel(mydata1,fa="fa",main="碎石图")
#根据碎石图,提取3个主因子合适。理由:前3个主因子的特征根大于平行分析(红色虚线)结果
#第二步:估计因子载荷、因子得分
#第1次尝试
fa1=fa(mydata1,nfactors=4,rotate="none",fm="pa")#不进行因子旋转,因子提取方法设为主成分法
fa1#输出因子分析估计结果。
#结果不理想,因子含义不明确,应进行因子旋转。
#第2次尝试
fa2=fa(mydata1,nfactors=4,rotate="varimax",fm="pa")#进行因子旋转(旋转方法为“varimax”,因子提取方法设为主成分法
fa2#输出因子分析估计结果
#结果显示:前3个因子的累计贡献率为55%
#第三步:查看因子得分及其权重系数
head(fa2$scores)#因子得分
fa2$weights#因子得分的权重系数
fa2$scores
#第四步:画出各品牌因子得分统计图
#将四个品牌对应的因子得分写入原始数据
data[,35]=fa2$scores[,1]
data[,36]=fa2$scores[,4]
data[,37]=fa2$scores[,2]
data[,38]=fa2$scores[,3]
names(data)[35:38]=c("用户体验","性价比","具象象征","抽象象征")
p1=ggplot(data,aes(data$brand,data$用户体验))+geom_boxplot(fill="yellow")
p1
p2=ggplot(data,aes(data$brand,data$性价比))+geom_boxplot(fill="red")
p2
p3=ggplot(data,aes(data$brand,data$具象象征))+geom_boxplot(fill="green")
p3
p4=ggplot(data,aes(data$brand,data$抽象象征))+geom_boxplot(fill="blue")
p4
##回归分析
aver1=(data$q23+data$q24+data$q25)/3
data[,39]=aver1
aver2=(data$q26+data$q27+data$q28)/3
data[,40]=aver2
names(data)[39:40]=c("满意度均值","忠实度均值")
par(mfrow=c(2,2))
plot(data$用户体验,data$满意度均值)
abline(lm(data$满意度均值~data$抽象象征))
plot(data$性价比,data$满意度均值)
abline(lm(data$满意度均值~data$抽象象征))
plot(data$具象象征,data$满意度均值)
abline(lm(data$满意度均值~data$抽象象征))
plot(data$抽象象征,data$满意度均值)
abline(lm(data$满意度均值~data$抽象象征))
plot(data$用户体验,data$忠实度均值)
abline(lm(data$忠实度均值~data$抽象象征))
plot(data$性价比,data$忠实度均值)
abline(lm(data$忠实度均值~data$抽象象征))
plot(data$具象象征,data$忠实度均值)
abline(lm(data$忠实度均值~data$抽象象征))
plot(data$抽象象征,data$忠实度均值)
abline(lm(data$忠实度均值~data$抽象象征))
##可见线性关系明显
lm.test1=lm(data$满意度均值~data$用户体验+data$性价比+data$具象象征+data$抽象象征,data=data)
summary(lm.test1)
lm.test2=lm(data$忠实度均值~data$用户体验+data$性价比+data$具象象征+data$抽象象征,data=data)
summary(lm.test2)
tansuo.rar_R language_R因子分析_meanzco_数据分析 R_问卷数据
版权申诉
121 浏览量
2022-09-23
03:22:53
上传
评论
收藏 1KB RAR 举报
alvarocfc
- 粉丝: 109
- 资源: 1万+
最新资源
- 简单的Python示例,演示了如何使用TCP/IP协议进行基本的客户端和服务器通信
- 考试.sql
- keil2 + proteus + 8051.exe
- 1961ee27df03bd4595d28e24b00dde4e_744c805f7e4fb4d40fa3f695bfbab035_8(1).c
- mediapipe-0.9.0.1-cp37-cp37m-win-amd64.whl.zip
- windows注册表编辑工具
- mediapipe-0.9.0.1-cp37-cp37m-win-amd64.whl.zip
- 校园通行码预约管理系统20240522075502
- 车类型数据集6250张VOC+YOLO格式.zip
- The PyTorch implementation of STGCN.STGCN-main.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈