R 数据分析:如何简洁高效地展示统计结果
之前给大家写过一篇数据清洗的文章,解决的问题是你拿到原始数据后如何快速地对数据
进行处理,处理到你基本上可以拿来分析的地步,其中介绍了如何选变量如何筛选个案,变
量重新编码,如何去重,如何替换缺失值,如何计算变量等等------R 数据分析:数据清洗的
思路和核心函数介绍
今天呢,就更进一步,对于一个处理好的数据,我们就可以进行统计分析了,本文的思路
就是对照期刊论文的一般流程写写如何快速的实现一篇论文的统计过程并简洁高效地展示
结果。依然提醒大家,请先收藏本文再往下读哈。
先做描述统计
基本上文章结果部分一上来首先展示的就是描述统计,就是你有多少样本,样本特征是啥
样的----连续变量的均值标准差是多少,分类变量的频数百分比是多少等等,这些都是描述
统计
做法 1:
比如我现在拿到手的处理好的数据是这样:
图 1
比如我想看看男女之间它们每个变量的均值是多少,我就可以写出如下代码:
data %>%
group_by(gend.f) %>%
summarize(mean_figures=mean(figures),
mean_cards=mean(cards),
mean_words=mean(wordlist))
运行之后可以看到输出中就按照性别输出了三个变量的均值。
评论0
最新资源