没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
序:
这篇文档内容的来源多样,既有来自于 R 官方文档(包括 R intro,R data,R admin),也有来
自于互联网的 contributed documents;还有若干来自于 Capital Of Statistics 论坛的讨论问题。
本文档的目的是为具有一定统计(数学)背景的 R 软件初学者提供一个快速认识 R 软件的平
台,如果你无此背景,可能会对其中的若干表达存在疑问。这篇文档重点不在统计方法上,因此所
列问题不可能详尽到统计学的每个知识点。
R 是一个很庞大的体系,在 CRAN 的 Task Views 上可以清楚地看到贝叶斯推断、聚类分析、
机器学习、空间统计、稳健统计等方法的介绍。而这些方法又通过相应的 R Packages 扩展,可以说
学习 R 是一件没有尽头的事情。
如果你的英文阅读没问题,那么精读一本关于 R 的原版书籍也是一个不错的选择,但这个开
头常常让人很头痛。希望这份 37 页的文档,对你认识、学习 R 是个不错的帮助。
§A 前言
1. R 是做什么的?
R 是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的 Ross Ihaka 和
Robert Gentleman 共同创立。由于 R 受 Becker, Chambers & Wilks 创立的 S 和 Sussman 的 Scheme
两种语言的影响,所以 R 看起来和 S 语言非常相似。
2. 在哪里可以下载 R 的安装程序
在 R 的官方网址上,选择网站镜像 http://cran.r-project.org/mirrors.html,比如 UC
Berkeley 下载软件副本。R 拥有在 Linux,MacOS X,Windows 平台下的各个版本,如果是 Windows
用户,进入镜像网站,选择 Windows (95 and later) ,进入 base,下载 R-x.x.x-win32.exe。
3. 为什么 R 叫做 R
部分是因为两位 R 的作者 (Robert Gentleman 和 Ross Ihaka) 的姓名,部分是受到了贝尔实验室 S
语言的影响(称其为 S 语言的方言)。
4. CRAN 是什么意思?
CRAN 是 C omprehensive R Archive N etwork 的简写,是拥有同一资料,包括 R 的发布版本,包,
文档和源代码的网络集合。
5. 我是新手,我如何开始学习 R
R 的官方网页拥有大量英文学习资源,还可以参考 http://cran.r-project.org/other-docs.
html 上的中文翻译文档。统计之都 bbs 是一个不错的学习 R 的中文网站,这个论坛上你可以找到
大量学习资料或直接提出问题同大家探讨。
6. 初学者阅读 R 自行安装的 R-intro 就可以了么?
R-intro 确实是官方文档中最基础的,但它不是从 R 软件应用角度讲的,故并不适合于 R 初学者。
可以参考 R-intro 中数据类型、结构部分,作为基础学习。
7. 能列举一些 R 的经典书目么?
正如大家应用 R 的过程中看到,大部分经典的 R 书籍都为英文:
Modern Applied Statistics with S(Venables and Ripley)
The New S Language: A Programming Environment for Data Analysis and Graphics
—(Richard A. Becker,John M. Chambers,Allan R.Wilks)
A Handbook of Statistical Analysis Using R(Brian S. Everitt,Torsten Hothorn)
Data Analysis and Graphics using R(Maindonald and Braun)
Introductory Statistics with R(Dalgaard)
8. R 需要编程么?
2
不!大多数时候不需要,因为 R 有很多函数和包,而且每天都在增加,你用的一般方法和函数都可
以在 R 自带包中找到。
9. 能否简单举一个 R 的例子?
生成 100 个高斯(正态)分布随机数,并对这 100 个数进行特征描述。
1 x <− rnorm ( 100 , mean = 5 , sd = 0 . 1 )
me an ( x )
3 sd (x )
summary ( x )
当然你还可以使用 demo()函数,比如 R 漂亮的图形演示:
de mo ( g r a ph i c s )
10. R 需要注册费用么?
不需要!R 是一款在 GNU General Public License (GPL) 下发布的开源软件,只是很少一部分包不
能用于商业用途。不知道为什么有些费时、费力且价格不菲的商业统计软件,居然还在生存?
11. 为什么 R 不能使用超过 50% 的 CPU?
这是 Windows 下任务管理器的误导,它将多个 CPU 看作是单个 CPU,同时计算使用比例。而 R
是单线程计算软件,它不能同时使用 2 个以上的 CPU。当你的计算机应用的是双核技术,你会发
现 CPU 应用会定格在 50% 上。
12. 如何在发行出版物里引用 R
如果你是 L
A
T
E
X 用户,可以在 R 中使用命令 citation() 得到可供 BibT
E
X 使用的内容;或者是某一
个包的引用
1 c i t a t i o n ( package = ’package’ )
§B 基础知识
13. 如何获得帮助?
R 的帮助系统非常强大,可以直接使用 “?topic” 或 help(topic) 来获取 topic 的帮助信息;也可使用
help.search(”topic”) 来搜索帮助系统。
如果你只知道函数的部分名称,那么可以使用 apropos(”tab”) 来搜索得到载入内存所有包含
tab 字段的函数。
如果还没有得到需要的资料,还有 R Site Search:http://finzi.psych.upenn.edu/search.
html,等价于在 R 平台上使用 RSiteSearch() 函数。
14. R 可使用的最大内存是多少?
3
R 经常因为过分消耗内存而受到指责,而事实也确是如此。不过还好,我们使用的数据量通常不是
很大,通常 R 都可以处理。特定条件下我们可能需要更大的内存来做运算,提供两种途径来设定
(增大)内存:
• 启动 R 进程前,增加 R 启动参数。在 CMD 环境下,运行增加参数的 Rterm:
1 r −−max−mem−s i z e =1Gb
或通过添加 RHOME/bin 至系统环境中,直接在 “运行” 中运行
2
1 r gu i −−max−mem−s i z e =1Gb
• 启动 R 进程后,通过 memory.limit 函数增大 R 进程的内存限制。
R 的工作内存大小的设定值为 32Mb 到 3Gb 间的任意数值。但需要提示的是:Windows 平台可用
最大有效内存为 2Gb,也就是说,实际上 R 的工作内存区间为 32Mb 至 2Gb。
15. 为什么 help.search() 搜索不能使用?
基于浏览器的搜索引擎要求正确安装完整版 Java,且 Java 和 Javascript 须嵌入浏览器。
16. R 支持中文么?
支持,但不好!在 R 中,大部分包的作者都是以英文为母语的,不会对中文字符考虑太多,故建议
使用全英文环境。
17. R 支持自动补全(Tab completion)么?
支持!在 2.5.0 版本中,R 引入了命令自动补全功能,使用 Tab 键能自动补全 R 命令;或使用第二
次 Tab 后,返回所有可能的补全命令列表。
18. 如何清除变量?
清除单个变量使用 rm() 函数,清除内存中所有的变量:
1 rm( l i s t = l s ( a l l = TRUE) )
19. 如何更改小数点后显示数字位数?
options(digits = ) ,digits 后面的参数为 1 至 22 的数字,默认为 7。options 函数还可以改变很多全
局选项,如更改提示符 (prompt) ,是否显示错误信息 (show.error.messages) 等。
20. 如何调用系统内的程序?
使用 system() 函数或用 shell.exec() 调用相应程序来打开文件:
1 # g o t o t h e c r a n
system ( pas t e (’"C:/Program Files/Internet Explorer/iexplore.exe"’ ,
2
同样支持 Rterm
4
剩余40页未读,继续阅读
资源评论
悠闲饭团
- 粉丝: 158
- 资源: 3308
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功