没有合适的资源?快使用搜索试试~ 我知道了~
此为nhanesR包 数据提取部分的笔记。是根据老师讲课的内容以及自己的需求记的。个人认为很详细,可用于在记不得做法的时候回溯用。想免费要我的笔记可以联系我。跟我交换笔记或者交流科研。
资源推荐
资源详情
资源评论
数
据
提
取
查
找
数
据
:
步
骤
:
1.
明
确
想
要
找
的
变
量
,
⽐
如
我
想
找
的
变
量
是
age
,
在
⽹
⻚
搜
索
⾥
输
⼊
age
,
在
label
⾥
看
哪
个
说
的
是
年
龄
。
2.
看
这
些
数
据
在
哪
个
⽂
件
⾥
。
这
部
分
内
容
是
在
年
份
列
⾥
。
⽐
如
demo_a, demo_b , demo_
c
3.
明
确
变
量
名
字
。
看
variable
这
⼀
列
,
写
的
就
是
变
量
名
,
⽐
如
age
的
变
量
名
是
ridagey
r
完
成
上
述
步
骤
以
后
才
能
去
提
取
数
据
,
直
接提
取
数
据
不
⾏
。
因
为
nhanes
数
据
库
的
各
个
年
份
数
据
命名
什
么
的
有
不⼀
致
的
情
况
。
所
以
需
要
查
找
这
⼀
步
,
把
⽂
件们
都
归
纳
好
。
实
操
:
⽤
nhs_tsv
找
出
⽂
件
名
是
填
⽂
件
名
的
地
⽅
,
注
意
加
上
‘ ‘
,
⽐
如
,
年
龄
是
在
⼈
⼝
学
数
据
demo
⾥
,
这
个
位
置
写
的
就
是
demo,
意
思
为
找
到
⽂
件
名
包
含
demo
的
⽂
件
items
是
nhanes
的
五个
类
别
⽂
件
:
Demographics
、
Dietary
、
Examination
、
Labo
ratory
、
Questionnaire
cat
是
找
到
⽂
件
所
在
位
置
,
就
打
印
出
来
看看
,
默
认
是
打
印
的
。
按
默
认
值
就
好
,
毕
竟
⾃
⼰
也
要
了
解
⼀下
代
码
运
⾏
的
情
况
例
:
age
这
个
数
据
的
变
量
名
是
riaageyr
,
在
⽂
件
demo_a, demo_b, demo_c
⾥
,
⽂
件
名
都
包
含
demo
nhs_tsv(, items, years, cat = TRUE) # 意为找出文件名中含有字段的所有文件
nhs_tsv('demo') # 意为找出文件名中含有demo字段的所有文件
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv"
"D:/MyNhanes/01 NHANES/2001-2002/Demographics/demo_b.tsv"
[3] "D:/MyNhanes/01 NHANES/2003-2004/Demographics/demo_c.tsv"
"D:/MyNhanes/01 NHANES/2005-2006/Demographics/demo_d.tsv"
[5] "D:/MyNhanes/01 NHANES/2007-2008/Demographics/demo_e.tsv"
"D:/MyNhanes/01 NHANES/2009-2010/Demographics/demo_f.tsv"
[7] "D:/MyNhanes/01 NHANES/2011-2012/Demographics/demo_g.tsv"
"D:/MyNhanes/01 NHANES/2013-2014/Demographics/demo_h.tsv"
[9] "D:/MyNhanes/01 NHANES/2015-2016/Demographics/demo_i.tsv"
"D:/MyNhanes/01 NHANES/2017-2018/Demographics/demo_j.tsv"
[11] "D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
nhs_tsv('demo',years=20072019) # 意为找出2007-2019年间文件名中含有demo字段的所有文件
[1] "D:/MyNhanes/01 NHANES/2007-2008/Demographics/demo_e.tsv"
"D:/MyNhanes/01 NHANES/2009-2010/Demographics/demo_f.tsv"
[3] "D:/MyNhanes/01 NHANES/2011-2012/Demographics/demo_g.tsv"
"D:/MyNhanes/01 NHANES/2013-2014/Demographics/demo_h.tsv"
[5] "D:/MyNhanes/01 NHANES/2015-2016/Demographics/demo_i.tsv"
"D:/MyNhanes/01 NHANES/2017-2018/Demographics/demo_j.tsv"
[7] "D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
nhs_tsv('demo',years=c(1999,20072019)) # 意为找出1999年以及2007-2019年间文件名中含
有demo字段的所有文件
在
上
述
尝
试
中
,
我
们
发
现
1999
年
的
⽂
件
名
是
demo.tsv
,
没
有
_f
、
_h
这
类
的
后
缀
,
这
样
的
话
,
我
们
在
⽂
件
名
搜
索
条
件
⾥
写
demo.
也
能
因
为
.
这
么⼀个
很
有
区
别
的
标
点
符
号
,
把
这
⼀
年
的
数
据
超
选
出
来
。
不
过
要
注
意
的
是
.
是
通
配
符
,
我
想
要
他
执
⾏
单
纯
的
⽂
件
名
中
的
标
点
符
号
的
功
能
,
需
要
加
上
\\
转
义
。
故
,
正
确
写
法
如
下
对
于
years
这
个
字
段
,
写
这
个
circle
⾥
的
哪
个
都
⾏
。
以
下三
种
情
况
是
等
价
的
:
当
⽤
nhs_tsv('demo\\.')
会
打
印
出
来
两
⾏
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv" .
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv"
"D:/MyNhanes/01 NHANES/2007-2008/Demographics/demo_e.tsv"
[3] "D:/MyNhanes/01 NHANES/2009-2010/Demographics/demo_f.tsv"
"D:/MyNhanes/01 NHANES/2011-2012/Demographics/demo_g.tsv"
[5] "D:/MyNhanes/01 NHANES/2013-2014/Demographics/demo_h.tsv"
"D:/MyNhanes/01 NHANES/2015-2016/Demographics/demo_i.tsv"
[7] "D:/MyNhanes/01 NHANES/2017-2018/Demographics/demo_j.tsv"
"D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
nhs_tsv('demo\\.') # 找出文件名包含 demo. 的所有文件
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv"
"D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
# 发现有两年的文件名包含 demo. 这个字段。如果只要1999年的,可以加上 years= 1999
来限制
nhs_tsv('demo\\.',years = 1999)
nhs_tsv('demo\\.',years = 2000)
nhs_tsv('demo\\.',years = 19992000)
[2]"D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
可
以
⽤
[1]
这
种
⽅
式
来
选
择
第
⼀
⾏
。
不
过这
个东
西
。。。
万⼀
有
的
⻚
⾯
⼀
⾏
打
印
两个
呢
,
⽐
如
我
⾃
⼰
的
就
是
。
所
以
这
个
只
能
是
备
选
⼿
法
。
代
码
如
下
。
在
nhs_tsv('demo\\.')
得
到
的
⽂
件
中
,
我
想
要
⽂
件
名
不
包
含
p
的
⽂
件
,
⽤
!~
表
⽰
去
掉
,
注
意
这
两个
符
号
之
间
没
有
空
格
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv"
其
它
⽰
例代
码
:
上
述
步
骤
已
经
完
成
了
对
⽂
件
的
总
结
。
现
在
需
要
查
找
变
量
名
。
如
前
所
述
,
变
量
名可
以从
⽹
⻚
⾥
查
找
到
。
当
确
定
是
ridageyr
的
时
候
就
直
接
找
就
⾏
。
当
不
确
定
的
时
候
,
可
以
⽤
nhs_brief()
函
数
nhs_tsv('demo\\.')[1] # 选择nhs_tsv('demo\\.')这个命令得到的结果中的第一行的文件
nhs_tsv('demo\\.','!~p') # 找出包含 demo. 这个字段,同时不包含 p 的文件,用逗号分隔两个
条件,表示and
demo nhs_tsv('dem',years=20012005) # 找出2001-2005年间文件名包含dem字段的所有文
件
cbc nhs_tsv('lab25|125_b|125_c|cbc',years=20012005) # 找出2001-2005年间文件名
包含lab25或125_b或125_c或cbc的所有文件
bmx nhs_tsv('bmx',years=20012005) # 找出2001-2005年间文件名包含bmx字段的所有文
件
mytsv nhs_tsv('demo')
nhs_brief(mytsv,'age') # 查找 age 这个变量的变量名是什么
变
量
名
label
riagendr gender of the sample person
ridagemn age in months - recode
这
样
的
话
,
能
看
到
所
有
age
的
变
量
名
,
这
样
能
在
console
⾥
看
到
所
有
变
量
名
。
但
是
这
样
很
杂
乱
,
可
以
⽤
View()
转
到
表
格
来
看
,
注
意
⼤
⼩
写
,
V
是
⼤
写
。
> mytsv nhs_tsv('demo')
[1] "D:/MyNhanes/01 NHANES/1999-2000/Demographics/demo.tsv"
"D:/MyNhanes/01 NHANES/2001-2002/Demographics/demo_b.tsv"
[3] "D:/MyNhanes/01 NHANES/2003-2004/Demographics/demo_c.tsv"
"D:/MyNhanes/01 NHANES/2005-2006/Demographics/demo_d.tsv"
[5] "D:/MyNhanes/01 NHANES/2007-2008/Demographics/demo_e.tsv"
"D:/MyNhanes/01 NHANES/2009-2010/Demographics/demo_f.tsv"
[7] "D:/MyNhanes/01 NHANES/2011-2012/Demographics/demo_g.tsv"
"D:/MyNhanes/01 NHANES/2013-2014/Demographics/demo_h.tsv"
[9] "D:/MyNhanes/01 NHANES/2015-2016/Demographics/demo_i.tsv"
"D:/MyNhanes/01 NHANES/2017-2018/Demographics/demo_j.tsv"
[11] "D:/MyNhanes/01 NHANES/2019-2020/Demographics/p_demo.tsv"
> nhs_brief(mytsv,'age')
1999-2000 2001-2002 2003-2004 2005-2006 2007-2008 2009-2010
2011-2012 2013-2014 2015-2016 2017-2018 2019-2020 N
riagendr riagendr riagendr riagendr riagendr riagendr riagendr
riagendr riagendr riagendr riagendr riagendr 11
ridagemn ridagemn ridagemn ridagemn ridagemn ridagemn ridagemn
ridagemn ridagemn ridagemn ridagemn ridagemn 11
ridageyr ridageyr ridageyr ridageyr ridageyr ridageyr ridageyr
ridageyr ridageyr ridageyr ridageyr ridageyr 11
dmdhrage dmdhrage dmdhrage dmdhrage dmdhrage dmdhrage dmdhrage
dmdhrage dmdhrage dmdhrage <NA> <NA> 9
ridageex ridageex ridageex ridageex ridageex ridageex ridageex
<NA> <NA> <NA> <NA> <NA> 6
nhs_brief(mytsv,'age')View()
剩余20页未读,继续阅读
资源评论
珏世佳人
- 粉丝: 94
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功