没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
“book”
2006/6/15
page I
i
i
i
i
i
i
i
i
Interactive and Dynamic
Graphics for Data Analysis
With Examples Using R and GGobi
Dianne Cook Deborah F. Swayne Andreas Buja
with contributions from Duncan Temple Lang and Heike Hofmann
Copyright 1999-2006 D. Cook, D. F. Swayne, A. Buja, D. Temple Lang, H.
Hofmann
DRAFT
“book”
2006/6/15
page II
i
i
i
i
i
i
i
i
“book”
2006/6/15
page III
i
i
i
i
i
i
i
i
Contents
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Data Visualization: Beyond the Third Dimension . . . . . . . . . . . . 1
1.2 Statistical Data Visualization: Goals and History . . . . . . . . . . . . 3
1.3 Getting Down to Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Getting Real: Process and Caveats . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Interactive Investigation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 What’s in this b ook? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 The Toolbox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Plot types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 Univariate plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 Bivariate plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.3 Multivariate plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.4 Real-valued and categorical variables plotted together . . 34
2.2.5 Multiple views . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Direct manipulation on plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.1 Brushing and painting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.2 Identification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.3.3 Scaling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3.4 Adding/deleting/moving points and drawing lines . . . . . 40
2.3.5 Rearranging layout in multiple views . . . . . . . . . . . . . . . . . 40
2.3.6 Subset selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3 Missing Values . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2 Exploring missingness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2.1 Getting started: plots with missings in the “margins” . . 45
3.2.2 A limitation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Imputation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
“book”
2006/6/15
page IV
i
i
i
i
i
i
i
i
IV Contents
3.3.1 Shadow matrix: The missing values data set . . . . . . . . . . 48
3.3.2 Examining Imputation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.3 Random values . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.4 Mean values . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3.5 From external sources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4 Supervised Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.1 Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.1.1 Classical Multivariate Statistics . . . . . . . . . . . . . . . . . . . . . 58
4.1.2 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.1.3 Studying the Fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2 Purely Graphics: Getting a Picture of the Class Structure . . . . 63
4.2.1 Overview of Olive Oils Data . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2.2 Classifying Three Regions . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2.3 Separating Nine Areas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 Numerical Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.1 Linear discriminant analysis . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.2 Trees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3.3 Random Forests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3.4 Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.5 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3.6 Examining boundaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.4 Deduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5 Cluster Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.1 Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.2 Purely graphics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.3 Numerical methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3.1 Hierarchical algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.3.2 Model-based clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.3.3 Self-organizing maps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.3.4 Comparing methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.4 Recap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6 Exploratory Multivariate Spatio-temporal Data Analysis . . 113
6.1 Spatial Oddities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Space-time trends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.3 Multivariate relationships . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.4 Multivariate spatial trends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
“book”
2006/6/15
page V
i
i
i
i
i
i
i
i
Contents V
7 Longitudinal Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.1 Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.2 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
7.3 More Background . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.4 Mean Trends. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.5 Individuals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.5.1 Example 1: Wages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
8 Microarray Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.1 Two-Factor, Single Replicate Data . . . . . . . . . . . . . . . . . . . . . . . . . 140
8.1.1 Data description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
8.1.2 Plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
8.1.3 Incorporating numerical analysis . . . . . . . . . . . . . . . . . . . . 147
8.2 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9 Inference for Data Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
9.1 Really There? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
9.2 The Process of Assessing Significance . . . . . . . . . . . . . . . . . . . . . . 157
9.3 Types of Null Hypotheses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
9.4 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
9.4.1 Tips . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
9.4.2 Particle physics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
9.4.3 Baker data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
9.4.4 Wages data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
9.4.5 Leukemia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
9.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
Data Sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
10.1 Arabidopsis Gene Expression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
10.2 Australian Crabs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
10.3 Flea Beetles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
10.4 Insect Populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
10.5 Italian Olive Oils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
10.6 Iowa Youth and Families Project (IYFP) . . . . . . . . . . . . . . . . . . . 170
10.7 Leukemia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
10.8 Panel Study of Income Dynamics(PSID) . . . . . . . . . . . . . . . . . . . . 171
10.9 PRIM7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
10.10Rat Gene Expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
10.11Soils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
10.12Spam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
10.13Tropical Atmosphere-Ocean Array . . . . . . . . . . . . . . . . . . . . . . . . . 175
10.14Tipping Behavior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
10.15Wages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
剩余168页未读,继续阅读
pengshanglian
- 粉丝: 1
- 资源: 20
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页