CONTENTS
Exploratory Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Quantile Quantile Plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Scatterplots And Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Stratification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Bi-variate Normal Distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Plots To Avoid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Misunderstanding Correlation (Advanced) . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Robust Summaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
Wilcoxon Rank Sum Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Matrix Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Motivating Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Matrix Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Solving System of Equations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Vectors, Matrices and Scalars . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Matrix Operations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
Linear Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
The Design Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
The Mathematics Behind lm() . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
Standard Errors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
Interactions and Contrasts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Linear Model with Interactions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
Analysis of variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
Co-linearity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
Rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
Removing Confounding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
The QR Factorization (Advanced) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
Going Further . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
Inference For High Dimensional Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Inference in Practice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
Error Rates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
The Bonferroni Correction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
False Discovery Rate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
Direct Approach to FDR and q-values (Advanced) . . . . . . . . . . . . . . . . . . . . . . 265
Basic Exploratory Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
Statistical Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
The Binomial Distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281