線形モデル

fitted, predict

関数の詳細は以降を参照:R基本統計関数マニュアルP237
fitted:モデルを当てはめる値を返す
predict:モデルの得た結果から予測を返す

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
model <- lm(y ~ x)
model
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##      -1.279        1.143
predict(model)
##          1          2          3          4          5          6 
## -1.2787024 -0.9657169 -0.2492192  0.6898271  1.6148650  1.5280408 
##          7          8          9         10         11         12 
##  2.5874121  1.8136557  2.9107218  3.8784616  3.3627079  2.4280049 
##         13         14         15         16         17         18 
##  1.8356641  2.4825374  2.3642247  2.3716090  1.4588812  1.8495629 
##         19         20         21         22         23         24 
##  1.9219157  2.7383116  2.3241254  2.3877094  2.6845268  1.5635930 
##         25         26         27         28         29         30 
##  1.0329280  1.6112523  2.6016286  1.7489655  1.7908673  2.1091110 
##         31         32         33         34         35         36 
##  1.6007919  2.7131446  3.6193499  4.2806241  4.1383089  3.3055474 
##         37         38         39         40         41         42 
##  3.8223528  3.6295372  3.6443460  4.7418520  4.5634273  4.2652600 
##         43         44         45         46         47         48 
##  5.1697887  6.3032467  6.5079368  7.4570334  7.8600511  7.7564869 
##         49         50         51 
##  8.5627718  8.7850714  9.9108741

resid, rstandard

参照:R基本統計関数マニュアル 間瀬 茂著 P238
モデル残差を返す 標準化残差を返す

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
model <- lm(y ~ x)
z <- as.data.frame(resid(model))
z
##    resid(model)
## 1    0.04094051
## 2    0.14337798
## 3    0.37153219
## 4    0.06048142
## 5    0.49511038
## 6    0.94411808
## 7    0.95084388
## 8    1.44727210
## 9    0.71675884
## 10   0.29256347
## 11  -0.34742400
## 12  -0.73367511
## 13  -0.21489779
## 14   0.50364034
## 15  -0.34065352
## 16  -0.80696554
## 17  -0.07878300
## 18   0.50054757
## 19  -0.18133865
## 20  -0.48860052
## 21  -0.28555381
## 22  -0.83749578
## 23  -1.26727997
## 24  -0.32142544
## 25   0.34509778
## 26  -0.13372841
## 27   0.47239370
## 28   1.15383667
## 29   1.63669739
## 30   1.09233867
## 31   1.22097507
## 32   0.80397682
## 33   1.14113539
## 34   0.50111934
## 35   0.61229487
## 36   0.54770625
## 37   0.25660893
## 38  -0.26345060
## 39  -0.65796058
## 40  -0.60994744
## 41  -0.28927659
## 42  -0.05071906
## 43   0.30785621
## 44   0.31664029
## 45  -0.07059479
## 46  -0.98760222
## 47  -1.64491575
## 48  -1.85102804
## 49  -1.73605686
## 50  -1.10412611
## 51  -1.57236453
w <- as.data.frame((rstandard(model)))
w
##    (rstandard(model))
## 1          0.04921459
## 2          0.17266036
## 3          0.44654369
## 4          0.07282175
## 5          0.59704382
## 6          1.13953572
## 7          1.15634774
## 8          1.78855898
## 9          0.89919122
## 10         0.37339163
## 11        -0.43612773
## 12        -0.91631162
## 13        -0.26301843
## 14         0.60956723
## 15        -0.40940122
## 16        -0.97412790
## 17        -0.09567099
## 18         0.60507784
## 19        -0.21793734
## 20        -0.59047828
## 21        -0.34535677
## 22        -1.00837957
## 23        -1.52372483
## 24        -0.38636688
## 25         0.41541208
## 26        -0.16074186
## 27         0.56874554
## 28         1.39503812
## 29         1.99891634
## 30         1.35021447
## 31         1.48543302
## 32         0.96840794
## 33         1.37130327
## 34         0.60298058
## 35         0.73610633
## 36         0.66293268
## 37         0.31499746
## 38        -0.31916168
## 39        -0.79113655
## 40        -0.73413968
## 41        -0.35211378
## 42        -0.06214902
## 43         0.37887287
## 44         0.39123615
## 45        -0.08568904
## 46        -1.19989402
## 47        -1.98009051
## 48        -2.22634971
## 49        -2.09457734
## 50        -1.32882599
## 51        -1.88989007

lm

関数の詳細は以降を参照:基本統計関数マニュアル P187
線形モデルを当てはめる

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
lm(y ~ x)
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##     -1.3901       0.1804

glm

関数の詳細は以降を参照:基本統計関数マニュアル P199
一般線形モデルによる回帰を行う

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
glm(y ~ x)
## 
## Call:  glm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##      -2.236       -1.263  
## 
## Degrees of Freedom: 50 Total (i.e. Null);  49 Residual
## Null Deviance:       208.3 
## Residual Deviance: 165.7     AIC: 210.8

hat

hat行列を返す

influence.measures

関数の詳細は以降を参照:基本統計関数マニュアル P240
回帰分析を診断する

x <- rnorm(seq(1,50,1))
y <- rnorm(seq(1,50,1))
model <- lm(x~y)
influence.measures(model)
## Influence measures of
##   lm(formula = x ~ y) :
## 
##      dfb.1_    dfb.y    dffit cov.r   cook.d    hat inf
## 1   0.29577  0.31331  0.41691 0.943 8.24e-02 0.0460    
## 2  -0.27243  0.00741 -0.27367 0.916 3.55e-02 0.0200    
## 3  -0.14552 -0.15940 -0.20886 1.056 2.19e-02 0.0479    
## 4   0.02144 -0.00412  0.02216 1.064 2.51e-04 0.0207    
## 5  -0.03436 -0.00383 -0.03439 1.062 6.03e-04 0.0203    
## 6  -0.14303  0.35402 -0.39167 1.111 7.63e-02 0.1093    
## 7   0.12696 -0.18166  0.22915 1.060 2.63e-02 0.0538    
## 8  -0.10714 -0.02451 -0.10852 1.041 5.94e-03 0.0211    
## 9   0.17612  0.23320  0.28314 1.057 3.99e-02 0.0622    
## 10 -0.07839 -0.10252 -0.12503 1.100 7.94e-03 0.0610    
## 11 -0.17220  0.09912 -0.20494 1.003 2.08e-02 0.0261    
## 12 -0.11581 -0.10303 -0.15002 1.058 1.14e-02 0.0379    
## 13  0.14901  0.11662  0.18328 1.036 1.68e-02 0.0336    
## 14 -0.10301  0.11074 -0.15667 1.060 1.24e-02 0.0400    
## 15  0.31006  0.39091  0.48322 0.948 1.10e-01 0.0579    
## 16  0.04139 -0.01353  0.04451 1.063 1.01e-03 0.0220    
## 17 -0.16812 -0.06152 -0.17544 1.010 1.53e-02 0.0228    
## 18  0.03892  0.03432  0.05023 1.081 1.29e-03 0.0375    
## 19 -0.00237  0.00225 -0.00338 1.082 5.84e-06 0.0358    
## 20  0.16723  0.14119  0.21187 1.029 2.24e-02 0.0360    
## 21  0.40295 -0.32849  0.53822 0.764 1.25e-01 0.0319   *
## 22 -0.01650  0.00363 -0.01718 1.065 1.51e-04 0.0209    
## 23 -0.02109  0.02548 -0.03425 1.091 5.99e-04 0.0448    
## 24 -0.03390  0.00742 -0.03527 1.063 6.35e-04 0.0209    
## 25 -0.09935  0.11367 -0.15635 1.064 1.23e-02 0.0424    
## 26  0.01669  0.02187  0.02665 1.110 3.63e-04 0.0612    
## 27 -0.20434 -0.16974 -0.25719 1.003 3.25e-02 0.0354    
## 28  0.09691 -0.06265  0.11921 1.050 7.18e-03 0.0276    
## 29  0.28903  0.02217  0.28904 0.902 3.93e-02 0.0201    
## 30  0.23572 -0.01730  0.23809 0.950 2.73e-02 0.0201    
## 31 -0.06233 -0.03909 -0.07144 1.066 2.60e-03 0.0285    
## 32 -0.06273  0.03822 -0.07583 1.062 2.92e-03 0.0268    
## 33 -0.12402 -0.01530 -0.12421 1.032 7.76e-03 0.0203    
## 34  0.12238 -0.20711  0.24822 1.076 3.09e-02 0.0658    
## 35 -0.13011 -0.09181 -0.15440 1.043 1.20e-02 0.0309    
## 36 -0.01852 -0.01289 -0.02188 1.075 2.44e-04 0.0306    
## 37 -0.04853  0.03627 -0.06268 1.070 2.00e-03 0.0301    
## 38  0.08335  0.00589  0.08335 1.049 3.52e-03 0.0201    
## 39 -0.00300  0.01053 -0.01117 1.271 6.37e-05 0.1796   *
## 40 -0.11543 -0.16242 -0.19319 1.095 1.89e-02 0.0682    
## 41 -0.26760 -0.30319 -0.39139 0.974 7.37e-02 0.0500    
## 42 -0.11336 -0.02101 -0.11414 1.038 6.57e-03 0.0207    
## 43  0.19110 -0.03604  0.19733 0.986 1.91e-02 0.0207    
## 44 -0.09499 -0.08193 -0.12143 1.065 7.47e-03 0.0367    
## 45 -0.00494  0.00713 -0.00896 1.103 4.10e-05 0.0544    
## 46 -0.07480 -0.01674 -0.07570 1.053 2.91e-03 0.0210    
## 47 -0.02746  0.02977 -0.04195 1.085 8.98e-04 0.0403    
## 48  0.02739  0.00503  0.02757 1.063 3.88e-04 0.0207    
## 49 -0.03171  0.05933 -0.06932 1.124 2.45e-03 0.0748    
## 50  0.15099  0.05124  0.15647 1.020 1.22e-02 0.0224

logLik

関数の詳細は以降を参照:基本統計関数マニュアル P230
オブジェクト(通常はモデル)から対数尤度値を抽出する。

df

関数の詳細は以降を参照:基本統計関数マニュアル P358
df() は自由度df1, df2 (そしてオプションの非心度パラメータncp) を持つF分布の密度関数

deviance

関数の詳細は以降を参照:基本統計関数マニュアル P230
モデルの逸脱度を返す

formula

関数の詳細は以降を参照:基本統計関数マニュアル P245
オブジェクトに含まれるモデル式を取り出す。

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
fit = lm(y ~ x)
formula(fit)
## y ~ x

~

チルダ演算子:左辺の変数を右側の変数で説明するモデルを作成する

lm(y ~ x)
## 
## Call:
## lm(formula = y ~ x)
## 
## Coefficients:
## (Intercept)            x  
##     -2.5009      -0.2575

I

関数の詳細は以降を参照:基本統計関数マニュアル P252
オブジェクトが,文字通りの意味で解釈されるべきことを指示する様にクラスを変更する

x <- 1 / 10
class(x)
## [1] "numeric"
x <- I(1/10)
class(x)
## [1] "AsIs"

anova

関数の詳細は以降を参照:基本統計関数マニュアル P216
一つまたは複数の当てはめオブジェクトから分散(または逸脱度) 分析表を計算する。

x = cumsum(c(0, runif(50, -1, +1)))
y = cumsum(c(0, runif(50, -1, +1)))
fit = lm(y ~ x)
summary(fit)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.97578 -0.95565 -0.01286  0.81047  1.84102 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.44585    0.18177   2.453   0.0178 *  
## x           -0.29867    0.06788  -4.400 5.84e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.065 on 49 degrees of freedom
## Multiple R-squared:  0.2832, Adjusted R-squared:  0.2686 
## F-statistic: 19.36 on 1 and 49 DF,  p-value: 5.835e-05
anova(fit)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## x          1 21.975  21.975  19.361 5.835e-05 ***
## Residuals 49 55.614   1.135                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

coef

関数の詳細は以降を参照:基本統計関数マニュアル P247
coef() はモデリング関数が返すオブジェクトからモデル係数を取り出すための総称的関数である。 coefficients() はその別称である。

x <- 1:5
y <- c(1:3, 7, 6)
z <- lm(y ~ x)
coef(z)
## (Intercept)           x 
##        -0.7         1.5

confint

関数の詳細は以降を参照:基本統計関数マニュアル P248
当てはめモデルの一つもしくは複数のパラメータに対する信頼区間を計算する。

# confint()のヘルプから引用
# mtcars データを使って回帰分析を行う
mtcars
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
fit <- lm(100/mpg ~ disp + hp + wt + am, data = mtcars)
confint(fit)
##                    2.5 %      97.5 %
## (Intercept) -0.774822875 2.256118188
## disp        -0.002867999 0.008273849
## hp          -0.001400580 0.011949674
## wt           0.380088737 1.622517536
## am          -0.614677730 0.926307310
# 総重量の信頼区間を算出する
confint(fit, "wt")
##        2.5 %   97.5 %
## wt 0.3800887 1.622518

vcov

関数の詳細は以降を参照:基本統計関数マニュアル P245
当てはめモデルオブジェクトの主要パラメータの分散共分散行列を計算する。

contrasts

参照:基本統計関数マニュアル P252
ある因子に関連する対比を設定したり,閲覧したりする

# codeはヘルプファイルから引用
(ff <- factor(substring("statistics", 1:10, 1:10), levels = letters))
##  [1] s t a t i s t i c s
## Levels: a b c d e f g h i j k l m n o p q r s t u v w x y z
fff <- ff[, drop = TRUE]
fff
##  [1] s t a t i s t i c s
## Levels: a c i s t
contrasts(fff)
##   c i s t
## a 0 0 0 0
## c 1 0 0 0
## i 0 1 0 0
## s 0 0 1 0
## t 0 0 0 1
最終更新日:2016/04/27

copyrigth © 2016 r-beginners.com All rigths reserved.

PAGE TOP ▲