ワインの価格

Newton 2013年12月号「統計の威力」特集にあった図です。データは http://www.liquidasset.com/ の左の「6. Articles and Data」をクリックして「Article 3」の「Click here to see the data and the basic regression results」のリンク先にあります。念のためデータを引用しておきます:

OBS    VINT     LPRICE2    WRAIN    DEGREES    HRAIN    TIME_SV
  
  1    1952    -0.99868     600     17.1167     160        31  
  2    1953    -0.45440     690     16.7333      80        30  
  3    1954      .          430     15.3833     180        29  
  4    1955    -0.80796     502     17.1500     130        28  
  5    1956      .          440     15.6500     140        27  
  6    1957    -1.50926     420     16.1333     110        26  
  7    1958    -1.71655     582     16.4167     187        25  
  8    1959    -0.41800     485     17.4833     187        24  
  9    1960    -1.97491     763     16.4167     290        23  
 10    1961     0.00000     830     17.3333      38        22  
 11    1962    -1.10572     697     16.3000      52        21  
 12    1963    -1.78098     608     15.7167     155        20  
 13    1964    -1.18435     402     17.2667      96        19  
 14    1965    -2.24194     602     15.3667     267        18  
 15    1966    -0.74943     819     16.5333      86        17  
 16    1967    -1.65388     714     16.2333     118        16  
 17    1968    -2.25018     610     16.2000     292        15  
 18    1969    -2.14784     575     16.5500     244        14  
 19    1970    -0.90544     622     16.6667      89        13  
 20    1971    -1.30031     551     16.7667     112        12  
 21    1972    -2.28879     536     14.9833     158        11  
 22    1973    -1.85700     376     17.0667     123        10  
 23    1974    -2.19958     574     16.3000     184         9  
 24    1975    -1.20168     572     16.9500     171         8  
 25    1976    -1.37264     418     17.6500     247         7  
 26    1977    -2.23503     821     15.5833      87         6  
 27    1978    -1.30769     763     15.8167      51         5  
 28    1979    -1.53960     717     16.1667     122         4  
 29    1980    -1.99582     578     16.0000      74         3  
 30    1981      .          535     16.9667     111         2  
 31    1982      .          712     17.4000     162         1  
 32    1983      .          845     17.3833     119         0  
 33    1984      .          591     16.5000     119        -1  
 34    1985      .          744     16.8000      38        -2  
 35    1986      .          563     16.2833     171        -3  
 36    1987      .          452     16.9833     115        -4  
 37    1988      .          808     17.1000      59        -5  
 38    1989      .          443       .          82        -6  

このデータをRで読むには,クリップボードにコピーして,次のどちらかを打ち込みます:

data = read.table("clipboard", na.strings=".", header=TRUE) # Windows
data = read.table(pipe("pbpaste"), na.strings=".", header=TRUE) # Mac

プロットしてみます:

par(mgp=c(2,0.8,0))
plot(data$WRAIN, data$LPRICE2, pch=16,
     xlab="収穫前年の10月〜3月の雨量",
     ylab="ワインの価格")

相関係数とその p 値を求めてみましょう。

cor.test(data$WRAIN, data$LPRICE2)

右上の点を外したらどうなるでしょうか。

data1 = subset(data, LPRICE2 < 0)
cor.test(data1$WRAIN, data1$LPRICE2)

Last modified: