Excel使うな

Computational Statistics and Data Analysis Volume 52, Issue 10 (2008) に Excel 2007 特集がある。

まず最初の論文 (B.D. McCullough and David A. Heiser, On the accuracy of statistical procedures in Microsoft Excel 2007, pp.4570-4578) のアブストラクト:

Excel 2007, like its predecessors, fails a standard set of intermediate-level accuracy tests in three areas: statistical distributions, random number generation, and estimation. Additional errors in specific Excel procedures are discussed. Microsoft's continuing inability to correctly fix errors is discussed. No statistical procedure in Excel should be used until Microsoft documents that the procedure is correct; it is not safe to assume that Microsoft Excel's statistical procedures give the correct answer. Persons who wish to conduct statistical analyses should use some other package.

要約:どうしょーもないから使うな。

次の A. Talha Yalta, The accuracy of statistical distributions in Microsoft® Excel 2007, pp.4579-4586 のアブストラクト:

We provide an assessment of the statistical distributions in Microsoft® Excel versions 97 through 2007 along with two competing spreadsheet programs, namely Gnumeric 1.7.11 and OpenOffice.org Calc 2.3.0. We find that the accuracy of various statistical functions in Excel 2007 range from unacceptably bad to acceptable but significantly inferior in comparison to alternative implementations. In particular, for the binomial, Poisson, inverse standard normal, inverse beta, inverse student’s t, and inverse F distributions, it is possible to obtain results with zero accurate digits as shown with numerical examples.

要約:どうしょーもないから使うな。

次の B.D. McCullough, Microsoft Excel's `Not The Wichmann-Hill' random number generators, pp.4587-4593 のアブストラクト:

Microsoft attempted to implement the Wichmann-Hill RNG in Excel 2003 and failed; it did not just produce numbers between zero and unity, it would also produce negative numbers. Microsoft issued a patch that allegedly fixed the problem so that the patched Excel 2003 and Excel 2007 now implement the Wichmann-Hill RNG, as least according to Microsoft. We show that whatever RNG it is that Microsoft has implemented in these versions of Excel, it is not the Wichmann-Hill RNG. Microsoft has now failed twice to implement the dozen lines of code that define the Wichmann-Hill RNG.

昔のExcelの乱数は無茶苦茶だった。Excel 2003でMicrosoftはやっとWichmann-Hillの乱数生成アルゴリズム(私のアルゴリズム事典にも載っている十数行で書ける簡単だがまともなアルゴリズム)に切り替えた(Microsoftの Excel 2007 と Excel 2003 の RAND 関数について 参照。ただしMicrosoftはWichmannの綴りを間違えている)。最初はバグっていて負の値を返したりしたため,パッチが出た。めでたしめでたし。じゃない。調べてみると,何かおかしい。Excel 2007になってもまだおかしい。Microsoftはたった十数行のアルゴリズムもまともにインプリメントできないんだ。

ほかにもチャートジャンクの話などがあるが,略。

追記:MicrosoftのExcelの統計関数の解説ページはみんな「統計関数を超えます」(Excel Statistical Functionsの直訳)になっている。例:統計関数を超えます。:傍受します。

2008-10-27追記:「統計関数を超えます」がなくなった!

[追記] Excel使うな:2010版を書いた。

2014-02-08追記:Excel 2007についてのCSDA誌の論文で拾い損ねていたもの:Bruce R. Hargreavesa and Thomas P. McWilliams, Polynomial Trendline function flaws in Microsoft Excel, Computational Statistics & Data Analysis, Vol. 54, No. 4, pp.1190-1196 (2010):Excel 2003/2007の多項式フィットも駄目駄目。

2014-02-08追記:ついでに,Wichmann-Hill(1982)の現代編の論文:B. A. Wichmann and I. D. Hill, Generating good pseudo-random numbers, Computational Statistics & Data Analysis, Vol. 51, No. 3, pp.1614-1622 (2006).

相変わらずの殿様商売のようですね。 この点、乱数生成にしろ

相変わらずの殿様商売のようですね。

この点、乱数生成にしろほかの機能にしろ、OOoあたりはぬかりなくやっているのか気になります。

Excel

Excel は,コンピュータ・ソフトウェアの三種の神器のようになっていますが,とんでもないこともあるというお話。

ttp://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

のバグも直ってないんでしょうかねぇ?

OpenOfficeの方がまし

The accuracy of ...によれば、多少の問題点があるが、OpenOfficeの方がましと言う結論ですね(使用したバージョンは2.3)。しかも、OpenOfficeのCalcの開発メンバーは問題点を既に2.4で解決する(した?)とありますね。
でも、Excel使っている人は多いですよね。以前は安価で性能の良い統計パッケージが売られていましたが、ほとんどがEcelに駆逐されてしまった。何十万円もするパッケージは個人や研究室で購入するのは大変です。
私は、OS9で動作するStatViewかDeltaGraphです。
査読者がExcel使っているだけで、論外としない限り、Excelは使われ続けるでしょうね。残念。
大学でSPSSかSASのライセンス買って欲しい。

もう直ってる?

この雑誌が出たのが6月なので、よっぽどぼんくらじゃなかったら、(こっそり)直していたりして。
論文は間違いと発表しないとこ見ると、Williamち直接被害の無い所は優先順位が低いとしか思えません。
今回の不況も、アメリカの景気動向調査の結果をExcelで計算して間違った。なんて結論が出たらどうしよう。

先ほど気付きましtが、Save プレビューにボタンが変わってますね。saveボタンで無事投稿できるようですが。

Re: もう直ってる?

ところが,この特集の前書きだったかにも書いてあるように,Excelの新しいバージョンが出るごとに特集を組んだりして批判を続けているにもかかわらず,いっこうに直す気配がないのは不思議だということです。競合製品がない以上,金をかけて直さないというのが,MSの姿勢なんでしょうか。

その昔,Microsoft BASICが小規模な数値計算に使われるようになって,研究者たちはその乱数生成アルゴリズムが幼稚で使い物にならないことに気がついて,論文やパソコン雑誌の記事でさんざん叩いたにもかかわらず,いっこうに直さなかったという経緯もあります。そもそもこんな幼稚な乱数発生をしているということは,Bill Gatesはコンピュータサイエンスの素養がまったくなく,アセンブリ言語の知識と腕力だけでこれだけのものを作ったんだなぁと感心したことがあります。

ところで,統計ソフトなら,ぜひRを使ってください。S-PLUS相当のオープンソースのソフトです。

コメント掲載が遅れてすみませんm(__)m

ブログシステムを更新してからコメント新着メールが出なくなっていたようで,ラッコさん,落伍弟子さんのコメントに気がつかず,掲載が遅れてしまい,申し訳ありませんでした。m(__)m

Excel使うな:補遺

書き残したことを書いておきます。Excelのひどい話は昔からあちこちで書かれており,特に青木先生のひどい話です!はよく引き合いに出されます(ここから私が昔書いたExcelの演算誤差にもリンクしていただいています)。

このExcelのひどさをVBAで補ってがんがん科学計算に使おうという本 Robert de Levie, Advanced Excel for scientific data analysis, 2nd edition (OUP, 2008) が出ています。この本自身がWordで作られているようです。MSヲタ感涙の本です。

株式会社

と書いてみるテスト。一部の方のみ意味明瞭ですみません……。

しかし、これでは「弊社の自動翻訳の質は、こんなものです」といっているようなものですね。笑われるくらいならやめればいいのに。

Re: 株式会社

ありがとうございます。これで「株式会社三重大学」で検索した人が迷子になることが防げるでしょう。

"株式会社三重大学"

さらに"株式会社三重大学" と、ダブルクオートをつけてもOKですね :-)

Excel2008には…

たとえば、
http://www.istc.kobe-u.ac.jp/contents/question/faq/?categ=imac#24
によると、
分析ツールもVBAも無いそうです。

既にご存知かとも思いましたが、念のため…。

Re: Excel2008には…

はい,私もユーザなので,困っています。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。