圧縮率の定義は?
データ圧縮で「圧縮率」とか「圧縮比」の定義は?
英語版Wikipediaの Data compression ratio には Compression Ratio = Uncompressed Size / Compressed Size と載っています。つまり、半分に縮んだら、compression ratio は 2 というわけです。日本語版Wikipediaの データ圧縮比 は単にこれを訳しているだけのようです。
ところが Zip のようなツールを使うと、例えば100 MBが30 MBに縮んだら70 %と表示されます。だから、よく縮む圧縮ソフトは「高圧縮率」であるといわれました。
これは次のChatGPT 4の答えと符合します(たまたま二つの回答を並行して出力してくれましたがどちらも同じ内容):
ところがClaude 3 Opusに聞くと「圧縮率 = (圧縮後のデータサイズ ÷ 元のデータサイズ) × 100 %」だそうです。
私は若いころデータ圧縮の研究をしていたのですが、この問題に悩んで、とりあえず自分の書くものでは、100 MBが30 MBに縮んだら「圧縮率」は70 %、「圧縮比」は30 %と表すことにしました。そして「高圧縮率」(「低圧縮比」)を目標としました。しかし、その後も用語の混乱は続いています。
要は、定義してから使うようにするしかなさそうです。
令和3年度(2021年度)共通テスト(1月30日・31日) 情報関係基礎 第1問 問3では、「圧縮比」を「圧縮後のデータ量/圧縮前のデータ量」と定義してから使っています。[←このURLはリンク切れになりました。Wayback Machineのアーカイブには残っているようです。念のためこの部分の画像を下に掲載しておきます。]