本をカメラで電子化

本をカメラで電子化する実験をした。

452ページの本を見開き226枚の写真に。カメラはPowerShot G11,3648×2736ピクセル,JPEG高圧縮率,モノクロ。200×106バイトに収まる。平均887600バイト/枚程度。マクロモード,距離固定,露出は+1/3にしたがもっと明るくしたほうがよかった。解像度は300dpi程度,もう1段階低くしてもよかった。

かかった時間は追加撮影を除いて18分22秒。1枚5秒弱。慣れてくると1枚1〜2秒でできる。ただし,あとで調べたら1枚足りなかったので追加撮影。ページのめくり過ぎがないように急がず作業すべきだった。

本はパソコンデスクの中の段に置き,上の段にミニ三脚を横にしてカメラを設置。距離は50cmほどなのでマクロにする必要はなかったかも。

追記:携帯で撮った写真:

[2010-07-09追記] Simply Scanという製品が出るようだ。これは以前TwitterでもつぶやいたHoverCamと類似のもので,「本を裁断せずに電子書籍化できるスキャナー」と銘打っているが,要は書画カメラ。

[2010-10-12] 書き忘れていたが,この記事は 本をカメラで電子化 2 に続く。なお,Canon RS-60E3 リモートスイッチというものも買ったので,シャッターを押すのが楽になった。

画像→テキスト変換?

撮影した画像は OCR でテキストに変換するのですか?

Re: 画像→テキスト変換?

いえ,そこまでは考えていません。
数式ばかりの本ですとOCRはあまり役に立ちません。

中央部分は?

普通に撮影すると中央部分が歪みます.歪み修正ソフトもあるようですが,どう処理しましたか?

Re: 中央部分は?

それ以上に,開いた部分が湾曲して写りますので,よほど考えないと,見開きをきれいに写すのは無理っぽいです。私のはとにかく読めればいいというレベルの仕上がりです。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。