自動ブックスキャナの導入は、スキャン作業の省力化が主な目的ではない


「自動ブックスキャナを使うと、スキャン作業が省力化できる」ってのが通念だけど、スキャン作業における省力化なんて、たかが知れてる。正確に言うなら、「自動ブックスキャナを使うと、スキャン後のOCR作業が大幅に省力化できる」ってこと。





大辞林 第二版 (三省堂)によると、省力化とは

機械の導入や作業の合理化などで、手間や労働力を省くようにすること

となってる。

その意味で、「自動ブックスキャナを使うと、スキャン作業が省力化できる」というのは、あながち間違ってはない。ある程度の効果がある。

だけど、その「スキャン作業の省力化」効果だけでは、自動マシンと手動マシンの価格差は説明しきれない。
普通、いろいろ計算した挙句、「自動マシンは割高だね」って話になる。
実際に何度もそういう感想を聞いてきた。


でも、大事なことを見落としてるよ。


自動ブックスキャナは、大量スキャンプロジェクトで使われるもの。
そして、大量スキャンプロジェクトってのは、大量OCRプロジェクトでもあんだよ。

例えば、グーグルUCプロジェクトにおいて、1日3,000冊の本がスキャンされるってことは、1日100万ページがOCRにかけられて、ページあたり1,000〜3,000文字を認識していくわけだから、1日10億〜30億文字を、変換してるわけ。


そんな大量OCRプロジェクトにおいて、一番重要なのは、できるだけ均質な画像を提供すること。(これは、いろいろと実験してみると、すぐに分かる。OCRって結構、チューンナップが必要で、「画像の状態」が大きく結果を左右する。)


大量スキャンにおいて、スキャナ(マシンもそうだし、作業者もね)に求められているのは、「均質な画像」の提供ってことに尽きる。


「均質な画像」を実現するためには、照明、本の置く位置・方法などなど、いろんなことを正確に「リピート」しなくちゃいけないわけ。この「リピート」させるってことが、自動ブックスキャナの持つ付加価値で、最大のところ。

別の言い方をすれば、「自動ブックスキャナを使うと、スキャン後のOCR作業が大幅に省力化できる」ってこと。



もちろん、手動マシンを使っても、正確に「リピート」させることは可能だよ。
実際に日本で撮影されたマイクロフィルムを見れば、おそろしいほどの「均質な画像」で、びっくりする。

でも、その日本の高品質な画像を支えているのは「職人」であって、大量スキャンプロジェクトのために、一斉に50〜100人雇いましょう、って言って集まるもんではない。いくらGoogleがお金持ちでも、こればかりは、お金の問題でもないんで。


だから、大量スキャンプロジェクトには、自動ブックスキャナが必要なんだろう。
そんで、もし「自動マシンと手動マシンの価格差」をきちんと理解するなら、この「均質な画像を提供するための道具」という視点で、自動ブックスキャナを評価する必要がある。さもないと、投資効果が得られないって話で終わる。


もう一度言っておくけど、「誰がやっても、ほぼ同じ画像を提供し続けることができる」ってのが、自動ブックスキャナを導入する意義だよ。1時間に1,000〜2,000ページだっていう作業効率は、ついでについてくる「おまけ」ね。