3,000冊/日って、毎日引越ししてるようなもんだよ


本日の要約:
1日3,000冊で、10日分が滞留するので、平均30,000冊が本棚に。しかも毎日3,000冊の出し入れ、運搬。まるで、毎日引越ししてるようなもんだよ。




グーグルUC契約書の内容は、こちらを見ると、おおよそのことが日本語で書かれている。


ここではいつも通り、他のブログで読めるような内容については触れないで、違うところを見る。


おそらく、「3,000冊/日ってどうやってスキャンするんだ?」って感じで、みんながスキャナについて、詮索するんじゃないかな、って思う。でも、並列処理することを考えれば、たいていのスキャナで可能。たとえば、インターネットアーカイブは、現在10台のマシンで200冊/日と言ってる。(参照)UCのGreensteinさんも3,500冊/月(≒170冊/日)だったと証言しているんだから、まぁ、そんなもんなのだろう。そしたら、3,000冊/日を実現するには、150台のマシンを使えばいいだけ。


日本なら、「150台のマシンをどこに置こう?」なんて問題も発生するかもしれないけど、家にプールがついているのが当たり前というような米国なら、150台くらいのマシンスペースはどうにだってなる。30,000冊の保管場所だって、どうにかなる。


でも、150台のマシンを並べているとすると、体育館みたいな場所だろうから、本棚とマシンの配置はどうする?(仮にインターネットアーカイブよりはるかに性能が良いマシンを使って、3倍の効率出すと考えても、50台が必要だからね。)スキャン後の本は、まとめて返却しなくちゃいけないから、そのあたりの管理もしとかないとね。


あと、図書館側だって、「毎朝3,000冊くらいを書棚からとってきて、箱に詰めて、台車で運んで、午後になったら、3,000冊が戻ってくるから、台車で運んで、箱から出して、書棚に並べ直して」って、そりゃ、一日中本を出し入れしている感じだよ。きっと。


どんだけ大変なのか、実験をすればすぐ分かる。ダンボール60個くらいを持って、最寄の図書館に行って、片っ端から箱に詰めてみれば良い。図書館の人に怒られる前に箱詰めできたら、ラッキー。そしたら、すぐにそのダンボールを全て運びだそう。60人でやれば、1人1個で済む。でも、そのまま持って帰ったりしたら、泥棒だから、すぐに元に戻しに行こう。


まぁ、実体験すれば、「大量スキャンってのは、スキャニングマシンの性能も重要だけど、ロジスティックスがもっと重要だ」って思うはず。体育館に並べるマシンが50台だろうが、150台だろうが、もうどうでもいいよ。ちょっと、本の出し入れ、手伝ってよ!って気分になるはず。