Amazonスキャンはなぜ安い?(3)


過去2回にわたって、Amazonの「1冊1ドル」伝説を検証してたんだけど、最後に、Amazonプロジェクトを、他のプロジェクトと比較してみるよ。そんで、なんでAmazonだけが「1冊1ドル」に挑戦できるのか、ってところね。

本日の命題: スキャン料金は、残したい思い出の量に比例する


Amazonプロジェクトと、他のプロジェクト、例えばGoogleプロジェクトを比較すると、最大の違いは、スキャンしたあとの本の処理にあるんじゃないかな。

  • Aプロジェクト: スキャン終わったら、ポイ捨て
  • Gプロジェクト: スキャン終わったら、ちゃんと耳をそろえて、ご返却

この違いがでる理由は、Aは出版社から提供される最近の本をスキャンしてんだけど、Gは図書館にある古〜い本(思い出びっしり)をスキャンしてるからなんだけど、この違いは結構大きなコスト差となっちゃう。なんでかっていうと、Gプロジェクトに比べて、Aプロジェクトは、次の7点(くらい)で有利だから。

  1. 輸送料金が片道分で済む
  2. 返却に伴う整理作業が省略できる
  3. 裁断しちゃっていいので、スキャン方法が広がる
  4. 比較的新しい本だから、スキャンしやすい(汚破損本は扱い大変)
  5. 貴重本だったら、格安コンテナで1ヶ月の船旅は許可されない
  6. 貴重本ではないので、輸送に伴う保険代が安く済む
  7. 万が一、途中紛失、破損でも、頼めばもう1冊くれる(かもしんない)ので、管理がゆるくて済む


というわけで、「ポイ捨て」できるAプロジェクトは、基本的に安く済む。Aプロジェクトがスキャン後に欲しいのは、そこそこの品質の画像と、OCR済みテキストデータのみ*1。つまり、本そのものなんて、実はどうでも良いんだよね。


ところが、Gプロジェクトにとって、本そのものはとても重要。(Gがどう考えてんのか知らんけど、)その本を提供している図書館にとっては、虎の子を預けるくらい心配で心配で、本が返ってくるまで食事も喉を通らない。だから、スキャンプロジェクトが開始して、最初の頃は、おそらく図書館関係者がスキャン現場にうろちょろしてて、作業をじろじろ見てんだよ。そんで、「あ〜、そんな雑に扱ったら、本が泣いちゃうよ」なんて、心の中でソワソワしてんだよ。作業者にとっては、ちょっとだけ迷惑。


そんで世の中、60円バーガーを売ってた店もあれば、反対に1,000円バーガーを売ってた店もあるらしい。書籍電子化における60円バーガーはAmazonプロジェクトが提供し、逆の1,000円バーガーは、慶応大学のHUMIプロジェクトあたりが提供する。このHUMIプロジェクトの撮影風景を見てみよう。ビデオの最後の方に、「パシャッ」って撮影した場面があるでしょ。そんとき見えるのが、カメラマン、その横の人(何やってんだ、この人?)、そんで本を押さえる男女1名づつってなわけで、究極の人海戦術だね。しかも、本を押さえてる二人は、なにやら怪しい白い手袋までしちゃってるよ。*2こっちのレポートを読んだりすると、実はもっとたくさんの人が、関係してんだってことがわかる。こりゃ、1冊数万ドルってレベルだよね。(計算方法によっては、もう一桁上かも。)というわけで、HUMIプロジェクトを考えると、Googleの提供してんのは、せいぜい300円バーガーくらいになんのかな。

さらに、HUMIプロジェクトに関して、おもろいのが、このプロジェクトにとって、撮影した画像も、本そのものも大切なんだけど、それとおんなじくらい「スキャン作業そのもの」も大切。*3「連載 : HUMIプロジェクトの貴重書デジタルアーカイブ」って感じで、プロジェクトそのものが「思い出」として、『情報の科学と技術』っていう雑誌の2006年4月から連載で、書かれてたりする。(10周年記念だしね。)


というわけで、結局何が言いたいのかっていうと、Amazonが安上がりにスキャンできんのは、単にスキャン後のデータだけが欲しくて、本にまつわる「思い出」は一切関係ないからだよってこと。そんで、「思い出」を引きずれば引きずるほど、スキャン費用は高騰しちゃう。さらにスキャン対象(本)だけでなく、スキャン作業の「思い出」までも残しておきたいとなると、とんでもない値段になっちゃう。だから、もしスキャンにいくらかかるんだろう、って思ったら、まず「どれだけ、思い出を切り捨てられるんだろう?」って考えてみてね。Amazonレベルの割り切りができるなら、「1冊1ドル」も夢じゃない。(Amazonレベルの規模も必要だけどね。)


次回は、「スキャン現場へご招待」。でも、そろそろ(あと2週間くらいで)アメリカはホリデーシーズン突入。まちはジングルベルで浮かれ気分。更新ペースが落ちるかもしんない。

*1:すでにImage Coordinatesとかを紹介してるので、分かってもらえると思うけど、Aが必要なのはページ情報まで。これってかなりプリミティブだよね。

*2:念のため書いておくけど、米国で進行中の電子化プロジェクトでも、ちゃんと手袋する場合もあるよ。でも、たまに手袋が汚くて、意味ない時もあるけどね。

*3:そういった意味では、前回紹介した「インドへ試しに6,000冊を送ってみた」プロジェクトみたいのも、「やってること」にも意味があるって類。