Amazonスキャンはなぜ安い?(2)


前回は、巷の「1冊1ドル」説はかなりいい加減!って話をした。でも、今回は翻って、(できるだけ具体的に見ていくことで、)「Amazonは、本当に1冊1ドルくらいでスキャンしてるかもしんない」ってことを書く。(でも、かなりいろんな条件がつくけどね。)



大前提

  • Amazonは、スキャン対象本を、タダでもらえる (この前提が崩れると、全く話にならん)
  • スキャンした本は、そのままポイ捨てするけど、環境団体からは訴えられない (10万冊だと約25トンのゴミになる)*1
  • クオリティは、「なか見!」で使える程度でよい (スキャンレベルとして、10段階の2くらいかな)
  • OCR処理などは、料金にふくまれない


順番に見ていこう。


まず、アメリカからインドへ本を送るといくらくらいかかんの?こういうときは、実際に送ったことのある人に聞けばよい。(http://www.library.cmu.edu/Libraries/MBPfinalNO_PICTS.pptの12ページ見てね。)

6000 Book Pilot Shipment to India (インドへ試しに6,000冊を送ってみた)


20 ft ocean container - 25 days NY to Chennai (NYから出て、25日で到着した)

  • 243 boxes - 9 palettes - 11,298 lbs - duty free (243箱、9パレット、重さ約5トン、関税なし)
  • Mostly public domain - government documents, social science, biography, history, & literature (ほとんどがパブリックドメインの本)
  • Approximate cost $2 per book round trip (往復で1冊2ドルの運賃)
  • 4000 books did not have to be returned (4,000冊は返却不要、ポイ捨て)
  • 2000 books were returned in good condition (2,000冊は、ちゃんと戻ってきた)
  • August 2002 to August 2003 (2002年8月〜2003年8月)

ってな感じで、試しに送ったら片道1冊1ドルだったって。でも、次の13ページで、「もっとうまくやれば、1冊0.5ドルまで値切れたな、こりゃ」って反省してる。そんで、Michael Leskさんが言うには、「1冊0.2ドルでインドまで送れるよ」*2ってことらしい。 ただ、これって、ちゃんとアメリカ国内での出荷作業費だとか、インドについてからの本の仕分け作業費とかも、入ってんのか、ちょいと分からん。

まぁ、そんなわけなので、とりあえず、1コンテナに20,000冊(重量10トンくらい)ずつ押し込んで、それを4,000ドル/コンテナでインドまで届けてもらおう。(某運送会社に電話してみたら、「可能だよ」って答えだったけど、あれこれ条件がつくらしい。詳しくは最寄の運送会社まで。*3)そんでもし、アメリカ国内での出荷作業費が足りなくなったら、出版社にお願いして、本を無料でくれるついでに、労力も提供してもらっちゃおう。というわけで、輸送費は1冊0.2ドル


次にスキャン作業だけど、独断と偏見により、Fujitsu ScanSnap S500をスキャナとして選んでみた。*4300dpiでカラースキャンすると、だいたい普通の大きさの本なら、本のセッティングなども含めて、30分以内に1冊終了するはず。


ということは、スキャナ代金として:
10万冊のスキャンをする場合、このスキャナの耐久性(いくらなんでも、20万〜25万ページ、つまり600〜700冊はスキャンできるでしょ)も考慮して、150台くらい必要。1台あたり350ドル程度で調達できるはずなので、1冊あたり0.53ドル(≒150×350÷100,000)。このスキャナをインドまで運ぶ輸送費は、このさい、Fujitsuにお願いしよう。


そんで、人件費として:
1冊30分としてるんだから、時給÷2ってのが、1冊あたりの人件費になる。そんで、今「1冊1ドル」計画だとすると、輸送費0.2ドル、スキャナ代0.53ドルを差し引いて、残り0.27ドルを1冊あたりの人件費として使えるので、時給としては0.54ドル払えることになる。こういう話などを総合してみると、時給0.54ドルを払えば、十分に働いてもらえそうな気がすんだよね。(インドは行ったことないので、実際の物価などは分からんので、誰か知ってたら教えてね。)


と、ここまでくれば、あとは作業日数を決めるだけ。何ヶ月で終了しましょっか?とりあえず、最短コースとして、

  • 150台のスキャナを24時間まわしっぱなし(スキャナが火噴くかどうかは別として)
  • 1日6シフト(1人あたり4時間作業)
  • 合計900人を雇う (=150人x6シフト)

という感じなら、1日あたり7,200冊スキャンできるので2週間で終了することになる。
それか、スキャナの耐久性を第一に考えて、

  • スキャナ1台あたり1時間しか稼動させず
  • 1日5時間作業で30人を雇う
  • 30人の作業者は1時間ごとにスキャナをかえ、1日に5台を扱う

ってな感じの、のんびりモードなら、だいたい1年かかる。要するに、「スキャナの限界までワーっと一気にやるか」、「スキャナ温存でいくか」、の両極端の間で、適当なところを選択すればよい。まぁ、中間くらいの3ヶ月〜6ヶ月プランがおススメだけどね。


というわけで、結論として、まぁ、「1冊1ドル」でやれないことはない。あとは、細かい点で、

  • インドの時給はもっと高いはずだ、とか
  • あのスキャナはそんなに耐久性ないぞ、とか
  • インドの電気代はものすご〜く高いぞ、とか
  • インドの電気事情はとても悪くて、停電を計算にいれろ、とか

出てくれば、修正すれば良いわけ。あくまでたたき台として出しただけだから、いっぱいたたいといてね。*5


ただ、忘れんといて欲しいのは、「1冊1ドル」ってのには、たーくっさんの前提条件が付けられてるってこと。だから、どちらかと言えば、「スキャンって部分だけ限定してインドでやるってんなら、1冊1ドルかもね」ってこと。それでも、かなり限定した部分だけでも、本当にそんな安くできちゃうなら、やっちゃう意義はあるよ。だって、大量スキャンプロジェクトってのは、本当に大量の本をスキャンすんだから。Aプロジェクトで言えば、コストを1冊1ドルでも安くしたら、10万ドル以上の節約になるよ。だから、大量スキャンプロジェクトにとっては、たった1セント/冊の節約提案でも、喜んで聞く準備がある。


そんで、今のところ、数ある大量スキャンプロジェクトの中でも、とりわけAmazonスキャンプロジェクトだけが、こんな「1冊1ドル」スキャンを実現できそうなんだけど、次回はその理由を書くつもり。他のプロジェクトだと、やりたくてもできない事情がある。

*1:ちなみにhttp://www.rs.noda.tus.ac.jp/~suzulab/hiroba/kankyo/suijun/gomi1-j.htmlによると、東京都のゴミは1日に1万トン以上ね

*2:http://www.scils.rutgers.edu/~lesk/bl-sep04b.ppt の24ページ

*3:でも、テキトーに質問して、テキトーに答えてもらったので、全く信用できんと思ってね。

*4:詳しくは、こちらを参考にしてね。http://pc.watch.impress.co.jp/docs/2006/0406/pclabo36.htm。選択基準としては、計算するためのデータがネットで入手できるかどうか、って観点だけね。だから、製品の実際性能とかは、全く考えてない。

*5:例えば、例としてあげたプランだと30分のスキャン中、作業者はボケーっとしてることになる。だったら、1人で5台くらい担当させて、本セットしてスタートボタン押したら、次のスキャナでセットしてスタート、そんで5台くらい回ったら、最初の1台目がスキャン完了してんでしょ、って感じのローテーションもありだよね。