Amazonスキャンはなぜ安い?(1)

ここ2年くらい、よく質問されることがある。

中国とかでスキャンすると、本当に1冊1ドルくらいでできるんの?

って質問。これって、かなり返答に困るんだよね。何でかって言うと、


質問した人は、「YesかNo」って返答を期待してんだけど、どう考えても、そんな単純な話じゃない。でも、しょうがないから、「だいたい10万冊くらいをスキャンする覚悟があって、しかもその本が返ってこなくてもいいんだったら、可能かもしんないよ」って言って、お茶を濁す。でも、たいてい質問した人は、その返答に満足そうなので、そこで終わる。


この記には、お茶を濁さず書いとくね。3回シリーズ(くらい)。
まず今日は、ちょいと寄り道から。「1冊1ドルだなんて、誰が言いだしたんだ?


言いだしっぺは、ズバりGary Wolfさん。2003年10月くらいに、Wolfさんの『The Great Library of Amazonia』というのがネットに公開されて、かなり反響あった。おそらく、覚えてる人もいるはず。そこに、

Fortunately, mass scanning has grown increasingly feasible, with the cost dropping to as low as $1 each. Amazon sent some of the books to scanning centers in low-wage countries like India and the Philippines; others were run in the United States using specialty machines to ensure accurate color and to handle oversize volumes. Some books can be chopped out of their bindings and fed into scanners, others have to be babied by a human, who turns pages one by one. Remarkably, Amazon was already doing so much data processing in its regular business that the huge task of reading the images of the books and converting them into a plain-text database was handled by idle computers at one of the company's backup centers.

って書いてある。要は、「Amazonはインドとかフィリピンに本を送ってスキャンしてて、1冊あたり1ドルなんだよ」ってこと。知る限り、これが「1冊1ドル」説の起源(かも)。そんで、当時の常識から考えて、このAmazonスキャンのコストは、かなり安い。


そんで、この記事はかなりタチが悪い。何でかって言うと、一番肝心の「誰から聞いたの?」ってことが、完全に抜け落ちてる。Wolfさんの記事の中で、Kahleさん(有名人)、Manberさん(有名人)、Bezosさん(AmazonのCEO)、Kesselさん(Amazon副社長、この写真の右から3番目)あたりが、Amazonの「インナーサークル」として登場してるが、重要な「誰から聞いたのか」ってことをWolfさんは明示してない。あやしい。(というより、ズルい。)


しかも、Wolfさんの文章からは、「1冊1ドル」って料金にどこまで含まれてんのか、さっぱり分からん。Wolfさんは、Amazonの大量スキャン(mass scanning)のおおよその内訳として、

  • 本をインドとかフィリピンに送る
  • 一部はアメリカでやる
  • 本を裁断する
  • スキャナにかける
  • 手でめくってスキャンするものもある
  • OCRをかける

というのが挙げられてるけど、これ全部ひっくるめて、「1冊1ドル」なのか、不明。そうすっと、特に(明らかに1冊1ドルは不可能である)アメリカで作業する分も含めて、平均1冊1ドルだとすると、アメリカ作業の比率によっては、インド・フィリピン料金は「1冊1ドル」よりず〜っと低くなるよ。


というわけで、Wolfさんの記事は、かなり「ゴシップ」系だよ。あんまし、数字を真に受けちゃ、いけない。


ところで、もうひとつのちょい「ゴシップ」系有名記事である、Kevin Kellyさんの「Scan This Book!」では、スキャンコストに関して、

It costs $30 to scan a book at Stanford but only $10 in China.

というわけで、「アメリカで1冊30ドルくらいかかるけど、中国なら1冊10ドルだよ」って書いてる。これは中国の「超星数字图书网(superstar)」っていうところに取材して聞きだしてきたのかもしんないけど、情報源はいまいち分からん。(superstarについては、今度詳しく紹介する予定。すごいよ、この会社。)


さらに、「インドでスキャンすると3ドルだ」とか、「5ドルくらいだろう」とか言う話はいくらでも出てくる。でも、みんな結局、どこまでその料金に含まれてんのか、っていうあたりがあいまいで、比較しようがない。


まぁ、こんな感じで、結局何が言いたいのかって言うと、「1冊1ドル」って話は、「本当に1ドルでできるのか?」って感じで考えないでねってこと。そうじゃなくて、かなりいい加減な話として、「中国、インド、フィリピンあたりで作業すれば、アメリカでスキャンするより、安くできるんだろうな」って程度の話ね。あまり深く考えてない「アウトソーシング神話」のひとつってこと。そんで、そんないい加減なコストの話はもういい加減やめようよ、っていいたいよ。


次回は、出所はそんないい加減な話だったとしても、それでも、インドでやれば安いんでしょ?ということを、できるだけ具体的に見て、検証しましょ。