一体Googleはいくら使ったの?


さて、昨日に引き続き、ニューヨークタイムズの記事をみましょ。昨日とセットで見てね。

http://www.nytimes.com/2007/03/10/business/yourmoney/11archive.html?ex=1331355600&en=ac8d2f50c8dfc12d&ei=5124&partner=permalink&exprod=permalink

この記事によると、

In its quest to scan every one of the tens of millions of books ever published, Google has already digitized one million volumes. Google refuses to say how much it has spent on the venture so far, but outside experts estimate the figure at at least $5 million.

というわけで、「Googleはこれまでに100万冊スキャンしたらしい。そんで、これまでにいくら使ったのか言わんけど、事情通に言わせると、最低でも500万ドルはかかったんではないか」ということらしい。つまり、1冊5ドルくらい。(いままでにも何度か、スキャンのコストについては話をしてんので、だいたいの相場には少しは慣れたかしらん?)


さて、この「1冊5ドル」ということについて、考えましょ。


今から3年ほどまえの2003年、何度か伝えてるよーに、「1冊1ドル」伝説が生まれた。(http://d.hatena.ne.jp/bookscanner/20061106/p1


それから1年(2004年暮れ)、Googleが騒ぎを起こしはじめた頃、「1冊10ドル」ってな噂が流れた。(いまだに誰が震源地かつかめてないけど、bookscanner考古学はあらゆる手段を使って、発掘作業を進めてんので、いつか忘れた頃に、報告できるかもね。)


当時のこちらの記事をご覧あれ。(http://newsbreaks.infotoday.com/nbreader.asp?ArticleID=16302

When asked about feasible costs for digitization (estimated by some at $10 per book), Gordon Macomber, president and CEO of Thomson Gale (which has extensive experience in digitizing its Eighteenth Century Collections Online and Nineteenth Century Collections Online licensed products), indicated that $10 per book was below Gale's experienced cost.

ってなわけで、経験豊富なMacomberさんによると、「1冊10ドル」ってのは、これまでにない破格の値段だな、ってことらしい。


ついでだから、2つだけケチつけとくね。
1.Quintさんの記事で、「estimated by some at $10 per book」って言ってるんだけど、1冊10ドルだって言いだした奴に関して、「some」(誰か)ってのは、かなりいい加減な話だよね。もう少し追求しようよ。それか、かなりいい加減な数字だって、注意書きしとこうよ。
2.事情通のMacomberさんを引き合いに出してるけど、この人、18世紀とか19世紀の「きちょーな本」をスキャンする専門家でしょ。こんなの最高級フレンチレストランの人に、マックのポテトは1ドルくらいなんだけど、安い?って聞くようなもんだから、あんまし意味無さそー。


それからさらに1年。2005年になったら、Microsoftが英国図書館(The Britich Library)の本を10万冊(2500万ページ)スキャンしますよ、って発表したときに、Mは250万ドルの予算だって発表した。*1そんで、この数字はさ、Mが実際に発表したんだから、ある程度信用できるよね。でも、あくまで予算として確保しただけだから、実際のコストじゃないよ、そこんとこは勘違いせんといてね。このあたりから、「1冊25ドル」説がちらほらと散見。


最近だと、「New Yorker」ってな有名な雑誌に、『Google's Moon Shot』って記事が載ってて、オンラインだと見れんくなってるけど、こっちに行くと、どーにか見れるよ。(http://72.14.253.104/search?q=cache:J-KeOfdfxr8J:www.newyorker.com/printables/fact/070205fa_fact_toobin&hl=ja&ct=clnk&cd=2&gl=jphttp://www.newyorker.com/reporting/2007/02/05/070205fa_fact_toobinで見れる、とのこと。

In 2005, Microsoft announced that it would spend two and a half million dollars to scan a hundred thousand out-of-copyright books in the collection of the British Library. At this rate, scanning thirty-two million books—the number in WorldCat’s database—would cost Google eight hundred million dollars, a major but hardly extravagant expenditure for a multibillion-dollar corporation.

ってな感じで、「Mは10万冊を250万ドルでやるっていうから、もしWorldCatにある3200万冊の本をやるとすると、8億ドルかかるね」ってな風に使われるわけ。


続く、2006年は穏やかな年で、スキャンコストの話といえば、もっぱら2003年の1ドル説か、2004年の10ドル説か、2005年の25ドル説かで説明のつくくらいプリミティブな推論か、出所を理解してない「単なる伝聞」ばっかだった。


ところが、今回のニューヨークタイムズの記事は、新たな1冊5ドル説を持ち出して、しかも、「outside experts」が推計したってことになってる。相変わらず、タチの悪い、ソースのはっきりしない情報だね。でも今回の記事は、結構反響あったっぽいから、これからいろんな人が知ったふりして、「あー、あのGoogleがやってる本のスキャンでしょ。あれ、1冊5ドルくらいでやってるらしいよ」ってな話をするかもしんない。こういうときは、暖かい目で見てあげましょ。


さて、そんなこんなで結局何が言いたいのかって言うと、「Googleはコストの話を完全シャットアウトしてんので、一体いくらでやってんのか、なんて分かりゃしないよ。そーすっと、みんなが勝手に試算するわけ。だから、いろんな数字が出てくるんよ。でも、みんなは、最低でも、1ドル/5ドル/10ドル/25ドル*2ってのが、どっからでてきた話なのか、おおよそ分かってんので、混乱せずに済むよね」ってこと。

*1:例えば、http://www.ft.com/cms/s/b977c208-4cb3-11da-89df-0000779e2340.html

*2:次は1冊50ドル説あたりが出てくるとオモロイな