「とりあえず、やっちゃおう」(大量スキャンにおけるロングテール的なもの)


(本日の要約)
もし、大量スキャン計画にロングテール的なものがあるとすると、「この本はスキャンする必要あるかな、どうしようかな?とりあえず、やっちゃおう!」ってあたりにある(だろう)。


流行言葉を使ってポジションを明確にしておくと、案外、分かってもらえるような気がする。なので、できるだけ使おうと思うんだけど、最先端の言葉は理解するのが大変。だから、少し古いかもしれないけど、今日は「ロングテール」。でも、実証できないし、厳密に言うとちょいと違うので、「的なもの」。



国電子化史上、代表的なもののひとつが、「Making of America」プロジェクト。略してMOA。
MOAについては、いずれ詳しく紹介するつもりなんだけど、今日の話題で重要なのは、「MOAはだいたい10,000冊を電子化した!」ってこと。


10,000冊を電子化する予算が出たぞ、っということになると、「じゃあ、どの本を電子化しよう?」って話になる。
当然、「これが重要だ!」「あれが重要だ!」って話になり、「電子化対象を決める会」ってのが結成されて、投票かなんかして決める。


もし、日本で「Making of Japan」なんてプロジェクトができたとしても、KotoriKoTorikoさんが指摘する「現在の三流漫画の原稿」は、対象から外れてしまう可能性が大。風野春樹さんが書評を書いているこういう本も難しいような気がする。


そういったわけで、「Making of Japan」の最終選考まで残るってのは、すごく大変だよ。


ところが、今回、グーグルUCプロジェクトだと、250万冊でしょ。そしたら、「今日は3列目の本棚を全部やろう!」とかいう感じにできる。(でも、実際は、そんな安易に決めないだろうけどね。)もし、これって電子化しようか?って迷ったら、とりあえず、やっちゃえばいい。


MOAの1万冊に対して、UCの250万冊って規模は、そういうこと。
さらに、グーグルの当初の計画だと、1500万冊でしょ。そしたら、なおさら、「とりあえず、やっちゃおう」色が強まる。


というわけで、「後世に残したい本」という国民投票をしたとして、得票数が多い本はもちろんのこと、そんなに多くなかったロングテーラーたちにも、電子化されるチャンスが訪れる。


でも、念のため言っとくけど、「第3の目的から考えると、スキャン対象を事前に選抜する必要はなくて、全てを電子化した後、本が本を読んでいくうちに、どれが重要で、どれが重要でないかが決まってくる」って順番が正しいはず。「後世に残したい本」という国民投票は、すでに保存・閲覧目的でやることだし、予算の関係上全部をスキャンできない貧乏プロジェクト向けだよ。だから、現在進行中の金持ち大量電子化計画にあてはめた場合、ロングテールグラフの縦軸になるような、指標っていうか、目安というか、何かがないような気がする。


でも、言いたかったことは、MOAでは電子化されないものが、グーグルUCではスキャンされて、その中には、こういう本も含まれるかもしれないよ、ってこと。KotoriKoTorikoさんがテキスト化している講談倶楽部もね。