Amazonで「本が本を読む」様子でもみましょ
前に、本の電子化の「あっち側」ってことで、電子化した画像(+OCRデータ)使って、何やりたいのか、ってのを少し考えた。
http://d.hatena.ne.jp/bookscanner/20060814
一方、「こっち側」の話は、要はインターフェースの問題だよね。見やすいよーに、ってこと。でも、何度か言ってるけど、こんなのおもろくもなんともない。所詮、「みにくい」んだよね。どーんなにがんばったって。
だから、やっぱおもろいのは、「あっち側」。
そんで「あっち側」で、アメリカ(あたり)の優秀(かもしんない)頭脳がたーくさん集まって、血眼になって、何をゴソゴソやってんのか、っちゅうと、
「ある本に違う本を読ませて、自分の中の文章がどこに出てくんのか、自分の中の文章がどっから来たのかってのを探してる」わけ。そんなことして、何になんのか、ってのは、また近い将来詳しく見ていきたいけど、とりあえず、今日は、Amazonに行って、どんなことになってきてるのか見てみましょ。
http://www.futureofthebook.org/blog/archives/2007/03/amazon_starts_to_close_the_loo.htmlでも紹介されてんので、同じ「共産党宣言」でもみてみましょ。でも、英語の方ね。だって、アマゾン日本は、かなり遅れてるから。
とりあえず、http://www.amazon.com/o/ASIN/0140447571に行ってみましょ。Amazonのサイトは、どんどんいろんな機能が追加されてんので、ちょっぴしみにくくなってきたけど、ずんどこ下へ行って、「Citations」ってところへ行こう。
This book cites 15 books
ってなことなので、この「共産党宣言」が他の本を読んだみたところ、「どうやら自分は15冊くらいから、パク*1ってきた感じがするんだよね」って告白してるわけ。
そんで、どの本のどのあたりからパクってきたのか、ってのを、
こんな感じで、一覧表示する。まぁ、人間から見れば、「まだまだアオいな」って感じで、正確に言うとパクりとは言えないよーなもんも含まれてっけど、がんばってると思うよ。
さらに、この「共産党宣言」が他の本を読んだみたところ、「どうやら自分は2,061冊くらいに、パクられてる感じがするんだよね(2061 books cite this book)」って感想をもらしてるわけ。(ずいぶんとパクられたな)
当然、その2,061冊の一覧と、それぞれ、どのページに、パクられた痕跡があるのか、ってのを、事細かに報告してるわけ。リンクまで張ってくれてるから、クリックひとつで、はい、そのページ!
先ほどと一緒で、「パクりとは言えないな」ってのが含まれてんだけど、それでも逆に、「おー、よくこんなもんまで見つけてきたもんだ!」ってのも含まれてる。だから、二長一短くらいで、差し引き「一長」。これは良い!
ってなわけで、結局何が言いたいのかっていうと、
Well, amidst all the discussion of the pluses and minuses of both Google and Microsoft book search, for the past two years Amazon has been quietly doing something exciting.
http://www.futureofthebook.org/blog/archives/2007/03/amazon_starts_to_close_the_loo.html
ってなわけで、「えーっと、ここ数年、GoogleやMicrosoftのスキャンプロジェクトについて、あれが良いだとか、ありゃあかん、ってなことをいろいろと話してたんだけど、その影で、こっそりとAmazonはおもろいことを進めてたんだね」ってこと。こういうAmazonが好き。
*1:決して、悪い意味の「パク」ではないでーす。中立な「パク」。