Amazonで「本が本を読む」様子でもみましょ


前に、本の電子化の「あっち側」ってことで、電子化した画像(+OCRデータ)使って、何やりたいのか、ってのを少し考えた。
http://d.hatena.ne.jp/bookscanner/20060814


一方、「こっち側」の話は、要はインターフェースの問題だよね。見やすいよーに、ってこと。でも、何度か言ってるけど、こんなのおもろくもなんともない。所詮、「みにくい」んだよね。どーんなにがんばったって。


だから、やっぱおもろいのは、「あっち側」。
そんで「あっち側」で、アメリカ(あたり)の優秀(かもしんない)頭脳がたーくさん集まって、血眼になって、何をゴソゴソやってんのか、っちゅうと、
ある本に違う本を読ませて、自分の中の文章がどこに出てくんのか、自分の中の文章がどっから来たのかってのを探してる」わけ。そんなことして、何になんのか、ってのは、また近い将来詳しく見ていきたいけど、とりあえず、今日は、Amazonに行って、どんなことになってきてるのか見てみましょ。


http://www.futureofthebook.org/blog/archives/2007/03/amazon_starts_to_close_the_loo.htmlでも紹介されてんので、同じ「共産党宣言」でもみてみましょ。でも、英語の方ね。だって、アマゾン日本は、かなり遅れてるから。


とりあえず、http://www.amazon.com/o/ASIN/0140447571に行ってみましょ。Amazonのサイトは、どんどんいろんな機能が追加されてんので、ちょっぴしみにくくなってきたけど、ずんどこ下へ行って、「Citations」ってところへ行こう。

This book cites 15 books

ってなことなので、この「共産党宣言」が他の本を読んだみたところ、「どうやら自分は15冊くらいから、パク*1ってきた感じがするんだよね」って告白してるわけ。


そんで、どの本のどのあたりからパクってきたのか、ってのを、

こんな感じで、一覧表示する。まぁ、人間から見れば、「まだまだアオいな」って感じで、正確に言うとパクりとは言えないよーなもんも含まれてっけど、がんばってると思うよ。


さらに、この「共産党宣言」が他の本を読んだみたところ、「どうやら自分は2,061冊くらいに、パクられてる感じがするんだよね(2061 books cite this book)」って感想をもらしてるわけ。(ずいぶんとパクられたな)


当然、その2,061冊の一覧と、それぞれ、どのページに、パクられた痕跡があるのか、ってのを、事細かに報告してるわけ。リンクまで張ってくれてるから、クリックひとつで、はい、そのページ!


先ほどと一緒で、「パクりとは言えないな」ってのが含まれてんだけど、それでも逆に、「おー、よくこんなもんまで見つけてきたもんだ!」ってのも含まれてる。だから、二長一短くらいで、差し引き「一長」。これは良い


ってなわけで、結局何が言いたいのかっていうと、

Well, amidst all the discussion of the pluses and minuses of both Google and Microsoft book search, for the past two years Amazon has been quietly doing something exciting.
http://www.futureofthebook.org/blog/archives/2007/03/amazon_starts_to_close_the_loo.html

ってなわけで、「えーっと、ここ数年、GoogleMicrosoftのスキャンプロジェクトについて、あれが良いだとか、ありゃあかん、ってなことをいろいろと話してたんだけど、その影で、こっそりとAmazonはおもろいことを進めてたんだね」ってこと。こういうAmazonが好き。

*1:決して、悪い意味の「パク」ではないでーす。中立な「パク」。