Googleが目指すは、「ページの切り売り」なんてショボいもんじゃない

もう1年も前になるけど、Amazonが「ページの切り売りを始めますよ」って発表した。この記事のTBとかを見れば、当時の反応が分かる。


いまや、時代は、ページ単位でもない。
どんな単位なのかってことは、こちらをみてね。


さらに、


Gregory Craneさんは、前にも紹介した論文で、

As digital libraries mature and become better able to extract information (e.g., personal and place names), each word and automatically identifiable chunk of words becomes a discrete object. In a sample 300 volume, 55 million word collection of nineteenth-century American English, automatic named entity identification has added 12,000,000 tags. While this collection focuses on name rich historical materials and includes several reference works, this system already discovers thousands of references to named entities in most book length documents. We thus move from single catalogue entries with a few hundred words to thousands of tagged objects – an increase of at least one order of magnitude with named entities and of at least two orders of magnitude when we consider each individual word as an object.

って書いてて、要するに「電子化が進むと、単語ってのが単位になるよ。そーすっと、すごいことになるよ。ためしに300冊の本でやってみたけど、単語としては5500万単語あって、その単語に自動的にタグ付けさせたら1200万タグもできたよ。・・・1冊の本が急に、10倍、いや100倍の情報量に、膨張するってことだよ」らしきことを言ってる。(このあたりは、今度詳しく紹介する予定。)


そんで、今紹介している"Image Coordinates"は、その単語さえも分割して、文字単位での管理を可能にするわけさ。


というわけで、「今、みんなが争っている単位レベル("Granularity of objects")」ってのをちゃんと理解しとかんといけんわけ。そんで、当面、文字レベルを超えることはなさそうなので、そこが「いろんな商品・サービス」の激戦区になるわけさ。


ただ、この記が言いたいのは、「GoogleAmazonもすごいこと考えてるね〜」って側の話じゃない。そんなことは、Google好きやAmazon好きな人なら、もっと詳しく話をしてくれるはず。そっちじゃなくて、「"Image Coordinates"ってそんなに可能性を秘めたもんなのに、UCにあげちゃうんだね、びっくりだね、それと引き換えにGoogleが獲得したのは・・・」ってこと。