2006-09-01から1ヶ月間の記事一覧
昨日、なんで「Kevin Kellyさんの記事」が、「本が本を読む」というキーワードと関連付けられたのが分からん、って書いたら、tmasaoさんと通りすがりさんが、「アンカーテキストの効果だよ」って教えてくれた。そんで、場合によっては、「その周辺50文字程度…
昨日、私が寝ている間に、美崎さんが来て、コメントをくれた。その後、fuzzy2さんとちょっとした理由から、コメント欄で話し合ってる。 他の人が見逃したら、もったいないので、引用しておく。
先ほどの二人の話は、まだまだ続く。おふたりへ、迷惑なんてことはないので、どんどんここで話し合っちゃってくだされ。みんなへ、私はそろそろ寝る時間なんで、実況中継できないけど、こまめにコメント欄でもチェックしてくだされ。 おやすみなさい。 ちな…
「ブログ炎上」って言葉があるってのは聞いてたけど、今ここで起こっている良い意味の、しかもまだ小さな「炎上」みたいなもんは、なんと呼ぶのかな?もし名前があったら、教えて。「ブログ白熱」かな? というわけで、美崎さんがうちにやってきて、コメント…
前からひとつだけ疑問に思ってて、いまだに解決できんことがある。 それは、Googleで、結果を英語だけに絞って「本が本を読む」って検索してもらうと、「Kevin Kellyさんの記事」が出てくること。
中山さんの「参入障壁論」は、確かに説得力がある。でも、GoogleはPh.D集団だよ。MBA集団だったら、ほぼ間違いなくそういうことやるだろうけど、世界一の変人企業であるこのPh.D集団が、障壁なんて考えるのかな?また、梅田さんの伝える「グーグルの特異性と…
美崎薫さんと言えば、巷では、BTRONというもので有名なんだそうだが、知らんかった。 そもそもBTRONというものを知らんかった。私はてっきり、美崎さんと言えば、「記憶する住宅プロジェクト」の人なのだと、ず〜っと思ってた。少なくとも今年の初めくらいま…
三上さんが、『グーグルが本の電子化で狙う「うまみ」の正体は』というエントリーで、この記で書いていることについて、かなり真剣に分析してくれた。正直言って、とってもうれしい。だから、三上さんの書いた内容について、こっちも真剣に応える。
日本では、とうとう16団体が著作権保護期間延長を求めたらしい。Copy&Copyrightさんによると、 (著作権保護期間の延長について)要望を出す...理由が「世界標準」というのは、何も考えていない証拠 ということで、なかなか情けない状況のようだ。情けない団…
昨日は、スキャンした画像ってのは、残念ながら傾いちゃうって話をした。 この(日)記は、具体例を挙げるのがモットーなので、どんくらい傾くのか、(かなり)具体的に話をしとく。マニア度がちょっと高めなので、ご注意あれ。 下の2枚の写真は、スキャン直…
9月11日に書いたものの続編。前回の要約 出版された当時は「同じ本」だったものが、汚れたり、書き込みされたり、折られたり、切られたりして、もはや「スキャン」上「同じ本」とは言えないようになってる という感じで、本の状態に注目して「本の大量スキャ…
本の電子化について、いろいろ書いてるんだけど、この(日)記が一番言いたいことは、「グーグル(とかYahoo、MSNなど)が本を電子化しているのは、人間が読むためじゃないよ」ってことに尽きる。この点は、かなり誤解されてて、というか過剰に期待されてて…
最近、著作権絡みのリングに登録したので、これから、著作権関係も話題にしようと思う。 第1弾として、「Google Book Searchで「海外ユーザー」に対してアクセス制限がされている」という問題。 この本って日本から見れる?こっちは? 上がミシガン大学が提…
「自動ブックスキャナを使うと、スキャン作業が省力化できる」ってのが通念だけど、スキャン作業における省力化なんて、たかが知れてる。正確に言うなら、「自動ブックスキャナを使うと、スキャン後のOCR作業が大幅に省力化できる」ってこと。
確かに、本の分類上、おおよそ「ISBNが同じなら同じ本」と言えるんだろうけど、大量スキャンプロジェクトの基準で言うと、「ダブりなんてない」って言える。また大量スキャンにおいては、「ダブる」ことは大して怖くないとも言える。「ダブり」に関するしめ…
日記をはじめて1ヶ月経った。だから気分一新。(デザイン変更)そんで、やっと気づいたけど、毎日書くのは大変。日記だから、毎日書かなきゃって思ってたけど、回りを見回してみたら、結構みんな毎日は書いてなかった。もっと早く気づけばよかった。なので、…
昨日は、「ダブり」かどうか判定するのも楽じゃない、ってことを書いた。そしたら、UNさんが、「これは一つの本なのか否か、分かりにくい本」の例をいくつか紹介してくれた。黒澤さんからは、「人名(本名も変化するし、人類の半分は、改名する、ペンネーム…
昨日は、グーグル1500万冊のうち、450万冊がダブってて、まぁ割とダブりがすくないんじゃないの、って話をした。myrmecoleonさんやkusamisusaさんも「少ないな」と言ってくれた。でも、「ダブりって何さ?」って聞かれると、分かってたようで、実はあまり分…
9月2日に、kikoriさんから、 (仮に)国会図書館に800万冊、ICU図書館に65万冊の本があっても、865万種類の本があるわけじゃなくてある程度というか何万冊もダブりがあるわけですよね?となると、無駄なダブりを防ぐ為に情報交換が必要なんじゃないかと思う…
9月1日のエントリーで、「この本棚を全部やろう!」という感じの「とりあえず、やっちゃおう」的な考えがありうることを紹介した。そんでこっちで、「大量スキャンにおいては、ロジスティックスが重要だよ」って言ったけど、そんなの具体的に考えてみないと…
米国で進行中の「本の電子化」が、日本で少しでも理解されたら良いな、と思って書いてるんだけど、この日記だけだとやっぱ限界がある。あとは、みんなが酒飲んでるときに話題にしてくれるのを待ってる。(かなり他力本願だけど。) そんときの小ネタをたまに…
(本日の要約) もし、大量スキャン計画にロングテール的なものがあるとすると、「この本はスキャンする必要あるかな、どうしようかな?とりあえず、やっちゃおう!」ってあたりにある(だろう)。