やっぱりどう考えても、検索エンジンは賢いよ

その他

昨日、なんで「Kevin Kellyさんの記事」が、「本が本を読む」というキーワードと関連付けられたのが分からん、って書いたら、tmasaoさんと通りすがりさんが、「アンカーテキストの効果だよ」って教えてくれた。そんで、場合によっては、「その周辺50文字程度…

2006-09-29

　美崎さんがやってきた！

その他

昨日、私が寝ている間に、美崎さんが来て、コメントをくれた。その後、fuzzy2さんとちょっとした理由から、コメント欄で話し合ってる。他の人が見逃したら、もったいないので、引用しておく。

2006-09-29

　美崎さん、fuzzy2さん、しばらくうちでやっちゃってくだされ

その他

先ほどの二人の話は、まだまだ続く。おふたりへ、迷惑なんてことはないので、どんどんここで話し合っちゃってくだされ。みんなへ、私はそろそろ寝る時間なんで、実況中継できないけど、こまめにコメント欄でもチェックしてくだされ。おやすみなさい。ちな…

2006-09-29

　「Web2.0の一連のサービスについて、わたしはあまり高くは評価していません」

電子化の先

「ブログ炎上」って言葉があるってのは聞いてたけど、今ここで起こっている良い意味の、しかもまだ小さな「炎上」みたいなもんは、なんと呼ぶのかな？もし名前があったら、教えて。「ブログ白熱」かな？というわけで、美崎さんがうちにやってきて、コメント…

2006-09-28

　検索エンジンって、かなり賢いかも

その他

前からひとつだけ疑問に思ってて、いまだに解決できんことがある。それは、Googleで、結果を英語だけに絞って「本が本を読む」って検索してもらうと、「Kevin Kellyさんの記事」が出てくること。

2006-09-27

　美崎薫さんは「2009年に来る3年後の未来は日々体験ずみ」なんだって

電子化の先

中山さんの「参入障壁論」は、確かに説得力がある。でも、GoogleはPh.D集団だよ。MBA集団だったら、ほぼ間違いなくそういうことやるだろうけど、世界一の変人企業であるこのPh.D集団が、障壁なんて考えるのかな？また、梅田さんの伝える「グーグルの特異性と…

2006-09-26

　美崎薫さんと言えば、BTRONなんだそうだが...

スキャンプロジェクト

美崎薫さんと言えば、巷では、BTRONというもので有名なんだそうだが、知らんかった。そもそもBTRONというものを知らんかった。私はてっきり、美崎さんと言えば、「記憶する住宅プロジェクト」の人なのだと、ず〜っと思ってた。少なくとも今年の初めくらいま…

2006-09-25

　『グーグルが本の電子化で狙う「うまみ」の正体は』に応える①

電子化の先

三上さんが、『グーグルが本の電子化で狙う「うまみ」の正体は』というエントリーで、この記で書いていることについて、かなり真剣に分析してくれた。正直言って、とってもうれしい。だから、三上さんの書いた内容について、こっちも真剣に応える。

2006-09-23

　あんまし派手に、ヤバいことしないで、ってコーネル大学が言った

著作権

日本では、とうとう16団体が著作権保護期間延長を求めたらしい。Copy&Copyrightさんによると、（著作権保護期間の延長について）要望を出す...理由が「世界標準」というのは、何も考えていない証拠ということで、なかなか情けない状況のようだ。情けない団…

2006-09-20

　どんくらい傾くのか？見てみよう。

周辺情報

昨日は、スキャンした画像ってのは、残念ながら傾いちゃうって話をした。この（日）記は、具体例を挙げるのがモットーなので、どんくらい傾くのか、（かなり）具体的に話をしとく。マニア度がちょっと高めなので、ご注意あれ。下の2枚の写真は、スキャン直…

2006-09-19

　大量スキャンプロジェクトにおいて、ダブりなどない②

スキャンプロジェクト

9月11日に書いたものの続編。前回の要約出版された当時は「同じ本」だったものが、汚れたり、書き込みされたり、折られたり、切られたりして、もはや「スキャン」上「同じ本」とは言えないようになってるという感じで、本の状態に注目して「本の大量スキャ…

2006-09-16

　「誰が読むんだ？」ってものを、Googleだけはコツコツ読んでる

電子化の先

本の電子化について、いろいろ書いてるんだけど、この（日）記が一番言いたいことは、「グーグル（とかYahoo、MSNなど）が本を電子化しているのは、人間が読むためじゃないよ」ってことに尽きる。この点は、かなり誤解されてて、というか過剰に期待されてて…

2006-09-14

　Google Book Searchで「海外ユーザー」に対してアクセス制限がされている問題

著作権

最近、著作権絡みのリングに登録したので、これから、著作権関係も話題にしようと思う。第1弾として、「Google Book Searchで「海外ユーザー」に対してアクセス制限がされている」という問題。この本って日本から見れる？こっちは？上がミシガン大学が提…

2006-09-13

　自動ブックスキャナの導入は、スキャン作業の省力化が主な目的ではない

スキャナ

「自動ブックスキャナを使うと、スキャン作業が省力化できる」ってのが通念だけど、スキャン作業における省力化なんて、たかが知れてる。正確に言うなら、「自動ブックスキャナを使うと、スキャン後のOCR作業が大幅に省力化できる」ってこと。

2006-09-11

　大量スキャンプロジェクトにおいて、ダブりなどない①

スキャンプロジェクト

確かに、本の分類上、おおよそ「ISBNが同じなら同じ本」と言えるんだろうけど、大量スキャンプロジェクトの基準で言うと、「ダブりなんてない」って言える。また大量スキャンにおいては、「ダブる」ことは大して怖くないとも言える。「ダブり」に関するしめ…

2006-09-09

作戦変更　日記やめる

日記をはじめて1ヶ月経った。だから気分一新。（デザイン変更）そんで、やっと気づいたけど、毎日書くのは大変。日記だから、毎日書かなきゃって思ってたけど、回りを見回してみたら、結構みんな毎日は書いてなかった。もっと早く気づけばよかった。なので、…

2006-09-08

　30個の『二都物語』と3世代の「トイレ本」

周辺情報

昨日は、「ダブり」かどうか判定するのも楽じゃない、ってことを書いた。そしたら、UNさんが、「これは一つの本なのか否か、分かりにくい本」の例をいくつか紹介してくれた。黒澤さんからは、「人名（本名も変化するし、人類の半分は、改名する、ペンネーム…

2006-09-07

　ところで、ダブりって何さ？

周辺情報

昨日は、グーグル1500万冊のうち、450万冊がダブってて、まぁ割とダブりがすくないんじゃないの、って話をした。myrmecoleonさんやkusamisusaさんも「少ないな」と言ってくれた。でも、「ダブりって何さ？」って聞かれると、分かってたようで、実はあまり分…

2006-09-06

　Googleの1500万冊のうち、450万冊はダブり

スキャンプロジェクト

9月2日に、kikoriさんから、（仮に）国会図書館に800万冊、ICU図書館に65万冊の本があっても、865万種類の本があるわけじゃなくてある程度というか何万冊もダブりがあるわけですよね？となると、無駄なダブりを防ぐ為に情報交換が必要なんじゃないかと思う…

2006-09-05

　ロジスティックスを具体的に考える

スキャンプロジェクト

9月1日のエントリーで、「この本棚を全部やろう！」という感じの「とりあえず、やっちゃおう」的な考えがありうることを紹介した。そんでこっちで、「大量スキャンにおいては、ロジスティックスが重要だよ」って言ったけど、そんなの具体的に考えてみないと…

2006-09-02

　本の電子化に何年かかる？

週末の数字遊び

米国で進行中の「本の電子化」が、日本で少しでも理解されたら良いな、と思って書いてるんだけど、この日記だけだとやっぱ限界がある。あとは、みんなが酒飲んでるときに話題にしてくれるのを待ってる。（かなり他力本願だけど。）そんときの小ネタをたまに…

2006-09-01

　「とりあえず、やっちゃおう」（大量スキャンにおけるロングテール的なもの）

スキャンプロジェクト

（本日の要約）もし、大量スキャン計画にロングテール的なものがあるとすると、「この本はスキャンする必要あるかな、どうしようかな？とりあえず、やっちゃおう！」ってあたりにある（だろう）。

bookscanner記

2006-09-01から1ヶ月間の記事一覧

やっぱりどう考えても、検索エンジンは賢いよ

美崎さんがやってきた！

美崎さん、fuzzy2さん、しばらくうちでやっちゃってくだされ

「Web2.0の一連のサービスについて、わたしはあまり高くは評価していません」

検索エンジンって、かなり賢いかも

美崎薫さんは「2009年に来る3年後の未来は日々体験ずみ」なんだって

美崎薫さんと言えば、BTRONなんだそうだが...

『グーグルが本の電子化で狙う「うまみ」の正体は』に応える①

あんまし派手に、ヤバいことしないで、ってコーネル大学が言った

どんくらい傾くのか？見てみよう。

大量スキャンプロジェクトにおいて、ダブりなどない②

「誰が読むんだ？」ってものを、Googleだけはコツコツ読んでる

Google Book Searchで「海外ユーザー」に対してアクセス制限がされている問題

自動ブックスキャナの導入は、スキャン作業の省力化が主な目的ではない

大量スキャンプロジェクトにおいて、ダブりなどない①

作戦変更　日記やめる

30個の『二都物語』と3世代の「トイレ本」

ところで、ダブりって何さ？

Googleの1500万冊のうち、450万冊はダブり

ロジスティックスを具体的に考える

本の電子化に何年かかる？

「とりあえず、やっちゃおう」（大量スキャンにおけるロングテール的なもの）