日本事情

 Uniform Concept Locaterと「本の路線図化」

国際日本文化研究センターってとこの山田さんが中心になって、「古事類苑」っていう古ーい百科事典を電子化してんだけど、約7万ページのスキャンは終わったらしい。今、一生懸命、文字入力をしてるんだって。がんばって!情報処理学会での研究報告(http://w…

 「なか見!」のOCR検証(1)

今日も引き続き、アマゾンの「なか見!検索 」。 さっそく、「なか見!」に行って、「日」というキーワードで検索してみよう。 ひどいOCR結果のオンパレードが見れるはず。日本語OCRの程度の低さをアピールするには、都合が良い。 でも、悪いところを見て、…

 「なか見!」の中身は、50,000冊

昨年11月の記事(『アマゾン ジャパン、書籍の全文検索ができる“なか見!検索”のサービスを開始』)、 なか見!検索は、その名のとおりAmazon.co.jpで販売されている書籍の内容の全文検索を行なえる機能。検索キーワードがヒットしたページの前後をプレビュ…

 日本で起こっている大変化を、私はとて〜も評価する

アマゾンの「なか見!検索」は画期的だ!というより、びっくりした!何をいまさら、と思うなかれ。よ〜く、画像をみてみよう!

 ダミーを追う日本

本日の要約: 「アメリカの後追いでない取り組みをする必要がある」と言ってみたけど、とりあえず、「後追い」。しかもダミーを追ってしまっているような感じ。

 日本だって、優れたものを持ってる

(引き続き、日本の電子化状況と、日本政府が考えている米国の電子化事情を紹介する。) 本日の要約:Google Book Searchみたいに、本をオンラインで見れる、というのはすばらしいよ。でも、日本だって、優れたもの持ってるじゃん。もし日本が電子化を本格的…

 日本における電子化の反省と対策

(2日ほど家庭の事情でお休みしていたが、再開。引き続き、日本の電子化状況と、日本政府が考えている米国の電子化事情を紹介する。) 本日の要約: 日本の電子化プロジェクトが、単に画像を電子化しただけという批判があるが、アメリカだっておんなじだった…

 日本には多くの埋没画像があるらしい

本日の要約: 日本には多くの埋没画像があるらしいが、米国で進行中の「本が本を読む」作戦から考えると、2ステップ遅れている。