画像派と文字派 - bookscanner記

電子化されたデータに関連して、2つのグループがある。画像派と文字派。とりあえず、簡単なところから、攻略していきましょ。

画像派ってのは、本を電子化するときに、画像としてとっておくことに意味があるケース。例を2つほどみてみましょ。

一つ目は、ミズーリー州立植物園が、植物の挿絵なんかを、普通の名前（「チューリップ」とかふつうにみんなが呼ぶ名前）と、学術名（「Tulipa sylvestris」みたいによーわからん長い名前）の両方から検索できるよーにした、ってプロジェクト。この場合、単純明快、画像が重要だよね。

http://www.illustratedgarden.org/mobot/rarebooks/page.asp?relation=QL551G3S651797V1&identifier=0074

二つ目は、日本の明星大学がやってるプロジェクトで、シェークスピアのフォリオを電子化してるもん。この場合、書き込みについてあれこれいうだけで、「研究」になっちゃうくらいだから、そりゃ、画像が重要なわけさ。

http://shakes.meisei-u.ac.jp/Shakespeare/Image/0003/2x0003.jpg

ってなわけで、画像派にとって、本を電子化するってことは、画像として見えるようにするってこと。

これに対して、残したいのは文字なんだと叫ぶ集団あり。例を2つみましょ。

日本代表、青空文庫。青空工作員が、がんばって文字入力を行ってる。Webでも見れるし、そのほかの端末でも見れるよ。

http://www.aozora.gr.jp/readingTEXT/text.html

米国代表、プロジェクト・グーテンベルグ。これまたボランティア集団が、文字入力、校正を繰り返す。そんでまた、Webで見られるほか、PDAなどでも読めるんだけど、さすが携帯後進国のアメリカ。日本ほど、すごくない。

http://www.gutenberg.org/w/images/2/24/Plucker-moby-dick.jpg

ってなわけで、文字派にとって、本を電子化するってことは、文字1個1個がデータ化されてて、いろんな端末に、文章を流し込める、ってこと。

そんで、ここで終わってれば、話は簡単なんだけど、そーはいかない。
次回は、派生種を紹介すんよ。