「うわづら文庫」と「青空文庫」
前に、スキャンされたデータは、画像派/文字派/しかたなく画像派に分かれる、って話をした。
http://d.hatena.ne.jp/bookscanner/20070222/p1
http://d.hatena.ne.jp/bookscanner/20070223/p1
(ご本人はどー思ってんのか知んないけど)日本の代表的「しかたなく画像派」は、 岡島昭浩さんの運営する「うわづら文庫」かな。
主人の岡島さん曰く(http://www.let.osaka-u.ac.jp/~okajima/uwazura.html)、うわづら文庫
(別名「責空文庫」)というのは、
青空文庫への敬意を表した命名です。青空文庫がテキストファイルを提供し、さまざまな環境で読めるのに対し、この「うわづら文庫」はテキストではなく画像で、すなわち上面だけのものだ、という意味です。(別名の「責空文庫」(せめぞらぶんこ)というのは、「テキストはなくても、せめて画像でも読めれば」という意味で「責めて版・青空文庫」と。でも、副詞の「せめて」に「責」を当てるのに不快感を感じる人も居るでしょうから(「せめて」を「責而」と書くことも用例がありますが)、これは別名ということにしました。)
というわけで、「しかたなく画像派」っぽい命名でしょ。
一方、日本を代表する文字派と言えば、「青空文庫」。
最近ね、この「青空文庫」が「うわづら文庫」にラブコールを送って、「うわづら文庫」がラブ返ししたよ。http://hpcgi1.nifty.com/hongming/komorebi/wforum.cgi?mode=allread&no=1338を要約すれば、「青空文庫」が次に出すDVDに、「うわづら文庫」のスキャン画像も収録したらどーよってこと(らしい)。
そんで、「うわづら」と「青空」の関係をさかのぼってみっと、「青空」の大久保さんの2004年発言。
「うわづら文庫」は「青空文庫」の心強い味方だと思っています。たとえば、これから青空文庫では、入力底本を探すという作業がだんだん難しくなっていくような気がします。というのも、有名な作家があらかた作業を終わり、だんだんと歴史の影にかくれた作家や、あるいはたまたま底本が手に入らないために入力から外れてしまった作品、などなど色々理由はありそうですが、そういうふうに底本が手に入らないとき、「うわづらにある!」ということで、誰か新しく入力するかもしれませんし……。
http://www.aozora.jp/blog/2004/05/06/mirai.html
そんな感じで、「しかたなく画像派」と文字派は、これからも仲良しなんだろーと思うよ。アメリカだと、Project GutenbergとInternet Archiveが、そんな親交中。
というわけで、結局何が言いたいのかっていうと、「青空文庫は、みんなで手分けして文字入力してて、うわづら文庫の岡島さんは(おそらく)たったひとりでスキャン作業を進める。えらい。作業効率からすっと、今のところ、そんな人数比でOKなんだろー。でもそのうち、スキャン作業もみんなで手分けできるよーになったらいいね。なので、次回から数回にわたって、スキャンの手分けってことを考えるよ」ってこと。
(追伸)
電子化のデメリットについて、書こっと準備中なんだけど、税金シーズンにつき、いろいろと作業が難航してんよ。