日本における電子化の反省と対策
(2日ほど家庭の事情でお休みしていたが、再開。引き続き、日本の電子化状況と、日本政府が考えている米国の電子化事情を紹介する。)
本日の要約:
日本の電子化プロジェクトが、単に画像を電子化しただけという批判があるが、アメリカだっておんなじだった。でも、アメリカはメタデータの重要性に気づいていたため、現在、電子化において、リードをしている。日本は先行していたのに、無念。メタデータにやられた。
前回は、『学術情報基盤の今後の在り方について』という報告書を紹介した。
こういう類の報告書を読むときは、「搦め手から」。
こちらのページで、真ん中くらいまでスクロールしていくと、
2−3.研究環境基盤部会 学術情報基盤作業部会 大学図書館等ワーキンググループ
なんて部分があり、これによれば、大学図書館等ワーキンググループというのは、2005年1月20日に1回目を開催してから、14回の会合を開いていたらしい。
いくつかの会合と、その中で話されている「おもしろいこと」をピックアップする。発言に関して、勝手に順番などを入れ替えているので、正確な文脈を知りたい場合は、原文参照。
まずは、第4回目。
過去のプロジェクトの反省という話だが、やはり一番大きいのは電子化への対応の仕方の部分だと思う。
言い換えれば、「単に画像を電子化しただけというプロジェクトが多すぎたのではないか」?
いや、それは違う。
例えばアメリカの機関リポジトリなどもスペシャルコレクションの画像電子化に過ぎず、日本の90年代の先導的プロジェクトとそれほど差はない。むしろ、なぜ日本は先行したにもかかわらず埋没したのかを検討することの方が重要だ。
そう!忘れてならないのは、「日本は先行し」ていたんだ!(この点は、次回、紹介予定)
しかし、
90年代アメリカの電子図書館政策、すなわちデジタルライブラリー・イニシアチブはグーグルを生み出した。しかし日本では、メタデータ抜きのコンテンツばかりがたくさんできてしまった。
(個人的感想)
かなり大胆な歴史解釈だし、いろんなことが省略されているので、「イニシアチブ」からグーグルへのつながりが分かりにくい発言。しかし、有効な対比が示される。「日本ではメタデータの重要性に気づいていなかった」が、「アメリカではメタデータが重視されていた」。
なんで、「メタデータ抜きのコンテンツばかりがたくさんできてしまった」かと言うと、
1990年代にはこのメタデータの概念が十分に理解されていなかった。
じゃぁ、どうしよう?
メタデータの整備と、グーグルのようにそれを検索するシステムがいると思う。ただ、それだけではなく、例えばグーグルでは源氏物語の古写本の本文を見ようと思っても検索されない。それを解消できるような、メタデータの整備の仕方と、ポータルが必要である。
でも、お金かかるから、大変だな。
だって、日本の図書館とか研究所の懐事情は、非常に厳しい。データベース管理費用なんて誰も出してくれない。
情報センターとしての区切られた予算があるわけではない。現在、研究所の予算の中から年1500万円ほどを確保しているが、これは運営のための最低限の資金であり、(データベースの)作成やメンテナンスの費用は主に科研費などの競争的資金から措置されている。
ところが、
巨大なサーチエンジンで中身をクロールさせてしまえば(、自分たちで維持管理しているデータベースの)メンテナンスは必要なくなる。
つまり、データベース管理の一部をグーグルに外注してしまう。グーグルは、無料でやってくれるから。
というわけで、前回紹介した報告書には、
(ウ)電子化の新たな波への対応
貴重書の電子化はしたものの、メタデータの不十分さ、検索機能の弱さなど、インターネット時代の電子情報の長所を活かしきれていないなどの欠点があることから、現在、そのデータは散在した状態にあるとの指摘がある。今後、こうしたデータを再整理し、後述する機関リポジトリに吸収・再編することで利用可能な状態にするなど、それらデータへのアクセス体制を確立・整備することが必要である。
と書かれていたわけ。でも、「データベース管理の一部をグーグルに外注してしまう」というのは、オフレコらしい。