日本だって、優れたものを持ってる


(引き続き、日本の電子化状況と、日本政府が考えている米国の電子化事情を紹介する。)


本日の要約:

Google Book Searchみたいに、本をオンラインで見れる、というのはすばらしいよ。でも、日本だって、優れたもの持ってるじゃん。もし日本が電子化を本格的に進めたら、とってもすごいことになるかもよ。




今日もスタートは、こちらのページで、
”2−3.研究環境基盤部会 学術情報基盤作業部会 大学図書館等ワーキンググループ”の
第3回目




日本はどんな感じなの?

基本的に日本は米国等に比べ、大学がどの程度の蔵書を持っているかといった情報が国民によく知られる状態になっており、世界最先端とはいえないが、非常に整備された状況になっていると言える。

NACSISなどを指しているんだろうけど、日本のシステムはすばらしいらしい。

しかしながら、その状況が急速な電子化に対応できているかというと、必ずしもそうではない。また、例えばGoogleのようにクリックすれば現物が見られるといったことが、世間では一般的になりつつある状況で、これをどう考えていくか。

確かに、いくら優れた検索システムでも、実際の本を入手するまでが大変だとやだな。

例えば、NACSIS(http://webcat.nii.ac.jp/)へ行く。
「タイトル・ワード」に”A treatise on probability”、「著者名」に”John Maynard Keynes”と入れてみる。
ケインズの隠れた名著『確率論』は、14個の大学図書館が所蔵してるそうだ。
残念ながら、自分の通っている大学になかったとすると、取り寄せてもらうしかない。
届いたら連絡くれるって言ってたけど、何日かかるのかな?って感じで待つ。

ところが、William Stanley Jevonsが「太陽の活動とコーン価格の関係」について論じた『通貨と金融の研究』をGoogleで探すと、このあたりにたどりつく。方向性としては、確かに「便利」だ!

でも、残念ながら、この論文の場合、前の194ページが白紙だし、198ページはピンぼけみたいになってたりして、果たして「見える」と呼べるかどうか、ちょっとだけ心配だな。


ところが、画像が悪いからダメじゃん、というだけだと、ちょっぴりむなしい。負け惜しみみたい。


でも、日本には負け惜しんでいない人もいる。
国立情報学研究所の高野明彦さんは、次のように言ってる。(日本人のアタマを救え

裏の取れた確実な情報はそれほど多くないにも関わらず、ネットの世界だけで情報を完結させ「Google検索で出ないものはこの世に存在しないと同然」ととらえる人は少なくない。(でも、)書籍の情報なら編集者の目を通っているため情報の信頼性もある程度担保されており、共用してもそれほど価値が薄れない。


ここまでは、結構、普通の人の発言。


ところが、高野さんの所属する国立情報学研究所ってのは、

書籍のデータベース「Webcat」を保有しており、コンテンツを丸ごと使える

これって、すごいことのはず。だって、日本のそれって、「非常に整備された状況」なんでしょ。アメリカよりすごいんでしょ。



そしたら、あとは、検索する方法を考えるしかない。
Googleはスキャンして、全文検索という道を選んだ。
でも、国立情報学研究所が目指したのは、

人がものごとを連想するように、文章の固まりから関連情報を次々に見つけ出す「連想検索エンジン」。文章を検索窓に入力すると、瞬時に形態素解析し、最大1000万件規模の大容量データベースから関連文書を検索できる

ようにした。



できあがったものは、Webcat Plusっていう名前だけど、これは便利だと思う。

このページに行って、さっそく、前回の要約をコピペしてみる。

日本の電子化プロジェクトが、単に画像を電子化しただけという批判があるが、アメリカだっておんなじだった。でも、アメリカはメタデータの重要性に気づいていたため、現在、電子化において、リードをしている。日本は先行していたのに、無念。メタデータにやられた

連想検索をすると、1番目に『メタデータ技術とセマンティックウェブ 』というのが出てきた。
タイトルをクリックすると、全国65個の大学図書館に入っていることが分かった。
とりあえず、読んでみてもいいかな、って思った。



こんなシステムがあるなら、あとは、本を電子化すればいいのに。

しかし政府は電子コンテンツ整備にはそれほど積極的でない。「官報など誰も読まないものを言い訳的に、莫大なお金をかけて電子データ化しているだけ」

そうなのか。もったいないね。もし日本が本の電子化を本格的に進めたら、とってもすごいことになるかもよ。