ところで、ダブりって何さ?


昨日は、グーグル1500万冊のうち、450万冊がダブってて、まぁ割とダブりがすくないんじゃないの、って話をした。myrmecoleonさんやkusamisusaさんも「少ないな」と言ってくれた。

でも、「ダブりって何さ?」って聞かれると、分かってたようで、実はあまり分かってなかったような気がする。だから、ダブりの事情を探る。


たとえばさ、「読書日記☆こんな本読んでます」さんが紹介してる、この二つの「孔雀狂想曲」って、もし両方持ってたら「ダブり」なの?



じゃ、『日本人の正体』『オバサンとサムライ』はどうなの?


もひとつ、ついでに、グワイヒアさんが言ってるこのふたつは?



専門家に言わせると、こんな分類ができるらしい。(一番おおもとは、こっちね。細かいことに興味ある人は、原文参照。)

*1

そんで、、昨日紹介した論文によれば、Manifestationってのが、いわゆる1個だそうだ。


なんだ、どうりで、だぶりが少ないと思った。
だから、単純にタイトルが同じっていう「Works」で計算すると、「ダブり率」は上昇するらしいよ。



Manifestationってのに従うと、グワイヒアさんのふたつは、別物だな。
でも、『オバサンとサムライ』はどうしよっか?


宮城県の「読者」さんは、こう証言してる。

「オバサンとサムライ」というタイトルのときは買うのをためらい、買わなかった。「日本人の正体」というタイトルになって宝島社新書になって平積みされていた。すかさず買った。

内容は変わっていないのだが、いい悪いではなくて、きっと好みの問題だろう。


じゃぁ、将来のこと考えて、とりあえず別物ってことにしようかな。(違うISBN持ってるしね。)

そんで、残念だけど、「孔雀狂想曲」は「ダブり」かな。




ってな感じで、「ダブり」かどうか判定するのも楽じゃない。


「ダブり」についての考察は、まだ続く。

*1:メタデータについて議論してみよう」(lib.slis.tsukuba.ac.jp/colloqium/051222.pdf)の5ページ