Kalkulierbare Dubletten??
Im Rahmen dieses abgeschlossenen Projekts konnte gezeigt werden, dass
unter bestimmten Bedingungen beim Laden von Titeldaten in
Online-Kataloge die üblichen Methoden der Dublettenerkennung
durch statistische Abschätzungen ersetzt werden können.
Dabei wird aufgrund von Sicherheits- und Genauigkeitsannahmen die Größe
einer Stichprobe errechnet, diese aus der Gesamtmenge nach einem
Zufallsverfahren gewählt und händisch (intellektuell)
geprüft. Das Ergebnis dieser Prüfung wird in weiterer Folge
als ein gültiges für die Gesamtmenge angesehen.
B.I.T.online 7(2004) Nr. 3
|
Calculating bibliographic Duplicates
In this project we show that under certain conditions the checking for
duplicates while loading bibliographic data into an online catalog
can be replaced by a statistical estimation.
Due to the selected signifcance level (of 90%) and tolerance bounds (10%)
the minimum of the needed sample size is calculated, chosen from the
population at random and verified by hand. The result of this
examination is regarded in further consequence as a valid result for
the total quantity.
B.I.T.online 7(2004) Nr. 3
|
Calculs des duplicats biblographiques
Dans le cadre de ce projet qui a été réalisé,
on a pu constater qu'á certaines conditions lors du chargement
des dates descriptives bibliographiques dans le catalogue en-ligne,
les méthodes usitées permettant d'identifier les
descriptions doubles pourraient être remplacées par un
système d'évaluation statistique.
Lors de ce procédé on calcule la taille d'un échantillon
pris au hasard en tenant compte du niveau de signification et des
limites de tolérance, cet échantillon est choisi parmi
l'ensemble des données par une méthode au hasard et
contrôlé à la main (intellectuellement). Le
résultat de cet examen sera valable pour la totalité
des dates par la suite.
B.I.T.online 7(2004) Nr. 3
|