Google-Buchsuche steckt voller Fehler
(Dominique) Die Google-Buchsuche stand in letzter Zeit vor allem wegen Verstössen gegen das Urheberrecht in Kritik. Es gibt jedoch noch ein anderes Problem...
Gemäss Google-Buchsuche ist dieses Buch aus dem Jahr 1742 ein Werk zum Thema "Internet". Die falsche Kategorisierung ist offensichtlich.
Bei der Google-Buchsuche sind die Metadaten der eingescannten Bücher zum Teil fehlerhaft. Darauf weist Professor Geoffrey Nunberg von der Berkeley School of Information in seinem Blog languagelog.ldc.upenn.edu/nll/ hin. Er hat viele Werke mit falschem Erscheinungsjahr entdeckt. Auch bei der Beschlagwortung hat er Fehler gefunden. Zum Beispiel hat er in einer Abfrage zum Thema "Internet" über 500 Werke, die vor 1950 erschienen sind, als Treffer erhalten. Unter anderem ein 1742 erschienenes Buch aus der bayrischen Staatsbibliothek. Die maschinell mittels OCR durchgeführte Suche hat das in Fraktur-Schrift geschriebene Wort "Unterricht" als "Internet" interpretiert.
Im Gespräch mit Professor Nunberg habe Google die Verantwortung für diese Fehler auf die Bibliotheken abgeschoben. In Einzelfällen möge das zutreffen, doch die meisten Fehler seien Googles eigene Schuld. Falsche Erscheinungsdaten lägen daran, dass Google sie per OCR (Optical Character Recognition; deutsch: optische Textzeichenerkennung) automatisch bestimme.
Wenn man nur nach den Inhalten der Bücher sucht, ist das nicht so ein Problem. Sobald man (z.B. für wissenschaftliche Arbeiten) die verwendeten Werke jedoch zitieren will, muss man sich darauf verlassen können, dass die Metadaten wie Auflage, Erscheinungsjahr usw. korrekt sind. Da dies bei der Googe-Buchsuche nicht immer der Fall ist, sollte man bei Bedarf die bibliographischen Daten in einem Bibliothekskatalog überprüfen.