IBM und EU-Konsortium: Neue Technologien zur Digitalisierung historischer Texte

Ziel von IMPACT ist es, neue Technologien für eine höchst-präzise Digitalisierung von seltenen, historisch-wertvollen Texten zur Verfügung zu stellen. Im Gegensatz zu früheren Digitalisierungsprojekten, deren Ergebnis oft statische Online-Bibliotheken von gescannten Texten war, wird bei IMPACT ein System angestrebt, das eine kontinuierliche Produktion von digitalen Repliken erlaubt, die online zugänglich sowie editierbar und durchsuchbar gemacht werden können.


Automatisches Erkennen spezifischer Schriftzeichen
Alte Dokumente mit verblichener Schrift und seltenen Schriftzeichen stellen eine grosse Herausforderung für heutige Texterkennungstechnologien dar. Eine bis zu 50 Prozent niedrigere Erkennungsrate und eine aufwändige Nachbearbeitung der digitalen Dokumente sind daher die Regel. Um dies zu verbessern, bietet IMPACT das erste Digitalisierungssystem an, das hochentwickelte, adaptive Software für optische Zeichenerkennung (OCR) mit einem kollaborativen, web-basierten Korrektursystem kombiniert. Mithilfe dieses Korrektursystems, das von IBM Forschern in Haifa entwickelt wurde, können die digitalen Repliken weltweit von allen Beteiligten gleichzeitig über ein Online-Web-System eingesehen, überprüft und korrigiert werden. Das System nutzt zudem lernfähige Software und adaptiert das Erkennen spezifischer Schriftzeichen automatisch. «Um ein grosses Digitalisierungsprojekt zum Erfolg zu führen, muss die Qualität der Texterkennung gesteigert und der Nachbearbeitungsaufwand entscheidend reduziert werden. Wir erwarten, dass wir mit IMPACT eine signifikante Produktivitätssteigerung im Digitalisierungsprozess erzielen können», sagt Hildelies Balk, Koordinatorin des Forschungsprojektes an der niederländischen Koninklijke Bibliotheek.


(IBM/nmc/hfu)

Schreibe einen Kommentar