Spitch und recapp IT kooperieren bei der Schaffung eines „Schwiizerdütsch“ Standards für die Transkription
Zürich – Die Schweiz befindet sich im weltweiten Vergleich bezüglich dem Einsatz von Sprachlösungen im Hintertreffen. Der Grund für diese durch zahlreiche Studien erhärtete Erkenntnis liegt in der Tatsache, dass hierzulande wie kaum in einem anderen Land auch in der öffentlichen Kommunikation und in den elektronischen Medien extensiv Dialekt gesprochen wird – und das in verschiedenen Sprachen. Und das in der jeweiligen regionalen Ausprägung, vom breitesten „Wallisserditsch“ bis hin zum Freiburger Sensler Dialekt.
Das Fehlen einer Schweizerdeutschen „Hochsprache“ mit einheitlicher Grammatik oder Schreibweise ist der automatischen Verarbeitung von Sprache, zum Beispiel beim Transkribieren, hinderlich. So können manuelle Annotationsarbeiten einen beachtlichen Anteil der gesamten Projektkosten ausmachen. Abhilfe tut not. Die beiden einzigen Anbieter von professionellen Sprachlösungen in Schweizerdeutsch, die Schweizer Unternehmen Spitch und recapp IT, haben sich nun zum Ziel gesetzt, die Standardisierung des Schweizerdeutschen für die Entwicklung von Spracherkennungslösungen gemeinsam voranzutreiben. Dies garantiert den heutigen und zukünftigen NLU-Anwendern, dass die Ergebnisse einer solchen Datenaufbereitung weiterhin transparent und wiederverwendbar sind. Sobald Ergebnisse dieser Zusammenarbeit vorliegen, sollen diese der Öffentlichkeit unter www.transkriptionstandard.ch zugänglich gemacht werden.
Täglich werden in Schweizer Büros und „Amtsstuben“ enorme Ressourcen dafür aufgewendet, in Schweizerdeutsch gehaltene Gespräche, Vorträge, Sitzungen usw. in Protokolle und Transkripte in Hochdeutsch zu überführen. Während es längst möglich ist, in einer standardisierten Sprache, zum Beispiel in Englisch oder Hochdeutsch vorliegende Gespräche schnell und kostengünstig maschinell zu transkribieren, geht das bei “Schwiizerdütsch“ kaum. Die Komplexität des Schweizerdeutschen ist der Hauptgrund, dass es für die bei der Spracherkennung wichtigen Annotierungen noch keine Standards gibt.
Kostenersparnis im Zentrum
Die beiden einzigen Anbieter für professionelle Spracherkennungslösungen für Schweizerdeutsch spannen nun zusammen, um die Standardisierung für die Entwicklung von Spracherkennungslösungen weiter zu entwickeln. Als erster Schritt haben die beiden Unternehmen entschieden gemeinsam einen „CH Basis-Standard für die Transkribierung (Annotierung) von Schweizerdeutsch zu entwickeln“.
Gerade die „Annotierung“ ist bei der Entwicklung von Spracherkennungslösungen ein wichtiger und kostspieliger Faktor. Für die Annotierung müssen die gesprochenen Audio-Daten manuell von Linguisten (die Schweizerdeutsch sprechen) transkribiert werden, was hohe Kosten nach sich zieht. Der neue Transkriptionsstandard von Spitch und recapp IT soll helfen die Annotierungskosten zu verringern und die Austauschbarkeit der Daten zu erhöhen. Zudem sollte auch der Aufwand, um neue Annotierer auszubilden oder zu finden sowie die Datenaufbereitung in der Zukunft geringer ausfallen, da bereits heute bestehende Plattformen und Tools dieser Firmen vorhanden sind, welche diesen Standard – und andere Sprachen – unterstützen und von der Community bereits genutzt werden.
Zurzeit arbeiten die beiden Firmen an der Definition des Standards. In einer nächsten Phase werden dann auch weitere Schweizer Unternehmen eingeladen, sich an der Entwicklung zu beteiligen. Interessierte können sich bereits heute unter transkriptionsstandard.ch registrieren. (Spitch/mc/ps)