Meine Schreibdienstleistungen: Transkriptionen & Protokolle

Spracherkennung und Transkription

Fluch oder Segen?

Wir alle sind per Du mit Siri oder sprechen unser Smartphone mehrmals täglich am Tag mit "Hey Google" an. Wenn wir also unser Handy in die Nähe unseres Mundes bewegen und eine kurze Frage stellen, klappt das mit dem Verstehen in den meisten Fällen ziemlich gut!

Und doch ist eine Interviewsituation in keinster Weise vergleichbar - ganz zu schweigen von Aufnahmeverhältnissen bei Diskussionsrunden, Meetings oder Arbeitssitzungen. Das Aufnahmegerät steht dabei nämlich mitten auf dem großen Tisch oder sogar irgendwo anders im Raum, sodass die Distanz ein gewisses Rauschen erzeugt. Dieses Rauschen wiederum - logisch - erschwert es enorm, das Gesagte vernünftig zu verstehen.

Was Spracherkennungssoftware nicht gut kann

In meiner langjährigen Arbeit mit Interviewtranskriptionen begegnen mir täglich verschiedene Dialekte und Akzente. Es begegnen mir virtuell Menschen, die nuscheln. Menschen, die enorm schnell sprechen und dabei Silben oder auch mal ganze Wörter verschlucken. Menschen, die sonst wie undeutlich sprechen.

Und machen wir uns nichts vor: Interviewpartner oder Meetingteilnehmer, die in der Lage sind, ganze Sätze flüssig, grammatikalisch richtig und nahezu druckreif zu sprechen, sind leider selten. Das wahre Leben ist auch hier nicht vergleichbar mit Dialogen in Fernsehfilmen, TV-Serien oder zusammengeschnittenen YouTube-Videos.

Im wahren Leben wird mit ähs und ähms um sich geschmissen. Im wahren Leben werden viele englische oder "verdenglischte" Begriffe benutzt. Im wahren Leben wird gerne mal ein Satz gänzlich in Englisch zitiert. Im wahren Leben bleiben Sätze auch mal unvollendet und werden nach ein bisschen Rumdrucksen neu angefangen. Im wahren Leben gibt es äußere Störeinflüsse, die die Qualität der Tonaufnahmen zusätzlich negativ beeinflussen.

So sind glasklare Aufnahmen, wie zum Beispiel für Fernsehproduktionen, eine wirkliche Seltenheit. Ich spreche hier über Aufnahmen mit Störgeräuschen durch eingeschaltete Handys, Straßenlärm durch geöffnete Fenster, sehr laute Geräuschkulissen, da das Gespräch in einem Café oder einer Mensa aufgezeichnet wurde. Und, und, und.

Dies alles hat eine negative Auswirkung auf Audioaufnahmen und macht die Transkription schwieriger - auch für die Spracherkennung!

 

Schreibbüro Sabine Brinkmann
Schlinghofener Straße 37, 51519 Odenthal
Mobil: 0151 / 67857254
02174 / 4950023
Öffnungszeiten:

Montag - Freitag: 8:30 Uhr - 18 Uhr

Sabine Brinkmann

Der von Ihnen verwendete Browser ist veraltet

Um die Homepage korrekt darstellen zu können, empfehlen wir Ihnen einen moderneren Browser zu verwenden: