Herzlich willkommen auf den Seiten einer Dolmetscherin, auf denen ich über Sprache und Wörter schreibe und über das, was zwischen den Zeilen steht. Ich bin Simultandolmetscherin, arbeite bei Konferenzen, auf Messen und begleite Delegationsreisen. Heute: KI-Mittwoch! |
| Hier geht's rund! |
Auf Französisch bin ich
une interprète, wörtlich: eine Interpretin. Nein, keine Schauspielerin, dafür wird der Begriff im Französischen übrigens auch gebraucht (neben
actrice).
Und schon sind wir mitten im Thema. Heute geht es um Sprach- und Situationsvielfalt. Ich interpretiere, was ich höre, wähle in der Menge der möglichen Begriffe jene aus, die Sinn ergeben in dem jeweiligen Kontext, bei der jeweiligen Person, die diese oder jene Sprechabsichten hat, immer abgesichert durch mein Informations- und Vorbereitungsmaterial.
Denn 80 Prozent unserer Arbeit hängt von der Vorbereitung ab. Hier entsteht Qualität, lege ich die Grundlagen für Auswahl, Gewichtung, Antizipation.
Ja, aber die Maschinen wüssten alles, höre ich Zweifler:innen an meinen Worten einwenden. Sie haben alle Informationen der Welt zur Verfügung, also dürften sie sich doch nicht groß vertun! Und sowieso: Die Maschinen würden jeden Monat, ja jede Woche besser! Es wäre nur eine Frage der Zeit, und ich wäre arbeitslos!
Dass Computersysteme schon sehr bald gesprochene und geschriebene Sprache per Knopfdruck übertragen können, wird mindestens seit den 1950-ern geschrieben. So alt ist jedenfalls das älteste Buch über Computerlinguistik in unserer Bibliothek.
Die Maschinen ersaufen in zu viel Info, jetzt kommen auch noch die Kommentartexte der asozialen Themen hinzu sowie die Auswürfe der Maschine, die sie selbst bisher produziert hat, denn die Masse des geschriebenen Wortes soll weltweit einmal abgegrast sein, soweit digital verfügbar. Und genau das ist das eine Problem: Zu viel, zu wenig Kontextdifferenzierung, zu schlecht. Dann das andere: Maschinen können Relevanz nicht eigenständig definieren, sondern nur aus Trainingsmustern ableiten. Und genau da kippt es in spezialisierten, sensiblen und neuen Zusammenhängen. Und wozu werden Events veranstaltet, wenn nicht für das Neue, das Besondere?
Neben dem Kontext stören auch noch grundlegende Eigenschaften der Sprache, zum Beispiel ihre Vielfältigkeit. Beim Untertiteln hilft uns unsere Allgemeinbildung, das richtige Wort herauszupicken. Wer sich mal eine Weile mit YouTube-Titeln befasst hat, merkt das Dilemma der Maschinen, die häufig Homonyme nehmen und in Titel einbauen. Aber Homonyme klingen eben nur ähnlich, bedeuten in der Regel etwas ganz anderes.
Kurz: Die Maschine greift oft auf im Kontext vollkommen sinnlose Wörter zurück. Ist das ein Substantiv, wird dann gerne auch das Nachstehende vollkommen verfremdet, dann kippen die Sätze in Serie um wie die Dominosteine und reißen den Rest mit in den Abgrund.
Die Technik kann oft auch nicht mit Pausen umgehen, die wir Menschen machen, mit Nachdenk- oder Blickpausen, winzigen Zwischenfällen, dem Warten auf den PowerPoint, mit besonderen Betonungen. Dann kollabieren manchmal die Bezüge, entstehen Löcher, legt die KI-Stimme kurz ICE-Tempo ein, um dann in gemächlichem Regionalzugtempo weiterzumachen, wenn ich dieses als Standard für die Nachvollziehbarkeit setze. Und natürlich fällt beim Stakkato Inhalt weg bzw. wird verstümmelt.
Das gilt auch für zu schnell gesprochenen Inhalte, wo wir Menschen dank der Vorbereitung wissen, was das Wesentliche des Vortrags ist, auf das wir das Gesagte runtermetzgern. Dieses Mal ist der ICE am Sprecherpult.
Das waren jetzt einige Symbole für Worte in Bewegung. Ja, die Technik ist dynamisch. Und durchaus, das Maschinenkauderwelsch verbessert sich jedes Jahr ein My. Aber es geht langsam, alles, was mit der Essenz von Kommunikation zusammenhängt, Emotionen, kulturelle Bezüge, Humor, werden die LLMs nicht lernen.
Das Problem derzeit ist, dass Menschen, die die andere Sprache nicht kennen, die Fehler aber nur dann auffallen, wenn es komplett absurd wird. Das Vage oder einigermaßen Verständliche führt besonders in die Irre.
Welche Konferenzveranstalter:innen möchten mit Ungefährem arbeiten, welche Messestandleitungen eine Bla-Bla-Kommunikation haben, die nicht zum Nachfragen bei den Menschen vor Ort anregt?
Neben Homonymen schlagen auch Akzente zu: Ich muss rasch an die Kolleg:innen im EU-Parlament denken, die auch Baynglisch oder Schwänglish meistern, ohne in Lachen auszubrechen. Vor allem schaffen sie darüber hinaus, auch noch den Inhalt rüberzuwuppen. (Als ich das erste Mal Öttinger-Englisch gehört habe, habe ich Tränen gelacht und musste die Kabine verlassen. Aber sogar dieses Idiom können wir Menschen lernen.)
Ach, wenn das jetzt nur alles wäre! Sehr oft verhaspeln sich Menschen, starten einen Satz neu, sprechen in Andeutungen oder nuscheln. Der eine hat eine Hasenscharte, die andere ist komplett verkrampft (und knödelt), ist voller Ironie oder vergreift sich im Begriff (was wir Menschen korrigieren dürfen und können, vorausgesetzt, wir haben im Vorfeld ausreichend Vorbereitungsmaterial erhalten). Kurz: Wir Zweibeiner und unsere Sprache sind viel zu vielfältig und fehlerbehaftet, damit kommen die Bits und Bytes nicht klar.
Eine Konferenz, eine Verhandlung, eine Delegationsreise sind zudem keine Situationen, in denen „wahrscheinlich richtig“ ausreicht. Da braucht es jemanden, der notfalls eingreift, glättet, nachfragt, entscheidet. Genau dieser Moment, das aktive Eingreifen, ist etwas, das Maschinen strukturell fehlt.
Die KI scheitert manchmal an der Sprache, häufig an Situationen.
Andersrum gesagt: Wenn alle Wörter einen eindeutigen Sinn hätten und nicht kontextabhängig wären, wenn Maschinen Sinne hätten, fühlen könnten und vor diesem Hintergrund nicht herumrätseln müssten, sondern entscheiden könnnten, wenn unsere Arbeit nicht vertraulich wäre, wenn die KI in solchen Momenten nicht halluzinieren würde, wenn die KI von den Lippen ablesen und Körpersprache erkennen könnte und zu Ironie fähig wäre, wenn die großen Maschinen nicht den Tech-Faschisten gehören würden, die mit Sprachverboten für Verzerrung sorgen, wenn die KI nicht immer alles auf das mathematisch wahrscheinlichste Mittel runterpegeln müsste, wenn die KI auch ohne Wlan und Stromkabel arbeiten könnte, ja, dann würde die KI uns ersetzen, nun, éventuellement (nicht: eventually).
Zugespitzt könnte ich sagen: Beim Dolmetschen durch die KI stören erstens die Sprecher:innen und zweitens die Zuhörerschaft. Sonst läuft alles perfekt! Also fast, aber bald, möglicherweise, vielleicht!
______________________________
Grafik: Pixlr.com (Zufallsfund)