Bonjour & hello! Sie sind auf den Seiten eines digitalen
Tagebuchs aus der Welt der Sprachen gelandet, das es seit 15 Jahren
gibt. Als Spracharbeiter:innen müssen wir uns zu vielen Fachthemen auf dem Laufenden halten. Daher habe ich neulich einen Ausflug im Internet gemacht.
Die KI ist strunzdumm. Dieser Satz ist in sich nicht schlüssig, denn "künstliche Intelligenz" kann weder klug noch dumm sein, ist sie ja nicht dazu imstande, mangels Masse auch nur ein Neuronchen weit zu denken. Sie stützt sich auf das, was sie im Netz findet, errechnet Wahrscheinlichkeiten, kombiniert neu. Ich habe sie getestet, und zwar den "Text-zu-Bild-Generator" DALL.E der Firma openAI.
|
Funkender Hausmeister? Für die KI ein Dolmetscher!
|
Zunächst einmal ist es doch sehr erstaunlich, welche Bilderwelten das System aufgrund von detaillierten Beschreibungen zusammenstoppelt, wie es formale Anforderungen aufgreift, Anzahl, Motiv, Farbgebung, Umgebung, Stil oder Technik.
Die Ergebnisse fand ich in mehrfacher Hinsicht überraschend, denn sie haben alle einen Schlag ins Absurde, etwas Verrutschtes, Tragisches, Abstoßendes. Illustrator:innen werden nicht so rasch sämtlich arbeitslos, wie eine Freundin neulich mutmaßte.
Außerdem schafft es die Deep-Learning-Technologie nicht einmal, das vorhandene Bildmaterial zu unserer Arbeit sich so akkurat als Grundlage zu nehmen, dass mein Beruf in seinen Kreationen überraschungsfrei wiederzuerkennen ist.
Zunächst sind die meisten interpreter, die mir das System für mich "zeichnet", "malt" oder "gestaltet", Männer. Hätte die KI richtig "hingesehen", wäre ihr aufgefallen, dass die überwiegende Mehrheit von uns weiblichen Geschlechts ist. Die Männerdominanz ist auch schon anderswo aufgefallen, wo die Anforderung "science journalist" gelautet hat. (Kurze Erinnerung: Englisch kennt keine männlichen oder weiblichen Artikel, da ist alles the.)
Außerdem hat die KI nicht "verstanden", dass wir im Prinzip zu zweit (oder zu dritt) je Sprache arbeiten. Mir werden spontan nur Einzelpersonen gezeigt. Fordere ich explizit zwei oder mehr an, sitzen diese nicht selten an getrennten Pulten, Rücken an Rücken, auf einem Haufen am langen Tisch, oder aber sie werden verschiedenen Flaggen zuordnet.
Das Wort Dolmetschkabine, interpreting booth, wurde nicht richtig gelesen. Booth kann Hütte, Bretterbude, Zelle, Messestand oder eben "Kabine" heißen. Ich bekomme Darstellungen kleiner Zelte, von Unterständen, Käfigen oder Glashütten (der Sound?!) — oder aber der Hintergrund ist einfach schwarz.
Wie wir arbeiten, mit Kopfhörern und Mikrofonen, ist manchmal zu sehen, aber auch nicht immer. Mikrofonkabel verlieren sich im Nirgendwo, einmal sind Ohr und Kopfhörermuschel ein fleischfarbens Ganzes, andere Figuren sprechen in eckige black boxes hinein, einmal zeigt ein Mikro sogar durch rotes Licht, dass es eingeschaltet ist. Unser Arbeitsumfeld, obwohl mit unzähligen Bildern im Netz dargestellt, ist sonst nicht vorhanden.
Ab und zu arbeiten wir gemäß DALL.E mit Papier, einmal liegt irgendwo ein Mobiltelefon herum. Nur zwei Mal unter 100 Bildern ist ein Laptop dargestellt, ein anderes Mal eine Tastatur, dafür andere merkwürdige Objekte, viel Beschriftung und Nationalflaggen von Phantasieländern. Manchmal kleben Landkarten an den Wänden unserer "Kabinen", fliegen Zettel durch den Hintergrund, oft sind die Scheiben blind, einmal sieht der Kollege immerhin ins Grüne.
|
Unterschiedliche Vorgaben: realistic, 3D, french, painting, historic |
Dass wir die Redner:innen sehen, wird jedes Wesen aus Fleisch und Blut verstehen, denn die Körpersprache der Sprechenden verrät einiges, wir können uns so auf Sprecherwechsel einstellen, lesen auch schon mal von den Lippen ab. Die KI-Bilder deuten hier und da eine Simultandolmetschkonsole an und Kabel, über die wir mit der Außenwelt verbunden sind wie der Embryo mit dem Uterus.
Wie wir arbeiten, ignoriert das System.
Warum wir zumeist in Kabinen sitzen, kann es nicht "verstehen", also auch keine damit verbundenen Objekte erkennen und wiedergeben.
Anders gesprochen: Bereiche, die das Programm nicht trainiert hat, kann es nicht erschließen; "lernen" braucht bislang dezidiert ein menschliches Angebot und Training durch Programmierer:innen. Zum Teil wird diese Aufgabe bei dieser Art Technologie schon an die Nutzer:innen ausgelagert, da diese die KI-Produkte bewerten und Änderungen vorschlagen können.
Bislang sehen die weibliche Figuren überwiegend missgelaunt aus, anderen rutschen Partien ihres Antlitzes aus dem Gleichgewicht, um es vorsichtig zu sagen. Oft ist trotz des Plurals in meiner "Bestellung" nur eine Person zu sehen. Wenn nach explizit geänderten Vorgaben, two interpreters, dann zwei Figuren auftauchen, sprechen und gestikulieren sie gleichzeitig. Dass wir im Wechsel im On sind, steht im Internet an vielen Stellen; offensichtlich "kennt" das System zur künstlichen Erschaffung von Bildern maximal einige Onlinebilder und analysiert den Text nicht (den das System ohnehin nicht verstehen würde).
Den formellen Dresscode, der in unserer Branche üblich ist, hat das System richtig "erkannt". Manche Kleidung sieht indes wie eine Polizeiuniform aus. Ein Bild erinnert mich an eine Zollbeamtin am Flughafen in New York, zur Kleidung kommen noch strenge Haartracht und strenger Blick hinzu. Ohne Headset sitzt eine andere Lady hinter einer Art Empfangstresen, sie hält einen Telefonhörer in der Hand. Komplett ohne Technik kommen andere Figuren aus, darunter eine Dame, die wie eine Professorin aus einem Buch vorzulesen scheint. Irritierenderweise weist ihr Hintergrund ähnliche facettierte Unterteilungen auf wie unsere Dolmetschkabinen. Eine andere Kabine wirkt fast realistisch, nur ein wenig abgerockt; die KI war dann "müde" und es hat nur noch zu einem Bürostuhl gereicht.
|
Dolmetscherinnen in der Kabine mit Technik der Zukunft
|
|
Sehr oft scheinen vor allem wir Frauen für die "kreierenden"
Bits & Bytes unfreundliche, hässliche, fast inhumane Wesen zu sein. Sogar dann, wenn ich als "Aufgabe"
very, very beautiful femal interpreters angebe, geht grundsätzlich noch etwas was schief.
Wie zum Ausgleich könnten die meisten abgebildeten männlichen Dolmetscher umgehend auf dem Laufsteg eine gute Figur machen, wenn sie nicht bereits, Halbgöttern gleich, wie von Zauberhand aus dem Monitor wachsen.
Einmal beauftrage ich das System, Französischdolmetscherinnen zu 'liefern' und erhalte prompt eine Madame, die in der Kabine eine Baskenmütze trägt. Überhaupt sind Kopfbedeckungen in der Box offenbar groß im Kommen. Die KI zeigt mir Stroh- und Tirolerhüte oder Sicherheitshelme. Aus manchem Mund wachsen komische Pflanzen, andere Figuren haben ausgeleierte Ohren (oder sie schlackern nur mit denselben, das ist nicht klar). Hier ist das Riechorgan in den Damenbart gerutscht, dort ein Auge in Gitterform aufgerissen oder das Gesicht gänzlich verwischt. Wie gesagt, meistens sind wir Dolmetschpersonen identitätslos, männlich oder ohne Abbildung.
Das spiegelt unfreiwillig die öffentliche Wahrnehmung unseres Berufes wider. Wir sind Stimmen, sonst nichts, die Menschen dahinter zählen für viele leider nicht.
______________________________
Illustrationen: DALL.E