Dienstag, 10. Januar 2023

Was ich von der KI über meinen Beruf gelernt habe (1)

Bon­jour & hel­lo! Sie sind auf den Sei­ten eines digitalen Ta­ge­buchs aus der Welt der Spra­chen­ ge­lan­det, das es seit 15 Jahren gibt. Als Sprach­ar­bei­ter:innen müs­sen wir uns zu vielen Fach­the­men auf dem Lau­fen­den halten. Daher habe ich neu­lich einen Aus­flug im In­ter­net gemacht.

Die KI ist strunz­dumm. Dieser Satz ist in sich nicht schlüssig, denn "künst­liche In­tel­li­genz" kann we­der klug noch dumm sein, ist sie ja nicht dazu ims­tan­de, man­gels Mas­se auch nur ein Neu­ron­chen weit zu den­ken. Sie stützt sich auf das, was sie im Netz findet, er­rech­net Wahr­schein­lich­kei­ten, kombi­niert neu. Ich habe sie getestet, und zwar den "Text-zu-Bild­-Ge­ne­rator" DALL.E der Firma openAI.

Älterer Mann in Gabardine-Jacke und -Hose mit Schirmmütze und Sonnenbrille sitzt vor geöffneten Fensterflügeln an einer Funkstation Funkender Haus­meister? Für die KI ein Dol­metscher!
Funkender Haus­meister? Für die KI ein Dol­metscher!

Zunächst einmal ist es doch sehr erstaun­lich, welche Bil­der­wel­ten das System auf­grund von de­tail­lier­ten Be­schrei­bun­gen zu­sam­men­stop­pelt, wie es formale An­for­de­rungen aufgreift, An­zahl, Motiv, Farb­ge­bung, Um­ge­bung, Stil oder Technik.

Die Er­geb­nis­se fand ich in mehr­fa­cher Hin­sicht überraschend, denn sie haben alle einen Schlag ins Absurde, etwas Ver­rutsch­­tes, Tra­gisches, Ab­sto­ßen­des. Il­lus­tra­tor:innen wer­den nicht so rasch sämt­lich arbeits­los, wie eine Freundin neulich mutmaßte.

Au­ßer­dem schafft es die Deep-Learning-Technologie nicht ein­mal, das vor­han­dene Bild­ma­te­rial zu un­se­rer Ar­beit sich so ak­ku­rat als Grund­la­ge zu neh­men, dass mein Beruf in sei­nen Krea­tio­nen über­ra­schungs­frei wie­der­zu­er­ken­nen ist.

Zunächst sind die meis­ten in­ter­pre­ter, die mir das System für mich "zeich­net", "malt" oder "ge­staltet", Männer. Hätte die KI richtig "hin­ge­se­hen", wäre ihr auf­ge­fal­len, dass die über­wie­gende Mehr­heit von uns weib­li­chen Ge­schlechts ist. Die Män­ner­do­mi­nanz ist auch schon anderswo aufgefallen, wo die An­for­de­rung "science jour­nalist" gelau­tet hat. (Kur­ze Erin­ne­rung: Englisch kennt keine männ­lichen oder weibl­ichen Ar­ti­kel, da ist alles the.)

Außer­dem hat die KI nicht "ver­standen", dass wir im Prin­zip zu zweit (oder zu dritt) je Spra­che ar­bei­ten. Mir werden spontan nur Ein­zel­per­so­nen gezeigt. Fordere ich expli­zit zwei oder mehr an, sitzen diese nicht sel­ten an ge­trenn­ten Pulten, Rücken an Rücken, auf einem Haufen am lan­gen Tisch, oder aber sie wer­den ver­schie­de­nen Flag­gen zu­ord­net.

Das Wort Dolmetsch­ka­bine, inter­pre­ting booth, wurde nicht rich­tig ge­le­sen. Booth kann Hütte, Bret­ter­bude, Zelle, Messe­stand oder eben "Kabine" heißen. Ich be­kom­me Darstel­lungen kleiner Zelte, von Un­ter­stän­den, Käfigen oder Glas­hütten (der Sound?!) — oder aber der Hin­ter­grund ist ein­fach schwarz.

Wie wir arbeiten, mit Kopf­hö­rern und Mikro­fo­nen, ist manch­mal zu sehen, aber auch nicht immer. Mikro­fonkabel verlieren sich im Nir­gend­wo, einmal sind Ohr und Kopf­hö­rer­mu­schel ein fleisch­far­bens Ganzes, andere Fi­gu­ren spre­chen in eckige black boxes hinein, einmal zeigt ein Mikro sogar durch rotes Licht, dass es ein­ge­schal­tet ist. Unser Ar­beits­um­feld, ob­wohl mit unzäh­ligen Bildern im Netz dar­ge­stellt, ist sonst nicht vor­han­den.

Ab und zu ar­beiten wir gemäß DALL.E mit Pa­pier, einmal liegt irgend­wo ein Mo­bil­te­le­fon herum. Nur zwei Mal unter 100 Bil­dern ist ein Laptop dar­ge­stellt, ein an­de­res Mal eine Tas­ta­tur, dafür ande­re merk­wür­di­ge Objekte, viel Be­schrif­tung und National­flag­gen von Phan­ta­sie­ländern. Manch­mal kle­ben Land­karten an den Wän­den unserer "Kabi­nen", flie­gen Zettel durch den Hinter­grund, oft sind die Schei­ben blind, einmal sieht der Kol­lege immer­hin ins Grüne.

Diverse merkwürdige Darstellungen von "Dolmetscher:innen"
Unterschiedliche Vorgaben: realistic, 3D, french, painting, historic
Dass wir die Redner:innen sehen, wird jedes We­sen aus Fleisch und Blut ver­ste­hen, denn die Kör­per­spra­che der Spre­chen­den verrät einiges, wir können uns so auf Sprecher­wech­sel ein­stel­len, le­sen auch schon mal von den Lippen ab. Die KI-Bil­der deuten hier und da ei­ne Si­mul­tan­dol­metsch­kon­so­le an­ und Kabel, über die wir mit der Au­ßen­welt ver­bun­den sind wie der Em­bryo mit dem Ute­rus.

Wie wir ar­bei­ten, igno­riert das Sys­tem. 

Warum wir zumeist in Kabinen sitzen, kann es nicht "verste­hen", also auch kei­ne damit verbun­denen Objekte er­ken­nen und wie­der­geben.

Anders ge­sprochen: Bereiche, die das Pro­gramm nicht trai­niert hat, kann es nicht erschlie­ßen; "ler­nen" braucht bis­lang de­zi­diert ein mensch­liches Ange­bot und Trai­ning durch Pro­gram­mierer:in­nen. Zum Teil wird diese Auf­gabe bei die­ser Art Tech­no­lo­gie schon an die Nut­zer:innen ausgelagert, da diese die KI-Produkte bewerten und Än­de­run­gen vor­schla­gen können.

Bis­lang sehen die weib­liche Fi­gu­ren über­wie­gend miss­gelaunt aus, anderen rut­schen Partien ih­res Antlit­zes aus dem Gleich­ge­wicht, um es vorsichtig zu sagen. Oft ist trotz des Plu­rals in meiner "Bestel­lung" nur eine Person zu sehen. Wenn nach explizit ge­än­derten Vor­gaben, two inter­pre­ters, dann zwei Figuren auf­tau­chen, sprechen und gesti­ku­lieren sie gleich­zeitig. Dass wir im Wech­sel im On sind, steht im Inter­net an vielen Stellen; offensichtlich "kennt" das System zur künst­li­chen Erschaf­fung von Bildern maximal einige On­line­bilder und analy­siert den Text nicht (den das System ohnehin nicht ver­ste­hen würde).

Den for­mel­len Dress­code, der in unserer Branche üblich ist, hat das System richtig "erkannt". Manche Klei­dung sieht indes wie eine Polizei­uni­form aus. Ein Bild er­in­nert mich an eine Zoll­be­am­tin am Flughafen in New York, zur Kleidung kom­men noch stren­ge Haar­tracht und strenger Blick hin­zu. Ohne Head­set sitzt eine an­de­re Lady hin­ter einer Art Em­pfangs­tre­sen, sie hält einen Te­le­fonhörer in der Hand. Komplett ohne Technik kom­men andere Fi­gu­ren aus, darunter eine Dame, die wie eine Pro­fes­so­rin aus einem Buch vor­zu­lesen scheint. Ir­ri­tie­ren­der­weise weist ihr Hin­ter­grund ähnliche fa­cet­tierte Un­ter­tei­lungen auf wie unsere Dolmetschka­bi­nen. Eine andere Ka­bi­ne wirkt fast re­alis­tisch, nur ein wenig ab­ge­rockt; die KI war dann "müde" und es hat nur noch zu einem Bü­ro­stuhl ge­reicht.

Flächige Grafik: Zwei Damen in einem "Kasten", eine angelt den Ton bei der anderen, beide sprechen gleichzeitig ("Sprechblasen")
Dolmetscherinnen in der Kabine mit Technik der Zukunft       

Sehr oft scheinen vor allem wir Frauen für die "kre­ie­ren­den" Bits & Bytes un­freund­liche, häss­liche, fast in­hu­mane Wesen zu sein. Sogar dann, wenn ich als "Aufgabe" very, very beau­ti­ful femal inter­pre­ters angebe, geht grund­sätz­lich noch etwas was schief.

Wie zum Aus­gleich könnten die meis­ten ab­ge­bil­de­ten männ­lichen Dol­met­scher um­ge­hend auf dem Lauf­steg eine gute Fi­gur ma­chen, wenn sie nicht be­reits, Halb­göt­tern gleich, wie von Zau­ber­hand aus dem Moni­tor wach­sen.

Einmal beauf­trage ich das System, Franzö­sisch­dol­met­scherinnen zu 'liefern' und er­hal­te prompt eine Ma­dame, die in der Kabine eine Bas­ken­mütze trägt. Über­haupt sind Kopf­be­deckungen in der Box of­fen­bar groß im Kommen. Die KI zeigt mir Stroh- und Ti­roler­hüte oder Si­cher­heits­helme. Aus man­chem Mund wach­sen ko­mi­sche Pflanzen, andere Fi­gu­ren haben ausgelei­erte Ohren (oder sie schlackern nur mit den­selben, das ist nicht klar). Hier ist das Riech­organ in den Damen­bart ge­rutscht, dort ein Auge in Git­ter­form auf­ge­ris­sen oder das Gesicht gänz­lich ver­wischt. Wie gesagt, meistens sind wir Dolmetschpersonen identitätslos, männ­lich oder ohne Ab­bil­dung.

Das spiegelt un­frei­wil­lig die öf­fent­li­che Wahr­neh­mung un­seres Berufes wider. Wir sind Stim­men, sonst nichts, die Men­schen dahinter zählen für viele leider nicht.

______________________________
Illustrationen:
DALL.E

Keine Kommentare: