Dieses Jahr habe ich über 30.000 Buchseiten gehört. Ja, gehört, und dazu noch tausende von Seiten gelesen. Ich mag Hörbücher. Es gibt Phasen, in denen ich erschöpft bin, nach sehr anstrengenden Einsätzen zum Beispiel. Oder ich bin im Wartemodus an der Seite einer betagten verwandten Person. Drittes Moment: der Hausputz. Und schließlich die Nächte, in denen mich Hitzewallungen wachhalten. Seit zwei Jahren erlebe ich das, was viele Frauen erleben. (Es ist, wie fast alles, was mit Frauen zu tun hat, in Deutschland fast ein Tabu.)
Hörbücher begleiten mich in sehr körperlichen, sehr vulnerablen Situationen. Sie sind nah. Intim. Ich lässe eine Stimme an mich heran, oft über Stunden.
Ich liebe gute Stimmen.
Wiederholt habe ich Bücher abgebrochen oder, sofern gekauft, zurückgegeben, weil sie schlecht gesprochen klangen: leblos, spannungslos, inhaltlich flach, auch bei anspruchsvollen Texten. Irgendwann wurde mein Verdacht zur Gewissheit: Hier ist KI am Werk. Und zwar schlechte.
Eine meiner Freundinnen arbeitet hauptberuflich als Sprecherin. Ich selbst spreche als Dolmetscherin beruflich ja auch und bekomme oft entsprechende Rückmeldungen, die mich ermutigen sollen, den Weg Richtung Hörbücher weiterzugehen. Doch hier holt uns die Technik ein. Der Freundin droht der Verlust der Lebensgrundlage. Mir würde Plan C verbaut. Und wieder drohen die nächsten Nerds, durch die Vernichtung kultureller Leistungen ihre Gewinne auf Kosten von Menschen zu vervielfachen.
Die Entwicklung geht derzeit rasend schnell. Begleitet von neuen technischen Möglichkeiten lässt sich eine erschwerende Tendenz beobachten: Das breite Publikum wird zunehmend anspruchsloser. In der U-Bahn wird immer schlechteres Deutsch gesprochen, auch die Kommentarspalten der Zeitungen (online) strotzen vor Stolperstellen: Denk- und Schreibfehler, unlogische Schlussfolgerungen, ideologische Verdrehungen.
Der Audiomarkt verändert sich massiv. Dokumentarfilmproduktionen nutzen vermehrt KI-Stimmen, um ihre Erstfassungen Redaktionen und Koproduktionsfirmen zu präsentieren. Das normalisiert den KI-Gebrauch, das nimmt Anfängern die Einstiegschancen. Bei YouTube, im ohnehin kaum bezahlten Feld, hauen grauenhaft monotone KI-Stimmen und Übelsetzungen im Voice-over Sachen raus wie „75 Quadratmeter“ statt 75 Fuß. Telefonansagen oder die berühmten Stimmen im öffentlichen Nahverkehr kommen längst vom Band, falsche Betonungen inklusive, was nicht nur Urberliner:innen stört. Es droht die Sprache zu verändern. In Berlin ist eine für Außenstehende „falsche“ Betonung richtig: Es heißt Fálkensee und nicht Falkensée.
KI-Projekte gelten als billig. Sie bedienen sich geklauter Stimmen. Wir haben ein massives Urheberrechtsproblem. Denn Tantiemen bekommt derzeit niemand für die eigene Stimme.
![]() |
| Auch das hier zeigt echte Berufe |
Außerdem bin ich falschen Betonungen gegenüber intolerant.Und das betrifft vieles, was täglich in den Medien zu hören ist, denn auch hier sinken die Standards. Leip-zick, Ho-nick, wich-tick, Kö-nick: diese falsche Auslautung ist nur ein kleines Beispiel.
Es gibt in den Konserven so viele Fehler, die kein Mensch hätte machen können: entstellende Fehlbetonungen zusammengesetzter Wörter etwa. Menschliche Stimmen haben manchmal hier ein Zögern, da ein Glucksen, ganz grundsätzlich ein Je-ne-sai-quoi, das sie unvergleichlich schön macht.
Ich hoffe, dass mehr Menschen diese Sensibilität mitbringen und dann einfach so reagieren, wie es sich gehört: Konserve, nein, zurückgeben, bestimmte Verlage meiden.
In Dänemark wird derzeit ein Gesetz vorbereitet, das die Nutzung von Stimmen und Fotos anderer Menschen verbieten soll, ein Copyright auf diese biometrischen Merkmale, vor allem um Deepfakes einzuhegen. Geschichten darüber, wie digitale Fälschungen Einzelner Angehörige um mehr als nur den Sparstrumpf erleichtert haben, erzielen hohe Einschaltquoten. Das dänische Modell klingt gut: Der „digitalen Kopiermaschine“ würde ein Riegel vorgeschoben, eine klare Grundlage für Klagen geschaffen, so der dänische Kulturminister gegenüber dem Guardian. Eine schon etwas ältere Meldung dazu gibt es beim Deutschlandfunk Kultur. Glücklicherweise gibt es eine Ausnahme: Parodie und Satire bleiben erlaubt.
Der KI-Müll verstopft zunehmend die Kanäle, das ist von den Tech-Bros so beabsichtigt: flood the zone with sh*t. Am Ende ist nichts mehr wahr, nichts mehr wichtig. Die KI nimmt Profis den Lebensunterhalt, den anderen die Hobbies: Malen, Zeichnen, Schreiben, Musizieren. Anstatt das zu tun, wofür wir Roboter liebend gern nutzen würden: Hausputz, Wäsche, Dinge reparieren.
Stimmen sind keine Ware, sie sind Ausdruck von Körper, Biografie, Erfahrung. Wer das nicht hört, hört vielleicht bald gar nichts mehr.
______________________________
Illustration: pixlr.com (Zufallsfund)

Keine Kommentare:
Kommentar veröffentlichen