Musik und KI, wo stehen wir? Eine Zusammenfassung der neuen Technologie, von Deepfakes bis hin zu Protesten von Künstlern

Jedes Mal, wenn eine neue Technologie in den Bereich der Kunst eingeführt wird, entstehen gegensätzliche Fraktionen, die auf die beiden Kategorien zurückgeführt werden können, die Umberto Eco in seinem berühmten Essay Apocalyptic and Integrated (1964) vorgeschlagen hat. Auf der einen Seite die völlig Gegner und auf der anderen Seite die Unterstützer. Ein Beispiel dafür könnte vor allem die Fotografie sein: Als sie eingeführt wurde, spekulierten einige „Apokalyptiker“ — darunter C. Baudelaire und Walter Benjamin —, dass eine so leistungsstarke Technologie, die ein Bild, das mit der Realität identisch ist, perfekt wiedergeben kann, das Ende von Malerei und Illustration bedeuten würde. Aber wie wir wissen, war das nicht genau der Fall, und die Fotografie wurde zu einer neuen Kunstform. Der Widerstand gegen Technologie war im Bereich der Musik schon immer besonders stark und feindselig. Denken Sie nur daran, wie viel Mühe elektronische Musik auf sich nehmen musste, bevor sie als würdevoll anerkannt wurde wie „Musik, die mit Instrumenten gespielt wird“. In jüngerer Zeit musste sich die Branche auch zahlreichen technologischen Veränderungen ihrer Konsum- und Vertriebsmethoden stellen, die zu erheblichen ethischen und wirtschaftlichen Konflikten geführt haben. Denken Sie an den Übergang von CDs zu MP3s und das Aufkommen von Napster und anderen Peer-to-Peer-Sharing-Systemen, die zur Verbreitung von Piraterie führten. Oder die neuere totale Dematerialisierung der Musik und die neuen Vereinbarungen zwischen Plattenfirmen und Streaming-Plattformen. Die Art und Weise, wie die Öffentlichkeit Musik konsumiert, wird in Diskussionen über KI oft ignoriert, aber sie ist genauso wichtig wie die Art und Weise, wie Musik selbst entsteht.

Die ersten Schritte der KI bei der Musikkreation

Die ersten Experimente zum musikalischen Potenzial generativer KI wurden größtenteils als harmlose Unterhaltung wahrgenommen. Denken Sie an Daddy's Car, einen Song im Beatles-Stil von vor fast zehn Jahren (damals 2016), in dem zum ersten Mal Musik vom KI-Programm Flow Machines komponiert wurde. Viele Menschen haben wahrscheinlich nie davon gehört, da diese „Songs“ zu der Zeit noch als bloße Experimente galten, die an Streiche grenzten. Vier Jahre später, auf dem Höhepunkt der Pandemie, tauchten die von OpenAI generierten sogenannten Jukebox-Samples auf. Dies waren im Wesentlichen einminütige Stilübungen, bei denen Musikrichtungen und Künstlerstile vermischt wurden, mit Titeln wie Folk Rock im Stil von Simon und Garfunkel. Aufgrund der Verwendung echter Künstlernamen sind diese Samples heute nicht mehr auf SoundCloud verfügbar.

Deepfake

@emortalye Kanye ft Carti #praiselordkanye #eatemos #musicai #aimusic Originalton - emortalye

In den letzten fünf Jahren sind die Dinge deutlich ernster geworden. Zu den meist negativ wahrgenommenen Fällen gehört das Phänomen der sogenannten Deepfakes, die sich auf YouTube und TikTok weiter ausbreiten. Dies sind im Wesentlichen Songs, die künstliche Intelligenz verwenden, um die Stimmen berühmter Sänger nachzubilden. Der auffälligste Fall war Heart On My Sleeve, ein gefälschter Song von Drake and The Weeknd, der 2023 vom anonymen Produzenten Ghostwriter veröffentlicht wurde. Die Ähnlichkeit der Stimmen und der Ruhm der beiden Künstler ermöglichten es, dass der gefälschte Track über 20 Millionen Mal abgespielt wurde, bevor Universal es schaffte, ihn von allen Streaming-Plattformen zu entfernen. Andere bemerkenswerte Experimente sind Jay-Z, der Shakespeare rezitiert, Kanye West singt Somebody That I Used To Know und sogar ein ganzes unveröffentlichtes Oasis-AlbumAisis, The Lost Tapes Vol. 1 — das eigentlich nur ein Album der Band Breezer war, bei dem die Stimme des Sängers durch eine KI-generierte Liam Gallagher-Stimme ersetzt wurde.

@grimes #aiart I Wanna Be Software - Grimes & Illangelo

Wenn die vorherigen Fälle als gefälschte Waren betrachtet werden können, wie etwa eine gefälschte Rolex oder eine einfache Nachahmung, gibt es andere Fälle, die wir als mehr oder weniger tugendhaft ansehen könnten, oder zumindest, in denen das rechtliche Problem nicht besteht und die ethische Debatte nuancierter ist. Ein Beispiel ist Grimes: Sie begann leichtfertig mit dem Projekt AI Lullaby — bei dem ihre Stimme mit Umgebungsgeräuschen kombiniert werden konnte, um Kindern beim Schlafen zu helfen — und entschied sich später, ihre Stimme verfügbar zu machen, sodass jeder sie verwenden konnte, um neue KI-generierte Songs zu kreieren und so ein potenziell unendliches Kontinuum zu entwickeln. So extrem es auch sein mag, niemand kann diese Wahl aus ethischer oder rechtlicher Sicht anfechten, da es in diesem Fall ein freier Ausdruck ihrer persönlichen künstlerischen Vision ist und nur sie die Rechte an ihrer Stimme und Musik besitzt.

Das bisher auffälligste Beispiel ist sicherlich die Veröffentlichung eines neuen Beatles-SongsNow And Then — im Jahr 2024, der sogar einen Grammy in der Kategorie Best Rock Performance gewann. Im Vergleich zu Daddy's Car befinden wir uns buchstäblich auf einer anderen Ebene (für Interessierte gibt es eine Mini-Dokumentation, die die Geschichte des Songs zusammenfasst): Ursprünglich war es ein altes Band mit einem Homerecording von John Lennon, dessen Qualität zu schlecht war, um daraus einen fertigen Song zu machen. Die übrigen Beatles hatten es bereits in der Vergangenheit versucht, den Versuch aber aufgrund der schlechten Audioqualität abgebrochen. Dank einer neuen KI-basierten Technologie — dieselbe, die Peter Jackson für den Dokumentarfilm Get Back verwendet hat — war es jedoch möglich, den Ton zu isolieren und eine für die Veröffentlichung akzeptable Qualität zu erzielen. Diese Operation könnte als eine Restaurierung des kulturellen Erbes angesehen werden. Und wenn das Endergebnis ein großartiger neuer Song von der besten Band der Geschichte ist, kann das Gesamturteil nur positiv ausfallen.

Vor- und Nachteile von AI Music

Eine mögliche zukünftige Degeneration der bisher diskutierten Praktiken könnte darin bestehen, sich mitreißen zu lassen und geschmacklos zu werden, indem Millionen neuer Songs verstorbener Sänger veröffentlicht werden, die durch KI generiert wurden. So gesagt mag es dystopisch erscheinen, aber angesichts des Interesses der Öffentlichkeit an posthumen Alben und der Tendenz der Plattenfirmen, den Boden des Fasses zu kratzen, um neue Musik von verstorbenen Künstlern zu veröffentlichen, sollte dieses Thema nicht unterschätzt werden. Denken Sie nur daran, wie viele Alben von Jeff Buckley nach seinem Tod veröffentlicht wurden, oder an die minderwertigen Skizzen, die im sogenannten Soloalbum von Kurt Cobain enthalten sind. Sicher, in diesen Fällen hatten zumindest die Songs historischen Wert, weil es Tracks gab, die der Künstler bewusst aufgenommen hatte, aber wenn selbst diese Grundlage fehlen würde, welchen Wert hätten die Songs dann? Schwer zu sagen. Und wie würden wir die Situation beurteilen, wenn künstliche Intelligenz eingesetzt würde, um Sängern zu „helfen“, die noch am Leben sind, aber aus gesundheitlichen Gründen mit dem Singen aufhören mussten? Wäre es positiv oder negativ, wenn jemand wie Steven Tyler, der gezwungen war, die Bühne zu verlassen, beschließen würde, KI so auszubilden, dass sie seine Stimme reproduziert und heute ein neues Aerosmith-Album veröffentlicht? Auch hier ist es schwer zu sagen, aber an diesem Punkt sind wir wahrscheinlich nicht allzu weit davon entfernt, es herauszufinden.

Die Frage der öffentlichen und funktionalen Musik

Es scheint, dass ein großer Teil der heutigen Öffentlichkeit nicht mehr sehr daran interessiert ist, zu wissen, wer der Künstler ist, den sie hören, sondern sich mehr um die allgemeine Stimmung kümmert, die vermittelt wird. Aus diesem Grund gibt es immer mehr Playlisten, die direkt von Plattform-Editoren oder Algorithmen generiert werden, insbesondere solche, die sogenannte „funktionale Musik“ anbieten, also Musik zum Anhören bei bestimmten Aktivitäten wie Laufen, Lernen oder Schlafen, oder solche, die eine bestimmte Stimmung wie Entspannung oder Melancholie hervorrufen. Von hier aus sind Vereinbarungen zwischen zwei großen Plattenfirmen — Warner und Universal — und der Firma Endel zustande gekommen, die praktisch führend auf dem Gebiet der funktionalen Musikkreation ist, die darauf abzielt, Stress durch KI abzubauen. Auf Endels Spotify-Profil gibt es ganze Alben mit selbsterklärenden Titeln wie The Most Beautiful Calm oder Antarctican Dream Machine (Relax Soundscape).

Das Thema Ghost Artists

Während die KI-produzierte Musik von Endel offen deklariert wird, gilt das nicht für Musik, die von sogenannten Ghostkünstlern auf Spotify produziert wird. Das Problem wurde kürzlich von der Journalistin Liz Pelly in einem neu veröffentlichten Buch mit dem Titel Mood Machine — The Rise of Spotify and the Costs of the Perfect Playlist ans Licht gebracht. Die Untersuchung ergab, dass Spotify externe Unternehmen, die immer noch mit der Plattform verbunden sind, beauftragt, Instrumentaltracks zu erstellen, die dann unter falschen Künstlernamen in den meistgehörten Playlisten platziert werden, um Lizenzgebühren zu generieren, die später an die Plattform selbst weiterverteilt werden. Im Moment gibt es wenig Gewissheit darüber, wie diese Songs entstehen oder wer ihre Autoren sind, aber die Möglichkeit, dass KI eine Rolle spielt, kann nicht ausgeschlossen werden. Schließlich hat das Hauptunternehmen hinter diesen falschen Künstlern — Epidemic Sound — bereits offen erklärt, dass es seinen Komponisten den Einsatz von KI ermöglicht.

Der regulatorische Rahmen — Warum protestieren Künstler?

Haben Künstler angesichts der bisherigen Diskussionen Recht, gegen KI-Interferenzen zu protestieren? Das hängt davon ab, welche Bedenken sie haben, aber es stimmt, dass auf regulatorischer Ebene noch viel zu tun ist. In den letzten Tagen hat ein Gesetzesvorschlag der britischen Regierung, der darauf abzielt, KI-Schulungen mit urheberrechtlich geschützten Kulturprodukten zu ermöglichen, eine heftige Debatte ausgelöst. Die Gegenreaktion führte zur Gründung eines Kollektivs von tausend Musikern — darunter Kate Bush und Damon Albarn von Blur —, die ein stummes Protestalbum veröffentlichten, eine Platte, die symbolisch aus zwölf leeren Titeln besteht, deren Titel zusammengenommen den Satz bilden: Die britische Regierung darf Musikdiebstahl nicht legalisieren, um KI-Unternehmen zu helfen. In den USA war Tennessee der erste Staat, der ein Gesetz zum Schutz von Musikern vor Missbrauch im Zusammenhang mit KI verabschiedete, wo im vergangenen Jahr der sogenannte Elvis Act (Ensuring Likeness Voice and Image Security) in Kraft trat. Das Problem ist, dass es sich um ein staatliches Gesetz und nicht um ein Bundesgesetz handelt und daher über die Landesgrenzen hinaus keine Gültigkeit hat. Auf Bundesebene kommt dem Schutz vor KI-Missbrauch ein Werbegesetz am nächsten, das die Verwendung der Stimme einer Person in Werbung ohne deren Zustimmung verbietet. Was die Europäische Union anbelangt, so wurde in diesem Jahr mit der schrittweisen Einführung des KI-Gesetzes begonnen, aber der Weg ist noch lang, und seine Auswirkungen und Wirksamkeit bleiben abzuwarten.

Expertenmeinungen zu KI-Musik

@innerkaizen Miyazaki Hayao on AI: #miyazaki #hayaomiyazaki #ghibli Ladyfingers by Herb Alpert and The Tijuana Brass - Mieze Katz

Laut Francesca Lagioia — Professorin für Rechtsinformatik, KI und Recht sowie Ethik für KI an der Universität Bologna — kann durch künstliche Intelligenz geschaffene Kunst niemals die von Menschen geschaffene Kunst ersetzen oder mit ihr verglichen werden, da die kreativen Fähigkeiten von KI nur kombinatorisch sind, was bedeutet, dass sie lediglich in der Lage ist, bereits bestehende Ideen wieder zusammenzusetzen, aber keine wirklich neue Idee hervorbringen kann. Das ist beruhigend, eröffnet aber eine Welt philosophischer Spekulationen darüber, was eigentlich eine neue Idee ausmacht. Hayao Miyazaki, der Meister der japanischen Animation, zeigte sich angewidert, als ihm eine KI-generierte Animation gezeigt wurde — nicht aus Prinzip, sondern weil die Kreation einer Parodie auf eine Person mit motorischen Behinderungen ähnelte. Seiner Ansicht nach könnte sich nur eine Maschine, die menschliches Leid nicht versteht, eine solche Abweichung vorstellen. Miyazakis Perspektive mag zwar rein sein, aber für unsere zynischen westlichen Augen mag sie etwas zu unschuldig erscheinen, um völlig überzeugend zu sein. Eine konkretere und beruhigendere Sichtweise kommt vom Musikkritiker Simon Reynolds, der aufschlussreich auf etwas scheinbar Offensichtliches hinwies: KI „hört“ keine Musik — sie hat weder Ohren noch einen Körper —, aber jede Musik beeinflusst uns durch unsere sensorischen und kinästhetischen Fähigkeiten. KI kann Musik nicht vollständig verstehen, weil ihr unsere physische und neuronale Erfahrung fehlt.

Schließlich kam die komplexeste und überzeugendste Antwort — gerade weil sie instinktiver und menschlicher ist — vor einigen Jahren von Nick Cave, als er einem Fan antwortete, der versuchte, mithilfe von KI einen Song „im Stil von Nick Cave“ zu schreiben:

„Einen guten Song zu schreiben ist keine Nachahmung, Replikation oder Pastiche, es ist das Gegenteil. Es ist ein Akt der Selbstvernichtung, der alles zerstört, was man zuvor versucht hat zu schaffen. Es sind gefährliche Abgänge, herzzerreißende Sprünge, die den Künstler über die Grenzen dessen treiben, was er als sein bekanntes Ich anerkennt. Dies ist Teil des authentischen kreativen Kampfes, der der Erfindung eines wirklich wertvollen Werkes vorausgeht; es ist die atemlose Konfrontation mit der eigenen Verletzlichkeit, der eigenen Gefahr, der eigenen Bedeutungslosigkeit, kontrastiert mit dem Gefühl einer plötzlichen und schockierenden Entdeckung; es ist der erlösende künstlerische Akt, der das Herz des Zuhörers bewegt, wo der Hörer im Innenleben des Songs sein eigenes Blut, seinen eigenen Kampf, seinen eigenes Leid. Das ist es, was wir bescheidenen Menschen bieten können, was die KI nur nachahmen kann — die transzendente Reise des Künstlers, der sich ständig mit seinen eigenen Fehlern auseinandersetzt. Darin liegt das menschliche Genie, das tief in diesen Grenzen verwurzelt ist und doch über sie hinausgeht.“

Was man als Nächstes liest