Lasst die Roboter spielen

  Ralf Hersel   Lesezeit: 4 Minuten  🗪 1 Kommentar

Google hat eine KI präsentiert, die aus Texteingaben ganze Musikstücke mit Gesang generiert.

lasst die roboter spielen

Im letzten Wochenendartikel habe ich die Verfügbarkeit einer Musik-KI, die Musik mit Instrumenten und Gesang auf der Basis eines Prompts (Eingabetextes) erzeugen wird, als nächsten Schritt angenommen. Nun hat die Forschungsabteilung von Google eine wissenschaftliche Arbeit über ihre KI MusicLM veröffentlicht. Zwar ist die Musikmaschine noch nicht öffentlich zugänglich, die publizierten Ergebnisse lassen aber hoffen, oder fürchten.

Das Modell von Google ist sicherlich nicht das erste generative KI-System für Songs. Es gab bereits andere Versuche, darunter Riffusion, eine KI, die Musik komponiert, sowie Dance Diffusion, Googles eigenes AudioML und OpenAIs Jukebox. Aufgrund technischer Beschränkungen und begrenzter Trainingsdaten war jedoch keines von ihnen in der Lage, besonders komplexe Kompositionen oder hochqualitative Songs zu produzieren.

MusicLM wurde mit "nur" 280.000 Stunden Musik trainiert, um zu lernen, kohärente Songs für Beschreibungen von signifikanter Komplexität zu generieren. Die Songs klingen bemerkenswerterweise so, wie ein menschlicher Künstler komponieren könnte, wenn auch nicht unbedingt so einfallsreich oder musikalisch kohärent. Hier ist ein Beispiel von der MusicLM Seite mit folgendem Prompt:

Langsames Tempo, Bass- und Schlagzeug-geführter Reggae-Song. Getragene E-Gitarre. Hohe Bongos mit klingenden Tönen. Der Gesang ist entspannt, sehr ausdrucksstark und locker.

Die Fähigkeiten von MusicLM gehen über die Erstellung kurzer Clips von Liedern hinaus. Die Google-Forscher zeigen, dass das System auf bestehenden Melodien aufbauen kann, egal ob diese gesummt, gesungen, gepfiffen oder auf einem Instrument gespielt werden. Überdies kann MusicLM aus mehreren nacheinander folgenden Beschreibungen (z. B. "Zeit zum Meditieren", "Zeit zum Aufwachen", "Zeit zum Laufen", "Zeit, 100 % zu geben") eine Art melodische Geschichte oder Erzählung von bis zu mehreren Minuten Länge erstellen, zum Beispiel für einen Filmsoundtrack.

Das ist noch nicht alles. MusicLM kann auch über eine Kombination aus Bild und Beschriftung instruiert werden oder Audio generieren, das von einem bestimmten Instrumententyp in einem bestimmten Genre "gespielt" wird. Sogar das Erfahrungsniveau des KI-"Musikers" kann eingestellt werden, und das System kann Musik erzeugen, die von Orten, Epochen oder Anforderungen inspiriert ist.

Aber MusicLM ist nicht fehlerfrei. Einige der Samples haben eine verzerrte Qualität (höre das Tonbeispiel weiter oben), eine unvermeidliche Nebenwirkung des Trainingsprozesses. Und obwohl MusicLM technisch in der Lage ist, Gesang, einschliesslich Chorharmonien, zu erzeugen, lassen diese doch sehr zu wünschen übrig. Die meisten "Texte" reichen von kaum Englisch bis zu reinem Kauderwelsch, gesungen von synthetischen Stimmen, die wie eine Mischung aus verschiedenen Künstlern klingen.

Die Google-Forscher weisen auf die vielen ethischen Herausforderungen hin, die ein System wie MusicLM mit sich bringt, einschliesslich der Tendenz, urheberrechtlich geschütztes Material aus den Trainingsdaten in die generierten Songs einzubauen. Während eines Experiments stellten sie fest, dass etwa 1 % der vom System generierten Musik direkt von den Liedern übernommen wurde, mit denen es trainiert wurde.

"Wir sind uns des Risikos einer möglichen Zweckentfremdung von kreativen Inhalten durch den Anwendungsfall bewusst", schreiben die Mitautoren der Studie. "Wir betonen nachdrücklich die Notwendigkeit weiterer zukünftiger Arbeiten zur Bewältigung dieser Risiken im Kontext der Musikerzeugung".

Es dürfte noch eine Weile dauern, bis bezüglich der ethischen und rechtlichen Fragen Klarheit herrscht. Mehrere Gerichtsverfahren, die derzeit anhängig sind, werden sich wahrscheinlich auf musikgenerierende KI auswirken, darunter eines, das die Rechte von Künstlern betrifft, deren Werke ohne ihr Wissen oder ihre Zustimmung zum Training von KI-Systemen verwendet werden.

Quellen:

https://google-research.github.io/seanet/musiclm/examples/

https://techcrunch.com/2023/01/27/google-created-an-ai-that-can-generate-music-from-text-descriptions-but-wont-release-it/?tpcc=tcplusfacebook

Bildquelle: https://makerfaire.com

Tags

Künstliche Intelligenz, Google, MusicLM, Song, Generierung

Daniel Schär
Geschrieben von Daniel Schär am 30. Januar 2023 um 14:29

Da gab es schon vor knapp 7 Jahren einen Beatles Song der mithilfe von künstlicher Intelligenz erzeugt wurde, welchen ich ziemlich überzeugend fand (obwohl sich die AI auffällig vieler typischen Klischees bedient hatte): https://youtu.be/LSHZ_b05W7o