Entwicklung

Der Soundtrack zum Spielspaß

Kai Rosenkranz   //   Februar 4, 2010   //   0 Kommentare

Musik leistet einen großen Beitrag zur Atmosphäre eines Spiels. Ein passender Soundtrack unterstützt die emotionale Wirkung und fügt dem Gesamterlebnis eine wichtige Ebene hinzu, die teilweise außerhalb der bewussten Wahrnehmung liegt. Doch wie trifft man als Komponist den richtigen Ton? Und wie kann man als Programmierer gewährleisten, dass die Musik stets zur Spielsituation passt?

Fast jeder kann mindestens eine kurze Sequenz aus einem Filmsoundtrack summen und vielleicht sogar das Gefühl rekonstruieren, das die zugehörige Szene im Kino ausgelöst hat. Musik ist sehr eng mit Emotion verknüpft. Mit keinem anderen Medium lässt sich direkter Einfluss nehmen auf das Gemüt des Konsumenten. Die Filmbranche hat das längst verstanden und mit ihren hochwertigen Soundtracks eine eigene Kunstform innerhalb der Filmkunst erschaffen. Die Bandbreite an Emotionen, die in einem Kinosaal jeden Abend auf das Publikum losgelassen werden, ist gewaltig. Von primitiven Empfindungen wie Furcht und Angst bis hin zu komplizierten Gefühlsfacetten wie Misstrauen, Sympathie, Mitleid, Trauer, Geborgenheit und Freude kann Musik nahezu alles ausdrücken und wird deshalb von den Filmemachern gern als Emotionsboten verwendet, der die Stimmung auf die Zuschauer übertragen soll.
Natürlich kann auch eine ästhetische Bildsprache im Zuschauer ein Wechselbad der Gefühle auslösen, genauso wie ein Duft oder eine Berührung theoretisch dazu in der Lage sind. Grundsätzlich ist das menschliche Gehirn so konstruiert, dass es bestimmte Reize mit der Erinnerung an ein Gefühl assoziativ verknüpfen kann. Das Parfüm der Exfreundin kann also ebenso dramatische Erinnerungen wecken wie das Hauptthema aus dem Film Schindlers Liste, wobei akustische Reize – insbesondere Musik – den direktesten Zugang zum Gefühlszentrum für sich beanspruchen.
Diesen Effekt können Computerspiele für sich nutzen. Meistens ist die Palette an Gefühlen, die in einem Game erzeugt werden sollen, eher beschränkt und ein »Lied vom Tot« deckt inhaltlich einen großen Teil aller Titel ab. Doch der Trend in Richtung Tiefgang ist deutlich erkennbar. Beyond Good & Evil beispielsweise hat mit seinen Tränendrüsen-Cutscenes vorgemacht, wie man beim Spieler ein echtes Interesse an fiktiven Charakteren erzeugt. Die wenigen Games, bei denen der Spieler auf einer emotionalen Ebene berührt wird, markieren einen wichtigen Meilenstein bei der Annäherung von Filmen und Spielen und zeugen von dem Bestreben, auch in Computerspielen echtes Gefühlskino zu bieten.

Der FILMharmonic Choir Prag singt für Gothic 3 in der rennomierten Dvorak Hall.

Von Panikpiano bis Höllenforte
Komponisten sollten sich dieser bedeutenden Aufgabe bewusst sein. Furcht und Panik im Spieler auszulösen gehört dabei noch zu den einfacheren Herausforderungen. Dass man sich hier immer gern bei den gängigen Klischees bedient und tiefe Soundflächen mit zirpenden Streichern bemüht, kommt nicht von ungefähr. Fremdartige Geräusche, die für die meisten Zuhörer entweder völlig ungewohnt oder – noch besser – mit bedrohlichen Erinnerungen verbunden sind, sorgen dabei für eine gute Grundlage. Ein tiefer, grummelnder Klangteppich, erzeugt durch eine leise Sinuskurve an der tiefsten Grenze des hörbaren Frequenzbereichs, löst im Unterbewusstsein des Opfers subtiles Unbehagen aus. Im Kino greift fast jeder Horrorstreifen auf diesen Trick zurück und lässt den Subwoofer kaum hörbar vor sich hin wummern. Ausgelutscht, aber gut. Der Schreck heiligt die Mittel. Auch durch Disharmonien wird die Musik den Hörgewohnheiten entrückt und bekommt dadurch etwas Fremdes und Bedrohliches. Das war auch schon das kleine Einmaleins der Angstmusik. Freude und Ausgelassenheit musikalisch umzusetzen, ohne dabei im Kitsch zu ertrinken, ist im Vergleich viel schwieriger. Zum Glück bleibt dieser Bereich der Gefühlsskala dem Game-Komponisten meistens erspart.

Interaktive Musik
Die Tatsache, dass Musik so einen gewichtigen Beitrag zur Stimmung des Spiels leistet, macht eines deutlich: Sie muss von guter Qualität sein, zielsicher komponiert und dynamisch angesteuert. Im Gegensatz zum Kinogänger, der in den Sitz einer emotionalen Achterbahnfahrt geschnallt wird, ohne selbst Einfluss nehmen zu können, fährt der Computerspieler meistens selbst. Mit linearer Dramaturgie im Soundtrack kommt man da nicht weit. Sei der musikalische Spannungsbogen im finsteren Dungeon auch noch so perfekt arrangiert, der Spieler kann jederzeit alles vermasseln und sich lieber ständig verlaufen, anstatt endlich in die Falle zu trappen und der Musik den verdienten Höhepunkt zu ermöglichen. Ergo, die Musik muss sich ständig flexibel an die Spielsituation anpassen können und solange das Herumirren des Spielers perfekt untermalen, bis er sich entschließt, den Schockmoment auszulösen. Die Musik ist dann also nicht mehr ausschließlich dazu da, eine bestimmte Stimmung zu erzeugen. Ihre Aufgabe ist es vielmehr, die Stimmung des Spielers jederzeit adäquat zu unterstützen und den passenden Soundtrack für seine Neugierde, Aufregung, Kampfeslust und Euphorie parat zu haben. Die Musik wird interaktiv. Dadurch steigt der Aufwand ins Unermessliche, aber es lohnt sich.
Die Probleme, die interaktive Musik mit sich bringt, liegen auf der Hand. Ein MP3-File mit idyllischer Musik ist absolut linear, es hat dem plötzlichen Ausbrechen eines Kampfes also nichts entgegen zu setzen. Ein zweites MP3-File mit der nötigen Hektik muss her. Doch wie komme ich nun vom ursprünglichen Idylle-Track zum Kampfthema, ohne dass man den Übergang hört? Dieses Problem muss das Musiksystem eines Spiels lösen, und es gibt dafür mehrere Möglichkeiten. Diese hängen davon ab, welche Technologie allgemein für die Wiedergabe von Musik im Spiel verwendet wird.

Das Produktionsteam von scoreworkers im Studio seventyone in Düsseldorf. Von links: Aufnahmetechniker Jin Choi, Komponist Kai Rosenkranz, Musiker Bobby Glorian und Tonmeister Stephan Cahen.

Veni, MIDI, Vici
Die Abkürzung MIDI steht für »Musical Instrument Digital Interface« und bezeichnet eine gemeinsame digitale Schnittstelle für Musikinstrumente. Der Begriff stammt aus dem Jahr 1981, einer Zeit, in der man sein klobiges Keyboard noch mit seinem Atari verkabelte und das Zeitalter der PCs oder Macs noch nicht begonnen hatte. Noch heute basieren die meisten Programme zur Erstellung von Musik am Computer auf dem mehr als 25 Jahre alten Format.
Im Gegensatz zu MP3-Dateien, die Klänge direkt darstellen, enthalten MIDI-Dateien lediglich Steuersignale für einzelne Noten und Events wie Tempowechsel oder Lautstärkeänderungen. Die eigentlichen Klänge werden dann beim Auswerten des MIDI-Files erzeugt. Man stelle sich also eine Datei vor, in der Anweisungen á la »Spiele in Takt 4, an Position x die Note Fis« vermerkt sind. Allein diese Anweisungen machen noch keinen Mucks, es wird also ein Klangerzeuger benötigt, der die Kommandos auswertet. Mono- oder polyphone Klingeltöne bei Handys nutzen dieses Prinzip und spülen den Anbietern Millionen in die Kassen, da MIDI-Dateien sehr klein sind und demnach unkompliziert verschickt werden können.
Die Soundqualität der Musik hängt bei MIDI nicht von der Konfiguration des Systems ab, auf dem die Musik komponiert wurde, sondern vielmehr von dem vorhandenen Klangerzeuger auf dem System des Spielers. Während das Prinzip der FM-Synthese, also der algorithmischen Modulation von Frequenzen zur synthetischen Erzeugung von Klängen, weitestgehend ausgedient hat, verwenden modernere Systeme einzelne Samples, die dem Produkt beiliegen und von den MIDI-Signalen angesteuert werden können. Anzahl und Qualität der Samples, also beispielsweise der einzelnen Streicher- und Bläserklänge, bestimmen hier die Qualität des Endproduktes. Nostalgikern ist dieses Prinzip noch von den MOD-Files der Amiga-Musikszene bekannt, und tatsächlich unterscheiden sich die zeitgemäßen Varianten lediglich in puncto Sample-Anzahl und –Qualität von dem ursprünglichen Konzept.

»Hall« of fame
Da bei MIDI-basierten Systemen zur Wiedergabe von Musik in Spielen einzelne Samples in Echtzeit gemischt werden, ist das Ergebnis zunächst ein »trockener« Rohmix. Trocken bedeutet in diesem Zusammenhang, dass er völlig frei von Raumhall (Reverb), Frequenzkorrekturen (Equalizer), Dynamikbearbeitung (Compressor) und anderen Post-Processing-Effekten ist. Verglichen mit aufwändigen Studioproduktionen klingt der Mix flach und unspektakulär. Man sollte also darauf achten, dass das Musiksystem die Möglichkeit bietet, den Rohmix zumindest mit rudimentären Reverb-Algorithmen aufzumotzen. Microsofts interaktives MIDI-Musiksystem DirectMusic, der komplexeste Bestandteil von DirectX Audio, bietet hierfür einige nützliche Werkzeuge. Mehr dazu später. Sofern man sich gegen derartige Rundum-Sorglos-Konzepte entscheidet, sollte man diesen Punkt bei der Programmierung selbst berücksichtigen.

Kai Rosenkranz und Aufnahmetechniker Jin Choi bei einer Nachtschicht im Tonstudio seventyone.

Technologiemuseum
Die meisten Games der Neunziger verwendeten MIDI-Soundtracks in Verbindung mit der bereits erwähnten FM-Synthese. Der Sound klang synthetisch, aber aufgrund der MIDI-Grundlage konnten schon die frühen Adventures aus dem Hause LucasArts fließend zwischen unzähligen Musikstücken wechseln. Da das komplette Notenmaterial in den MIDI-Files vorlag und in Echtzeit ausgewertet wurde, konnte für einen nahtlosen Übergang auf Notenebene gesorgt werden. Einfache Cross-Fades, also das Ausblenden des einen und das gleichzeitige Einblenden des anderen Musikstücks, kamen ebenso zum Einsatz.
Im Laufe der Evolution von Gamemusik wurde lediglich das Prinzip der Crossfades für Übergänge übernommen, allerdings verwendete man nun Audio-Files wie MP3 oder WAVE für die Wiedergabe der Musik. Es wurde also nicht mehr in Echtzeit mit Samples gepuzzelt und rudimentär gemischt, sondern mit vorproduzierten Musikstücken gearbeitet. Der kinoverwöhnte Spieler erwartete Musik in Hollywood-Qualität, was innerhalb der Grenzen von Echtzeit-MIDI kaum realisierbar war. Um beispielsweise ein echtes Orchester abbilden zu können, müssten in fülligen Passagen teilweise mehr als hundert Einzelsounds ineinander gemischt werden. Zusammen mit der Rechenleistung der Post-Processing-Effekte hätte das den Speicherverbrauch und den Performance-Rahmen deutlich gesprengt, ohne jemals wirklich an die Qualität einer echten Orchesterproduktion heranzureichen. Deshalb produzierten die Komponisten Musikstücke in CD-Qualität mit aller nötigen Effekthascherei und schrieben MIDI für Spielemusik das Todesurteil aus. Damit wurde Film-reifer Klangqualität Tür und Tor geöffnet und gleichzeitig der Interaktivität Steine in den Weg gelegt, aufgrund der schon erwähnten Schwierigkeiten mit nahtlosen Übergängen zwischen zwei Audiodateien.

DirectX® audio, das zweischneidige Schwert
Microsoft hat sich der diffusen Situation im Bereich der Gamemusik angenommen und ein System entwickelt, das für die Erstellung von hochwertiger und interaktiver Musik maßgeschneidert ist und Musiker wie Programmierer gleichermaßen glücklich macht. Herausgekommen ist DirectMusic als Bestandteil von DirectX Audio. In der jüngsten Version lässt das System kaum Wünsche offen, unter der Voraussetzung, dass man nicht gerade einen pompösen Orchestersoundtrack erstellen will.
DirectMusic stützt sich voll und ganz auf den bewährten Grundgedanken von MIDI-Files. Der Komponist bekommt die Möglichkeit, in einem einzig für DirectMusic erstellten Musikeditor, dem DirectMusic Producer, einzelne musikalische MIDI-Puzzleteile zu arrangieren. Verglichen mit spezialisierter Sequenzer-Software zur Komposition und Arrangierung von Musik wie Cubase oder Logic verblasst der Producer in nahezu jeder Disziplin. Seine Existenzberechtigung verdankt er jedoch der Möglichkeit, mit einem einzigen Tool sämtliche Editing-Schritte für die Erstellung interaktiver Musik abzudecken, wenn auch teilweise äußerst unhandlich. Wer die eigentliche Komposition also lieber in seinem Lieblings-Sequenzer erledigen will, kann das tun und die MIDI-Files hinterher in den Producer importieren.
Sobald die MIDI-Notendaten im Producer in sogenannten Segmenten gespeichert sind, können eigene hochwertige Sample-Bibliotheken erstellt werden, mit denen die Musik wiedergegeben wird. Wer also ein kleines Vermögen in professionelle Sample-Libraries investiert, kann die Klangqualität nahezu verlustfrei in den Producer importieren und fortan damit arbeiten. Grundsätzlich bietet jede Sequenzer-Software mit integriertem Software-Sampler diese Möglichkeit. Allerdings gewährleistet DirectMusic, dass sämtliche benötigten Komponenten für die Wiedergabe, also die Notendaten in den Segmenten, die Samples, die Effekt-Einstellungen und die Logik für die interaktive Musik, in einem geschnürten Paket dem Spiel beiliegen und vom Programmcode unkompliziert angesteuert werden können. DirectMusic erfindet das Rad also nicht neu, sondern fasst etablierte Konzepte zusammen und bietet den Programmierern einfache Interfaces zur Implementation. Die erwähnten Post-Processing-Effekte sind vorhanden, man kann also Raumhall, Chorus, Echo und andere Spielereien hinzufügen. Die Algorithmen sind allerdings auf Sparsamkeit hinsichtlich der Performance ausgelegt und können natürlich nicht mit Studio-Alternativen oder teuren Sequenzer-Plugins mithalten.
Für überschaubare Arrangements, die mit wenigen Instrumenten auskommen, ist DirectMusic die perfekte Lösung. Sobald es komplexer wird, muss man Speicherbelastung und Performance schon sehr genau im Auge behalten. Es mag auf den ersten Blick ungewöhnlich erscheinen, dass ein Orchestersoundtrack unzählige gleichzeitig gespielter Samples benötigt. Eine gängige Orchesterbesetzung besteht aus sechzig bis einhundert Musikern, die natürlich nicht einzeln simuliert werden müssen. In den meisten erhältlichen Sample-Libraries sind Einzelinstrumente der gleichen Art unisono in einem virtuellen Instrument zusammengefasst. Man benötigt für eine komplette Orchester-Besetzung also exemplarisch folgende achtzehn Sample-Instrumente: Piccoloflöte, Flöten/Altflöte, Oboe/English Horn, Klarinette, Bassklarinette, Fagott, Kontrafagott, Hörner, Trompeten/Flügelhorn, Posaunen, Tuba, Percussions, Harfe, Piano, Violinen, Bratschen, Celli, Kontrabässe.

Der Komponist und Ehno-Musiker Bobby Glorian spielte im Tonstudio diverse Instrumente für den Gothic-3-Soundtrack ein, darunter diese Mandolin Tamboura. Zuvor zeichnete der gebürtige Bulgare für den Soundtrack von Knights of Honor verantwortlich.

Es ist bei einer filmischen Orchestrierung nicht unüblich, dass in fülligen Passagen sämtliche Instrumentgruppen bedient werden. In den meisten Fällen werden Streicher zum Beispiel kaum hörbar durch Holzbläser unterstützt, was ein paar zusätzliche Frequenzen und Charakteristika hinzufügt. Würde man also auf dem Notenblatt nachzählen, wie viele Töne gleichzeitig gespielt werden, käme man vielleicht auf durchschnittlich zwölf. Nun muss aber bedacht werden, dass die Klänge am Ende der Notenlänge nicht einfach verstummen. Jeder Ton klingt eine kurze Zeit aus, während der Folgeton bereits gespielt wird. An Notenübergängen werden also stets mindestens zwei Töne gleichzeitig gespielt. Eine Harfensaite schwingt sogar noch einige Sekunden nach. Wenn man von einer Samplelänge von sechs Sekunden inklusive Nachschwingen für jeden Harfenton ausgeht und die Harfe bei einer Geschwindigkeit von 60bpm durchgängig Sechzehntel spielt, belegt allein die Harfe vierundzwanzig gleichzeitig gespielte Samples. Percussion klingt noch deutlich länger aus. Insgesamt läppert es sich also recht schnell.
Das Mischen der Samples in Echtzeit wird von vielen Soundkarten hardwareseitig unterstützt, so dass die Performance zwar belastet wird, allerdings noch in überschaubarem Rahmen. Gravierender fällt der Speicherverbrauch ins Gewicht. Damit die Samples jederzeit ohne Verzögerung gespielt werden können, werden sie vor dem Abspielen in den Speicher geladen. Ein vollständiges Orchester kann im Speicher schon mal einige Gigabytes belegen, man muss also deutlich den Rotstift ansetzen und unnötige Samples aus dem Fundus verbannen, damit im Speicher noch Platz für den Rest des Spiels bleibt.

Die Steuerdaten für Audio-Files werden wahlweise direkt in einem beliebigen Wave-Editor (hier Steinbergs WaveLab) eingegeben, sofern dieser die Marker-Funktion unterstützt. In den Markern können die Steuerbefehle eingegeben werden, die dann vom Musiksystem beim Importieren in die essenziellen Metadaten umgeschrieben werden.

Ein eigenes Musiksystem
Aufgrund der geschilderten Schwierigkeiten mit DirectMusic und dem Wunsch, einen Orchestersoundtrack zu realisieren, haben wir uns bei Gothic 3 für ein eigenes Musiksystem entschieden. Dieses greift die Möglichkeiten der interaktiven Musik von DirectMusic auf und überträgt diese auf ein Szenario mit vorarrangierten, gemischten und gemasterten Audiodateien.
Ähnlich wie DirectMusic stellen wir dem Musiksystem die benötigten Informationen für geeignete Übergänge zwischen den Segmenten in Form von Metadaten zu jeder Audiodatei zur Verfügung. In diesen Metadaten sind geeignete Ein- und Ausstiegspunkte innerhalb der Tracks vermerkt, darüber hinaus Informationen über die Stimmung und passende Anknüpfmöglichkeiten. Jedes Audiofile hat seine eigene Datenspur und kann sich somit im Rahmen des Musiksystems selbst verwalten. Wenn ein Übergang zu einem anderen Segment gewünscht ist, ermittelt das System aus den Metadaten den nächstmöglichen Ausstieg und wählt anhand der Informationen über Quell- und Zieltrack einen passenden Übergang in Form einer kaschierenden »Transition«. Diese akustischen Blendgranaten enthalten meistens Trommelwirbel oder perkussive Elemente, die genug Krach machen, um den Übergang dahinter zu verbergen. In manchen Fällen sind Transitions aber auch eigens für bestimmte Übergänge komponierte Musikschnipsel, die nur in passenden Situationen vom Musiksystem ausgewählt werden. Auch die Transitions verfügen über eine eigene Datenspur und sind letztendlich selbstverwaltend.
Dieses System hat sich bewährt und bietet dem Komponisten grundsätzlich alle Freiheiten, ohne die Performance stark zu beanspruchen. Auch hier gibt es Nachteile wie zum Beispiel den verhältnismäßig hohen Programmieraufwand. Die DirectMusic-Interfaces sind ruckzuck eingebaut, während eine eigene Musiklogik für den Programmierer einen mittelgroßen Kraftakt darstellt. Doch da die Grundregeln überschaubar sind und die Komplexität eher auf der Datenseite entsteht, lässt sich auch das ganz gut überblicken.

Library-Empfehlungen
Wer orchestrale Musik erstellen will, ohne auf ein echtes Orchester zurückgreifen zu können, kommt um den Einsatz hochwertiger virtueller Instrumente nicht herum. Sample-Libraries enthalten einzelne Instrumente in einer Form, die für die Erstellung von Musik am Computer optimal ist. Meist wurden einzelne Töne in diversen Spielweisen und Lautstärken in einem professionellen Studio aufgenommen und für das virtuelle Instrument aufgearbeitet. Diese Samples sind dann über die Tastatur des MIDI-Keyboards oder aus dem MIDI-Arrangement heraus ansteuerbar. Die Klangqualität der Musik hängt also zu großen Teilen von der Qualität der Samples ab.
Die »Vienna Symphonic Library«, kurz VSL, sticht hier besonders aus dem Angebot der Libraries hervor, da sämtliche Instrumente von ausgezeichneter Qualität sind und mit einer Vielzahl unterschiedlicher Spielweisen aufgenommen wurden. Der »VSL Orchestral Cube«, der ein komplettes Orchester und einige zusätzliche Instrumente beinhaltet, kostet allerdings auch einige Tausend Euro.
Für die Gothic-Soundtracks habe ich daher eine erlesene Zusammenstellung kleinerer, günstigerer Libraries verwendet, die gut miteinander harmonieren und qualitativ absolut ausreichen. Dazu zählen Ultimate Strings (Eastwest), Epic Horns (VSL), Rare Instruments (Eastwest) und London Orchestral Percussion (BigFish Audio) sowie das Advanced Orchestra Extended von BestService. Eine gute Quelle für Sample-Libraries ist Best Service unter www.bestservice.de.
Grundsätzlich sollte man auch die Möglichkeit in Erwägung ziehen, besondere Instrumente im Studio aufzunehmen, um dem Score einen persönlichen Anstrich zu verpassen. Bei Gothic 3 kamen viele fremdländische Instrumente zum Einsatz, darunter Didgeridoo, Fujara, Daduk, Saz, Ud, Tamboura und Dudelsack. Ein Studiotag kostet inklusive Musiker-Honorar nicht die Welt und sorgt dafür, dass Titelthema und Trailermusik echte »Earcatcher« werden.

 

Schlussakkord
Grundsätzlich muss bei der Musik natürlich – wie bei jedem anderen Bereich – auf Qualität geachtet werden. Die Zeit, in der Musik halbherzig und in letzter Minute eingebaut wurde, ist endgültig vorbei. Das Ohr der Spieler wurde durch Filmsoundtracks und großartige Vertreter von Gamemusik verwöhnt und erwartet demnach ein entsprechend hohes Niveau in zeitgemäßen Produktionen. Nicht immer muss ein Orchester bemüht werden, eine pfiffige Verwendung von Samples und eine geschickte Auswahl der Stilrichtung sind ebenso wertvoll. Wichtig ist, dass bereits bei der Planung berücksichtigt wird, was für eine bedeutende Rolle der Soundtrack spielt und wie man den Spieler durch die Musik stilsicher und unaufdringlich dort packen kann, wo Emotionen entstehen: an seinem Herzen.  

Kai Rosenkranz

zum Autoren: Kai Rosenkranz hat als freier Komponist und Sound Designer an der Gothic-Serie mitgewirkt und erstellte zudem die grafischen Spezialeffekte. Er spricht regelmäßig auf Konferenzen und betreut zusammen mit einigen Kollegen die große Community der hauseigenen Titel.

Kommentare

Einen Kommentar hinterlassen

Um einen Kommentar hinterlassen zu können, müssen Sie sich zuerst anmelden oder registrieren.

» zur Anmeldung
» zur Registrierung