Alignment notierter Musik - Alignment: Operationalisierung von Ähnlichkeit

Sequenzanalyse

3.2 Alignment: Operationalisierung von Ähnlichkeit

3.2.2 Alignment notierter Musik

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

auch möglich, die Kostenfunktionen für Substitutionen entsprechend auszu-differenzieren. So werden beispielsweise im Rahmen von DNA-Vergleichen sehr einfache Bewertungsverfahren durchgesetzt, während sich für den Ver-gleich von Proteinsequenzen aufwendigere Modelle etabliert haben, die auf sog.Substitutionsmatrizenberuhen.³²Hierbei handelt es sich um Modelle, die auf der Basis empirischer Beobachtungen angemessene Subsitutionskos-ten für bestimmte Aminosäuren vorgeben.³³ Die Leistungsfähigkeit eines Alignments hängt damit also wesentlich von dem ihm zugrunde gelegten Scoring-Modell ab. Wie an dem obigen Beispiel (siehe Abb. 3.4) zu be-obachten ist, muss die zugrundeliegende Menge möglicher Elemente nicht unbedingt der biologischen Domäne entspringen. Die prinzipielle Übertrag-barkeit des Konzeptes auf musikbezogene Fragestellungen ist, wie bereits im Rahmen des Sequenzbegriffs festgestellt wurde³⁴, unter der Voraussetzung der Nutzung eines entsprechend adäquaten Modells gegeben.

3.2 Alignment: Operationalisierung von Ähnlichkeit wesentlichen methodischen Unterschiede gegenüber anderen Analysealgo-rithmen heraus, die lediglich vordefinierte melodische Modifikationen in Betracht ziehen. Im Gegensatz dazu wählen sie ausdrücklich einen distanz-basierten Ansatz, der auf tonaler Kontur und rhythmischer Struktur beruht, um so die als willkürlich betrachtete Vorabdefinition erlaubter Transforma-tionen zu vermeiden. Als weiteren Vorteil distanzbasierter Verfahren nennen sie die Möglichkeit der hierarchischen Klassifizierung.³⁶ Der Unterschied ist, obwohl der paarweise Sequenzvergleich auch vordefinierte Modifika-tionen verwendet, dennoch beträchtlich, da diese DefiniModifika-tionen nur lokale Editiervorgänge umfassen. Mongeau und Sankoff grenzen dieses Verfahren deutlich von globalen Transformationen wie Umkehrungen und Krebsgän-gen ab. Insofern weist der Sequenzvergleich eine höhere Vielseitigkeit auf, indem der Vergleich lediglich in Hinblick aufÄhnlichkeit/Unterschiedlichkeit durchgeführt wird. Eine qualitative Klassifizierung globaler Transformati-onsverfahren ist, da das Verfahren auf der Bewertung von Objektpaaren basiert, logischerweise so nicht möglich. Letzteres entspricht auch nicht der Fragestellung des Beitrages.

Eine methodische Besonderheit der Adaption des paarweisen Alignment durch Mongeau/Sankoff aufmusikalische Sequenzen stellt ihre Erweiterung der Operationen dar. Statt nur Substitution, Insertion und Deletion zu erlauben, haben sie zur besseren Anpassung an die Erfordernisse musikali-scher Variation die Menge möglicher Einzeloperationen umFragmentation undConsolidation erweitert. Zu Recht merken sie an, dass die Ersetzung mehrerer kurzer Notenwerte durch eine längere Note gleicher Dauer wie auch umgekehrt die Aufteilung längerer Noten in mehrere kürzere eine nicht unübliche Operation darstellt. So wurde das vergleichsweise häufige Auftreten derartiger Operationen bereits im Rahmen der Ausführungen zur Filiation thematisiert.³⁷ In einem unmodifizierten Algorithmus würden

36 Vgl. MS90, S. 161–162.

37 Siehe 2.2.2.

155

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

Abbildung 3.5: Beispiel für eine Fragmentation.

solche Ersetzungen allerdings erhebliche Editierkosten verursachen, indem eine Substitution und mehrere direkt folgende Insertionen bzw. Deletionen diesen Vorgang abbilden würden. Durch die Einführung der Fragmenta-tion – die Aufteilung längerer Notenwerte in mehrere kürzere – und der Consolidation – die Zusammenfassung mehrerer kürzerer Noten in eine längere – können die Ersetzung und folgende Insertion/Deletion zu einer einzelnen Operation zusammengefasst und als solche entsprechend mit einem angemessenen Gewicht versehen werden.³⁸

Konzeptionell entlehnt sind Fragmentation und Consolidation aus der Spracherkennung. Im Rahmen der Zeitnormierung wird es durch Kom-pression und Expansion möglich, Objekte unterschiedlicher Ausdehnung miteinander zu vergleichen, im Sinne einer Krümmung der Zeitachse. In der Übertragung dieser Idee wird somit das Gewicht der Operationen als Linearkombination der Gewichte für Tondauer und Tonhöhe verstanden.

Bei einer Fragmentation ist das Gewicht der Tonhöhe die Summe der Ton-höhengewichte aller Einzelnoten, während das Gewicht für die Tondauer sich aus der Differenz der Dauer der einzelnen zu ersetzenden Note und der Summe der Dauer aller ersetzenden Noten ergibt.³⁹Das Besondere an diesem Verfahren ist, dass nicht wie bisher ein Objekt mit einem einzelnen anderen verglichen wird. Vielmehr werden stattdessen bei einem Teilschritt im Alignment die dem Vergleichsobjekt unmittelbar vorausgehenden

Objek-38 Vgl. MS90, S. 164–165.

39 Vgl. MS90, S. 164–165.

156

3.2 Alignment: Operationalisierung von Ähnlichkeit te im Rahmen der Consolidation und Fragmentation mit einbezogen. Eine Konstante legt hierbei fest, wie weit dieses Vergleichsfenster zurückreichen soll. Zur Optimierung der sich dadurch entsprechend deutlich erhöhen-den Laufzeit kann die Maximalgröße dieser Konstante entsprechend der größten vorkommenden Tondauerndifferenz begrenzt werden. Der optimale Traceback erfolgt dann anhand der gespeicherten Zeigervariablen.⁴⁰ Wesentlich ist außerdem die Parametrisierung, auf deren Basis das beschrie-bene Alignmentverfahren erfolgt. Dass die Parametrisierung von grundle-gender Bedeutung in der Anwendung des Sequenzmodells ist, wurde im vorhergehenden Abschnitt bereits ausgeführt. Das Verfahren von Mongeau und Sankoff ist nicht nur in Hinblick auf die Erweiterung des Alignments um zusätzliche Grundoperationen von Bedeutung, sondern kann auch in Hinblick auf die Frage nach der Parametrisierung als Fallbeispiel dienen.

Das Gewicht, das einer Substitution von Mongeau und Sankoff zugewie-sen wird, besteht in der Summe der Parameter Tonhöhe und Tondauer, wobei zur Gewichtung dieses Verhältnisses der Tondauer ein Koeffizient beigegeben wird. Dieser bestimmt, wie stark der Einfluss der Tonhöhe, bzw. der Dauer im Alignment ist und wird anhand der Auswertung von be-kannt sehr ähnlichen Sequenzpaaren bestimmt. Ist der Wert nicht optimal gewählt, werden entweder stark dissonante Noten identischer Länge einan-der zugeordnet oeinan-der Einzelnoten durch Fragmentation bzw. Consolidation Notengruppen mit stark abweichender Gesamtdauer zugeordnet. Ist der Koeffizient angemessen gewählt werden zudem nur wenige Objekte über Taktgrenzen hinweg zugeordnet.⁴¹

Zentral ist außerdem, da Variationen untersucht werden sollen, dass das Verfahren invariant gegenüber Änderungen in Tempo und/oder Tonart sein soll.⁴² Die Invarianz der Tonhöhe gegenüber der Tonart erreichen sie allein

40 Vgl. MS90, S. 165–166.

41 Vgl. MS90, S. 163, 167–168.

42 Vgl. MS90, S. 163.

157

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

durch die Modellierung des Parameters w_interval. Invarianzen bezüglich der Tondauer werden mit Hilfe der Logik zu den Gesetzmäßigkeiten musi-kalischer Zeiteinteilung wie auch der Einführung von Fragmentation und Consolidation hauptsächlich im eigentlichen Algorithmus zum Alignment abgedeckt. Um nun alsowinterval invariant gegenüber Tonartenwechseln zu gestalten, wurde, statt die absolute Tonhöhe zu vergleichen, ein stufenba-sierter Ansatz gewählt. Ist die Tonhöhe einer Note innerhalb einer Sequenz Bestandteil der Skala dieser Sequenz, dient die Stufe als Vergleichspunkt, auch wenn hierdurch die exakte Tonhöhe abweichen würde. Hierbei werden die Gewichte entsprechend der Konsonanz der Intervalle unabhängig von deren Oktavlage vergeben. Damit werden Einklänge, Oktaven und deren Vielfache identisch behandelt. Darauf folgend werden entsprechend ihrer Dissonanz Quinten, Terzen, Sexten, Quarten, Septimen und Sekunden wie auch deren Äquivalente in anderen Oktaven mit aufsteigenden Gewichten versehen. Ist eine der zu vergleichenden Töne keine natürliche Stufe der zugrundeliegenden Skala, wird stattdessen ein anderes Gewicht berechnet, basierend auf der benachbarten natürlichen Stufe. Dem Gewicht der benach-barten Stufe werden ein Koeffizient wie auch eine Konstante beigegeben.

Hierdurch bestimmt das nächste skaleneigene Intervall einen wesentlichen Teil des Gewichts, die beiden hinzugefügten Konstanten sorgen dafür, dass das Gewicht skalenfremder Intervalle höher ist als das skaleneigener Inter-valle und zudem mit zunehmender Dissonanz des Grundintervalls steigt.

Dass dieses Verfahren auf die Bedürfnisse tonaler Musik hin modelliert wur-de, erwähnen die Autoren. Im Falle atonaler Musik empfehlen sie vielmehr die Wahl konstanter Gewichte.⁴³

Als weiteres Beispiel soll die Nutzung von paarweisem Sequenzalignment für das Retrieval von Volksliedmelodien betrachtet werden. Peter van Kranenburg widmet sich im Rahmen seiner Dissertation⁴⁴verschiedenen

43 Vgl. MS90, S. 164, 167.

44 Kra10.

158

3.2 Alignment: Operationalisierung von Ähnlichkeit Retrievalmethoden, darunter auch der Nutzung von paarweisem Sequenz-alignment. Sein Hauptfokus liegt hierbei vor allem auf der Repräsentation der Melodien und der Evaluierung des Verfahrens als Retrievalinstrument.

Als wesentliche Herausforderung im Design von Retrievalstrategien für Volksliedmelodien nennt van Kranenburg den Umgang mit den überliefe-rungsbedingten Varianten einerseits wie auch dem Einfluss, den die Tran-skription der Tonaufnahmen auf das Korpus haben. Denn auch wenn die Transkription gemäß expliziter Richtlinien erfolgt, ist ein Mindestmaß an Varianz nicht auszuschließen. Van Kranenburg unterscheidet deshalb zwi-schen tatsächlicher Varianz und transkriptionsbedingter Varianz (actual und representational), gegenüber denen das Verfahren auf unterschiedli-che Weise robust sein soll. Während die tatsächliunterschiedli-chen Unterschiede – das Hauptinteresse der Volksliedforschung – sich auf die Ähnlichkeitsscores auswirken sollen, muss gewährleistet werden, dass der Score gegenüber der repräsentationsbedingten Varianz invariant ist.⁴⁵ Entsprechend werden Strategien vorgestellt, die es ermöglichen sollen robust gegenüber der Nota-tion in unterschiedlichen Tonarten, unterschiedlich langen Kadenztönen, nicht immer vorhandenen Pausen am Phrasenende wie auch Abweichungen bezüglich der notierten Taktart und inkonsistenter Segmentierung zu sein.⁴⁶ Basierend auf diesen Ausführungen werden eine Reihe von Scoringfunk-tionen vorgestellt, die musikalische Parameter in unterschiedlichen Nor-malisierungsstufen abbilden sollen, um diese später auf ihre Güte hin zu evaluieren. So wird die Tonhöhe sowohl exakt verwendet, als auch mit einem gewissen Abweichungskorridor. Auch wird eine Bewertung hinsichtlich der Konsonanz einer Tonhöhendifferenz vorgenommen. Darüber hinaus werden statt der absoluten Tonhöhe auch Funktionen basierend auf dem Intervall zur vorhergehenden Note definiert, wie auch auf der melodischen Kontur einer Phrase, bzw. des gesamten Liedes – damit wird die vertikale Position

45 Vgl. Kra10, S. 95–96.

46 Vgl. Kra10, S. 96–102.

159

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

eines Tons in Relation zur höchsten und niedrigsten Tonhöhe einer Melodie bezeichnet. Zur Repräsentation rhythmischer Eigenschaften werden ebenso verschiedene Funktionen definiert. Neben der exakten Tondauer wird auch das metrische Gewicht einer Note, die zeitliche Differenz zwischen dem Einsatz einer Noten und der folgenden wie auch die rhythmische Posi-tion einer Note innerhalb einer Phrase verwendet. Ebenso werden auch Kombinationen der genannten Parameter verwendet.⁴⁷

Die Evaluation der Funktionen wird entsprechend ihrer Performance auf einem annotierten Korpus wie auch einem größeren nicht-annotierten Kor-pus vorgenommen. Eine der Melodien aus dem annotierten KorKor-pus wird dabei als Abfrage verwendet, einmal auf dem annotierten Korpus und dann wiederum auf dem vollständigen Datensatz sowohl annotierter als auch nicht-annotierter Daten.⁴⁸Als Kriterium der Relevanz gilt die Zugehörig-keit zur selbentune family.⁴⁹ In Hinblick auf die Tonhöhe zeigt sich, dass, obwohl die Varianz als wesentliches Element mündlicher Überlieferung gilt, dennoch die exakte Tonhöhe die besten Ergebnisse gebracht hat – gefolgt von der Tonhöhe mit Toleranzkorridor, die entsprechend auf den niedrigeren Rängen bessere Ergebnisse erzielte. Die Parameter, die explizit nicht die exakte Tonhöhe zum Ausgangspunkt nahmen, um repräsentationsbedingte Varianz auszugleichen, zeigten stattdessen schlechtere Ergebnisse. Stattdes-sen zeigten sämtliche Parameter basierend auf rhythmischen Eigenschaften, obwohl diese üblicherweise als relativ stabil im Rahmen mündlicher Über-lieferung gilt, deutlich schlechtere Ergebnisse. Auch zeigt sich hier, dass die Parameter, die repräsentationsbedingte Unterschiede ausgleichen sollten, nicht deutlich bessere Ergebnisse liefern als die exakte Dauer. Ebenso kann beobachtet werden, dass die komplexeren Funktionen besser abschneiden als die einfacheren Funktionen, die dieselben Parameter bewerten sollen.

47 Vgl. Kra10, S. 104–107.

48 Vgl. Kra10, S. 107–108.

49 Siehe Kra10, S. 11–12.

160

3.2 Alignment: Operationalisierung von Ähnlichkeit Die besten Ergebnisse aller rhythmischen Parameter lieferte die Position innerhalb einer Phrase, ein Parameter der über die Definition der Tondauer hinaus auch eine segmentierende Funktion inne hat.⁵⁰ Die weitere Bewer-tung der Performance von Kombinationen von Parametern wie auch der Vergleich mit anderen Retrievalmethoden und darüber hinaus die weitere Auswertung zeigen zum einen die grundsätzliche Verwendbarkeit von Align-mentverfahren. Zum anderen machen sie auch deutlich, wie wichtig die Wahl der Parameter und der Scoringfunktionen ist. Hierbei wird ersichtlich, dass die Ergebnisse nicht der Erwartung basierend auf domänenspezifischen Vorannahmen entsprechen müssen. Vielmehr zeigt sich sogar das Potential des Verfahrens, wenn es im Rahmen des Evaluierungsprozesses zu einer ver-änderten Klassifikation durch die mit eingezogenen Domänenexpert*innen falsch negativ klassifizierter Melodien kommt.⁵¹

Bereits anhand dieser zwei Beispiele wird deutlich, wie direkt die Zusam-menhänge zwischen Fragestellung, verwendeter Parametrisierung und dem angenommenen Substitutionsmodell sind. Die Festlegung der Parameter folgt hierbei sehr stark dem Domänenverständnis. Mongeau/Sankoff le-gen für ihre Analyse von Variationen als Parameter die Tonhöhe und Tondauer fest, modellieren diese aber so, dass sie sowohl tonarten- als auch tempounabhängig interpretiert werden können. Ihr Substitutions-modell basiert stark auf musikalischem Vorwissen, indem sie sowohl die Substitutionskosten abhängig von der Konsonanz des Intervalls abhängig machen, um den sich ein Ton ändert, als auch einen starken Fokus auf die rhythmische Variation legen, ganz im Sinne der Variation als musikalische Gattung. Van Kranenburg legt stattdessen, obwohl es auch im Rahmen seiner Studie um die Aufklärung musikalischer Ähnlichkeitsbeziehungen geht, im Detail andere Schwerpunkte. Zentral ist in dieser Studie die expli-zite Unterscheidung musikalischer Varianz und repräsentationsbedingter

50 Vgl. Kra10, S. 109–112.

51 Vgl. Kra10, S. 121–122.

161

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

Varianz, ein Phänomen, dem Mongeau/Sankoff keine Beachtung schen-ken. Ebenso betrachtet van Kranenburg eine andere Art musikalischer Varianz. Während sich Mongeau/Sankoff mit der Variation als Gattung und damit quasi komponierter Variation widmen, ist van Kranenburgs Korpus durch überlieferungsbedingte Variation geprägt – diese zählt zum zentralen Forschungsinteresse. Die repräsentationsbedingten Unterschiede, wie van Kranenburg ausführt, müssen insofern bedacht werden, als sie dem Korpus inhärent sind, aber sich nicht in den Alignments niederschlagen sollen. Aus diesem Grund werden verschiedene Parameter zur Repräsenta-tion von Tonhöhe und Rhythmus und darauf basierende ScoringfunkRepräsenta-tionen modelliert, die auf unterschiedliche Art und Weise Vorannahmen über Variationsprozesse enthalten. So wird auch hier wiederum ein Parameter zur Darstellung der Tonhöhe danach bewertet, ob eine Abweichung einem konsonanten Intervall entspricht. Beachtenswert sind hierbei insbesondere die unterschiedlichen Konzepte, die sich in der Repräsentation des Rhyth-mus zeigen. So werden zum einen akzentbasierte Parameter modelliert, die eine Form der Gewichtung darstellen, zum anderen wird der relati-ve Zeitabstand zwischen den Einsätzen bemessen. Darüber hinaus wird Rhythmus als Segmentierung einer musikalischen Formeinheit interpretiert, wie es im Falle vons_phrposgeschieht. Von Interesse ist weiterhin, wie sich im Zuge von van Kranenburgs Evaluierung zeigt, dass Vorannahmen über Variationsprozesse, die auch wesentlich für die Modellierung der Parameter waren, sich nicht unbedingt in dieser Form am Material beobachten lassen – sonst wäre die Performanz der entsprechenden Parameter eine höhere.

Letztendlich lassen sich diese Schlussfolgerungen auch auf andere Fragestel-lungen übertragen, insofern sie deutlich machen, wie wichtig eine kontext-bezogene Modellierung ist, zum einen hinsichtlich des zu untersuchenden Korpus, zum anderen hinsichtlich der Phänomene, die beobachtet werden sollen. So lässt sich gerade auch die Filiation als spezieller Untersuchungsge-genstand von den beiden erläuterten Fallbeispielen abgrenzen. Obwohl die 162

3.2 Alignment: Operationalisierung von Ähnlichkeit Untersuchungen an einem Volksliedkorpus ebenso Überlieferungsprozesse in den Fokus nehmen, so spiegeln diese Eigenarten mündlicher Überlieferung wider. Die schriftliche Repräsentation der Melodien ist dem Repertoire nicht inhärent, sondern Teil der wissenschaftlichen Aufbereitung, da es sich um durch Expert*innen transkribierte Audioaufnahmen handelt. Sollen Methoden des Sequenzvergleichs im Rahmen der Filiation angewendet werden, handelt es sich hierbei um schriftliche Überlieferungsprozesse. Die strikte Trennung von musikalischer und repräsentationsbedingter Variati-on kann so nicht einfach angenommen werden. Vielmehr ist zu erwarten, dass diese Prozesse durch die Dichotomie von musikalischem Sinn und schriftlicher Repräsentation geprägt sind. Eine wesentliche Einflussgröße stellen zudem Kopierfehler dar, deren Existenz die zentrale methodenspezi-fische Grundannahme darstellen. Prozesse musikalischer Variation treten hinzu, sind aber nicht die einzige Ursache abweichender Lesarten.⁵² Die mündliche Tradierung von Repertoire führt zwar, so lässt sich annehmen, zu einem erheblichen Maß musikalischer Variation, diese kann aber nicht von Schreibfehlern herrühren. Dass aber für Kopierfehler andere Substitu-tionsannahmen getroffen werden müssen, ist allzu leicht nachvollziehbar.

Während sowohl bei Mongeau und Sankoff als auch bei van Kranenburg gewisses musikalisches Vorwissen bei der Modellierung der Scoringfunktio-nen eine Rolle gespielt hat, entziehen sich Fehler dieser Logik. Dass auch den repräsentationsspezifischen Eigenschaften eines Repertoires Rechnung getragen werden muss, wie auch dessen musikalischer Eigenlogik, ist somit evident. In welchem Rahmen diese Faktoren Einfluss nehmen, ist ohne entsprechende Untersuchungen nicht festzustellen.

52 Siehe 2.2.1, bzw. 2.2.2.

163

3 Konzepte und Verfahren der computerbasierten Sequenzanalyse

Im Dokument Modelle zur computergestützten Analyse von Überlieferungen der Mensuralmusik : Empirische Textforschung im Kontext phylogenetischer Verfahren (Seite 175-185)