• Keine Ergebnisse gefunden

Phylogenetische Methoden in der historischen Linguistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Phylogenetische Methoden in der historischen Linguistik"

Copied!
8
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Phylogenetische Methoden in der historischen Linguistik

Die IELex-Datenbank Maximum Likelihoold und

Bayessche Inferenz Gerhard Jäger

Forum Scientiarum

(2)

Maximum Likelihood

Maximum Parsimony basiert auf der Annahme, dass Mutationen extrem unwahrscheinlich sind

Wenn Mutationen nicht ganz so selten sind, liefert MP falsche Ergebnisse

Bessere (und computationell teurere) Alternative:

Maximum Likelihood

(3)

Maximum Likelihood

Angenommen, wir kennen den korrekten Baum T einschließlich

der Kantenlängen

der Charakterzustände an jedem Knoten

Ein evolutionäres Modell sagt uns, wie wahrscheinlich die

beobachteten Mutationen sind

(4)

Maximum Likelihood

Mutationswahrscheinlichkeiten sind vergleichbar zu den Mutationsgewichten im Sankoff-Algorithmus

(5)

Maximum Likelihood

Unterschied: Kosten sind von Kantenlänge abhängig

(6)

Maximum-Likelhood

x

π

x

L ( root , x )

Gesamt-Likelihood des Baumes:

πx: stationäre Wahrscheinlichkeit von Charakterzustand x

L(root, x): Likelihood von Charakterzustand x an Wurzel des Baums

Der Maximum-Likelhood-Baum wird gesucht durch

Optimierung der Kantenlängen

Durchsuchen des Baum-Raumes

(7)

Praktische Fragen

Gutes Programm auch für Maximum- Likelihood-Analyse: paup*

Verfügbar von

http://people.sc.fsu.edu/~dswofford/paup_test/

(8)

Praktische Fragen

Starte paup* von dem Verzeichnis aus, in dem die Nexus-Datei liegt

> execute Ielex_binarizedFull.nex

> set criterion=likelihood

> set storebrlens

> Hsearch

> SaveTrees file='ielexFull_ML.tree'  format=Newick brlens=yes

> q

Referenzen

ÄHNLICHE DOKUMENTE

Sankoff algorithm efficiently computes parsimony score of a given tree goal: tree which minimizes parsimony score.. no efficient way to find the optimal tree → heuristic

Sankoff algorithm efficiently computes parsimony score of a given tree goal: tree which minimizes parsimony score.. no efficient way to find the optimal tree → heuristic

I normalized RF-distance: number of different partitions, divided by the total number of partitions in tree 1 + total number of partitions in tree 2. I in the example:

◮ defines the distance between two strings as the minimal number of edit operations to transform one string into the other.. ◮

all potential cognate pairs with an aggregate PMI score ≥ 5.0 are considered probable cognates. s(a, b) is re-estimated using only probable cognate pairs this is repeated

Argumentieren Sie (mit linguistischen Argumenten), welcher der drei ge- wurzelten B¨ aume (der auf der Folie und Ihre beiden Antworten auf Frage 1) die Daten am besten

● 0: Sprache L verwendet kein Element der Kognatenklasse für das Konzept. ● 1: Sprache L verwendet ein Element der Kognatenklasse für

● shortening of existing words (to be distinguished from sound change); acronyms.