• Keine Ergebnisse gefunden

Phylogenetische Methoden in der historischen Linguistik

N/A
N/A
Protected

Academic year: 2022

Aktie "Phylogenetische Methoden in der historischen Linguistik"

Copied!
13
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Phylogenetische Methoden in der historischen Linguistik

Die IELex-Datenbank Maximum Parsimony

Gerhard Jäger Forum Scientiarum

2. Dezember 2014

(2)

Kognate

Kognate Wörter haben sich aus derselben Wortform entwickelt

z.B. lt. filius → frz. fils / it. figlio

Faustregel: je näher zwei Sprachen verwandt sind, um so mehr Kognatenpaare gibt es

(3)

IELex

Indo-European Lexical Cognacy Database

Öffentlich zugänglich unter http://ielex.mpi.nl/

Basiert auf der älteren Kruskal-Dyen- Datenbank

Geleitet von Michael Dunn am Max-Planck- Institut für Psycholinguistik Nijmegen

(4)

IELex

Swadesh-Listen mit 207 Konzepten für 157 indoeuropäische Sprachen

z.T. Orthographie und/oder phonetische Transkription (uneinheitlich)

Jeder Eintrag wird einer Kognatenklasse zugeordnet

(5)

Kognatenklassen

Konzept 'mountain':

Klasse A: armenisch sar, serbisch/russisch/polnisch gora, cz, slowak., ukr. hora

Klasse B: dt. Berg, fries. berch, dän. bjerg, …

Klasse C: alban. mal

Klasse D: armen. ler

Klasse E: panjabi par, nepali parbat, marathi parwat …

Klasse F: engl. mountain, fr. montagne, it. monte, breton. menez, gäl. monadh...

Elemente der selben Kognatenklasse sind untereinander kognat;

Elemente verschiedener Klassen sind nicht kognat

Zuordnung basiert auf Expertenurteilen (nicht automatisierbar)

(6)

Kognaten als phylogenetische Charaktere

Durch Bedeutungswandel ändern sich

Kombination Sprache/Konzept/Kognatenklasse

z.B. Konzept 'bone':

ahd. Bein (Kognatenklasse B) → nhd. Knochen (Kognatenklasse G)

Vergleichbar zu einer biologischen Mutation

(7)

Kognaten als phylogenetische Charaktere

Kognatenklassen können wie biologische Charaktere behandelt werden

Allerdings: Häufig Synonyme Einträge

z.B. 'guts' → dt. Eingeweide, Gedärm

Keine eindeutische Zuordnung von Charakterzuständen zu Sprachen

Alternative: Binarisierung

(8)

Binarisierte Charaktere

Jede Kognatenklasse (für jedes Konzept) ist ein Charakter

Zwei mögliche Zustände: 0/1

0: Sprache L verwendet kein Element der Kognatenklasse für das Konzept

1: Sprache L verwendet ein Element der Kognatenklasse für das Konzept

Wechsel wie ahd. ubil → nhd. schlecht entspricht also zwei Mutationen

(9)

Praktische Fragen

Charakter-Matrix wird in Nexus-Datei dargestellt (Datei liegt unter http://www.sfs.uni-

tuebingen.de/~gjaeger/lehre/ws1415/phylogeny/data/IElex_bina rizedFull.nex)

(10)

Praktische Fragen

Gutes Programm für Maximum-Parsimony- Analyse: paup*

Verfügbar von

http://people.sc.fsu.edu/~dswofford/paup_test/

(11)

Praktische Fragen

Starte paup* von dem Verzeichnis aus, in dem die Nexus-Datei liegt

> execute Ielex_binarizedFull.nex

> Hsearch

Do you want to increase 'Maxtrees'? (Y/n): Y Enter new value for 'Maxtrees' (100): 10000 Action if limit is hit:

   (1) Prompt for new value

   (2) Automatically increase by 100 (= AUTOINC)    (3) Leave unchanged, and don't prompt: 2

> SaveTrees file='ielexFull_MP.tree' format=Newick brlens=yes

> q

(12)

Das Newick-Format

Siehe

http://en.wikipedia.org/wiki/Newick_format

Darstellung mit Dendroscope

(http://ab.inf.uni-tuebingen.de/software/dendroscope/) oder SplitsTree (http://www.splitstree.org/)

(13)

Konsens-Methoden

Häufig ergibt eine phylogenetische

Inferenzmethode mehr als einen Kandidaten- Baum (manchmal über 1000)

Konsens-Bäume und -Netzwerke sind

kompakte Repräsentationen einer Menge von Bäumen

Referenzen

ÄHNLICHE DOKUMENTE

Ein dunkles Kapitel in der deutschen Sprachphilo- sophie* 4 , unter diesem Titel publizierte Coseriu in einem kurzen Text (In: Inte- grale Linguistik. Festschrift für Hebnut Gipper.

Metavariable: Eine Metavariable ist ein Ausdruck der Metasprache, der dazu benutzt wird, allgemein über Ausdrücke der Objektsprache zu reden.. Wir verwenden kursive Großbuchstaben

Im dritten Teil geht es um „Besondere Sprachen“: Künstliche Sprachen wie Esperanto haben ihren besonderen Reiz, ebenso wie Zeichen- und Gebärden- sprache oder Geheimsprachen

enum Wochentyp {Montag, Dienstag, Mittwoch, Donnerstag, Freitag, Samstag, Sonntag};.. enum

Zeigen Sie durch Angabe der Berechnungen (Konfigurationsfolgen), dass alle Wörter w ∈ {ab, abab, aaabbb, abaababb, aaabbabb} von A akzeptiert werden und alle Wörter w ∈ {a, ba,

Sie können dazu verwenden, dass die Menge aller kontestfreien Sprachen unter Schnitt mit regulären Sprachen abgeschlossen

all potential cognate pairs with an aggregate PMI score ≥ 5.0 are considered probable cognates. s(a, b) is re-estimated using only probable cognate pairs this is repeated

Argumentieren Sie (mit linguistischen Argumenten), welcher der drei ge- wurzelten B¨ aume (der auf der Folie und Ihre beiden Antworten auf Frage 1) die Daten am besten