• Keine Ergebnisse gefunden

Rückkopplungsbasierte Rangfolgenbestimmung am Beispiel der FIFA-Weltrangliste

N/A
N/A
Protected

Academic year: 2022

Aktie "Rückkopplungsbasierte Rangfolgenbestimmung am Beispiel der FIFA-Weltrangliste"

Copied!
84
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Rückkopplungsbasierte Rangfolgenbestimmung am Beispiel der FIFA-Weltrangliste

Wissenschaftliche Arbeit zum Staatsexamen für das Lehramt an Gymnasien

von Peter Nikolai Dittmann

Fachbereich Mathematik und Statistik

Mathematisch-Naturwissenschaftliche Sektion Universität Konstanz

Betreuer: Prof. Dr. Ulrik Brandes

Fachbereich Informatik und Informationswissenschaft Lehrstuhl Algorithmik

Universität Konstanz

Oktober 2005

(2)
(3)

Zusammenfassung

Ziel dieser Arbeit ist es, den Rangfolgenalgorithmus der FIFA (Fédération Inter- nationale de Football Association) nachzubilden und einen alternativen, rück- kopplungsbasierten Algorithmus zu entwerfen. Hierbei werden Lücken in der Beschreibung des FIFA-Algorithmus aufgezeigt und Möglichkeiten zu deren Be- hebung beschrieben.

Zum Teil werden die Berechnungsmethoden der FIFA in Frage gestellt und Al- ternativen vorgeschlagen.

Anschließend werden die Nachbildung des FIFA-Algorithmus und das alterna- tive Eigenvektor-Ranking variiert und die Ergebnisse bei der Anwendung auf die Spielergebnisdaten der FIFA-Website miteinander verglichen. Hierzu müs- sen die Spielergebnisdaten von der FIFA-Website heruntergeladen und in eine einheitliche Form gebracht werden und ein Algorithmus zum Vergleich zweier implementiert werden Rangfolgen entwickelt werden.

(4)

1 Einführung 9

1.1 Motivation. . . 9

1.2 Überblick . . . 10

1.2.1 Der FIFA-Algorithmus. . . 10

1.2.2 Der rückkopplungsbasierte Algorithmus . . . 11

1.2.3 Ermittlung der Spieledaten . . . 11

2 Das FIFA-Ranking 12 2.1 Beschreibung des FIFA-Rankings . . . 12

2.1.1 Beispiele . . . 13

2.1.2 Sieg, Unentschieden oder Niederlage . . . 14

2.1.3 Anzahl der Tore und Gegentore . . . 14

2.1.4 Heim- und Auswärtsspiele . . . 14

2.1.5 Bedeutung des Spiels . . . 15

2.1.6 Kontinental-Gewichtungen . . . 15

2.1.7 Zeitgewichtung . . . 16

2.1.8 Berechnung der Jahresgesamtpunktzahl . . . 17

2.1.9 Aktualisierung der Weltrangliste . . . 21

2.2 Nachbildung des FIFA-Rankings . . . 22

2.2.1 Sieg, Unentschieden oder Niederlage . . . 23

2.2.2 Anzahl der Tore und Gegentore . . . 24

2.2.3 Heim- und Auswärtsspiele . . . 28

2.2.4 Bedeutung des Spiels . . . 28

(5)

2.2.5 Kontinentalgewichtungen . . . 28

2.2.6 Zeitgewichtung und Anzahl bestrittener Spiele . . . 28

2.2.7 Aktualisierung der Weltrangliste . . . 29

2.2.8 Zusammenfassung . . . 29

3 Eigenvektorranking 30 3.1 Einleitung . . . 30

3.2 Zentralitäten . . . 32

3.3 Die Eigenvektorzentralität . . . 34

4 Experimente 41 4.1 Beschaffung der Spieledaten . . . 41

4.2 Der Algorithmus . . . 42

4.2.1 Kontinentalgewichtung, Bedeutung des Spiels und Heimvorteil 43 4.2.2 Anzahl der Spiele pro Jahr . . . 43

4.2.3 Ergebnisse der Spiele . . . 44

4.2.4 Das FIFA-Ranking . . . 45

4.3 Ergebnisse . . . 46

4.3.1 Ranglistenvergleiche . . . 46

4.3.2 Variationen des FIFA-Algorithmus . . . 50

4.3.3 Interpretation der Ergebnisse der Nachbildung des FIFA- Rankings . . . 53

4.3.4 Eigenvektorranking . . . 54

4.3.5 Interpretation der Ergebnisse des Eigenvektorrankings . . . . 54

5 Abschließende Überlegungen und Ausblick 57

(6)

6.2 Spielewertung im FIFA-Ranking . . . 64

6.3 Das FIFA-Ranking und eine Nachbildung . . . 68

6.4 Das Eigenvektorranking und das FIFA-Ranking im Vergleich . . . 74

6.5 Eigenvektorranking.java . . . 77

6.6 ChangeYear.java . . . 78

6.7 Email Dr. H.P. Stamm . . . 80

7 Danksagung 83

8 Eidesstattliche Erklärung 84

(7)

Tabellenverzeichnis

1 FIFA Beispiel 1 . . . 13

2 FIFA Beispiel 2 . . . 13

3 Veröffentlichungsdaten . . . 22

4 Elfmeterschießen . . . 24

5 Wertetabelle Torpunktefunktionen . . . 25

6 Wertetabelle Torpunktefunktionen mit Stärkewertung . . . 27

7 Adjazenzmatrix des Beispielgraphen. . . 30

8 Volleyball-BeispielmatrixA . . . 42

9 Fußball-3D-BeispielmatrixB . . . 44

10 Mögliche Spielergebnisse . . . 45

11 Top 20 des FIFA-Rankings und einer Nachbildung. . . 46

12 Kendall-Tau-Distanzen Tabelle . . . 50

13 Kendall-Tau-Distanzen Tabelle Eigenvektorranking . . . 55

14 Rangplatzunterschiede Eigenvektorranking zum FIFA-Ranking . . . . 57

15 Auf- und Absteiger . . . 57

16 Kontinentalzuordnung im FIFA-Ranking . . . 63

17 Tabellarischer Vergleich des FIFA-Ranking und einer Nachbildung . . 73

18 Rangplatzgewinne und -verluste beim Eigenvektorranking . . . 76

Abbildungsverzeichnis

1 Alternative Jahresgesamtpunktzahlberechnung . . . 22

2 Schaubild Torpunktefunktionen. . . 26

(8)

5 Der FIFA-Spielegraph und eine Detailansicht . . . 41 6 Der FIFA-Algorithmus und Nachbildungen . . . 48 7 Grafischer Vergleich des FIFA-Ranking und einer Nachbildung . . . . 49 8 Alternative Berechnung Jahresgesamtpunktzahl II. . . 52 9 Grafischer Vergleich des FIFA-Ranking und einer Nachbildung . . . . 56 10 Auf- und Absteiger . . . 58

(9)

1 EINFÜHRUNG

1 Einführung

1.1 Motivation

Fußball als Volkssport fasziniert Millionen von Menschen weltweit. Wenige andere Sportarten berühren eine vergleichbare Anzahl von Menschen so emotional. Kein Wunder also, dass der offiziellen Fußball-Weltrangliste besondere Aufmerksamkeit zukommt. Erst im April 2005 degradierte zum Beispiel der deutsche Bundestrainer JÜRGEN KLINSMANN die Ranglistenberechnungen der FIFA zum „schlechten Witz”

[DFB05], weil er die Benachteiligung des zukünftigen WM-Gastgebers ungerecht fand.

Über den Modus der Berechnungen lässt sich trefflich streiten. Benutzt man bei- spielsweise Weltmeister- und Kontinentalmeisterschaftstitel, um die Stärke einer Na- tionalmannschaft zu quantifizieren, so ist die deutsche Nationalelf vor Italien die Nummer Eins in Europa und nach Brasilien die Nummer Zwei weltweit1.

Als im Dezember 1993 der Internationale Fußball-Verband FIFA (Fédération Inter- nationale de Football Association) die Weltrangliste einführte, stand der damalige Weltmeister Deutschland auch auf Platz Eins dieser Skala. Der damalige Bundes- trainer BERTI VOGTSmachte sich lustig über diese neue Wertung, die er für Unsinn hielt.

Nachdem – anders als zum Beispiel in derFußball-Bundesliga– weltweit nicht alle Mannschaften gegen alle anderen antreten können und auch nicht alle Mannschaf- ten gleich viele Spiele bestreiten, ist die Ermittlung einer weltweiten Rangfolge auch erheblich komplexer als auf nationaler Ebene.

Es scheint also durchaus lohnend, den Berechnungsmodus der FIFA für die Fuß- ballweltrangliste einmal genauer unter die Lupe zu nehmen und auch mit anderen möglichen Berechnungsmodi zu vergleichen.

Der durchschlagende Erfolg, den die InternetsuchmaschineGOOGLEbei der Rang- folgenbestimmung von Suchergebnissen mit dem von den GOOGLE-Gründern LAR-

RY PAGE und SERGEY BRINentwickelten PageRank -Algorithmus [Brin98] hat, legt

1Internationale Erfolge der deutschen Nationalmannschaft: Drei Weltmeistertitel (1954, 1974, 1990) und drei Europameistertitel (1972, 1980, 1996). Außerdem vier weitere Teilnahmen am FIFA WM-Finale (1966, 1982, 1986, 2002) sowie zwei an den EM-Endspielen (1976, 1992).

(10)

einen Vergleich mit einer für das Fußballranking modifizierten PageRank -Version nahe.

Bei genauer Betrachtung scheint das dem PageRank zu Grunde liegende Eigen- vektorranking besser für ein Fußballranking geeignet, da mit den von PAGE und BRINvorgenommenen Modifikationen des Eigenvektorrankings im Wesentlichen die Notwendigkeit des starken Zusammenhangs des betrachteten Graphen umgangen wird2. Es wird sich herausstellen, dass beim FIFA-Spielgraphen der starke Zusam- menhang leicht sichergestellt werden kann.

1.2 Überblick

1.2.1 Der FIFA-Algorithmus

Auf ihrer Website beschreibt die FIFA den von ihr verwendeten Algorithmus [FIFA05]

auf den ersten Blick vergleichsweise ausführlich. Auf den zweiten Blick jedoch of- fenbaren sich zahlreiche Lücken, die beim Versuch, den Algorithmus nachzubauen, gefüllt werden müssen.

Die Funktionen zur Berechnung der Punkte für Sieg, Unentschieden oder Niederlage und für Tore und Gegentore zum Beispiel sind von der FIFA nicht explizit angegeben und müssen aus Beispielen der FIFA so gut wie möglich hergeleitet werden.

Die Bewertung von Spielen, die durch Elfmeterschießen entschieden werden, ist ebenfalls lückenhaft dargestellt. Aus diesem Grund können zum Beispiel über die Art der Bewertung von Hin- und Rückspielen, die durch Elfmeterschießen entschieden werden, nur Vermutetungen angestellt werden.

Der von der FIFA angegebene Modus zur Verrechnung der Einzelspielepunktzahlen für den Fall, dass eine Mannschaft mehr als sieben Spiele pro Jahr spielt, ist zwar sehr detailliert beschrieben. Um so deutlicher wird jedoch auch, dass der Anreiz, nach sieben Spielen noch ein weiteres zu bestreiten, sehr viel geringer ist als bei den Spielen vorher. Warum die Berechnung in dieser Art und Weise vorgenommen wird, bleibt unklar.

2Nebenbei gesagt spielen auch Laufzeit und Skalierbarkeit bei der Rangfolgenbestimmung von etwa 200 Fußball- nationalmannschaften (im Vergleich zu mehreren Milliarden Webseiten) ebenso keine Rolle wie die Resistenz gegen gezielte Manipulationen (zum Beispiel durch das Anlegen von so genannten Linkfarmen).

(11)

1.2 Überblick 1 EINFÜHRUNG

Die Details hierzu sowie zu den Spiel- und Torpunktefunktionen sind im Kapitel2.2

„Nachbildung des FIFA-Rankings” (S.22) ausgeführt.

1.2.2 Der rückkopplungsbasierte Algorithmus

Der hier implementierte rückkopplungsbasierte Algorithmus verwendet eine Eigen- vektorberechnung der Adjazenzmatrix, in der die Einträge die von einer Mannschaft gegen eine andere Mannschaft erzielten Punkte sind. Die Gewichtung der einzel- nen Einträge (abhängig zum Beispiel von der Bedeutung des Spiels) wird auf die gleiche Art vorgenommen wie beim FIFA-Ranking. Dann muss für die Berechnung des Eigenvektorrankings sichergestellt werden, dass der Fußballspielegraph stark zusammenhängend ist. Wie dies gewährleistet wird, wird im Kapitel3„Eigenvektor- zentralität” (S.30) erläutert.

1.2.3 Ermittlung der Spieledaten

Da die FIFA die Daten der Länderspiele nicht in einem ohne Weiteres maschinenles- baren Format anbietet, mussten die Spieledaten aus der Website der FIFA extrahiert werden. Hierbei ergaben sich Probleme mit der zum Teil inkonsistenten Darstellung, einigen wenigen fehler- oder lückenhaften Ergebnissen und der schieren Datenmen- ge. Dies ist im Kapitel4.1(S.41) dargestellt.

(12)

2 Das FIFA-Ranking

2.1 Beschreibung des FIFA-Rankings

Das FIFA-Ranking in seiner heutigen Form wird seit 1993 (mit Revisionen 1999) verwendet. Es wurde von den Schweizer SoziologenDr. Markus Lamprecht und Dr.

Hanspeter Stammfür die FIFA entwickelt.

Beim FIFA-Ranking werden folgende Parameter berücksichtigt [FIFA05]:

• Sieg, Unentschieden oder Niederlage.

• Die Anzahl der Tore und Gegentore.

• Der Heimvorteil.

• Die Bedeutung des Wettbewerbs.

• Der Kontinentalverband.

• Das zeitliche Zurückliegen des Spiels.

Die Punkte für Sieg, Unentschieden oder Niederlage (PS) und die Punkte für erziel- te Tore (PT) werden addiert. Hiervon werden die Punkte für die Gegentreffer (PGT) abgezogen und ein Bonus für die Auswärtsmannschaft (PAB) addiert. Das Ergebnis wird mit Gewichtungsfaktoren für den betreffenden Wettbewerb (FW), die Kontinen- talstärke (FK) und das Alter des Spiels (FT) multipliziert.

Die Verteilung der Punkte für Sieg, Unentschieden oder Niederlage sowie für die Tore und Gegentreffer erfolgt dabei flexibel in Abhängigkeit von der Stärke beider Mannschaften – der Punktedifferenz vor dem Spiel (∆P), um genau zu sein. Um Misserfolge nicht zu bestrafen, werden negative Punktetotale auf 0 Punkte aufge- rundet. Für dasi-te Spiel werden also folgende Punkte vergeben:

Pi=max([(PS(∆P) +PT(∆P)−PGT(∆P) +PAB) · FW·FK·FT], 0)

Der Modus für die Berechnung der Jahresgesamtpunktzahl und der Gesamtpunkt- zahl wird in2.1.8beschrieben.

(13)

2.1 Beschreibung des FIFA-Rankings 2 DAS FIFA-RANKING

2.1.1 Beispiele

Um den Modus der Punktevergabe zu verdeutlichen, führt die FIFA sechs Beispiele an:

Punktestand vor dem Turnier:

Team A 630 Punkte Team B 500 Punkte Team C 480 Punkte

Team A : Team B Team A : Team B Team A : Team B

Tore 3 : 1 1 : 3 2 : 2

Punkte für Sieg/Nie- derlage

+17,4 +2,6 -2,6 +22,6 +7,4 +12,6

Tore von Team A +5,4 -3,6 +2,3 -1,6 +4,1 -2,7

Tore von Team B -1,8 +2,7 -4,1 +6,2 -3,1 +4,7

Insgesamt +21,0 +1,7 (0,0) +27,2 +8,4 +14,6

Tabelle 1: FIFA Beispiel 1

Team B : Team C Team B : Team C Team B : Team C

Tore 3 : 1 1 : 3 2 : 2

Punkte für Sieg/Nie- derlage

+19,6 +0,4 -0,4 +20,4 +9,6 +10,4

Tore von Team B +5,7 -3,8 +2,5 -1,7 +4,3 -2,9

Tore von Team C -1,7 +2,5 -3,9 +5,8 -3,0 +4,4

Insgesamt +23,6 (0,0) (0,0) +24,5 +10,9 +11,9

Tabelle 2: FIFA Beispiel 2

(14)

2.1.2 Sieg, Unentschieden oder Niederlage

Beim FIFA-Ranking richtet sich die Punktzahl für einen Sieg nach der Stärke der bei- den Mannschaften: Gewinnt eine schwache Mannschaft gegen eine starke, so erhält sie mehr Punkte als wenn eine starke Mannschaft gegen eine schwache gewinnt.

Auch die Punkte für ein Unentschieden oder einen Spielverlust richten sich nach der Stärke der beiden Mannschaften. So kann eine schwache Mannschaft sogar bei einem Spielverlust gegen eine deutlich stärkere Mannschaft Punkte angerechnet bekommen (siehe Beispiel oben).

Bei Partien, die durch Elfmeter entschieden werden, erhält die siegreiche Mann- schaft die volle Punktzahl für einen Sieg, für das unterlegene Team wird das Spiel jedoch wie ein Unentschieden gewertet.

2.1.3 Anzahl der Tore und Gegentore

Ebenso erfolgt die Punkteverteilung für Tore und Gegentore beim FIFA-Ranking in Abhängigkeit von der Stärke der Mannschaften. Tore der schwächeren Mannschaft zählen also mehr als die Tore der stärkeren Mannschaft. Um eine Spielweise mit vielen Toren zu belohnen, werden Gegentreffer allerdings schwächer gewichtet als selbst geschossene Tore.

Der erste Treffer einer Mannschaft wird stärker gewichtet als die darauffolgenden Tore. Insgesamt werden Tore deutlich schwächer gewertet als Siege.

Bei Spielen, deren Sieger durch Elfmeterschießen ermittelt wird, werden nur die während der regulären Spielzeit plus Verlängerung erzielten Treffer berücksichtigt.

2.1.4 Heim- und Auswärtsspiele

Um den erschwerten Bedingungen bei Auswärtsspielen Rechnung zu tragen, wird der Auswärtsmannschaft ein Bonus von 3 Punkten gutgeschrieben. Bei Spielen auf neutralem Boden sowie im Rahmen von Weltmeisterschaftsendrunden werden keine Bonuspunkte vergeben.

(15)

2.1 Beschreibung des FIFA-Rankings 2 DAS FIFA-RANKING

2.1.5 Bedeutung des Spiels

Die unterschiedliche Wichtigkeit der Spiele wird durch einen entsprechenden Faktor berücksichtigt:

• Freundschaftsspiele×1,00

• Qualifikation für eine Kontinentalmeisterschaft×1,50

• WM-Qualifikation×1,50

• Endrunde einer Kontinentalmeisterschaft×1,75

• FIFA/Confederations Cup×1,75

• WM-Endrunde×2,00

2.1.6 Kontinental-Gewichtungen

Beim FIFA-Ranking werden Spiele von Mannschaften innerhalb einer Kontinental- gruppe mit einem Gewichtungsfaktor multipliziert. Spielen zwei Mannschaften aus unterschiedlichen Kontinentalverbänden gegeneinander, so werden die Punkte für dieses Spiel mit dem Durchschnitt der beiden Kontinentalgewichtungsfaktoren mul- tipliziert.

Mit den Kontinentalgewichtungen soll dem Umstand Rechnung getragen werden, dass Spiele viel häufiger innerhalb einer Kontinentalgruppe stattfinden als zwischen Mannschaften verschiedener Kontinentalgruppen. Im Spielegraphen wird dies durch eine gewisse Clusterbildung (siehe S.41) deutlich.

Befinden sich in der Kontinentalgruppe A ausschließlich relativ schlechte Mann- schaften und in der Kontinentalgruppe B ausschließlich relativ gute Mannschaften, und das Ranking dieser Mannschaften wird im Wesentlichen durch Spiele inner- halb der einzelnen Kontinentalgruppen ermittelt, so fehlen Referenzen, um das Stär- keverhältnis der Mannschaften unterschiedlicher Kontinentalverbände errechnen zu können.

Bei der Berechnung der Kontinentalfaktoren werden nur die interkontinentalen Di- rektbegegnungen der besten 25% (mindestens aber 5) Mannschaften jedes Konti- nentalverbandes betrachtet. So soll der Gefahr von Verzerrungen entgegengewirkt

(16)

werden, die sich aus der Tatsache ergeben könnten, dass starke Teams aus schwa- chen Kontinentalverbänden oft gegen schwache Mannschaften aus starken Konti- nentalverbänden antreten. Im Jahr 2004 und 2005 hatten diese Kontinentalfaktoren die selben Werte:

UEFA (Europa) 1,00

CONMEBOL (Südamerika) 0,99

CAF (Afrika) 0,96

CONCACAF (Nordamerika) 0,94

AFC (Asien) 0,93

OFC (Ozeanien) 0,93

Wie diese Faktoren genau errechnet werden, führt die FIFA nicht näher aus.

2.1.7 Zeitgewichtung

Mit jedem vergangenen Jahr werden alte Spiele um 18 schwächer gewertet. Die Be- rechnungen für eine Rangliste Ende 2004 werden daher wie folgt vorgenommen:

2004: 88-Gewichtung 2003: 78-Gewichtung 2002: 68-Gewichtung 2001: 58-Gewichtung 2000: 48-Gewichtung 1999: 38-Gewichtung 1998: 28-Gewichtung 1997: 18-Gewichtung

Alle vorhergehenden Resultate werden nicht berücksichtigt.

(17)

2.1 Beschreibung des FIFA-Rankings 2 DAS FIFA-RANKING

2.1.8 Berechnung der Jahresgesamtpunktzahl

Nach Angaben der FIFA spielen durchschnittlich aktive Teams zwischen 7 und 10 Spiele pro Jahr. Tatsächlich liegt der Durchschnitt seit 1996 genau bei 10 Spielen pro Jahr. Damit Teams, die weniger häufig spielen, nicht übermäßig benachteiligt werden, werden einerseits die in den Spielen eines Jahres erzielten Punkte nicht einfach aufsummiert, sondern bei mehr als 7 Spielen die durchschnittliche Punktzahl aller Spiele auf 7 Spiele hochgerechnet. Andererseits werden die besten 7 Spiele stärker gewichtet. Die Schranke 7 ist von der FIFA willkürlich festgelegt worden. Auf diese Weise soll Folgendes sicher gestellt werden:

1. Durch die „Dämpfung” bei mehr als 7 Spielen werden Mannschaften, die nur wenige Spiele pro Jahr bestreiten, nicht allzu sehr benachteiligt.

2. Es gibt auch nach 7 Spielen noch Anreiz, weitere Spiele zu bestreiten, um den Durchschnitt der 7 besten Spiele zu heben.

Im Folgenden seienPges die Jahresgesamtpunktzahl einer Mannschaft am Ende ei- ner Saison,Pidie imi-ten Spiel erzielte Punktzahl (wobei wir für noch nicht gespielte SpielePi=0setzen),t die Schranke, ab der die Jahresgesamtpunktzahl nicht mehr durch einfaches Aufsummieren ermittelt wird (im Fall des FIFA-Rankings:t=7) und n die Gesamtzahl der bisher in diesem Jahr bestrittenen Spiele. Ohne Einschrän- kung seien die Spiele in absteigender Punktzahl sortiert. Insbesondere sei Pt das t-beste undPndas schlechteste Spiel.

Pges(n) = 1 2

t i=1

Pi + 1 2

n i=1

Pi·min(t,n) n

Die erste Summe ist also die Hälfte der Summe der t besten Spiele. Die zweite Summe ergibt die Hälfte des Durchschnitts allernSpiele aufn, höchstens aber auf tSpiele umgerechnet.

Der Anreiz für die Teams, weitere Spiele zu bestreiten, soll im Folgenden untersucht werden.

(18)

1. Fall:n<t Für die erstentSpiele istmin(t,n) =n. Pges(n) =

n i=1

Pi

Solange die Schranket noch nicht erreicht ist, werden die Punkte für die Spiele also einfach aufsummiert. Der AnreizA(n+1), ein weiteres,(n+1)-tes Spiel zu bestrei- ten, entspricht also der Punktzahl für den erwarteten Ausgang des Spiels. Es ist also A(n+1) =Pges(n+1)−Pges(n), wobei überPges(n+1)natürlich nur spekuliert wer- den kann. Ohne mehr über die Stärke der Gegner in bisherigen Begegnungen und des Gegners der nächsten Begegnung zu wissen, kann man vom Durchschnitt der Punktzahlen der bisherigenn Begegnungen als AnreizA(n+1) für das (n+1)-te Spiel ausgehen:

A(n+1) = Pges(n)

n =

n i=1

Pi n Es ist also

Pges(n+1) =

n+1

i=1

Pi =

n i=1

Pi +

n i=1

Pi n

Selbst im ungünstigsten Fall – wenn die Mannschaft in der(n+1)-ten Begegnung 0Punkte erzielt – kann sich die Jahresgesamtpunktzahl der Mannschaft nicht ver- schlechtern.

2. Fall:nt Ab demt-ten Spiel istmin(t,n) =t.

Auch wenn die Schranke t überschritten wird, ist die erwartete Punktzahl für das (n+1)-te Spiel gleich dem Durchschnitt

n i=1Pi

n der Punktzahlen der bisherigen n Begegnungen. Die angerechnete Punktzahl ist jedoch nicht mehr gleich der erzielten Punktzahl, sondern hängt vom Durchschnitt der bisherigen Begegnungen, von der erzielten Punktzahl im bishert-besten Spiel und der im(n+1)-ten Spiel erzielten PunktzahlPn+1ab.

Es ist

Pges(n+1) = 1 2

t i=1

Pi + 1

2·min(Pn+1Pt,0) + 1 2

n+1

i=1

Pi· t n+1

(19)

2.1 Beschreibung des FIFA-Rankings 2 DAS FIFA-RANKING

Betrachten wir zunächst die rechte Summe. Da wir erwarten, dass Pn+1=∑ni=1Pni ist, und trivialerweise n+1t = tn·n+1n und n+1n =1−n+11 ist, haben wir

1 2

n+1

i=1

Pi· t

n+1 = 1 2

n i=1

Pi· t

n+1 + 1

2Pn+1· t n+1

= 1 2

n i=1

Pi· t n· n

n+1 + 1

2Pn+1· t n+1

= 1 2

n i=1

Pi· t

n − 1 2

n i=1

Pi· t n· 1

n+1 + 1 2

n i=1

Pi· t n· 1

n+1

= 1 2

n i=1

Pi· t n

Wenig überraschend ändert sich der 2t-fache Durchschnitt der Punkte aller Spiele bei einem weiteren, durchschnittlichen Spiel nicht.

Die linke Summe jedoch vergrößert sich um 12·min(Pn+1Pt,0), also die Hälfte der DifferenzPn+1Pt, falls diese positiv ist. Wann aber ist dies der Fall?

Wenn man die bisherigen Spiele als Berechnungsgrundlage heranzieht, erwartet man für das (n+1)-te Spiel die selbe Differenz zum bishert-besten Spiel wie im Durchschnitt bei den ersten n Spielen. Gewertet werden in der linken Summe je- doch nur die Spiele, die besser als das t-beste Spiel waren. Das heißt, es wird erwartet, dass sich die erste Summe beim(n+1)-ten Spiel um die Summe der Dif- ferenzen zwischen dent besten Spielen und demt-besten Spiel dividiert durch die Gesamtzahlnder Spiele vergrößert.

Pges(n+1) = 1 2

t i=1

Pi + 1 2

t i=1

PiPt

n + 1

2

n i=1

Pi·t n

= 1 2

t i=1

Pi + 1 2

t i=1

Pi

nt·Pt

2n + 1 2

n i=1

Pi·t n

= Pges(n) + 1 2

t i=1

Pi

nt·Pt 2n

(20)

Also ist der Anreiz für das(n+1)-te Spiel

A(n+1) = 1 2

t i=1

Pi

nt·Pt 2n

Betrachten und vergleichen wir nun die Grenzfälle beim Überschreiten der Schranke t. Wird im t-ten Spiel durchschnittlich gespielt, so ist ∑ti=1

Pi

t =∑t−1i=1t−1Pi . Da wir vorher ohne Einschränkung angenommen haben, die Spiele seien mit absteigender Punktzahl sortiert, ist fürn=t: Pt das schlechteste Spiel und also

1 2

t i=1

Pi

nt·Pt

2n = 1

2

t i=1

Pi

nPt 2

Wir haben demnach folgende Fälle:

• Wir erwarten einen durchschnittlichen Punktezuwachs imt-ten Spiel um

A(t) =

t−1

i=1

Pi

t−1

• Wir erwarten einen durchschnittlichen Punktezuwachs im(t+1)-ten Spiel um

A(t+1) = 1 2

t i=1

Pi

tPt

2 = 1

2

t−1

i=1

Pi

t−1 − Pt 2

Es ist A(t+1) = 12A(t)P2t der Anreiz für das (t+1)-te Spiel, wobei Pt das bis- her schlechteste Spiel ist. Das heißt, der Anreiz für dast+1-te Spiel ist maximal halb so groß wie der Anreiz für dast-te Spiel, und je nachdem, wie gut das bisher schlechteste Spiel ausgefallen ist, eher kleiner.

Beispiele Betrachten wir zwei typische Mannschaften und ihre Anreize im FIFA- Ranking für dast-te Spiel. Es istt=7.

Mannschaft A sei recht durchschnittlich und habe von ihren ersten 6 Spielen gleich viele Spiele verloren wie gewonnen. Für ihre Spielgewinne hat sie je ca. 20 Punk- te kassiert, für ihre Unentschieden ca. 10 Punkte und für ihre Spielverluste ca. 0 Punkte.

(21)

2.1 Beschreibung des FIFA-Rankings 2 DAS FIFA-RANKING

Für ihr 7. Spiel erwartet Mannschaft A ein Unentschieden und somit einen Gesamt- punktezuwachs von 10 Punkten.

Für ihr 8. Spiel erwartet Mannschaft A ebenfalls ein Unentschieden, der Gesamt- punktezuwachs wäre aber nur noch 12·10−02=5Punkte.

Mannschaft B sei relativ gut und habe von ihren ersten 6 Spielen keines verloren und gleich viele gewonnen (ca. 20 Punkte) wie unentschieden gespielt (ca. 10 Punkte).

Für ihr 7. Spiel erwartet sie also 15 Punkte und einen ebenso großen Gesamtpunk- tezuwachs.

Für ihr 8. Spiel erwartet Mannschaft B ebenfalls 15 Punkte. Sie erhielte hierfür aber nur einen Gesamtpunktezuwachs von 12·15−102 =2,5Punkten.

Wie sinnvoll ein derart starker Knick in der Anreizkurve ist, ist zumindest fragwürdig.

Die Bewertung mehrerer Spiele in einem Jahr könnte ebenso gut über das Produkt einer Wurzel- oder Logarithmusfunktion mit dem Durchschnitt aller Spiele eines Jah- res berechnet sein. Die Berechnung der Jahresgesamtpunktzahl über

Pges(n) =

n i=1

Pi

n · √ 7n

zum Beispiel bietet sich an. Auf diese Weise zählt bei sieben Spielen ebenfalls die Summe aller Spiele. Ein Knick im Anreiz jedoch wird vermieden.

Da die Gewichtung für das zeitliche Zurückliegen des jeweiligen Spiels schon in den Jahresgesamtpunktzahlen berücksichtigt wurde, werden zur Berechnung der Gesamtpunktzahlen lediglich die Jahresgesamtpunktzahlen addiert.

2.1.9 Aktualisierung der Weltrangliste

Die FIFA-Weltrangliste wird jeden Monat aktualisiert mit einer Deadline am Donners- tag in der Mitte des jeweiligen Monats. Veröffentlichungsdaten 20053:

Wie die Zwischenjahresergebnisse genau berechnet werden, führt die FIFA nicht aus.

3http://fifa.com/de/mens/statistics/rank/procedures/0,2540,4,00.html

(22)

0 1 2 3 4 5 6 7 8 9

0 1 2 3 4 5 6 7 8 9 10

Funktion zur Berechnung der Jahresgesamtpunktzahl f(x)=sqrt(7*x)

Abbildung 1: Alternative Jahresgesamtpunktzahlberechnung

Monat Veröffentlichung

Januar 19.1.

Februar 16.2.

März 23.3.

April 20.4.

Mai 18.5.

Juni 15.6.

Juli 20.7.

August 17.8.

September 14.9.

Oktober 19.10.

November 23.11.

Dezember 19.12.

Tabelle 3: Veröffentlichungsdaten

2.2 Nachbildung des FIFA-Rankings

Im Zuge dieser Arbeit wird versucht, den Algorithmus des FIFA-Rankings so weit wie möglich nachzubilden. Nachdem die Website der FIFA bezüglich einiger Details des Rankings Fragen offen lässt und die FIFA auf diesbezügliche E-Mails nicht antwortet,

(23)

2.2 Nachbildung des FIFA-Rankings 2 DAS FIFA-RANKING

müssen über diese Details Vermutungen angestellt werden. Aus rechtlichen Grün- den dürfen sich auch die Entwickler des Algorithmus, Dr. Markus Lamprecht und Dr.

Hanspeter Stamm, nicht dazu äußern (vgl. Anhang6.7S.80). Die folgenden Annah- men über die Berechnungen basieren auf den oben angeführten Beispielen (S.13) und folgen dem Prinzip der ockham’schen Sparsamkeit.

2.2.1 Sieg, Unentschieden oder Niederlage

Die Punkte für Sieg, Unentschieden oder Niederlage scheint die FIFA mittels folgen- der Formel auszurechnen:

PSieg = 20+∆P 50 , PU nentschieden = 10+∆P

50 und PNiederlage = 0+∆P

50

wobei∆P=Pges(Gegnermannschaft)−Pges(Mannschaft).

Das heißt, die Punktedifferenz ∆P zwischen den beiden Mannschaften ist für die stärkere Mannschaft negativ und für die schwächere Mannschaft positiv. Die Summe der Punkte für beide Mannschaften ist immer 204. Diese Formel passt exakt zu den sechs von der FIFA angegebenen Beispielen.

Auf welchen Zeitpunkt exakt sich die Punktedifferenz bezieht, ist nicht erläutert. Ver- mutlich ist die Punktedifferenz genau vor dem jeweils betrachteten Spiel gemeint.

Bei den Beispielen wird jedoch von der Punktedifferenz der Mannschaften „vor dem Turnier” gesprochen. Ob aber die betrachteten Mannschaften im Laufe des Turniers noch andere Spiele ausgetragen haben, die vor den betrachteten stattfanden, bleibt offen.

Bei der hier entwickelten Implementierung der Siegprämie wird als Berechnungsba- sis die Punktedifferenz am Ende des jeweiligen Vorjahres herangezogen, da eine

4Ausnahme: Elfmeterschießen. Hier ist die Summe der Punkte für beide Mannschaften 30. Siehe S.24.

(24)

laufende Punkteberechnung während jedes Jahres den Algorithmus stark verkom- plizieren würde (vgl. Abschnitt „Aktualisierung der Weltrangliste” S.29).

Ein weiteres Problem ist die Wertung von Spielen, die durch Elfmeterschießen ent- schieden werden. Nach FIFA-Angaben bekommt der Sieger des Elfmeterschießens das Spiel als Sieg angerechnet, der Verlierer jedoch als Unentschieden.

Bei Spielen jedoch, die als Hin- und Rückspiel gespielt werden, muss der Sieger des Spiels nach der Verlängerung und der Sieger nach dem Elfmeterschießen nicht derselbe sein. Zur Behandlung dieses Falles macht die FIFA keine Angaben zur Punkteverteilung.

Es scheint sinnvoll, die Aussagen der FIFA so zu interpretieren, dass die in Spie- len mit Elfmeterschießen vergebene Gesamtpunktzahl (Summe der Punkte beider Kontrahenten) 30 anstatt 20 ist und der Sieger des Elfmeterschießens 10 Punkte mehr als bei einem regulär eintschiedenen Spiel bekommt. Es sind drei Fälle zu unterscheiden:

Spielergebnis nach EMS Punkte

reguläres Spiel: 1:1 2:3 10:20

Hinspiel: 1:0 - 20:00

Rückspiel: 0:1 2:3 00:30

Hinspiel: 1:0 - 20:00

Rückspiel: 0:1 3:2 10:20

Hinspiel: 1:1 - 10:10

Rückspiel: 1:1 3:2 20:10

Tabelle 4: Elfmeterschießen

Da in den erhobenen Spieledaten Hin- oder Rückspiele nicht kenntlich gemacht sind und aus den Ergebnissen des Rückspiels nicht in allen Fällen auf ein Hinspiel ge- schlossen werden kann (siehe letztes Beispiel), ist eine gesonderte Behandlung der Hinspiele nicht möglich, aber bei dieser Interpretation auch nicht erforderlich.

2.2.2 Anzahl der Tore und Gegentore

Über die Funktion zur Berechnung der für Tore vergebenen Punkte gibt die FIFA ebenfalls keine Auskunft, sondern sagt lediglich, dass für das erste Tor mehr Punkte vergeben werden als für die Folgetore (vgl. S.14). Bei den angegebenen Beispielen (siehe S.13) erhalten die beinahe gleichstarken (Punktedifferenz: 20 Punkte≈5%) Mannschaften B und C für ihre Tore folgende Punktzahlen:

(25)

2.2 Nachbildung des FIFA-Rankings 2 DAS FIFA-RANKING

1 Tor 2,50 Punkte

2 Tore 4,35 Punkte (Durchschnitt der an die Mannschaften B und C für 2 Tore ver- gebenen Punkte)

3 Tore 5,75 Punkte (Durchschnitt der an die Mannschaften B und C für 3 Tore ver- gebenen Punkte)

Es steht zu vermuten, dass für 0 Tore auch 0 Punkte vergeben werden.

Die gesuchte Funktion soll also durch die vier Punkte(0|0), (1|2,5), (2|4,35)und (3|5,75)gehen, und ihre Steigung soll streng monoton abnehmen.

Es wurden drei mögliche Funktionen gefunden:

0 1 2 3 5

Soll 0 2,5 4,35 5,75 -

PT(x) =2,5x0,75 0 2,5 4,20 5,70 8,36 PT(x) =4,75x0,475−2,25 -2,25 2,5 4,35 5,75 7,95 PT(x) =14,45 log(0,5x+1) 0 2,54 4,35 5,75 7,86

Tabelle 5: Wertetabelle Torpunktefunktionen

Die zweite Funktion setzt natürlich voraus, dass Punkte nur für eine Toranzahl>0 berechnet werden. Die Spalte für fünf Tore wurde in die Wertetabelle aufgenom- men, um einen Eindruck über den weiteren Verlauf der Kurven zu bekommen. Bei Betrachtung der Ergebnisse mit unterschiedlichen Variationen (siehe: „Ergebnisse”

S. 46) wird sich zeigen, ob es bei der Anwendung auf reale Daten einen wesentli- chen Unterschied macht, welche der Funktionen für die Berechnung der Punkte für Tore benutzt wird.

Für Gegentore bekommt eine Mannschaft im Durchschnitt das 0.672-fache5 der Punkte abgezogen, die die Gegenmannschaft gutgeschrieben bekommt. Der Vor- teil dieser – im Vergleich zur Entwicklung eigener Funktionen für die Gegentore – einfachen Lösung ist, dass beim Variieren der Torfunktionen und beim Variieren des Verhältnisses der Wertungen von Toren zu Gegentoren nur an einer Stelle die Funktionen angepasst werden müssen. Wie stark sich Variationen hier im Ergebnis bemerkbar machen wird in Kapitel4.3„Ergebnisse” (S.46) untersucht.

Wie die Punktvergabe für Sieg, Unentschieden und Niederlage erfolgt die Punktver- gabe für Tore und Gegentore in Abhängigkeit von der Stärke der Mannschaften. Aus

5Verhältnisse Punktabzug fürGegner punkteGegentore für Tore im Beispiel der FIFA: 0,667; 0,667; 0,696; 0,661; 0,658; 0,659;

0,667; 0,68; 0,68; 0,672; 0,674; 0,682

(26)

Abbildung 2: Schaubild Torpunktefunktionen

dem Beispiel der FIFA lassen sich bei den Punktvergaben für die Tore im Spiel A gegen B (130 Punkte Differenz) folgende Korrekturwerte für unterschiedlich starke Mannschaften ablesen:

1 Tor ±0,2 Punkte bei 130 Punkten Differenz 2 Tore ±0,3 Punkte bei 130 Punkten Differenz 3 Tore ±0,4 Punkte bei 130 Punkten Differenz

Der gesuchte Korrekturwert soll für Tore bei Mannschaften ohne Punktdifferenz 0 sein. Möglich wäre folgende Berechnung für die Punktvergabe für Tore zwischen ungleich starken Mannschaften:

(27)

2.2 Nachbildung des FIFA-Rankings 2 DAS FIFA-RANKING

Abbildung 3: Schaubild Gegentorpunktefunktionen

PT(x,∆P) =PT(x) + (x+1)· ∆P 1300

wobei PT(x) eine der Funktionen von oben und ∆P=Pges(Gegnermannschaft)− Pges(Mannschaft)ist.

1 2 3

Soll für∆P=±20 2,5 / 2,5 4,3 / 4,4 5,7 / 5,8

PT(x,20) =2,5x0,75±(x+1)·130020 2,47 / 2,53 4,15 / 4,25 5,64 / 5,76 PT(x,20) =4,75x0,475−2,25±(x+1)·130020 2,47 / 2,53 4,3 / 4,4 5,69 / 5,81 PT(x,20) =14,45 log(0,5x+1)±(x+1)·130020 2,51 / 2,57 4,3 / 4,4 5,69 / 5,81

Soll für∆P=±130 2,3 / 2,7 4,1 / 4,7 5,4 / 6,2

PT(x,20) =2,5x0,75±(x+1)·1300130 2,3 / 2,7 3,9 / 4,5 5,3 / 6,0 PT(x,20) =4,75x0,475−2,25±(x+1)·1300130 2,3 / 2,7 4,05 / 4,65 5,35 / 6,15 PT(x,20) =14,45 log(0,5x+1)±(x+1)·1300130 2,34 / 2,74 4,05 / 4,65 5,35 / 6,15

Tabelle 6: Wertetabelle Torpunktefunktionen mit Stärkewertung

(28)

2.2.3 Heim- und Auswärtsspiele

Der von der FIFA benutzte Bonus von 3 Punkten für Auswärtsspiele wird hier nicht implementiert. In den von der FIFA-Website erhobenen Daten ist lediglich der Aus- tragungsort eines Spieles angegeben. Das Stringmatching zwischen Austragungs- ort und beteiligten Mannschaften konnte nicht mit ausreichender Zuverlässigkeit ge- währleistet werden.

Außerdem bestehen Zweifel an den Angaben der FIFA, es würde ausschließlich für Spiele im Rahmen von Weltmeisterschaftsendrunden kein Auswärtsbonus verge- ben. Diese Ausnahme nicht auch auf die Endrunden von Kontinentalmeisterschaf- ten anzuwenden, erscheint nicht schlüssig. So hätten zum Beispiel sämtliche Mann- schaften außer Portugal, die bei der Europameisterschaft 2004 in Portugal teilnah- men, für jedes Spiel unabhängig vom Spielausgang3·1,75=5,25Punkte erhalten.

2.2.4 Bedeutung des Spiels

Die Bewertung der Bedeutung des Spiels wurde exakt nach den Vorgaben der FIFA (vgl. S.15) umgesetzt (vgl. „Anhang Spielewertung S.64”).

2.2.5 Kontinentalgewichtungen

Für die Implementierung des Kontinentalgewichtungsfaktors werden die Angaben der FIFA aus dem Jahr 2005 benutzt. Die Gewichtungsfaktoren von 2005 sind iden- tisch mit denen aus dem Jahr 2004. Zur Gewichtung von alten Spielen werden die selben Gewichtungsfaktoren benutzt, anstatt derjenigen aus den entsprechenden Jahren. Welchen Einfluss eine Variation der Kontinentalgewichtungsfaktoren auf das Rankingergebnis bei realen Daten hat, wird im Kapitel „ Ergebnisse” (S.46) unter- sucht.

2.2.6 Zeitgewichtung und Anzahl bestrittener Spiele

Die Gewichtungsfaktoren für ältere Spiele und die Bewertung der Anzahl der Spiele werden exakt nach FIFA-Angaben implementiert.

(29)

2.2 Nachbildung des FIFA-Rankings 2 DAS FIFA-RANKING

2.2.7 Aktualisierung der Weltrangliste

Wie die Weltrangliste im Laufe des Jahres genau berechnet wird, wird von der FIFA nicht erläutert.

Zum Beispiel könnte die Aktualisierung im Laufe eines Jahres einfach genau so wie am Jahresende vorgenommen werden. Da aber selten spielende Mannschaften in der Regel ihre wenigen Spiele auch über das Jahr verteilt bestreiten, würde dies be- deuten, dass – solange keine der Mannschaften 7 Spiele bestritten hat – die beab- sichtigte „Dämpfung” für Vielspieler (vgl. S.17) am Anfang des Jahres außer Kraft ist und erst bei der Überschreitung der „7-Spiele-Grenze” ihre Wirksamkeit entwickelt.

Alternativ könnte die „7-Spiele-Grenze” während des Jahres im Lauf der Monate sukzessive von 0 auf 7 erhöht werden. Im Mai etwa wäre eine „ 5·127

-Spiele- Grenze” wirksam.

Welche Berechnungsmethode die FIFA benutzt, wird nicht offengelegt.

Im Rahmen dieser Arbeit werden lediglich Endjahresergebnisse unterschiedlicher Variationen des Algorithmus verglichen. Deshalb werden Jahreszwischenergebnis- se nicht berechnet. Dies hat möglicherweise Auswirkungen auf die Punktedifferenz zweier Mannschaften, die ja mit in die Punktberechnung eingeht.

2.2.8 Zusammenfassung

Bei der hier entwickelten Implementation des FIFA-Algorithmus sind also die Wer- tung von Sieg, Unentschieden, Niederlage und die Wertung der Tore und Gegentore aus den Beispielen der FIFA hergeleitet. Der Bonus für Auswärtsspiele wird nicht gegeben, die Kontinentalgewichtungen basieren auf den Werten von 2004, und die Bedeutung des Spiels, die Anzahl der bestrittenen Spiele und die Zeitgewichtung sind exakt nach FIFA-Angaben umgesetzt.

(30)

3 Eigenvektorranking

3.1 Einleitung

Betrachtet man die in der FIFA aktiven Mannschaften als Knoten in einem Netzwerk und die Spiele zwischen den Mannschaften als ungerichtete Kanten, so ergibt sich ein ungerichteter Multigraph.

Zur Ermittlung einer Rangfolge von Knoten auf Multigraphen gibt es eine große An- zahl von Möglichkeiten.

Zum Beispiel kann zur Ermittlung der wichtigsten Personen in einem sozialen Netz- werk der Knotengrad herangezogen werden. Auf Fußballspiele übertragen stünde dann die Mannschaft an der Spitze der Weltrangliste, die die meisten Spiele aus- trägt.

Mehr Sinn macht es, gerichtete Kanten zu benutzen und die Summe der eingehen- den Kantengewichte als Maßstab zu benutzen. In diesem Fall wäre die Mannschaft Weltmeister, die durch die Gesamtzahl ihrer Spiele die meisten Punkte erzielt hat.

Im Prinzip scheint der FIFA-Algorithmus auf diese Art und Weise zu funktionieren.

Eine weitere Möglichkeit zur Ermittlung erfolgreicher Knoten im FIFA-Spielegraph ist das Eigenvektorranking. Im Gegensatz zum FIFA-Ranking fließen hier die Stär- keunterschiede zweier Kontrahenten zum Zeitpunkt des Spiels nicht in die für das Spiel erzielte Punktzahl und somit in das Kantengewicht im Spielegraphen mit ein, sondern wird quasi im Nachhinein ermittelt und berücksichtigt.

Ein Beispielgraph mit Adjazenzmatrix

A B C D E F

A - 2 1 0 1 2

B 3 - 1 1 2 0

C 0 4 - 1 0 5

D 0 0 1 - 2 4

E 1 1 0 0 - 0

F 2 0 3 3 3 -

Tabelle 7: Adjazenzmatrix des Beispielgraphen

Definition. Graphen, bei denen Knoten auch durch mehr als eine Kante verbunden sein können, nennen wir Multigraphen.

(31)

3.1 Einleitung 3 EIGENVEKTORRANKING

A B

C D

E

F 2

3

1

1 1

2 2

1

1 4 3

3 4 1

3 2 5

2

1 1

Abbildung 4: Beispielgraph

Definition. Ein Graph G= (V,E) heißt stark zusammenhängend, wenn für alle v,wV einen Weg vonvnachwexistiert.

Satz. IstG= (V,E)der ungerichtete Multigraph aller im Rahmen der FIFA in einem Zeitraum von mindestens 4 Jahren ausgetragenen Spiele und stehen die KantenE für Spiele zwischen allen an Weltmeisterschaften teilnehmenden MannschaftenV, so istGstark zusammenhängend.

Beweis. Da alle Mannschaften bei den Qualifikationsspielen ihres Kon- tinentalverbandes für die Weltmeisterschaft teilnehmen und sich hierbei entweder selbst qualifizieren oder gegen mindestens eine qualifizierte Mannschaft verloren haben (oder gegen eine Mannschaft verloren ha- ben, die ihrerseits gegen eine qualifizierte Mannschaft verloren hat usw.), ist der Spiele-Multigraph innerhalb der Kontinentalgruppen stark zusam- menhängend.

Bei den im Vierjahresrhythmus stattfindenden Weltmeisterschafts- Endrunden spielen zuerst die 32 qualifizierten Mannschaften innerhalb von acht Gruppen „jeder gegen jeden”, und die zwei besten Mann- schaften jeder Gruppe qualifizieren sich für das Achtelfinale. Da sich das anschließende K.O.-System im Graphen als Baum darstellt, ist der Spiele-Multigraph innerhalb der WM-Endrunde stark zusammenhän- gend, und somit ebenfalls der gesamte Spiele-Multigraph.

Definition. Ein GraphG= (V=ST , E)heißt bipartit, wenn er aus 2 disjunkten KnotenmengenSundT besteht und es gilt: Jede KanteeEverbindetSundT.

(32)

Satz. IstG= (V,E)der ungerichtete Multigraph aller im Rahmen der FIFA in einem Zeitraum von mindestens 4 Jahren ausgetragenen Spiele und stehen die KantenE für Spiele zwischen allen an Weltmeisterschaften teilnehmenden MannschaftenV, so istGbipartit.

Beweis. Da in Welt- und Kontinentalmeisterschaftsendrunden bei den Gruppenspielen alle Mannschaften einer Gruppe gegen alle anderen Mannschaften dieser Gruppe spielen, hat der Graph hier Dreiecke. Of- fensichtlich kann ein Graph mit Dreiecken nicht bipartit sein.

Werden also in einem Fußballpunktesystem auch für verlorene Spiele eine Punkt- zahl>0vergeben und stellt man von einer MannschaftAgegen eine MannschaftB errungene Punkte als gewichtete Kante von KnotenBnach KnotenAdar, so ergibt sich für die Fußballländerspiele ein gewichteter, gerichteter und stark zusammenhä- nender Multigraph.

3.2 Zentralitäten

Um die Überlegungen zur Ermittlung der Wichtigkeit von Knoten in einem Netzwerk zu formalisieren, werden zunächst einige Begriffe eingeführt6.

Definition. Seien

K

eine unter Bildung von Zusammenhangskomponenten abge- schlossene Klasse von Multigraphen undR≥0 die Menge aller Vektoren über den nicht-negativen reellen Zahlen. Eine Funktions :

K

R≥0heißt (Knoten-)Struktur- index auf

K

, falls

• ∀ G= (V,E)

K

s(G)∈RV≥0

(d.h. s ist ein Knotenindex),

• ∀ G= (V,E)

K

und AutomorphismenαvonG s(G)v=s(α(G))α(v)

6Abgesehen von wenigen Umformulierungen, Beispielen und Anpassungen entspringt die folgende Herleitung der Eigenvektorzentralität dem Skript zur Vorlesung „Methoden der Netzwerkanalyse” von Prof. Dr. U. Brandes [Brandes05]

(33)

3.2 Zentralitäten 3 EIGENVEKTORRANKING

vV

(d.h. s bewertet ausschließlich die Struktur des Graphen) und

• ∀ G= (V,E)

K

und ZusammenhangskomponentenC= (VC,EC)⊆G s(G)v·s(C)w=s(C)v·s(G)w

v,wVC

(d.h. s ist konsistent).

Ein (Knoten-)Strukturindex ist also eine Funktions, die jedem Knoten vV eines GraphenG= (V,E)einen positiven Eintrag in einem Vektor zuordnet.

Bemerkung. Diese Definition gilt analog auch für Kantenstrukturindizes.

Für diese Arbeit interessant sind im Wesentlichen nur Knotenstrukturindizes, da ei- ne Rangfolge von Knoten ein spezieller Knotenindex ist. Sinnvolle Strukturindizes nennen wir Zentralitäten, und wir stellen folgende Mindesanforderungen.

Definition. Ein Strukturindex c auf einer unter Hinzufügen von Kanten abgeschlos- senen Klasse

K

von Multigraphen heißt Zentralität, falls eine der drei folgenden BedingungenG= (V,E)∈

K

undv,wV gilt.

WennxV

c(G)vc(G)x =⇒ C(G+ (v,w)vc(G+ (v,w))x

gilt, so nennen wir c eine Einflusszentralität7.vprofitiert von einer Kante (v,w) mehr als jeder andere Knoten.

WennxV

c(G)wc(G)x =⇒ C(G+ (v,w)wc(G+ (v,w))x

gilt, so nennen wir c eine Erreichbarkeitszentralität. w profitiert von einer Kante (v,w) mehr als jeder andere Knoten.

7„Einflusszentralität” wird hier als Überbegriff für alle Zentralitäten mit dieser Eigenschaft verwendet und nicht im Sinne der 1953 von KATZdefinierten Einflusszentralitätci= k=1·A)k

·1

(34)

WennxV

c(G)v+c(G)wc(G)x =⇒ C(G+ (v,w)v+C(G+ (v,w)wc(G+ (v,w))x

gilt, so nennen wir c eine Vermittlungszentralität.v und w (in ihrer Summe) profitieren von einer Kante (v,w) mehr als jeder andere Knoten.

Beispiele

In sozialen Netzwerken, in denen gerichtete Kanten für Einflussmöglichkeiten von Personen auf andere stehen, ist eine Einflusszentralität ein sinnvolles Maß, mit dem Personen nach ihrer Wichtigkeit bewertet werden können.

Im World Wide Web, in dem gerichtete Kanten Links symbolisieren, ist die Erreich- barkeitszentralität sinnvoll. Das Gleiche gilt für ein Fußballspielenetzwerk, in dem gerichtete Kanten von A nach B von Mannschaft B gegen Mannschaft A erzielte Punkte bedeuten.

In geografischen Netzwerken, in denen Kanten Verkehrswege symbolisieren, ist eine Vermittlungszentralität ein sinnvolles Maß. Ein Spezialfall wären Einbahnstraßen als gerichtete Kanten.

Offensichtlich ist der Eingangsgrad eine Erreichbarkeitszentralität, der Ausgangs- grad eine Einflusszentralität und der Knotengrad eine Erreichbarkeits-, Einfluss- und eine Vermittlungszentralität.

Um die relative Wichtigkeit von Knoten in Netzwerken bezüglich unterschiedlicher Knotenindizes vergleichen zu können, müssen diese normiert werden.

Definition. Ein Knotenindex s auf

K

heißt normiert, falls

v∈V

s(G)v=1 ∀ G= (V,E)∈

K

.

3.3 Die Eigenvektorzentralität

IstAdie Adjazenzmatrix eines Graphen, in dem mit1gewichtete, gerichtete Kanten für einen Sieg, mit 12 gewichtete Kanten für ein Unentschieden und mit0gewichtete Kanten für eine Niederlage stehen, so sind die Zeilensummen∑nt=1as,tdieser Matrix

(35)

3.3 Die Eigenvektorzentralität 3 EIGENVEKTORRANKING

die Eingangsgrade der Knoten vsV. Diese sind genau die Einträge im Vektor Ax0, wenn x0=1ist. Die Eingangsgrade der Knoten entsprechen der Summe der besiegten Mannschaften.

Lemma. SeiG= (V,E)ein Multigraph,A=A(G)seine Adjazenzmatrix undAk=

a(k)s,t

s,t∈V deren k-te Potenz. Für zwei Knoten s,tV ist a(k)s,t gerade die Anzahl aller gerichteten Kantenfolgen vonsnacht der Längek.

Beweis. Durch Induktion über k: Für k =0 ist a(0)s,t = 0 für s6=t und a(0)s,t =1andernfalls. Das ist gerade die Anzahl der gesuchten Kantenfol- gen der Länge 0.

Jede Kantenfolge von s nacht der Länge k>0 endet mit einer Kante (v,t)für einvV. Davon gibt es jeweilsav,t viele, und nach Induktions- voraussetzung ista(k−1)s,v die Anzahl der gerichteten Kantenfolgen vons nachvder Längek−1. Für die Einträge vonAk=Ak−1·Agilt aber

a(k)s,t =

v∈V

a(k−1)s,v ·av,t

und damit die Behauptung.

Das heißt, ist x0=1und somit die Zeilensummen ∑nt=1as,t = (Ax0)s der MatrixA die Anzahl der vonvsbesiegten Mannschaften, so ist(A2x0)s die Anzahl der Mann- schaften, die von durchvsbesiegten Mannschaften besiegten wurden. Diese Mann- schaften wurden vonvs also quasi „indirekt” besiegt und der Vektor(A2x0)s enthält die Anzahl dieser indirekten Sieg als Einträge. [Keener93]

Dies wollen wir verallgemeinern und als Zentralitätsmaß verwenden und definieren xals normierten Vektor

x = lim

n→∞

Anx0

|Anx0|.

(36)

Der Vektor x ist gerade der durch Potenziteration ermittelte Eigenvektor zum be- tragsgrößten Eigenwertλ1der MatrixA.

Definition. Gilt für eine quadratische MatrixAund einen Vektorx A·x=λx

dann heißtx Eigenvektor von A. Ist x6=0, so heißen λ Eigenwert und (λ,x) Ei- genpaar vonA.

Diese Idee für ein Zentralitätsmaß ist sinnvoll, da ausA·c=λcfolgtc= 1λA·c, es wird also die Zentralität eines Knotens proportional zur Zentralität seiner Vorgänger definiert:

cw = 1 λ·

(v,w)∈E

cv

Der Erfolg einer FußballmannschaftAfärbt demnach auf die Mannschaften ab, die in Spielen gegenAPunkte erringen. Offensichtlich istceine Erreichbarkeitszentralität:

Von einer Kante vonA nachB profitieren nur Bund seine Nachfolger. Wegen des Proportionalitätsfaktors 1λprofitieren die Nachfolger vonBin einem geringeren Maße von solchen Kanten alsBselbst. Der Proportionalitätsfaktor 1λ lässt sich jedoch nicht ohne Weiteres angeben – es muss ihn nicht einmal immer geben.

Dass es für Adjazenzmatrizen von stark zusammenhängenden Multigraphen immer ein solches Eigenpaar(λ,x)gibt, wird im Folgenden gezeigt.

Es sei daherAdie Adjazenzmatrix eines stark zusammenhängenden Multigraphen G= (V,E). Ungleichungen, Beträge usw. von Vektoren und Matrizen sind immer komponentenweise zu verstehen.

Definition. Ein Vektorx∈RV≥0\{0}ist eineρ-pseudoharmonische Bewertung von G, falls

A·x ≥ ρx.

Lemma. IstGein stark zusammenhängender Multigraph, dann existiert ein größtes

ρ∈R>0, für das es eineρ-pseudoharmonische Bewertung vonGgibt.

Beweis. Sei

F(x) = min

v∈V : xv6=0

(Ax)v xv

definiert auf der Menge der nicht-negativen Knotenbewertungen RV≥0\{0}. Jeder nicht-negative Vektor x ist F(x)-pseudoharmonisch.

(37)

3.3 Die Eigenvektorzentralität 3 EIGENVEKTORRANKING

Da F invariant unter Multiplikation mit einem Skalar ist, genügt es zu zeigen, dass wir einen Vektoryin der Menge

P = {x∈RV : x0,

v∈V

xv=1}

angeben können, für den F(y) maximal ist. Weil P kompakt ist, würde dessen Existenz folgen, wennF aufPstetig wäre. Dies ist aber an den Rändern nicht der Fall. StattPbetrachten wir deshalb zunächst die Men- ge

P0 = (I+A)n−1·P.

Die MatrixA0= (I+A)ist die Adjazenzmatrix des MultigraphenG0, den man ausGerhält, indem man an jedem Knoten eine Schleife hinzufügt.

Da im stark zusammenhängenden Multigraphen G keine zwei Knoten einen Abstand größern−1haben können, ist die Zahl der Kantenfolgen der Längen−1zwischen zwei beliebigen Knoten inG0 echt größer als Null. Folglich sindA0 und damit auch alle Vektoren inP0 positiv. Außer- dem istP0ebenso wiePkompakt. DaFaber stetig auf ganzP0ist, nimmt F einen maximalen Wertρfür einen VektorzP0an. Durch Setzen von

yv = zv

w∈Vzw

erhalten wir auch einyPmitF(y) =F(z) =ρ. Da aber außerdem F

(I+A)n−1x

F(x) ist, gibt es keinxPmitF(x)>ρ.

Lemma. Seix eine ρ-pseudoharmonische Bewertung eines stark zusammenhän- genden Multigraphen G mit maximalem ρ∈R. Dann ist (ρ,x) ein Eigenpaar von A(G).

Beweis. Sei

σ(x) = {v : (Ax)vxv}

die Menge der nicht imρ-Gleichgewicht befindlichen Knoten, dann istx genau dann ein Eigenvektor vonA, wennσ(x) = /0. Nehmen wir nun also an,σ(x)wäre nicht leer.

Referenzen

ÄHNLICHE DOKUMENTE

In Deutschland hatten auch der Staat und nicht minder die Leitenden im Heere längst vom Kriege genug, nicht so auf der anderen Seite, und weil dort der Nationalsinn so ausgeprägt

Seitdem werden für die Berechnung der durchschnittlichen massgeben- den CO2-Emissionen einer PW-Flotte eines Grossimporteurs, sämtliche (100%) Fahr- zeuge der

Russland finde ich nicht gut, aber es lässt sich ja noch irgendwie rechtfertigen: Größtes Land der Erde, reiche Sponsoren und eine gewisse Fußballtradition (wenn

ert Berens/Marguerite Koob: Mit Erfolg und Versagen umgehen – Wünsche haben uer Verlag – AAP Lehrerfachverlage GmbH, Donauwörth.. Unterrichtseinheit 1: Der Sieg über

Der Unmut wächst, weil die Infrastruktur für Verkehr, Tourismus oder öffentliche Dienste oft nicht fertig oder Modernisierungsprojekte längst gestrichen

Neu ist in diesem Jahr das Spiel um die Bronzeme-daille – neben den Preisen für den ersten und den zweiten Platz erhält auch die oder der Drittplatzierte noch einen kleinen Preis..

Hierbei durchlaufen die 16 Teilnehmerinnen und Teilnehmer das k.O.-System – Jede und Jeder gegen Jeden.. Gespielt werden jeweils sechs Minuten

Für die Siegerin oder den Sieger winken nicht nur tolle Preise, sondern auch die Krönung zum &#34;Ersten FIFA-Champion der Stadtbibliothek&#34; .Das Turnier ist das Pilotprojekt