• Keine Ergebnisse gefunden

5.6.1 Steckbrief

Art Kumulative Schadendreiecke Haftpflicht Schweiz.

Quelle SoftwareR, PackageCASdatasets (Datensatz:swtriangles).

Datenformat Dataframe inR.

Sprache Englisch.

Verf¨ugbarkeit Installieren und Laden des Package inR.

Dateiumfang 2 Dreiecke, 10×10.

Zeithorizont Zeitunabh¨angig, 10 Schadenjahre, 10 Abwicklungsjahre (Stand: Mai 2021).

5.6.2 Beschreibung

Dieser Datensatz inR beinhaltet 2 Dreiecke mit kumulativen Daten zu Reserven und Schadenzahlungen.

5.6.3 Daten

Jede Zeile entspricht einem Schadenjahr, ¨uber die Spalten sind die Abwicklungsjahre aufgetragen. Maßeinheit ist keine gegeben.

Das Dataframe inR schaut wie folgt aus:

5.6.4 Aufrufen der Daten

Installieren der Packagessp,xts, zoo, danninstall.packages(’CASdatasets’, repos =

’http://dutangc.free.fr/pub/RRepos/’, type=’source’). Schließlich Aufrufen der Befehle library(CASdatasets) und data(swtri1auto).

5.6.5 Bemerkungen

Weitere Daten zu Schadendreiecken sind in diesem Package mittels folgender Befehle aufzurufen:

ˆ data(sgautoprop9701), data(sgautoBI9301): Singapur, 2 Dreiecke, Kfz-Haftpflicht, inkrementelle Zahlungen.

ˆ data(nortritpl8800): Norwegen, 5 Dreiecke, Personensch¨aden, kumulative Zahlungen und Schadenanzahl.

ˆ data(fretri1auto9605), data(fretri2auto9605), data(fretri3auto9605), data(fretri4auto9403): fretriXautoYYZZ beinhaltet das Dreieck zur Xth line of business von YY bis ZZ. F¨ur jeden der 4 Datens¨atze gibt es 3 ×2 Dreiecke, Reserve und Schadenzahlung f¨ur Sachschaden, Personenschaden und Totalschaden.

5.6.6 Literatur

Der Datensatz kommt u.a. vor in Estimation of Tail Development Factors in the Paid-Incurred Chain Reserving Method, [MW13].

27

6 Reiseversicherung

Dateiumfang 63.326 Zeilen, 11 Spalten (4,36 MB).

Zeithorizont k.A. (Stand: Mai 2021).

6.2 Beschreibung

Dieser Datensatz auf Kaggle beinhaltet Informationen zu Vertr¨agen einer Reiseversicherung aus Singapur. Dieser anonyme Datensatz umfasst unterschiedliche Vertragstypen bei verschiedenen Reiseagenturen und besitzt neben 10 Kovariablen eine Spalte mit Schaden eingetroffen oder nicht. Der Datensatz ist online einsehbar oder steht als csv-Datei zum Download bereit.

6.3 Daten

Die 63326 Vertr¨age werden durch folgende 11 Spalten klassifiziert:

ˆ Agency: Reiseagentur.

ˆ Agency type: Agenturentyp (Reise oder Airline).

ˆ Distribution channel: Vertrieb, online oder offline.

ˆ Product Name: Typ der Versicherung.

ˆ Claim: Schaden, ja/nein.

ˆ Duration: Reisedauer.

ˆ Destination: Reiseziel.

ˆ Net Sales: Keine genauere Angabe an dieser Stelle.

ˆ Commision (in value): Kommission an die Agentur.

ˆ Gender: Geschlecht der versicherten Person.

ˆ Age: Alter der versicherten Person.

Die Daten schauen (online) wie folgt aus:

6.4 Bemerkungen

Die Angaben zum Geschlecht sind sehr l¨uckenhaft (71% der Angaben fehlen bei dieser Variable).

6.5 Literatur

Der Datensatz kommt in mehreren Notebooks auf Kaggle vor. Zu finden ist die Liste dieserhierauf Kaggle.

29

7 Allgemeine Branchendaten deutscher Versicherungsmarkt

7.1 Steckbrief

Art Allgemeine Daten zur Versicherungswirtschaft in Deutschland.

Quelle GDV,Zahlen und Fakten.

Datenformat CSV/Excel.

Sprache Deutsch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang Zahlreiche Tabellen kleinen Umfangs.

Zeithorizont Letzte Jahre/letztes Jahr, je nach Datensatz auch ¨altere Daten (Stand: Mai 2021).

7.2 Beschreibung

Die Webseite der GDV stellt j¨ahrlich aktualisierte Daten zur Versicherungsbranche zur Verf¨ugung. Diese umfassen die Gebiete Branchendaten, Lebensversicherung, Schaden- und Unfallversicherung und Kfz-Versicherung. Es han-delt sich dabei um aggregierte Daten der GDV-Mitgliedsunternehmen aus dem letzten Jahr oder der letzten Jahre.

Hierbei sei erw¨ahnt, dass der Gesamtverband der Deutschen Versicherungswirtschaft (GDV) die Dachorganisation der privaten Versicherer in Deutschland ist und rund 460 Mitglieder mit fast 446 Millionen Versicherungsvertr¨agen umfasst.

Auf der GDV-Seite steht hier das Statistische Taschenbuch der Versicherungswirtschaft Jahr XXXX zum Pdf-Download zur Verf¨ugung. Der Inhalt ist hier etwas granularer als in den csv-Tabellen. Sollte der Link nicht funk-tionieren, ist das Pdf unterZahlen und Fakten - Publikationen zu finden.

7.3 Daten

In der folgenden Auflistung seien die Daten samt Unterkategorien aufgelistet, welche auf der GDV-Seite zu fin-den sind. Die meisten Kennzahlen beziehen sich auf das Vorjahr, an manchen Stellen sind l¨angere Zeithorizonte abgedeckt.

ˆ Branchendaten:

– Uberblick: Beitragsdaten, Anzahl Vertr¨¨ age.

– Versicherer: VU nach Sparten und Standorten.

– Erwerbst¨atige: Daten zu Besch¨aftigten in VU.

– Kapitalanlagen.

– Internationale M¨arkte: St¨arkste Marktanteile nach L¨andern.

ˆ Lebensversicherung:

– Uberblick: Generelle Kennzahlen.¨

– Renten- und Kapitalversicherungen: Beitrags- und Vertragszahlen.

– Risikoversicherung.

– Riester- und Basisrenten: Beitr¨age und Vertr¨age, letzte 10 Jahre.

– Betriebliche Altersversorgung: Best¨ande und Beitr¨age verschiedener Altersversorgungsfonds.

– Kapitalanlagen: Struktur und Nettoverzinsung.

ˆ Schaden- und Unfallversicherung:

– Uberblick: Kennzahlen zu unterschiedlichen Versicherungssparten.¨

– Wohngeb¨aude, Hausrat, Elementarschaden, Haftpflicht, Rechtsschutz, Kreditversicherung, Unfall, Nicht-Private Sach, Transport und Luftfahrt, Directors-and-Officers.

ˆ Kfz-Versicherung:

– Uberblick: Beitr¨¨ age, Leistungen und Schaden-Kosten-Quoten verschiedener Kfz-Versicherungstypen.

– Autodiebstahl: Nach Marke, Modell, Bundesland und Fahrzeugart.

– Schadenarten.

Als Beispiel, wie die Daten (online) ausschauen, sei hier an einer von drei Tabellen des Unterbereichs Hausratver-sicherung gezeigt:

7.4 Bemerkungen

Bei den Daten, die auch als csv-Dateien runtergeladen werden k¨onnen, sind auf der GDV-Seite jeweils Fußnoten und Quellen zu den einzelnen Tabellen zu finden.

Das statistische Taschenbuch der Versicherungswirtschaft steht ebenso in englischer Sprache zur Verf¨ugung. Hier kann es bei den verschiedenen Sprachen zu Unterschieden im Datum der Herausgabe kommen.

31

8 Datenpannen (Cyberrisiken)

8.1 Steckbrief

Art Daten zu Datenpannen in den USA.

Quelle Privacy Rights Clearinghouse,Datenpannen.

Diese Webseite stellt eine Auflistung von Datenpannen in den USA zur Verf¨ugung. U.A. beinhaltet der Datensatz Informationen zur Art der Datenpanne und eine genauere Beschreibung des Vorfalls. Daher ist die csv-Datei sehr textlastig und teilweise etwas unvorteilhaft formatiert (Zeilenspr¨unge, mehrere Zeilen f¨ur einen Datenpunkt etc.).

Dessen sollte man sich bei der Nutzung bewusst sein.

8.3 Daten

Hier folgend seien die Spalten des Datensatzes genauer erkl¨art.

ˆ Date made public: Datum der Ver¨offentlichung der Panne.

ˆ Company: Betroffenes Unternehmen (manche in Anf¨uhrungszeichen gelistet, manche nicht).

ˆ City, State: Ort des Unternehmens.

ˆ Type of breach:

– CARD: Nicht gehackter Kartenbetrug (z.B. am Automaten).

– HACK: Von außen gehackt oder von Malware/Schadsoftware infiziert.

– INSD: Datenpanne von Insider kommend (Mitarbeiter, Kunde etc.).

– PHYS: Verlorene oder gestohlene physische Materialien (z.B. Papierdokumente).

– PORT: Tragbares Ger¨at, verloren, gestohlen o. ¨A. (z.B. Laptop).

– STAT: Station¨are Computerpanne (nicht mobiler Computer, z.B. kein Laptop).

– DISC: Ungewollte Ver¨offentlichung (z.B. ausversehen ver¨offentlicht, verschickt etc.).

– UNKN: Unbekannte Datenpanne.

– MED: Gesundheitswesen/-¨amter/-unternehmen.

– NGO: Non-profit Unternehmen.

– UNKN: Unbekannt.

ˆ Total Records: Datens¨atze/Aufzeichnungen (Zahl, mit oder ohne Anf¨uhrungszeichen).

ˆ Description of incident: Detailliertere Beschreibung der Panne, teilweise l¨angeres Textfeld.

ˆ Information Source, Source URL: Quelle.

ˆ Year of Breach, Latitude, Longitude: Weitere Angaben zur Panne und deren Unternehmen.

Damit eine Vorstellung des Datensatzes gewonnen werden kann, hier ein kleiner Ausschnitt:

8.4 Bemerkungen

Die Seite wurde (Stand Mai 2021) ¨uberarbeitet, daher kann es sein, dass der Link im Steckbrief veraltet ist.

8.5 Literatur

Der Datensatz wird u.A. in folgendem Paper benutzt:Cyber Risk Management: an actuarial point of view, [Car+19].

33

9 Risikokapitalberechnung unter Solvency II

9.1 Steckbrief

Art Daten aus einem DAV Use Case zur SCR-Berechnung.

Quelle Aktuar.de,Use Case,Github mit Daten.

Datenformat CSV.

Sprache Deutsch/Englisch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang 8 csv-Dateien pro 3 Portfolios, insgesamt ca. 30 MB.

Zeithorizont Fiktiv, f¨ur diesen Use Case erzeugt. (Stand: Mai 2021).

9.2 Beschreibung

In der Fallstudie wird bei der SCR-Berechnung unter Solvency II der klassische Least Squares Monte Carlo-Ansatz mit neuronalen Netzen verglichen. Hierf¨ur wurden realistische Projektionsdaten von drei im Rahmen dieses Use Case aufbereiteten Lebensversicherungs- und Krankenversicherungsportfolios erzeugt. Die genaue Beschreibung der Fallstudie ist unter dem im Steckbrief aufgef¨uhrten Link zu finden.

Die f¨ur die Fallstudie generierten Datens¨atze sind 8 pro Portfolio, wovon es wiederum 3 gibt. Man sollte im Hinterkopf behalten, dass es sich um Datens¨atze handelt, welche f¨ur eine Anwendung eines neuronalen Netzwerkes hergenommen werden.

9.3 Daten

Im Folgenden werden die Datens¨atze pro Portfolio genauer erkl¨art.

ˆ train input.csv, train result.csv: Fitting-Datenset f¨ur das Training. Ungenaue Auswertungen der Bilanzposi-tionen von einer Vielzahl von Risiko-Szenarien. Own Funds (Output) als Teil der gestressten Marktwertbilanz in den entsprechenden Szenarien.

ˆ validation input.csv, validation result.csv: Zur ¨Uberpr¨ufung der G¨ute der Trainingsresultate gibt es dieses sogenannte Out Of Sample Validation Set bestehend aus 256 Szenarien.

ˆ stderror validation.csv: F¨ur jedes Szenario der Standardfehler als Maß f¨ur die Ungenauigkeit des zugrundelie-genden Sch¨atzers.

ˆ nested input.csv, nested result.csv: Alternativer Validationsdatensatz.

ˆ stderror nested.csv: Standardfehler dieser letzteren Validierung.

Als Beispielsdatensatz ist hier ein Ausschnitt des validation input.csv-Datensatzes aufgef¨uhrt:

9.4 Literatur

Der Datensatz wird wie weiter oben erw¨ahnt in der DAV-Fallstudie verwendet, diehierzu finden ist.

35

10 Kreditdaten Deutschland

10.1 Steckbrief

Art Deutscher Kredit-Datensatz.

Quelle data.world.

Datenformat CSV oder Dataframe inR.

Sprache Englisch.

Verf¨ugbarkeit Registrierung notwendig.

Dateiumfang 1000 Zeilen, 21 Spalten, 14 KB.

Zeithorizont Keine Angabe (Stand Mai 2021).

10.2 Beschreibung

Dieser Datensatz klassifiziert mittels einer Reihe an Attributen Kunden als gute oder schlechte Kreditrisiken. Es werden datensatzinterne Schl¨ussel zur Beschreibung der Kategorien verwendet, weshalb es notwendig ist, unter dem verwiesenen Link die Bezeichnung dieser Kategorien nachzulesen (siehe z.B. die ’A-Werte’ im Screenshot).

10.3 Daten

Das Dataframe umfasst 1000 Datenpunkte und 21 Variablen, von denen einige im Folgenden genauer erl¨autert werden (f¨ur die weiteren Variablen sei auf die angegebene Quelle verwiesen):

ˆ checking status: Status des Girokontos.

ˆ duration: Dauer des Kredits in Monaten.

ˆ credit history: Angabe ¨uber R¨uckzahlungen in der Vergangenheit.

ˆ purpose: Verwendung des Kredits (z.B. Autokauf, Urlaub, etc.).

ˆ credit amount: Kredith¨ohe in DM.

ˆ installment rate: Anzahl Zahlungsraten.

ˆ personal status: Angabe ¨uber Geschlecht und Zivilstand des Kreditnehmers.

ˆ housing: Wohnzustand.

ˆ job: Arbeitsverh¨altnis.

ˆ class: kreditw¨urdig ja/nein (0/1).

Die csv-Datei schaut wie folgt aus:

10.4 Bemerkungen

Beim Download des Datensatzes wird eine weitere csv-Datei runtergeladen, welche sich dann f¨ur Algorithmen eig-net, die numerischer Variablen bed¨urfen.

Dieser Datensatz ist auch Teil desR-PackagesCASdatasets, worunter zahlreiche versicherungstechnische Datens¨atze enthalten sind. Einige davon sind in diesem Dokument gelistet, die vollst¨andige Auflistung isthierzu finden.

Aufrufen der Daten:Installieren der Packagessp,xts,zoo, danninstall.packages(’CASdatasets’, repos =

’http://dutangc.free.fr/pub/RRepos/’, type=’source’). Schließlich Aufrufen der Befehle library(CASdatasets) und data(credit).

10.5 Literatur

Der Datensatz wird u.A. in folgendem Buch benutzt:Data Mining and Statistics for Decision Making, [Tuf11].

37

11 Schadenf¨ alle Autoversicherung (Insurance Claims)

11.1 Steckbrief

Art Schadenf¨alle in der Autoversicherung mit F¨ulle an Kovariablen.

Quelle Kaggle,Daten.

Datenformat CSV.

Sprache Englisch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang 1000 Zeilen, 39 Spalten, 260,7 KB.

Zeithorizont Januar-Februar 2015 (Stand Mai 2021).

11.2 Beschreibung

Zum Datensatz geh¨oren Schadenf¨alle aus der Autoversicherung einzelner US-Bundesstaaten, n¨amlich Indiana, Ohio und Illinois. Enthalten ist eine große Menge an Variablen inklusive Schadensumme. W¨ahrung ist keine angegeben, vermutlich handelt es sich um US Dollar.

11.3 Daten

Der Datensatz umfasst 1000 Datenpunkte und 39 Variablen, von denen einige im Folgenden aufgelistet bzw. genauer erl¨autert werden (f¨ur die weiteren Variablen sei auf die angegebene Quelle verwiesen):

ˆ months as customer: Anzahl Monate als Kunde.

ˆ age: Alter zwischen 19 und 64, ann¨ahernd normalverteilt.

ˆ policy number, policy state.

ˆ policy deductible: Selbstbehalt, zwischen 500 und 2000.

ˆ policy annual premium (ann¨ahernd normalverteilt), insured sex.

ˆ umbrella limit: Manche Vertr¨age beinhalten eine Schadensobergrenze.

ˆ insured educational level: (Ausbildungs-)Abschluss des Versicherten, 7 verschiedene Kategorien.

ˆ insured occupation: Beruf des Versicherten, 14 Kategorien.

ˆ insured hobbies, insured relationship, incident date.

ˆ incident type, collision type: Diebstahl, Einzelunfall, Unfall mit mehreren Fahrzeugen, geparktes Auto und f¨ur Unfall Art des Aufpralls.

ˆ incident severity (4 Kategorien), authorities contacted, number of vehicles involved, property damage (Ja/Nein/kA), bodily injuries, witnesses

ˆ incident state, incident city, incident location: Ort des Schadenfalles.

ˆ total claim amount, injury claim, property claim, vehicle claim, auto make, auto model, auto year.

Die umgeformte csv-Datei schaut wie folgt aus:

11.4 Bemerkungen

Die Spalten collision type, property damage und police report available weisen vereinzelt L¨ucken auf.

11.5 Literatur

Der Datensatz kommt in mehreren Notebooks auf Kaggle vor. Zu finden ist diese Liste dieserhier auf Kaggle.

39

12 Wahrscheinlichkeitstafeln PKV

12.1 Steckbrief

Art Wahrscheinlichkeitstafeln in der privaten Krankenversicherung.

Quelle BaFin,Daten.

Datenformat Excel/CSV.

Sprache Deutsch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang 4 Exceltabellen, 1 PDF-Datei, insgesamt 597,7 KB f¨ur 2018.

Zeithorizont 2002-2018 (Stand Mai 2021).

12.2 Beschreibung

Die Statistiken der BaFin enthalten u.A. genauere Daten zu Wahrscheinlichkeitstafeln und Schadenh¨ohen in der privaten Krankenversicherung. Dabei werden zu Ambulant-, Station¨ar-, Zahn- und Krankentagegeldtarifen Grund-kopfsch¨aden und Profile j¨ahrlich ver¨offentlicht. Getrennt wird hierbei nach Geschlecht, Schwangerschaft und Mut-terschaft ja/nein und Beamte ja/nein. Zudem werden Stornotafeln zur PKV und GKV ver¨offentlicht.

Die Daten sind f¨ur das Jahr 2018 beispielsweise in 3 Excel-Tabellen zu finden, dazu gibt es eine Datei, welche die Variablen- und Spaltenerkl¨arungen sowie weitere Erl¨auterungen liefert. Des Weiteren ist eine PDF-Datei zu finden, welche Grafiken der Datenreihen aus der DateiKRAWATTE 2018 Tafeln komplett.csv enth¨alt.

12.3 Daten

Im Folgenden werden kurz die Dateien aus dem verf¨ugbaren Zip-Ordner beschrieben:

ˆ Erl¨auterungen.xlsx: Enth¨alt Informationen zu den anderen Dokumenten und Erl¨auterungen der Spalten/Variablen.

ˆ KRAWATTE 2018 fSB ambulant.csv: Fiktive Selbstbehalte der Tafeln f¨ur den Ambulantbereich.

ˆ KRAWATTE 2018 GKS komplett.csv: Einj¨ahrige Grundkopfsch¨aden aller Tafeln.

ˆ KRAWATTE 2018 Tafeln komplett.csv: Normierte Profile, normierte rohe Kopfsch¨aden, Kopfschadenreihen und Best¨ande f¨ur alle Tafeln.

ˆ KRAWATTE Kopfschadenreihen mit GKS 2018: Grafische Visualisierung der Tafeln aus der DateiTafeln komplett.

Als Beispiel sei hier ein Ausschnitt der DateiTafeln komplett gezeigt:

In der obersten Zeile (=Spaltenbeschriftung) sind hierbei verschiedene Kennzahlen zu den unterschiedlichen Lei-stungsarten gegeben.

12.4 Literatur

Der Datensatz kommt u.A. im Artikel Beitragsentwicklung und Verteilungseffekte der RfB in PKV-Best¨anden, [Neu16], vor.

12.5 Bemerkungen

Zur privaten Krankenversicherung gibt es weitere Quellen, die j¨ahrlich Fakten und Zahlen herausgeben. Mit dazu z¨ahlt auch der Verband der Privaten Krankenversicherung selbst (PKV), der j¨ahrlich einen Zahlenbericht zu ¨uber 100 Seiten im PDF-Format herausgibt. Darin zu finden sind ein ¨Uberblick der Branche, Versicherungsbest¨ande, Ertr¨age, Aufwendungen, Statistiken zur Tarifkalkulation und diverse Zeitreihen verschiedener Kennzahlen. Der Bericht isthierzu finden. Dabei ist eine Anmeldung notwendig, die Nutzung der Daten ist weiterhin kostenlos.

41

13 Statistik Erstversicherungsunternehmen Deutschland

13.1 Steckbrief

Art Statistik der BaFin - Erstversicherungsunternehmen.

Quelle BaFin,Daten.

Datenformat xlsx-Dateien/PDF.

Sprache Deutsch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang 6 Exceltabellen, mehrere Tabellenbl¨atter, 1 PDF-Datei (75 Seiten in 2019), ges. ca. 3-4 MB/Jahr.

Zeithorizont 2001-2019 (Stand Mai 2021).

13.2 Beschreibung

Unter den Statistiken der BaFin finden sich auch eine Reihe an Datens¨atzen zu deutschen Erstversicherungsunter-nehmen und Pensionsfonds. Einer allgemeinen Erstversicherungsstatistik stehen spezifischere Tabellen pro Sparte gegen¨uber. Die Daten werden jedes Jahr herausgegeben, in Excel- und im PDF-Format.

13.3 Daten

Im Folgenden werden kurz die Dateien beschrieben, die jedes Jahr erscheinen:

ˆ BaFin-Erstversicherungsstatistik: Enth¨alt eine Liste zu den Versicherungsunternehmen und Pensionsfonds unter Bundesaufsicht mit Angabe ¨uber Ort des VU und Bruttobeitr¨age. U.A. ist eine Zusammensetzung der Kapitalanlagen pro Sparte gegeben (siehe Beispiel).

ˆ Lebensversicherung, Pensionskassen, Krankenversicherung, Schaden- und Unfallversicherung, Pensionsfonds:

Zu all diesen Sparten sind in separaten Exceltabellen auf mehreren Tabellenbl¨attern aggregierte Kennzahlen gegeben.

ˆ Gesamtausgabe PDF: Daten zur Gesamtentwicklung, zu den einzelnen Sparten u.A. Beitrags- und Bestand-sentwicklung, R¨uckstellungen, Ertragslage, Eigenkapitalausstattung, Solvibilit¨at.

13.4 Beispiele

Als Beispiel sei hier die Zusammensetzung der Kapitalanlagen aus der DateiErstversicherungsstatistik gezeigt:

Als weiteres Beispiel seien ausgew¨ahlte Kennzahlen der Lebensversicherungsunternehmen aus der Datei Lebensver-sicherungsunternehmen aufgef¨uhrt:

13.5 Literatur

Der Datensatz kommt u.A. im ArtikelDas System der betrieblichen Altersversorgung in Deutschland, [CF15], vor.

43

14 Social Policy and Law Shared Database (SPLASH)

14.1 Steckbrief

Art Sammlung ¨okonomischer und demographischer Daten, international.

Quelle SPLASH,Daten.

Datenformat Sehr heterogen.

Sprache Englisch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang Ansammlung vieler Datenquellen und -verlinkungen.

Zeithorizont Nach Datensatz unterschiedlich (Stand Mai 2021).

14.2 Beschreibung

Diese Website ist eine Ansammlung verschiedener ¨okonomischer und demographischer Datens¨atze. Dabei werden Datens¨atze klassifiziert, kurz beschrieben und verlinkt. Die Kategorien sind

ˆ Demographic Indicators,

Um einen Eindruck der Gestaltung der Website zu bekommen, seien hier 3 Ausschnitte aufgef¨uhrt, zun¨achst die Ausgabe einer allgemeinen Suchabfrage, dann ein genauer beschriebener Datensatz in 2 Grafiken:

45

15 Globale Entwicklungsdaten

15.1 Steckbrief

Art Globale Daten zu Entwicklung und Armut.

Quelle The World Bank,Data Bank.

Datenformat Excel, CSV oder Tabbed TXT.

Sprache Englisch.

Verf¨ugbarkeit Keine Registrierung notwendig.

Dateiumfang 79 Datens¨atze/Indikatoren.

Zeithorizont 1960-2020, L¨ucken vorhanden, Aktualisierungsdatum unterschiedlich (Stand: Mai 2021).

15.2 Beschreibung

Die Weltbank (World Bank), eine multinationale Entwicklungsbank, stellt auf der oben verlinkten Website globale Entwicklungsdaten jeglicher Art zur Verf¨ugung. Die Datenbanken werden teilweise nicht j¨ahrlich aktualisiert und enthalten unter Umst¨anden L¨ucken.

In den verschiedenen Datens¨atzen gibt es unterschiedliche Variablen, die auch ausf¨uhrlich beschrieben werden.

15.3 Daten

Zu den Datenbanken z¨ahlen unter anderem

ˆ World Development Indicators (Weltweite Entwicklungsindikatoren),

ˆ Education Statistics (Ausbildungsstatistiken),

ˆ Health Nutrition and Population Statistics (Ern¨ahrungs- und Bev¨olkerungsstatistiken),

ˆ Jobs (Arbeitsstatistiken Arbeitnehmer, Unternehmen, etc.),

ˆ Worldwide Governance Indicators (politische Stabilit¨at, Korruption, Regulatorien, etc.),

ˆ Africa Infrastructure, und viele weitere.

15.4 Beispiele

Als Beispiel wird hier der DatensatzWorld Development Indicatorsaufgef¨uhrt. Dieser enth¨alt ¨uber 1400 Zeitreihen pro Land/L¨andergruppe zu mehreren Perioden. Die im Beispiel ausgew¨ahlten Kategorien sind den beiden Bildaus-schnitten bzgl. Mali und Europ¨aischer Union zu entnehmen.

47

16 Insurance Fact Book

16.1 Steckbrief

Art Globale und US-spezifische Versicherungsdaten.

Quelle Insurance Information Institute,Daten 2019.

Datenformat PDF.

Sprache Englisch.

Verf¨ugbarkeit Keine Registrierung notwendig (f¨ur 2020-Version Registrierung notwendig).

Dateiumfang 2019-Version: 236 Seiten, 15,3 MB.

Zeithorizont 2017-2018 (Version 2019).

16.2 Beschreibung

Dieses

”Faktenbuch“ wird j¨ahrlich vomInsurance Information Institute herausgegeben. Es enth¨alt zahlreiche ag-gregierte Versicherungsdaten, prim¨ar zum US-amerikanischen Versicherungsmarkt, teilweise unterteilt nach Bun-desstaat.

16.3 Daten

Die zahlreichenden Tabellen enthalten u.A. Informationen zu

ˆ Globalen und US-spezifischen Katastrophen,

ˆ Ergebnisse und Investments zur P&C und Lebens-/Krankenversicherung,

ˆ Schadenstypen,

ˆ R¨uckversicherungsdaten,

ˆ Pensionsversicherungen.

16.4 Beispiele

Als Beispiel seien hier zwei Ausschnitte gezeigt, einer zu den gr¨oßten US-amerikanischen Lebensversicherungen gemessen an den direkten Pr¨amien, und der andere zu den Sch¨aden in der Kfz-Privatversicherung.

16.5 Bemerkungen

Insurance Factbooks gibt es auch weitere, hier sind noch welche aufgelistet:

ˆ Kanadischer Versicherungsmarkt,

ˆ US-amerikanische Lebensversicherungsdaten, ACLI (American Council of Life Insurers).

49

Literaturverzeichnis

[Car+19] Maria Francesca Carfora et al. “Cyber risk management: an actuarial point of view”. In: Journal of Operational Risk 4.14 (2019). webpage, pp. 77–103.

[CF15] Johannes Clemens and Till F¨orstemann. “Das System der betrieblichen Altersversorgung in Deutsch-land”. In:Wirtschaftsdienst 95 (2015).webpage, pp. 627–635.

[HDJ08] Gillian Heller and Piet De Jong.Generalized Linear Models for Insurance Data.Link zum Buch. Cam-bridge University Press, 2008.isbn: 13 978-0-511-38677-0.

[JE09] Thomas H. Jagger and James B. Elsner. “Modeling tropical cyclone intensity with quantile regression”.

In:International Journal of Climatology 29.10 (2009).webpage, pp. 1351–1361.

[KM05] Cooray Kahadawala and M.A. Ananda Malwane. “Modeling actuarial data with a composite lognormal-Pareto model”. In:Scandinavian Actuarial Journal 5 (2005).webpage, pp. 321–334.

[MG16] Tatjana Miljkovic and Bettina Gr¨un. “Modeling loss data using mixtures of distributions”. In:Insurance:

Mathematics and Economics 70 (2016).webpage, pp. 387–396.

[MW13] Michael Merz and Mario V. W¨uthrich. “Estimation of Tail Development Factors in the Paid-Incurred Chain Reserving Method”. In:Variance1.7 (2013).pdf, pp. 61–73.

[Neu16] Thomas Neusius. “Beitragsentwicklung und Verteilungseffekte der RfB in PKV-Best¨anden”. In: Zeit-schrift f¨ur die gesamte Versicherungswissenschaft 105 (2016).Artikel, pp. 171–190.

[Ram15] Andres M. Villegas Ramirez. “Mortality: Modelling, Socio-Economic Differences and Basis Risk”.pdf.

PhD thesis. City University London, 2015.

[RR19] Stefan Roth and Gunther Reinhart. “Risikomanagement in der energieorientierten Produktionsplanung und -steuerung”. In:Zeitschrift f¨ur wirtschaftlichen Fabrikbetrieb 114 (2019).webpage, pp. 823–.

[Tuf11] St´ephane Tuff´ery.Data Mining and Statistics for Decision Making. Link zum Buch. Wiley, 2011.isbn: 978-0-470-97916-7.

[Zaj96] Daniel Zajdenweber. “Extreme Values in Business Interruption Insurance”. In:The Journal of Risk and Insurance 63.1 (1996).webpage, pp. 95–110.