• Keine Ergebnisse gefunden

Finiter versus Asymptotischer Sch¨ atzer

In diesem letzten Teil kontrollieren wir die Asymptotik anhand von Resultaten f¨ur finite Stichproben.

In Fall eindimensionaler Lokation bzw. einfacher Regression gibt es von Hu-ber (1968) bzw. Rieder (1989) eine exakte finite4 minimax Theorie, die auf ro-busten Tests f¨ur spezielle Kapazit¨aten basiert. Dieser Ansatz erfordert eine spezielle Pseudo-Verlustfunktion in Gestalt von Unter-/ ¨Uberschusswahrscheinlichkeiten und liefert minimax Optimalit¨at unter beliebigen Sch¨atzern. Jedoch scheint er auf einen reellen Lokations- bzw. Regressionsparameter beschr¨ankt zu sein. Der entsprechen-de asymptotische minimax Sch¨atzer f¨ur diese spezielle Pseudo-Verlustfunktion wur-de in Rieder (1980) f¨ur die Klasse asymptotisch linearer Sch¨atzer und in Rieder (1981a) f¨ur die Klasse beliebiger Sch¨atzer hergeleitet. Daher kann die Asymp-totik anhand von Resultaten f¨ur finite Stichproben und Kontaminations- sowie To-talvariationsumgebungen fester Gr¨oße ¨uberpr¨uft werden. Der Vergleich zwischen asymptotischen und finiten Resultaten erfordert jedoch die Berechnung der exak-ten finiexak-ten Risiken. Die analytische Berechnung finiter Risiken erweist sich als sehr schwer oder sogar unm¨oglich f¨ur Stichprobenumf¨ange n ≥ 3 . Daher haben wir einen Algorithmus konzipiert, der auf der schnellen Fourier Transformation (FFT) beruht, und mit dem die exakte finite Verteilung (und die entsprechenden finiten Risiken) dieser in unterschiedlicher Weise robusten Sch¨atzer bestimmt werden kann.

Zwei interessante Ergebnisse sind: Die (erste Ordnungs-) Asymptotik ist zu optimistisch und die Konvergenz gegen die asymptotischen Werte ist besser im Fall der Totalvariationsumgebungen als im Fall der Kontaminationsumgebungen.

Wir geben nun einen kurzen ¨Uberblick ¨uber die finite und die asymptotische minimax Theorie.

Hubers (1968) Ansatz

Huber(1968) betrachtet eindimensionale Lokation und setzt Kontaminations-/To-talvariationsumgebungen fester Gr¨oße ein. Auf der Basis einer minimax Testtheorie f¨ur spezielle Kapazit¨aten, die inHuber(1965) entwickelt wurde, leitet er eine finite minimax L¨osung her, welche die maximale Wahrscheinlichkeit, dass der Sch¨atzer den wahren Wert des Parameters um mehr als eine feste Konstante ¨ubersteigt bzw. unterschreitet, minimiert. Wir nennen diese Pseudo-Verlustfunktion Unter-/ ¨Uberschuss Konfidenzrisiko. Eine Zusammenfassung dieser Resultate findet sich auch in Kapitel 10 vonHuber(1981).

Im Fall eindimensionaler normaler Lokation und Stichprobenumfang n= 2 ist Hu-ber(1964) in der Lage, das finite Unter-/ ¨Uberschuss Konfidenzrisiko analytisch zu bestimmen. Seine Ergebnisse f¨ur die normale Lokation werden durch unsere ana-lytischen und numerischen Berechnungen, die in den Abschnitten 11.3 und 11.4 angegeben sind, best¨atigt und erweitert.

4d.h., im Kontext finiter Stichproben

xxvii

Rieders (1989) Ansatz

Rieder (1989) dehnt die Resultate von Huber (1968) auf die einfache lineare Re-gression durch den Ursprung aus, wobei der Regressor zuf¨allig ist und er zwei Arten von fixierten Umgebungen einsetzt: unbedingte (“Fehler in den Variablen”) und be-dingte (“fehlerfreie Variablen”) Kontaminations-/Totalvariationsumgebungen. F¨ur den Spezialfall von endlich vielen deterministischen Regressoren und bedingten Umgebungen wurde eine vorl¨aufige Erweiterung vonHuber(1983) angedeutet.

Im Fall normaler Fehler und unbedingter Umgebungen entspricht der finite mini-max Sch¨atzer dem Hampel-Krasker Sch¨atzer. Dies widerspricht der Vermutung vonHuber(1983) (vgl. Abschnitte 1, 7 und Erwiderung), dass der Hampel-Krasker Sch¨atzer keine Optimalit¨at besitzt in dem Fall, dass “Fehler in den Variablen” vor-liegen. Außerdem treten im Fall von normalen Fehlern und bedingten Umgebungen sowohl der Hampel-Kraker als auch der Huber Sch¨atzer als minimax L¨osungen f¨ur geeignet gew¨ahlte Kontaminationskurven auf.

Rieders (1980) und (1981) Ansatz

Die asymptotische Entsprechung der Resultate f¨ur finite Stichprobenumf¨ange, die oben angegeben sind, wurde in Rieder (1980) unter Verwendung von Resultaten aus der robusten asymptotischen Testtheorie (vgl.Rieder(1978)) hergeleitet. Um diese Resultate zu erhalten, wird vorausgesetzt, dass die Gr¨oße der Kontaminations-/Totalvariationsumgebungen sowie die Breite des betrachteten Konfidenzintervalls mit der Rate √

n schrumpfen.

Im Gegensatz zu den finiten Resultaten sind die Resultate, die in Rieder (1980) angegeben sind, auf einen beliebigen Parameter anwendbar. Insbesondere lassen sich diese auf lineare Regression mit zuf¨alligen Regressoren und unbedingten Konta-minations-/Totalvariationsumgebungen anwenden.

Indem man das asymptotische Unter-/ ¨Uberschuss Konfidenzrisiko uniform auswer-tet, werden supereffiziente Sch¨atzer nicht aufgrund von speziellen Annahmen, son-dern durch ein hohes maximales Risiko ausgeschlossen. Auf diese Weise etabliert Rieder(1981a) eine lokale asymptotische minimax Schranke f¨ur beliebige Sch¨atzer.

In diesem Sinne ist der asymptotische minimax Sch¨atzer, der in Rieder (1980) hergeleitet ist, minimax unter allen beliebigen Sch¨atzern.

Im Fall von bedingten Kontaminationsumgebungen verifiziert Rieder(1994) (vgl.

Unterabschnitt 7.5.2), dass der Huber Sch¨atzer im Vergleich zum Hampel-Krasker Sch¨atzer in einem ¨ahnlichen aber etwas kleinerem Modell minimax ist. N¨amlich im Fall von quadratisch gemittelten im Gegensatz zu gemittelten bedingten Umge-bungen (vgl. Bemerkung 7.5.17 (a), ibid.). Da die Minimierung des asymptotischen Unter-/ ¨Uberschuss Konfidenzrisikos ¨aquivalent zur Minimierung der asymptotisch-en Varianz unter einer Biasschranke ist (vgl. Lemma 10.3.5), ist dieses Resultat auch in unserem Setup g¨ultig.

Unser Ansatz

In Kapitel 10f¨uhren wir zuerst den finiten und den asymptotischen Setup ein;

siehe Abschnitt10.1. Als zweites pr¨asentieren wir die Herleitung des finiten mini-max Regressionssch¨atzers, welche zum gr¨oßten Teil auf Rieder (1989) und Ab-schnitt 1 in Rieder (1995) basiert; vergleiche Abschnitt 10.2. In Erg¨anzung zu

xxviii

Rieder (1989), beweisen wir die Zul¨assigkeit des finiten minimax Sch¨atzers (vgl.

Theorem 10.2.10(b)) und geben einige formale Argumente f¨ur die Herleitung der Sch¨atzer in den Randf¨allen an (vgl. Unterabschnitt10.2.4).

Als drittes wenden wir die asymptotischen Resultate von Rieder (1980) auf lineare Regression an und erweitern die asymptotische Theorie auf bedingte Re-gressionsumgebungen; siehe Abschnitt 10.3. Wir leiten den asymptotischen mini-max Sch¨atzer ohne jede Verbindung zum entsprechenden robusten Testproblem von Rieder(1978) her, indem wir stattdessen Optimierungsargumente wie in Ruckde-schel and Rieder(2004) verwenden; vergleiche Unterabschnitt10.3.3.

Wie oben erw¨ahnt, sind diese Resultate die asymptotischen Gegenst¨ucke zum Fall finiter Stichproben. Daher sind wir in der Lage, die Asymptotik mit Hilfe von Resultaten, die f¨ur finite Stichproben und fixierte Umgebungen hergeleitet wur-den, zu ¨uberpr¨ufen. Dies gilt zumindest f¨ur den Fall dieser speziellen Pseudo-Verlustfunktion und eines eindimensionalen Lokations- bzw. Regressionsparame-ters. Vorausgesetzt nat¨urlich, dass wir in der Lage sind, die finiten Risiken mit hoher Genauigkeit numerisch zu berechnen.

In Kapitel 11spezialisieren wir die Resultate aus Kapitel 10von einfacher Re-gression auf eindimensionale Lokation und von Fehlerverteilungen mit finiter Fisher-Information auf normalverteilte Fehler. Wir betrachten Kontaminations- (∗ =c) sowie Totalvariationsumgebungen (∗ = v); siehe Abschnitt 11.1 bzw. 11.2. In diesem Setup sind der finite und der asymptotische minimax Sch¨atzer von der gleichen Gestalt und k¨onnen anhand der entsprechenden optimalen Stutzh¨ohen identifiziert werden. Wir vergleichen daher zuerst die finit und die asymptotisch optimalen Stutzh¨ohen unter Verwendung von Taylorentwicklungen. Es zeigt sich, dass die Konvergenz gegen die asymptotischen Werte von unten erfolgt; d.h., die (erste Ordnungs-) Asymptotik ist zu optimistisch. Außerdem ist die Konvergenz-geschwindigkeit im Fall von Kontaminationsumgebungen (∗=c) von der Ordnung n−1/2 w¨ahrend sie im Fall von Totalvariationsumgebungen (∗ =v) von der Ord-nung n−1 ist. Deshalb besteht im Fall der Stutzh¨ohen ein deutlicher Unterschied zwischen diesen zwei Typen von Umgebungen, der unserer Vermutung nach von der gr¨oßeren Symmetrie der Totalvariationsumgebungen verursacht wird. Im Ver-lauf dieser Untersuchungen, erhalten wir auch O(n−1/2) -korrigierte (∗=c) bzw.

O(n−1) -korrigierte (∗=v) asymptotisch optimale Stutzh¨ohen.

In Abschnitt 11.3untersuchen wir direkt die exakten finiten Risiken (vgl. Un-terabschnitt11.3.1) und f¨uhren zwei Algorithmen ein, die auf der schnellen Fourier Transformation (FFT) beruhen (vgl. Unterabschnitt 11.3.2). Diese stellen nu-merische Approximationen zur Verf¨ugung, die sehr genau sind. Wir ¨uberpr¨ufen die Genauigkeit dieser Algorithmen mittels analytischer Berechnungen, die f¨ur Stich-probenumfang n = 2 verf¨ugbar sind (der einfachere Fall n = 1 wird nicht be-trachtet!) sowie mittels numerischer Simulationen; siehe Unterabschnitt 11.3.2.3.

Wir verwenden diese Algorithmen auch dazu, die Resultate von anderen Approxi-mationen, n¨amlich von Edgeworth Entwicklungen bis zur ersten und zweiten Ord-nung (vgl. Ibragimov (1967)) sowie von Sattelpunktapproximationen (vgl. Field and Ronchetti (1990)), zu ¨uberpr¨ufen; siehe Unterabschnitt11.3.3. Es stellt sich heraus, dass in diesem Konfidenz-Setup f¨ur robuste normale Lokation sowohl die

xxix

Edgeworth Entwicklungen bis zur zweiten Ordnung als auch die Sattelpunktsap-proximationen gute N¨aherungen bis hinunter zu Stichproben mit 5 Beobachtungen liefern.

Die Hauptanwendung unserer Algorithmen ist der numerische Vergleich zwi-schen finiten und asymptotizwi-schen Resultaten; siehe Abschnitt 11.4. Zuerst ver-gleichen wir die finit, die asymptotisch und die O -korrigierten asymptotisch op-timalen Stutzh¨ohen; siehe Unterabschnitt 11.4.1.1 bzw. 11.4.2.1. Es stellt sich heraus, dass es deutliche Unterschiede zwischen den finit und den asymptotisch op-timalen Stutzh¨ohen gibt. Jedoch liegen die O -korrigierten asymptotisch optimalen Stutzh¨ohen f¨ur mittelgroße Stichproben mit ungef¨ahr 10 (∗=v) bzw. 20 (∗=c) Beobachtungen bereits sehr nahe bei den finit optimalen.

Als zweites vergleichen wir die finiten Risiken des finiten und des asymptotischen minimax Sch¨atzers sowie des Sch¨atzers, der auf der O -korrigierten asymptotisch optimalen Stutzh¨ohe basiert; siehe Unterabschnitt11.4.1.2bzw.11.4.2.2. Obwohl es deutliche Unterschiede zwischen den optimalen Stutzh¨ohen gibt, sind die Unter-schiede (in absoluten Zahlen) zwischen den entsprechenden finiten Risiken nur klein.

Zus¨atzlich deuten die Resultate der Box-Cox Potenztransformation, die vomMASS Paket vonVenables and Ripley(2002) zur Verf¨ugung gestellt wird, darauf hin, dass die Konvergenzgeschwindigkeit der finiten Risiken gegen die asymptotischen Risiken von derselben Ordnung ist wie die der optimalen Stutzh¨ohen. Das heißt, im Fall von Kontaminationsumgebungen (∗ = c) scheint die Konvergenzgeschwindigkeit von der Ordnung n−1/2 hingegen im Fall von Totalvariationsumgebungen (∗=v) von der Ordnung n−1 zu sein.

Da es (bereits a priori) nur kleine Unterschiede zwischen den absoluten Werten gibt, untersuchen wir auch relative Werte; d.h., wie viel Effizienz verlieren wir, falls wir die asymptotisch optimale bzw. die O -korrigierte asymptotisch optimale Stutzh¨ohe anstelle der finit optimalen Stutzh¨ohe verwenden. Die numerischen Ergebnisse zeigen, dass die maximalen relativen Risiken des Sch¨atzers, der auf der O -korrigierten asymptotisch optimalen Stutzh¨ohe basiert, sehr klein sind. Außer-dem gibt es bereits f¨ur mittelgroße Stichproben (∗=c: 20−50 , ∗=v: 10 ) keine großen Unterschied mehr zwischen allen drei Sch¨atzern (maximaler Effizienzverlust

<5% ).

Da die Gr¨oße der Kontamination in den meisten Anwendungen unbekannt bzw.

bis auf ein Intervall unbekannt ist, bestimmen wir auch die ung¨unstigsten Ra-dien und die entsprechenden Ineffizienzen. Diese sind analog zu Abschnitt 2.2 definiert. Die Effizienzverluste bleiben in allen betrachteten F¨allen deutlich unter 40% (ρ = 0 ), 20% (ρ = 1/2 ) und 10% (ρ = 1/3 ), wobei die gr¨oßten Inef-fizienzen im asymptotischen Fall auftreten. Da die Normalverteilung symmetrisch zur Null ist, sind im asymptotischen Setup die Subeffizienzen f¨ur Kontaminations-(∗=c) und Totalvariationsumgebungen (∗ =v) identisch. Im finiten Setup gibt es jedoch Unterschiede und die Ineffizienzen sind im Fall von Totalvariationsumge-bungen etwas gr¨oßer. Dies ist vermutlich durch die schnellere Konvergenz gegen die asymptotischen Werte verursacht.

Als drittes berechnen wir die finite Verteilung des finiten minimax Sch¨atzers und vergleichen diese mit der Normalverteilung, die den kleinsten Kolmogorov Ab-stand dκ hat; siehe Unterabschnitte 11.4.1.3 und 11.4.2.3. Unsere numerischen

xxx

Ergebnisse deuten darauf hin, dass die Konvergenzgeschwindigkeit im Fall von To-talvariationsumgebungen (∗ = v) nicht nur in der Null (entspricht dem finiten Risiko), sondern uniform ¨uber den ganzen Tr¨ager der finiten Verteilung des finiten minimax Sch¨atzers schneller ist. Die Unterschiede treten aber in erster Linie f¨ur sehr kleine Stichprobenumf¨ange zu Tage und bereits f¨ur n ≥ 10 erhalten wir in beiden F¨allen dκ<0.02 .

In Kapitel 12 spezialisieren wir die Resultate aus Kapitel 10 von beliebigen Fehlern mit endlicher Fisher-Information auf normalverteilte Fehler. Wir betrach-ten unbedingte (“Fehler in den Variablen”) Kontaminiatons- (∗ =c, t = 0 ) und Totalvariationsumgebungen (∗=v, t= 0 ) sowie bedingte (“fehlerfreie Variablen”) Kontaminations- (∗ =c, t =ε) und Totalvariationsumgebungen (∗ =v, t = δ);

vergleiche Abschnitt12.1bzw.12.2.

Ahnlich zur normalen Lokation besitzen der finite und der asymptotische mini-¨ max Sch¨atzer dieselbe Gestalt und k¨onnen anhand der entsprechenden optimalen Stutzh¨ohen (∗=c, v;t= 0 ) bzw. Funktionen (∗=c, v;t=ε, δ) identifiziert wer-den. Daher vergleichen wir zuerst die optimalen Stutzh¨ohen bzw. Funktionen. Wie sich herausstellt, sind die Ergebnisse analog zur normalen Lokation. Das heißt, wir erhalten mit Hilfe von Taylorentwicklungen, dass die Konvergenzgeschwindigkeit im Fall von Kontaminationsumgebungen (∗=c;t= 0, ε) von der Ordnung n−1/2, im Fall von Totalvariationsumgebungen (∗ =c;t = 0, ε) hingegen von der Ordnung n−1 ist. In allen F¨allen erfolgt die Konvergenz gegen die asymptotische Werte von unten; d.h., die (erste Ordnungs-) Asymptotik ist zu optimistisch. Dar¨uber hinaus liefern diese Taylorentwicklungen O(n−1/2) -korrigierte (∗ = c;t = 0, ε) und O(n−1) -korrigierte (∗ =v;t = 0, δ) asymptotisch optimale Stutzh¨ohen bzw.

Funktionen.

Außerdem leiten wir erneut Algorithmen f¨ur die Berechnung des finiten Risikos her, welche auf FFT basieren und ¨ahnlich zu den Algorithmen sind, die im Fall der eindimensionalen normalen Lokation verwendet wurden; siehe Unterabschnitte 12.1.3 und 12.2.3. Aufgrund der Abh¨angigkeit vom Regressor haben wir dieses Mal, im Gegensatz zur normalen Lokation, keine analytischen Ergebnisse f¨ur Stich-probenumfang n = 2 mit deren Hilfe wir die Genauigkeit unserer Algorithmen

¨

uberpr¨ufen k¨onnten. Jedoch deuten verschiedene Gegenproben und Ergebnisse, die wir mittels numerischen Simulationen erhielten, darauf hin, dass unsere Algorith-men wieder sehr genau sind.

In Abschnitt12.3stellen wir einige numerischen Vergleiche an. Im Regressions-kontext, im Gegensatz zur Lokation, ergibt sich das Problem, dass ideale Regres-sorverteilungen K ausgew¨ahlt werden m¨ussen. F¨ur die Zwecke dieses Abschnitts betrachten wir K= 13 I{0.5}+ I{1.0}+ I{1.5}

und K= Unif ([−1,2]) .

Wir beginnen mit der Behandlung der unbedingten Umgebungen; siehe Un-terabschnitte 12.3.1 und 12.3.2. Zuerst vergleichen wir die finit, die asympto-tisch und die O -korrigierten asymptoasympto-tisch optimalen Stutzh¨ohen; siehe Unterab-schnitte 12.3.1.1 und 12.3.2.1. Wie im Fall der normalen Lokation gibt es deut-liche Unterschiede zwischen den finit und den asymptotisch optimalen Stutzh¨ohen.

Hingegen liegen die O -korrigierten asymptotisch optimalen Stutzh¨ohen bereits f¨ur Stichproben, die aus ca. 20 Beobachtungen bestehen, sehr nahe bei den finit

opti-xxxi

malen.

Als n¨achstes behandeln wir die finiten Risiken. Mit Hilfe unserer FFT Algorith-men vergleichen wir die finiten Risiken der finiten und der asymptotischen minimax Sch¨atzer sowie der Sch¨atzer, die auf der O -korrigierten asymptotisch optimalen Stutzh¨ohe basieren; siehe Unterabschnitte12.3.1.2und12.3.2.2. Wieder stellt sich heraus, dass in den meisten F¨allen die Unterschiede (in absoluten Zahlen) zwischen den entsprechenden finiten Risiken nur klein sind.

Wie im Fall der normalen Lokation deuten die numerischen Untersuchungen der Konvergenzgeschwindigkeit der finiten Risiken gegen die asymptotischen Risiken darauf hin, dass diese im Fall unbedingter Kontaminationsumgebungen (∗=c, t= 0 ) von der Ordnung n−1/2, hingegen im Fall unbedingter Totalvariationsumgebun-gen (∗=v, t= 0 ) von der Ordnung n−1 ist.

Anschließend betrachten wir relative Risiken. Wie zuvor sind die Ergebnisse

¨

ahnlich zu denen in der normalen Lokation und nur die numerischen Werte sind unterschiedlich. In den betrachteten F¨allen bleibt der maximale Effizienzverlust des asymptotischen minimax Sch¨atzers deutlich unter 10% f¨ur Stichprobenumf¨ange n ≥ 50 (∗ = c, t = 0 ) bzw. n ≥ 20 (∗ = v, t = 0 ). Im Fall der Sch¨atzer, die auf der O -korrigierten asymptotisch optimalen Stutzh¨ohe basieren, k¨onnen kleine Werte von n (∗ =c, t= 0 :n <10 , ∗=v, t= 0 :n <20 ) zu sehr großen Subef-fizienzen f¨uhren. Dies wird dadurch verursacht, dass die O -Korrektur f¨ur kleine Stichprobenumf¨ange zu groß ist und sogar zu unzul¨assigen (negativen) Stutzh¨ohen f¨uhren kann. Um zul¨assige Werte zu erhalten, ersetzen wir diese Werte daher durch 0 . Hingegen liegen die Effizienzverluste f¨ur Stichprobenumf¨ange n ≥ 10 (∗=c, t= 0 ) bzw. n≥20 (∗=v, t= 0 ) deutlich unter 5% (∗=c, t= 0 ) bzw.

10% (∗=v, t= 0 ).

In vielen Anwendungen ist die Gr¨oße der Kontamination unbekannt bzw. un-bekannt bis auf ein Intervall. Daher bestimmen wir wieder die ung¨unstigsten Radien und die entsprechenden Ineffizienzen, welche analog zu Abschnitt2.2definiert sind.

In den betrachteten F¨allen sind die Effizienzverluste etwas gr¨oßer als im Fall der nor-malen Lokation, bleiben aber deutlich unter 60% (ρ= 0 ), 30% (ρ= 1/2 ) und 15%

(ρ= 1/3 ). Aufgrund der Symmetrie der Normalverteilung sind im asymptotischen Setup, in dem die gr¨oßten Ineffizienzen auftreten, die Subeffizienzen f¨ur unbedingte Kontaminations- (∗ = c, t = 0 ) und Totalvariationsumgebungen (∗ = v, t = 0 ) identisch. Im Kontext finiter Stichproben sind die Resultate unterschiedlich und aufgrund der schnelleren Konvergenz ist es nicht ¨uberraschend, dass die Effizienz-verluste im Fall der unbedingten Totalvariationsumgebungen etwas gr¨oßer sind.

Abschließend berechnen wir die finite Verteilung des finiten minimax Sch¨atzers und vergleichen diese mit der Normalverteilung, die den geringsten Kolmogorov-Abstand dκ aufweist; siehe Unterabschnitte12.3.1.3und12.3.2.3. Analog zur nor-malen Lokation deuten unsere numerischen Ergebnisse darauf hin, dass die Konver-genzgeschwindigkeit im Fall unbedingter Totalvariationsumgebungen (∗ = v, t = 0 ) nicht nur in der Null (entspricht dem finiten Risiko), sondern uniform ¨uber den gesamten Tr¨ager der finiten Verteilung des finiten minimax Sch¨atzers schneller ist.

Wieder treten die Unterschiede besonders bei sehr kleinen Stichprobenumf¨angen auf und bereits f¨ur n≥10 erhalten wir in beiden F¨allen dk <0.02 .

Als zweites betrachten wir bedingte (“fehlerfreie Variablen”) Umgebungen; siehe

xxxii

Unterabschnitte 12.3.3 und12.3.4. In den Unterabschnitten12.3.3.1 und12.3.4.1 bestimmen wir die Kontaminationskurven, f¨ur die der Hampel-Krasker Sch¨atzer der finite bzw. asymptotische minimax Sch¨atzer ist. Wie sich herausstellt, sind die entsprechenden Kontaminationskurven f¨ur kleine Werte des Regressors sehr ¨ ahn-lich. Jedoch ist der Umfang der Kontamination, der vom asymptotischen Ansatz f¨ur große Werte vorgeschlagen wird, unrealistisch groß und kann im Fall finiter Stichproben nicht realisiert werden. Im Gegensatz dazu ist der Umfang der Kon-tamination im finiten Setup beschr¨ankt. Dies deutet darauf hin, dass die (erste Ordnungs-) Asymptotik f¨ur große Regressoren nur ein schlechte Approximation liefert.

Man kann aber f¨ur geeignete Kontaminationskurven auch den Huber Sch¨atzer als finiten bzw. asymptotischen minimax Sch¨atzer erhalten. Die Berechnungen in den Unterabschnitten 12.3.3.2 und 12.3.4.2 zeigen, dass die entsprechenden Kon-taminationskurven f¨ur kleine Regressorwerte wieder sehr ¨ahnlich sind. Jedoch muss der Umfang der Kontamination f¨ur große Werte im finiten Setup sehr schnell gegen 0 tendieren wohingegen im asymptotischen Setup wieder ein unrealistisch großer Kontaminationsumfang ben¨otigt wird. Das heißt, die (erste Ordnungs-) Asymptotik scheint erneut nur eine schlechte Approximation f¨ur große Regressoren zu liefern.

F¨ur die verbleibenden numerischen Vergleiche w¨ahlen wir konstante Kontamina-tionskurven und verwenden K=13 I{0.5}+ I{1.0}+ I{1.5}

und K= Unif ([−1,2]) als ideale Regressorverteilungen.

Wie wir in den Unterabschnitten 12.3.3.3 und12.3.4.3 sehen, ist die optimale Klippingfunktion im Fall konstanter Kontaminationskurven gleich Null f¨ur kleine Regressorwerte. Dies gilt sowohl f¨ur den finiten als auch f¨ur den asymptotischen Setup. Hingegen ist die Klippingfunktion im asymptotischen Setup f¨ur große Werte unbeschr¨ankt w¨ahrend sie im finiten Setup gegen 0 tendiert. Außerdem sind die O -korrigierten asymptotisch optimalen Klippingfunktionen negativ f¨ur (sehr) kleine sowie f¨ur (sehr) große Regressorwerte. F¨ur mittelgroße Werte funktionieren die Approximationen ganz gut bis hinunter zu Stichprobenumf¨angen von n= 10 (∗= c, t = ε) bzw. n = 5 (∗ = v, t = δ). Diese Ergebnisse zeigen einmal mehr, dass die (erste Ordnungs-) Asymptotik f¨ur große Regressoren wohl eine schlechte Approximation liefert.

In den Unterabschnitten12.3.3.4und12.3.4.4verwenden wir unseren FFT Al-gorithmus, um die finiten Risiken des finiten und des asymptotischen minimax Sch¨atzers sowie des Sch¨atzers, der auf der O -korrigierten asymptotisch optimalen Stutzh¨ohe basiert (negative Werte werden auf 0 gesetzt), zu vergleichen. Wie im Fall der normalen Lokation bzw. im Fall unbedingter Umgebungen sind die Un-terschiede (in absoluten Zahlen) zwischen den entsprechenden finiten Risiken in allen betrachteten F¨allen nur klein. Außerdem scheint, wie in den F¨allen zuvor, die Konvergenzgeschwindigkeit gegen das asymptotische Risiko im Fall bedingter Kontaminationsumgebungen (∗=c, t=ε) von der Ordnung n−1/2, hingegen im Fall bedingter Totalvariationsumgebungen (∗ = v, t = δ) von der Ordnung n−1 zu sein.

Wir beenden dieses Kapitel mit der Berechnung der finiten Verteilung des finiten minimax Sch¨atzers. Wie zuvor vergleichen wir diese mit der Normalverteilung,

xxxiii

die den kleinsten Kolmogorov-Abstand dκ aufweist; siehe Unterabschnitte12.3.3.5 und12.3.4.5. Dieses Mal sind die Unterschiede zwischen Kontaminations- und To-talvariationsumgebungen kleiner als in den vorangegangenen Situationen. Genauer gesagt erhalten wir in beiden F¨allen dκ<0.02 bereits f¨ur n≥5 .

Introduction

This thesis consists of five parts. Each part opens with a short description of the previous treatment in literature and a summary of our own results.

Along with this dissertation comes a CD which contains the .pdf and .ps versions of this document as well as the Windowsr installer and the sources forR 2.1.1 patched(cf.R Development Core Team(2005)). In addition, one can find on this CD: OurRbundleRobASt(cf. AppendixD), which includes theRpackagesdistrEx, RandVar,ROptEst,RobLox,ROptRegTSandRobRex, as well as the requiredR pack-agesdistr(cf.Ruckdeschel et al.(2005)),setRNG(cf.Gilbert(2004)) andevd(cf.

Stephenson(2004)).