• Keine Ergebnisse gefunden

M is si n g D a ta

N/A
N/A
Protected

Academic year: 2021

Aktie "M is si n g D a ta"

Copied!
10
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

21

M is si n g D a ta

aMissingDataarefrequentin

SurveySampling

Datacollections/registersthatarenotcollectedforthepurposeofstatisticalanalysis

(2)

22

bDistinguishfrom

CensoredData(survival,detectionlimit)

TruncatedData

Subjectsthatearnmorethan200000.–donotanswerthequestionaboutincome.Censored,truncated,missing?

cInformativemissingnessBias=systematicerrorNon-informativemissingnessincreasedstandarderrorscanbetreatedbystatisticalmethods.

(3)

23dModel:CompletedatasetSelectionmechanismObserved

Z e=[ eZ (j)i ]=[X e,Y e]andM=[M (j)i ]Z

Z (j)i = eZ (j)i ifM (j)i =0NAifM (j)i =1

MissingCompletelyatRandom(MCAR)

M (j)i independentof eZi.

Missingatrandom(MAR)

M (j)i onlydependsonobservedZ (j)i .

InformativeMissing(IM)Usuallyhopeless.ButseeSurveySamplingfortricks.

(4)

24

eProceduresfordealingwithnon-informativemissings:

Dropobservationswith1missings(na.omit)Okiftheremainingdatasetisbigenough.

Regression:

AlwaysDropobservationsforwhichtheresponsevariableismissing.

Indicatorvariables:–Factor:addalevel’NA’–Continuousvariable:addanindicatorvariableM (j)

LetX (j)i =someconstantcj(=0)insteadof’NA’.

(5)

25

General:

Imputation:Replaceeachmissingbyaplausiblevalue–Useregression:Forecast eZ (j)i fromobserved eZ (k)i .–Nearestneighbor(s).

MultipleImputation:Repl.eachmissingby5plausiblev.tomimikrandomvariation.

MaximumLikelihood:DetermineMLestimatesbasedonallobserveddata.

(6)

26fComments:

na.omitissimpleandusefulupto5-10%missings–causesproblemswithadd1oflmandthereforewithstep(...,direction=forward)

MaximumLikelihoodneedsstochasticmodelforallvars.

Regression:”kindof”model.

Observationsmaybeweightedaccordingtonumberofimputedvalues.

Remember”attenuation”for”errors-in-variables”models.Singleimputationofinputvariablesleadstobias.

(7)

27gStrategyforregressionproblems(tobetested...)

DeletecaseswithmissingYi.

Chooseinputvar.X (k1)withsmallestnumberofmissings.LetI1=setofmissings,={i|M (j)i =1}.DetermineallX (j)whichhavenon-miss.valuesforalliI1(CalltheseX (K0).)Predict eX (k1)i fromregressingX (k1)onX (K0) bX (k1)i .

X (k2):secondsmallestnumberofmissingsUseonlyX (K0),X (k1)(withimputedv.)topredict eX (k2)....

X (k):thsmallestnumberofmissingsUseonlyX (K0),X (k1),...,X (k1)topredict eX (k).

(8)

28

LLiteratur:

F.Harrell(2002).RegressionModelingStrategies,Ch.3

J.L.Schafer(1999).Analysisofincompletemultivariatedata

hR-packages

normAnalysisofmultivariatenormaldatasetswithmissingvaluesmixEstimation/multipleImputationforMixedCategoricalandContinuousDatamitoolsToolsformultipleimputationofmissingdata

(9)

29

Functions:

Hmisc::transcanTransformations/ImputationsusingCanonicalVariates(Harrell)e1071::imputeReplaceMissingValuesfts::fillFillMissingValuesmlmmm::mlmmm.emMLestimationviaEM-algorithmundermultivariatelinearmixedmodelswithmissingvaluesmvnmle::getclfCreatelikelihoodfunctionformultivariatedatawithmissingvalues.scrime::knncatimputeMissingValueImputationwithkNNscrime::knncatimputeLargeMissingValueImputationwithkNNforHigh-DimensionalData

(10)

30

MessagesMissingValues

Missingvaluesareoftenasevereprobleminobservationaldataandsurveysampling.

Thereareseveralwaystodealwithit.”Forecasting”missingvaluesonthebasisofregressioninputvariablesonotherinputvariablesappearstobemostpromising.

TherearemanyRfunctions&afewspecializedpackages.

Referenzen

ÄHNLICHE DOKUMENTE

Weitere Informationen finden Sie in unseren aktuellen Prospekten und Preislisten oder unter www... Rom –

AlŊbald athmete sie wieder und erholte siĚ, aber der junge KŹnig hatte eŊ mit angesehen und wute niĚt, warum eŊ der getreue JohanneŊ gethan, ward zornig darđber und rief

Den Kapitalisten steht die Klasse der abhängig Arbeitenden gegenüber. Das gemeinsame Interesse der Lohnabhängigen ist es, Einkommen, Arbeitsbedingungen sowie ihre soziale

Sehr gerne können Sie das Sotavento für eine private oder auch geschäftliche Feier nutzen.. Auch außerhalb der

Sie lernen im Seminar, die Körpersprache anderer zu verstehen, zu lesen. Die lernen auch ihre Ressourcen kennen, wie Sie Menschen am besten erkennen können durch sehen, hören,

Voraussetzung: Jause, Getränk und festes Schuhwerk Höhenunterschied: Aufstieg und Abstieg 150 Hm... Wanderung

Lenker-RS: wenn ein Fahrzeug-RS für das Fahrzeug bei der OÖV besteht 15,--.. wenn kein Fahrzeug-RS für das Fahrzeug bei der OÖV

Jesus, der wusste, dass ihm der Vater alles in die Hand gegeben hatte und dass er von Gott gekommen war und zu Gott zurückkehrte, stand vom Mahl auf, legte sein Gewand ab