Kahe regressoriga lokaalne regressioon - Magistritöö(30EAP)Juhendaja:dotsentMeelisKäärik k -läh

5.4 Tulemused

5.4.2 Kahe regressoriga lokaalne regressioon

Kahe regressoriga lokaalse regressiooni korral kasutame hindamiseks eelmises peatükis leitud võrrandeid (4.2). Võtame regressoriteks omaniku ja auto va-nused. Tabelis 5.4 näeme saadud tulemusi.

Mahalanobise kauguse korral on kasutatud kovariatsioonimaatriksit, kus age tähistab omaniku vanust ja v.age auto vanust.

C =cov(age, v.age) = 151.62321 −3.980510

−3.98051 7.568443

Kahemõõtmelisel juhul on näha erinevust eukleidilise ja Mahalanobise kau-guse vahel. Näeme, et Mahalanobise kaugus annab suurema osa k väärtuste korral parema tulemuse, vaid k = 3500 ja k= 4000 korral jääb ta eukleidili-sele alla. Alates k = 6000jõutakse olukorrani, kus k →n ja saame globaalse

k Eukleidiline kaugus Mahalanobise kaugus

500 78.161971 78.084263

1000 77.536584 77.396354

1500 77.271121 77.136557

2000 77.557201 77.422963

2500 77.713830 77.593561

3000 77.640166 77.616465

3500 77.983807 78.044727

4000 78.200291 78.211248

4500 78.546014 78.464993

5000 78.507941 78.506341

5500 78.606995 78.551386

6000 78.654487 78.654487

6500 78.654487 78.654487

7000 78.654487 78.654487

Tabel 5.4: Vea e väärtused kahe regressoriga lokaalse regressiooni korral.

saadud tulemuse, mille viga on 77.5. Eukleidilise kauguse korral saadakse sellest parem tulemus vaid k = 1500 korral, mis on ka eukleidilise kaugu-se parim tulemus 77.27. Mahalanobikaugu-se kaugukaugu-sega saadakkaugu-se CART-meetodist parem tulemus alates k= 1000 kunik = 2000. Ülejäänud k-väärtuste korral on mõlema kaugusega leitud lokaalse regressiooni hinnangute vead suuremad kui CART-meetodil leitud viga. Ka globaalse regressiooni viga 78.65 on suu-rem kui CART-meetodil leitud. Parima tulemuse kahe regressoriga lokaalse regressiooni korral saime Mahalanobise kaugusega k = 1500, kuse = 77.14.

Joonis 5.3: Vea e suurused kahe regressoriga lokaalse regressiooni korral.

Punasega on joonisele kantud CART-meetodi viga väärtusega 77.5. Rohe-lise joonega on toodud eukleidiRohe-lise kaugusega leitud mudeli vead ja musta joonega Mahalanobise kaugusega leitud mudeli vead. On näha, et kahemõõt-melisel juhul annab Mahalanobise kaugus väiksema vea, sest arvesse võetakse tunnustevahelist kovariatsiooni, mis annab eelise eukleidilise kauguse ees. Vi-gade graafikud on sarnase kujuga, sest korrelatsioonimaatriksist

R =cor(age, v.age) = 1 −0.117504

−0.117504 1

! ,

kus age on omaniku vanus ja v.age auto vanus, näeme, et tunnuste vahel on negatiivne ning üpris väike korrelatsioon. Seetõttu annavad Mahalanobise ja eukleidiline kaugus sarnased tulemused.

CART-meetodi ees, kuid tähelepanu tuleb pöörata k valikule, et saavutada väiksem viga. Samas võimaldavad dünaamilised klassipiirid, mis määratak-se lokaalmääratak-se regressiooniga, vähendada hinnašoki tekkimimääratak-se võimalust, mis on kindlustuspoliisi sõlmija jaoks kindlasti eelistatud.

Eukleidiline kaugus e Lokaalne regressioon k = 1500 77.27 Lokaalne regressioon k = 2500 77.71 Lokaalne regressioon k = 3500 77.98

Mahalanobise kaugus

Lokaalne regressioon k = 1500 77.14 Lokaalne regressioon k = 2500 77.59 Lokaalne regressioon k = 3500 78.04 Globaalne regressioon 78.65

CART-meetod 77.5

Tabel 5.5: Erinevate meetodite vead kahe sisendtunnuse korral.

Kokkuvõte

Töö eesmärgiks oli uurida, kas lokaalse regressiooni ja dünaamiliste klassipii-ride kasutamine annab täpsemaid tulemusi kindlustuskahjude sageduse hin-damisel, kui CART-meetod. Selleks tutvustasime töö esimeses osas k-lähima naabri meetodit. Tegu on mitteparameetrilise meetodiga, mida saab kasu-tada nii klassifitseerimiseks kui regressiooniks. Antud töös kasutasime seda koos lokaalse regressiooniga. Sageli on meetodi puhul elementaarseks valikuks eukleidiline kaugus, kuid antud töös uurisime ka Mahalanobise kauguse ka-sutamise võimalusi ning omadusi.

Lisaks erinevatele kauguse defineerimise võimalustele on lokaalse regressiooni korral mitu võimalust regressorite valikuks. Nii leidsimegi kahjude esinemise sageduse hinnangute valemid nii ühe, kahe kui ka m regressoriga juhul. Ees-ti kaskokindlustuse andmetel proovisime ühe ja kahe regressoriga hindamist, kus esimesel juhul oli regressoriks omaniku või auto vanus ning kahemõõtme-lisel juhul võtsime arvesse mõlemad. Ühemõõtmekahemõõtme-lisel juhul on eukleidilise ja Mahalanobise kaugusega leitud tulemused võrdsed, sest kovariatsioonimaat-riks ühemõõtmelisel juhul on vaadeldavate punktide jaotuse dispersioon. Ka-hemõõtmelisel juhul olid tulemused erinevad ning suurema osa k väärtuste korral saime Mahalanobise kaugusega paremad tulemused.

Ühemõõtmelisel juhul on lokaalse regressiooniga leitud mudeli vea suurus suurema osakväärtuste korral väiksem kui CART-meetodil leitud viga, kuid kahemõõtmelisel juhul on vaid paari k väärtuse korral võimalik saada

pa-rem viga. Seega vaadeldud andmete korral on ühemõõtmelisel juhul lokaalse regressiooniga hindamisel ehk dünaamiliste klassipiiride kasutamisel nähtav eelis CART-meetodi ees, kuid kahemõõtmelisel juhul annab see paremad tule-mused vaid väikses k-väärtuste piirkonnas. Samas vähendavad dünaamilised piirid hinnašoki esinemise võimalust ning kindlustusmaksete muutus on su-juvam.

Antud teemal on võimalus uurimist jätkata suurema arvu regressorite hul-gaga mudelite analüüsimisel, mille kohta antud töös küll leiti hindamiseks vajalikud võrrandid kuid praktiliste andmete peal analüüsini ei jõutud.

Kirjandus

Cunningham, P; Delany, S. J (2007) „k-Nearest Neighbour Classifiers", Technical Report UCD-CSI-2007-4

Fix, E; Hodges, J.L (1989) „Discriminatory Analysis. Nonparametric Disc-rimination: Consistency Properties“,International Statistical Reviw, 57 (3), 238-247

Gnanadesikan, R; Kettenring, J.R (1972) „Robust Estimates, Residuals, and Outlier Detection with Multiresponse Data", Biometrics, 28 (1), 81-124 Hastie, T; Tibshirani, R; Friedman, J (2008) „The elements of statistical learning: data mining, inference and prediction", Springer, 14-18

Käärik, M; Kaasik, A (2012) „On premium estimation using the C&RT/Poisson model and its extensions",Lithuanian Journal of Statistics, 51 (1), 36-50

Maesschalck, R. De; JouanRimbaud, D; Massart, D. L (2000) "Tutorial -The Mahalanobis distance", Chemometrics and Intelligent Laboratory Sys-tems, 50, 1-18

Pärna, K; Kangro, R; Kaasik, A; Möls, M (2012) „K-Nearest Neighbors as Pricing Tool in Insurance: a Comparative Study", Multivariate Statistics:

Theory and Applications, 130-131

Wilson, D.R; Martinez, T.R (1997) „Improved Heterogeneous Distance Functions", Journal of Artificial intelligence Research, 6, 1-34

Xiaoyu, S; Jingke, X; Zhichao, Y; Huanliang, S (2014) „RkNN Query Algo-rithm Based on K-order Voronoi Diagram",International Journal of Control and Automation, 7 (9), 11-26

Lisa: Kasutatud R-i kood

# ühe r e g r e s s o r i g a l o k a a l n e r e g r e s s i o o n

# age − omaniku vanus

# v_age − s õ i d u k i vanus

# c l a i m f r e q − k a h j u s a g e d u s

# days − k i n d l u s t u s p ä evade a r v

# a , b1 , b2 − r e g r e s s i o o n i p a r a m e e t r i d

#Võ r r a n d i d toodud j u h u l , k u i r e g r e s s o r i k s omaniku vanus

#Auto v a n u s e l e ü l e m i n e k u k s asendada vä ä r t u s e d

#age vä ä r t u s e g a v_age

fnL_1 = f u n c t i o n ( a , b1 , age , c l a i m f r e q , days ) {−

sum ( c l a i m f r e q∗l o g ( a+b1∗age ))+sum ( days∗( a+b1∗age ) ) }

#võ r r a n d i d STH l e i d m i s e k s

fnLgrad_1 = f u n c t i o n ( a , b1 , age , c l a i m f r e q , days ) { c(−sum ( c l a i m f r e q / ( a+b1∗age ))+sum ( days ) ,

−sum ( c l a i m f r e q∗age / ( a+b1∗age ))+sum ( days∗age ) ) }

#v a s t a v a d võ r r a n d i d k o n k r e e t s e t e andmete k o r r a l

fnL_kon_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;

b1=x [ 2 ] ;

fnL_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample ,

c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }

fnLgrad_kon_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;

b1=x [ 2 ] ;

fnLgrad_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }

##############################################

# andmestiku s i s s e l u g e m i n e j a mõ ned a b i t e i s e n d u s e d . . .

# t r e e n i n g a n d m e d

d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , sum ( k a h j u d e a r v ) a s f r e q ,

sum ( p o l i i s _ k e h t i n u d ) a s days ,

sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t r e e n i n g p o l i i s i d

where i n i m v a n u s != ’NA’

group by i n i m v a n u s " )

#a u t o vanus r e g r e s s o r i k s

#d a t a = s q l d f ( " s e l e c t a u t o v a n u s a s v_age ,

# sum ( k a h j u d e a r v ) a s f r e q ,

# sum ( p o l i i s _ k e h t i n u d ) a s days ,

# sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,

# 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y

# from t r e e n i n g p o l i i s i d

# where a u t o v a n u s != ’NA’

# group by a u t o v a n u s " )

######################################

#k e s k v ä ä r t u s e d j a d i s p e r s i o o n i d age_mean = sum ( d a t a $ a g e∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; age_mean

age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗

sum ( d a t a $ d a y s∗( d a t a $ a g e−age_mean ) ^ 2 ) ; age_var

#v_age_mean = sum ( data$v_age∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ;

#v_age_mean

#v_age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗

#(data$v_age−v_age_mean ) ^ 2 ) ; v_age_var

######################################

# testandmed

t e s t _ d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , sum ( k a h j u d e a r v ) a s f r e q ,

sum ( p o l i i s _ k e h t i n u d ) a s days ,

sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t e s t p o l i i s i d

where i n i m v a n u s != ’NA’

group by i n i m v a n u s " )

#a u t o vanus r e g r e s s o r i k s

#t e s t _ d a t a = s q l d f ( " s e l e c t a u t o v a n u s a s v_age ,

# sum ( k a h j u d e a r v ) a s f r e q ,

# sum ( p o l i i s _ k e h t i n u d ) a s days ,

# sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,

# 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y

# from t e s t p o l i i s i d

# where a u t o v a n u s != ’NA’

# group by a u t o v a n u s " )

######################################################

d a t a 2 a g e=d a t a . frame ( age=c ( min ( d a t a $ a g e ) : max ( d a t a $ a g e ) ) ) d a t a 2 = s q l d f ( " s e l e c t a . age , c . f r e q , c . days , c . lambda_y

from d a t a 2 a g e a s a

l e f t j o i n d a t a a s c on a . age=c . age " )

#a u t o vanus r e g r e s s o r i k s

#d a t a 2 a g e=d a t a . frame ( age=c ( min ( data$v_age ) : max( data$v_age ) ) )

#d a t a 2 = s q l d f ( " s e l e c t a . v_age , c . f r e q , c . days , c . lambda_y

# from data2v_age a s a

# l e f t j o i n d a t a a s c on a . v_age=c . v_age " )

#e r i n e v a d k−vä ä r t u s e d , s u u r e n d a t a k s e sammuga 500 k=c ( 5 0 0 , 1 0 0 0 , 1 5 0 0 , 2 0 0 0 , 2 5 0 0 , 3 0 0 0 , 3 5 0 0 , 4 0 0 0

, 4 5 0 0 , 5 0 0 0 , 5 5 0 0 , 6 0 0 0 , 6 5 0 0 , 7 0 0 0 ) n i m e k i r i=r e p (NA, 1 4 )

f o r (m i n ( 1 : l e n g t h ( k ) ) ) {

## n a a b r u s e l e i d m i s e f u n k t s i o o n

datawindow =f u n c t i o n ( age , i 1 ) {

window = d a t a 2 [ round ( abs ( d a t a 2 $ a g e−age ))<= i 1 &

! i s . na ( d a t a 2 $ d a y s ) , ] #e u k l e i d i l i n e window

}

####################################################

f o r ( j i n ( 1 : l e n g t h ( d a t a 2 $ a g e ) ) ) { age=d a t a 2 $ a g e [ j ]

i = 0 . 0 1

n e i g h b _ s i z e = sum ( datawindow ( age , i ) $days ) w h i l e ( ( n e i g h b _ s i z e < 365∗k [m] ) &

( ( age−i >min ( d a t a 2 $ a g e ) ) | ( age+i <max( d a t a 2 $ a g e ) ) ) ) { i = i + 0 . 1

n e i g h b _ s i z e = sum ( datawindow ( age , i ) $days ) }

age_sample = datawindow ( age , i ) $ a g e

c l a i m f r e q _ s a m p l e = datawindow ( age , i ) $ f r e q days_sample = datawindow ( age , i ) $days /365 fnL2_1 = f u n c t i o n ( x ) {

a=x [ 1 ] ; b1=x [ 2 ] ;

fnL_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample

, c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }

fnLgrad2_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;

b1=x [ 2 ] ;

fnLgrad_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample

, c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }

params=optim ( par=c ( 1 , 0 ) , f n=fnL2_1 , g r=fnLgrad2_1 , method="BFGS" )

d a t a 2 $ a 2 [ j ] = round ( params$par [ 1 ] , d i g i t s =8) data2$b 12 [ j ] = round ( params$par [ 2 ] , d i g i t s =8) d a t a 2 $ n e i g h b 2 [ j ] = n e i g h b _ s i z e

i f ( p a r a m s $ c o n v e r g e n c e != 0 ) { c a t ( " j =" , j , " ,

age =" , age , " , n e i g h b =" , n e i g h b _ s i z e , " NOT CONVERGED" ) } }

data2$lambda_new2 = round ( d a t a 2 $ a 2+da ta2$b12∗d a t a 2 $ a g e , d i g i t s =8)

t e s t _ d a t a 2 = s q l d f ( " s e l e c t a . age , a . f r e q , a . days , b . lambda_y , b . lambda_new2 ,

a . lambda_y a s lambda_actual from t e s t _ d a t a a s a l e f t j o i n d a t a 2 a s b on a . age = b . age " )

#################################################

e2_semipar2 = sum ( t e s t _ d a t a 2 $ d a y s∗

( t e s t _ d a t a 2 $ l a m b d a _ a c t u a l−test_data2$lambda_new2 )

^2/ 365 , na . rm=TRUE) ; e2_semipar2 #l e i a m e m u d e l i vea n i m e k i r i [m]= e2_semipar2

p r i n t ( p a s t e 0 ( " Tulemus on : " , e2_semipar2 ) ) }

####################################################

#Kahe r e g r e s s o r i g a l o k a a l n e r e g r e s s i o o n

fnL_2 = f u n c t i o n ( a , b1 , b2 , age , v_age , c l a i m f r e q , days ) {

−sum ( c l a i m f r e q∗l o g ( a+b1∗age+b2∗v_age ))+

sum ( days∗( a+b1∗age+b2∗v_age ) ) }

#Võ r r a n d i d STH l e i d m i s e k s

fnLgrad_2 = f u n c t i o n ( a , b1 , b2 , age , v_age , c l a i m f r e q , days ) { c(−sum ( c l a i m f r e q / ( a+b1∗age+b2∗v_age ))+sum ( days ) ,

−sum ( c l a i m f r e q∗age / ( a+b1∗age+b2∗v_age ))+sum ( days∗age ) ,

−sum ( c l a i m f r e q∗v_age / ( a+b1∗age+b2∗v_age ))+sum ( days∗v_age ) ) }

#Treeningandmed

d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , a u t o v a n u s a s v_age ,

sum ( k a h j u d e a r v ) a s f r e q ,

sum ( p o l i i s _ k e h t i n u d ) a s days ,

sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,

365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y

from t r e e n i n g p o l i i s i d

where i n i m v a n u s != ’NA’ and a u t o v a n u s != ’NA’

group by inimvanus , a u t o v a n u s " )

#k e s k v ä ä r t u s e d j a d i s p e r s i o o n i d

age_mean = sum ( d a t a $ a g e∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; age_mean

age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗ ( d a t a $ a g e−age_mean ) ^ 2 ) ; age_var

v_age_mean = sum ( data$v_age∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; v_age_mean

v_age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗ ( data$v_age−v_age_mean ) ^ 2 ) ; v_age_var

cov_2=cov . wt ( d a t a . frame ( d a t a $ a g e , data$v_age ) , d a t a $ d a y s /sum ( d a t a $ d a y s ) , c o r=TRUE) $cov

#########################################################

#Testandmed

t e s t _ d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , a u t o v a n u s a s v_age ,

sum ( k a h j u d e a r v ) a s f r e q ,

sum ( p o l i i s _ k e h t i n u d ) a s days ,

sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t e s t p o l i i s i d

where i n i m v a n u s != ’NA’ and a u t o v a n u s ! = ’NA’

group by inimvanus , a u t o v a n u s " )

######################################################

d a t a 2 a g e = d a t a . frame ( age=c ( min ( d a t a $ a g e ) : max( d a t a $ a g e ) ) )

d a t a 2 v a g e = d a t a . frame ( v_age=c ( min ( data$v_age ) : max( data$v_age ) ) )

d a t a 2 = s q l d f ( " s e l e c t a . age , b . v_age , c . f r e q , c . days , c . lambda_y from d a t a 2 a g e a s a

l e f t j o i n d a t a 2 v a g e a s b

l e f t j o i n d a t a a s c on a . age=c . age and b . v_age = c . v_age " )

#e r i n e v a d k−vä ä r t u s e d , s u u r e n d a t a k s e sammuga 500 k=c ( 5 0 0 , 1 0 0 0 , 1 5 0 0 , 2 0 0 0 , 2 5 0 0 , 3 0 0 0 , 3 5 0 0 , 4 0 0 0 , 4 5 0 0

, 5 0 0 0 , 5 5 0 0 , 6 0 0 0 , 6 5 0 0 , 7 0 0 0 ) m a h a l a n o b i s=r e p (NA, 1 4 ) f o r (m i n ( 1 : l e n g t h ( k ) ) ) {

## n a a b r u s e l e i d m i s e f u n k t s i o o n ( datawindow ) datawindow =f u n c t i o n ( age , v_age , i 1 ) {

#d i s p e r s i o o n i d e g a k o r r i g e e r i t u d e u k l e i d i l i n e

#d a t a 2 $ k a u g u s =( d a t a 2 $ a g e−age ) ^ 2 / ( age_var∗( i 1 )^2)+

( data2$v_age−v_age ) ^ 2 / ( v_age_var∗( i 1 ) ^ 2 )

#window=d a t a 2 [ data2$kaugus <1 & ! i s . na ( d a t a 2 $ d a y s ) , ]

#m a h a l a n o b i s

d a t a 2 $ k a u g u s=s q r t ( m a h a l a n o b i s ( c b i n d ( d a t a 2 $ a g e , data2$v_age ) , c b i n d ( age , v_age ) , cov_2 ) )

window=d a t a 2 [ data2$kaugus<i 1 & ! i s . na ( d a t a 2 $ d a y s ) , ] window

}

####################################################

f o r ( j i n ( 1 : l e n g t h ( d a t a 2 $ a g e ) ) ) {

age=d a t a 2 $ a g e [ j ] v_age=data2$v_age [ j ]

i = 0 . 0 1

n e i g h b _ s i z e = sum ( datawindow ( age , v_age , i ) $days ) w h i l e ( ( n e i g h b _ s i z e < 365∗k [m] ) &

( ( age−i >min ( d a t a 2 $ a g e ) ) | ( age+i <max( d a t a 2 $ a g e ) ) ) ) { i = i + 0 . 1

n e i g h b _ s i z e = sum ( datawindow ( age , v_age , i ) $days ) }

age_sample = datawindow ( age , v_age , i ) $ a g e v_age_sample = datawindow ( age , v_age , i ) $v_age c l a i m f r e q _ s a m p l e = datawindow ( age , v_age , i ) $ f r e q days_sample = datawindow ( age , v_age , i ) $days /365

fnL2= f u n c t i o n ( x ) { a=x [ 1 ] ;

b1=x [ 2 ] ; b2=x [ 3 ] ;

fnL_2 ( a=x [ 1 ] , b1=x [ 2 ] , b2=x [ 3 ] , age=age_sample , v_age=v_age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample )

}

f n L g r a d 2 = f u n c t i o n ( x ) { a=x [ 1 ] ;

b1=x [ 2 ] ; b2=x [ 3 ] ;

fnLgrad_2 ( a=x [ 1 ] , b1=x [ 2 ] , b2=x [ 3 ] , age=age_sample , v_age=v_age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample )

}

params=optim ( par=c ( 1 , 0 , 0 ) , f n=fnL2 , g r=fnLgrad2 , method="BFGS" ) d a t a 2 $ a 2 [ j ] = round ( params$par [ 1 ] , d i g i t s =8)

data2$b 12 [ j ] = round ( params$par [ 2 ] , d i g i t s =8) data2$b 22 [ j ] = round ( params$par [ 3 ] , d i g i t s =8) d a t a 2 $ n e i g h b 2 [ j ] = n e i g h b _ s i z e

i f ( p a r a m s $ c o n v e r g e n c e != 0 ) { c a t ( " j =" , j , " , age =" , age , " , v_age =" ,v_age , " , n e i g h b =" , n e i g h b _ s i z e , " NOT CONVERGED" ) } }

data2$lambda_new2 = round ( d a t a 2 $ a 2+da ta2$b12∗d a t a 2 $ a g e+

data2$b 22∗data2$v_age , d i g i t s =8)

t e s t _ d a t a 2 = s q l d f ( " s e l e c t a . age , a . v_age , a . f r e q , a . days , b . lambda_y , b . lambda_new2 , a . lambda_y a s lambda_actual from t e s t _ d a t a a s a l e f t j o i n d a t a 2 a s b

on a . age = b . age and a . v_age = b . v_age " )

#############################################

#l e i a m e m u d e l i vea

e2_semipar2 = sum ( t e s t _ d a t a 2 $ d a y s∗( t e s t _ d a t a 2 $ l a m b d a _ a c t u a l− test_data2$lambda_new2 ) ^ 2 / 3 6 5 , na . rm=TRUE) ; e2_semipar2

m a h a l a n o b i s [m]= e2_semipar2

p r i n t ( p a s t e 0 ( " Tulemus on : " , e2_semipar2 ) ) }

Lihtlitsents lõputöö reprodutseerimiseks ja lõpu-töö üldsusele kättesaadavaks tegemiseks

Mina, Liina Muru (sünnikuupäev: 23.02.1991)

1. annan Tartu Ülikoolile tasuta loa (lihtlitsentsi) enda loodud teose

„Kindlustuskahjude sageduse analüüs lokaalse regressiooni ja k-lähima naabri meetodil“,

mille juhendaja on Meelis Käärik,

(a) reprodutseerimiseks säilitamise ja üldsusele kättesaadavaks tege-mise eesmärgil, sealhulgas digitaalarhiivi DSpace-is lisatege-mise ees-märgil kuni autoriõiguse kehtivuse tähtaja lõppemiseni;

(b) üldsusele kättesaadavaks tegemiseks Tartu Ülikooli veebikeskkon-na kaudu, sealhulgas digitaalarhiivi DSpace’i kaudu kuni autori-õiguse kehtivuse tähtaja lõppemiseni.

2. olen teadlik, et punktis 1 nimetatud õigused jäävad alles ka autorile.

3. kinnitan, et lihtlitsentsi andmisega ei rikuta teiste isikute intellektuaaloman-di ega isikuandmete kaitse seadusest tulenevaid õigusi.

Tartus, 13.05.2015

Im Dokument Magistritöö(30EAP)Juhendaja:dotsentMeelisKäärik k -lähimanaabrimeetodil Kindlustuskahjudesageduseanalüüslokaalseregressioonija LiinaMuru (Seite 34-53)