5.4 Tulemused
5.4.2 Kahe regressoriga lokaalne regressioon
Kahe regressoriga lokaalse regressiooni korral kasutame hindamiseks eelmises peatükis leitud võrrandeid (4.2). Võtame regressoriteks omaniku ja auto va-nused. Tabelis 5.4 näeme saadud tulemusi.
Mahalanobise kauguse korral on kasutatud kovariatsioonimaatriksit, kus age tähistab omaniku vanust ja v.age auto vanust.
C =cov(age, v.age) = 151.62321 −3.980510
−3.98051 7.568443
!
Kahemõõtmelisel juhul on näha erinevust eukleidilise ja Mahalanobise kau-guse vahel. Näeme, et Mahalanobise kaugus annab suurema osa k väärtuste korral parema tulemuse, vaid k = 3500 ja k= 4000 korral jääb ta eukleidili-sele alla. Alates k = 6000jõutakse olukorrani, kus k →n ja saame globaalse
k Eukleidiline kaugus Mahalanobise kaugus
500 78.161971 78.084263
1000 77.536584 77.396354
1500 77.271121 77.136557
2000 77.557201 77.422963
2500 77.713830 77.593561
3000 77.640166 77.616465
3500 77.983807 78.044727
4000 78.200291 78.211248
4500 78.546014 78.464993
5000 78.507941 78.506341
5500 78.606995 78.551386
6000 78.654487 78.654487
6500 78.654487 78.654487
7000 78.654487 78.654487
Tabel 5.4: Vea e väärtused kahe regressoriga lokaalse regressiooni korral.
saadud tulemuse, mille viga on 77.5. Eukleidilise kauguse korral saadakse sellest parem tulemus vaid k = 1500 korral, mis on ka eukleidilise kaugu-se parim tulemus 77.27. Mahalanobikaugu-se kaugukaugu-sega saadakkaugu-se CART-meetodist parem tulemus alates k= 1000 kunik = 2000. Ülejäänud k-väärtuste korral on mõlema kaugusega leitud lokaalse regressiooni hinnangute vead suuremad kui CART-meetodil leitud viga. Ka globaalse regressiooni viga 78.65 on suu-rem kui CART-meetodil leitud. Parima tulemuse kahe regressoriga lokaalse regressiooni korral saime Mahalanobise kaugusega k = 1500, kuse = 77.14.
Joonis 5.3: Vea e suurused kahe regressoriga lokaalse regressiooni korral.
Punasega on joonisele kantud CART-meetodi viga väärtusega 77.5. Rohe-lise joonega on toodud eukleidiRohe-lise kaugusega leitud mudeli vead ja musta joonega Mahalanobise kaugusega leitud mudeli vead. On näha, et kahemõõt-melisel juhul annab Mahalanobise kaugus väiksema vea, sest arvesse võetakse tunnustevahelist kovariatsiooni, mis annab eelise eukleidilise kauguse ees. Vi-gade graafikud on sarnase kujuga, sest korrelatsioonimaatriksist
R =cor(age, v.age) = 1 −0.117504
−0.117504 1
! ,
kus age on omaniku vanus ja v.age auto vanus, näeme, et tunnuste vahel on negatiivne ning üpris väike korrelatsioon. Seetõttu annavad Mahalanobise ja eukleidiline kaugus sarnased tulemused.
CART-meetodi ees, kuid tähelepanu tuleb pöörata k valikule, et saavutada väiksem viga. Samas võimaldavad dünaamilised klassipiirid, mis määratak-se lokaalmääratak-se regressiooniga, vähendada hinnašoki tekkimimääratak-se võimalust, mis on kindlustuspoliisi sõlmija jaoks kindlasti eelistatud.
Eukleidiline kaugus e Lokaalne regressioon k = 1500 77.27 Lokaalne regressioon k = 2500 77.71 Lokaalne regressioon k = 3500 77.98
Mahalanobise kaugus
Lokaalne regressioon k = 1500 77.14 Lokaalne regressioon k = 2500 77.59 Lokaalne regressioon k = 3500 78.04 Globaalne regressioon 78.65
CART-meetod 77.5
Tabel 5.5: Erinevate meetodite vead kahe sisendtunnuse korral.
Kokkuvõte
Töö eesmärgiks oli uurida, kas lokaalse regressiooni ja dünaamiliste klassipii-ride kasutamine annab täpsemaid tulemusi kindlustuskahjude sageduse hin-damisel, kui CART-meetod. Selleks tutvustasime töö esimeses osas k-lähima naabri meetodit. Tegu on mitteparameetrilise meetodiga, mida saab kasu-tada nii klassifitseerimiseks kui regressiooniks. Antud töös kasutasime seda koos lokaalse regressiooniga. Sageli on meetodi puhul elementaarseks valikuks eukleidiline kaugus, kuid antud töös uurisime ka Mahalanobise kauguse ka-sutamise võimalusi ning omadusi.
Lisaks erinevatele kauguse defineerimise võimalustele on lokaalse regressiooni korral mitu võimalust regressorite valikuks. Nii leidsimegi kahjude esinemise sageduse hinnangute valemid nii ühe, kahe kui ka m regressoriga juhul. Ees-ti kaskokindlustuse andmetel proovisime ühe ja kahe regressoriga hindamist, kus esimesel juhul oli regressoriks omaniku või auto vanus ning kahemõõtme-lisel juhul võtsime arvesse mõlemad. Ühemõõtmekahemõõtme-lisel juhul on eukleidilise ja Mahalanobise kaugusega leitud tulemused võrdsed, sest kovariatsioonimaat-riks ühemõõtmelisel juhul on vaadeldavate punktide jaotuse dispersioon. Ka-hemõõtmelisel juhul olid tulemused erinevad ning suurema osa k väärtuste korral saime Mahalanobise kaugusega paremad tulemused.
Ühemõõtmelisel juhul on lokaalse regressiooniga leitud mudeli vea suurus suurema osakväärtuste korral väiksem kui CART-meetodil leitud viga, kuid kahemõõtmelisel juhul on vaid paari k väärtuse korral võimalik saada
pa-rem viga. Seega vaadeldud andmete korral on ühemõõtmelisel juhul lokaalse regressiooniga hindamisel ehk dünaamiliste klassipiiride kasutamisel nähtav eelis CART-meetodi ees, kuid kahemõõtmelisel juhul annab see paremad tule-mused vaid väikses k-väärtuste piirkonnas. Samas vähendavad dünaamilised piirid hinnašoki esinemise võimalust ning kindlustusmaksete muutus on su-juvam.
Antud teemal on võimalus uurimist jätkata suurema arvu regressorite hul-gaga mudelite analüüsimisel, mille kohta antud töös küll leiti hindamiseks vajalikud võrrandid kuid praktiliste andmete peal analüüsini ei jõutud.
Kirjandus
Cunningham, P; Delany, S. J (2007) „k-Nearest Neighbour Classifiers", Technical Report UCD-CSI-2007-4
Fix, E; Hodges, J.L (1989) „Discriminatory Analysis. Nonparametric Disc-rimination: Consistency Properties“,International Statistical Reviw, 57 (3), 238-247
Gnanadesikan, R; Kettenring, J.R (1972) „Robust Estimates, Residuals, and Outlier Detection with Multiresponse Data", Biometrics, 28 (1), 81-124 Hastie, T; Tibshirani, R; Friedman, J (2008) „The elements of statistical learning: data mining, inference and prediction", Springer, 14-18
Käärik, M; Kaasik, A (2012) „On premium estimation using the C&RT/Poisson model and its extensions",Lithuanian Journal of Statistics, 51 (1), 36-50
Maesschalck, R. De; JouanRimbaud, D; Massart, D. L (2000) "Tutorial -The Mahalanobis distance", Chemometrics and Intelligent Laboratory Sys-tems, 50, 1-18
Pärna, K; Kangro, R; Kaasik, A; Möls, M (2012) „K-Nearest Neighbors as Pricing Tool in Insurance: a Comparative Study", Multivariate Statistics:
Theory and Applications, 130-131
Wilson, D.R; Martinez, T.R (1997) „Improved Heterogeneous Distance Functions", Journal of Artificial intelligence Research, 6, 1-34
Xiaoyu, S; Jingke, X; Zhichao, Y; Huanliang, S (2014) „RkNN Query Algo-rithm Based on K-order Voronoi Diagram",International Journal of Control and Automation, 7 (9), 11-26
Lisa: Kasutatud R-i kood
# ühe r e g r e s s o r i g a l o k a a l n e r e g r e s s i o o n
# age − omaniku vanus
# v_age − s õ i d u k i vanus
# c l a i m f r e q − k a h j u s a g e d u s
# days − k i n d l u s t u s p ä evade a r v
# a , b1 , b2 − r e g r e s s i o o n i p a r a m e e t r i d
#Võ r r a n d i d toodud j u h u l , k u i r e g r e s s o r i k s omaniku vanus
#Auto v a n u s e l e ü l e m i n e k u k s asendada vä ä r t u s e d
#age vä ä r t u s e g a v_age
fnL_1 = f u n c t i o n ( a , b1 , age , c l a i m f r e q , days ) {−
sum ( c l a i m f r e q∗l o g ( a+b1∗age ))+sum ( days∗( a+b1∗age ) ) }
#võ r r a n d i d STH l e i d m i s e k s
fnLgrad_1 = f u n c t i o n ( a , b1 , age , c l a i m f r e q , days ) { c(−sum ( c l a i m f r e q / ( a+b1∗age ))+sum ( days ) ,
−sum ( c l a i m f r e q∗age / ( a+b1∗age ))+sum ( days∗age ) ) }
#v a s t a v a d võ r r a n d i d k o n k r e e t s e t e andmete k o r r a l
fnL_kon_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;
b1=x [ 2 ] ;
fnL_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample ,
c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }
fnLgrad_kon_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;
b1=x [ 2 ] ;
fnLgrad_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }
##############################################
# andmestiku s i s s e l u g e m i n e j a mõ ned a b i t e i s e n d u s e d . . .
# t r e e n i n g a n d m e d
d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , sum ( k a h j u d e a r v ) a s f r e q ,
sum ( p o l i i s _ k e h t i n u d ) a s days ,
sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t r e e n i n g p o l i i s i d
where i n i m v a n u s != ’NA’
group by i n i m v a n u s " )
#a u t o vanus r e g r e s s o r i k s
#d a t a = s q l d f ( " s e l e c t a u t o v a n u s a s v_age ,
# sum ( k a h j u d e a r v ) a s f r e q ,
# sum ( p o l i i s _ k e h t i n u d ) a s days ,
# sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,
# 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y
# from t r e e n i n g p o l i i s i d
# where a u t o v a n u s != ’NA’
# group by a u t o v a n u s " )
######################################
#k e s k v ä ä r t u s e d j a d i s p e r s i o o n i d age_mean = sum ( d a t a $ a g e∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; age_mean
age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗
sum ( d a t a $ d a y s∗( d a t a $ a g e−age_mean ) ^ 2 ) ; age_var
#v_age_mean = sum ( data$v_age∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ;
#v_age_mean
#v_age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗
#(data$v_age−v_age_mean ) ^ 2 ) ; v_age_var
######################################
# testandmed
t e s t _ d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , sum ( k a h j u d e a r v ) a s f r e q ,
sum ( p o l i i s _ k e h t i n u d ) a s days ,
sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t e s t p o l i i s i d
where i n i m v a n u s != ’NA’
group by i n i m v a n u s " )
#a u t o vanus r e g r e s s o r i k s
#t e s t _ d a t a = s q l d f ( " s e l e c t a u t o v a n u s a s v_age ,
# sum ( k a h j u d e a r v ) a s f r e q ,
# sum ( p o l i i s _ k e h t i n u d ) a s days ,
# sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,
# 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y
# from t e s t p o l i i s i d
# where a u t o v a n u s != ’NA’
# group by a u t o v a n u s " )
######################################################
d a t a 2 a g e=d a t a . frame ( age=c ( min ( d a t a $ a g e ) : max ( d a t a $ a g e ) ) ) d a t a 2 = s q l d f ( " s e l e c t a . age , c . f r e q , c . days , c . lambda_y
from d a t a 2 a g e a s a
l e f t j o i n d a t a a s c on a . age=c . age " )
#a u t o vanus r e g r e s s o r i k s
#d a t a 2 a g e=d a t a . frame ( age=c ( min ( data$v_age ) : max( data$v_age ) ) )
#d a t a 2 = s q l d f ( " s e l e c t a . v_age , c . f r e q , c . days , c . lambda_y
# from data2v_age a s a
# l e f t j o i n d a t a a s c on a . v_age=c . v_age " )
#e r i n e v a d k−vä ä r t u s e d , s u u r e n d a t a k s e sammuga 500 k=c ( 5 0 0 , 1 0 0 0 , 1 5 0 0 , 2 0 0 0 , 2 5 0 0 , 3 0 0 0 , 3 5 0 0 , 4 0 0 0
, 4 5 0 0 , 5 0 0 0 , 5 5 0 0 , 6 0 0 0 , 6 5 0 0 , 7 0 0 0 ) n i m e k i r i=r e p (NA, 1 4 )
f o r (m i n ( 1 : l e n g t h ( k ) ) ) {
## n a a b r u s e l e i d m i s e f u n k t s i o o n
datawindow =f u n c t i o n ( age , i 1 ) {
window = d a t a 2 [ round ( abs ( d a t a 2 $ a g e−age ))<= i 1 &
! i s . na ( d a t a 2 $ d a y s ) , ] #e u k l e i d i l i n e window
}
####################################################
f o r ( j i n ( 1 : l e n g t h ( d a t a 2 $ a g e ) ) ) { age=d a t a 2 $ a g e [ j ]
i = 0 . 0 1
n e i g h b _ s i z e = sum ( datawindow ( age , i ) $days ) w h i l e ( ( n e i g h b _ s i z e < 365∗k [m] ) &
( ( age−i >min ( d a t a 2 $ a g e ) ) | ( age+i <max( d a t a 2 $ a g e ) ) ) ) { i = i + 0 . 1
n e i g h b _ s i z e = sum ( datawindow ( age , i ) $days ) }
age_sample = datawindow ( age , i ) $ a g e
c l a i m f r e q _ s a m p l e = datawindow ( age , i ) $ f r e q days_sample = datawindow ( age , i ) $days /365 fnL2_1 = f u n c t i o n ( x ) {
a=x [ 1 ] ; b1=x [ 2 ] ;
fnL_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample
, c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }
fnLgrad2_1 = f u n c t i o n ( x ) { a=x [ 1 ] ;
b1=x [ 2 ] ;
fnLgrad_1 ( a=x [ 1 ] , b1=x [ 2 ] , age=age_sample
, c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample ) }
params=optim ( par=c ( 1 , 0 ) , f n=fnL2_1 , g r=fnLgrad2_1 , method="BFGS" )
d a t a 2 $ a 2 [ j ] = round ( params$par [ 1 ] , d i g i t s =8) data2$b 12 [ j ] = round ( params$par [ 2 ] , d i g i t s =8) d a t a 2 $ n e i g h b 2 [ j ] = n e i g h b _ s i z e
i f ( p a r a m s $ c o n v e r g e n c e != 0 ) { c a t ( " j =" , j , " ,
age =" , age , " , n e i g h b =" , n e i g h b _ s i z e , " NOT CONVERGED" ) } }
data2$lambda_new2 = round ( d a t a 2 $ a 2+da ta2$b12∗d a t a 2 $ a g e , d i g i t s =8)
t e s t _ d a t a 2 = s q l d f ( " s e l e c t a . age , a . f r e q , a . days , b . lambda_y , b . lambda_new2 ,
a . lambda_y a s lambda_actual from t e s t _ d a t a a s a l e f t j o i n d a t a 2 a s b on a . age = b . age " )
#################################################
e2_semipar2 = sum ( t e s t _ d a t a 2 $ d a y s∗
( t e s t _ d a t a 2 $ l a m b d a _ a c t u a l−test_data2$lambda_new2 )
^2/ 365 , na . rm=TRUE) ; e2_semipar2 #l e i a m e m u d e l i vea n i m e k i r i [m]= e2_semipar2
p r i n t ( p a s t e 0 ( " Tulemus on : " , e2_semipar2 ) ) }
####################################################
####################################################
####################################################
#Kahe r e g r e s s o r i g a l o k a a l n e r e g r e s s i o o n
fnL_2 = f u n c t i o n ( a , b1 , b2 , age , v_age , c l a i m f r e q , days ) {
−sum ( c l a i m f r e q∗l o g ( a+b1∗age+b2∗v_age ))+
sum ( days∗( a+b1∗age+b2∗v_age ) ) }
#Võ r r a n d i d STH l e i d m i s e k s
fnLgrad_2 = f u n c t i o n ( a , b1 , b2 , age , v_age , c l a i m f r e q , days ) { c(−sum ( c l a i m f r e q / ( a+b1∗age+b2∗v_age ))+sum ( days ) ,
−sum ( c l a i m f r e q∗age / ( a+b1∗age+b2∗v_age ))+sum ( days∗age ) ,
−sum ( c l a i m f r e q∗v_age / ( a+b1∗age+b2∗v_age ))+sum ( days∗v_age ) ) }
#Treeningandmed
d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , a u t o v a n u s a s v_age ,
sum ( k a h j u d e a r v ) a s f r e q ,
sum ( p o l i i s _ k e h t i n u d ) a s days ,
sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d ,
365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y
from t r e e n i n g p o l i i s i d
where i n i m v a n u s != ’NA’ and a u t o v a n u s != ’NA’
group by inimvanus , a u t o v a n u s " )
#k e s k v ä ä r t u s e d j a d i s p e r s i o o n i d
age_mean = sum ( d a t a $ a g e∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; age_mean
age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗ ( d a t a $ a g e−age_mean ) ^ 2 ) ; age_var
v_age_mean = sum ( data$v_age∗d a t a $ d a y s ) / sum ( d a t a $ d a y s ) ; v_age_mean
v_age_var = 1 / ( sum ( d a t a $ d a y s )−1)∗sum ( d a t a $ d a y s∗ ( data$v_age−v_age_mean ) ^ 2 ) ; v_age_var
cov_2=cov . wt ( d a t a . frame ( d a t a $ a g e , data$v_age ) , d a t a $ d a y s /sum ( d a t a $ d a y s ) , c o r=TRUE) $cov
#########################################################
#Testandmed
t e s t _ d a t a = s q l d f ( " s e l e c t i n i m v a n u s a s age , a u t o v a n u s a s v_age ,
sum ( k a h j u d e a r v ) a s f r e q ,
sum ( p o l i i s _ k e h t i n u d ) a s days ,
sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_d , 365∗sum ( k a h j u d e a r v ) / sum ( p o l i i s _ k e h t i n u d ) a s lambda_y from t e s t p o l i i s i d
where i n i m v a n u s != ’NA’ and a u t o v a n u s ! = ’NA’
group by inimvanus , a u t o v a n u s " )
######################################################
d a t a 2 a g e = d a t a . frame ( age=c ( min ( d a t a $ a g e ) : max( d a t a $ a g e ) ) )
d a t a 2 v a g e = d a t a . frame ( v_age=c ( min ( data$v_age ) : max( data$v_age ) ) )
d a t a 2 = s q l d f ( " s e l e c t a . age , b . v_age , c . f r e q , c . days , c . lambda_y from d a t a 2 a g e a s a
l e f t j o i n d a t a 2 v a g e a s b
l e f t j o i n d a t a a s c on a . age=c . age and b . v_age = c . v_age " )
#e r i n e v a d k−vä ä r t u s e d , s u u r e n d a t a k s e sammuga 500 k=c ( 5 0 0 , 1 0 0 0 , 1 5 0 0 , 2 0 0 0 , 2 5 0 0 , 3 0 0 0 , 3 5 0 0 , 4 0 0 0 , 4 5 0 0
, 5 0 0 0 , 5 5 0 0 , 6 0 0 0 , 6 5 0 0 , 7 0 0 0 ) m a h a l a n o b i s=r e p (NA, 1 4 ) f o r (m i n ( 1 : l e n g t h ( k ) ) ) {
## n a a b r u s e l e i d m i s e f u n k t s i o o n ( datawindow ) datawindow =f u n c t i o n ( age , v_age , i 1 ) {
#d i s p e r s i o o n i d e g a k o r r i g e e r i t u d e u k l e i d i l i n e
#d a t a 2 $ k a u g u s =( d a t a 2 $ a g e−age ) ^ 2 / ( age_var∗( i 1 )^2)+
( data2$v_age−v_age ) ^ 2 / ( v_age_var∗( i 1 ) ^ 2 )
#window=d a t a 2 [ data2$kaugus <1 & ! i s . na ( d a t a 2 $ d a y s ) , ]
#m a h a l a n o b i s
d a t a 2 $ k a u g u s=s q r t ( m a h a l a n o b i s ( c b i n d ( d a t a 2 $ a g e , data2$v_age ) , c b i n d ( age , v_age ) , cov_2 ) )
window=d a t a 2 [ data2$kaugus<i 1 & ! i s . na ( d a t a 2 $ d a y s ) , ] window
}
####################################################
f o r ( j i n ( 1 : l e n g t h ( d a t a 2 $ a g e ) ) ) {
age=d a t a 2 $ a g e [ j ] v_age=data2$v_age [ j ]
i = 0 . 0 1
n e i g h b _ s i z e = sum ( datawindow ( age , v_age , i ) $days ) w h i l e ( ( n e i g h b _ s i z e < 365∗k [m] ) &
( ( age−i >min ( d a t a 2 $ a g e ) ) | ( age+i <max( d a t a 2 $ a g e ) ) ) ) { i = i + 0 . 1
n e i g h b _ s i z e = sum ( datawindow ( age , v_age , i ) $days ) }
age_sample = datawindow ( age , v_age , i ) $ a g e v_age_sample = datawindow ( age , v_age , i ) $v_age c l a i m f r e q _ s a m p l e = datawindow ( age , v_age , i ) $ f r e q days_sample = datawindow ( age , v_age , i ) $days /365
fnL2= f u n c t i o n ( x ) { a=x [ 1 ] ;
b1=x [ 2 ] ; b2=x [ 3 ] ;
fnL_2 ( a=x [ 1 ] , b1=x [ 2 ] , b2=x [ 3 ] , age=age_sample , v_age=v_age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample )
}
f n L g r a d 2 = f u n c t i o n ( x ) { a=x [ 1 ] ;
b1=x [ 2 ] ; b2=x [ 3 ] ;
fnLgrad_2 ( a=x [ 1 ] , b1=x [ 2 ] , b2=x [ 3 ] , age=age_sample , v_age=v_age_sample , c l a i m f r e q=c l a i m f r e q _ s a m p l e , days=days_sample )
}
params=optim ( par=c ( 1 , 0 , 0 ) , f n=fnL2 , g r=fnLgrad2 , method="BFGS" ) d a t a 2 $ a 2 [ j ] = round ( params$par [ 1 ] , d i g i t s =8)
data2$b 12 [ j ] = round ( params$par [ 2 ] , d i g i t s =8) data2$b 22 [ j ] = round ( params$par [ 3 ] , d i g i t s =8) d a t a 2 $ n e i g h b 2 [ j ] = n e i g h b _ s i z e
i f ( p a r a m s $ c o n v e r g e n c e != 0 ) { c a t ( " j =" , j , " , age =" , age , " , v_age =" ,v_age , " , n e i g h b =" , n e i g h b _ s i z e , " NOT CONVERGED" ) } }
data2$lambda_new2 = round ( d a t a 2 $ a 2+da ta2$b12∗d a t a 2 $ a g e+
data2$b 22∗data2$v_age , d i g i t s =8)
t e s t _ d a t a 2 = s q l d f ( " s e l e c t a . age , a . v_age , a . f r e q , a . days , b . lambda_y , b . lambda_new2 , a . lambda_y a s lambda_actual from t e s t _ d a t a a s a l e f t j o i n d a t a 2 a s b
on a . age = b . age and a . v_age = b . v_age " )
#############################################
#l e i a m e m u d e l i vea
e2_semipar2 = sum ( t e s t _ d a t a 2 $ d a y s∗( t e s t _ d a t a 2 $ l a m b d a _ a c t u a l− test_data2$lambda_new2 ) ^ 2 / 3 6 5 , na . rm=TRUE) ; e2_semipar2
m a h a l a n o b i s [m]= e2_semipar2
p r i n t ( p a s t e 0 ( " Tulemus on : " , e2_semipar2 ) ) }
Lihtlitsents lõputöö reprodutseerimiseks ja lõpu-töö üldsusele kättesaadavaks tegemiseks
Mina, Liina Muru (sünnikuupäev: 23.02.1991)
1. annan Tartu Ülikoolile tasuta loa (lihtlitsentsi) enda loodud teose
„Kindlustuskahjude sageduse analüüs lokaalse regressiooni ja k-lähima naabri meetodil“,
mille juhendaja on Meelis Käärik,
(a) reprodutseerimiseks säilitamise ja üldsusele kättesaadavaks tege-mise eesmärgil, sealhulgas digitaalarhiivi DSpace-is lisatege-mise ees-märgil kuni autoriõiguse kehtivuse tähtaja lõppemiseni;
(b) üldsusele kättesaadavaks tegemiseks Tartu Ülikooli veebikeskkon-na kaudu, sealhulgas digitaalarhiivi DSpace’i kaudu kuni autori-õiguse kehtivuse tähtaja lõppemiseni.
2. olen teadlik, et punktis 1 nimetatud õigused jäävad alles ka autorile.
3. kinnitan, et lihtlitsentsi andmisega ei rikuta teiste isikute intellektuaaloman-di ega isikuandmete kaitse seadusest tulenevaid õigusi.
Tartus, 13.05.2015