• Keine Ergebnisse gefunden

Data Cube

N/A
N/A
Protected

Academic year: 2022

Aktie "Data Cube"

Copied!
82
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Data Cube

! !

" # $ % &

' (!& ! ) * # $

+ , * !! ** ) * -.

Dank an Hanna Köpcke!

(2)

On-line Analytical Processing (OLAP)

, / ) ** 0 * 1

# !

2 3 !

2 4 . ) #

2 5 * * ) **

2 6* ) ** )

3 !

(3)

OLAP-Werkzeuge

2 # ! 7 ) * %) ! * ! **

2 () 8 9 : ** ; < !

2 ( # . 7 ) %) ! *

# * ! % ! )

2 # ! * * ) . ) - ) #

) 7 ** # ! *

(4)

Beispiel: Autoverkäufe

Modell Jahr Farbe Anzahl

Opel 1990 rot 5

Opel 1990 weiß 87

Opel 1990 blau 62

Opel 1991 rot 54

Opel 1991 weiß 95

Opel 1991 blau 49

Opel 1992 rot 31

Opel 1992 weiß 54

Opel 1992 blau 71

Ford 1990 rot 64

Ford 1990 weiß 62

Ford 1990 blau 63

Ford 1991 rot 52

Ford 1991 weiß 9

Ford 1991 blau 55

Ford 1992 rot 27

Ford 1992 weiß 62

Ford 1992 blau 39

(5)

Aggregation in SQL

2 . /

COUNT(), SUM(), MIN(), MAX(), AVG()

Beispiel: SELECT AVG(Anzahl) FROM Autoverkäufe

2 9 *- ) =

Beispiel: SELECT COUNT(DISTINCT Modell) FROM Autoverkäufe

2 . 8 =

2 ! !

GROUP BY

(6)

GROUP BY

SELECT Modell, Jahr, SUM(Anzahl) FROM Autoverkäufe

GROUP BY Modell, Jahr

2# > 7 ) !<1 ) ? ! )

* 7< ! &&

2@ ) && 7 ) 3 .

2# * * * > ! =

) 8 ) - ) * 7< !

(7)

Beispiel: GROUP BY

SELECT Modell, Jahr, SUM(Anzahl) FROM Autoverkäufe

GROUP BY Modell, Jahr

Modell Jahr Anzahl

Opel 1990 154

Opel 1991 198

Opel 1992 156

Ford 1990 189

Ford 1991 116

Ford 1992 128

Modell Jahr Farbe Anzahl

Opel 1990 rot 5

Opel 1990 weiß 87

Opel 1990 blau 62

Opel 1991 rot 54

Opel 1991 weiß 95

Opel 1991 blau 49

Opel 1992 rot 31

Opel 1992 weiß 54

Opel 1992 blau 71

Ford 1990 rot 64

Ford 1990 weiß 62

Ford 1990 blau 63

Ford 1991 rot 52

Ford 1991 weiß 9

Ford 1991 blau 55

Ford 1992 rot 27

Ford 1992 weiß 62

Ford 1992 blau 39

(8)

Roll Up

- *- ) - # * )

2 5 ! ) ) * # * ) * A &

2 B ) * # * ) * A # # 7

*& / 9 .<

2 & )

2 # 7 ) - 0 ) ) - @

) - 3

2 ) 5 . *8 7 ) 8 * C ) * 0 )

* C ) ! @ C ) 3 *

) 7 ) 5 . *8 ) * - 0 ) *

) @ * * !! ) ) *

) 5 . *8 ) 0 ) -

(9)

GROUP BY: Roll Up

Modell Jahr Farbe Anzahl nach Modell, Jahr, Farbe

Anzahl nach Modell, Jahr

Anzahl nach Modell

Opel 1990 rot 5

weiß 87

blau 62

154

1991 rot 54

weiß 95

blau 49

198

1992 rot 31

weiß 54

blau 71

156

508

(10)

Probleme mit GROUP BY: Roll Up

2 > * - ) ! 7 ) 3 )

DE %= F . - ** * .

2 # , ) & 7<- * ! ) , )

2 ! ) * 4& 7 - * ) & 8 8 9 ! )

7 ) ) %=

2 # %= & <* ) 0 ) )

- 7 )

*& /

) & 3 ) ) ** ) 8 ) *

, ) 5 . *8 ) 7 1 ) *

8 * !! ** * )

(11)

GROUP BY: Roll Up mit ALL

Modell Jahr Farbe Anzahl

Opel 1990 rot 5

Opel 1990 weiß 87

Opel 1990 blau 62

Opel 1990 ALL 154

Opel 1991 rot 54

Opel 1991 weiß 95

Opel 1991 blau 49

Opel 1991 ALL 198

Opel 1992 rot 31

Opel 1992 weiß 54

Opel 1992 blau 71

Opel 1992 ALL 156

Opel ALL ALL 506

8 ) > ! /

SELECT Modell, ALL, ALL, SUM(Anzahl) FROM Autoverkäufe

WHERE Modell = ‘Opel‘

GROUP BY Modell UNION

SELECT Modell, Jahr, ALL, SUM(Anzahl) FROM Autoverkäufe

WHERE Modell = ‘Opel‘

GROUP BY Modell, Jahr UNION

SELECT Modell, Jahr, Farbe, SUM(Anzahl) FROM Autoverkäufe

WHERE Modell = ‘Opel‘

GROUP BY Modell, Jahr, Farbe

(12)

Probleme mit GROUP BY: Roll Up

2 *& 7 - * ) ) ! * * &

2 # ! * ) *

2 & * *6!! *- /

5 .< * ) - @ - - 3

(13)

Kreuztabellen

6!! *- # * ! ) ! * #

)

Opel 1990 1991 1992 Total (ALL)

rot 5 54 31 90

weiß 87 95 54 236

blau 62 49 71 182

Total (ALL) 154 198 156 508

# * ? 8 * 87 ) ! *

E !! ! - ) ! ) 8 . !! C ) * 0 )

7 8

0 < ) ) ! *

(14)

%) ! * * ) * ? 8 &

# G# # $ * .

# # # $ * ! ! .

# # # $ * ? 8

# # # $ * = ! ) * -

*- ) ) ? 8

D 6 $ ) *7 6! H H I F

Aggregation

Summe

GROUP BY (mit Gesamtsumme) rot

weiß blau Summe

rot weiß

blau Modell

Farbe Opel Ford

Kreuztabelle

Data Cube mit allen Aggregationen

Jahr OpelFord

Modell

& Jahr

Modell

Modell & Farbe Farbe & Jahr

Farbe Summe

1990 1991

1992

(15)

Der CUBE-Operator

2 *& / SELECT Modell, Jahr, Farbe, SUM(Anzahl) FROM Autoverkäufe

GROUP BY CUBE Modell, Jahr, Farbe

2 # $ % & 8 > ) *<! -

<

2 * 7 ) * !B - ? !

) -

2 # 8 ) > ) ) )

8! ) 8 ) &

2 7 ) * -

2 $ $ $ ) ? ) < ) ) * )

? ) < ) * ) # $ % ∏∏∏∏D$ J F

(16)

Modell Jahr Farbe Anzahl

Opel 1990 rot 5

Opel 1990 weiß 87

Opel 1990 blau 62

Opel 1991 rot 54

Opel 1991 weiß 95

Opel 1991 blau 49

Opel 1992 rot 31

Opel 1992 weiß 54

Opel 1992 blau 71

Ford 1990 rot 64

Ford 1990 weiß 62

Ford 1990 blau 63

Ford 1991 rot 52

Ford 1991 weiß 9

Ford 1991 blau 55

Ford 1992 rot 27

Ford 1992 weiß 62

Ford 1992 blau 39

(17)

Modell Jahr Farbe Anzahl

Opel 1990 rot 5

Opel 1990 weiß 87

Opel 1990 blau 62

Opel 1990 ALL 154

Opel 1991 rot 54

Opel 1991 weiß 95

Opel 1991 blau 49

Opel 1991 ALL 198

Opel 1992 rot 31

Opel 1992 weiß 54

Opel 1992 blau 71

Opel 1992 ALL 156

Opel ALL rot 90

Opel ALL weiß 236

Opel ALL blau 182

Opel ALL ALL 508

Ford 1990 rot 64

Ford 1990 weiß 72

Ford 1990 blau 63

Ford 1990 ALL 189

Ford 1991 rot 52

Ford 1991 weiß 9

Ford 1991 blau 55

Ford 1991 ALL 116

Modell Jahr Farbe Anzahl

Ford 1992 rot 27

Ford 1992 weiß 62

Ford 1992 blau 39

Ford 1992 ALL 128

Ford ALL rot 143

Ford ALL weiß 133

Ford ALL blau 157

Ford ALL ALL 433

ALL 1990 rot 69

ALL 1990 weiß 149

ALL 1990 blau 125

ALL 1990 ALL 343

ALL 1991 rot 106

ALL 1991 weiß 104

ALL 1991 blau 104

ALL 1991 ALL 314

ALL 1992 rot 58

ALL 1992 weiß 116

ALL 1992 blau 110

ALL 1992 ALL 284

ALL ALL rot 233

ALL ALL weiß 369

ALL ALL blau 339

ALL ALL ALL 941

(18)

Implementationsalternativen

2 6* *- 0 * ) * * ! # $ /

% * 7 8

% & - & 8 )

2 ? 0 * /

% C ) , 7 ) ) * ) ) -

% . 8 *< 8 - & - & 8

% *- - 7 8

2 0 * 9 > ) * # $ /

% = 9 , * ) * ( ) , -

% ) * , ! : < ; ,

% , ) %= * ) <

% !/ = - , ) * # $ ! * K

% , ) * # $ *& - D - F

(19)

Abhängigkeit von Sichten

# < . * ≤≤≤≤ 87 *- 87 )

≤≤≤≤ )7 . 7 7 ) ) ! ) **

9 9 7 ) 7 ) * < 9

2 ) 5 ) ) 5 ** 8 /

≤≤≤≤ * L ) )

* ! 4 ! * ! D * - F

2 # 5 ) 7 ) ) - 0 9 D - F

) ) < . * ≤≤≤≤ ) ) ! ≤≤≤≤ 8 -

2 5 ) 7 ) ) * ) - & ) ! )

) ? * ) ) ≤≤≤≤ ) ?

(20)

Auswahl von Sichten

2 & ! *& ! ) * ) )

B* 7 ) * /

% # ) - *- - , ) *7 )

* ! ! 7 )

% 0 *- < . * - * 8 9 - )

! * 7 ) * < 9 ) 8 )

2 # * & ! *& ! * E %9 * < ) 2 L * . && 4 ! * B* /

)6% ! *

2 # )6% ! * 9 < * - 8 *- - /

0 . 8 ) ** ) ! ) * * + M <

DL 6 C ! ! H H +F

(21)

Der Greedy Algorithmus

2 5 ) ! & - . * $D9F C ) - 9

2 ! / & - . * A 8 ) ) -

2 *- < . . ! * -

2 E - *7 0 9 - 7 )

) E 8 ) - 9 9 8 ! D9 F 8 -

) 7 ) /

3 C ) - 7 ≤ 9 7 ) 7 - /

D F ) - ! ) * ? *

* ) ** 7 ≤ D F 7 A

D9 F A 7 9 7

C(v) - C(u), falls C(v) < C(u)

0 ansonsten

(22)

Der Greedy Algorithmus

A N * - O

A . )

=< ) - 9∉∉∉∉ * ) ** D9 F ! 4 ! * P

" A ∪∪∪∪ N9O

' )P

+ P

(23)

Beispiel

a

b c

f

d e

g h

1

100

20

50 30

10

40 75

Erste Wahl Zweite Wahl Dritte Wahl b 50 x 5 = 250

c 25 x 5 = 125 25 x 2 = 50 25 x 1 = 25

d 80 x 2 = 160 30 x 2 = 60 30 x 2 = 60

e 70 x 3 = 210 20 x 3 = 60 20 + 20 + 10 = 50

f 60 x 2 = 120 60 + 10 = 70

g 99 x 1 = 99 49 x 1 = 49 49 x 1 = 49

h 90 x 1 = 90 40 x 1 = 40 30 x 1 = 30

Greedy Auswahl: b, d und f

(24)

Was wissen Sie jetzt?

2 0B - . ) 8 )

2 9 # $ * 8 * 8 9

# ! *

2 (!& ! * 9 9 # $ *

8 8

2 )6% ! * 8 *7 *

8 9 - ) ! * 7 )

(25)

Lernen von Assoziationsregeln

/

0 9 C . ) < =

> * . ⊆

0 9 > * .

! ∈∈∈∈ QG R ) ! ! * 8

$ ! ∈∈∈∈ QG R ) ! ! ? ) 8

3 ) - ) 3 ! S 7 S ⊆ ⊆ S ∩ A N O

{ }

) min

,

( s

r

t Y X

r c t

r

s ∈ ∪ ∈ ≥

=

{ }

{ }

min

) ,

( conf

r X r t

t Y X

r c t

r

conf

= ∈

(26)

Binäre Datenbanken

0 9 C . ) < =

$

0 9 > * .

> * . ⊆

$ G G "

G

G G

(#

$

(27)

Warenkorbanalyse

4 0

0 1

3 1

1 0

2 0

1 1

1 1

1 0

EinkaufsID Chips

Bier Aftershave

N * 9 O N O * A T - A U

N * 9 O N$ &*O * A G

N O N$ &*O * A U - A V %% 8 * !! K

N$ &*O N * 9 O * A G N * 9 O N $ &*O * A G

(28)

Wieder ein Verband...

N $ #O

N $O N #O N $ #O N $ #O

N O N $O N $O N #O N$ #O N #O

N O N O N$O N#O

N O

(29)

Ordnungsrelation

2 L * ) ) * ) > ! 8

2 0 * B1 * 0 7

2 . 0 * !

(30)

Assoziationsregeln

L / ** 8 * * ) . ( % W

2 ( ) ? . * .B ! *

2 * ) !! <

2 0 ** 8 * 8 * !! .

!!

/ < 9 . D> * . F

2 * ) ) )

/

2 * < 0 ** 8 * *

(31)

Apriori Algorithmus

D 7 0 . > 9 5 . ! H H +F

L ) * , 7 *- *- */ L < 0 .A S ∪∪∪∪

! . C . D !* * X * *F

2 = 0 < * * - > !

D %0 F

2 = 0 * * * - !

D0 F

2 = S .J ) ⊆ S . D %0 F

2 0 . ) .% C . ! * ! 7 )

9 8 .J

# * * ) ? ) * ! *Y ) ? ) )

(32)

Beispiel

N $ #O

N $O N #O N $ #O N $ #O

N O N $O N $O N #O N$ #O N #O

N O N O N$O N#O

N O

= <

) <

* N O N $O N $O N $O

.J A

.A L < 0

.

? ) ) $.J

(33)

Beispiel

* - 7 ) ? ) ) ! .J A'

"A N N $#O N $ O N # O N $# O N $# O O

.% ! * !

9 8 /

A N $# O

) . > ! 9 "K N $#O N $ O N # O N $# O N $# O Z C W

# 7 ) ? ) ) $'

"A N N $#O N $ O O A N $# O

) > ! 9 "K

N $#O N $ O N # O N $# O N $# O Z W

# 7 ) - 8 ! ? ) )

(34)

Kandidatengenerierung

8 %? ) ) D . F

.J /A NO

Forall

. * ) ** A N .% .O

AN .% Y.O Y. [ . /A N .% . Y.O

if

.% ! > ! 9 . * )

then

.J /A .J ∪ N O

Return

.J

D$.J F 9 - L < . 9 ? ) ) ! *!

(35)

Häufige Mengen

L < %0 D *! F

$ /A .A

/A D$ F

while

.

N O

$

.J

/A 8 %? ) ) D

.

F

.J

/A D$

.J

F

./A .J

Return

k

j

L

j

=2

{}

R i

i

(36)

APRIORI

& D * *! - ! F

/A L < %0 D *! F

-/A D - ! F

Return -

(37)

Regelgenerierung

* ) < 0 7 ) !

= ) ? . * < 7 ) . ) ? ) 8 * .

# ) ) 7 ) * 8 /

A N .% .O - A N .% O N . O - A N .% .O - A N O N .% . O -

A N .% .O -. A N O N .% . O - .

- ≥ - ≥ ≥ - .

(38)

Implementierung

2 L * %> ) < 4 ! ) * - * ) )

) ! ) 0

2 C ) ! ? 7 ) - ** ) L < .

*& -

A B C D

B C

N $ON #O N $#O

N#O

N$#O C

N $#O

N #O

#6 ! *-

(39)

Was wissen Sie jetzt?

2 ** 8 * * ) . ( %

2 %0 ) L < . / = 0 < *

* - > !

2 0 8 < 0 ) ! ! < > !

8 0 8 ) ) * 0 )

L < . *

!% & - ! 5 ) ) 0

2 0 ) / = > ! * *

* - C ) 0 ) * <

2 0 *- ) ) - ) ! 0 !

* > ! - 7 - 7 )

(40)

Probleme von Apriori

2 (! *- !!* 3 * & 4& 7 7 !B - > ! ) 7 )

( ) 4 * * ) ) > * . *&< - * 8

# *- ) ) - *! ) - ! - )

= . 6* ! * *

2 & - 9

2 # * ) B- * ) )

2 # * ) ) 7 ) ? ) &

= *- - . - -.* -

= * 7 * $ . * ** ) ** -

- ) 9 3 1 $ . *

(41)

Aktuelle Forschung

2 ? ) * & <*

2 ** ? * * && ) ? ) 8

2 & ! ! ) . 9 # . ) -

- * *

2 L * 7 ) * ) 5 **

2 # ? 8 ? ## ? ## ) ($#0 * ) 9 9

< 8 : X !* *;

(42)

Kondensierte Repräsentationen

* 8 ) # . 87 ) !* . ) -

. ) * & <*

2 ) . * * ) *& - & <* )

2 * ) 7 < 0 ) L < .

.B - ! ) # * * 8 *

? ) * & <* ** 8 * /

2 $ * ) ! * *

2 3 * *

& ) ) 0 ** 8 * /

2 $ 9 &

(43)

In anderen Worten:

= < 5 * !W

# 5 * ! * . * ) L 6& * !

1 ) * 5 * !* . ) * 8 -

= ! ** * * ) *&

2 8 )

2 8 . *

L ) 8 > ! 8 7 *-

# 8 7 -

! . K

(44)

Untere Grenze

2 = 0 < * * - > !

D %0 F

2 *- ) ) * *! )

? ) ) !<1 ) * 8 W

8 # L < .

? 0

B1 0

(45)

Obere Grenze

2 0 ) / = > ! * * *

- C ) 0 ) * < * - *

2 *- ) ) ? ) ) - ) 0

? 0

B1 0

(46)

Beispiel

CD {}

A B C D

AB AC AD BC BD

ABC ABD ACD BCD

3 X -6 * ) G

ABCD

Dank an Jean-Francois Boulicaut!

L <

<

(47)

Closed Item Sets

2 - * D F * ) ! 4 ! ! D !<1

) > ! 8 F 9 ) -

* < 7 9 . !!

2 * - * ) ! * 7 - * D FA

2 ! - 7 7 9 G * )

> * . <

2 $ * ) * )/ $ $ $ $ $#

. ! 9 $ . !! - + ! 9 P

. !! ' ! 9 - ) !

$ ) . ! 9 $

G G G

G G

G G

#

$

(48)

Kondensierte Repräsentation und Ableitung

$ * ) ! * * * ) . ) * & <* / 2 * ) . !& .

2 = ! ) < - * ) ! * * $ -

- ! - ! ) # 8 8 ) .

) - < 0 -

/

2 3 C ) 0 & 7 ) 9 $/

(* ! ! S 9 $ K

Z E ) * - <

Z @ ) * ) L < . 9 < ) 9 S

= * ! ! 9 $ 9 . !! !! )

! 4 ! L < . W

(49)

Freie Mengen (free sets)

2 0 * 7 * . *-

D? ) 8A F 87 *- ! )

{ } X Y

Y Y X

S Y

X = ∪ ≠

¬∃ , , ,

2 0 * δδδδ% 7 * . ! 7 *

δδδδ * ! 87 *- !

2 # - * ) * * * ) ) - * ) 0 W

0 . ) - * ) * * * ) 0 -

2 3 * %! *- 9 0

# * . ! ) 0 8 -

(50)

Beispiel

G G G

G G

G G

#

$ 2 ! - 7 7 9 G * ) )

< 0 /

NO #

2 $ * ) * )/ $ $ $ $ $#

2 $ * DNOFA$

- * D FA $ - * D FA $ - * D#FA $#

- * D FA $

(51)

Arbeiten mit freien Mengen

2 3 D δδδδF/ 0 S * δδδδ% 7 * .

87 *- ! ! 7 * δδδδ * !

2 3 XD σF/ NS \ S ⊆ \S ∈ \V \ \ ≥ σO 2 3 X3 D σ, δδδδF/ 3 X D σF ∩ 3 D δδδδF

2 E 9 8 )%D σ, δδδδF/ NS \ S ⊆ S ∉3 X3 D σ, δδδδF

) ∀ ⊂ S ∈ 3 X3 D σ, δδδδF O

* ) . 8 * 0 ) ) - < )

* ) ) > ! < ) * )

2 = *- < 8 ) L < . 0 * /

∃ S ⊆ ) S * δδδδ% - σZ < )

!! G * L < . 9

* !! ) . * 8 ! 5 . !! )

> ! S * L < . 9

(52)

Abschätzung

S S S S

! .

3 X3 /

E - 3 X3 /

3 - <

D FAG

D FA !

⊂ ⊂

! DN D F \ S OF A !

(53)

MinEx

2 < 0 8 * - - 7 -

3 X3 D σ, δδδδF 8 * -

2 !% & - ! L 9 ) ) 0

! ! !! ) % !

0 ) ) B1 0 ) - 3 X3 D σ, δδδδF

* )

2 # > * 0 * ) ) ) * ) 9

* ) ) * ) 0

) * - ) 7 )

! * 9 @ %3 - * -

(54)

Algorithmus (abstrakt)

< # * * C . ) )

- 7 7 σ ) δδδδ 3 X3 D σ, δδδδF *

$G/AN NO O /AG

3. While $ ≠ NO do

" 3 X3 /A NS \S ∈ $ S * σ% < ) δδδδ% O

' $ /A NS \ S ⊆ ∀ ⊂ S ∈ 3 X3 D σ, δδδδF C ≤ O]

≤≤≤≤ $

+ /A J od

7. Output

3 X3

(55)

Pruning

2 ( ) % ( 7 ) ) δδδδZ* . ) 3 !

S N O - 7

S < ) * ) % )

⊆ ]S

2 # * * 7 ) 9 7 ) ! - δδδδ % 0

8 Z * * ) . ? ) ! ) J %

(

(56)

Eigenschaften von MinEx

2 # ! * * !! - 7< ) *- *

( ( ) *- * ) 5 7 ) 9 - * ) * *

2 # ! * * 4& ) 0

2 # ! * * ) 0 ) # . &

7 δδδδ ! * 0 1 * 7 ) , ) > &

= 9 ) && δδδδ 7 7 ) > & 8 9 ) &&

2 # ! * && 4 ! ) * :7 ; *

( ) 4 * * 7 - 9 G M .

!

(57)

Was wissen Sie jetzt?

2 * 87 & <* ) 7 !

- - < 0 * *

< 0 * ) * & <* .B

< 0 7 )

Z # - * ) * * * ) ! 4 ! ! 9 ! ) * L < . 7

Z # * * * ) 0 * ) ! .

** 8 * ! - .

2 = ! ) < 0 - !

) 8 ! 5 * ! ** 8 *

)

2 # ! * 0 4 ) ) * 8

(58)

Prinzipien für Regelbewertungen

(D F A G 7 \ \ A D\ \ \ \ F V\ \ ) * ) <

(D F * ! ! \ \

(D F < ! ! \ \ ) \ \

* / ( ^ G 7 \ \ ^ D\ \ \ \ F V\ \

) 7 & * 9 ! . *

( [ G 7 \ \ ^ D\ \ \ \ F V\ \

) 7 9 ! . *

= 7 ** ) ** !! \ \ ≤ \ \ ≤ \ \ * (! 7 \ \ A \ \ ) \ \ A \ \

(! 4 7 \ \ A \ \ A \ \

*.6% & H H

(59)

Konfidenz

2 # ? ) 8 ) 8 & - WDE ) * F

- < 0 ) 7 ) * - %

. ) 7

2 # %$ * *%# )

. 9%! < . %# * % %5 ! ! H GM ? ) 8

> *<- - * *D. %# * % %5 !FAH 'M

* 7 ) * 7 *- - 7 . 9%! <

* W

2 ! GGG - 9 ) +GM

*. *& I 'M $ . * ** #

*. $ . * ? ) 8 ++M

> *<- - * . *. ) $ . * L < . W

(60)

Signifikanztest

2 - * 0 1 ) * ) 8 & * /

2 # . 8 ) ? 87 *- ) * /

r B B A

A → −

r B r

B A A

r B B A

A

1

1

(61)

Sicherheitsmaß

- H H G - *! 1 $3 D

= ** * * F

2 = - D F ^ *D F

$3D FA - D F Z *D FVD %*D FF

2 = - D F [ *D F

$3D FA - D F

2 *

$3D FA G

# * - *! 1 ) 8 & 7

= ) ! . 8 * ) - *! 1 <

! 7 D 9 ) F ** 8 *

(62)

Was wissen Sie jetzt?

2 ) 8 & ) 7

. /

Z < 0 * ! G 7 7 )

Z # = * B 7 ) 7 ) !

Z # = * ) 7 ) 7 ) 0 7

2 ) 0 1 . ) ) 8 &

/

Z - * 0 1

Z * * *- * 0 1 )

Z - *! 1

(63)

Zeitphänomene

Ereignisse Sequenzen

Zeit

t

1

t

2

t

i

t

m

t

m+1

Attribute

(64)

Univariat - Multivariat

Univariat - ein Attribut pro Zeit (Herzfrequenz)

Multivariat - k Attribute (Herzfrequenz, Atemfrequenz, Blutdruck)

t

1

t

2

t

i

t

m

t

m+1

Zeit

t

1

t

2

t

i

t

m

t

m+1

Zeit

1 k

(65)

Beispiele für Zeitreihen

2 0 **7 9 ! 8 **

Z ( * 9! ) 8

Z . . *

Z = )

Z

Kontinuierliche Messung in z.B. Tagen, Stunden, Minuten, Sekunden

(66)

Beispiele für Ereignisse

2 # .

Z 5 *) 5 . *) 8 )

Z ** D . !! F

Ereignisse mit Zeitangaben in Jahren, Monaten, Tagen Verkäufe Monat Anzahl Verkäufer ...

...

...

...

...

...

256 Meier

Juni

(67)

Lernaufgaben

2 9

Z 5 * ) .J % -

Z ! > ) . D ! * F

Z . > )* ) D, 6. . * ) = F

Z 3 ) 9 ! ) ) 7 - ) = D * 1 F

Z $ * / 3 ** < - - 9 )

= 8 $ * 8 * !!

2 0 9

Z 3 ) 8 * !! ) =

(68)

Repräsentation der Eingabedaten

Multivariat: i

l

: <t

1

, a

11

, ... , a

1k

>

<t

2

, a

21

, ... , a

2k

>

...

<t

i

, a

i1

, ... , a

ik

>

Univariat: i

l

: <t

1

, a

1

>

<t

2

, a

2

>

...

<t

i

, a

i

>

(69)

Lernaufgaben

X 8 9 ** /

3 ) < & * ) X 8 Q0 R

2 = ) ) , >

Q# * R

8 87 *- , %( 9

QL B&& R

2 * 9 ) $ * ) -

(Menge von Ereignissen in partieller Ordnung)

(70)

Repräsentation der Eingabedaten

* * > & D, * ) ) F

# , * ) . = ) D> )

87 *- F *

*& /

D ) 'FPD3 ) I HFPD G "F

2 0B - . ) # *

X 8 5 . / ( / > >

3 . / D( > >

*

F

(71)

Wie finde ich die Ereignisse in Zeitreihen?

2 3 * * < 7

Z 9 ) ) 0 *

2 ( . ! 6* ) , -

9 0 * Q0 .V VHH R

Z *& /

Z 5 / #6 ! *- <

2 # *. * ) - $ * Q# * R

(72)

Clustering Vorbereitung

Zeitreihe s = (x1,...,xn) in Subsequenzen si = (xi,...,xi+w-1) aufteilen

Fenster der Bereite w = 3

Schritt 2

(73)

Clustering

# * 8! 1 )D* *CF/ 87 *- 87 * X 8

*& / . ) *- * ) (Σ(xi-yi)2)0,5

? * ) ^ G/ 7 1 ) *- ) 87 *- )

* X 8 * )

) * ) 0 * X 8

$ * $ $.

@ ) * $ * < 6! . D: & *;F

(74)

Anwendung des Clustering

# * A D4 4 F . C 8 ! L ) * & *

*- 7 ) D:) *. * ;F

(75)

Regeln in diskreten Sequenzen

2 ) 3 !

= ) ) , > -

! ( (

2 - ) , !_. !B -

Z D.A 8 ) 6! ! A ` 9 *- ) 0B - . >F

2 7 /

Z = ) ) ) ) , 5

) ) , >

Z 0 - * ↓ D F 0 - * ↑ D F J ( → D F ( 0 → D F

Z !/ 8 ) * * .

(76)

Beziehungen zwischen Ereignissen

2 5 @ ! * 3 7 ) 9 *- )

( 9 8 * /

Z && ) 9 <

2 *& / )

(A, StartA, EndeA)

(B, StartB, EndeB)

StartB<StartA, EndeA = EndeB,

(77)

Beziehungen zwischen Zeit- Intervallen lernen [Höppner]

Darstellung der Beziehungen als Matrix:

R1 R2

(78)

Regeln

Prämisse P Regel R

Die Regeln sind von der Form P → → → → R

Beispiel: A, B, C sind Verträge verschiedener Kategorien

(79)

Häufige Muster finden

Muster muss im Fenster der Länge t

max

beobachtbar sein

Der maximale Abstand zwischen den Ereignissen eines Muster ist begrenzt

(80)

Was bedeutet häufig?

Als Maß für die Häufigkeit von Mustern dient der „Support“

A B A = o B io =

Ein Muster wird als häufig

erachtet, wenn es einen Support >

supp

min

hat

(81)

Anwendung von APRIORI

2 ! ) && %0 *

2 (! .% /

Z 0 * ! * &&[* &&!

Z * ) 9 .%0 * 0 9

? ) ) .J %0 *

Z ! ) && ) ? ) ) ! <- *

2 = ) ) * - * . < 0 * !

) 7 ) .B

2 ) * ) < 0 *

(82)

Was wissen Sie jetzt?

2 0 . ) & ! * ) ) -. 9

, * X 8 7 )

2 # * 8 9 ) ! # * /

Z 3 * 7 ) ) , *-

Z # * * X 8 7 ) ) - # * 8! 1

%- * % * * 0 * 7 aufsteigend, absteigend

Z 0 ) 0 * * 7 ) ** 8 *

2 # * 8 9 3 . L B&& /

Z 3 * 7 ) ) , *-

Z 0 8 8 * ( 9

Z L < !B - * X 8 7 ) ! )

** 8 *

Referenzen

ÄHNLICHE DOKUMENTE

In comparison to the texture of the rolled 95% 50/m material (Figure 4a) this texture is less sharp and shows besides Cube (28R) a wide orientation spread about the twin of

Doch nicht nur in Afghanistan, auch in anderen wichtigen Bündnis- fragen tut sich Deutschland erkenn- bar schwer mit einer operativ ausge- richteten NATO..

Korrektur: Bitte beachten Sie im Interesse einer optimalen Datenerfassung die links gegebenen Hinweise beim Ausfüllen1. Der Sächsischen Landesärztekammer ist es ein

die Verkaufszahlen werden zuerst für jedes Modell aus jedem Jahr in jeder Farbe aufgelistet, dann werden alle Verkaufszahlen des gleichen Modells und Jahres aufsummiert und daraus

die Verkaufszahlen werden zuerst für jedes Modell aus jedem Jahr in jeder Farbe aufgelistet, dann werden alle Verkaufszahlen des gleichen Modells und Jahres aufsummiert und daraus

– Konstruiere die Conditional Pattern Base (Schritt 1) für jedes Item und berechne auf dieser dann den Conditional FP-Tree (Schritt 2). – Wiederhole diesen Prozess für jeden

– Wenn Attribute bei einer Zeiteinheit nicht verändert werden können, sollen sie auch nicht mit dieser gestempelt werden. – Attribute sollen nur mit der Granularität

• Wenn man die häufigen closed item sets C berechnet hat, braucht man nicht mehr auf die Daten zuzugreifen und kann doch alle häufigen Mengen