Data Cube
! !
" # $ % &
' (!& ! ) * # $
+ , * !! ** ) * -.
Dank an Hanna Köpcke!
On-line Analytical Processing (OLAP)
, / ) ** 0 * 1
# !
2 3 !
2 4 . ) #
2 5 * * ) **
2 6* ) ** )
3 !
OLAP-Werkzeuge
2 # ! 7 ) * %) ! * ! **
2 () 8 9 : ** ; < !
2 ( # . 7 ) %) ! *
# * ! % ! )
2 # ! * * ) . ) - ) #
) 7 ** # ! *
Beispiel: Autoverkäufe
Modell Jahr Farbe Anzahl
Opel 1990 rot 5
Opel 1990 weiß 87
Opel 1990 blau 62
Opel 1991 rot 54
Opel 1991 weiß 95
Opel 1991 blau 49
Opel 1992 rot 31
Opel 1992 weiß 54
Opel 1992 blau 71
Ford 1990 rot 64
Ford 1990 weiß 62
Ford 1990 blau 63
Ford 1991 rot 52
Ford 1991 weiß 9
Ford 1991 blau 55
Ford 1992 rot 27
Ford 1992 weiß 62
Ford 1992 blau 39
Aggregation in SQL
2 . /
COUNT(), SUM(), MIN(), MAX(), AVG()
Beispiel: SELECT AVG(Anzahl) FROM Autoverkäufe
2 9 *- ) =
Beispiel: SELECT COUNT(DISTINCT Modell) FROM Autoverkäufe
2 . 8 =
2 ! !
GROUP BY
GROUP BY
SELECT Modell, Jahr, SUM(Anzahl) FROM Autoverkäufe
GROUP BY Modell, Jahr
2# > 7 ) !<1 ) ? ! )
* 7< ! &&
2@ ) && 7 ) 3 .
2# * * * > ! =
) 8 ) - ) * 7< !
Beispiel: GROUP BY
SELECT Modell, Jahr, SUM(Anzahl) FROM Autoverkäufe
GROUP BY Modell, Jahr
Modell Jahr Anzahl
Opel 1990 154
Opel 1991 198
Opel 1992 156
Ford 1990 189
Ford 1991 116
Ford 1992 128
Modell Jahr Farbe Anzahl
Opel 1990 rot 5
Opel 1990 weiß 87
Opel 1990 blau 62
Opel 1991 rot 54
Opel 1991 weiß 95
Opel 1991 blau 49
Opel 1992 rot 31
Opel 1992 weiß 54
Opel 1992 blau 71
Ford 1990 rot 64
Ford 1990 weiß 62
Ford 1990 blau 63
Ford 1991 rot 52
Ford 1991 weiß 9
Ford 1991 blau 55
Ford 1992 rot 27
Ford 1992 weiß 62
Ford 1992 blau 39
Roll Up
- *- ) - # * )
2 5 ! ) ) * # * ) * A &
2 B ) * # * ) * A # # 7
*& / 9 .<
2 & )
2 # 7 ) - 0 ) ) - @
) - 3
2 ) 5 . *8 7 ) 8 * C ) * 0 )
* C ) ! @ C ) 3 *
) 7 ) 5 . *8 ) * - 0 ) *
) @ * * !! ) ) *
) 5 . *8 ) 0 ) -
GROUP BY: Roll Up
Modell Jahr Farbe Anzahl nach Modell, Jahr, Farbe
Anzahl nach Modell, Jahr
Anzahl nach Modell
Opel 1990 rot 5
weiß 87
blau 62
154
1991 rot 54
weiß 95
blau 49
198
1992 rot 31
weiß 54
blau 71
156
508
Probleme mit GROUP BY: Roll Up
2 > * - ) ! 7 ) 3 )
DE %= F . - ** * .
2 # , ) & 7<- * ! ) , )
2 ! ) * 4& 7 - * ) & 8 8 9 ! )
7 ) ) %=
2 # %= & <* ) 0 ) )
- 7 )
*& /
) & 3 ) ) ** ) 8 ) *
, ) 5 . *8 ) 7 1 ) *
8 * !! ** * )
GROUP BY: Roll Up mit ALL
Modell Jahr Farbe Anzahl
Opel 1990 rot 5
Opel 1990 weiß 87
Opel 1990 blau 62
Opel 1990 ALL 154
Opel 1991 rot 54
Opel 1991 weiß 95
Opel 1991 blau 49
Opel 1991 ALL 198
Opel 1992 rot 31
Opel 1992 weiß 54
Opel 1992 blau 71
Opel 1992 ALL 156
Opel ALL ALL 506
8 ) > ! /
SELECT Modell, ALL, ALL, SUM(Anzahl) FROM Autoverkäufe
WHERE Modell = ‘Opel‘
GROUP BY Modell UNION
SELECT Modell, Jahr, ALL, SUM(Anzahl) FROM Autoverkäufe
WHERE Modell = ‘Opel‘
GROUP BY Modell, Jahr UNION
SELECT Modell, Jahr, Farbe, SUM(Anzahl) FROM Autoverkäufe
WHERE Modell = ‘Opel‘
GROUP BY Modell, Jahr, Farbe
Probleme mit GROUP BY: Roll Up
2 *& 7 - * ) ) ! * * &
2 # ! * ) *
2 & * *6!! *- /
5 .< * ) - @ - - 3
Kreuztabellen
6!! *- # * ! ) ! * #
)
Opel 1990 1991 1992 Total (ALL)
rot 5 54 31 90
weiß 87 95 54 236
blau 62 49 71 182
Total (ALL) 154 198 156 508
# * ? 8 * 87 ) ! *
E !! ! - ) ! ) 8 . !! C ) * 0 )
7 8
0 < ) ) ! *
%) ! * * ) * ? 8 &
# G# # $ * .
# # # $ * ! ! .
# # # $ * ? 8
# # # $ * = ! ) * -
*- ) ) ? 8
D 6 $ ) *7 6! H H I F
Aggregation
Summe
GROUP BY (mit Gesamtsumme) rot
weiß blau Summe
rot weiß
blau Modell
Farbe Opel Ford
Kreuztabelle
Data Cube mit allen Aggregationen
Jahr OpelFord
Modell
& Jahr
Modell
Modell & Farbe Farbe & Jahr
Farbe Summe
1990 1991
1992
Der CUBE-Operator
2 *& / SELECT Modell, Jahr, Farbe, SUM(Anzahl) FROM Autoverkäufe
GROUP BY CUBE Modell, Jahr, Farbe
2 # $ % & 8 > ) *<! -
<
2 * 7 ) * !B - ? !
) -
2 # 8 ) > ) ) )
8! ) 8 ) &
2 7 ) * -
2 $ $ $ ) ? ) < ) ) * )
? ) < ) * ) # $ % ∏∏∏∏D$ J F
Modell Jahr Farbe Anzahl
Opel 1990 rot 5
Opel 1990 weiß 87
Opel 1990 blau 62
Opel 1991 rot 54
Opel 1991 weiß 95
Opel 1991 blau 49
Opel 1992 rot 31
Opel 1992 weiß 54
Opel 1992 blau 71
Ford 1990 rot 64
Ford 1990 weiß 62
Ford 1990 blau 63
Ford 1991 rot 52
Ford 1991 weiß 9
Ford 1991 blau 55
Ford 1992 rot 27
Ford 1992 weiß 62
Ford 1992 blau 39
Modell Jahr Farbe Anzahl
Opel 1990 rot 5
Opel 1990 weiß 87
Opel 1990 blau 62
Opel 1990 ALL 154
Opel 1991 rot 54
Opel 1991 weiß 95
Opel 1991 blau 49
Opel 1991 ALL 198
Opel 1992 rot 31
Opel 1992 weiß 54
Opel 1992 blau 71
Opel 1992 ALL 156
Opel ALL rot 90
Opel ALL weiß 236
Opel ALL blau 182
Opel ALL ALL 508
Ford 1990 rot 64
Ford 1990 weiß 72
Ford 1990 blau 63
Ford 1990 ALL 189
Ford 1991 rot 52
Ford 1991 weiß 9
Ford 1991 blau 55
Ford 1991 ALL 116
Modell Jahr Farbe Anzahl
Ford 1992 rot 27
Ford 1992 weiß 62
Ford 1992 blau 39
Ford 1992 ALL 128
Ford ALL rot 143
Ford ALL weiß 133
Ford ALL blau 157
Ford ALL ALL 433
ALL 1990 rot 69
ALL 1990 weiß 149
ALL 1990 blau 125
ALL 1990 ALL 343
ALL 1991 rot 106
ALL 1991 weiß 104
ALL 1991 blau 104
ALL 1991 ALL 314
ALL 1992 rot 58
ALL 1992 weiß 116
ALL 1992 blau 110
ALL 1992 ALL 284
ALL ALL rot 233
ALL ALL weiß 369
ALL ALL blau 339
ALL ALL ALL 941
Implementationsalternativen
2 6* *- 0 * ) * * ! # $ /
% * 7 8
% & - & 8 )
2 ? 0 * /
% C ) , 7 ) ) * ) ) -
% . 8 *< 8 - & - & 8
% *- - 7 8
2 0 * 9 > ) * # $ /
% = 9 , * ) * ( ) , -
% ) * , ! : < ; ,
% , ) %= * ) <
% !/ = - , ) * # $ ! * K
% , ) * # $ *& - D - F
Abhängigkeit von Sichten
# < . * ≤≤≤≤ 87 *- 87 )
≤≤≤≤ )7 . 7 7 ) ) ! ) **
9 9 7 ) 7 ) * < 9
2 ) 5 ) ) 5 ** 8 /
≤≤≤≤ * L ) )
* ! 4 ! * ! D * - F
2 # 5 ) 7 ) ) - 0 9 D - F
) ) < . * ≤≤≤≤ ) ) ! ≤≤≤≤ 8 -
2 5 ) 7 ) ) * ) - & ) ! )
) ? * ) ) ≤≤≤≤ ) ?
Auswahl von Sichten
2 & ! *& ! ) * ) )
B* 7 ) * /
% # ) - *- - , ) *7 )
* ! ! 7 )
% 0 *- < . * - * 8 9 - )
! * 7 ) * < 9 ) 8 )
2 # * & ! *& ! * E %9 * < ) 2 L * . && 4 ! * B* /
)6% ! *
2 # )6% ! * 9 < * - 8 *- - /
0 . 8 ) ** ) ! ) * * + M <
DL 6 C ! ! H H +F
Der Greedy Algorithmus
2 5 ) ! & - . * $D9F C ) - 9
2 ! / & - . * A 8 ) ) -
2 *- < . . ! * -
2 E - *7 0 9 - 7 )
) E 8 ) - 9 9 8 ! D9 F 8 -
) 7 ) /
3 C ) - 7 ≤ 9 7 ) 7 - /
D F ) - ! ) * ? *
* ) ** 7 ≤ D F 7 A
D9 F A 7 ≤ 9 7
C(v) - C(u), falls C(v) < C(u)
0 ansonsten
Der Greedy Algorithmus
A N * - O
A . )
=< ) - 9∉∉∉∉ * ) ** D9 F ! 4 ! * P
" A ∪∪∪∪ N9O
' )P
+ P
Beispiel
a
b c
f
d e
g h
1
100
20
50 30
10
40 75
Erste Wahl Zweite Wahl Dritte Wahl b 50 x 5 = 250
c 25 x 5 = 125 25 x 2 = 50 25 x 1 = 25
d 80 x 2 = 160 30 x 2 = 60 30 x 2 = 60
e 70 x 3 = 210 20 x 3 = 60 20 + 20 + 10 = 50
f 60 x 2 = 120 60 + 10 = 70
g 99 x 1 = 99 49 x 1 = 49 49 x 1 = 49
h 90 x 1 = 90 40 x 1 = 40 30 x 1 = 30
Greedy Auswahl: b, d und f
Was wissen Sie jetzt?
2 0B - . ) 8 )
2 9 # $ * 8 * 8 9
# ! *
2 (!& ! * 9 9 # $ *
8 8
2 )6% ! * 8 *7 *
8 9 - ) ! * 7 )
Lernen von Assoziationsregeln
/
0 9 C . ) < =
> * . ⊆
0 9 > * .
! ∈∈∈∈ QG R ) ! ! * 8
$ ! ∈∈∈∈ QG R ) ! ! ? ) 8
3 ) - ) 3 ! S 7 S ⊆ ⊆ S ∩ A N O
{ }
) min
,
( s
r
t Y X
r c t
r
s ∈ ∪ ∈ ≥
=
{ }
{ }
min) ,
( conf
r X r t
t Y X
r c t
r
conf ≥
∈
∈
∈
∪
= ∈
Binäre Datenbanken
0 9 C . ) < =
$
0 9 > * .
> * . ⊆
$ G G "
G
G G
(#
$
Warenkorbanalyse
4 0
0 1
3 1
1 0
2 0
1 1
1 1
1 0
EinkaufsID Chips
Bier Aftershave
N * 9 O N O * A T - A U
N * 9 O N$ &*O * A G
N O N$ &*O * A U - A V %% 8 * !! K
N$ &*O N * 9 O * A G N * 9 O N $ &*O * A G
Wieder ein Verband...
N $ #O
N $O N #O N $ #O N $ #O
N O N $O N $O N #O N$ #O N #O
N O N O N$O N#O
N O
Ordnungsrelation
2 L * ) ) * ) > ! 8
2 0 * B1 * 0 7
⊇
2 . 0 * !
Assoziationsregeln
L / ** 8 * * ) . ( % W
2 ( ) ? . * .B ! *
2 * ) !! <
2 0 ** 8 * 8 * !! .
!!
/ < 9 . D> * . F
2 * ) ) )
/
2 * < 0 ** 8 * *
Apriori Algorithmus
D 7 0 . > 9 5 . ! H H +F
L ) * , 7 *- *- */ L < 0 .A S ∪∪∪∪
! . C . D !* * X * *F
2 = 0 < * * - > !
D %0 F
2 = 0 * * * - !
D0 F
2 = S .J ) ⊆ S . D %0 F
2 0 . ) .% C . ! * ! 7 )
9 8 .J
# * * ) ? ) * ! *Y ) ? ) )
Beispiel
N $ #O
N $O N #O N $ #O N $ #O
N O N $O N $O N #O N$ #O N #O
N O N O N$O N#O
N O
= <
) <
* N O N $O N $O N $O
.J A
.A L < 0
.
? ) ) $.J
Beispiel
* - 7 ) ? ) ) ! .J A'
"A N N $#O N $ O N # O N $# O N $# O O
.% ! * !
9 8 /
A N $# O
) . > ! 9 "K N $#O N $ O N # O N $# O N $# O Z C W
# 7 ) ? ) ) $'
"A N N $#O N $ O O A N $# O
) > ! 9 "K
N $#O N $ O N # O N $# O N $# O Z W
# 7 ) - 8 ! ? ) )
Kandidatengenerierung
8 %? ) ) D . F
.J /A NO
Forall
. * ) ** A N .% .OAN .% Y.O Y. [ . /A N .% . Y.O
if
.% ! > ! 9 . * )then
.J /A .J ∪ N OReturn
.JD$.J F 9 - L < . 9 ? ) ) ! *!
Häufige Mengen
L < %0 D *! F
$ /A .A
/A D$ F
while
.≠ N O
$
.J/A 8 %? ) ) D
.F
.J
/A D$
.JF
./A .J
Return
k
j
L
j=2
{}
R i
i
∈
APRIORI
& D * *! - ! F
/A L < %0 D *! F
-/A D - ! F
Return -
Regelgenerierung
* ) < 0 7 ) !
= ) ? . * < 7 ) . ) ? ) 8 * .
# ) ) 7 ) * 8 /
A N .% .O - A N .% O N . O - A N .% .O - A N O N .% . O -
A N .% .O -. A N O N .% . O - .
- ≥ - ≥ ≥ - .
Implementierung
2 L * %> ) < 4 ! ) * - * ) )
) ! ) 0
2 C ) ! ? 7 ) - ** ) L < .
*& -
A B C D
B C
N $ON #O N $#O
N#O
N$#O C
N $#O
N #O
#6 ! *-
Was wissen Sie jetzt?
2 ** 8 * * ) . ( %
2 %0 ) L < . / = 0 < *
* - > !
2 0 8 < 0 ) ! ! < > !
8 0 8 ) ) * 0 )
L < . *
!% & - ! 5 ) ) 0
2 0 ) / = > ! * *
* - C ) 0 ) * <
2 0 *- ) ) - ) ! 0 !
* > ! - 7 - 7 )
Probleme von Apriori
2 (! *- !!* 3 * & 4& 7 7 !B - > ! ) 7 )
( ) 4 * * ) ) > * . *&< - * 8
# *- ) ) - *! ) - ! - )
= . 6* ! * *
2 & - 9
2 # * ) B- * ) )
2 # * ) ) 7 ) ? ) &
= *- - . - -.* -
= * 7 * $ . * ** ) ** -
- ) 9 3 1 $ . *
Aktuelle Forschung
2 ? ) * & <*
2 ** ? * * && ) ? ) 8
2 & ! ! ) . 9 # . ) -
- * *
2 L * 7 ) * ) 5 **
2 # ? 8 ? ## ? ## ) ($#0 * ) 9 9
< 8 : X !* *;
Kondensierte Repräsentationen
* 8 ) # . 87 ) !* . ) -
. ) * & <*
2 ) . * * ) *& - & <* )
2 * ) 7 < 0 ) L < .
.B - ! ) # * * 8 *
? ) * & <* ** 8 * /
2 $ * ) ! * *
2 3 * *
& ) ) 0 ** 8 * /
2 $ 9 &
In anderen Worten:
= < 5 * !W
# 5 * ! * . * ) L 6& * !
1 ) * 5 * !* . ) * 8 -
= ! ** * * ) *&
2 8 )
2 8 . *
L ) 8 > ! 8 7 *-
# 8 7 -
! . K
Untere Grenze
2 = 0 < * * - > !
D %0 F
2 *- ) ) * *! )
? ) ) !<1 ) * 8 W
8 # L < .
? 0
B1 0
Obere Grenze
2 0 ) / = > ! * * *
- C ) 0 ) * < * - *
2 *- ) ) ? ) ) - ) 0
? 0
B1 0
Beispiel
CD {}
A B C D
AB AC AD BC BD
ABC ABD ACD BCD
3 X -6 * ) G
ABCD
Dank an Jean-Francois Boulicaut!
L <
<
Closed Item Sets
2 - * D F * ) ! 4 ! ! D !<1
) > ! 8 F 9 ) -
* < 7 9 . !!
2 * - * ) ! * 7 - * D FA
2 ! - 7 7 9 G * )
> * . <
2 $ * ) * )/ $ $ $ $ $#
. ! 9 $ . !! - + ! 9 P
. !! ' ! 9 - ) !
$ ) . ! 9 $
G G G
G G
G G
#
$
Kondensierte Repräsentation und Ableitung
$ * ) ! * * * ) . ) * & <* / 2 * ) . !& .
2 = ! ) < - * ) ! * * $ -
- ! - ! ) # 8 8 ) .
) - < 0 -
/
2 3 C ) 0 & 7 ) 9 $/
(* ! ! S 9 $ K
Z E ) * - <
Z @ ) * ) L < . 9 < ) 9 S
= * ! ! 9 $ 9 . !! !! )
! 4 ! L < . W
Freie Mengen (free sets)
2 0 * 7 * . *-
D? ) 8A F 87 *- ! )
{ } X Y
Y Y X
S Y
X = ∪ ≠
¬∃ , , ,
2 0 * δδδδ% 7 * . ! 7 *
δδδδ * ! 87 *- !
2 # - * ) * * * ) ) - * ) 0 W
0 . ) - * ) * * * ) 0 -
2 3 * %! *- 9 0
# * . ! ) 0 8 -
Beispiel
G G G
G G
G G
#
$ 2 ! - 7 7 9 G * ) )
< 0 /
NO #
2 $ * ) * )/ $ $ $ $ $#
2 $ * DNOFA$
- * D FA $ - * D FA $ - * D#FA $#
- * D FA $
Arbeiten mit freien Mengen
2 3 D δδδδF/ 0 S * δδδδ% 7 * .
87 *- ! ! 7 * δδδδ * !
2 3 XD σF/ NS \ S ⊆ \S ∈ \V \ \ ≥ σO 2 3 X3 D σ, δδδδF/ 3 X D σF ∩ 3 D δδδδF
2 E 9 8 )%D σ, δδδδF/ NS \ S ⊆ S ∉3 X3 D σ, δδδδF
) ∀ ⊂ S ∈ 3 X3 D σ, δδδδF O
* ) . 8 * 0 ) ) - < )
* ) ) > ! < ) * )
2 = *- < 8 ) L < . 0 * /
∃ S ⊆ ) S * δδδδ% - σZ < )
!! G * L < . 9
* !! ) . * 8 ! 5 . !! )
> ! S * L < . 9
Abschätzung
S S S S
! .
3 X3 /
E - 3 X3 /
⊂ ⊂ ⊂
3 - <
D FAG
D FA !
⊂ ⊂ ⊂
! DN D F \ ⊂ S OF A !
MinEx
2 < 0 8 * - - 7 -
3 X3 D σ, δδδδF 8 * -
2 !% & - ! L 9 ) ) 0
! ! !! ) % !
0 ) ) B1 0 ) - 3 X3 D σ, δδδδF
* )
2 # > * 0 * ) ) ) * ) 9
* ) ) * ) 0
) * - ) 7 )
! * 9 @ %3 - * -
Algorithmus (abstrakt)
< # * * C . ) )
- 7 7 σ ) δδδδ 3 X3 D σ, δδδδF *
$G/AN NO O /AG
3. While $ ≠ NO do
" 3 X3 /A NS \S ∈ $ S * σ% < ) δδδδ% O
' $ /A NS \ S ⊆ ∀ ⊂ S ∈ 3 X3 D σ, δδδδF C ≤ O]
∪
≤≤≤≤ $+ /A J od
7. Output
∪
3 X3Pruning
2 ( ) % ( 7 ) ) δδδδZ* . ) 3 !
S N O - 7
S < ) * ) % )
⊆ ]S
2 # * * 7 ) 9 7 ) ! - δδδδ % 0
8 Z * * ) . ? ) ! ) J %
(
Eigenschaften von MinEx
2 # ! * * !! - 7< ) *- *
( ( ) *- * ) 5 7 ) 9 - * ) * *
2 # ! * * 4& ) 0
2 # ! * * ) 0 ) # . &
7 δδδδ ! * 0 1 * 7 ) , ) > &
= 9 ) && δδδδ 7 7 ) > & 8 9 ) &&
2 # ! * && 4 ! ) * :7 ; *
( ) 4 * * 7 - 9 G M .
!
Was wissen Sie jetzt?
2 * 87 & <* ) 7 !
- - < 0 * *
< 0 * ) * & <* .B
< 0 7 )
Z # - * ) * * * ) ! 4 ! ! 9 ! ) * L < . 7
Z # * * * ) 0 * ) ! .
** 8 * ! - .
2 = ! ) < 0 - !
) 8 ! 5 * ! ** 8 *
)
2 # ! * 0 4 ) ) * 8
Prinzipien für Regelbewertungen
(D F A G 7 \ \ A D\ \ \ \ F V\ \ ) * ) <
(D F * ! ! \ \
(D F < ! ! \ \ ) \ \
* / ( ^ G 7 \ \ ^ D\ \ \ \ F V\ \
) 7 & * 9 ! . *
( [ G 7 \ \ ^ D\ \ \ \ F V\ \
) 7 9 ! . *
= 7 ** ) ** !! \ \ ≤ \ \ ≤ \ \ * (! 7 \ \ A \ \ ) \ \ A \ \
(! 4 7 \ \ A \ \ A \ \
*.6% & H H
Konfidenz
2 # ? ) 8 ) 8 & - WDE ) * F
- < 0 ) 7 ) * - %
. ) 7
2 # %$ * *%# )
. 9%! < . %# * % %5 ! ! H GM ? ) 8
> *<- - * *D. %# * % %5 !FAH 'M
* 7 ) * 7 *- - 7 . 9%! <
* W
2 ! GGG - 9 ) +GM
*. *& I 'M $ . * ** #
*. $ . * ? ) 8 ++M
> *<- - * . *. ) $ . * L < . W
Signifikanztest
2 - * 0 1 ) * ) 8 & * /
2 # . 8 ) ? 87 *- ) * /
r B B A
A → −
−
−
−
→
r B r
B A A
r B B A
A
1
1
Sicherheitsmaß
- H H G - *! 1 $3 D
= ** * * F
2 = - D F ^ *D F
$3D FA - D F Z *D FVD %*D FF
2 = - D F [ *D F
$3D FA - D F
2 *
$3D FA G
# * - *! 1 ) 8 & 7
= ) ! . 8 * ) - *! 1 <
! 7 D 9 ) F ** 8 *
Was wissen Sie jetzt?
2 ) 8 & ) 7
. /
Z < 0 * ! G 7 7 )
Z # = * B 7 ) 7 ) !
Z # = * ) 7 ) 7 ) 0 7
2 ) 0 1 . ) ) 8 &
/
Z - * 0 1
Z * * *- * 0 1 )
Z - *! 1
Zeitphänomene
Ereignisse Sequenzen
Zeit
t
1t
2t
it
mt
m+1Attribute
Univariat - Multivariat
Univariat - ein Attribut pro Zeit (Herzfrequenz)
Multivariat - k Attribute (Herzfrequenz, Atemfrequenz, Blutdruck)
t
1t
2t
it
mt
m+1Zeit
t
1t
2t
it
mt
m+1Zeit
1 k
Beispiele für Zeitreihen
2 0 **7 9 ! 8 **
Z ( * 9! ) 8
Z . . *
Z = )
Z
Kontinuierliche Messung in z.B. Tagen, Stunden, Minuten, Sekunden
Beispiele für Ereignisse
2 # .
Z 5 *) 5 . *) 8 )
Z ** D . !! F
Ereignisse mit Zeitangaben in Jahren, Monaten, Tagen Verkäufe Monat Anzahl Verkäufer ...
...
...
...
...
...
256 Meier
Juni
Lernaufgaben
2 9
Z 5 * ) .J % -
Z ! > ) . D ! * F
Z . > )* ) D, 6. . * ) = F
Z 3 ) 9 ! ) ) 7 - ) = D * 1 F
Z $ * / 3 ** < - - 9 )
= 8 $ * 8 * !!
2 0 9
Z 3 ) 8 * !! ) =
Repräsentation der Eingabedaten
Multivariat: i
l: <t
1, a
11, ... , a
1k>
<t
2, a
21, ... , a
2k>
...
<t
i, a
i1, ... , a
ik>
Univariat: i
l: <t
1, a
1>
<t
2, a
2>
...
<t
i, a
i>
Lernaufgaben
X 8 9 ** /
3 ) < & * ) X 8 Q0 R
2 = ) ) , >
Q# * R
8 87 *- , %( 9
QL B&& R
2 * 9 ) $ * ) -
(Menge von Ereignissen in partieller Ordnung)
Repräsentation der Eingabedaten
* * > & D, * ) ) F
# , * ) . = ) D> )
87 *- F *
*& /
D ) 'FPD3 ) I HFPD G "F
2 0B - . ) # *
X 8 5 . / ( / > >
3 . / D( > >
*F
Wie finde ich die Ereignisse in Zeitreihen?
2 3 * * < 7
Z 9 ) ) 0 *
2 ( . ! 6* ) , -
9 0 * Q0 .V VHH R
Z *& /
Z 5 / #6 ! *- <
2 # *. * ) - $ * Q# * R
Clustering Vorbereitung
Zeitreihe s = (x1,...,xn) in Subsequenzen si = (xi,...,xi+w-1) aufteilen
Fenster der Bereite w = 3
Schritt 2
Clustering
# * 8! 1 )D* *CF/ 87 *- 87 * X 8
*& / . ) *- * ) (Σ(xi-yi)2)0,5
? * ) ^ G/ 7 1 ) *- ) 87 *- )
* X 8 * )
) * ) 0 * X 8
$ * $ $.
@ ) * $ * < 6! . D: & *;F
Anwendung des Clustering
# * A D4 4 F . C 8 ! L ) * & *
*- 7 ) D:) *. * ;F
Regeln in diskreten Sequenzen
2 ) 3 !
= ) ) , > -
! ( (
2 - ) , !_. !B -
Z D.A 8 ) 6! ! A ` 9 *- ) 0B - . >F
2 7 /
Z = ) ) ) ) , 5
) ) , >
Z 0 - * ↓ D F 0 - * ↑ D F J ( → D F ( 0 → D F
Z !/ 8 ) * * .
Beziehungen zwischen Ereignissen
2 5 @ ! * 3 7 ) 9 *- )
( 9 8 * /
Z && ) 9 <
2 *& / )
(A, StartA, EndeA)
(B, StartB, EndeB)
StartB<StartA, EndeA = EndeB,
Beziehungen zwischen Zeit- Intervallen lernen [Höppner]
Darstellung der Beziehungen als Matrix:
R1 R2
Regeln
Prämisse P Regel R
Die Regeln sind von der Form P → → → → R
Beispiel: A, B, C sind Verträge verschiedener Kategorien
Häufige Muster finden
Muster muss im Fenster der Länge t
maxbeobachtbar sein
Der maximale Abstand zwischen den Ereignissen eines Muster ist begrenzt
Was bedeutet häufig?
Als Maß für die Häufigkeit von Mustern dient der „Support“
A B A = o B io =
Ein Muster wird als häufig
erachtet, wenn es einen Support >
supp
minhat
Anwendung von APRIORI
2 ! ) && %0 *
2 (! .% /
Z 0 * ! * &&[* &&!
Z * ) 9 .%0 * 0 9
? ) ) .J %0 *
Z ! ) && ) ? ) ) ! <- *
2 = ) ) * - * . < 0 * !
) 7 ) .B
2 ) * ) < 0 *
Was wissen Sie jetzt?
2 0 . ) & ! * ) ) -. 9
, * X 8 7 )
2 # * 8 9 ) ! # * /
Z 3 * 7 ) ) , *-
Z # * * X 8 7 ) ) - # * 8! 1
%- * % * * 0 * 7 aufsteigend, absteigend
Z 0 ) 0 * * 7 ) ** 8 *
2 # * 8 9 3 . L B&& /
Z 3 * 7 ) ) , *-
Z 0 8 8 * ( 9
Z L < !B - * X 8 7 ) ! )
** 8 *