• Keine Ergebnisse gefunden

Universit¨at Dortmund SoSe 2004

N/A
N/A
Protected

Academic year: 2022

Aktie "Universit¨at Dortmund SoSe 2004"

Copied!
3
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Universit¨at Dortmund SoSe 2004

Ubungen zu ¨ Wissensentdeckung in Datenbanken

Blatt 12. Abgabe bis Montag, den 19.7.2004

Aufgabe 1 Bestimmen Sie die 1-freien Mengen, die 2-freien Mengen und die closed item sets in der folgenden Transaktionstabelle.

tid A B C D

1 0 1 1 0

2 1 1 0 0

3 1 0 0 1

4 0 0 1 1

5 0 1 1 0

6 0 1 1 1

tid A B C D

7 1 1 0 1

8 0 0 1 0

9 0 1 0 0

10 1 1 0 0

11 0 1 0 1

12 0 0 1 1

Aufgabe 2 An einem Tag im April wird zu jeder vollen Stunde das Wetter beobachtet; die Ergebnisse finden sich in der folgenden Tabelle.

Zeit Wind Niederschlag 0h windstill kein 1h windstill kein 2h windstill kein 3h windstill kein 4h windstill kein

5h Brise Regen

6h windstill kein 7h windstill kein 8h windstill Schnee 9h windstill Schnee 10h windstill kein

11h frisch kein

Zeit Wind Niederschlag

12h frisch kein

13h frisch kein

14h frisch Regen

15h frisch Regen

16h windstill kein 17h windstill kein

18h frisch kein

19h frisch kein

20h frisch Regen

21h windstill kein 22h windstill kein 23h windstill Schnee

1. ¨Uberf¨uhren Sie die Tabelle in die Repr¨asentation zeitlicher Daten, die in Mannilas Winepi-Ansatz verwendet wird (Folien Teil 13 ab Nr. 86), d.h. geben Sie die Beobachtungssequenz s an. Als Ereignis gilt dabei dasEintreteneines neuen Wind-oderNieder- schlagsverh¨altnisses, also k¨onnen null bis zwei Ereignisse zum sel-

1

(2)

ben Zeitpunkt stattfinden. Formalisieren Sie die Episoden “Auf keinen Niederschlag folgt frischer Wind, danach Regen” und “Schnee f¨allt bei Windstille”. Geben Sie die diesem Ansatz entsprechende Fensterung von s an bei einer Fensterbreite von 6 Stunden, mit einer Schrittweite von 2 Stunden. Bestimmen Sie die H¨aufigkeit der beiden Episoden anhand dieser Fensterung. Bestimmen Sie zus¨atzlich die Konfidenz der Regel “Wenn es windstill ist, f¨allt Schnee”.

2. ¨Uberf¨uhren Sie die Tabelle in die Repr¨asentation zeitlicher Daten, die in H¨oppners Ansatz verwendet wird (Folien Teil 13 ab Nr.

112), d.h. geben Sie die Zustandsintervalle an. Schieben Sie dann ein 6 Stunden breites Fenster mit Schrittweite 4 Stunden ¨uber die Zustandssequenz und bestimmen Sie f¨ur jedes Fenster die In- tervallrelationen, die zwischen den Windverh¨altnissen einerseits und den Niederschlagsverh¨altnissen andererseits bestehen. Die m¨oglichen Intervallrelationen sind die folgenden [Auswahl aus Al- lens Ansatz]:

Relation Gilt wenn

A before B A endet, bevor B beginnt A meets B A endet genau dort, wo B beginnt A overlaps B A beginnt eher als B und endet,

nachdem B beginnt und bevor B endet A starts B A und B beginnen gleichzeitig, aber A endet eher A finishes B A und B enden gleichzeitig, aber B beginnt eher A contains B A beginnt eher als B und endet, nachdem B endet

A equals B A und B beginnen und enden gleichzeitig Bestimmen Sie den Support der Muster “Regen f¨allt bei Wind (frischer Wind oder Brise)” und “Schnee f¨allt bei Windstille”.

Aufgabe 3 In dieser Aufgabe sollen Sie ein Datenbankschema zur zentralen Wettererfassung und Auswertung entwerfen. In einer endlichen und festen Anzahl von St¨adten befinden sich Wetterstationen, die jeden Tag die minimale, maximale und durchschnittliche Temperatur festhal- ten, sowie den Niederschlag an diesem Tag und die durschschnittliche Windst¨arke. Entwerfen Sie ein Datenbankschema, mit dem sich fol- gende Fragen beantworten lassen:

2

(3)

1. Wie waren durchschnittlich Temperatur, Wind oder Niederschlag in einer Stadt an einem gegebenen Tag, in einer gegebenen Woche, einem gegebenen Monat oder einem gegebenen Jahr?

2. Dasselbe f¨ur einen Monat ¨uber den gesamten Zeitraum (d.h. z.B.

die Durchschnittstemperatur ¨uber alle Januare).

3. Wie waren die durchschnittlichen Wetterwerte gemittelt ¨uber alle Wetterstationen in einem bestimmten Monat?

4. War der Niederschlag an Arbeitstagen gr¨oßer als an Tagen, die frei sind? Wie sieht es mit der Durchschnittstemperatur aus?

Hinweise:

• Sie k¨onnen alle Zeitgranularit¨aten als Integer modellieren (wie auf den Folien angegeben).

• Sie m¨ussen die Tabellen, die Sie anlegen, nicht mit Daten f¨ullen (d.h. sowohl Wetter- als auch Datumsinformationen m¨ussen nicht eingetragen werden). Wenn Sie Ihren Ansatz aber testen wollen, k¨onnen Sie einfach zuf¨allige Werte eintragen.

• Geben Sie in Ihrer L¨osung die SQL-Anweisungen an, mit denen Sie die Tabellen erstellt und die Anfragen gestartet haben.

3

Referenzen

ÄHNLICHE DOKUMENTE

Für Gemüsekulturen sowie Dill, Petersilie und Schnittlauch mit einer Folgekultur der Tabelle 11 im gleichen Jahr gelten die Werte nach Tabelle

Objekts anzufertigen, die ¨ Anderungen darauf anzuwenden und dann die Instanz auf dieses Schema umzubiegen. Von Nachteil ist, dass damit die urspr¨ungliche Prozesstyp–Zugeh¨o-

In [Got03] werden sich wiederholende Abschnitte in musikalischen Audiodaten auf graphisch recht anschauliche Weise gefunden. Nach einer gefensterten Extraktion von Chromamerk-

[CHH98] legt dar, dass seiner Meinung nach, Dokumente, die durch Breitensuchen (s. 2.2.3) gefunden werden, so leicht zu finden sind, dass sich der programmiertechnische Aufwand f¨

Hinweise zur Benutzung von Yale finden sich auf der Webseite der Vorlesung (Datei yale einfuehrung.pdf) und auf den Yale-Seiten.. Weiterhin enth¨alt die Datei Daten/yale samples.zip

Aufgabe 2 In der Vorlesung wurden parametrisierte Modelle zur Model- lierung von Zeitreihen vorgestellt. Wie findet man jedoch geeignete Parameterwerte f¨ ur ein Modell bei

Vorteile Druckverhältnisse für jeden Heizkörper gleich groß Heizflächenbedarf ist unabhängig von der Rohrführung Die Heizkörper beeinflussen sich gegenseitig nur wenig

• F ind(x) Ist x in einer Menge enthalten, so liefere diese in Form eines kanonischen Elementes zur¨ uck. Anderenfalls liefere