• Keine Ergebnisse gefunden

¨Ubungen zur Vorlesung Wissensentdeckung in Datenbanken Sommersemester 2009 Blatt 1

N/A
N/A
Protected

Academic year: 2022

Aktie "¨Ubungen zur Vorlesung Wissensentdeckung in Datenbanken Sommersemester 2009 Blatt 1"

Copied!
2
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Prof. Dr. Katharina Morik, Prof. Dr. Claus Weihs Dipl.-Inform. Marco Stolpe, Dipl.-Stat. Julia Schiffner

Dortmund, 14.04.09 Abgabe: bis Di, 21.04., 10.00 Uhr an

schiffner@statistik.tu-dortmund.de

Ubungen zur Vorlesung ¨

Wissensentdeckung in Datenbanken Sommersemester 2009

Blatt 1

Aufgabe 1.1 – Grundgesamtheit und Ereignisse (2 Punkte)

Ein handels¨ublicher sechsseitiger W¨urfel mit den Zahlen 1 bis 6 wird zweimal geworfen.

a) Geben Sie die Grundgesamtheit Ω an.

b) Geben Sie die folgenden Ereignisse an:

A: Die Summe der Augenzahlen der beiden W¨urfe ist eine Primzahl.

B: Die Augenzahl des zweiten Wurfs ist um mindestens eins h¨oher als die des ersten Wurfs.

C: Die Augenzahlen beider W¨urfe betragen mindestens f¨unf.

Aufgabe 1.2 – bedingte Wahrscheinlichkeiten und Satz von Bayes (4 Punkte) Die Eing¨ange eines Supermarkts sind mit einer Alarmanlage gegen Diebstahl gesichert. Wir betrachten die zwei Ereignisse

D: Der Kunde ist ein Dieb,

A: Der Alarm wird ausgel¨ost.

Wenn ein Dieb mit gestohlener Ware die Anlage passiert, wird mit einer Wahrscheinlichkeit von P(A|D) = 0.995 Alarm ausgel¨ost. Bei einem unbescholtenen Kunden betr¨agt diese Wahrscheinlichkeit P(A|D) = 0.006. Nehmen Sie an, dass jeder 500. Kunde einen Diebstahl¯ probiert (d. h. P(D) = 0.002).

a) Wie groß ist die Wahrscheinlichkeit P(A), dass ein beliebiger Kunde mit dem Alarm konfrontiert wird?

b) Wie groß ist die WahrscheinlichkeitP(D|A), dass die Anlage zu Recht alarmiert?

(2)

Aufgabe 1.3 – Sch¨atzung der Kreiszahl π (5 Punkte)

Bestimmen Sie eine N¨aherung der Kreiszahlπ, indem Sie gleichverteilte ZufallsvektorenX = (X1, X2)0 in [−1,1]×[−1,1] erzeugen (in R ist dies mit der Funktion runif()m¨oglich) und die Wahrscheinlichkeit f¨urP ||X|| ≤1

sch¨atzen.

Hinweis: F¨ur die Dichtefunktion von zweidimensional gleichverteilten Zufallsvektoren in [a, b]×[c, d] gilt:

fX1,X2(x1, x2) =

( 1

(b−a)(d−c) f¨ur x1 ∈[a, b] und x2 ∈[c, d]

0 sonst

sowie

P a1 ≤X1 ≤b1, a2 ≤X2 ≤b2

= Z b1

a1

Z b2

a2

fX1,X2(x1, x2)dx2dx1.

a) Zeigen Sie zun¨achst, dass ˆπ := 4·Pˆ kXk ≤1

eine sinnvolle Sch¨atzung f¨urπ darstellt.

b) Sch¨atzen Sie P kXk ≤1

durch die relative H¨aufigkeit hn kXk ≤1

= 1 n

n

X

i=1

I{kxik≤1}(xi),

den Anteil an Realisierungen xi = (xi1, xi2)0 innerhalb des Einheitskreises, f¨ur unter- schiedliche Anzahlenn∈ {10,20,50,100,1000,5000,10000}an erzeugten Zufallszahlen.

c) Stellen Sie ˆπ in Abh¨angigkeit von n grafisch dar. Wiederholen Sie nun f¨ur jedes n die Sch¨atzung zehn mal und berechnen Sie die Standardabweichung in Abh¨angigkeit von n.

Referenzen

ÄHNLICHE DOKUMENTE

Benutzen Sie zudem k-Means, Data to Similarity, Log und Cluster Density Performance innerhalb der Parameter-Schleife, um die Cluster zu bewerten. Cluster Density Performance

(b) Starten Sie das Experiment jeweils f¨ ur die zuvor genannten Werte von p und lassen Sie sich das Histogramm der vom Operator ExampleSet2Similarity paarweise berechne- ten

(a) Klassifizieren Sie Spam einmal anhand des Operators NaiveBayes und einmal mit Hilfe eines Entscheidungsbaums DecisionTree und notieren Sie die jeweils

Ziehen Sie außerdem zum Vergleich eine einfache Zufallsstichprobe der Gr¨ oße N = 20 und berechnen ebenfalls den Mittelwert ¯ X des Merkmals Petal.Width und seine gesch¨ atzte

c) Sch¨ atzen Sie den Trend der Zeitreihe durch eine lineare Trendfunktion nach der Metho- de der Kleinsten Quadrate. Zeichnen Sie die gesch¨ atzte Trendgerade in das Schaubild

Passen Sie eine Hauptkomponenten- und eine PLS-Regression auf der Basis von Korre- lationen an (in R mit den Funktionen pcr und plsr im Paket pls m¨ oglich) und erstellen Sie die

(a) Warum kann man allein anhand dieses Kriteriums den Parameter k nicht mit Hilfe einer herk¨ ommlichen Parameter-Optimierung bestimmen.. (b) Der k-Means-Algorithmus l¨ asst sich

Stellen Sie sich vor, das Pr¨ ufungsamt einer Universit¨ at h¨ atte zur Erfassung von Pr¨ ufungsergebnissen folgendes Relationenschema aufgestellt:?. Pruefungen(MatNr,