• Keine Ergebnisse gefunden

Prozesse der

N/A
N/A
Protected

Academic year: 2022

Aktie "Prozesse der"

Copied!
13
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Prozesse der

Datenkonzentration

TOM ZIMMERLING

23.06.2017

(2)

Inhalt

• Rückblick

• Data Mining

• Text Mining

• Wie verbessert Big Data unseren Alltag?

• Diskussion

23.06.2017

(3)

23.06.2017

(4)

23.06.2017

(5)

Data Mining

• automatisiertes Durchsuchen von Daten nach Mustern, Modellen oder Abweichungen

• Anwendung meist bei strukturierten Daten

• Hypothesen sind nicht notwendig

• Risiken entstehen bei Personenbezogenen Daten

23.06.2017

(6)

Data Mining

Umsatzdaten WalMart führte eine Warenkorb-Analyse durch, 20 Millionen Transaktionen pro Tag erforderten eine Datenbank mit einer Kapazität von 24 Terabyte.

Bilder Die NASA nimmt mit ihrem Earth Observing System Oberflächenbilder der Erde auf: 50 GByte pro Sekunde. Diese Erdbeobachtungssatelliten ermöglichen langfristige

Erkundungen der Landoberfläche, der Biosphäre, der Atmosphäre und der Ozeane.

Textinformationen Das World Wide Web enthält eine rapide wachsende Anzahl von Seiten und damit verbunden Daten und Informationen.

23.06.2017

(7)

Ablauf einer Datenanalyse – Modell nach Fayyad

23.06.2017

(8)

CRISP – DM

Cross- Industry

Standard Process for Data Mining

6/23/2017

(9)

Text Mining

• Analyseverfahren von un- oder schwachstrukturierten Textdaten

• Szenario 1: „Wort des Tages“ Projekt der Uni Leipzig, welches Wörter anzeigt die im Netz häufig verwendet werden

(http://wod.corpora.uni-leipzig.de/)

• Szenario 2: Trump Tweets

23.06.2017

(10)

23.06.2017

(11)

Wie verbessert die

Datenanalyse unseren Alltag?

• Verkehrsmeldesysteme

• Google flu trends

• Individuelle Kaufangebote

• Prognosen von Verbrechen

23.06.2017

(12)

“Die Macht von Big Data Digitale Freiheit oder

Einschränkung?”

6/23/2017

(13)

Quellen

https://www.youtube.com/watch?v=3Tus1SPoMWc

Data Mining (De Gruyter Studium) Taschenbuch – 7. März 2016

http://www-ai.cs.uni-dortmund.de/LEHRE/VORLESUNGEN/KDD/SS08/02_CRISP_4p.pdf

http://blog.wiwo.de/look-at-it/2015/04/22/big-data-25-trillionen-byte-daten-jeden-tag-wachst- vier-mal-schneller-als-weltwirtschaft/

https://www.youtube.com/watch?v=RAT0Cm5UEss

https://www.zdf.de/politik/frontal-21/die-macht-von-big-data-100.html

23.06.2017

Referenzen

ÄHNLICHE DOKUMENTE

Neunundvierzig Probanden suchten in einem Wiki mit und ohne die Hilfe des Wiki-Sniffers nach Informationen zu ver- schiedenen Themen und beantworteten anschließend Fragen zu

(2008a) beschreiben eine Reihe von speziali- sierten Werkzeugen f¨ ur den Zugriff auf Wikipedia und stellen einen optimierten Ansatz vor, bei dem die Inhalte von Wikipedia

Bei den Einzelnetzen kann es sich um lokale oder globale Instituts- oder Firmennetze, Netze von Online Diensten, wie eben Compuserve, regionale Internet-"Provider"netze,

abgeschlossenen Fließtext, wie er beispielsweise im Project Gutenberg 411 aufzuru- fen ist, sondern präsentiert das Tagebuch als Hypertext mit einer Vielzahl teil- weise

Demzufolge ist Interaktivität eine Qualität, die für digitale Medien charakteristisch ist: Eine Handlung an einem Objekt resultiert in einer so schnellen

Diese Vernetzung kann über Hyperlinks und einzelnen Einträge aber auch in institutionalisierten For- men von Zusammenschlüssen (z.B. als „Gruppen“ – gemeint sind

Dieser Effekt ist damit zu erkl¨aren, dass mit zunehmender Batchgr¨oße einige Ziele der anderen Nutzer (nicht vom Opfer selbst) h¨aufiger vorkommen und durch den Algorithmus

Wer Mosaic ausschließlich - ohne Netzanbindung - als Browser für lokale HTML-Dokumente nutzen möchte (z.B. zur Kontrolle beim Schreiben eigener HTML-Dokumente, die später auf