• Keine Ergebnisse gefunden

Viele Fragen?

N/A
N/A
Protected

Academic year: 2022

Aktie "Viele Fragen?"

Copied!
34
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Viele Fragen?

Und doch kurze Interviews!

Über Modularisierung und Data Mining

Frank Zander Julia Georgi

Institut für angewandte Datenanalyse GmbH

(2)

• Full Service Institut für Markt- und Trendforschung

• Gegründet 1998, unabhängig, inhabergeführt

• Pionier Onlineforschung

• Schwerpunkte: FMCG, OTC, Finanzen

• Forschung in über 30 Ländern

Frank E. Zander

• 20+ Jahre in der Marktforschung

• Zuletzt: Division Manager Consumer Research und Key Account Manager bei einem Global Player

• Seit 3/2012 bei EARSandEYES

• Client Service Manager

• Schwerpunkte: Strategische

Markenführung, Innovationsforschung, Marketing-Mix

• Institut für angewandte Datenanalyse

• All-in-one-Dienstleister für

Marktforschung und Research Support

• Erfassung, Codierung, Tabellierung

• Softwareentwicklung, speziell CIS

• Services rundum CIS

• Data Sciences und Data Mining

Julia S. Georgi

• 8 Jahre in der Neurowissenschaft

• Zuletzt: Wissenschaftliche

Mitarbeiterin beim Leibnitz-Institut für Neurobiologie

• Seit 4/2014 bei IfaD

• Projektleiterin Data Sciences

• Schwerpunkte: Data Sciences,

Methodenentwicklung, Data Mining, Artificial Intelligence

Institut für angewandte Datenanalyse GmbH

(3)

Zwei Themen

• Warum Interviews kürzer werden

• Wie Interviews kürzer werden

(4)

Quellen: AGOF eV, Internet facts, Sep 2014, Basis: Deutschsprachige Wohnbevölkerung in Deutschland ab 10 Jahre, ARD/ZDF- Onlinestudie 2014, Basis: Deutschsprachige Wohnbevölkerung in Deutschland ab 14 Jahre

Internet Facts

DE

griffen in den letzten 3 Monaten auf das Internet zu

76%

der Teenager in den letzten 12 Monaten

98%

der Onliner nutzen dafür das Smart- phone oder Handy, überholten den Computer/PC

60%

(5)

Quellen: ARD/ZDF-Onlinestudie 2014; Best for Planning 2014, Basen: Deutschsprachige Wohnbevölkerung in Deutschland ab 14 Jahre

50%

Mobilisten (2012: 23%

2013: 41%)

31%

via Smartphone

Mobile Facts

DE

(6)

Quelle: http://think.withgoogle.com/mobileplanet/en/

2011 18

%

2012

29

%

2013

40

%

Smartphone Penetration

DE

DE #27

weltweit = Philippinen,

Mexiko

73%

Süd-Korea

(7)

Quelle: http://think.withgoogle.com/mobileplanet/en/, Basis: Smartphone-Besitzer

61%

gingen in den letzten 7 Tagen täglich mobil ins

Internet

87%

verwenden das Smartphone

unterwegs

Smartphone Facts

DE

76%

verwenden es während des

Transports/

Fahrens

72%

im Geschäft

Smarties

= Heavy- Onliner (öfter, länger)

(8)

Audio, Video

Facts über smarte Mobilisten

Shopping

Such- maschinen

Informa- tionen

Lokale Services &

Infos Banking

Kommuni- kation

Gaming Fotos

(9)

2012:

133 m/t

2013:

169 m/t

Das heißt:

• Onliner verbringen immer mehr Zeit online

• und haben immer weniger Zeit

• für Online-

Befragungen.

Quelle: ARD/ZDF-Onlinestudie 2014, Basis: Deutschsprachige Wohnbevölkerung in Deutschland ab 14 Jahre

(10)

Ein-Blick in die Zukunft

• Die Zukunft geht smart.

• Beträgt die optimale Interviewzeit für

Onlinebefragungen mit stationäre Geräten heute noch 15-20 Minuten,

• liegt sie für Befragungen von „Smarties“ eher bei der Hälfte, optimal 7, max.

10 Minuten.

2014: 20 Min.

2016: 10 Min.

(11)

Konsequenzen für die Auftraggeber?

• Qualitätsverzicht bei längeren Interviews?

• Informationsbedarf

reduzieren bei kürzeren Interviews?

• Studien aufteilen?

• Dadurch längere Projektzeiten?

• Dadurch mehr Budget

für noch mehr Studien?

(12)

Möglichkeiten für die

Auftragnehmer/ Institute?

• Back to the roots: Face-to-face oder Telefon statt Online?

• Geringere Ausschöpfung bei

längeren Interviews ausgleichen durch größere „Mailouts“?

• Qualitätsverluste ausgleichen durch größere Stichproben?

• Anzahl der Stichproben

vergrößern? Aber: Informationen nicht verknüpfbar.

• Oder: Modularisierung von

Fragebogen und Prognose von

fehlenden Daten in einer Studie.

(13)

Das Ziel

Frage: Wie den Fragebogen in Module zerlegen, Daten

prognostizieren und damit für den Befragten das Interview kürzen?

Zielsetzung: Entwicklung eines Modells, das nicht erhobene Daten prognostiziert.

Ergo: Gleiche Zahl an Antworten bei kürzeren Interviews.

(14)

Die Studie

Die Studie

• Thema: Sportprodukte, Zielgruppe: potenzielle Verwender

• Ansatz: Usage & Attitude, Kauf und Verwendung, Segmentation (Bedürfnisse), Treiber, Need Gaps, Medianutzung, u.a.m.

Methode:

• Online Access Panel

• Selbstausfüller

• Interview: 20 Minuten

Vorgehensweise

• Modularisierung des Fragebogens

• Prognose der nicht erhobenen Daten

(15)

Gemeinsamer Fragebogenteil

Stichprobe 3:

Smartphone

(n =100)

Fragebogenmodul 1 Fragebogenmodul 2 Stichprobe 2:

Smartphone

(n=100)

Stichprobe 1:

Stationär PC

(n =800)

Das Testdesign

Training (n=500)

Test (n=300)

Gesamter Fragebogen

(16)

Der Weg durch‘s Interview

Einstellungen Sport (Bedürfnisse)

Sport &

Produkt- verwendung

Einstellungen Produkt- verwendung

Kaufverhalten

Brand Funnel Produkt- bewertung

Media- nutzung*

Einstellungen Lifestyle

Soziodemo- grafie

+ Datenbank-

informationen Dauer: 20 Minuten

* Übernahme diverser Fragen und Antworten zum Mediaverhalten mit freundlicher Genehmigung von Best-for-planning

(17)

Artgerechte Anpassung: Responsives Design

(18)

Entwicklung eines Modells mit Data Mining Methoden

Modell mit erlerntem Antwortverhalten Vollständiger Datensatz mit

empirischen Antworten

Vollständiger Datensatz mit realen und prognostizierten

Antworten

Lückenhafter Datensatz

(19)

Fragebogenaufteilung

– abgeschlossene Themenblöcke

Stationär Befragte beantworten alle Fragen notwendig für die Modellerstellung.

Smartphone Befragte erhalten alle Kernfragen und einen von zwei Themenblöcken.

Themenblock 2 Themenblock 1

Kernfragen

Frage gestellt Frage nicht gestellt Stationär

Smartphone 1 Smartphone 2

(20)

Fragebogenaufteilung

– Aufgrund der Zusammenhangstruktur

Aufteilung nach unterschwelligen und nicht-linearen Zusammenhängen

Identifizieren von „Schlüssel-Variablen“ für eine optimale Fragebogenaufteilung

Eine Vorstudie ist notwendig  längere Feldphase und mögliche systematische Fehler

1 A B

C 2

R

(21)

Fragebogenaufteilung

– alternierende Fragen

Stationär Befragte beantworten alle Fragen notwendig für die Modellerstellung.

Smartphone Befragte erhalten alle Kernfragen und einen von zwei alternierenden Fragebogen.

Themenblock 2 Themenblock 1

Kernfragen

Frage gestellt Frage nicht gestellt Stationär

Smartphone 1 Smartphone 2

(22)

Entwicklung eines Modells mit Data Mining Methoden

Modell mit erlerntem Antwortverhalten Vollständiger Datensatz mit

empirischen Antworten

Lückenhafter Datensatz

Vollständiger Datensatz mit realen und prognostizierten

Antworten

(23)

Anwendung von Data Mining Tools

– zur direkten Schätzung fehlender Werte

Klassische lineare Regression

y

x

Support Vector Machine

y

x 0

y

ϕ(x)

0

Neuronale Netze

Entscheidungsbaum

(24)

Ich esse regelmäßig Energieriegel.

Entscheidungsbaum zur Prognose fehlender Werte

Alter

>= 45 Jahre

< 45 Jahre

Sportart

Joggen Andere

Motivation

Gut aussehen Fit bleiben

Autotyp

Sportwagen Anderer n = 5 n = 30

n = 35

n = 38 n = 15

n = 53

n = 88

n = 4 n = 34

Ja/Nein

(25)

Entscheidungsbaum im Überblick

Stärken von Entscheidungsbäumen:

Lineare und nicht-lineare Zusammenhänge

Keine Umwandlung kategorialer Variablen notwendig

Fehlende Werte

Robust bei Ausreißern

Anschaulich nachvollziehbares Modell

Grenzen bei Entscheidungsbäumen:

Tendenz zum Overfitten

Das Ergebnis ist eine Stufenfunktion

Bei metrischen Variablen, Tendenz zur Mitte

Bei kategorialen Variablen, Tendenz zur Mehrheitsklasse

(26)

Höhere Entscheidungsbaum-Verfahren

– Boosted Tree

Schrittweise Kombination einfacher Entscheidungsbäume

Stärken von Boosted Trees:

Hohe Prognosegüte

Sehr gute Kontrolle des Overfittens

Fokussierung auf die schwierigen Fälle

Grenzen bei Boosted Trees:

Black Box – nicht anschaulich nachvollziehbar

(27)

0.000 0.100 0.200 0.300 0.400 0.500 0.600 0.700 0.800 0.900 1.000

Prognosegüte

Variablen

Prognosegüte des Modells

Einstellung zu Sport

r = 0.646

Produkteinstellung

r = 0.686

Leistungsversprechen

r = 0.653

Interessenthemen Print

r = 0.554

TV Sendungen/-Themen (kategorial)

Trefferquote = 0.757

Lebens- einstellung

r = 0.580

Ich mache Sport,

um wieder gesund zu werden Ich mache Sport,

um an die frische Luft zu kommen

(28)

Entwicklung eines Modells mit Data Mining Methoden

Modell mit erlerntem Antwortverhalten Vollständiger Datensatz mit

empirischen Antworten

Lückenhafter Datensatz

Vollständiger Datensatz mit realen und prognostizierten

Antworten

(29)

Ergebnisse:

– Clusteranalyse: eine Segmentierungsstudie

21%

39% 23%

17%

Vollständig erhobene Desktop-Daten (n = 770)

Hedonisten

Gesundheits- orientiert

Prophylaktiker

Leistungs- orientierte

(30)

Ergebnisse:

– Clusteranalyse: eine Segmentierungsstudie

26%

33% 21%

20%

Sehr hohe Übereinstimmung der prognostizierten Smartphone-Daten mit Desktop-Daten (Korrelation 0.93) Teilweise prognostizierte Smartphone-Daten (n = 196)

Hedonisten

Gesundheits- orientiert

Prophylaktiker

Leistungs- orientierte

(31)

Haben wir unsere Zeitvorgabe geschafft?

18,0 17,5

16,0

Smartphone Desktop Tablet

(32)

 Identifikation eines speziellen Verfahrens des Data Minings zur besten Prognose von nicht erhobenen Daten.

 Identifikation der Variablentypen, die sich gut prognostizieren lassen.

 Erkenntnis, dass sich Fragen besser prognostizieren lassen, wenn sie nicht nach Themen, sondern alternierend variieren.

 Smartphone-Interviews dauern noch länger, wenn sie nicht gekürzt werden.

Ergo: Erste Schritte haben wir getan. Und wir werden weiter gehen!

(33)
(34)

Wir freuen wir uns auf

Ihren Besuch an unseren Ständen!

Stand: 151 Stand: 170

Referenzen

ÄHNLICHE DOKUMENTE

sie schlug die Tür zu sie rief ihre Mutter Beantworte die Fragen?. Kreuze die richtige

هب یکمک نفلت قيرط زا .نئمطم و سانشان تروص هب .مينک یم کمک امش هب ام نابز هب ،عناوم نودب ،ناگيار .ميرضاح امش هب کمک یارب یزور هنابش تروص یرتشيب تاعلاطا ام یکمک

Wenn du mehr an einer technischen/handwerklichen Ausbildung interessiert bist oder lieber Strukturvorgaben hast, ist die Kunsthochschule Kassel wahrscheinlich nicht die

Die Baurekurskommission des Kantons Basel- Stadt gab stattdessen mit dem Urteilsspruch vom Sommer 2005 fast sämtli- chen Gartenhausbesitzern das Recht, ihr Häuschen zu

Für den Gau Tirol-Vorarlberg sind aus Stefan Lechners grundlegenden Studien für die Jahre 1940 bis 1943 268 Zwangssterilisierungen bekannt. Darauf aufbauend schätzt Lechner

Käufer / Keufer S. Schlage die Wörter im Wörterbuch nach. Streiche das falsche Wort durch. Notiere die Seitenzahl. Sie überfielen reisende Läute / Leute... Diese konnten sich

Unterschriftenaktion: Die CDU Büderich hat eine Unter- schriftenaktion initiiert, um die Notwendigkeit des Handelns gegen die Ansiedlung der Krä- hen im Ort zu unterstreichen.

Klasse Karin Hohmann: Die Lesefertigkeit trainieren 5 © Persen Verlag GmbH, Buxtehude.. zur