Einteilung in Hauptkategorien und Subkategorien

3. Ergebnisse

3.2 Von den Interviews zum Fragebogen

3.2.1 Einteilung in Hauptkategorien und Subkategorien

Tabelle 7 stellt eine Auflistung der Haupt- und Subkategorien, sowie die Fragenanzahl der einzelnen Hauptkategorien, und die hiervon schließlich verwendete Anzahl an Fragen für den DaMiPu-Fragebogen dar.

auffälligkeiten“ - Appetitlosigkeit - Laufen lernen

struktur - Krankheitsein- schätzung

Die größte Anzahl an Fragen enthielt die Hauptkategorie „Symptome der Atemwege“

mit 162 Fragen. Insgesamt gingen 26 Fragen dieser Hauptkategorie in den endgültigen Fragebogen ein. Dies macht einen Anteil von 57,8 % aller Fragen der DaMiPu-Fragen aus, was wiederum die Bedeutung dieser Kategorie aufzeigt.

Die Hauptkategorie „Operationen“ bestand nur aus einer Frage, trotzdem wurde diesem Aspekt eine hinlänglich große Bedeutung zugewiesen, so dass diese Frage in den finalen Fragebogen aufgenommen wurde. Auf den folgenden zwei Seiten ist der finale Fragebogen mit den 45 Fragen dargestellt (Abb.5). Dieser befindet sich ebenfalls im Anhang (siehe Anhang, Punkt 11.6).

52 Abbildung 5: Finaler Fragebogen

Fragebögen aus Familien mit einem Pneumonie-Patienten. Hier wurden nur zehn Fragebögen erfasst. In die Kontrollgruppe der gesunden Kinder gingen 24 beantwortete Fragebögen ein.

Neben der eigentlichen Diagnose, wurden im Fragebogen Informationen zum Geschlecht, dem aktuellen Alter, dem Alter beim Auftreten der ersten Symptome und dem Alter bei der Diagnosestellung des Kindes erhoben. Die Abb. 7 und 8 stellen zum Einen das durchschnittliche Alter der untersuchten Kinder heute (Abb.7) und zum Anderen die diagnostische Latenz bei den einzelnen Diagnosen (Abb.8) graphisch dar. Zudem beinhalten sie die jeweiligen Minimal- und Maximalwerte.

Abbildung 7: Durchschnittliches Alter bei Beantwortung des Fragebogens und bei Diagnosestellung (mit Minimal- und Maximalwerten)

Innerhalb der Diagnosegruppe akute Bronchitis waren die Kinder zum Zeitpunkt der Untersuchung durchschnittlich am jüngsten ( = 2 Jahre), gefolgt von den Kindern mit PBB ( = 5 Jahre) und Pneumonien ( = 6 Jahre). Die ältesten Kinder waren in den Diagnosegruppe CF ( = 10 Jahre) und PCD ( =11 Jahre) zu finden. An Asthma erkrankte Kinder waren zum Befragungszeitpunkt im Mittel 9 Jahre alt. Das durchschnittliche Alter bei der Diagnosestellung zeigen die roten Balken. Kinder mit CF und akuter Bronchitis waren im Durchschnitt 2 Jahre alt. Asthma und PBB wurde durchschnittlich im Alter von 4 Jahren diagnostiziert. Bei Kindern mit PCD und

Pneumonie lag das mittlere Diagnosealter bei 6 Jahren. Alle Altersangaben wurden auf ganze Jahre gerundet.

Abbildung 8 zeigt die durchschnittliche Zeit (in Jahren) seit Beginn der ersten Symptome bis zum Alter bei Diagnosestellung (= diagnostische Latenz).

Hervorzuheben sind die Ergebnisse bei der Diagnosegruppe PCD. Hier lässt sich für die befragten Kinder feststellen, dass die Symptome bei den meisten Kindern bereits seit der Geburt bestanden, jedoch erst 6 Jahre später die Diagnosestellung erfolgte (Mittelwert diagnostische Latenz und Mittelwert Alter bei Diagnosestellung= jeweils sechs Jahre).

Abbildung 8: Mittelwerte der diagnostischen Latenz pro Diagnosegruppe

3.4 Unvollständig oder fehlerhaft beantwortete Fragen

59% der in das Data Mining-Programm eingelesenen Fragebögen gingen vollständig ausgefüllt an uns zurück. Die angeführte Abb. 9 zeigt eine Auflistung der nicht beantworteten Fragen mit der jeweiligen Häufigkeit.

[0;5]

[0;8]

[0;25]

[0;8]

0 1 2 3 4 5 6 7

Jahre

Mittelwert der diagnostischen Latenz

Mittelwert der diagnostischen Latenz [MIN;MAX]

Abbildung 9: Unvollständig oder fehlerhaft beantwortete Fragen

Da 165 Elternteile den Fragebogen beantworteten, kommt man auf eine Gesamtzahl von 7.425 (165x 45) möglich beantworteter Fragen. Insgesamt wurden 228 Fragen nicht beantwortet. Dies entspricht einer Fehlerrate von 3,07%.

Aus Abb.9 geht hervor, dass es insbesondere bei Frage 19 („Geht bzw. ging auftretende Luftnot, auch ohne Medikamente, nach einer kurzen Erholungsphase von alleine wieder weg?“) zu Problemen bei der Beantwortung gekommen ist. Die Fragen 11 („Hatte Ihr Kind bereits eine Lungenentzündung und war während dessen trotzdem munter und fröhlich?“) und 35 („Finden Sie, dass Ihr Kind im Vergleich zu Gleichaltrigen besonders häufig Atemprobleme hat und vielleicht daher auch häufiger im Kindergarten/in der Schule fehlt?“) wurden jeweils zehnmal nicht oder fehlerhaft beantwortet. Tabelle 8 zeigt eine detaillierte Auflistung dieser Fragen mit zugehöriger Häufigkeitsangabe der Fehlerrate.

0 5 10 15 20 25 30

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45

Anzahl fehlerhafter Antworten

Fragennummer

fehlerhafte/unvollständige Antworten

fehlerhafte Antworten

58 11 Hatte Ihr Kind bereits eine Lungenentzündung und war

während dessen trotzdem munter und fröhlich? 6,06 12 Hatte Ihr Kind bereits eine Lungenentzündung, und nach

dem Absetzen des Antibiotikums folgte gleich die nächste Lungenentzündung?

4,85

19 Geht bzw. ging auftretende Luftnot, auch ohne

Medikamente, nach einer kurzen Erholungsphase von alleine wieder weg?

15,15

24 Kommt bzw. kam es bei Wetterumschwüngen zu

Atemnotanfällen? 5,45

34 Liegt bei Ihrem Kind ein jahreszeitenunabhängiger

"Dauerschnupfen" vor? 4,24

35 Finden Sie, dass Ihr Kind im Vergleich zu Gleichaltrigen besonders häufig Atemprobleme hat und vielleicht daher auch häufiger im Kindergarten/in der Schule fehlt?

6,06

36 Haben bzw. hatten Sie das Gefühl, Ihr Kind ist/war in der Entwicklung seiner Bewegungen (z. B. spätes Laufen lernen) langsamer als seine Altersgenossen?

4,24

39 Haben bzw. hatten Sie schon länger "irgendwie" das Gefühl, dass mit Ihrem Kind etwas nicht stimmt?

4,85 40 Bestehen bzw. bestanden während der

Haupt-Pollenflugzeit

(März bis September) Atemprobleme?

5,45

43 Hören Sie ein Pfeifen, wenn Ihr Kind atmet? 4,85 45 Gibt bzw. gab es Tage an denen Ihr Kind sehr stark hustet/

hustete, die von Tagen mit völliger Beschwerdefreiheit abgelöst werden/wurden?

4,24

3.5 Funktionen des Data Mining-Programms

Das Data Mining-Programm für die ausgewählten Erkrankungen des Bronchialsystems setzt sich aus mehreren Funktionen zusammen. Im folgenden Abschnitt werden die für die Fragestellungen der Arbeit relevanten Funktionen und ihre Ergebnisse vorgestellt.

Bei den hier verwendeten Screenshots hingegen handelt es sich, der Anschaubarkeit halber, um einzelne Java Module des Basisprogramms. Abbildung 10 zeigt die Eingabemaske des Fragebogens im Ausgangszustand.

Abbildung 10: Eingabemaske für pulmologische Erkrankungen-Fragebogen

Die gezeigte Struktur kann zur direkten Antworteingabe der einzelnen Fragen (beispielsweise auch über das Internet) genutzt werden. Neben jeder Frage befindet sich ein Kästchen mit einem Fragezeichen (?). Dieses dient als Platzhalter, solange keine Antwort gegeben wurde. Rechts daneben kann auf einen nach unten zeigenden Pfeil (▼) geklickt werden. Es öffnet sich ein neues Fenster zur Auswahl der möglichen Antwortmöglichkeiten („trifft überhaupt nicht zu“, „trifft sehr selten zu“,

„trifft eher nicht zu“, „trifft manchmal zu“, „trifft häufig zu“ und „trifft völlig zu“). Mit

einem Klick auf den Button „Diagnoseberechnung starten“ beginnt die Auswertung des Antwortmusters durch das Data Mining-Programm und es wird umgehend ein diagnostischer Vorschlag errechnet

(http://portal.improvedmedicaldiagnostics.com/q/pm/1/). Die Funktion ist zum Einen für denjenigen Anwender interessant, der das Programm zur Diagnose- Unterstützung nutzen möchte. Zum anderen besteht auch die Möglichkeit, bereits bekannte Fälle zu laden oder die gemittelten Antwortmuster der einzelnen Diagnosen, in der oben gezeigten Eingabemaske, in Textform, anzeigen zu lassen.

Die Analyse und Bewertung, sowohl des entwickelten Fragebogens, als auch der verwendeten mathematischen Verfahren, wurde basierend auf den im Folgenden erläuterten Funktionen und deren Ergebnissen, vorgenommen.

3.5.1 Gemittelter Fall

Mit dem Steuerelement „gemittelter Fall“ kann das durchschnittliche Antwortmuster jeder Diagnosegruppe aufgerufen werden. Bei dieser Funktion handelt es sich um einen Test der Funktionsfähigkeit des Programms. Als sogenannter „mittlerer Patient“

wird das Antwortmuster bezeichnet, welches die durchschnittlich gegebenen Antworten jeder Frage, bezogen auf eine Diagnosegruppe, repräsentiert. Nur wenn die Krankheiten der „mittleren Patienten“ richtig und sicher erkannt werden, dann wird auch jeder neue Patient, der vergleichbare Werte aufweist, ebenfalls richtig diagnostiziert und die Erkennungsrate konvergiert für diese Patienten gegen 100%.

Die vorliegende Programmversion (Tab. 9) kommt dabei zu dem folgenden Ergebnis:

Tabelle 9: Erkennungsrate der „mittleren Patienten“ des Computerprogramms je Diagnosegruppe

Diagnose 1 (CF) : 86% basierend auf 28 Patienten Diagnose 2 (Asthma): 94% basierend auf 39 Patienten Diagnose 3 (PCD): 93% basierend auf 24 Patienten Diagnose 4 (Pneumonie): 59% basierend auf 10 Patienten Diagnose 5 (Akute Bronchitis): 94% basierend auf 23 Patienten Diagnose 6 (PBB): 76% basierend auf 17 Patienten Diagnose 7 (gesund): 95% basierend auf 24 Patienten

Die Auflistung der Tab. 9 zeigt, dass die Leistungsfähigkeit des Computerprogrammes stark von der Anzahl der zur Verfügung stehenden Patienten abhängt. Diagnosen mit den wenigsten vorhandenen Datensätzen weisen auch die geringste Rate der korrekten Diagnosezuordnung auf. Der „mittlere Patient“ der Diagnose Pneumonie basiert auf den Daten von zehn Patienten. Aufgrund der geringen Fallzahl besteht hier noch ein großes Potenzial für Schwankungen im Ergebnis, sobald dieser Datensatz mit weiteren Angaben zu Pneumonie-Patienten erweitert wird. Die höchste Rate der richtigen Diagnosebestimmung gelingt dem Programm bei den Diagnosen Asthma und akute Bronchitis. Auch die Lungengesunden werden zu 95% korrekt erkannt. Zusammenfassend belegen die Zahlen, dass es dem Computersystem gelingt - vorausgesetzt die Fallzahl der Patienten ist ausreichend (> 20 Patienten) - einen hohen Prozentwert an korrekten Diagnosen (>85%) zu stellen.

3.5.2 Retrospektiver und prospektiver Test

Die Funktionen „retrospektiver Test“ und „prospektiver Test“ dienen der Beantwortung der Frage, zu welchem Prozentsatz es dem Computersystem gelingt, die richtige Diagnose bei eingelesenen Fällen rückwirkend korrekt zu stellen, bzw.

um Voraussagen für die Zuordnungswahrscheinlichkeit neuer, dem System unbekannter Fälle treffen zu können. An dieser Stelle folgt zunächst ein kurzer Exkurs zur Arbeitsweise des Data Mining-Programms.

„Exkurs“ Data Mining-Programm:

Insgesamt standen für das Data Mining-Programm 165 Testpatienten zur Verfügung.

Für die Programmierung mussten diese in Gruppen unterteilt werden, da für den Einsatz des Programms drei Arbeitsschritte durchlaufen werden müssen. Der erste Schritt war der sogenannte Testdurchlauf. Hierfür wurde der größte Anteil aus dem gesamten Datensatz benötigt. Hintergrund ist, dass ein Data Mining-System nur funktionieren kann, wenn es zuvor mit einer ausreichend großen Datenmenge trainiert wurde. Dieser Prozess ist vergleichbar mit dem eines Schachcomputers, der mit den Informationen aus vielen unterschiedlichen Schachpartien „lernt“, um für neue Spielsituationen präpariert zu sein. Der Testdurchlauf in der vorliegenden Arbeit wurde mit 130 Patienten durchgeführt. Je mehr Antworten pro Frage dem Programm zur Verfügung standen, desto genauer konnte es trainieren, die einzelnen Diagnosen voneinander zu trennen, da auftretende Varianzen vergleichsweise niedrige Gewichtungen aufweisen. Der zweite Arbeitsschritt umfasste das sogenannte

„Validieren“ der mathematischen Algorithmen. Dieser Schritt in der Entwicklung hatte die Aufgabe, das Programm mit den zuvor 130 eingelesenen Patienten zu testen.

Vereinfacht kann dieser Test als Nachweis über den Erfolg des Trainings bezeichnet werden. Der vorliegenden Arbeit vorausgegangene Untersuchungen der Arbeitsgruppe (Grigull & Lechner, 2012) haben gezeigt, dass mindestens 10% des gesamten Datensatzes (= hier ausgefüllte Fragebögen) zum Validieren verwendet werden müssen. Daher wurden hier dementsprechend 21 Datensätze für diesen Arbeitsschritt eingesetzt (drei Datensätze pro Diagnosegruppe).

Den letzten Arbeitsschritt stellte die „prospektive Testung“ dar. Diese Patientendaten standen dem Computersystem nicht zum Training zur Verfügung. Der Schritt diente dem Nachweis, zu welchem Prozentsatz es dem Programm gelingt, bis dato unbekannten Datensätzen eine korrekte Diagnose zuzuordnen. Der prospektive Testdurchlauf wurde mit den Antwortmustern von 14 Patienten durchgeführt (zwei pro Diagnosegruppe). Der limitierende Faktor für diese niedrige Fallzahl begründet sich auf der kleinen Gruppe der Pneumonie Patienten. Da mindestens 50% - bei der Diagnosegruppe Pneumonie folglich fünf Patienten - der Daten zum Testen benötigt werden und drei Patienten zum Validieren erforderlich sind, so verbleiben schließlich noch zwei Patienten für den prospektiven Test.

Es wurden bei der Analyse des Ergebnisses der Computer-gestützten Diagnose unterschiedliche Fehlerarten (= Fehler bei der Diagnose-Stellung) unterschieden.

Potenzielle Fehlerarten sind Voting- oder Computerfehler. Ein Votingfehler wird wie folgt definiert:

Die Referenzdiagnose wurde von mindestens einem der drei unabhängigen Systeme (Fuzzy, SVM, ANN) erkannt, aber vom Voter nicht als finale Diagnose ausgewählt.

Die Funktionen zeigen jeweils eine A- und eine B- Diagnose an. Diese Diagnosen sind diejenigen, die vom Computersystem als Diagnose erster (A), bzw. Diagnose zweiter (B) Wahl ermittelt wurden. Tritt ein Votingfehler auf, so wird die korrekte Diagnose zwar als B- Diagnose vom System angezeigt, der Voter hat sich jedoch für eine falsche, nämlich die A- Diagnose entschieden.

Ein Computerfehler hieße, dass weder die A- noch die B- Diagnose vom Programm richtig erkannt werden.

Tabelle 10 zeigt die Ergebnisse des retrospektiven Tests. Von den 130 getesteten Patienten wurden 126 (96,9%) richtig diagnostiziert. Bei vier der getesteten Patienten (3,1%) trat ein Votingfehler auf. Andere Fehler wurden nicht beobachtet. Die Tabelle zeigt eine vereinfachte Auflistung der Ergebnisse der einzelnen mathematischen Verfahren, sowie der jeweils angezeigten A- Diagnose (Ergebnis Voter) und der B- Diagnose (hier korrekte Diagnose), der vier Votingfehler.

Tabelle 10: Fehlerhafte Ergebnisse des retrospektiven Tests der Trainingsdaten

Grundsätzlich wählt der Voter aus den drei Diagnosen von Fuzzy, SVM und ANN aus. Es werden nur solche Diagnosen A und B ausgegeben, die in den drei Einzeldiagnosen auftreten. Man sieht, dass beim Patient 90 (Zeile 1 in Tabelle 10) die Diagnose 7 (gesund) zwar als B- Diagnose aufgeführt wurde, der Voter sich jedoch für die Diagnose 1 (CF) „entschieden“ hat. Zweimal trat ein Votingfehler bei Patienten mit PBB auf und einmal bei einem Patienten mit Pneumonie. Bei den Votingfehlern „2“ und „4“ wurde die Diagnose Asthma vom Voter ausgewählt, obwohl zwei der drei mathematischen Verfahren sich für die Diagnose PBB entschieden haben. Hier gilt zu beachten, dass das Programm mit Gewichtungen rechnet, die jedoch aus der Tabelle nicht ersichtlich sind (siehe hierzu Formel des Voting- Verfahrens unter 2.7.4). Folglich hatte das Ergebnis des SVM-Verfahrens allein eine höhere relative Gewichtung als das von Fuzzy- und ANN-Verfahren gemeinsam. Das Gesamtergebnis des retrospektiven Tests zeigt, dass das verwendete Data Mining- Programm anhand der beantworteten Fragebögen bei 130/130 (100%) die richtige Diagnose als A- oder B- Diagnose erkennt.

Tabelle 11 zeigt die Ergebnisse der Simulation des prospektiven Testdurchlaufs. Bei 2 der 14 getesteten Fälle konnte die richtige Diagnose nicht korrekt gestellt werden.

Diese beiden Votingfehler traten bei der Zuordnung der Diagnose Pneumonie auf.

Diese beiden Patienten wurden vom Programm als „gesund“ klassifiziert Im Umkehrschluss bedeuteten die Ergebnisse des prospektiven Tests, dass die A- oder B Diagnose in 14/14 (100%) korrekt erkannt wurde und der Voter sich für die A- Diagnose bei 12/14 (85,7%) der Patienten richtig entschieden hat.

Tabelle 11: Ergebnisse des prospektiven Tests der Trainingsdaten

arbeitet mit einer AUC von 100% für den prospektiven Test am zuverlässigsten. Der Voter kommt hier ebenfalls auf eine AUC von 100%. Aus der unter der ROC-Kurve stehenden Tabelle wird nochmals deutlich, dass beide der prospektiv getesteten Patienten der Diagnose 4 (Pneumonie) falsch zugeordnet wurden (vgl. 3.5.2 Tab.11).

Es ist scheinbar zunächst schwer verständlich, dass trotz der beiden Votingfehlern bei den Pneumonie-Patientendatensätzen im prospektiven Test die Zuverlässigkeit des Voters mit 100% angegeben wird. Die Erklärung dieses Ergebnisses wird anhand einer vereinfachten mathematischen Darstellung ersichtlich:

Die ROC-Funktion bildet sich aus den Wertepaaren der auf der y-Achse richtig erkannten Diagnosen (richtig positiv=RP) und denjenigen der auf der x-Achse falsch erkannten Diagnosen (falsch positiv=FP). Die AUC entspricht dann der Fläche unter dieser Kurve. Für den prospektiven Test mit 2 Patienten pro Diagnosegruppe sehen die einzelnen Ergebnisse wie folgt aus:

Diagnose RP FP Anzahl je Diagnose

1 2 0 2

2 2 0 2

3 2 0 2

4 0 0 2

5 2 0 2

6 2 0 2

7 2 2 2

RP Richtig Positiv; FP Falsch Positiv

Im nächsten Schritt werden die Ergebnisse der RP Werte jeweils durch die Anzahl der Diagnosen geteilt und in eine Prozentzahl umgewandelt. Folglich ergeben sich die aufgelisteten skalierten Wertepaare:

67 Diagnose RP FP Anzahl je Diagnose

1 100 0 2

2 100 0 2

3 100 0 2

4 0 0 2

5 100 0 2

6 100 0 2

7 100 100 2

RP Richtig Positiv; FP Falsch Positiv

Damit liegen die ersten sechs Diagnosen auf der x-Achse und die Diagnose 7 auf der y- Achse und zieht die Kurve zum Endpunkt (100/100). Die AUC ergibt somit 100%.

Die Ursache des Ergebnisses liegt in der Diagnose 4, bei der der Voter statt der richtigen Diagnose 4 zwei Mal die Diagnose 7 (gesund) bestimmt hat. Für die Diagnose 7 ergeben sich also jeweils zweimal „RP“ und „FP“ Werte. Dies führt mathematisch dazu, dass die ROC-Kurve als fehlerfrei abgeschlossen wird.

3.5.4 Mittelwerte der Antworten

Hinter der Funktion „Mittelwerte“ verbirgt sich die Darstellung der gemittelten Antworten zu jeder Diagnosegruppe. Tabelle 12 stellt die Ergebnisse der Mittelwerte grafisch dar.

In der ersten Spalte („A“) findet sich nochmals die Darstellung des durchschnittlichen Lebensalters zum Zeitpunkt der Befragung (vgl. 3.3 Abb. 7). In Worte gefasst bedeuten die Antworten 1 bis 6:

 1= trifft überhaupt nicht zu

 2= trifft sehr selten zu

 3= trifft eher nicht zu

 4= trifft manchmal zu

 5= trifft häufig zu

 6= trifft völlig zu

68 Tabelle 12: Mittelwerte der einzelnen Antworten

A= aktuelles Alter des Kindes; F1- F45= Fragen des finalen Fragebogens numerisch geordnet vgl. hierzu (Anhang, Punkt 11.6)

Um die Tab. 12 übersichtlicher zu gestalten, wurden die Antwortstufen „1“ und „2“ rot;

„3“ und „4“ blau; „5“ und „6“ grün hervorgehoben. Bei vermutlich besonders relevanten Fragen sollten die Antworten im Idealfall zwischen den gemittelten Antworten jeder Diagnosegruppe variieren. Die farbliche Darstellung erleichtert den Vergleich zwischen den durchschnittlich gegebenen Antworten. Bei den meisten Fragen sind ausreichend große Farbwechsel und damit eine Varianz der Zahlenwerte gegeben. Bei den Fragen 1, 11 und 41 hingegen variieren die Antworten um maximal 1,5 Antwortstufen. Dies lässt vermuten, dass diese Fragen eher weniger zur Unterscheidung der einzelnen Diagnosen geeignet sind. Relevante Fragen für einzelne Diagnosen erkennt man daran, wenn die gemittelte Antwort sich stark, dass heißt mindestens in einer Antwortstufen, von allen anderen Antworten der anderen Diagnosegruppen unterscheidet. Dies trifft für die durchschnittlichen Antworten der Fragen 13 ( = 4,9 bei PCD), 26 ( = 5,1 bei PCD), 27 ( = 4,7 bei PCD), 29 ( = 3,6 bei PCD), 31 ( = 4,6 bei Asthma), 32 ( = 4,9 bei PCD), 34 ( = 5,2 bei PCD), 38 ( = 5,0 bei PCD) und 39 ( = 5,5 bei PCD) zu. Es fällt auf, dass alle genannten Antworten, außer auf die Frage 31, bei der Diagnose PCD die aufgezählten Fragen im Durchschnitt mit „trifft häufig zu“ und „trifft völlig zu“

beantwortet haben. Die Frage 31 wurde bei Vorliegen der Diagnose Asthma überdurchschnittlich hoch (Durchschnittliche Antwortstufe 4,6) beantwortet. Diese Fragen erleichtern die Zuordnung zu den genannten spezifischen Diagnosen Asthma und PCD. Bei allen anderen Fragen ergibt sich ein variantes Antwortmuster, bzw.

Überschneidungen der gemittelten Antworten mehrerer Diagnosen. Ob diese

„scheinbar“ spezifischen Fragen für bestimmte Diagnosen und damit zu deren Zuordnung als „gute Fragen“ bezeichnet werden können, ist mittels der alleinigen Berechnung der Mittelwerte nicht beurteilbar. Überschneidungen der Antwortmuster in verschiedenen Diagnosegruppe zeigen an, dass bestimmte Symptome nicht nur eine Erkrankung betreffen. Die Aufgabe der verschiedenen Data Mining-Verfahren (Informationsgewinn und Korrelationsmatrix) besteht nun darin, diese Überschneidungen mathematisch aufzulösen (siehe hierzu Kapitel 3.5.6 und 3.5.7).

Anhand der gewählten Farben wird ersichtlich, dass sich die Diagnose 1 (CF) insgesamt am geringsten von der gesunden Kontrollgruppe unterscheidet.

Die Breite der Balken entspricht der Standardabweichung, welche für jede Frage jeder einzelnen Diagnose berechnet wurde. Deren Formel lautet:

Die schmalsten Balken symbolisieren eine Standardabweichung mit einem Minimum von +/- einer Antwortstufe. Beispielsweise weisen die gemittelten Antworten aller Diagnosen (außer bei akuter Bronchitis) bei Frage 10 („Hatte Ihr Kind bereits eine Lungenentzündung?“) eine hohe Standardabweichung auf. Dies bedeutet, dass eine hohe Varianz der gegebenen Antworten innerhalb einer Erkrankungsgruppe besteht.

Folglich hatte ca. die Hälfte der Kinder bereits eine Pneumonie, aber die andere Hälfte nicht. Das Resultat sind Mittelwerte im blauen Bereich. Dieses Ergebnis führt zu der Vermutung, dass die Frage eher weniger geeignet für die Diagnosezuordnung ist. Jedoch lässt sich dieses nicht nur anhand der Mittelwerte beurteilen (siehe 3.5.6 und 3.5.7).

3.5.5 Datenplots

Mit Hilfe dieser Funktion lassen sich Hypothesen zu Antwortmustern bei bestimmten Erkrankungen nachprüfen. Beim „Plotten“ können eine oder mehrere Diagnosen und die zu untersuchenden Antwortmuster einzelner Fragen ausgewählt werden.

Abbildung 12 stellt die Funktion „Plotten“ mit dem Bespiel einer detaillierten Antwortverteilung von ausgewählten Fragen des Fragebogens vergleichend dar. Die kleinen Quadrate der Graphik (Abb. 12) stehen jeweils für eine Antwort eines Patienten. Die unterschiedliche Höhe der Punkte innerhalb der einzelnen Diagnosegruppen illustrieren die Antwortstufen 1 bis 6. Eine 1 (trifft überhaupt nicht zu) wird von einem Punkt am unteren Rand jeder Diagnosegruppe, eine 6 (trifft völlig zu) wird von einem Punkt am oberen Rand symbolisiert. Der linke Plot der Abb. 12 stellt die Antwortverteilung auf die Frage 22 („Hatte ihr Kind zunächst Schnupfen und im weiteren Verlauf kam Husten hinzu?“) dar. Hier zeigt sich eine hohe Varianz der gegebenen Antworten innerhalb aller Diagnosegruppen. Vergleicht man hierzu den rechten Plot der Abb. 12, dann wird deutlich, dass bei der beispielhaft ausgewählten Frage 30 („Bestand bereits im ersten Lebensmonat nach der Geburt ein Darmproblem?“), die Quadrate bei allen Diagnosen außer bei CF, im unteren Bereich liegen (1= trifft überhaupt nicht zu). Bei der Diagnose CF hingegen wurde die Frage vergleichsweise häufig mit „trifft völlig zu“ beantwortet.

schaffen. Die folgende Formel zeigt die mathematischen Schritte in Form eines Gleichungssatzes an (Lechner, 2008):

1. Messreihe mit n Werten X= {x1, x2..., xn}

2. Messreihe mit n Werten Y= {y1, y2..., yn}

Bei der abgebildeten Matrix handelt es sich oberhalb und unterhalb der Diagonalen um eine symmetrische Darstellung. Mit Hilfe der Matrix können Aussagen darüber getroffen werden, welche Fragen auf Grund ihrer hohen Abhängigkeiten zueinander möglicherweise Redundanzen in den Antworten aufweisen und somit für das

Im Dokument Entwicklung und Evaluation eines auf elterlichen Beobachtungen basierenden Fragebogens zur Data Mining gestützten Diagnostik ausgewählter pädiatrisch-pneumologischer Erkrankungen: ein Pilotprojekt (Seite 58-0)