• Keine Ergebnisse gefunden

3. Ergebnisse

3.3 Auswertung der erhobenen Datensätze mittels Data Mining Verfahren

3.3.3 Einfluss einzelner Fragen auf die Klassifikation

Eine Fragen-Analyse wurde anhand des gesamten Datensatzes (76 Fragebogen) durchgeführt, um den Einfluss derselben auf die Klassifikation des Systems zu untersuchen.

Gewählt wurde hierfür der ‚Exakte Fisher-Test’ der auch bei kleinen Datensätzen zuverlässige Resultate liefert.117 Der Test wird verwendet, um die Signifikanz des Zusammenhangs zwischen Frage und Diagnosezuordnung zu berechnen. Der Test liefert p-Werte, die die entsprechende Nullhypothese verwerfen oder bestätigen, welche lautet: Die zu untersuchende Frage hat keinen Einfluss auf die Diagnoseentscheidung des Systems. Die Nullhypothese wird verworfen, wenn der p-Wert klein ist. Je kleiner der p-Wert einer Frage ist, desto höher ist also der Zusammenhang zwischen dieser Frage und der Klassifikation des Systems. Auf Seite 61 wird auf die Fragen mit den 5 kleinsten p-Werten (<0,001) genauer eingegangen.

Abbildung 7 veranschaulicht indirekt über eine farbliche und grafische Darstellung der gewählten Antworten in den Diagnosegruppen 1 und 2 die Signifikanz einzelner Fragen für die Diagnoseentscheidung. Die Befragten konnten sich zwischen 4 Antwortmöglichkeiten (grün:

Antwortmöglichkeit ‚nein’, gelb: Antwortmöglichkeit ‚eher nein’, lila: Antwortmöglichkeit

‚eher ja’, rot: Antwortmöglichkeit ‚ja’) entscheiden. Die farbliche Verteilung innerhalb der Balken über den einzelnen Fragen (x-Achse: Q1-Q40) spiegelt die relative Häufigkeit der in der jeweiligen Diagnosegruppe gegebenen Antworten zu den Antwortmöglichkeiten wider. Eine ungefähre Gleichverteilung der farblichen Anteile zwischen den zusammengehörigen Balken spricht für eine weniger signifikante Frage, wohingegen eine farbliche Ungleichverteilung zwischen den zusammengehörigen Balken bzw. eine farbliche Dominanz innerhalb der Antwortmöglichkeiten Hinweise auf eine hohe Signifikanz der jeweiligen Frage geben kann.

Abbildung 7 vergleicht die Antwortmuster beider Diagnosegruppen (‚MPS’ und ‚keine MPS’).

Die linken Balken stehen für die Beantwortung der Fragebogen durch die Diagnosegruppe 1 (‚MPS’) und die rechten Balken stehen für die Beantwortung der Fragebogen durch die Diagnosegruppe 2 (‚keine MPS’).

Die 5 Fragen mit den kleinsten p-Werten (< 0,001) sind im Folgenden festgehalten, wobei die erste Frage den kleinsten p-Wert besitzt:

• Wurde bei Ihrem Kind eine vergrößerte Leber und/oder Milz festgestellt? (Abb.

8, Q14)

• Haben Sie den Eindruck, dass Ihr Kind sich in manchen Bereichen langsamer entwickelt als andere Kinder (z.B. sprachliche Entwicklung, Bewegungsentwicklung, Gang zur Toilette etc.)? (Abb. 8, Q7)

• Haben Sie das Gefühl, dass Ihr Kind „anders“ ist als andere Kinder? (Abb. 8, Q4)

• Trifft es zu, dass Sie viel Engagement aufbringen müssen, um die normale Entwicklung (z.B. Laufen, Treppen steigen, einfache Koordination, Sprache etc.) Ihres Kindes voran zu bringen? (Abb. 8, Q21)

• Bedrückt Sie starke Ungewissheit bezüglich der Gesundheit Ihres Kindes? (Abb.

8, Q27)

Insgesamt geht aus den Berechnungen eine Vielzahl an statistisch relevanten Fragen hervor, weshalb die Bedeutung einer einzelnen Frage für die Diagnoseentscheidung dennoch in Frage zu stellen ist. Zentral ist das gesamte Antwortmuster, das letztendlich über die Klassifikation entscheidet.

Dies bedeutet, dass sich das System bei der Klassifikation an den bisher bekannten Antwortmustern, mit denen es trainiert wurde, orientiert. Der Computer berechnete anhand des Trainingsdatensatzes für beide Diagnosegruppen die am häufigsten gewählten Antworten der einzelnen Fragen, was statistisch als Modalwert bezeichnet wird. Hieraus ergaben sich diagnosetypische Antwortmuster, anhand derer das System eine Aussage darüber trifft, ob dem System unbekannte Fragebogen der Gruppe ‚MPS’ oder der Gruppe ‚keine MPS’

zugeordnet werden. Beispielsweise beantworteten Eltern deren Kinder an MPS erkrankt sind die Frage ‚Haben Sie das Gefühl, dass Ihr Kind „anders“ ist als andere Kinder?’ typischerweise mit ‚ja’, während Eltern der Kinder der Kontrollgruppe diese Frage am häufigsten mit ‚nein’

beantworteten.

Die diagnosetypischen Antwortmuster der beiden Diagnosegruppen sind in Abbildung 8 grafisch dargestellt. Auf der y-Achse sind die Werte der vier Antwortmöglichkeiten

Fälle der richtigen Diagnose zuordnete. In der folgenden Tabelle 11 sollen die Ergebnisse des prospektiven Tests veranschaulicht werden.

Kennung SVM RF LR LD Fusion Tatsächliche Diagnosegruppe

Elternfragebogen 2 2 2 2 1 2 1

Elternfragebogen 9 1 1 1 1 1 1

Elternfragebogen 21 1 1 1 1 1 1

Elternfragebogen 54 1 1 1 2 1 1

Elternfragebogen 58 2 2 2 1 1 1

Elternfragebogen 63 1 1 1 1 1 1

Elternfragebogen 68 1 1 1 1 1 1

Elternfragebogen 5 1 1 1 1 1 1

Elternfragebogen 4 1 1 1 1 1 1

Elternfragebogen 6 1 1 1 1 1 1

Elternfragebogen 33 1 1 2 2 2 2

Elternfragebogen 15 2 2 2 2 2 2

Elternfragebogen 42 2 2 2 1 2 2

Elternfragebogen 50 2 2 2 2 2 2

Elternfragebogen 69 1 1 1 2 1 2

Elternfragebogen 73 2 2 2 1 2 2

Elternfragebogen 77 2 2 2 2 2 2

Elternfragebogen 81 2 2 2 2 2 2

Elternfragebogen 12 2 2 2 2 2 2

Elternfragebogen 25 2 1 2 2 2 2

Tabelle 11: Ergebnisübersicht des prospektiven Tests

*Die Kennung weicht von der Originalkennung zum Zwecke der verständlichen Darstellung ab.

4. Diskussion

Menschen mit LSDs leiden zum Teil an diskreten und unspezifischen Symptomen, weshalb erst durch den chronischen Verlauf und die zunehmende Schwere der Erkrankung eine Stoffwechselerkrankung in Betracht gezogen wird.9,8 Die Diagnosestellung von LSDs erfolgt deshalb häufig mit einer sehr großen Latenz.15,16,17 Dies verhindert eine zielgerichtete Beratung und frühzeitig initiierte Therapie, welche bedeutsam für die nachhaltige Wirkung der Behandlung ist.23,21,24

In diesem Projekt sollte explorativ anhand von drei LSDs (MPS, M. Fabry und M. Gaucher) untersucht werden, ob ein fragebogenbasiertes Programm, das auf dem Data Mining Verfahren aufbaut, für die Diagnoseunterstützung seltener Stoffwechselerkrankungen anwendbar ist.

4.1 Generierung der Fragebogen mittels qualitativer Forschungsmethoden

Die Erstellung von Fragebogen zur Diagnoseunterstützung ausgewählter LSDs erfolgte anhand qualitativer Forschungsmethoden. Dass diese geeignet sind, um sich dem Feld seltener Erkrankungen anzunähern, zeigten bereits Garrino et al.50, Soni-Jaiswal et al.51 und Bouwman et al.52 (vgl. Kapitel 1.2), deren Projekte alle das Ziel verfolgten, durch die Exploration individueller Erfahrungen Betroffener, Einblicke in deren Erleben zu bekommen und hierdurch Erkenntnisse über Verbesserungsmöglichkeiten in deren medizinischer Versorgung zu erlangen.

Auch diese Dissertation widmet sich den individuellen Erfahrungen von Betroffenen und Angehörigen. Dabei ist in diesem Projekt die prädiagnostische Phase der Erkrankten von besonderer Bedeutung. Explizit soll durch die hier gewonnenen Erkenntnisse die Diagnostik ausgewählter LSDs erleichtert werden. Die Ergebnisse der vorliegenden Arbeit aus der prädiagnostischen Phase weisen Überschneidungen mit den Ergebnissen von Garrino et al.50, Soni-Jaiswal et al.51 und Bouwman et al.52 auf. Diese sich überschneidenden Ergebnisse sollen im Folgenden exemplarisch genannt werden:

Die Ergebnisse der hier durchgeführten qualitativen Inhaltsanalyse zeigen, dass Patienten einen aufwendigen Weg zur Diagnose haben, der zahlreiche Arztkontakte und

Untersuchungen, die oftmals zu keiner adäquaten Diagnose führen, beinhaltet. Betroffene und deren Eltern haben Probleme die – häufig unspezifische – Symptomatik bezüglich ihrer Bedrohlichkeit einzuordnen. Zudem fühlen sie sich missverstanden und nicht ernst genommen.Die Erkrankten sind in ihrem Alltag aufgrund der Beschwerden und Schmerzen eingeschränkt.Sie versuchen Strategien zu entwickeln, die Ihnen helfen, Kompetenzen im Umgang mit ihrer gesundheitlichen Situation zu entwickeln.Das soziale Leben wird durch den chronischen Leidensdruck und der permanenten Präsenz von Symptomen negativ beeinflusst.

Betroffene sehen sich nicht zuletzt auch als Außenseiter, was auch von deren Eltern so wahrgenommen wird.

Zusätzlich zu den hier genannten Überschneidungen konnten im vorliegenden Projekt Erkenntnisse über die emotionale Situation von Eltern aus der prädiagnostischen Phase gesammelt werden. So berichten diese von Enttäuschungen, die sie in Bezug auf ihre Kinder erfahren mussten, von Frustration oder von dem Gefühl alleine zu sein. Darüber hinaus charakterisieren Eltern ihre Kinder und beschreiben wie sie diese in der Zeit vor der Diagnosestellung wahrgenommen haben. Manche berichten von ‚Andersartigkeit’, manche von ‚Schwäche’ und wieder andere von ‚Pflegeleichtigkeit’. In diesem Projekt konnte außerdem das Verhältnis zwischen Eltern bzw. Patienten und Ärzten genauer dargestellt werden. Hierbei stehen häufig negative Erlebnisse im Vordergrund. So haben Eltern und Patienten oftmals das Gefühl, dass ihre Beobachtungen und Beschwerden von Ärzten heruntergespielt werden und stimmen deshalb nicht mit der Wahrnehmung der Ärzte überein. Die Betroffenen und Angehörigen verlieren so zunehmend das Vertrauen in Ärzte und beginnen in Bezug auf die Bemühungen, zu einer Diagnosestellung zu gelangen, zu resignieren.

Die prädiagnostische Phase wird außerdem von der Präsenz der Symptome und Beschwerden bestimmt, weshalb auch die Symptomatik der drei ausgewählten Erkrankungen einen großen inhaltlichen Bestandteil der Interviews darstellte. In bisherigen Studien zu LSDs oder seltenen Erkrankungen lag der Schwerpunkt entweder auf der körperlichen Symptomatik14,6,118 oder auf dem Erleben der Betroffenen und deren Angehörigen (vgl. Soni-Jaiswal et al., Garrino et al, Bouwman et al.). Die Eingangsfragen der hier geführten Interviews wurden so gestellt, dass die Interviewpartner die Möglichkeit auf eine umfassende Schilderung der prädiagnostischen

Phase hatten, ohne dass eine thematische Rahmung seitens der Interviewerin vorgenommen wurde. Dies bewirkte eine Auflösung der inhaltlichen Trennung von Symptomen und Erleben der Patienten bzw. deren Eltern. Auf diese Weise werden in den entstandenen Fragebogen für Erwachsene und Eltern sowohl klinische Symptome abgefragt, als auch Fragen zu deren Erleben und deren Sichtweisen gestellt. Die Fragebogen konnten aufgrund der angewandten qualitativen Forschungsmethode zudem in der Sprache der Eltern verfasst werden, was die Verständlichkeit und Beantwortbarkeit der Fragen erhöht.

Die Ergebnisse der Inhaltsanalyse wurden aus 11 Interviews mit Betroffenen und deren Angehörigen gewonnen. Es kann aufgrund der niedrigen, in der qualitativen Forschung aber durchaus üblichen Anzahl an Fällen (vgl. Soni-Jaiswal et al., Garrino et al.) nicht ausgeschlossen werden, dass auch Interviews mit anderen Patienten oder deren Eltern einen wertvollen Beitrag zur qualitativen Erkenntnisgewinnung beigetragen hätten. Aus diesem Grund wurde durch verschiedene Verfahren versucht, ein hohes Maß an Objektivierbarkeit und damit auch Übertragbarkeit119 der Ergebnisse zu erlangen.120

Zunächst sprechen die zuvor erwähnten inhaltlichen Überschneidungen der gewonnen Ergebnisse mit den Erkenntnissen anderer qualitativer Studien (vgl. Garrino et al., Soni-Jaiswal et al. und Bouwman et al.) dafür, dass durch die Inhaltsanalyse Phänomene herausgearbeitet wurden, die in dieser Form auch auf andere Personen und Situationen übertragen werden können. Die Vergleichbarkeit, also die inhaltliche Überschneidung der Erkenntnisse mit anderen Studienergebnissen, ist nach LeCompte und Preissle wichtiger Bestandteil der

‚externen Validität’ qualitativer Forschungsarbeit.121

Zudem wurde in der vorliegenden Arbeit das ‚Theoretical Sampling’ als Strategie zur Auswahl der Interviewteilnehmer verwendet (vgl. Kapitel 2.1.2).67 Jörg Strübing bezeichnet dieses Verfahren, das sich an der ‚theoretischen Sättigung’ des Datenmaterials orientiert, als

„qualitätssicherndes und kontrollierendes Verfahren“122. Durch diese Vorgehensweise kann sich der Ganzheit eines zu untersuchenden Phänomens angenähert werden. Die ‚theoretische Sättigung’ der Daten wurde für alle drei Erkrankungen separat verfolgt und bestimmte den Anteil der Erkrankungsgruppen an den ausgewerteten Interviews (7-mal MPS, 2-mal M. Fabry, 2-mal M. Gaucher). Eine Erklärung, weshalb mehr Interviews innerhalb der

Erkrankungsgruppe der MPS notwendig waren, um zu einer ‚theoretischen Sättigung’ zu gelangen, könnte in der Heterogenität der Mukopolysaccharidosen begründet sein.13

Des Weiteren wurden während des Auswertungsprozesses zentrale Gütekriterien der qualitativen Forschung eingehalten. Beispielsweise wurde im Sinne einer ‚kollegialen Validierung’ eine horizontale Prüfung der Zwischenergebnisse aus der qualitativen Inhaltsanalyse durchgeführt.84 Intersubjektive Abweichungen wurden durch eine Konsensfindung in der Forschungsgruppe beseitigt. Hierdurch wurde eine möglichst hohe Auswertungsobjektivität erreicht.84

Die Validierung der Ergebnisse durch die Interviewpartner erfolgte anhand der erarbeiteten Fragebogen (vgl. Kapitel 2.2.2).59 Deren Feedback deutet auf ein dem Forschungsgegenstand gerecht werdendes Vorgehen hin, da der überwiegende Anteil der Interviewteilnehmer angab, ihren Weg zur Diagnose in den Fragebogen dargestellt zu sehen. Dies zeigt, dass die Kernaussagen der Interviews durch qualitative Inhaltsanalyse erarbeitet werden konnten und eine adäquate Abbildung dieser in den Fragebogen realisiert wurde.

Die zentralen Ergebnisse der Inhaltsanalyse konnten durch semiquantitative Vorgehensweisen in einem Eltern- und einem Erwachsenenfragebogen abgebildet werden (vgl. Kapitel 2.3.1). Die Quantifizierung (im vorliegenden Projekt die Häufigkeitszählung der Kategorien) qualitativer Ergebnisse stellt laut Mayring einen Schritt zur Verallgemeinerbarkeit der Ergebnisse dar.123 Dadurch spiegeln sich in den Fragebogen die Themen wider, die von den Interviewpartnern besonders häufig angesprochen wurden und daher eine Regelmäßigkeit aufwiesen, die ihnen besondere Bedeutung zukommen ließ. Zudem war dieses Vorgehen ein Weg, um die Praxistauglichkeit der Fragebogen (vgl. Kapitel 4.3) sicher zu stellen.

Durch die anschließende exemplarische Anwendung des Elternfragebogens mithilfe von Data Mining Verfahren, konnte weiterhin die Übertragbarkeit der qualitativen Analyseergebnisse gezeigt werden. Die qualitativ-sinnverstehende Perspektive wurde hierdurch um eine statistisch repräsentative Herangehensweise ergänzt. Die Gültigkeit und damit auch die Repräsentativität der mittels qualitativer Inhaltsanalyse gewonnen Erkenntnisse wurde also im folgenden Schritt durch ein quantitatives Anwendungsmodell erhärtet, sodass das Verständnis des Einzelfalls und die quantitative Vergleichbarkeit ergänzend miteinander verknüpft wurden.124,65

4.2 Evaluation der Data Mining Applikationen

Im vorliegenden Projekt wurden zum Zwecke der Diagnoseunterstützung gesammelte Fragebogen mit gesicherter Diagnose durch Data Mining Verfahren ausgewertet. Die genannten Verfahren sind ursprünglich für die Analyse großer Datenmengen entwickelt worden125, können jedoch auch für kleinere Datensätze angewandt werden, deren komplexe Struktur (z.B. große Anzahl an Fragen mit mehreren Antwortmöglichkeiten in einem Fragebogen) eine computergestützte Auswertung notwendig machen77,138. Die Anwendung von Data Mining Verfahren auf einen verhältnismäßig kleinen Datensatz wurde bereits von Horowitz et al. erprobt.54 Diese werteten 132 beantwortete Fragebogen von Patienten mit der gesicherten Diagnose einer gastroösophagealen Refluxerkrankung (GERD) mithilfe von Data Mining Verfahren aus (siehe Kapitel 1.2).54

Im vorliegenden Projekt konnten 76 ausgefüllte Fragebogen mit gesicherter Diagnose gesammelt werden. Die diagnostische Sensitivität von 90% für die Diagnose ‚MPS’ im prospektiven Test zeigt, dass auch hier Data Mining Verfahren zur Diagnoseunterstützung auf einen verhältnismäßig kleinen Datensatz angewandt werden konnten.

Die Anwendung der Data Mining Verfahren konnte lediglich für die Diagnoseunterstützung der MPS mittels Elternfragebogen getestet werden (vgl. Kapitel 3.2.4). Gründe für den nicht ausreichenden Fragebogenrücklauf der Elternfragebogen in den Diagnosegruppen M. Fabry und M. Gaucher, sowie der entsprechenden Erwachsenenfragebogen, konnten nicht eruiert werden.

Eltern, die als Kontrollgruppe die Fragebogen ausfüllten, wurden durch persönliche Ansprache zur Teilnahme an dem Projekt motiviert. Die Auswahl der Kontrollteilnehmer erfolgte bewusst in Spezialambulanzen der Kinderklinik der MHH, denn es sollten keine Eltern klinisch gesunder Kinder in die Kontrollgruppe mit aufgenommen werden. Lediglich Eltern, deren Kinder eine passende Differentialdiagnose zu den Zielerkrankungen der Studie oder eine ähnliche Akutsymptomatik aufwiesen, wurden als Kontrollgruppe eingebunden (vgl. Kapitel 2.3.6). Eine Aufnahme gesunder Kontrollen in das Projekt hätte zu keinen aussagekräftigen Ergebnissen geführt. Es ist empirisch nachvollziehbar, dass die klinische Unterscheidung eines gesunden Menschen von einem chronisch Kranken keine diagnostische Herausforderung für

behandelnde Ärzte darstellt und damit auch Data Mining Verfahren exzellente Werte erzielen würden. Zu dieser Schlussfolgerung kommen ebenfalls Naydenova et al. am Ende ihres Projektes, dessen zentraler Punkt ein Data Mining basiertes Werkzeug zur Diagnoseunterstützung von Lungenentzündungen im Kindesalter ist.55 Die Sensitivität mit der ein junger Patient mit einer Lungenentzündung erkannt wird, liegt bei 98%.129 Die Kontrollgruppe dieser Studie bestand jedoch nur aus gesunden Patienten, weshalb sich der Nutzen eines auf diesen Daten aufgebauten Werkzeugs im klinischen Setting in Frage stellen lässt.

Horowitz et al. hingegen entwarfen ein fragebogenbasiertes Werkzeug, welches in der Lage ist, Patienten mit einer gastroösophagealen Refluxerkrankung (GERD) in einer Gruppe von Betroffenen mit gastrointestinalen Oberbauchbeschwerden zu finden.54 Die Kontrollgruppe besteht in deren Studie also nicht aus gesunden Menschen, sondern schließt – wie es auch im vorliegenden Projekt der Fall ist – Menschen mit zur Zielerkrankung ähnlichen Symptomen ein. Entsprechend der höheren diagnostischen Herausforderung liegt die Sensitivität des Werkzeugs von Horowitz et al. – je nach verwendetem Klassifikator – bei maximal 78%.54 Im hier vorliegenden Projekt können die ausgewählten Klassifikatoren die gesammelten Fragebogen nach der ‚k-fold Cross Validation’-Methode mit 91% der Diagnosegruppe ‚MPS‘

zuordnen. Das im Vergleich zu Horowitz et al. sensitivere Ergebnis kann unter anderem in der Verwendung des ‚Fusion’-Algorithmus begründet sein, der bei Horowitz et al. nicht zum Einsatz kam.54 Naydenova et al. sowie Maghooli et al. betonten bereits in ihren Arbeiten die Möglichkeit, dass der Gebrauch eines verfahrenkombinierenden Algorithmus die Ergebnisse einer Klassifikation optimieren könnte.55,56

Die Leistungsfähigkeit der Klassifikatoren im vorliegenden Projekt wurde anhand der 8-fach stratifizierten Kreuz-Validierung (vgl. Kapitel 2.4.1) ermittelt. Hierbei fanden sich zum Teil erhebliche Unterschiede in der Ergebnisqualität der eingesetzten Klassifikatoren.

Schwankungen und ein deutlich schlechteres Klassifikationsergebnis von 75% korrekter Ergebnisse wies die LD auf. Das solideste Ergebnis der einzelnen Klassifikatoren zeigten der SVM- und der RF-Klassifikator mit jeweils einem Wert für die richtig klassifizierten Diagnosen von 91% für die Diagnose ‚MPS’. Der ‚Random Forest’-Algorithmus erzielte im Projekt von Naydenova et al. ebenfalls die besten Ergebnisse.55

Der prospektive Test mit unbekannten Datensätzen ergab eine Sensitivität von 90% mit der ein Fragebogen einer korrekten Diagnose zugeordnet werden konnte. Der prospektive Test mit einem unbekannten Datensatz war nötig, damit die Leistung der Klassifikatoren nicht durch bereits bekannte Datensätze verfälscht bzw. in ihrer diagnostischen Effizienz zu gut eingestuft wurden. Die erheblichen Ergebnisunterschiede zwischen der Testung eines Systems mit bekannten und unbekannten Datensätzen wurden bereits durch Horowitz et al.

demonstriert.54 Hierbei ergaben sich Unterschiede in der Sensitivität des Verfahrens von 33%

zugunsten des Tests mit den dem System bereits bekannten Datensätzen.54

Im prospektiven Test wurden von dem hier erarbeiteten System zwei Fragebogen der falschen Diagnosegruppe zugeordnet. Ein Fragebogen mit der Diagnose ‚MPS IV’ wurde nicht als solcher erkannt. Die Begründung hierfür könnte unter anderem darin liegen, dass die bereits kleine Trainingsmenge (56 Fragebogen), die den Data Mining Verfahren zur Verfügung gestellt wurde, vorwiegend aus den Diagnoseangaben ‚MPS I–III’ sowie der Kontrollgruppe bestand.

In der Trainingsmenge befanden sich lediglich zwei Fragebogen mit der Diagnose ‚MPS IV’.

Durch das vorwiegende Training der Verfahren für die MPS I–III lässt sich auch die Signifikanz der Fragen ‚Haben Sie den Eindruck, dass Ihr Kind sich in manchen Bereichen langsamer entwickelt als andere Kinder (z.B. sprachliche Entwicklung, Bewegungsentwicklung, Gang zur Toilette etc.)?’ und ‚Trifft es zu, dass Sie viel Engagement aufbringen müssen, um die normale Entwicklung (z.B. Laufen, Treppen steigen, einfache Koordination, Sprache etc.) Ihres Kindes voran zu bringen?’ erklären. Bei der MPS I–III sind betroffene Kinder für gewöhnlich entwicklungsverzögert, wohingegen Kinder mit MPS IV und VI in der Regel keine kognitive Beeinträchtigung aufweisen.126,6 Eltern mit einem von MPS IV betroffenem Kind geben demnach mit hoher Wahrscheinlichkeit an, dass sie bei ihrem Kind keine Entwicklungsverzögerung bemerken. Die Data Mining Verfahren ordnen dann das Antwortmuster mit geringerer Wahrscheinlichkeit der Diagnose ‚MPS’ zu, denn das System kennt vorwiegend Antwortmuster von Eltern deren Kinder an MPS I–III leiden.

Die höchste Signifikanz wies die Frage ‚Wurde bei Ihrem Kind eine vergrößerte Leber und/oder Milz festgestellt?‘ auf. Es ist zu beachten, dass für diese Frage nur die Antwortmöglichkeiten

‚ja’ oder ‚nein’ zur Verfügung standen. Es ist anzunehmen, dass hierdurch eine bessere Trennschärfe der Antworten erreicht werden konnte, was die Signifikanz der Frage gegebenenfalls erhöhte. Der fehlerhaft klassifizierte Fragebogen mit der Diagnose ‚MPS IV’

wies sowohl für die Entwicklungsverzögerung als auch für die Hepatosplenomegalie eine negative Antwort auf. Da jedoch die überwiegende Zahl der Teilnehmer mit der Diagnose

‚MPS’ im Training diese Fragen positiv beantwortet hat, ist es wahrscheinlich, dass der Fragebogen mit der Diagnose ‚MPS IV’ unter anderem aus diesen Gründen fehlerhaft klassifiziert wurde. Eine Ergebnisoptimierung könnte durch die Erweiterung des Trainingsdatensatzes einschließlich der Diagnose ‚MPS IV’ erreicht werden.

Ein zweiter Fragebogen mit der Diagnoseangabe ‚Multiple kartilaginäre Exostosen’ wurde vom System als Diagnose ‚MPS’ fehlerhaft klassifiziert. Dies kann beispielsweise darin begründet sein, dass die Beantwortung der Fragebogen unter anderem von der persönlichen und differenzierten Sichtweise der Befragten abhängt. Die Beantwortung von signifikanten Fragen wie ‚Haben Sie das Gefühl, dass Ihr Kind „anders“ ist als andere Kinder?’ und ‚Bedrückt Sie starke Ungewissheit bezüglich der Gesundheit Ihres Kindes?’ steht in engem Zusammenhang mit der individuellen Wahrnehmung des Beantwortenden. So kann es sein, dass Eltern deren Kinder an der Diagnose ‚Multiple kartilaginäre Exostosen’ leiden, ebenfalls der Meinung sind, dass ihre Kinder ‚anders’ als andere sind und unter der ‚Ungewissheit’, die diese Erkrankung mit sich bringt, leiden. Die Diagnose ‚Multiple kartilaginäre Exostosen’ gehört zu den seltenen Erkrankungen, weshalb es empirisch nachvollziehbar ist, dass sich die Wahrnehmungen der von dieser Krankheit betroffenen Familien durchaus mit der Wahrnehmung von Betroffenen

Ein zweiter Fragebogen mit der Diagnoseangabe ‚Multiple kartilaginäre Exostosen’ wurde vom System als Diagnose ‚MPS’ fehlerhaft klassifiziert. Dies kann beispielsweise darin begründet sein, dass die Beantwortung der Fragebogen unter anderem von der persönlichen und differenzierten Sichtweise der Befragten abhängt. Die Beantwortung von signifikanten Fragen wie ‚Haben Sie das Gefühl, dass Ihr Kind „anders“ ist als andere Kinder?’ und ‚Bedrückt Sie starke Ungewissheit bezüglich der Gesundheit Ihres Kindes?’ steht in engem Zusammenhang mit der individuellen Wahrnehmung des Beantwortenden. So kann es sein, dass Eltern deren Kinder an der Diagnose ‚Multiple kartilaginäre Exostosen’ leiden, ebenfalls der Meinung sind, dass ihre Kinder ‚anders’ als andere sind und unter der ‚Ungewissheit’, die diese Erkrankung mit sich bringt, leiden. Die Diagnose ‚Multiple kartilaginäre Exostosen’ gehört zu den seltenen Erkrankungen, weshalb es empirisch nachvollziehbar ist, dass sich die Wahrnehmungen der von dieser Krankheit betroffenen Familien durchaus mit der Wahrnehmung von Betroffenen