und -mustern in der veterinärmedizinischen Popula� onsforschung
Strategien und Herausforderungen
Habilita� onsschri�
Amely Campe
Hannover, 2018
Bibliografische Informationen der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; Detaillierte bibliografische Daten sind im Internet über
http://dnb.ddb.de abrufbar.
1. Auflage 2018
© 2018 by Verlag:
Deutsche Veterinärmedizinische Gesellschaft Service GmbH, Gießen Printed in Germany
ISBN 978‐3‐86345‐444‐9
Verlag: DVG Service GmbH Friedrichstraße 17
35392 Gießen 0641/24466
info@dvg.de www.dvg.de
und Informationsverarbeitung der Stiftung Tierärztliche Hochschule Hannover
Erkennung und Interpretation von Risikofaktoren und –mustern in der veterinärmedizinischen
Populationsforschung –
Strategien und Herausforderungen
Habilitationsschrift
zur Erlangung der Venia legendi
an der Tierärztlichen Hochschule Hannover
vorgelegt von
Dr. med. vet. Amely Campe
Hannover 2018
Tag der nicht‐öffentlichen wissenschaftlichen Aussprache: 25. Juni 2018
Meinem Mann in Liebe und Dankbarkeit
Die Wissenschaft dagegen nötigt uns, den Glauben an einfache Kausalitäten gerade dort aufzugeben, wo alles so leicht begreiflich scheint und wir die Narren des Augenscheins sind.
(Friedrich Wilhelm Nietzsche; 1844 ‐ 1900)
Vorwort
Die vorliegende Habilitationsschrift behandelt ein Thema, dass für die veterinärmedizinische Epidemiologie von besonderer Bedeutung ist – die Erkennung und Interpretation von Risikofaktoren und –mustern mit Hilfe von Populationsstudien.
Ziel dieser kumulativen Arbeit ist es, Methoden der Risikofaktorenanalyse anzuwenden. Sie sollen im Hinblick auf verschiedene Aspekte der heutigen Studienbedingungen sowie der Aus‐
und Bewertung von Studienergebnissen bewertet werden. Weiterhin soll die Übertragbarkeit von Ergebnissen aus Populationsstudien auf Empfehlungen für den Tierhalter zur Haltung und dem Management von Tieren diskutiert werden. Ob und inwieweit die notwendigen Voraussetzungen für eine Schlussbildung heute noch gegeben sind und welche Implikationen sich daraus für die zukünftige veterinärmedizinischen Populationsforschung ergeben, soll in dieser Arbeit beleuchtet werden.
In dieser Habilitationsschrift sind Ergebnisse von Risikofaktorenanalysen für verschiedene Tierarten und verschiedene (Infektions‐)Krankheiten zusammen getragen und im Licht der Analysemethodik sowie der inhaltlichen Schlüsse übergreifend diskutiert. In der Schrift sind die wissenschaftlichen Veröffentlichungen 1 – 10 kapitelbezogen so eingearbeitet, dass die Themen veranschaulicht, diskutiert und im Hinblick auf die Strategien und Herausforderungen der modernen veterinärmedizinischen Populationsstudien Schlussfolgerungen gezogen werden können. Hierzu erfolgt zunächst eine Einleitung in die Thematik und Problemstellung sowie eine Erläuterung der Zielsetzung. Anschließend wird das (Miss‐)verhältnis zwischen dem Umfang, der Komplexität und der Reliabilität moderner veterinärmedizinischer Populationsstudien dargestellt. Im Anschluss wird diskutiert, was bei der Aus‐ und Bewertung komplexer Zusammenhänge zwischen Zielgrößen und Risikofaktoren zu beachten ist. Abschließend wird erläutert, welche Konsequenzen dies für die Durchführung und Interpretation zukünftiger Populationsstudien haben sollte. Es wird ein Ansatz zur harmonisierten Auswertung präsentiert und ein Ausblick für die zukünftige Übertragung von Studienergebnissen auf Empfehlungen für den Tierhalter zur Haltung und dem Management von Tieren erörtert.
Hannover, im Februar 2018 Amely Campe
ii Vorwort
Inhalt
Vorwort ... i
Inhalt ... iii
Abbildungsverzeichnis ... v
Tabellenverzeichnis ... v
Verzeichnis von Kurzdefinitionen ... v
Liste der Publikationen ... vii
1 Einleitung und Zielsetzung ... 1
1.1 Prämisse ... 1
1.2 Wissenschaftlicher Hintergrund ... 1
1.3 Zielsetzung: Risikofaktorenanalyse – unter heutigen Bedingungen ... 3
2 (Miss‐)Verhältnis zwischen Umfang, Komplexität und Reliabilität ... 5
2.1 Zusammenfassende These ... 5
2.2 Skizzierung des Status Quo ... 5
2.3 Zweck der Analysen ... 8
2.3.1 Hypothesen ... 8
2.3.2 Ursache‐Wirkungs‐Beziehungen ...17
2.4 Notwendiger Stichprobenumfang ...26
2.4.1 Zusammenhang zwischen α‐ und β‐Fehler und Stichprobenumfang – sowie Einfluss auf Studienergebnisse ...27
2.4.2 Mehrfaktorielle Analysen ...28
2.5 Moderne Datenhaltung in Populationsstudien ...31
3 Aus‐ und Bewertung komplexer Zusammenhänge zwischen Zielgrößen und Risikofaktoren ... 35
3.1 Zusammenfassende These ...35
3.2 Skizzierung des Status Quo ...35
3.3 Imputation von fehlenden Werten ...36
3.4 Drei Auswertungsstrategien für hierarchische Daten ...38
iv Inhalt
3.5 Verzerrungsmechanismen ...42
3.5.1 Auswahlverzerrung ...42
3.5.2 Informationsverzerrung ...46
3.5.3 Verzerrung durch Störgrößen ...53
3.6 Einflussgrößen und Risikomuster ...61
3.6.1 Zusammenhänge zwischen Einflussgrößen ...61
3.6.2 Interaktionen der Einflussgrößen ...65
3.6.3 Selektion von Effekten und mehrfaktorielle Verfahren ...66
3.6.4 Risikomuster ...69
3.6.5 Einordnung der identifizierten Effekte ...74
4 Konsequenz und Ausblick ... 83
4.1 Konsequenzen für die Durchführung und Interpretation zukünftiger Populationsstudien ...83
4.2 Leitfaden zur harmonisierten Auswertung von veterinärmedizinischen Populationsstudien ...88
4.2.1 Prüfung der Korrektheit der Daten...89
4.2.2 Plausibilitäts‐ und Integritätsprüfung ...89
4.2.3 Prüfung der Variabilität der Daten, Zellenbesetzung („Sparse Data“‐Problematik), Imputation ...90
4.2.4 Deskriptive Auswertung ...90
4.2.5 Assoziation bzw. Korrelation zwischen den Einflussgrößen ...91
4.2.6 Korrektur von Verzerrungen / Bias ...91
4.2.7 Übertragung der Studienhypothese in eine statistisch prüfbare Hypothese ...92
4.2.8 Induktive Verfahren ...93
4.3 Übertragung der Studienergebnisse in Empfehlungen für den Tierhalter zur Haltung und dem Management von Tieren ...95
Zusammenfassung ... 101
Summary ... 105
Literaturverzeichnis ... 107
Stichwortverzeichnis ... 117
Darstellung des eigenen Anteils an den Publikationen ... 119
Danksagung ... 123
Anhang – Abstracts der verwendeten Publikationen ... 125
Abbildungsverzeichnis
Abbildung 1: Circulus vitiosus der modernen Risikofaktorenanalyse ... 6 Abbildung 2: Beispiel für ein Hypothesennetz aus der Studie "Bedeutung von Clostridium botulinum bei chronischem Krankheitsgeschehen" (modifiziert nach Jensen, 2016) ... 13 Abbildung 3: Ähnlichkeiten zwischen Versuchsstation ‐ abhängig vom Kontext der Umwelt‐ und
Haltungsbedingungen (Ergänzende Grafik zu Publikation 7) ... 57 Abbildung 4: Dilemma der modernen Risikofaktorenanalysen (rote Pfeile=Richtung der tatsächlichen Entwicklung; grüne Pfeile=eigentlich erforderliche Richtung) ... 84
Tabellenverzeichnis
Tabelle 1: Evidenzlevel verschiedener wissenschaftlicher Studientypen (ins Deutsche übersetzt nach EBVM Network, 2015) ... 23
Verzeichnis von Kurzdefinitionen
Einfaktoriell = eine Einflussgröße wird untersucht im Hinblick auf ihren Zusammenhang mit einer/mehreren Zielgrößen
Einflussgröße = Risiko‐/Schutzfaktor, erklärende Variable, Variable, die Einfluss nimmt auf den Krankheitszustand oder Leistungsmerkmale HI‐Tier = Herkunftssicherungs‐ und Informationssystem für Tiere Hypothese = Annahme, Idee, Behauptung
Mehrfaktoriell = mehrere Einflussgrößen werden im Hinblick auf ihren Zusammenhang mit einer/mehreren Zielgrößen (gleichzeitig) untersucht
Multivariat = mehrere Zielgrößen werden gleichzeitig betrachtet (Hinweis: der Begriff wird in der englisch‐sprachigen Fachliteratur zum Teil wie hier der Begriff „mehrfaktoriell“ verwendet)
Univariat = eine Zielgröße wird betrachtet (Hinweis: der Begriff wird in der englisch‐sprachigen Fachliteratur zum Teil wie hier der Begriff
„einfaktoriell“ verwendet)
Zielgröße = Abhängige Variable, „Outcome“, Variable, die einen Krankheits‐
/Gesundheitszustand oder Leistungsmerkmal beschreibt, Ziel der wissenschaftlichen Fragestellung ist und durch andere Faktoren beeinflusst werden kann
vi Verzeichnis von Kurzdefinitionen
Liste der Publikationen
Auf diese Publikationen wird im Text Bezug genommen. Ihre Auflistung erfolgte chronologisch entsprechend dem Publikationsdatum und innerhalb der Publikationsjahre in alphabetischer Reihenfolge der Autorenschaft.
1. Campe, A.; Koesters, S.; Niemeyer, M.; Klose, K.; Ruddat, I.; Baumgarte, J.; Kreienbrock, L.:. Epidemiology of influences on the performance in broiler flocks – a field study in Germany. In: Poultry science 92, 10 (2013) 2576‐2587. http://doi.org/10.3382/ps.2013‐
03207
2. Campe, A.; Sauter, K.; Beyerbach, M.; Schael, J.; Selhorst, T.; Leo, S. B.; Kramer, M.;
Kreienbrock, L.: Case‐control study on the risks of BSE infections in Northern Germany = Fall‐Kontroll‐Studie zum BSE‐Risiko in Norddeutschland. In: Berliner und Münchener tierärztliche Wochenschrift 126, 5/6 (2013) 220‐229.
3. Ruddat, I.; Scholz, B.; Bergmann, S.; Buehring, A.‐L.; Fischer, S.; Manton, A.; Prengel, D.;
Rauch, E.; Steiner, S.; Wiedmann, S.; Kreienbrock, L.; Campe, A.: Statistical tools to improve assessing agreement between several observers. In: Animal 8, 4 (2014) 643‐
649.
http://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=9198728 4. Campe, A.; Hoes, C.; Koesters, S.; Froemke, C.; Bessei, W.; Knierim, U.; Schrader, L.;
Kreienbrock, L.; Thobe, P.: Determinants of economic success in egg production in Germany – here: laying hens kept in aviaries or small‐group housing systems. In:
Landbauforschung = Applied Agricultural and Forestry research 65, 3/4 (2015) 227‐237.
http://doi.org/10.3220/LBF1447678999000
5. Campe, A.; Abernethy, D.; Menzies, F.; Greiner, M.: Latent class regression models for simultaneously estimating test accuracy, true prevalence and risk factors for Brucella abortus. In: Epidemiology and Infection 144, 9 (2016) 1845‐1856.
http://doi.org/10.1017/S0950268816000157
6. Campe, A.; Hohmeier, S.; Koesters, S.; Hartmann, M.; Ruddat, I.; Mahlkow‐Nerge, K.;
Heilemann, M.: Mögliche Ursachen für unspezifische Leistungsminderung in
viii Liste der Publikationen
Milchkuhherden in Schleswig‐Holstein: eine explorative Fall‐Kontroll‐Studie = Possible causes of unspecific reduced productivity in dairy herds in Schleswig‐Holstein: an explorative case‐control study. In: Berliner und Münchener Tierärztliche Wochenschrift 129, 3/4 (2016) 118‐131. http://doi.org/10.2376/0005‐9366‐129‐118
7. Eva, D.; Kösters, S.; Ruddat I.; Kreienbrock, L.; Campe, A.: Differences and similarities between locations in a multisite project: a comparison of features of production systems for laying hens = Unterschiedlich‐ und Ähnlichkeiten zwischen verschiedenen Orten einer multizentrischen Studie: Vergleich der Eigenschaften von Produktionssystemen für Legehennen. In: Berliner und Münchener tierärztliche Wochenschrift 129, 11/12 (2016) 507‐517. http://vetline.de/differences‐and‐similarities‐between‐locations‐in‐a‐
multisite‐project‐a‐comparison‐of‐features‐of‐production‐systems‐for‐laying‐
hens/150/3130/99011/
8. Jensen, K. C.; Scheu, T.; Duc, P. D.; Gundling, F.; Wichern, A.; Hemme, M.; Hoedemaker, M.; Wellbrock, W.; Campe, A.: Understanding barriers to following advice: Evaluation of an advisory service from dairy farmers' perspectives = Hindernisse bei der Umsetzung von Ratschlägen verstehen: Evaluation einer Beratung aus der Sicht von Landwirten mit Milchvieh. In: Berliner und Münchener Tierärztliche Wochenschrift 129, 1/2 (2016) 72‐
81. http://doi.org/10.2376/0005‐9366‐129‐72
9. Jensen, K.; Frömke, C.; Schneider, B.; Sartison, D.; Do Duc, P.; Gundling, F.; Scheu, T.;
Wichern, A.; Fohler, S.; Seyboldt, C.; Hoedemaker, M.; Kreienbrock, L.; Campe, A.: Case‐
control study on chronic diseases in dairy herds in northern Germany: Symptoms at the herd level = Fall‐Kontroll‐Studie zu chronischen Erkrankungen in norddeutschen Milchviehherden: Symptome auf Herdenebene. In: Berliner und Münchener Tierärztliche Wochenschrift 130, 9‐10 (2017) 404‐414. http://vetline.de/case‐control‐
study‐on‐chronic‐diseases‐in‐dairy‐herds‐in‐northern‐germany‐symptoms‐at‐the‐herd‐
level/150/3130/104355
10. Campe, A.; Hoes, C.; Koesters, S.; Froemke, C.; Bougeard, S.; Staack, M.; Bessei, W.;
Manton, A.; Scholz, B.; Schrader, L.; Thobe, P.; Knierim, U. Analysis of the influences on plumage condition in laying hens: How suitable is a whole body plumage score as an outcome? Poultry Science 97, 2 (2018) 358–367. https://doi.org/10.3382/ps/pex321
1 Einleitung und Zielsetzung
1.1 Prämisse
Aufgrund der modernen Methoden zur Datengenerierung, ‐haltung und –auswertung ist es der Epidemiologie heute möglich, komplexe Zusammenhänge in der Tierhaltung zu untersuchen.
Dabei können heutzutage immer mehr Risikofaktoren für Tiergesundheit, ‐seuchen, ‐wohl und ‐verhalten gleichzeitig untersucht und sogar Risikomuster dargestellt werden. Jedoch darf nicht außer Acht gelassen werden, dass die Bedingungen zur Durchführung von epidemiologischen Studien und zur Risikofaktorenanalyse auch eine adäquate Schlussbildung zulassen müssen. Ob und inwieweit die notwendigen Voraussetzungen heutzutage gegeben sind und welche Implikationen sich daraus für die zukünftige veterinärmedizinischen Populationsforschung ergeben, soll in dieser Arbeit beleuchtet werden.
1.2 Wissenschaftlicher Hintergrund
Ein wesentliches Ziel der Veterinärepidemiologie ist es, durch die Anwendung epidemiologischer Methoden, Risikofaktoren für Krankheiten in verschiedenen Populationen zu identifizieren (Bartlett and Judge, 1997). Um diese Risikofaktoren zu identifizieren, haben wir bisher in der Statistik, Epidemiologie und Tierseuchen‐ bzw. Tiergesundheitsforschung immer danach gestrebt, so zu vereinfachen und zu reduzieren, dass der eine (oder die wenigen) wichtigen Auslöser für eine Erkrankung identifiziert werden können, der für (fast) alle Betroffenen die gleiche Bedeutung in der Krankheitsentstehung hatte. Die Annahme der Monokausalität bei der Entwicklung von Erkrankungen mag darauf zurückzuführen sein, dass sich die Forschung zuerst auf diejenigen Infektionserkrankungen konzentrierte, die zunächst die größte Bedeutung für die Tiergesundheit hatten. Man ging davon aus, dass das Vorkommen des Erregers allein reiche, um eine Krankheit auszulösen. Dies mag für hochkontagiöse Infektionserreger auch oftmals der Fall sein.
Mit zunehmender Kontrolle der epidemisch wirkenden und hochkontagiösen Infektionserreger wurde dann klar, dass bei manchen Erregern nicht nur der Erreger allein für die Entstehung der Krankheit verantwortlich ist. Seither hat sich die Sicht auf Krankheitsentstehung verändert und man zieht in Betracht, dass mehrere Faktoren erforderlich sind, um eine Krankheit auszulösen.
Mittlerweile sind auch nicht infektiöse Erkrankungen in den Fokus der Populationsforscher gerückt, die multikausal verursacht sein können (sog. Faktorenkrankheiten).
2 Wissenschaftlicher Hintergrund
Spätestens seitdem bekannt ist, dass es multifaktoriell bedingte (Infektions‐)Krankheiten gibt, ist klar, dass die Entstehung von Krankheiten von einem komplexen Zusammenspiel von Faktoren abhängig ist. Nicht jede Krankheit braucht nur einen Auslöser wie es etwa bei hochinfektiösen Krankheiten wie zum Beispiel der Maul‐und‐Klauenseuche der Fall ist. Nicht jeder Auslöser löst zwingend eine Erkrankung aus (bspw. bei Salmonelleninfektionen beim Schwein). Daher ist es auch im Rahmen von Risikofaktorenanalysen erforderlich, diese Zusammenhänge von einer vereinfachenden Reduktion hin zu einer „komplexitätserhaltenden Komplexitätsreduktion“ (Stierlin, H., 1983) bei der Modellierung im System Tierhaltung zu berücksichtigen.
Führt man sich beispielsweise die Entwicklung der Salmonellen‐Risikoforschung beim Geflügel oder Schwein vor Augen, so wird klar, dass es auch hier einen Prozess gegeben hat. Zunächst mussten Risikofaktoren identifiziert werden, dann wurden Hygiene‐ und Maßnahmenpläne entwickelt, um genau diese Risikofaktoren nicht mehr wirken zu lassen. Weiterhin wurde intensiver gegen die Verbreitung und das Vorkommen von Salmonellenerregern vorgegangen.
Mittlerweile ist die Prävalenz in und zwischen den Beständen deutlich geringer. Nach wie vor arbeiten Studien weiter darauf hin, dass Faktoren gefunden werden, die eine höhere Innerherdenprävalenz bedingen könnten. Bei Bekämpfungsprogrammen, die dem Ende der Eradikation näherkommen, tritt nun zutage, dass man nicht mehr zwingend den einen oder die wenigen allgemeingültigen und hoch‐signifikanten Einflüsse auf das Vorkommen einer Erkrankung identifizieren kann. Dies ist in der Humanepidemiologie bereits seit Längerem bekannt (Taubes, 1995). Vielmehr zeigt sich, dass ein Muster von Faktoren das Auftreten einer Erkrankung begünstigen kann. Welches Muster hier gerade zusammen wirkt, hängt von der allgemeinen Situation ab, unter der die Tiere leben. Die Herausforderung in der (Veterinär‐
)Epidemiologie ist es dabei, unter hochvariablen und veränderlichen Bedingungen im Feld Studien durchzuführen und Schlüsse zu ziehen.
Darüber hinaus hat der Wunsch immer komplexere Beziehungen und Risikofaktorenmuster zu analysieren eine zusätzliche Herausforderung für die Wissenschaft mit ins Spiel gebracht.
Zudem wird das Erreichen des allem zugrunde liegenden Ziels ‐ konkrete wissenschaftliche Hypothesen zu prüfen ‐ durch Verzerrungsmechanismen und Implikationen der Machbarkeit unter Feldbedingungen erschwert. Die Aufgabe der Epidemiologie ist es daher, Methoden der Studienplanung und Datenauswertung zu generieren und so anzuwenden, dass auch unter
solchen Bedingungen zulässige und möglichst verallgemeinerbare Schlüsse gezogen werden können.
1.3 Zielsetzung: Risikofaktorenanalyse – unter heutigen Bedingungen
Ziel dieser kumulativen Habilitationsschrift ist es, Methoden der Risikofaktorenanalyse anzuwenden und im Hinblick auf verschiedene Aspekte der heutigen Studienbedingungen, Aus‐
und Bewertung sowie der Übertragung auf Empfehlungen für den Tierhalter zur Haltung und dem Management von Tieren zu bewerten. Ob und inwieweit die notwendigen Voraussetzungen für eine Schlussbildung bei den heute durchgeführten Studien gegeben sind und welche Implikationen sich daraus für die zukünftige veterinärmedizinische Populationsforschung ergeben, soll in dieser Arbeit beleuchtet werden.
Neben einer kurzen Einführung in die epidemiologische Theorie dieser Aspekte der Risikofaktorenanalyse, werden Ergebnisse aus eigenen Studien ebenso wie andere Publikationen betrachtet und im Hinblick auf die Bedingungen diskutiert, unter denen veterinärmedizinische Populationsstudien heute durchgeführt werden. Besonders betrachtet werden soll hierbei, dass große Datenmengen pro statistische Einheit generiert, jedoch nur relativ geringe Stichprobenumfänge realisiert werden. Zudem wird auf den Zweck der Analysen eingegangen und Aspekte von Kausalität und Evidenz diskutiert. Weiterhin wird dargelegt, dass heute eine Vielzahl von wissenschaftlichen Fragestellungen innerhalb einer Studie beantwortet werden sollen und komplexe Zusammenhänge zwischen Risikofaktoren (als Risikomuster) und Zielgrößen bestehen. Die Rolle von Interaktion, Confounding und Bias wird hier ebenfalls betrachtet. Schließlich wird eine Empfehlung darüber gegeben, wie zukünftig Populationsstudien durchgeführt, ausgewertet und interpretiert werden sollten. Abschließend wird Bezug zu dem Wunsch genommen, die Wissenschaft möge aus ihren Studienergebnissen Empfehlungen für den Tierhalter zur Haltung und dem Management von Tieren ableiten. Dabei werden die inhaltlichen Erkenntnisse der verwendeten eigenen Arbeiten verwendet, um zu erläutern, welche Implikationen sich hieraus für die zukünftige Populationsforschung ergeben.
4 Zielsetzung: Risikofaktorenanalyse – unter heutigen Bedingungen
2 (Miss‐)Verhältnis zwischen Umfang, Komplexität und Reliabilität
2.1 Zusammenfassende These
In den letzten Jahren wächst die Diskrepanz zwischen dem notwendigen und machbaren Stichprobenumfang. Wenn es in einer veterinärepidemiologischen Studie zahlreiche Fragestellungen gibt und große Datenmengen pro statistische Einheit generiert werden, wird darunter der Stichprobenumfang leiden, da in praxi weniger Einheiten bei gegebenem Zeit‐ und Personalressourcen untersucht werden können. Geldgeber und Wissenschaftler versprechen sich durch die Nutzung von gestiegener Rechner‐ und Softwareleistung sowie durch intensive Kooperationen in Verbundprojekten eine Zunahme an verlässlichen Erkenntnissen und ein verbessertes Verständnis für komplexe Zusammenhänge und Einflüsse auf die Tiergesundheit.
Dabei gehen sie die Gefahr ein, wichtige Risikofaktoren zu übersehen, scheinbare Einflüsse fehlzuinterpretieren und wahre Risikofaktoren in ihrer Wirkung zu überschätzen. Somit werden statistisch signifikante Zusammenhänge seltener, Fehleinschätzungen häufiger und die Möglichkeit, konkrete Hypothesen zu prüfen, sinkt. Jedoch kommt man durch die größere Tiefe und Breite der erhobenen Informationen auch stärker in die Lage zahlreiche neue Hypothesen zu generieren.
2.2 Skizzierung des Status Quo
Im Verlauf der deutlich angestiegenen Rechnerleistung in den letzten Jahrzehnten haben sich auch die Möglichkeiten zur wissenschaftlichen Analyse von komplexeren Zusammenhängen erweitert. Neben einer schnelleren Rechenleistung haben sich auch die Datenhaltungssysteme vergrößert. Somit kann mittlerweile eine sehr große Menge an Informationen je Betrieb oder Tier erhoben und in elektronischen Datenbanken abgelegt werden. Weiterhin kann in kurzer Zeit eine große Datenmenge aufwändigen Analysemethoden unterzogen werden.
Neben dieser allgemeinen Erweiterung wissenschaftliche Analysen durchzuführen hat sich auch eine spezifische Erweiterung der Informationsdichte je Betrieb ergeben. So haben Mittelgeber von epidemiologischen Projekten in den letzten Jahren vermehrt gefordert, dass Verbundforschung betrieben werden solle, bei der verschiedene Fachbereiche und möglichst auch Fachbereiche, die nicht zur Veterinärmedizin gehören, gemeinsam Studien durchführen.
Der erwünschte Mehrwert ist dabei sicherlich in der Hinsicht erlangt worden, dass alle Bereiche des betrieblichen Managements beleuchtet und bewertet werden können. Jedoch hat dies auch
6 Skizzierung des Status Quo
zur Folge gehabt, dass für jeden fachlichen Verbundpartner eine angemessene Menge an Informationen erhoben werden muss, damit dieser die wesentlichen Bewertungen der betrieblichen Performance innerhalb seines Fachbereiches adäquat vornehmen kann (vgl. Abb.
1 „viele Daten pro statistischer Einheit erheben“). Dies hat zu einer Potenzierung von Datenvolumen und Informationsdichte (Messungen, Datenrecherchen, Untersuchungen von Tieren, etc.) geführt, womit der finanzielle und personelle Aufwand pro statistische Einheit deutlich zugenommen hat. Daneben gibt es noch einen weiteren Grund dafür, dass die Zahl der untersuchbaren Betriebe sinkt. So hat die Bereitschaft von Landwirten und Tierhaltern an Feldstudien teilzunehmen abgenommen. Gründe hierfür sind neben einer wachsenden Arbeitsbelastung auch ein zunehmendes Misstrauen gegenüber den Studienzielen und der Interpretation von wissenschaftlichen Ergebnissen durch Politik und Medien (Spiller et al., 2016). Dadurch können in einem Verbundprojekt möglicherweise nicht mehr so viele Betriebe eingeschlossen werden wie aus statistischer und epidemiologischer Sicht wünschenswert wäre (Vgl. Abb. 1; „wenige(r) statistische Einheiten untersucht“). Je seltener wir in der Wissenschaft die Gelegenheiten haben, Betriebe und Tiere unter Feldbedingungen zu untersuchen, umso mehr Fragestellungen möchten wir auf einmal beantworten. Durch die steigende Anzahl Fragestellungen steigt zum einen die Zahl der zu erhebenden Daten, zum anderen können immer komplexere Zusammenhänge analysiert werden. Aus der hier geschilderten Entwicklung der Konditionen für veterinärepidemiologische Forschung ergibt sich ein Circulus vitiosus der modernen Risikofaktorenanalyse (Abb. 1).
Abbildung 1: Circulus vitiosus der modernen Risikofaktorenanalyse
Wenn man im Rahmen der Modellierung für Risikofaktorenanalysen diese Möglichkeiten und Grenzen berücksichtigen möchte, gilt es, ein ausgewogenes Maß zwischen der erforderlichen vereinfachenden Reduktion und der Erhaltung einer gewissen Komplexität zu finden. Bei der Risikofaktorenanalyse wird mittels eines statistischen Modells ein möglichst realitätsnahes Abbild der Situation in der Tierhaltung gezeichnet. Die Realität kann jedoch nur zu einem bestimmten Maße abgebildet werden. Der Grad und Blickwinkel des Abbilds hängt davon ab, welches Ziel die Modellierung verfolgt (Kaplan, 2009). Ziel eines Modells kann die Annäherung, die Erklärung oder die Vorhersage sein, wobei ein Beziehungsgefüge zwischen verschiedenen Informationen analysiert wird (Pittioni, 1983; Dempster, 1998). Dabei muss immer klar sein, dass Modelle die Realität nur mit einem gewissen Grad an Genauigkeit abbilden können und daher in gewisser Weise immer falsch sind (Box, 1976). Nichtsdestotrotz können sie nützlich sein (Christley et al., 2013). Wie genau und sicher die Modellschätzungen sein müssen, ist individuell unterschiedlich und hängt vom Ziel der Modellierung ab. So wird eine erste Risikoabschätzung für die Exposition einer Gruppe von Nutztieren gegenüber einem neu auftretenden Infektionserreger ein anderes Maß an Genauigkeit akzeptieren müssen als es für eine Modellrechnung zur Eradikation einer hochansteckenden Krankheit erforderlich wäre.
Mit Bezug auf veterinärepidemiologische Modelle muss ein Modell so reduziert sein, dass sämtliche statistischen Einheiten (Tiere, Betriebe, etc.) darin im Hinblick auf ihr Krankheitsrisiko gruppiert werden können. Jedoch sollte unter den heutigen Bedingungen der Tierhaltung und mit dem Wissen um die Komplexität der Zusammenhänge die Reduktion nicht so stark sein, dass Risikomuster nicht (mehr) erkannt werden. Eine zu stark vereinfachende Abbildung der realen Situation ist also heute nicht mehr angezeigt und würde zu einer Fehleinschätzung der Lage führen.
Aufgrund dieser Voraussetzungen ergeben sich zwei Implikationen für die Studienplanung, ‐durchführung und ‐auswertung. Zum einen müssen genügend Individuen untersucht werden, um eine statistisch verlässliche Schlussfähigkeit zuzulassen (notwendiger Stichprobenumfang). Zum anderen muss für diese Individuen eine ausreichende Anzahl verschiedener Ziel‐ und Einflussgrößen erhoben werden, die benötigt werden, um die Komplexität der Zusammenhänge abzubilden. Da ein reziproker Zusammenhang zwischen dem notwendigen Stichprobenumfang und den benötigten Detailgrad an Informationen bei gleichen Ressourcen besteht, entsteht in praxi derzeit ein Missverhältnis zwischen dem Wunsch nach
8 Zweck der Analysen
großen Datenmengen und der Notwendigkeit für große Stichprobenumfänge, welches die statistische Schlussfähigkeit negativ beeinflusst. Um dieses Missverhältnis näher zu beleuchten, werden in den folgenden Unterkapiteln drei wichtige Faktoren näher besprochen, die Einfluss auf die statistische Schlussfähigkeit unter modernen Studienverhältnissen nehmen: der Zweck der Analysen, der notwendige Stichprobenumfang sowie die moderne Datenhaltung in Populationsstudien.
2.3 Zweck der Analysen 2.3.1 Hypothesen
"Hypothesen sind aus präzise definierten Begriffen zusammengesetzte Sätze, die mit mehr oder weniger Wahrheitsanspruch mehr oder weniger allgemeine Aussagen über bestimmte Bereiche der Realität enthalten. Ein System von Hypothesen ist eine Theorie. Oft wird schon eine einzelne zentrale Hypothese als Theorie bezeichnet" (Eberhard, 1977). Eine Hypothese ist dabei eine Theorie, die (bisher) nicht gut getestet wurde (Thrusfield, 2005). Sie wird unter anderem auch als Idee, Behauptung oder Annahme bezeichnet und macht Annahmen über die Realität.
"Als Theorie wird allgemein ein System von über den Einzelfall hinausgehenden Aussagen bezeichnet, das dazu dient, Erkenntnisse über einen Tatsachenbereich [...] zu ordnen und das Auftreten dieser Tatsachen zu erklären. In der Forschung haben Theorien vor allem die Funktion, das Erkenntnisinteresse und die Fragestellung zu leiten sowie eine Strategie für die Erhebung und Auswertung der Daten bereitzustellen…“ (Dolde, 1993).
Hypothesen müssen bestimmte Kriterien erfüllen. Hierzu gehören die Allgemeingültigkeit, Operationalisierbarkeit, Widerspruchsfreiheit und Falsifizierbarkeit. Sie müssen die Formalstruktur eines sinnvollen Konditionssatzes erfüllen und begründet sein (Bortz and Döring, 2006).
Für den hier betrachteten Bereich der Risikofaktorenanalyse muss klar definiert werden, ob eine Studie zur Schlussbildung (Hypothesentestung) oder zum Generieren von Hypothesen durchgeführt und ausgewertet werden soll.
Bei der Hypothesentestung verläuft der Prozess, bis sich eine statistische Hypothese formulieren lässt, über eine Studienfrage, weiter zur Arbeitshypothese und schließlich zur statistisch prüfbaren Hypothese. Testet man eine Hypothese mittels statistischer Methoden, so
vergleicht man seine Annahme mit Informationen (Daten, Befunden, etc.; Riedwyl, 1978). Mit Hilfe der Betrachtung einer Auswahl von Fällen ziehen wir Schlüsse für die gesamte Population (Induktion). Seit dem letzten Jahrhundert sind sich die Wissenschaftler in der Statistik einig, dass eine „wahre“ Hypothese nie bewiesen, also verifiziert, werden kann. Auf der anderen Seite kann eine „falsche“ Hypothese jedoch falsifiziert, also widerlegt, werden (Bärlocher, 2008). Popper meint sogar, dass bei manchen Hypothesen weder das eine noch das andere möglich sei und man daher eine Hypothese nur bestätigen oder untermauern könne – oder eben nicht ("...
confirm..."; Popper, 2002). Während der klassische Signifikanztest nach R.A. Fisher eine einzige Hypothese (die Nullhypothese) formulierte und testete, formuliert man heute nach dem Ansatz von Neyman‐Pearson‐Wolf zwei Hypothesen (Null‐ und Alternativhypothese), wodurch es möglich ist abzubilden, dass man beim statistischen Testen zwei verschiedene Arten von Fehlern machen kann (Fehler 1. und 2. Art; Bärlocher, 2008). Das Prinzip der Schlussbildung ist es, dass erst die wissenschaftliche Hypothese formuliert wird, dann das Modell passend konstruiert wird und dieses dann im Hinblick auf seine Anpassung an die Daten untersucht wird. Hypothesen zu formulieren, nachdem man die Auswertung vollzogen hat, ist ebenso wie die gleichzeitige Aufstellung und Testung einer Hypothese am selben Datensatz als unwissenschaftlich anzusehen (Bortz and Schuster, 2010).
Dieses Vorgehen lässt sich insbesondere anhand der Publikationen 1, 2 sowie 5 an Beispielen erläutern. Zum Zeitpunkt der Studienplanung und ‐durchführung lagen bereits Erkenntnisse über die Risikofaktoren für BSE bei Rindern, die Leistungsminderung bei Masthähnchen und das Vorkommen von Rindern, die serologisch positiv für Brucella abortus sind, vor. Diese Erkenntnisse konnten aus der wissenschaftlichen Literatur bzw. aus Untersuchungen des öffentlichen Veterinärwesens herangezogen werden. In allen hier dargestellten Fällen war jedoch zum Zeitpunkt der Studienplanung nicht klar, ob die an anderer Stelle oder unter anderen Bedingungen generierten Erkenntnisse auch unter den konkreten Bedingungen der gewählten Studienpopulation nachvollzogen werden können. Ziel der Untersuchungen war es daher, zum einen neue Erkenntnisse für die Studienpopulation zu erwerben, um dadurch zum anderen einen weiteren Beitrag zur Untermauerung der wissenschaftlichen Generalhypothesen zu leisten. In allen Fällen konnte zusätzlich zum Erreichen dieser Ziele ein weiterer Schritt gemacht werden. Die Kombination der eingesetzten Untersuchungsinstrumente beziehungsweise der analysierten Risikofaktoren hat neue Erkenntnisse geliefert, die wiederum zukünftig an anderer Stelle und in anderen Studienpopulationen überprüft werden können.
10 Zweck der Analysen
In Publikation 2 konnte bestätigt werden, dass auch in Norddeutschland die Betriebsgröße (aufgrund der höheren absoluten Anzahl empfänglicher Tiere), die Milchleistung, die Rinderrasse sowie die Haltung von anderen Nutztieren (als Hinweis auf mögliche Kreuzkontamination) in Beziehung mit dem Vorkommen von BSE steht. Somit konnten neue Erkenntnisse für die Rinderpopulation in Norddeutschland gewonnen werden und die Generalhypothesen untermauert werden. Jedoch hat sich bei den Analysen gezeigt, dass sämtliche hier genannten Risikofaktoren nur dann eine Rolle zu spielen scheinen, wenn andere (ebenfalls hier genannte) Faktoren eine bestimmte Ausprägung aufweisen. Das heißt, die Studie hat neue Erkenntnisse darüber geliefert, dass diese Risikofaktoren in bestimmten Mustern wirksam sind und abhängig von ihrer Kombination ein bestimmtes betriebliches Managementkonzept reflektieren – somit also eher als Indikator denn als Risikofaktor anzusehen sind.
Weiterhin war in der wissenschaftlichen Literatur bereits aufgeworfen worden, dass das Alter eines Gebäudes, das Wetter, die Brüterei, die Einstreu oder die Dauer der Mastperiode einen Einfluss auf die Leistung und das Wohlbefinden von Masthähnchen nehmen können, so dass die Studie, die in Publikation 1 beschrieben ist, untermauern konnte, dass diese Faktoren wirken.
Darüber hinaus konnte gezeigt werden, welche dieser Faktoren und in welcher Weise sie in agrarisch hochverdichteten Landkreisen in Niedersachsen Einfluss auf die Leistung und das Wohlbefinden der Masthähnchen nehmen. Auch in dieser Studie war die neue Erkenntnis, dass Risikofaktoren in bestimmten Mustern wirksam sind und abhängig von ihrer Kombination ein bestimmtes betriebliches Managementkonzept repräsentieren. Es konnte als neue Hypothese deduziert werden, dass der Landwirt den Effekt der Risikofaktoren und damit die Entwicklung von Leistung und Wohlbefinden aktiv steuern kann. Das heißt, trotz kalt‐feuchter außenklimatischer Bedingungen kann er ein für diese Bedingungen besser passendes Einstreumaterial auswählen, um damit (indirekt) die Tiermastgewichte erhöhen. Weiterhin kann er die Besatzdichte in Abhängigkeit von den Haltungsbedingungen (Gebäudealter, Klima, etc.) variieren.
In der Studie in Nordirland (s. Publikation 5) wurden fünf bekannte (Risiko‐)Faktoren auf ihren Zusammenhang mit dem Vorkommen serologisch positiv getesteter Rinder untersucht. Die Ergebnisse untermauern vorherige Erkenntnisse und Annahmen über die biologischen Zusammenhänge zwischen Infektionswahrscheinlichkeit, Alter, Geschlecht und Abortrate.
Darüber hinaus wurde auch hier eine neue Erkenntnis darüber abgeleitet, dass die Infektionswahrscheinlichkeit mit dem betrieblichen Managementkonzept in Zusammenhang steht (vgl. Nutzungsrichtung), was auf Unterschiede in der Biosicherheit ebenso wie in der Betriebsgröße zurückgeführt werden könnte. Diese so neu generierten Hypothesen können nun in einem neuen Studienkollektiv getestet werden.
Obwohl das Prinzip der Hypothesentestung in der Veterinärepidemiologie etabliert ist und angewendet wird, hat sich zuletzt für manche gut untersuchte Erkrankung ein Dilemma bei der Hypothesenformulierung ergeben. Teilweise gibt es mittlerweile eine Vielzahl von Untersuchungen und es sind bereits zahlreiche mögliche Risikofaktoren bekannt. Zudem werden Bekämpfungsprogramme angewendet, die das Vorkommen der Erkrankung gesenkt haben und bei denen verschiedene (Biosicherheits‐)Maßnahmen in den Betrieben implementiert sind. Führt man mit fortgeschrittener Sanierung eine Studie über die Risikofaktoren durch, wird man gegebenenfalls nicht mehr die ehemals bedeutendsten Faktoren nachweisen können. Vielmehr ist man dann gezwungen, alle grundsätzlich möglichen Faktoren zu untersuchen, um die aktuell wichtigsten identifizieren zu können.
Dieses Dilemma, konkrete Hypothesen testen zu wollen bei einer hohen erforderlichen Zahl von Risikofaktoren, lässt sich bei Gotter et al. (2012) nachvollziehen. Ziel der Untersuchung war es, Risikofaktoren für das Vorkommen von serologisch Salmonella spp. positiven Schweinebetrieben zu analysieren. Zum Zeitpunkt der Untersuchungen bestand bereits seit mehreren Jahren ein deutschlandweites Salmonellen‐Monitoring, bei welchem am Schlachthof der Anteil positiv getesteter Schweine pro Betrieb ermittelt wird. Basierend auf den serologischen Untersuchungen wurde eine Dreiteilung der Betriebe (Kategorie I bis III) vorgenommen. In der Studie wurden Kat. I‐ und Kat. III‐Betriebe miteinander verglichen. Die Landwirte waren bereits vor der Studie bezüglich der Reduktion der Salmonellenbelastung sensibilisiert, da eine starke Belastung wirtschaftliche Nachteile haben kann. Insofern kann unterstellt werden, dass zum Zeitpunkt der Untersuchung grundlegende Biosicherheitsmaßnahmen zumindest bekannt und teilweise bereits in mehr oder weniger wirksamer Anwendung waren. Da im Projekt der Hypothesen prüfende Gedanke überwog, wurde entschieden, basierend auf konkreten Hypothesen weitere Vorstrukturierungen der Informationen vorzunehmen anstatt ein Auswertetool anzuwenden, welches sämtliche Faktoren gemeinsam analysiert. Daher wurden im Folgenden drei Faktorenkomplexe näher
12 Zweck der Analysen
analysiert: zum Eintrag von Salmonellen, zur Zirkulation im Betrieb und zur Hygieneschleuse.
Dieses Vorgehen zur Hypothesen basierten Auswertung zeigte, dass trotz der hohen Zahl von potentiellen Risikofaktoren eine strukturierte, Hypothesen basierte Auswertung möglich ist.
Die hier beschriebene Studie ist nicht die einzige, die sich mit einer Hypothesen basierten Auswahl von zu erhebenden Informationen beschäftigen muss. Aufgrund der angestiegenen Rechnerleistung in den letzten Jahrzehnten kann ein extrem großer Umfang von Informationen auf Betriebs‐ und Tierebene erhoben werden. Diese Informationen können aus der Sicht des Risikofaktorenanalysten Zielgrößen, Einflussgrößen und Confounder sein und sind daher bei den Analysen unterschiedlich zu behandeln. Die Zuordnung der Informationen zu einer dieser Variablentypen muss aufgrund der zuvor aufgestellten Hypothesen erfolgen. Somit steht hinter den statistisch zu testenden Hypothesen eine konkrete Annahme über die Ursache‐Wirkungs‐
Beziehung zwischen den analysierten Informationen. Wie bereits erwähnt, ist die Zahl der zu testenden Hypothesen pro Studie in den letzten Jahren aufgrund der großen Zahl an erhobenen Informationen stark gestiegen. So kann eine Information in der einen Hypothese als Zielgröße und in einer anderen als Einflussgröße wirken. Diese Situation tritt gerade aus dem Grunde heutzutage vermehrt auf, da sich epidemiologische Populationsstudien immer mehr mit der Gesamtsituation in den Tier haltenden Betrieben auseinander setzen und somit komplexe Zusammenhänge untersuchen. Weiterhin sind viele sogenannte Produktionskrankheiten multifaktoriell bedingt (Striezel, 2005). Um die Zusammenhänge von allen Seiten zu beleuchten, werden dann zahlreiche Informationen erhoben und eine Vielzahl von Hypothesen getestet.
An einem Beispiel, welches der Publikation 9 zugrunde lag, lässt sich darstellen, wie ein solches Hypothesennetz aus betrieblichen Informationen aussehen kann, in dem Variablen sowohl als Zielgrößen als auch als Einflussgrößen wirken können (Hypothesennetz; vgl. Abb. 2).
Abbildung 2: Beispiel für ein Hypothesennetz aus der Studie "Bedeutung von Clostridium botulinum bei chronischem Krankheitsgeschehen" (modifiziert nach Jensen, 2016)
Der Begriff eines Hypothesennetzes ist bisher in der wissenschaftlichen Literatur nicht definiert oder geprägt. Er wird hier verwendet, um zu veranschaulichen, welches hohe Maß an Komplexität und Vernetzung von Hypothesen wir heutzutage versuchen, in Modellen abzubilden. Ein Hypothesennetz ist vergleichbar mit einem ätiologischen (bzw. kausalen) Diagramm, welches dabei helfen soll, Zusammenhänge grafisch darzustellen (causal diagram;
Dohoo et al., 2009). Im Gegensatz zum ätiologischen Diagramm enthält das Hypothesennetz ausschließlich Informationen, die auch tatsächlich erhoben worden sind und somit Hypothesen, welche grundsätzlich auch prüfbar wären. Eine solche grafische Darstellung der (möglichen) Zusammenhänge erleichtert nicht nur die fortschreitende Analyse, sie erleichtert auch die inhaltliche Interpretation.
Die Studie, für die das Hypothesennetz in Abb. 2 dargestellt ist, hat in einem Fall‐Kontroll‐Ansatz nach möglichen Ursachen für ein chronisches Krankheitsgeschehen in Milchviehbetrieben gesucht. Die hier dargestellte Analyse war eine ergänzende Untersuchung zur der primären Frage, ob ein kontinuierlicher, geringgradiger Kontakt mit Clostridium botulinum bei Milchkühen ein chronisches Krankheitsgeschehen mit sinkender Milchleistung, vermehrten Todesfällen,
14 Zweck der Analysen
erhöhter Abgangs‐ und Festliegerrate sowie dem Eindruck einer kranken Herde auslösen kann.
Da diese fünf Kriterien zur Charakterisierung eines chronischen Krankheitsgeschehens sehr allgemein sind und auch eine Vielzahl anderer Ursachen haben können, wurden die oben dargestellten zusätzlichen Informationen zur Tiergesundheit und dem betrieblichen Management erhoben und analysiert. In Abbildung 2 kann nachvollzogen werden, dass beispielsweise das Vorkommen von Lahmheiten auf dem Betrieb, eine mögliche Ursache für die Einstufung des Betriebes als Fall gewesen sein konnte (Lahmheit als Einflussgröße). Gleichzeitig kann jedoch das Auftreten von Lahmheiten von anderen Erkrankungen (z.B. Mortellaro, Pansenazidose) oder Haltungs‐ (z.B. Komfort der Liegeboxen) und Managementbedingungen (z.B. Klauenpflegemaßnahmen) abhängen (Lahmheit als Zielgröße).
Basierend auf dem zuvor beschriebenen Hypothesennetz sollten dann in enger Zusammenarbeit zwischen Klinikern und Epidemiologen die zu erhebenden Informationen bestimmt, ausgewählt und operationalisiert werden.
Dabei geht es neben Anforderungen an die angemessene Reihenfolge und Formulierung (Vermeidung der Verzerrung durch soziale Erwünschtheit, Suggestion, Komplexität, Verständlichkeit, etc.; Cameron et al., 2004; Jacob et al., 2011; Mayer, 2013) der Fragen insbesondere um die Erwägung, ob die gewünschte Information wirklich den Inhalt produziert, der für die Testung der Hypothese benötigt wird (Validität, Reliabilität; Mayer, 2013). Hierzu lässt sich wiederum ein Beispiel aus dem Projekt zur „Bedeutung von Clostridium botulinum bei chronischem Krankheitsgeschehen“ von Milchkühen einbringen.
Bei der Planung bestand der Wunsch, folgende Frage zu stellen:
„Wie viele Stunden arbeitet der Betriebsleiter pro Tag durchschnittlich im Betriebszweig Milchproduktion?“
Die zugrunde liegende Hypothese lautete:
„Bei psychisch und physisch stark be‐ oder überlasteten Betriebsleitern ist die betriebliche Leistung geringer und die Häufigkeit von Krankheiten höher als bei weniger belasteten Betriebsleitern.“
In weiteren Diskussionen konnte dann festgestellt werden, dass die absolute Arbeitszeit kein adäquater Indikator für die subjektiv empfundene Arbeitsbelastung ist. Wobei nicht in Abrede
gestellt wird, dass die zeitliche Arbeitsbelastung in landwirtschaftlichen Betrieben teilweise sehr hoch ist. Vielmehr ging es ja hier um die Annahme, dass (zu) viel Arbeit den Betriebsleiter vom Wesentlichen abhält oder ihn überfordert. Es ist jedoch ebenso anzunehmen, dass ein hoch engagierter Tierhalter und „Milchkuhliebhaber“ einen höheren zeitlichen Arbeitsanteil auf diesen Betriebszweig verwenden wird, ohne dabei größere Belastungen zu empfinden oder die Kühe aus den Augen zu verlieren, als ein eher technisch interessierter Landwirt oder ein
„Ackerbauer“ – oder gar ein Landwirt, der diesen Beruf nur aufgrund familiärer Zwänge übernommen hat (Schwarz, 2004; Kallioniemi et al., 2016).
Während Populationsstudien gut geeignet sind, um vorhandenes Wissen zu erhärten bzw. auf die Gültigkeit in anderen Populationen hin zu untersuchen, kann man Populationsstudien auch einsetzen, wenn man noch keine Annahmen und Erkenntnisse über eine Sache oder einen Zusammenhang hat. Die Auswertung solcher Studien wird als Exploration oder Erkundung der Daten bezeichnet werden. Am Ende der Exploration stehen neu generierte Hypothesen über mögliche Zusammenhänge und Wirkweisen. Einige Autoren gehen so weit zu fordern, dass in solchen Explorationsstudien nur deskriptive Auswertemethoden angewendet werden (Bortz and Schuster, 2010). Als Grund wird genannt, dass mit Hilfe von explorativen Studien nur die vorgefundene Situation in der untersuchten Stichprobe beschrieben werden sollte. Anders gesagt, darf bei explorativen Studien keine Ableitung hinsichtlich möglicher Kausalitäten gemacht werden. Ergebnisse liefern lediglich Evidenzen für die untersuchte Studienpopulation.
Verallgemeinernde Interpretationen, bei denen von der Stichprobe auf die Grundgesamtheit geschlossen wird, sind nicht zulässig. Dafür müssen die neu generierten Hypothesen erst nachfolgend in einem anderen Datensatz getestet werden (Bortz and Schuster, 2010).
Grundsätzlich sind zwei Szenarien für Explorationsstudien vorstellbar. Zum einen kann eine Populationsstudie mit dem ausschließlichen Ziel der Exploration und Hypothesengenerierung durchgeführt werden. Dies wurde bspw. in Publikation 6 so gemacht, als es um die möglichen Ursachen für unspezifische Leistungsminderung in Milchkuhherden in Schleswig‐Holstein ging.
Wesentliche Unterschiede zwischen hier untersuchten Fall‐ und Kontrollbetrieben lagen in der Futterbergung, ‐lagerung und Energieversorgung der Milchkühe sowie in der Verschmutzung der Tierumgebung. Diese Ergebnisse dürfen jedoch nicht ohne weiteres auf die Zielpopulation übertragen werden. Sie sind bisher rein spekulativ und müssen in nachfolgenden Studien überprüft werden.
16 Zweck der Analysen
Zum anderen kann man eine Populationsstudie mit dem Ziel der Prüfung vorhandener Hypothesen durchführen und dabei gleichzeitig neue Hypothesen generieren. Beispiele dazu aus eigenen Arbeiten wurden bereits zuvor genannt (vgl. Publikationen 1, 2 sowie 5). Durch die in den letzten Jahren verstärkt durchgeführten Verbundprojekte sind die Möglichkeiten für
„gemischte“ Populationsstudien deutlich gewachsen, in denen sowohl Hypothesen geprüft als auch neue generiert werden. Wie bereits beschrieben bedingt die Verbundarbeit eine umfassende Untersuchung pro statistischer Einheit, um jeden Partner mit den benötigten Informationen für seine Hypothesen zu versorgen (s. Publikationen 4, 9, 10 sowie Seyboldt et al., 2015). So haben im Verbund zur „Erarbeitung von Managementempfehlungen zur Kleingruppenhaltung für Legehennen unter Praxisbedingungen im Vergleich zur Volierenhaltung“ sechs unterschiedliche Einrichtungen mit neun unterschiedlichen Instituten zusammengearbeitet, die Informationen über Wirtschaftlichkeit, Tiergesundheit und ‐verhalten, Haltungsaspekten (Stallkima, etc.) sowie Epidemiologie zusammen getragen haben. Im Verbund zur „Bedeutung von Clostridium botulinum bei chronischem Krankheitsgeschehen“ verbunden mit dem Teilprojekt zum „Mikrobiologischen Risikopotenzial von Biogasanlagen unter besonderer Berücksichtigung von Hühnertrockenkot als Gärsubstrat“
haben zwei Einrichtungen mit sechs Partnern zusammen gearbeitet. In allen Verbünden war zu beobachten, dass die Partner – neben dem Testen ihrer konkreten Hypothesen ‐ ein gegenseitiges Interesse an den Daten der Partner hatten mit dem Ziel, durch eine übergreifende und kooperative Datenanalyse neue Hypothesen zu generieren, die ohne die Verbundarbeit so nicht hätten ermittelt werden können.
Führt man diese Art der „gemischten“ Populationsstudien durch, besteht die Gefahr, den Unterschied in der Aussagekraft von Analyseergebnissen aus neu generierten Hypothesen gegenüber zuvor in anderen Studien erarbeiteten zu prüfenden Hypothesen aus dem Blick zu verlieren. So könnte es passieren, dass Ergebnisse aus Hypothesen generierenden, explorativen Studienteilen in der wissenschaftlichen Literatur als schlussbildende Erkenntnisse überinterpretiert werden. So könnten sich mit der Zeit die Grenzen zwischen beiden Prinzipien verwischen. Im Rahmen der eigenen Arbeiten in Verbundprojekten konnte beobachtet werden, dass die Möglichkeiten der heutigen Rechnerleistung im Hinblick auf Datenhaltung und –analyse offenbar dazu verleiten, Informationen in einem sehr hohen Detailgrad und mit einer sehr großen inhaltlichen Breite zu erheben, wobei die dafür vordefinierten Hypothesen ebenfalls sehr zahlreich sind. Die Erwartung an die Analysen ist dann teilweise, dass aus allen
Informationen möglichst automatisiert die „wichtigsten Risikofaktoren extrahiert werden“.
Man sollte sich hier jedoch vor Augen führen, dass es sich zum einen bei einem solchen Vorgehen um eine Exploration der Daten handelt, die keine Verallgemeinerung zulässt. Zum anderen sollte ebenfalls berücksichtigt werden, dass bei einer solchen Vielzahl von Informationen immer mit falschen Auswerteergebnissen zu rechnen ist, da jedes Modell mit einer gewissen Wahrscheinlichkeit fehlerhafte Ergebnisse produziert (Typ‐I und Typ‐II‐Error;
Dohoo et al., 2009).
2.3.2 Ursache‐Wirkungs‐Beziehungen
Führt man Populations‐/Beobachtungsstudien mit dem Ziel der Hypothesentestung durch, so ist es bekannt, dass kausale Interpretationen als wesentliches Problem bei deren Interpretation gelten. Um den Zusammenhang zwischen der möglichen Ursache und der Wirkung inhaltlich besser interpretieren zu können und abzuleiten, ob diese Beziehung kausal ist, wurden im Verlauf des letzten Jahrhunderts sogenannte Kausalkriterien definiert, die sich in verschiedenen Kausaltheorien immer stärker präzisiert haben. Während Henle und Koch noch von einem monokausalen Ansatz ausgingen (Henle‐Koch‐Postulate), entwickelten Mill (Mill’s canon oder Mill’s methods; 1843) und Hill (Hill’s criteria for causation; 1965) sowie Evan (Evan’s criteria;
Evans, 1976) die Bedingungen für den Nachweis von Kausalität weiter, so dass mittlerweile auch multikausale Konzepte von Erkrankungen auf kausale Inferenz hin geprüft werden können.
Neben der Stärke des Zusammenhangs sind heute unter Anderem Dosis‐Wirkungsbeziehungen, Konsistenz, zeitlicher Zusammenhang (Temporalität), Reaktion auf Intervention oder Prävention, biologische Plausibilität, Kohärenz sowie Evidenz relevante Kausalitätskriterien.
Einige dieser Kriterien sind im Folgenden aufgegriffen und in Bezug auf die eigenen Arbeiten näher beleuchtet.
Der experimentelle Versuch gilt als der Gold‐Standard zum Nachweis von Kausalitäten (Dohoo et al., 2009). Hier können Verzerrungsmechanismen (Selection Bias, Confounding, etc.) kontrolliert werden. In populationsbasierten Beobachtungsstudien können diese Mechanismen dagegen nicht immer kontrolliert werden. Weist man in Beobachtungsstudien starke Zusammenhänge von möglichen Einflüssen mit einer oder mehreren Zielgrößen nach, so liegt grundsätzlich dennoch der Wunsch nahe, diese Zusammenhänge als kausale Zusammenhänge zu interpretieren (Rothman et al., 2008). Mittlerweile geht die moderne Interpretation des Kausalitätskriteriums über die Stärke des Zusammenhangs davon aus, dass gerade starke
18 Zweck der Analysen
Zusammenhänge nicht so wahrscheinlich durch den Zufall, Verzerrungsmechanismen oder Confounder zu erklären sind wie weniger starke Zusammenhänge (Boffetta, 2010). Diese Sichtweise ermöglicht es, auch aus Beobachtungsstudien Interpretationen hinsichtlich möglicher Kausalzusammenhänge abzuleiten. Jedoch bedeutet dies nicht, dass die Stärke des Zusammenhangs allein ausreichend wäre, um Kausalität abzuleiten. Vielmehr ist bei Beobachtungsstudien die Stärke des Zusammenhangs ein Kriterium von vielen (Kreienbrock et al., 2012).
Wendet man die Idee über die starken Zusammenhänge auf Faktorenkrankheiten an, bei denen man viele mögliche Risikofaktoren erfassen muss, so würden sich auch bei solchen Erkrankungen starke, signifikante Effekte in einen Kausalzusammenhang mit der Zielgröße bringen lassen. Beispiele hierfür lassen sich in den Publikationen 6 und 9 finden. So fiel in Publikation 6 auf, dass in Fallbetrieben die Chance für verbesserungsfähige Sauberkeit und Management am Futtertisch der Milchkühe gegenüber Kontrollbetrieben um das 7‐Fache erhöht war (in der einfaktoriellen Analyse; p<0,0001). Weiterhin war in Fallbetrieben die Chance für das Vorhandensein von sogenannten unspezifischen Leistungsdepressionen (retrospektives Bestandsproblem) im Vergleich zu Kontrollbetrieben um das 5,5‐fache höher (p=0,001). Mit dem Wissen um mögliche Einflüsse auf diese Effektschätzungen durch Interaktionen und Confounder wurden mehrfaktorielle Analysen durchgeführt, nach denen nur noch die unspezifischen Leistungsdepressionen einen sehr starken und signifikanten Zusammenhang mit der Zielgröße (hier: Fall‐Kontrollstatus) aufwiesen. Ähnliches kann in Publikation 9 nachvollzogen werden, wo in Fallbetrieben die Chance dafür, dass der Kuh‐Komfort‐Index unter 75% lag, um das mehr als 10‐fache höher war als in Kontrollbetrieben (Fall‐2‐Betriebe; p=0,002;
mehrfaktorielle Analyse). Es kann also geschlussfolgert werden, dass auch für Beobachtungsstudien mit einer großen Zahl an möglichen Einflüssen auf die Zielgröße bei starken Zusammenhängen grundsätzlich Interpretationen im Hinblick auf Kausalzusammenhänge möglich sind. Jedoch erfordert dies eine intensive analytische Auseinandersetzung mit den Daten und den Ausschluss möglicher Verzerrungsmechanismen sowie Interaktionen (vgl. Kap. 3.5 und 3.6.2). Weiterhin muss man sich über das Risiko bewusst sein, dass es sich bei den identifizierten Zusammenhängen um falsch positive (Fehler 1. Art; vgl.
Kap. 2.4.1) oder überschätzte und unrealistische Effekte (vgl. Kap. 2.4.2) handelt.
Gerade im Zusammenhang mit Faktorenkrankheiten ist es jedoch oft schwer, starke Zusammenhänge nachzuweisen. Die Wirkung von Faktoren ist multikausal und der einzelne Faktor hat oft nur einen schwachen Zusammenhang mit der Zielgröße. So wurden in Publikation 9 für 20 Faktoren signifikante Zusammenhänge (p<0,05) mit der Zielgröße in der einfaktoriellen Analyse nachgewiesen, von denen der Risikoschätzer einmal bei 4,7 lag und sonst ≤1,2 bzw. ≥0,9 war. Solche Werte sind bei wichtigen und für die Krankheitsentwicklung notwendigen Faktoren noch als gering zu bewerten („necessary cause“; Rothman et al., 2008). Bei Faktorenkrankheiten gibt es eine solche Bewertung nicht. Dennoch ist hier mehr als sonst die Einbeziehung anderer Kriterien neben der Stärke des Zusammenhangs notwendig, wenn es um die Beurteilung einer möglichen Kausalität geht. Gerade aufgrund des Fehlens eines starken Zusammenhangs sind intensive Analysen nötig, um den möglichen Einfluss von Confounding auszuschließen. Nach der mehrfaktoriellen Analyse blieb der eine starke Zusammenhang erhalten sowie 5 Faktoren, die zuvor einen schwachen Zusammenhang aufwiesen. Hier konnte im mehrfaktoriellen Modell für keinen der schwachen Einflüsse ein stärkerer Zusammenhang mit der Zielgröße nachgewiesen werden. Dennoch waren sie teilweise deutlich signifikant mit der Zielgröße assoziiert. Inhaltlich lässt sich nachvollziehbar ableiten, dass weniger Kühe mit ausreichender Köperkondition, eine verlängerte Zwischenkalbzeit, ein niedriger Kuh‐Komfort‐Index, mehr Kühe mit Hautläsionen an den Beinen sowie vermehrt verschmutzte Euter allein und insbesondere gemeinsam einen wirksamen Einfluss darauf hatten, dass sich in den Betrieben protrahierte Leistungsmängel sowie vermehrt Krankheiten und erhöhte Mortalitäten entwickelt haben.
Auch in der Humanepidemiologie sind diese schwachen Effekte bekannt. Will man beispielsweise solche Risikofaktoren untersuchen, die nicht die Hauptverursacher von Lungenkrebs sind, wird man mit schwachen Assoziationen rechnen müssen. Um dennoch eine adäquate Beobachtungsstudie durchführen zu können, ist es hier angezeigt einen angemessen hohen Stichprobenumfang zu wählen (Boffetta, 2010). Abgesehen davon sollte nicht unbeachtet bleiben, dass es in der Humanepidemiologie für die Analyse von multikausalen Faktorenkrankheiten ein theoretisches Modell über die ausreichende Ursache sowie über zusammengesetzte Ursachen gibt. Es kann gerade auf die Annahme angewendet werden, dass eine gewisse Zahl an schwachen Einflüssen gemeinsam eine Wirkung auslösen kann. Rothman et al. (2008) erläutern, dass es einerseits notwendige Ursachen geben kann, ohne die es nie zu einer Wirkung (z.B. nie zur Entstehung einer Krankheit) kommen kann („necessary cause“).
Andererseits kann es auch ausreichende Ursachen geben, die zur Krankheitsentstehung führen