• Keine Ergebnisse gefunden

2. Patienten, Material und Methoden

2.3 Methoden

2.3.1 Grundschema

Microcentrifuge 5415 R USA Eppendorf AG,

Hamburg, Germany

Thermomixer® compact Eppendorf AG,

Hamburg, Germany Galaxy Mini Centrifuge – 26 Joule VWR, Radnor, USA Qubit® 2.0 Fluorometer Thermo Fisher

Scientific, Waltham, USA

McCyclerTM Thermal Cycler und

T100TM Thermal Cycler Bio-Rad Laboratories GmbH, München, Germany

Vortex-Genie® 2 Scientific Industries Inc, Bohemia, USA

Abbildung 3. Arbeitsablauf der Probenaufbereitung.

ED: Erstdiagnose; MP: Myeloid Panel; MRD: messbare Resterkrankung, CR: komplette Remission

2.3.2 DNA-Extraktion aus Blut und Knochenmark

Die DNA-Isolation aus Vollblut und Knochenmark wurde gemäß der Herstellerangaben mit dem Allprep DNA/RNA purification kit (Qiagen, Hilden, Germany) durchgeführt.

Das Material wurde aus Zellen gewonnen, die bei -196°C in flüssigem Stickstoff gelagert wurden. Zuerst wurden die Zellen mithilfe einer phosphatgepufferten Salzlösung (PBS) gemischt, um diese zu lösen. Durch mehrmaliges Zentrifugieren und Abpipettieren wurde der PBS-Puffer wieder entfernt, sodass nur noch Zellen im Reagenz vorlagen. Anschließend wurde ein guanidiniumthiocyonathaltiger RLT plus

Extraktion von

24 Puffer hinzugegeben, um die Zellen zu lysieren und homogenisieren. Das Gemisch wurde mithilfe des QIA Shredders drei Minuten zentrifugiert. Der Durchfluss wurde dann auf die AllPrep DNA Mini Spin Säule pipettiert und für 30 Sekunden bei 12.000 rpm erneut zentrifugiert. Die DNA verblieb an der Membran und Kontaminationen wie Enzyme oder andere Proteine wurden durchgewaschen. Dieser Schritt wurde mit den Puffern AW1 und AW2 wiederholt, um die DNA-Konzentration zu erhöhen und die DNA ausreichend zu reinigen. 500 µl AW1 Puffer wurden auf die Säule gegeben und anschließend 15 Sekunden bei 12.000 rpm zentrifugiert. Nachdem der Durchfluss entfernt wurde, wurden 500 µl AW2 Puffer auf die Membran gegeben, welche dann für zwei Minuten bei maximaler Geschwindigkeit zentrifugiert wurde, um die Membran ausreichend zu waschen. Die DNA-enthaltende Säule wurde darauf in ein neues Reagenzgefäß überführt. Die DNA wurde nun mit 100 µl Elution Buffer gelöst und eine Minute wie oben beschrieben zentrifugiert. Die von der Membran gelöste DNA befand sich nun im Reagenz. (70) Die DNA-Konzentration wurde mit dem Qubit 2.0 Fluorometer von Invitrogen gemessen. Hierfür wurde das Qubit dsDNA HS Assay Kit gemäß Herstellerangaben verwendet. 1 µl DNA-Probe wurde mit 199 µl Qubit dsDNA HS Assay verdünnt und nach zwei Minuten Inkubation mit dem eingestellten DNA-Standard verglichen. Das Gerät maß die DNA-Konzentration photometrisch anhand eines fluoreszierenden Farbstoffes, der an die doppelsträngige DNA band. Da für die Analyse eine hoher DNA-Einsatz nötig war, wurde eine Konzentration von mindestens 10 ng/µl angestrebt. (71)

2.3.3 Library Präparation mit TruSight Myeloid Sequencing Panel

Zur Identifizierung eines geeigneten MRD-Markers wurden 116 Erstdiagnoseproben unseres Patientenkollektivs auf dem TruSight myeloid sequencing panel nach Empfehlung des Herstellers sequenziert (Illumina, San Diego, CA). Das Panel umfasste Exone von 46 Gene oder Hotspots, die hauptsächlich in myeloischen Neoplasien auftreten. Zur Übersicht der sequenzierten Gene ist eine Tabelle mit den entsprechenden Abschnitten eingefügt.

Tabelle 4. Abgedeckte Gene bzw. Genabschnitte durch das verwendete Custom Panel des Illumina ® TruSight® Myeloid Sequencing Panels.

Gen Exons Gen Exons Gen Exons

ASXL1 12 GATA2 2- 6 RUNX1 Komplett

25

ASXL2 11+12 IDH1 4 SETBP1 4

BCOR Komplett IDH2 4 SF3B1 13- 16 BCORL1 Komplett JAK2 12, 14 SMC1A 2, 11, 16, 17 BRAF Exon 15 KDM6A komplett SMC3 10, 13, 19,

23, 25, 28 CALR 9 KIT 2, 8- 11, 13,

17

SRSF2 1

CBL 8, 9 KRAS 2- 5 STAG1 Komplett

CEBPA Komplett MPL 10 STAG2 Komplett

CSF3R 14- 17 MYC 2 TET2 3- 11

CSNK1A1 3, 4 NF1 Komplett TP53 2- 11 DDX41 Komplett NPM1 11 U2AF1 2, 6 DNMT3A Komplett NRAS 2-5 WT1 7, 9 ETNK1 3 PHF6 Komplett ZBTB7A 2, 3 ETV6 Komplett PPM1D 1-6 ZRSR2 komplett EZH2 Komplett PTPN11 3, 13

FLT3 14- 16, 20 RAD21 komplett

Die zu sequenzierende Library wurde gemäß den Herstellerangaben vorbereitet. Es wurden je 50 ng DNA eingesetzt. Dieser wurde ein Mix aus Oligonukleotiden hinzugefügt, welche an die zu sequenzierenden Genregionen banden. Nach einer initialen Erhitzung wurde die Reaktion langsam runtergekühlt, um eine Hybridisierung der Oligonukleotide an die jeweilige Genregion zu bewirken. Im Anschluss erfolgte ein Reinigungsschritt mittels Size Selection, um überschüssige Oligonukleotide zu entfernen. Folgend wurde eine Reaktion mit einem beigefügten Extensions- und Ligationsmix durchgeführt, sodass DNA-Stränge mit den Zielregionen und den benachbarten Abschnitten entstanden. Anschließend erfolgte eine PCR, um sowohl

26 die Indexprimer, welche einen Barcode enthielten, als auch die Adapter für die Flow Cell anzufügen, die für die nachfolgende Sequenzierung notwendig waren.

Die Proben wurden mittels AMPure XP beads auf einem Magnetgestell aufgereinigt.

Die positive Ladung der Beads ermöglichte je nach Mischungsverhältnis mit der Probe, dass nur Fragmente einer bestimmten Länge selektiert wurden. Alle anderen Fragmente und Bestandteile wurden herausgewaschen. Die Bindung an die Beads erfolgte durch die negativ geladenen Phosphatgruppen der DNA. Um zu erzielen, dass in jeder Probe eine ähnliche Anzahl an DNA-Fragmenten sequenziert wurde (reads), wurden diese ebenfalls mithilfe von Beads normalisiert. Dafür wurde jeder Probe die gleiche Menge an Beads zugegeben, sodass die gleiche Menge DNA band und so dem Pool hinzugefügt werden konnte. Anschließend wurden die Proben mit 0,1 N Natriumhydroxid denaturiert, da die DNA für die Sequenzierung in Einzelsträngen vorliegen musste. Daraufhin wurde ein äquimolarer Pool erstellt, der jeweils 5µl Probe enthielt. Dieser wurde mit HT1-Puffer auf 12 pM verdünnt. Insgesamt wurden 80 Proben pro Kartuschen lane sequenziert. Verwendet wurde der Illumina HiSeq2500 sequencer mit dem HiSeq Rapid SBS Kit v2 (Illumina, San Diego, CA) mit 251 Zyklen in beide Richtungen.

Die Sequenzierung mit Illumina erfolgte nach der Technik sequencing by synthesis.

Die wie oben beschrieben hergestellten DNA-Sequenzen mit den Zielgenen enthielten an beiden Enden Adapter, welche an die Oligonukleotide auf der Flow Cell binden konnten. Das Gerät ließ den Pool über eine gläserne Flow Cell laufen, welche mit Oligonukleotiden beschichtet war. Es erfolgte eine Hybridisierung des Adapters des DNA-Einzelstranges mit dem komplementären Oligonukleotid auf der Flow Cell. Eine Polymerase synthetisierte einen komplementären DNA-Strang und der Ursprungsstrang wurde durch Denaturierung entfernt. Nun wurden der neu amplifizierte Strang durch die sogenannte bridge amplification klonal amplifiziert.

Dabei klappte der Strang um und der Adapter hybridisierte wieder an den Oligonukleotiden auf der Flow Cell. Erneut stellte die Polymerase einen komplementären Strang her, sodass letztendlich zwei Einzelstrangkopien entstanden.

Da sich dieser Prozess mehrmals wiederholte, wurden sehr viele Kopien des Originalstrangs hergestellt. Diese bildeten sogenannte örtliche Cluster, die alle die gleiche DNA-Kopie enthielten. Schließlich erfolgte die eigentliche Analyse mithilfe eines Sequenzierungsprimers. Sobald dieser gebunden hatte, wurden fluoreszierende

27 Nukleotide eingebaut, die jeweils ein typisches Lichtsignal einer bestimmten Wellenlänge sendeten. Am Ende jedes Zyklus entstand so ein Bild, an dem man die angebaute Base und letztendlich die Gensequenz feststellen konnte. Jeder Strang wurde zweimal sequenziert, da dieser vorwärts und rückwärts gelesen wurde.

2.3.4 Molekulare Analyse mittels Sanger Sequenzierung

Um die im Myeloid Panel detektierten Mutationen zu bestätigen, wurden diese mit der Sanger Sequenzierungsmethode validiert. Zunächst erfolgte eine Amplifikation des jeweils zu betrachteten Genabschnittes mittels Polymerase Kettenreaktion (PCR). Da viele verschiedene Gene untersucht wurden, waren viele Primer nötig, die je nach Möglichkeit das ganze Gen abdeckten. Das Protokoll wurden auf jeden Primer abgestimmt. In der PCR erfolgte zuerst eine Denaturierung der DNA-Doppelstränge bei 95°C. Anschließend folgte das Anlagern der genspezifischen Primer an den jeweiligen Einzelstrang (Annealing) und die hitzestabile Taq-Polymerase sequenzierte mithilfe der Desoxyribonukleosidtriphosphate (dNTP´s) einen komplementären Einzelstrang (Elongation). Pro Zyklus kam es somit zu einem exponentiellen Anstieg der DNA-Doppelstränge. Verwendet wurde der T100™ Thermal Cycler der Firma Bio-Rad. Der Erfolg der Reaktion wurde mit einem Gelbild kontrolliert.

Tabelle 5. Reaktionsansatz für die Sanger Sequenzierung.

Substanz Eingesetztes Volumen pro Probe

H2O

Tabelle 6. PCR-Konditionen für die Sanger-Sequenzierung.

Reaktionsschritt Temperatur Zeit Wiederholungen Initiale Denaturierung 95°C 10 Minuten

Denaturierung 95°C 30

Sekunden

39 Zyklen

28 Exemplarisch, Anpassung der Konditionen je nach Primer.

Die PCR-Produkte wurden mit dem Qiaquick Gel Extraction Kit gemäß der Herstellerangaben aufgereinigt. Dabei wurde zu 25 µl Probe die gleiche Menge an Isopropanol hinzugefügt, um so die DNA auszufällen. Danach wurden 75 µl QG-Puffer dazu pipettiert und der komplette Ansatz in eine Säule überführt. Diese wurde eine Minute lang bei 13.000 rpm zentrifugiert, sodass das PCR-Produkt mit dem zu untersuchenden DNA-Abschnitt in der Membran verblieb. Das anschließende Waschen mit PE-Puffer, entfernte verbliebene Salzreste. Nach erneuter Zentrifugation und Trocknung konnte das gereinigte PCR-Produkt mit Wasser aus der Membran eluiert werden.

Die Auswertung der Sequenzierungsreaktion wurde mithilfe der Software Mutation Surveyor der Firma Softgenetics (State College, PA, USA) vorgenommen.

Annealing 57°C 60

Sekunden

Elongation 72°C 1:10

Minuten Finaler

Polymerisationsschritt

72°C 10 Minuten

Ende 4°C ∞

29 2.3.5. Molekulare MRD Analyse mittels Next Generation Sequenzierung

Abbildung 4. Schematischer Ablauf der MRD-Analyse.

Modifiziert nach Thol et al. (72) A zeigt Aufbau des 1. Primers, der an die Gensequenz bindet. B zeigt den Aufbau des 2. Primers, der in einer zweiten Reaktion die Produkte der 1. PCR an der Common Sequence bindet. Anschließend folgt die Sequenzierung der PCR-Produkte auf dem Miseq (C). D zeigt das Prinzip der bioinformatischen Auswertung der Proben. Das erste Diagramm stellt die Auswertung der Proben anhand der read families dar. Das zweite Diagramm zeigt die Auswertung anhand des R1/R2 basierten Algorithmus. LVAF steht für „largest variant allele fraction“. Die grüne Linie zeigt die durchschnittliche Hintergrundfehlerrate. Die rote Linie zeigt das Sensitiviätlevel der Messung an, was als Hintergrundfehlerrate + 3 Standardabweichungen definiert ist. Eine Mutation wurde gewertet, wenn der Wert oberhalb dieser Linie lag. Mit Genehmigung des blood journals. (72)

30 2.3.5.1 Primerdesign

Da bei der Next Generation Sequenzierung eine höchst sensitive Analyse von sehr geringen Allel-Lasten erfolgen sollte, war ein spezielles Primerdesign nötig. Die Primer sollten unsere ausgewählte Targetmutation amplifizieren und gleichzeitig eine genaue, möglichst fehlerfreie Sequenzierung ermöglichen. Es wurden zwei verschiedene Primer für die zwei aufeinanderfolgenden Polymerasekettenreaktionen in der Library Präparation benötigt.

Die Primer für die erste PCR wurden mit der Primer3 software Version 4.1.0 entwickelt.

(73) Sie dienten speziell zur Amplifikation unserer Targetmutation und wurden daher mutationsspezifisch entworfen. Diese Primer deckten eine Region von circa 100 Basenpaaren ab. Zusammen war ein Primerpaar ungefähr 100 Basenpaare lang. Sie enthielten neben einer 20-Basenpaar-langen genspezifischen Region, einen 16- Basenpaar-langem Random Barcode (16-NNN) auch eine Common Sequence, die ebenso 20 Basenpaare lang war. Der Random Barcode besteht aus einer zufällig ausgewählten Sequenz und diente zur bioinformatischen Fehlerkorrektur, die in Abschnitt 2.4.2 genauer erklärt wird. Die Common Sequence fungierte als Bindungsstelle für den zweiten Primer.

Für jeden Primer wurde ein optimales PCR-Protokoll ermittelt.

Tabelle 7. Beispielhafte Sequenz des ersten NGS-Primers IDH2_NGS_415.

Genabschnitt IDH2

in 5‘ →3‘ Richtung

Forward Primer

GGTAAACACAAGGGCACTGGNNNNNNNNNNNNNNNNTATCCGGAACATCCTGGGG

Reverse Primer

CGGACTACAGCTCCCATCATNNNNNNNNNNNNNNNNcctctccaccctggccta

Die Primer für die zweite PCR enthielten ebenso die bereits erwähnte Common Sequence um an das PCR-Produkt zu binden. Zusätzlich umfassten sie einen zehn Basenpaar langen Barcode, den multiplex identifier (MID), dessen Bedeutung im nächsten Abschnitt erläutert wird, sowie einen Illumina Adapter zur Bindung an die Flow Cell.

31 Tabelle 8. Beispielhafte Sequenz der MID Primer CuPr_MID1_CS3 und CuPr_MID2_CS4.

Primer

2.3.5.2 Library Präparation für Ultra deep target Sequenzierung

Um die Resterkrankung auch bei minimalen Allel-Lasten zu detektieren, wurde eine Sequenzierung auf dem Miseq von Illumina durchgeführt. Um auch geringe Mutationsraten messen zu können, wurden nur wenige Proben auf einmal untersucht, sodass mehr DNA-Fragmente pro Probe sequenziert wurden (reads). Es wurde eine Alignment (reads pro Probe) von 100.000-500.000 reads pro Marker angestrebt bei 251 Zyklen jeweils forward und reverse. Für die Library Präparation musste jede Probe zwei Polymerasekettenreaktionen durchlaufen. Der DNA-Einsatz für die erste PCR betrug 400ng in doppeltem Ansatz mit den beschriebenen Primern, deren Annealing Temperatur individuell ermittelt wurde. Diese PCR diente zur Vervielfältigung unseres zu untersuchenden Abschnittes und zum Anfügen der Random Barcodes, die sogenannte Read Families kreiierten und wesentlich für die bioinformatische Unterscheidung von wahren Mutationen und Sequenzierungsfehlern bei sehr geringen Allel-Lasten war.

Tabelle 9. PCR-Reaktionsansatz für die 1. PCR (30µl).

Substanz Eingesetztes Volumen pro Probe

Probe

200 ng : Konzentration (Probe) 30 µl – 9,9 µl - Probenvolumen

32 Tabelle 10. PCR-Konditionen für die 1. PCR.

Reaktionsschritt Temperatur Zeit Wiederholungen Initiale Denaturierung 98°C 30s

Denaturierung 98°C 10s 5 Zyklen

Annealing Je nach Testung 57°C, 60°C oder 63°C

50s

Elongation 72°C 12s

Finaler

Polymerisationsschritt

72°C 120s

Ende 4°C ∞

Damit die Anzahl von Sequenzierungsfehler möglichst gering blieb, wurden nur wenige Zyklen wiederholt.

Anschließend wurde der doppelte Ansatz gepoolt und die Proben mithilfe der AMPure XP beads gereinigt, um überschüssige Primer, dNTP‘s und Salzreste zu entfernen.

Das Funktionsprinzip wurde bereits in der Myeloid Panel Vorbereitung 2.2.3 erklärt.

Die Probe wurde mit den Beads in einem Verhältnis von 0,9:1 gemischt, um so alle Fragmente mit einer Länge von ungefähr 200 Basenpaaren zu binden und so längere Fragmente zu entfernen. Es erfolgte ein Waschschritt mit 80%igem Ethanol, und ein erneutes Inkubieren der Probe mit den Beads in einem Verhältnis von 1,3:1 auf dem Magnetgestell. Unser PCR-Produkt mit einer Länge von 200 bp wurde nun an die Beads gebunden, mit Ethanol gewaschen und in 24 µl Wasser gelöst.

Für die zweite PCR wurde der Ansatz erneut in Duplikate aufgeteilt. Nun wurden die bereits erwähnten zweiten Primer für die Reaktion verwendet, um die MIDs und den Illumina Adapter anzufügen.

33 Tabelle 11. PCR-Reaktionsansatz für die 2. PCR.

Substanz Eingesetztes Volumen pro Probe

Probe Q5-Puffer Primer Forward Primer Reverse dNTP (10mM) Q5-Polymerase

20,1 µl 6 µl 1,5 µl 1,5 µl 0,6 µl 0,3 µl

Tabelle 12. PCR-Konditionen für die 2. PCR.

Reaktionsschritt Temperatur Zeit Wiederholungen Initiale Denaturierung 98°C 30s

Denaturierung 98°C 10s 25 Zyklen

Annealing 67°C 50s

Elongation 72°C 12s

Finaler

Polymerisationsschritt

72°C 120s

Ende 4°C ∞

Hier konnten mehr Zyklen wiederholt werden, da es in diesem Schritt weniger um mögliche Sequenzierungsfehler ging, sondern um das Anfügen der MIDs zur späteren Identifizierung der Probe und der Illumina Adapter, welche für die nachstehende Reaktion mit dem Miseq nötig waren.

Mithilfe einer Gelelektrophorese wurde das PCR-Produkt evaluiert. Dafür wurde je 5 µl Probe mit 1 µl Midorigreen Farbstoff gemischt und in die Taschen eines 2%

Agarosegels pipettiert. Bei einer Spannung von 130 V wanderte die negativ geladene DNA aufgrund der elektrischen Ladung zur positiv geladenen Anode. Je nach Molekulargewicht wurden die DNA-Fragmente aufgetrennt, wobei kleine Fragmente schneller wanderten als Große. Anhand der DNA-Leiter ließ sich die Länge unseres PCR Produktes, die bei circa 350 Basenpaaren liegen soll, ermitteln.

34 Abbildung 5. Gelbild mit PCR-Produkt von 350 Basenpaarlänge.

Danach wurde erneut eine Reinigung mit AMPure XP beads im Verhältnis 0,8:1 durchgeführt, um nun alle PCR-Produkte mit einer Länge von circa 350 bp zu binden.

Anschließend erfolgte ein zusätzlicher Reinigungsschritt mit dem GeneRead size selection kit (Qiagen, Hilden, Germany). Damit sollte eine zuverlässige Entfernung von DNA-Fragmenten, die kleiner als 150 Basenpaare sind, erfolgen. Dabei handelte es sich überwiegend um Adapter Monomere oder Adapter Dimer, aber auch um überschüssige Salze und Enzyme. Diese Verunreinigungen könnten somit nachfolgende Reaktionen erschweren. Der DNA wurde ein SB1-Puffer hinzugefügt und das Gemisch anschließend über eine Säule zentrifugiert. Diese band Fragmente über einer Länge von 150 Basenpaaren, und ließ kürzere Fragmente durch. Die anschließende Zentrifugation mit 80%-igem Ethanol diente der Eliminierung von verbliebenen Salzen. Durch eine erneute Zentrifugation sollte sichergestellt werden, dass auch der restliche Alkohol entfernt wurde, der nachfolgende enzymatische Reaktionen hätte hemmen könnte. Zuletzt wurde die DNA in Wasser gelöst.

Anschließend wurde der Erfolg der Aufreinigung mit einem wie oben beschriebenen Gelbild kontrolliert und die DNA-Konzentration mittels Qubit gemessen.

Damit alle Proben die gleiche Anzahl an reads bekamen, wurden diese mit Wasser auf eine Konzentration von 4 nM verdünnt und anschließend ein äquimolarer Pool aller Proben erstellt. Dafür wurden je 5 µl Probe eingesetzt.

Zur Quantifizierung der DNA-Konzentration, wurde der Pool mit der quantitativen Realtime-PCR gemessen. Hierbei wurden nur DNA-Stränge, welche den Illumina

35 Adapter enthielten, erfasst. Dafür wurde das Kapa Library Quantification Kit von Kapa Biosystems entsprechend der Herstellerangaben benutzt. Der Pool wurde in Triplikate aufgeteilt und mit sechs Standards verglichen, deren Konzentrationen zwischen 0,0002 und 20 pM lag.

Tabelle 13. Konditionen für die Kapa-PCR.

Reaktionsschritt Temperatur Zeit Wiederholungen Initiale

Denaturierung

95°C 5 Minuten

Denaturierung 95°C 30 Sekunden 35 Zyklen

Annealing, Elongation, Datentransfer

60°C 45 Sekunden

Das Ergebnis wurde mit der Step One Software Version 2.3 der Firma Applied Biosystem ausgewertet. Unter Berücksichtigung der durchschnittlichen Fragmentlänge, konnte so die genaue Konzentration des Pools anhand des Mittelwerts der Triplikate ermittelt werden.

Bevor der Pool zur Sequenzierung auf den Miseq geladen wurde, musste diesem eine 0,2 N Natriumhydroxidlösung zur Denaturierung der DNA-Doppelstränge hinzugefügt werden. Dies war für die Sequenzierung nötig, da auf der Flow Cell lediglich Einzelstränge binden konnten. Die Reaktion wurde mit anschließender Gabe von HT1 Puffer abgestoppt, und auf eine Konzentration von 14 pM verdünnt, damit die angestrebte Cluster Density von circa 900 K/mm² erreicht werden konnte. Diese war für die Qualität und Auswertung der Daten entscheidend. Zuletzt wurde der Pool mit den Custom Primern in die Illumina V3 Kits Kartusche pipettiert und mit dem MiSeq von Illumina sequenziert.

Tabelle 14. Sequenzen der Custom-Sequencing-Primer für den Illumina Miseq.

Primer ID Primersequenz

Custom_Primer_Seq_F Custom_Primer_Seq_R

ACACTCTTTCCCTACACGACGCTCTTCCGATCT TCTAGTGGCTCAGAGTTCTACAGTCCGACGATCA Seq: Sequenz; F: Forward; R: Reverse.

36 2.4 Bioinformatische Auswertung

2.4.1 Bioinformatische Auswertung der Myeloid Panel Sequenzierung und Auswahl der MRD Marker

Die durch das Myeloid Panel generierten Daten wurden von einem Bioinformatiker (Dr.

Razif Gabdoulline) ausgewertet. Dafür wurden zuerst mithilfe des Programms bwa (Burrow-Wheeler Aligner) die 46 eingeschlossenen Gene mit dem Referenzgenom hg19 abgeglichen. (74) Das Realignment Tool RealignerTargetCreator des Gene Analysis Tool Kit (GATK) wurde benutzt, um Insertionen und Deletionen lokal anzugleichen. (75) Die Rekalibrierung des Basenqualitätsscores (Base quality score recalibration) und das Auffinden von Varianten (variant calling) wurde mit weiteren Tools dieses Kits (Base Recalibrator, Unified Genotyper, HaplotypeCaller) durchgeführt. Um somatisch erworbene Einzelbasenveränderungen (single nucleotid variants, SNVs) zu identifizieren, wurden die Programme Illumina CallSomaticVariants (Version 3.2.3.0, Illumina, San Diego, CA), Iofreq (Version star-2.1.2) und freebayes (version 0.9.21-18-gc15a283) verwendet. (76) Alle Varianten, die nur einmalig vorkamen, wurden durch Illumina VariantStudio 3.0. annotiert. Zudem wurde ein Filter angewandt, der sowohl alle nicht annotierten SNV entfernte, die in >40% in zuvor analysierten Patientenkohorten auftraten, als auch alle SNVs entfernte, die in 14 gesunden Kontrollproben vorkamen und zudem eine VAF >0,1% in 1000 Genomes (Phase 3 v5a, Mai 2013) und ExAC. (77,78) Mutationen in bekannten Hotspots wurden herausgefiltert, wenn die VAF <5% oder die read depth <100 reads betrug. Alle anderen Mutationen fielen weg, sobald die VAF <10% oder die read depth <100 lag.

(79) Schließlich wurden alle Varianten manuell kontrolliert und basierend auf unserem Erfahrungswert (empirical score value, ESV) rausgefiltert, wenn dieser <0,8 war. Unser ESV setzte sich aus VAF³xRD/3 zusammen, wobei RD für die read depth der SNV steht. Unsere Erfahrung zeigte jedoch, dass dieser Score nur eine geringe Aussagekraft für Varianten, die durch Sequenzierungsfehler in der PCR-Amplifikation entstanden, aufwies. Wir gingen davon aus, dass die VAF von wahren Mutationen unabhängig vom Amplifikationslevel stabil blieb. Wohingegen die durch Sequenzierungsfehler bedingte falsche VAF, schon durch das Amplifikationslevel beeinflusst wurde. Deshalb ersetzten wir das Amplifikationslevel durch die read depth.

So konnten wird einen Cutoff einführen, der sowohl VAF und RD berücksichtigte und den ursprünglichen Filter ergänzte.

37 Pro Patient wurden bis zu 3 MRD-Marker ausgewählt, wobei NPM1- und DNMT3A- Mutationen ausgeschlossen wurden. Alle Mutationen wurden mit unserer NGS-Methode oder Sanger Sequenzierung validiert.

2.4.2 Bioinformatische Auswertung des error-corrected sequencing für sensitive MRD Detektion

Auch diese Auswertung fand durch einen Bioinformatiker (Dr. Razif Gabdoulline) statt.

Zuerst wurden die sequenzierten Einzelstränge an die Referenzsequenz mit dem bwa Programm (Burrow-Wheeler Aligner) angepasst. Dies wurde separat für die vorwärts (R1) und rückwärts (R2) gelesenen Einzelstränge durchgeführt. Anschließend wurden diese kombiniert, in eine kongruente Sequenz übertragen und abermals verglichen.

Die Sequenzen mussten sich sowohl vorwärts (R1) als auch rückwärts (R2) decken, um nachfolgend analysiert zu werden. So wurden insgesamt drei BAM Dateien (R1, R2, R1/2) erstellt, die mit den IGV tools analysiert wurden. (80) Um den Einfluss von Sequenzierungsfehlern auf unsere Ergebnisse möglichst gering zu halten, wurden nur

Die Sequenzen mussten sich sowohl vorwärts (R1) als auch rückwärts (R2) decken, um nachfolgend analysiert zu werden. So wurden insgesamt drei BAM Dateien (R1, R2, R1/2) erstellt, die mit den IGV tools analysiert wurden. (80) Um den Einfluss von Sequenzierungsfehlern auf unsere Ergebnisse möglichst gering zu halten, wurden nur