• Keine Ergebnisse gefunden

Vesper 2008 diploma thesis

N/A
N/A
Protected

Academic year: 2022

Aktie "Vesper 2008 diploma thesis"

Copied!
69
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Verfeinerung der

Proteinkristallographie durch Flexibilitätsvorhersagen

Diplomarbeit

vorgelegt von

Martin Vesper

aus Berlin

angefertigt

im Max-Planck-Institut für Biophysikalische Chemie vorgelegt

im Dritten Physikalischen Institut der Georg-August-Universität zu Göttingen

2008

(2)
(3)

Vorwort

Liebe Leserin, lieber Leser,

Sie halten gerade meine Diplomarbeit in den Händen. Ich habe sie in den Jahren 2007 und 2008 am Max-Planck-Institut für biophysikalische Chemie in Göttingen in der Abteilung für theoretische und computergestützte Biophysik angefertigt. Zur Form des Textes sei kurz erwähnt: Tiefergehende Ergänzungen und weiterführende Anmerkungen, die für das weitere Verständnis nicht unbedingt notwendig sind, sind abgesetzt und in kleinerer Schrift gehalten. Es werden Begrie und Abkürzungen aus dem Englischen benutzt, falls eine deutsche Entsprechung nicht oder kaum in Verwendung ist.

Ich danke Bert de Groot für die Idee zu dieser Arbeit, die hervorragende Betreuung und die sehr fruchtbaren Gespräche. Nicole Dölker war eine Hilfe bei den alltäglichen Ar- beitsfragen und sorgte für eine nette Büroatmosphäre. Christian Blau und Martin Stumpe bin ich für Hilfe und auch die nötigen Teepausen dankbar. Lars Bock war mir eine Hilfe bei der gemeinsamen Auseinandersetzung mit Distance Geometry. Weiterer Dank geht an die ganze Arbeitsgruppe, die immer mit kritischen Diskussionen und Ratschlägen zur Seite stand, an meine Referenten Chrsitoph Schmidt und Helmut Grubmüller, an Ansgar Kalz für sein Korrekturlesen, an meine Eltern für die Unterstützung meines Studium und natürlich an Jana.

Göttingen, Oktober 2008 Martin Vesper

(4)
(5)

Inhaltsverzeichnis

1 Einleitung 1

1.1 Proteine . . . 1

1.2 Röntgenkristallographie von Proteinen . . . 2

1.2.1 Kristallisation . . . 3

1.2.2 Phasenproblem . . . 4

1.2.3 Interpretation der Elektronendichte . . . 9

1.2.4 Verfeinerung und Validierung der Struktur . . . 10

1.3 Translation-Libration-Screw Renement . . . 13

1.3.1 Einleitung . . . 13

1.3.2 Entwicklung . . . 14

1.3.3 Rechnungen zu tls . . . 15

1.3.4 Anwendungen von tls . . . 15

1.3.5 Gruppendenition . . . 16

2 Entwicklung der Methode 17 2.1 Generierung des Ensembles mit concoord . . . 17

2.2 Analyse der Bewegungen . . . 19

2.3 Distanzmaÿ und Gruppierung der Bewegungen . . . 23

3 Anwendung der Methode 27 3.1 System eins: 2epe . . . 27

3.2 System zwei: 5hoh . . . 30

3.3 System drei: 1zz6 . . . 34

4 Diskussion 43 4.1 System eins: 2epe . . . 43

4.2 System zwei: 5hoh . . . 43

4.3 System drei: 1zz6 . . . 43

4.4 Zusammenfassung . . . 44

5 Zusammenfassung und Ausblick 45 5.1 Zusammenfassung . . . 45

5.2 Ausblick . . . 45

Anhang 47

(6)

a Distance Geometry 49

a.1 Theorie . . . 49

a.2 Anwendung . . . 51

a.3 Beispiel . . . 52

b Bonus: Fitfreie Hauptkomponentenanalyse 55 b.1 Einleitung . . . 55

b.1.1 Hauptkomponentenanalyse von Proteintrajektorien . . . 55

b.1.2 Abweichung der Koordinaten oder der Distanzen? . . . 56

b.2 Anwendung . . . 57

b.2.1 pca . . . 57

b.2.2 Fitfreie pca . . . 57

b.2.3 Auswertung . . . 60

b.3 Diskussion und Ausblick . . . 60

Literaturverzeichnis 61

(7)

1 Einleitung

Die am meisten verwendete Methode zur Strukturermittlung von Proteinen ist die Rönt- genkristallographie. In ihrem letzen Schritt dem Renement wird ein rudimentäres Strukturmodell anhand der Messwerte optimiert. Die optimierten Parameter sind die Atomkoordinaten und die so genannten B-Faktoren, die ein Maÿ für die statische und dynamische Unordnung darstellen. Eine gute Wahl der Parameter für diese Verbesserung ist entscheidend für die Qualität und Verlässlichkeit des Ergebnisses: Zu wenige Parame- ter verhindern die Beschreibung eines Teils der Messdaten und zu viele Parameter führen zu einer Überanpassung an die Messdaten. Bei Röntgenreexen mittlerer Auösung ist dieser kritische Schritt beim Übergang von isotropen zu anisotropen B-Faktoren des Proteins im Kristall anzusiedeln. Einen Ausweg stellt das so genannte tls-Renement dar [24]. Dabei wird das Protein in Untereinheiten geteilt, für die die anisotrope Dyna- mik gemeinsam beschrieben wird. Dadurch liegt die Anzahl der verwendeten Parameter zwischen denen der isotropen und der anisotropen atomaren Beschreibung. Damit ein tls-Renement erfolgreich ist, müssen die Atomgruppen dynamische Aspekte von Fest- körpern gemeinsame Translation, Rotation und Verdrillung aufweisen.

In dieser Arbeit wird eine Methode vorgestellt, die das Protein auf Grund seiner dy- namischen Eigenschaften automatisiert in Atomverbände einteilt. Diese Gruppen können im tls-Renement dazu verwendet werden, eine bessere Beschreibung der Dynamik ei- nes Proteins im Kristall zu liefern und dadurch ein besseres Strukturmodell zu erzeugen.

Kreuzvalidierung wird eingesetzt, um das Optimum zwischen einer möglichst vollständi- gen Beschreibung der Dynamik im Kristall und einer Überanpassung des Modells an das Protein zu nden.

1.1 Proteine

Proteine sind aus Aminosäuren aufgebaute Makromoleküle. Sie sind jedoch mehr als das, sie sind molekulare Maschinen der Biologie. Ihre Aufgaben reichen vom Stotransport über die Katalyse chemischer Reaktionen bis hin zur Immunabwehr. Die Information für den Aufbau eines Proteins wird aus dem Erbgut der Zelle gewonnen. Mit heutigen bioche- mischen Methoden ist es möglich, die Basenabfolge der dns (Desoxyribonukleinsäure) zu ermitteln. So ist beispielsweise im Jahre 2001 das menschliche Genom entschlüsselt wor- den [28, 18]. Aus der Basenabfolge der dns ergibt sich dann die Abfolge der Aminosäuren in einem Protein.

Aufbau eines Proteins Die Aminosäuren1 eines Proteins sind durch Peptidbindun- gen in einer linearen Kette angeordnet. Diese wird als Aminosäuresequenz oder auch

1 Genauer muss man sagenα-Aminosäuren, bei denen sich die Aminogruppe (NH2) am ersten Koh- lenstoatom nach der Carboxylgruppe (COOH ) bendet. Alle proteinogenen Aminosäuren sind α-Aminosäuren, daher werden in diesem Text die Begrie synonym gewählt.

(8)

Tabelle 1.1: Wachstum der Anzahl von Proteinstrukturen nach Methoden getrennt Methode Einträge insgesamt neue Einträge 2007

Röntgenkristallographie 43260 6287

Kernresonanzspektroskopie 7295 968

Elektronenmikroskopie 177 19

Primärstruktur bezeichnet. Hiermit ist jedoch nur etwas über die Abfolge der Aminosäu- ren gesagt, nicht über den räumlichen Aufbau eines Proteins. Die so genannte Hauptkette oder das Rückgrat eines Proteins besteht aus den Kohlensto- und Sauerstoatomen2der Carboxylgruppen, dem Stickstoatom der Aminogruppen und dem zentralen Kohlenstof- fatom Cα. An den Cα-Atomen hängen die Seitenketten der Aminosäuren. Wassersto- brücken zwischen den Atomen der Hauptkette stabilisieren die so genannte Sekundär- struktur eines Proteins. Bekannteste Vertreter der Sekundärstrukturelemente sind die α-Helices und dieβ-Faltblätter. Durch die Wechselwirkungen zwischen den Seitenketten der Aminosäuren faltet sich das Protein zu seiner räumlichen Anordnung der einzelnen Aminosäuren, der so genannten Tertiärstruktur. Das komplizierte Zusammenspiel der ver- schiedenen Wechselwirkungen im Protein macht es bislang unmöglich, die Tertiärstruktur verlässlich aus der Primärstruktur vorherzusagen. Jedoch ist es viel mehr diese räumliche Anordnung als die genaue Aminosäuresequenz, die die Funktion eines Proteins bestimmt.

In Experimenten lassen sich einzelne Aminosäuren gegen andere austauschen. So kann die Abhängigkeit der Arbeitsweise des Proteins von einer Aminosäure untersucht werden. Viele Aminosäuren können mutiert werden, ohne eine merkliche Änderung der Funktion des Pro- teins herbeizuführen. Eine andere Faltung jedoch führt bei gleicher Aminosäuresequenz zu völligem Verlust der ursprünglichen Funktion des Proteins.

1.2 Röntgenkristallographie von Proteinen

Die Kenntnis der Struktur eines Proteins ist also oft Grundvoraussetzung für das Ver- ständnis seiner Funktion. Die Strukturen von Myoglobin und Hämoglobin wurden von John C. Kendrew und Max F. Perutz in den Jahren 1958 und 1959 als erste Proteinstuk- turen ermittelt [17, 23]. Beide erhielten hierfür im Jahre 1962 den Nobelpreis für Chemie.

Das von ihnen verwendete Verfahren war die Röntgenkristallographie. Auch heute ist diese Methode die verbreitetste zur Bestimmung von Proteinstrukturen. Neben der Kern- resonanzspektroskopie und der Elektronenmikroskopie sind die meisten und die meisten neuen Strukturen in der rcsb protein data bank3 mit der Röntgenkristallographie bestimmt worden (siehe Tabelle 1.1).

2 Die Denitionen von Hauptkette und Rückgrat unterscheiden sich manchmal, was die Zugehörig- keit des Sauerstoes angeht.

3 Die Research Collaboratory for Structural Bioinformatics Protein Data Bank (http://www.rcsb.org/pdb) ist ein Archiv aller gelösten Proteinstrukturen.

(9)

1.2 Röntgenkristallographie von Proteinen 3

Bild 1.1: Einkristall des Lysozyms (Quelle: Wikimedia Commons) 1.2.1 Kristallisation

Vom Protein zum Kristall

Der erste und vielleicht auch schwerste Schritt in der Strukturbestimmung von Proteinen mit der Röntgenkristallographie ist die Herstellung eines Proteinkristalls. Hierzu wird das gewünschte Protein meist in Escherichia coli Bakterien überexprimiert. Dabei produziert das Bakterium gezielt dieses Protein in groÿen Mengen und es ist einfacher, eine hoch- reine, übersättigte Proteinlösung herzustellen, in der die Kristallisation stattnden soll.

Eine Lösung zu nden, in der das Protein kristallisiert, ist sehr aufwendig. Es spielen hierbei viele Parameter eine Rolle, wie zum Beispiel Temperatur, Lösungsmittel, pH- Wert, Art der gelösten Salze und deren Konzentration. Proteinkristalle beinhalten viel Kristallwasser. Hierbei handelt es sich um im Kristall gebundenes Wasser, das geordnet4 und ungeordnet5 vorliegen kann. Es nimmt etwa 30% bis 70% des Kristallvolumens ein.

Proteinkristalle sind daher viel weicher als zum Beispiel Ionenkristalle und reagien emp- ndlich auf Wasserverlust. Die Fotograe 1.1 zeigt einen Proteinkristall des Lysozyms6.

Warum Kristalle? Um Proteine mit Röntgenlicht auf ihre Struktur zu untersuchen, muss ein Proteinkristall vorliegen, denn erst die regelmäÿige Anordnung der Strukturen im Kristall ermöglicht einer einfallenden elektromagnetischen Welle positiv zu interferie- ren. Die Gitterpunkte eines Kristalls denieren Mengen von parallelen Ebenen. In drei Dimensionen wird jede dieser Mengen durch drei ganze Zahlen (h k l)(Miller-Indizes) beschrieben7. Strahlung wird von diesen Ebenen reektiert und ergibt nur bei konstrukti-

4 in fast jeder Elementarzelle an das Protein gebunden

5 den Raum zwischen den Proteinmolekülen ausfüllend, annähernd üssig 6 ein Protein, das eine der Beispielstrukturen in dieser Arbeit ist

7 Die Indizes geben an, wie viele Schnittpunkte die Ebenenschar innerhalb einer Elementarzelle mit der zugehörigen Kristallachse hat.

(10)

ver Interferenz einen Reektionspunkt auf dem Schirm bzw. Detektor. Hierfür muss das Bragg'sche Gesetz

nλ= 2dsinθ

erfüllt sein.λbezeichnet die Wellenlänge der Strahlung,θ den Einfallswinkel und d den Abstand zwischen den zwei Ebenen der Schar. Da d für jeden Kristall von den Miller- Indizes und der Geometrie der Elementarzelle abhängt, lässt sich jeder Reektionspunkt mit einem Tripel(h k l)identizieren.

Vom Kristall zum Beugungsbild

Ist es gelungen, das Protein zu kristallisieren, so werden die Röntgenreektionen gemes- sen. Hierzu sendet eine Röntgenquelle einen fokussierten Strahl aus, der auf den Protein- kristall trit. Ein Detektor misst die Intensitäten des gestreuten Lichtes in Abhängigkeit vom Streuwinkel. Um einen vollständigen Datensatz zu erhalten, wird das Protein schritt- weise rotiert und die Reexe für die einzelnen Winkel aufgenommen. Jedem erhaltenen Reex werden dann die Miller-Indizes (h k l)und die gemessenen Intensitäten zugeord- net.

Aus den Abständen der Reexe im reziproken Raum lassen sich die Abmessungen der Elementarzelle bestimmen. Die Elementarzelle besitzt die gleiche Symmetrie wie das reziproke Gitter. Aus dem systematischen Fehlen von Reexen können Rückschlüsse auf zusätzliche Symmetrien der Elementarzelle gezogen werden. Mit diesen Symmetriegrup- pen ist auch bekannt, welche Reexe äquivalent sind, also die gleichen Intensitäten zeigen sollten. Dadurch besteht die Möglichkeit, Mittelwerte der Intensitäten zu bilden, und die Messwerte verlässlicher werden zu lassen.

Die Intensitäten sind die Amplituden der so genannten Strukturfaktoren. Die Fourier- transformation der Strukturfaktoren ergibt die Elektronendichte, aus der die Orte der Atome bestimmt werden können. So weit wäre alles gut, gäbe es da nicht das:

1.2.2 Phasenproblem

Prinzipiell lieÿe sich die Elektronendichteρdurch Fouriertransformation der Strukturfak- toren F ausrechnen:

ρ(x,y,z) = 1 NV

X

h,k,l

Fhkle−2πi(hx+ky+lz).

Die Elektronendichte ist eine reellwertige Funktion, ihre Fouriertransformierte die Struk- turfaktoren hingegen kann eine komplexwertige Funktion sein:

Fhkl =|Fhkl|eiφhkl. (1.1)

Die in der Röntgenkristallographie verwendeten Strahlungsmessgeräte registrieren ledig- lich die Intensität der Strahlung. Weitere Charakteristika elektromagnetischer Wellen wie

(11)

1.2 Röntgenkristallographie von Proteinen 5

Phasen und Polarisationen gehen verloren. Die Intensität ist proportional zum Betrags- quadrat des Strukturfaktors

I(h,k,l)∝

|Fhkl|eiφhkl

2=|Fhkl|2.

Ohne die Phase φ ist lediglich eine unvollständige Information der Röntgenreexe vor- handen und die Fouriertransformation nicht direkt ausführbar. Diese Schwierigkeit ist als Phasenproblem bekannt.

Wie wichtig die Phaseninformation ist, soll in Abbildung 1.2 illustriert werden. Hier wurden zwei Graustufenbilder8fouriertransformiert und die Ergebnisse jeweils in Phasen und Intensitäten aufgeteilt. Aus den Phasen des Gesichts und den Intensitäten des Hauses wurde ein neues Feld von komplexen Zahlen erstellt. Seine Rücktransformation ergab ein synthetisches Bild im ursprünglichen Grauskalaraum. In dem Ergebnis ist, wenn auch etwas weniger deutlich als im Orginal, das Gesicht jedoch nicht das Haus zu identizieren.

Methoden zur Lösung

Um die Phasen zu bestimmen, können verschiedene Methoden eingesetzt werden. Die zuerst entwickelte ist das so genannte Multiple Isomorphous Replacement (mir)9. Sie soll etwas ausführlicher erklärt werden. Kurz angerissen werden darauf die Anomale Disper- sion und das Molecular Replacement. Die einzelnen Methoden schlieÿen sich nicht aus, sondern werden in der Röntgenkristallographie erfolgreich kombiniert.

Multiple Isomorphous Replacement. In der mir wird versucht, Schweratome (z.B.

Pb, Hg, U) in den Proteinkristall einzubringen, ohne die Elementarzelle und makromole- kulare Struktur zu verändern10. Dies kann durch Eintauchen des Kristalls in eine Lösung, die die Schweratome enthält, erreicht werden. Die Schweratome können so in den Kristall diundieren. Interpretierbare Röntgenreexe gibt es natürlich nur, wenn sich die Schwera- tome immer an den gleichen Stellen jedes Proteins im Kristall anlagern. So hält sich zum Beispiel Pb2+bevorzugt bei Cysteinen auf. Sind die Schweratome in den Kristall gewan- dert, so können erneut Beugungsdaten aufgenommen werden, und diese mit denen des ursprünglichen Proteins verglichen werden. Beide Beugungsbilder weisen, wenn sich die Geometrie der Elementarzelle nicht verändert hat, das gleiche Muster, jedoch vereinzelt abweichende Intensitäten auf. Auf Grund der additiven Form der diskreten Fouriertrans- formation lassen sich Strukturfaktoren für alle Miller-Indizes leicht zerlegen:

FPH =FP+FH, (1.2)

wobei FPH, FP und FH die Strukturfaktoren des Proteins mit gebundem Schweratom, ohne gebundes Schweratom bzw. nur des Schweratoms sind. Da die Strukturfaktoren im Allgemeinen komplexe Zahlen sind, gilt die Beziehung (1.2) nicht in gleichem Maÿe für

8 Ein solches Bild kann als eine Abbildung von zwei Pixelkoordinaten in eine Graustufenskala ver- standen werden.

9 zu deutsch etwa: mehrfacher isomorpher Ersatz 10 daher die Bezeichnung isomorph

(12)

Bild 1.2: Exemplarische Darstellung der Bedeutung der Phasen

(13)

1.2 Röntgenkristallographie von Proteinen 7

die Amplituden. Das Problem lässt sich gut in der so genannten Harker-Konstruktion lösen. Betrachten wir zunächst den Fall, dass FPH, FP und FH bekannt sind. Gleichung (1.2) ist in der komplexen Zahlenebene in Grak 1.3 a dargestellt. Alle komplexen Zahlen, die auf dem gleichen Kreis liegen, haben die gleiche Amplitude. Auf den Fall gemessener Intensitäten und unbekannter Phasen übertragen wissen wir nur, dass ein bestimmter Strukturfaktor auf einem Kreis in der komplexen Zahlenebene liegt, nicht aber, in welche Richtung er zeigt. Wäre uns nur FH nicht aber FP und FPH vollständig mit Phase bekannt, so könnten wir zwei Lösungen von FP = FPH −FH erhalten, indem wir den zu FPH gehörigen Kreis um−FH verschieben und die Schnittpunkte mit dem FP-Kreis betrachten (siehe Grak 1.3 b). Um nun noch auf eine Lösung einzuschränken, muss ein weiteres Beugungsbild mit einem Schweratom an anderer Stelle aufgenommen werden.

Bei Anwendung der gleichen Routine ergibt sich, wie in Abbildung 1.3 c dargestellt, ein Schnittpunkt der drei Kreise.

Die zuvor besprochenen Schritte beruhen auf der Annahme, dass für jeden Reex FH bekannt ist. Es scheint, als sei die Bestimmung der Phasen lediglich von dem Protein auf die Schweratome im Derivat verschoben worden. Die Lösung dieses Problems ist aber auf Grund seiner einfacheren Form bewältigbar. Hierfür betrachtet man zunächst die Dierenz der Beugungsamplituden von Schweratomderivat und Protein |∆F|2 = (|FPH| − |FP|)2. Diese Intensitätsverteilung gibt Aufschluss über die Streuung, die nur die Schweratome verursachen11. Ein erfolgreicher Lösungsweg verwendet die so genannte Pattersonfunktion:

P(u,v,w) = 1 V

X

h,k,l

|Fhkl|2e−2πi(hu+kv+lw).

Es handelt sich bei der Pattersonfunktion um eine Fouriersummation der Betragsquadrate der Strukturfaktoren, also ohne Berücksichtigung ihrer Phasen. Die Ursprungsvektoren auf die Maxima der Pattersonfunktion entsprechen Vektoren zwischen Atomen12. Für eine kleine Anzahl an Schweratomen pro Elementarzelle lassen sich durch Betrachtung der Patterson- funktion die Koordinaten der Schweratome konstruieren. Je mehr Schweratomen betrachtet werden, desto ähnlicher werden die Vektoren zwischen ihnen. Dies kann dazu führen, dass die Maxima der Pattersonfunktion immer mehr verschmieren und es letztendlich nicht mehr möglich ist, die Maxima ausndig zu machen. Da die Anzahl der Vektoren zwischen den Atomen quadratisch mit der Anzahl der Atome steigt, kann diese Situation schnell erreicht werden. Zu genauerer Betrachtung sei z.B. auf [3] verwiesen.

Ist es gelungen, auf diesem oder anderem Wege die vollständigen Strukturfaktoren für die Schweratome zu lösen, lassen sich nach der oben beschriebenen Konstruktion auch die Phasen der Proteinatome bestimmen.

11 Es handelt sich hierbei um ein hypothetisches Streumuster, denn es ist ja nicht möglich die Schweratome ohne das Protein an den gleichen Stellen zu halten. Durch die additive Form der Strukturfaktoren ist jedoch auch dieses Streubild sinnvoll.

12 Im Gegensatz dazu sind Ursprungsvektoren auf die Maxima der Elektronendichte die Ortsvektoren von Atomen.

(14)

a: Ausgangssituation b: Verschiebung um−FH

c: Lösung durch zweites Schweratomderivat Bild 1.3: Schematische Darstellung der Harker-Konstruktion

(15)

1.2 Röntgenkristallographie von Proteinen 9

Anomale Dispersion. In der Anomalen Dispersion nutzt man aus, dass Schwermetalle Röntgenstrahlung absorbieren können. Ist die Wellenlänge des verwendeten Strahls nah an einer Absorptionskante, wird ein Teil der Stahlung absorbiert und mit veränderter Phase reemittiert. Die Wellenlänge der Röntgenstrahlung kann eingestellt werden, um so die Störung des Systems zu variieren13. Durch die veränderte Phase geht die Gleichheit des so genannten Friedel-Paares verloren.

Da die Elektronendichte reell ist, giltρ=ρ. Die Fouriertransformation beider Seiten zeigt, wenn man die Strukturfaktoren wie in Gleichung (1.1) in Polarkoordinaten schreibt:

|Fhkl|=˛

˛Fhkl˛

˛, φhkl=−φhkl.

Das bedeutet, dass die gemessene Intensität von(h k l)gleich der Intensität von(h k l)ist.

Dies ist das Friedel'sche Gesetz. Zwei Intensitäten, die punktsymmetrisch zum Ursprung des reziproken Raumes liegen, werden als Friedel-Paar bezeichnet. Bei anomaler Streuung geht diese Symmetrie verloren.

Aus der Dierenz einer Messung bei normaler und einer Messung bei anomaler Streuung kann man wie in der mir die Positionen der Schweratome bestimmen. Die Lösung der Phasen aller Strukturfaktoren verläuft ab hier wie bei der mir.

Molecular Replacement. In dieser Methode werden die Phasen schon bekannter Strukturen als erste Schätzung verwendet. Zusammen mit den gemessenen Intensitä- ten lässt sich die daraus berechnete Elektronendichte iterativ verfeinern. Im Falle eines nur zugefügten kleinen Liganden wird sich die Elementarzelle nicht ändern, es liegt der isomorphe Fall vor. Die Methode funktioniert jedoch auch in der nicht-isomorphen Si- tuation. Hier wird in sechs Dimensionen14 nach der Orientierung des neuen Proteins im Vergleich zum bekannten gesucht. Die am besten passende Ausrichtung liefert dann die Phasen für den weiteren Prozess. Im Zuge der zunehmenden Anzahl an Strukturen in den Proteindatenbanken wird diese Methode immer erfolgreicher.

1.2.3 Interpretation der Elektronendichte

Ist es nach allen Anstrengungen gelungen, die Elektronendichte zu bestimmen, und ist diese weit genug verfeinert, kommt nun der nächste Schritt: die Gewinnung der Atomko- ordinaten aus der Elektronendichte. Die Elektronendichte wird oft als dreidimensionales Analogon zur Höhenlinie dargestellt. Etwas vorgreifend ist in Abbildung 1.4 unten ein kleiner Ausschnitt einer solchen Repräsentation zu sehen. Hier wurde ein Wert für die Elektronendichte als Mindestwert gewählt. Orte mit einer höheren Elektronendichte wer- den von denen niedrigerer Dichte durch ein Netz abgetrennt. Hier setzt die molekulare Darstellung des Modells ein. Der Kristallograph sucht in der Abbildung nach Sekundär- strukturen wie α-Helices und β-Faltblättern und ordnet die Rückgratatome an. Es ist hilfreich, die Seitenketten groÿer hydrophober Aminosäuren aufzuspüren, um so über die Kenntnis der Aminosäuresequenz auch die anderen Seitenketten zuzuordnen.

13 Strahlung der benötigten Linienschärfe erhält man am Synchrotron.

14 drei Dimensionen für die Translation und drei für die Rotation

(16)

1.2.4 Verfeinerung und Validierung der Struktur

Der Verfeinerungsprozess. Ist es gelungen, ein erstes Modell zu erstellen, so kann dies in einem Verfeinerungsverfahren (englisch: renement) verbessert werden. Es han- delt sich hierbei um einen iterativen Prozess, in dem eine Zielfunktion optimiert wird.

Die in diesem Fit anzupassenden Gröÿen sind in erster Linie die Koordinaten (x,y,z) der einzelnen Atome. Die Amplituden der Beugungsdaten und die Phasen einer ersten berechneten Struktur erzeugen durch Fouriertransformation eine Elektronendichte. Die- se ermöglicht den Bau einer verbesserten Struktur, die wiederum neue Phasen bestimmt (siehe Grak 1.4). Als Zielfunktion wird oft eine quadratische Abweichung verwendet:

Φ= X

h,k,l

whkl(|Fobs| − |Fcalc|)2hkl.

Hier sind Fobs die gemessenen und Fcalc die von der Struktur berechneten Strukturfakto- ren. Von beiden Gröÿen gehen nur die Beträge ein, sodass nur messbare Werte verwendet werden. Die Summation wird mit Faktoren whkl gewichtet, die z.B. invers quadratisch zu den Fehlern der Amplituden |Fobs| sein können. Zusätzlich gehen heuristische Informa- tionen wie Bindungslängen und -winkel in die Zielfunktion ein.

Dynamik im Kristall. Auf Grund des hohen Kristallwasseranteils können Proteine im Kristall gröÿere thermische Bewegungen machen, als es bei gewöhnlichen Kristallen kleiner Moleküle der Fall ist. Die Messung der Röntgenreexe ndet nicht nur an einem Proteinmolekül, sondern an allen Proteinen im ganzen Kristall statt. Die Röntgenreex- aufnahme ist also eine Mittelung über all diese Proteinstrukturen. Da einzelnen Proteine nicht alle genau die gleiche Struktur besitzen, liegt eine Unordnung vor. Diese wird als statische Unordnung bezeichnet. Auch dauert eine Messung eine gewisse Zeit an, die ei- nige Gröÿenordnungen über der Zeitskala der inneren Proteinbewegungen liegt. So wird während der Aufnahme über die zeitliche Veränderungen des Proteins gemittelt. Diese Unordnung bezeichnet man als dynamische Unordnung. Atome an den Enden der Seiten- ketten zeigen meist eine gröÿere Mobilität als die Hauptkettenatome. Da die Mobilität in Form von Unordnung die gemessenen Röntgenreexe beeinusst, ist es sinnvoll, die Beweglichkeit neben den Koordinaten als weiteren Fitparameter einzuführen. Diese Grö- ÿe ist der so genannte isotrope B-Faktor. Er ist gegeben durch die mittlere quadratische Abweichunghµ2ieines Atoms von seiner Ruheposition

Biso = 8π2h(rrr− hrrri)2i= 8π22i.

Da die Koordinaten der Atome in jeder einzelnen Elementarzelle zu jeder Zeit der Mes- sung nicht zugänglich sind, stellt Biso einen unabhängigen Parameter des Fits dar. Man kann sich den B-Faktor auch als Radius einer Kugel vorstellen, in dem sich das Atom die meiste Zeit aufhält. Einerseits erhöht das Einbinden des B-Faktors die Wahrscheinlich- keit, die Daten gut zu tten, da es das Proteinmodell realistischer macht. Andererseits bekommt man durch die B-Faktoren der Atome auch Einblick in die Dynamik des Pro- teins.

Je besser die Auösung ist, umso besser lässt sich erkennen, dass die Umgebung, in

(17)

1.2 Röntgenkristallographie von Proteinen 11

Bild 1.4: Schematische Darstellung der Strukturverfeinerung

der sich die Atome aufhalten, meist nicht isotrop ist. Zur besseren Beschreibung wird hier anstelle der Kugel ein Ellipsoid als Umgebung verwendet. Die hierfür nötigen sechs Parameter werden als anisotrope B-Faktoren bezeichnet. Zur genaueren Beschreibung der vielfältigen Nomenklaturen für anisotrope B-Faktoren sei auf [25] verwiesen.

Validierung. Um zu bewerten, wie gut eine ermittelte Struktur die experimentellen Reexe beschreibt, wird der R-Faktor bestimmt. Dabei werden die gemessenen |Fobs|

(18)

Tabelle 1.2: Observablen (Röntgenreexe) und Parameter in Abhängigkeit von der Auösung für typische Proteinsysteme [21]

dmin in Å Parameter Observablen-Parameter-Verhältnis

3,0 x,y,z 0,6

2,5 x,y,z,(Biso) 1,3

2,0 x,y,z,Biso 2,0

1,5 x,y,z,Biso 4,5

1,1 x,y,z,Uij 5,2

0,9 x,y,z,U ij 9,6

Reexe mit den berechneten|Fcalc| verglichen.

R=

P||Fobs| − |Fcalc||

P|Fobs| . (1.3)

Bei perfekter Übereinstimmung von berechneten und gemessenen Intensitäten nimmt der R-Faktor den Wert null an. Die Verwendung eines erweiterten Parametersatzes kann den R-Faktor durch besseres Fitten senken.

Überanpassung und Kreuzvalidierung. Da die Auösung für Proteinstrukturen im Allgemeinen deutlich schlechter ist als bei gewöhnlichen Kristallen, ist die Anzahl der gemessenen Reexe und die Anzahl der verwendeten Parameter bei der Verfeinerung leicht in der gleichen Gröÿenordnung. Es droht Überanpassung15. In Tabelle 1.2 ist für einen typischen Proteinkristall das Verhältnis von Observablen zu Fitparametern in Ab- hängigkeit von der Auösung gegeben. Höhere Auösungen erlauben die Verwendung weiterer Parameter. In der Anwendung sind die Parameter nicht ganz frei, sondern sind durch geometrische Bedingungen wie Bindungslängen und -winkel eingeschränkt. Ein häug angwandtes Verfahren zur Verhinderung von Überanpassung ist die Kreuzvalidie- rung mit dem freien R-Faktor[2]. Hierzu werden fünf bis zehn Prozent der Daten zufällig ausgewählt und von der Berechnung der Struktur ausgenommen. Der freie R-Faktor be- rechnet sich nach der gleichen Formel wie der R-Faktor (Gleichung (1.3)), jedoch laufen die Summen nur über die nicht für das Renement verwendeten Datenpunkte. Es wird also getestet, wie gut die aus 90% bis 95% der Daten bestimmte Struktur den Rest vor- hersagt. In Grak 1.5 sei dies verdeutlicht. Aus dem Datensatz (zehn Punkte) wurden zehn Prozent (oranger Punkt) ausgenommen und der Rest (schwarze Punkte) für den Fit verwendet. Die rote Gerade ist ein linearer Fit und die grüne Kurve ein Polynom fünften Gerades. Die grüne Kurve beschreibt zwar die schwarzen Punkte besser, aber der Test mit dem orangen Punkt zeigt, dass die Gerade die ausgelassenen Daten (oranger Punkt) besser beschreibt. Auf die Röntgenkristallographie übertragen hieÿe das: Die grü- ne Struktur hat zwar einen niedrigeren R-Faktor, aber einen hohen freien R-Faktor. Sie ist überangepasst. Die rote Struktur ist in diesem Sinne geeigneter.

15 englisch: overtting

(19)

1.3 Translation-Libration-Screw Renement 13

Bild 1.5: Illustration zur Nützlichkeit des freien R-Faktors

Das Strukturmodell. An diesem Punkt sei darauf hingewiesen, dass das, was bisher als Proteinstruktur bezeichnet wurde, ein Modell der Proteinstruktur ist. Ebenso wie in Grak 1.5 die verschiedenen Linien verschiedene Modelle der Daten darstellen. Wie bei jedem Modell ist es auch bei Proteinstrukturen der Röntgenkristallographie wichtig, nach dem Gültigkeitsbereich zu fragen und die Qualität des Modells zu bewerten. Für letzteres stellt der freie R-Faktor eine gute Lösung dar. In dieser Arbeit wird weiterhin von einer Proteinstruktur gesprochen werden, wobei sich der Leser jedoch im Klaren sein sollte, dass von einem an die experimentellen Daten angepassten Proteinstrukturmodell die Rede ist.

1.3 Translation-Libration-Screw Renement

1.3.1 Einleitung

Isotrope B-Faktoren sind die einfachste Möglichkeit, die statische und dynamische Un- ordnung der Atome im Kristall als Parameter in das Renement einzubeziehen. Die Verwendung anisotroper B-Faktoren (adp)16 stellt hier eine Erweiterung dar. Isotrope B-Faktoren werden durch einen und adp werden durch sechs Parameter beschrieben. Zu- sammen mit den drei Koordinaten werden also pro Atom beim isotropen Renement vier und beim anisotropen Renement neun Parameter für den Fit verwendet. Dadurch, dass

16 Anisotrope B-Faktoren werden in der Literatur auch als anisotropic displacement parameters (adp, zu deutsch: anisotrope Verschiebungsparameter) bezeichnet.

(20)

der Parametersatz mehr als verdoppelt wird, kommt es bei Proteinen mittlerer Auösung (ungefähr von 1,5Å bis 2,5Å) oft zu einer Überanpassung. Ein Ausweg ist es, nicht jedes Atom mit unabhängigen adp zu verfeinern, sondern für Teile des Proteins gemeinsam denierte adp zu verwenden.

Gedankenbeispiel Der Leser stelle sich Atome auf den Ecken eines Würfels ange- ordnet vor. Dieser Würfel führe kleine Rotationsschwingugen um eine Drehachse durch.

Betrachtet man die Orte der einzelnen Atome, die diese im Laufe der Zeit einnehmen, so liegen diese auf kurzen Kreislinien, die mit gröÿerem Abstand zur Drehachse länger werden. Hier lieÿen sich gut anisotrope B-Faktoren verwenden, ohne sie für jedes Atom einzeln zu denieren: Der Winkel, um den der Würfel schwingt und die Lage der Ro- tationsachse genügen, um an jedem Ort anzugeben, wie groÿ die Auslenkung ist, bzw.

wie der anisotrope B-Faktor zu wählen ist. Denn die Bewegung des gesamten Systems deniert den funktionalen Zusammenhang, in dem die einzelnen anisotropen B-Faktoren zueinander stehen.

1.3.2 Entwicklung

Historisch wurden nicht gemeinsame adp für Teile eines Biomoleküls im Renement be- trachtet, sondern das Problem von der anderen Seite angegangen: Bei einem gegebenen Molekül mit adp lassen sich die Zusammenhänge der adp untereinander untersuchen. Der erste Ansatz, die Korellationen der adp durch Bewegungen von Festkörpern zu beschrei- ben, wurde von Cruickshank entwickelt [4]. Er beschrieb die Bewegungen der Atome einer Gruppe durch zwei symmetrische3×3Tensoren TTT und LLL. TTT ist der Anteil der Transla- tionsschwingungen des Massenschwerpunktes und LLL der Anteil der Winkelschwingungen oder Librationen17der Gruppe.

Dieser Ansatz setzt jedoch voraus, dass ein zuvor bestimmtes Symmetriezentrum der Librationsbewegung vorliegt. Ist dies nicht der Fall, ist die Beschreibung nicht mehr korrekt. In ihrer tls-Beschreibung korrigierten Shoemaker und Trueblood diese Metho- de durch Hinzunahme eines weiteren Tensors SSS, der Verdrillungsbewegungen18 um drei senkrecht aufeinander stehende, sich nicht schneidende Achsen beschreibt [24]. Diese Be- schreibung ist unabhängig vom gewählten Ursprung.

Im Renement kann eine tls-Beschreibung umgekehrt dazu verwendet werden, Atom- verbänden des Proteins gemeinsame adp zuzuordnen. Gerade bei Proteinstrukturen mitt- lerer Auösung kann ein tls-Renement durch geringe Erweiterung der Parameterzahl die Situtation im Kristall realistischer beschreiben und so ein besseres Modell des Prote- ins im Kristall erstellen.

17 daher die Abkürzung LLL 18 englisch: screw; daher SSS

(21)

1.3 Translation-Libration-Screw Renement 15

1.3.3 Rechnungen zu tls

Die innitesimale Verschiebung uuu eines Atoms in einem Molekül, das einer Verschiebung und Drehung unterliegt, wird beschrieben durch

uuu=ttt+λλλ×rrr.

Hierbei ist ttt der Translationsvektor. Das Molekül wird um die zuλλλparallele, durch den Ursprung verlaufende Achse um den Winkelλ=|λλλ|rotiert. Das dyadische Produkt von uuu mit sich selbst gibt

uuuuuuT=ttttttT+tttλλλT×rrrT−rrr×λλλtttT−rrr×λλλλλλT×rrrT.

Mittelt man diesen Ausdruck über die Zeit und alle äquivalenten Punkte des Kristallgit- ters, ergibt sich

U

UU ≡ huuuuuuTi=TTT+SSST×rrrT−rrr×SSS−rrr×LLL×rrrT,

wobei TTT ≡ httttttTi, LLL≡ hλλλλλλTiund SSS ≡ hλλλtttTibedeuten19. UUU ist die mittlere quadratische Verschiebung eines Atomes bei rrr und kann so als adp identiziert werden. TTT und LLL sind per denitionem symmetrische Tensoren, werden also durch sechs unabhängige Gröÿen beschrieben, wohingegen SSS im Allgemeinen asymetrisch ist. Die Spur von SSS ist nicht durch UUU xiert, d.h. SSS wird nur durch acht unabhängige Parameter beschrieben. Jede tls-Gruppe wird daher durch 20 Parameter beschrieben. Ab einer Gruppegröÿe von drei Atomen verwendet das tls-Renement weniger Parameter (20) als ein Renement mit individuellen adp (27).

1.3.4 Anwendungen von tls

In Shoemakers und Truebloods Arbeit wurden tls-Tensoren verwendet, um Festkörper- bewegungen an schon bestimmte adp anzupassen [24]. Auf diese Weise dynamische Do- mänen aus den Korrelationen der adp zu erhalten, ist eine häug verwendete Mehtode [9, 10, 29]. Dabei werden die Tensoren TTT , LLL und SSS durch die Methode der kleinsten Qua- drate an die adp angepasst. Lokale Abweichung der im Renement bestimmten adp von den durch tls berechneten adp können Aufschluss über kleinere interne Bewegugen geben.

Das erste Renement, das tls-Parameter im Fit verwendet, wurde an Röntgenree- xen der Nukleinsäuren rns und dns durchgeführt [16, 15]. In der Arbeit wurden sieben verschiedene Unterteilungen der Nukleotide in tls-Gruppen im Renement getestet und daraus zusätzlich Informationen über die Dynamik innerhalb der Nukleotide gewonnen.

Heutzutage wird es mehr und mehr zur Routine, das tls-Renement bei der Struk- turbestimmung von Biomolekülen zu verwenden, wobei die Einteilung in Gruppen oft auf Heuristik oder Intuition beruht. Weitere ausführlich beschriebene tls-Renements

19 Das Kreuzprodukt bei Matrizen ist hier so zu verstehen: LLL×rrrTist eine Matrix, die in der iten Zeile das Kreuzprodukt der iten Zeile von LLL mit rrrTenthält.

(22)

nden sich in [30]. In dieser Arbeit wurden die tls-Renements mit der Renementsoft- ware refmac durchgeführt [30].

1.3.5 Gruppendenition

Ein tls-Renement kann zur Verbesserung der Strukturinformation, die aus der Röntgen- kristallographie erhalten wurde, beitragen. Grundlegend hierfür ist eine sinnvolle Eintei- lung des Proteins in Atomverbände, die sich wie Festkörper verhalten. Diese Information kann nicht a priori aus der Proteinstruktur gewonnen werden. Nötige Zusatzkenntnisse können aus verschiedenen Quellen stammen.

Die Kenntnis von der Stabilität der Sekundärstrukturelemente kann z.B. dazu benutzt werden, jede α-Helix und jedesβ-Faltblatt zu jeweils einer Gruppe zusammenzufassen.

Jedoch können jene einerseits so miteinander verbunden sein, dass es sinnvoll wäre, sie nicht getrennt zu betrachten, sondern zusammenzufassen. Andererseits weisen lange Heli- ces und groÿe Faltblätter eine interne Beweglichkeit auf, sodass es das Renement verbes- sern würde, auch diese Helices und Faltblätter in mehrere tls-Gruppen zu unterteilen.

Es ist sogar möglich, noch kleinere Gruppen zu wählen, und z.B. jeder Aminosäure ei- ne tls-Gruppe zuzuordnen. Hier droht jedoch schnell die Gefahr einer Überanpassung.

Bei gröÿeren Proteinen, die aus mehreren Molekülketten bestehen, kann es von Vorteil sein, jeder Kette eine Gruppe zuzuordnen. Auch hier kann die Dynamik des Proteins auf kleineren Skalen innerhalb einer Kette oder auf gröÿeren Maÿstäben zwischen Verbänden von Molekülketten ablaufen. Alle diese Einteilungen geben nicht sicher eine Aussage über die Dynamik des Proteins im Kristall.

Eine Betrachtung der Bewegungen eines Proteins verspricht eine bessere Einteilung des Proteins in tls-Gruppen, da die B-Faktoren eine Aussage über die Unordnung und Dynamik machen. Eine Molekulardynamik-Simulation (md) hat sich in vielen Studien als gutes Instrument zur Untersuchung der Proteindynamik gezeigt (siehe z.B. [27, 26, 6, 8]).

Selbst auf modernen Computern stellt jedoch die benötigte Rechenzeit ein Problem dar.

Die energetischen Barrieren zwischen verschiedenen Konformationen eines Proteins sind oft so groÿ, dass es unwahrscheinlich ist, sie in kurzen Simulationen zu überwinden.

Es sind jedoch diese Konformationen und die Bewegungen zwischen ihnen, die für die Unordnung der Proteine im Kristall sorgen. Die in dieser Arbeit benutzte Alternative zur md ist concoord [7]. concoord macht es möglich, dynamische Aussagen über ein Protein zu treen, ohne gleichzeitig den Zeitaufwand einer md-Simulation zu haben.

In dieser Arbeit wird eine Methode entwickelt, die auf concoord-Simulationen ba- sierend sinnvolle Gruppen für ein tls-Renement vorhersagt.

(23)

2 Entwicklung der Methode

In diesem Kapitel wird die entwickelte Methode vorgestellt. Sie nutzt die Flexibilitätsvor- hersagen eines concoord-Ensembles um die Rotationen einzelner Aminosäuren mitein- ander zu vergleichen. Aminosäuren, die korrelierte Rotationen zeigen, werden in Gruppen zusammengefasst. Diese Gruppen können im tls-Renement verwendet werden, um bes- sere Strukturmodelle von Proteinen zu erzeugen.

Die Methode gliedert sich in folgende Schritte (siehe Abbildung 2.1):

1. Generierung eines Stukturensembles mit concoord:

Erzeugung eines Ensembles, das die dynamischen Eigenschaften eines Proteins beschreibt

2. Analyse der Bewegungen:

Untersuchung der Rotationseigenschaften der einzelnen Aminosäuren bei Über- gängen zwischen einzelnen Ensemblestrukturen

3. Distanzmaÿ:

Ermittlung von paarweisen Distanzen zwischen den Rotationsvektoren und dar- aus Bestimmung eines Distanzmaÿes im Bezug auf das ganze Ensemble

4. Clustering:

Gruppierung der Aminosäuren auf dem Distanzmaÿ basierend 5. tls-Renement:

Verfeinerung der Proteinstruktur mit zusätzlichen tls-Parametern für jede im vorherigen Schritt bestimmte Gruppe

2.1 Generierung des Ensembles mit concoord

Die grundlegende Idee von concoord ist folgende: Die unterschiedlichen Konformatio- nen eines Proteins weisen ähnliche Wechselwirkungen zwischen den Atomen auf. Sind diese Wechselwirkungen bekannt, kann man umgekehrt nach Konformationen suchen, die diese Wechselwirkungen erfüllen. Diese Wechselwirkungen lassen sich durch Abstän- de, Winkel und Diederwinkel charakterisieren. So wird bei concoord durch Vorgabe von wenigen einzuhaltenden interatomaren Distanzen ein Strukturensemble erzeugt, das ein ähnliches Kongurationsraumvolumen1 abdeckt wie eine lange md-Simulation2.

1 Bei N Atomen lässt sich jede Struktur durch einen Punkt im3N -dimensionalen Kongurations- raum darstellen.

2 Ein concoord-Ensemble gibt im Allgemeinen nicht die Dichte im Kongurationsraum korrekt wieder.

(24)

Bild 2.1: Schematische Darstellung der Arbeitsschritte

Zu einer gegebenen Proteinstruktur generiert concoord zufällige Proteinstrukturen, die vorgegebene Unter- und Obergrenzen der Atomabstände erfüllen. Diese Grenzen ba- sieren auf Messungen an experimentellen Strukturen und der Art der interatomaren Wechselwirkungen. Im ersten Schritt werden die gültigen Distanzbereiche bestimmt.

Hier werden neben den kovalent gebundenen Paaren zum Beispiel auch alle Atompaare eines Ringes und die von den Diederwinkelnφund ψabhängigen Atomabstände betrachtet. Zu- sammen mit den weiteren Klassen von Interaktionen machen diese nur etwa 0,5% bis 3,5%

aller Distanzen eines Proteins aus.

Im zweiten Schritt werden die Atome des Proteins auf zufällige Positionen gesetzt. Die Atome werden anschlieÿend in zufälliger Reihenfolge so verschoben, dass die Unter- und Obergrenzen der Atomabstände erfüllt sind. Sind alle Kriterien erfüllt, wird die Struktur akzeptiert und gespeichert. Der zweite Schritt wird wiederholt bis die gewünschte Anzahl an Strukturen erzeugt wurde.

(25)

2.2 Analyse der Bewegungen 19 Tabelle 2.1: Bezeichnung einiger Atomnamen eines Proteins in einer pdb-Datei

Atom Kürzel pdb-Kürzel

α-Kohlensto Cα ca

β-Kohlensto Cβ cb

γ-Kohlensto Cγ cg

δ-Kohlensto Cδ1 cd1

Sticksto der Aminogruppe N n

Kohlensto der Carboxylgruppe C c

Sauersto der Carboxylgruppe O o

Es hat sich gezeigt, dass die generierten Strukturen ein ähnliches Volumen des Kon- gurationsraumes abdecken, wie die Strukturen einer langen md-Simulation [7]. Man ist insbesondere in der Lage aus dem concoord-Ensemble die groÿen Konformationsände- rungen eines Proteins abzulesen. concoord beschreibt eventuell nicht alle Aspekte der Proteindynamik in ihren Feinheiten. Auch besteht zwischen den Strukturen eines con- coord-Ensembles kein zeitlicher Zusammenhang, da jede erzeugte Struktur mit einem zufälligen Satz an Koordinaten beginnt. Doch gerade da liegt der Vorteil: Energiebar- rieren müssen nicht überwunden werden, da die nächste ganz neu generierte Struktur eventuell hinter der Barriere liegt.

2.2 Analyse der Bewegungen

Die Veränderungen, die nötig sind, um von einer Struktur des Ensembles zur nächsten zu gelangen, sind Bewegungen wie sie im Protein auf unterschiedlichen Zeitskalen stattnden. Für jede dieser Bewegungen wird untersucht, wie ein Teil jeder Aminosäure rotiert.

Die Struktur. Abbildung 2.23stellt den in dieser Methode verwendeten Teil der Struk- tur einer Aminosäure (hier Leucin) dar. Die Atome sind mit Kugeln und die kovalenten Bindungen zwischen ihnen mit Stäben symbolisiert. Die Atomnamen sind so, wie sie in einer pdb-Datei4verwendet werden (siehe Tabelle 2.1). Die Hauptkette (siehe Einleitung) ist zu erkennen, wenn man den Atomen ca, c, n und o folgt. Die Wasserstoatome sind hier nicht gezeigt, da sie wie in den meisten Fällen nicht von der Röntgenkristallo- graphie aufgelöst sind.

Das Dreibein. Die Struktur, die das ca mit den es umgebenden c, n und cb bildet, ist von besonderer Stabilität. Dieses Dreibein (siehe Abbildung 2.3) ist bei allen Amino- säuren sehr ähnlich. Ausgenommen ist hier die Aminosäure Glycin, die als einzige keine Seitenkette und folglich kein cb hat. Für weitere Teile dieser Methode ist es wichtig,

3 Wie alle Proteindarstellungen in dieser Arbeit ist auch diese Grak mit der open-source Software PyMol erstellt worden (http://pymol.sourceforge.net).

4 Hierbei handelt es sich um das Format, in dem die Proteine in der RCSB Protein Data Bank ge- speichert sind. Es enthält unter anderem die Namen der Atome und Residuen, deren Koordinaten und die B-Faktoren.

(26)

Bild 2.2: Stab-Kugel-Darstellung einer Aminosäure (Leucin) und Teile der Nachbarn in einem Protein

die Koordinaten eines Standarddreibeins zu kennen. Dafür wurden für alle Aminosäuren (auÿer Glycin) einer Proteinstruktur die Abstände zwischen den Atomen des Dreibeins gemessen. An die sich ergebenden Abstandsverteilungen für jedes einzelne Paar wurden Gaussverteilung angepasst. Aus den Maxima der Gaussverteilungen wurde mit Distan- ce Geometry (siehe Anhang a) eine Struktur erstellt, die den Abständen bestmöglich entspricht.

Das Vektorfeld. Um Aussagen über die Dynamik machen zu können, ist es nötig, aus dem Strukturensemble Bewegungen zu extrahieren. Dazu betrachten wir die Verschie- bungen der einzelnen Atome, die notwendig sind, um von der Referenzstruktur5 zu den einzelnen Strukturen des Ensembles zu gelangen. Diese Verschiebungen sind Bewegungen, wie sie auf unterschiedlichen Zeitskalen in einer md beobachtet werden können. Numme- riert man die einzelnen Strukturen und ordnet dabei der Referenzstruktur t = 0zu, so

5 Die Referenzstruktur ist die ursprüngliche Struktur, von der concoord die Distanzen bestimmt.

(27)

2.2 Analyse der Bewegungen 21

Bild 2.3: das Dreibein

erhält man für alle Strukturen ein Vektorfeld VVV ≡rrr(t)−rrr(0), t∈ {1,2, . . .}.

Im Folgenden werden die Rotationen, die von den Dreibeinen der einzelnen Aminosäuren ausgeführt werden, betrachtet. Zu Grunde liegt die Idee, dass Teile des Proteins, die gemeinsame Rotationen zeigen sich also korelliert bewegen einen guten Kandidaten für eine tls-Gruppe stellen. Für alle t ergibt sich so ein Vektorfeld, das auf seine Rotationen untersucht wird.

Der Rotationsvektor. Das zu betrachtende Vektorfeld ist also das Verschiebungs- vektorfeld der einzelnen Atome des Dreibeins. Um die Rotation zu bestimmen, sind die Ableitungen nach den Raumdimensionen nötig. Dieser Weg zur Bestimmung des Rota- tionsvektors ist dem Programm DynDom ([13, 12]) entlehnt. Auf Grund der diskreten Natur des Feldes sind auch diese Ableitungen nur diskret zu bilden. Als Ableitung wird hier die Veränderung der Dreibein-Atompositionen in Bezug auf die Änderung der Posi- tionen des ca verwendet. So lassen sich die räumlichen Ableitungen am Ort eines jeden ca angeben und daraus die Rotation bestimmen. Hier wird ausgenutzt, dass das Dreibein nicht planar ist, da es so drei unabhängige Komponenten der Rotation liefert. Die Indizes seien im Folgenden so gewählt:

ˆ k∈ {n,c,cb}bezeichne ein Dreibein-Atom, ca ausgenommen.

ˆ i∈ {x,y,z} bezeichne die Vektorkomponenten.

(28)

Die Änderung der i-ten Komponente des Verschiebungsvektorfeldes (im Folgenden VVV mit dem Komponenten Vi) bei Bewegung vom ca in Richtung eines der k Atome ist gegeben durch

kVi ≡Vi(rrrk)−Vi(rrrca)

=∂xVi·∆xk+∂yVi·∆yk+∂zVi·∆zk.

Hierbei wurde ∆kVi als vollständiges Dierential aufgefasst. ∆xk ≡ xk −xca, ∆yk ≡ yk−yca und∆zk ≡zk−zca sind die Komponenten der Koordinatenverschiebung. Alle Ableitungen der i-ten Komponente von VVV lassen sich in einer Matrizengleichung zusam- menfassen:

∆VVViii =∆∆∆·gradVi, wobei die Abkürzungen

∆VVViii =

nVi

cVi

cbVi

,

∆∆=

∆xn ∆yn ∆zn

∆xc ∆yc ∆zc

∆xcb ∆ycb ∆zcb

,

gradVi =

xVi

yVi

yVi

verwendet werden. Die Matrix ∆∆∆ wird aus der Referenzstruktur bestimmt. Für i ∈ {x,y,z} ergeben sich also drei Gleichungen, die alle nötigen Ableitungen enthalten:

gradVi =∆∆∆−1·∆VVViii.

Die Rotation von VVV berechnet sich dann nach

∇ ×VVV =

yVz −∂zVy

zVx−∂xVz

xVy−∂yVx

.

Auf diesem Wege ist es möglich, aus den Änderung der Koordinaten des Dreibeins von ei- ner Struktur zur nächsten die Rotationen der einzelnen Aminosäuren zu erhalten. Hierfür notwendig sind die Koordinaten der Atome ca, n, c und cb des Dreibeins. Die Amino- säure Glycin hat keine Seitenkette und folglich kein cb. Die fehlende Seitenkette gibt den Seitenketten benachbarter Aminosäuren Platz und so können Glycine eine wichtige Rolle in der Dynamik von Proteinen spielen.

(29)

2.3 Distanzmaÿ und Gruppierung der Bewegungen 23

Das cb des Glycins. Glycin hat das für die Berechnung der Rotationsvektoren nötige cb nicht. Durch die Bedeutung von Glycinen für die Dynamik im Protein ist es wichtig, Glycine nicht von dieser Betrachtung auszuschlieÿen. Der hier verwendete Lösungsansatz benutzt die Starrheit des Dreibeins, um bei Glycinen ein cb dahin zu setzen, wo es bei einer Aminosäure mit Seitenkette wäre. Hierzu wurden bei dem zuvor bestimmten Standarddreibein die Ortsvektoren des n, c und cb im Bezug zum ca betrachtet. Daraus ergeben sich die Skalarprodukte des Ortsvektors des cb mit dem Ortsvektor des n und des c und mit dem Kreuzprodukt der Ortsvektoren von n und c. Die Skalarprodukte lassen sich in Matrixform zusammenfassen zu:

 (rrrn)T (rrrc)T (rrrn×rrrc)T

·rrrcb=bbb, (2.1)

wobei bbb die Skalarprodukte enthält und rrrn, rrrc und rrrcb die Spaltenvektoren der drei- beininternen Koordinaten6von n ,c bzw. cb sind. Einsetzen der Dreibeinkoordinaten in (2.1) gibt den Vektor bbb. Für die Glycine im Strukturensemble, kann Gleichung (2.1) mit diesem bbb nach der hypothetischen cb-Position rrrcbaufgelöst werden.

Da rrrnund rrrcnicht linear abhängig sind, ist auch ihr Kreuzprodukt von ihnen linear unab- hängig. Dadurch hat die Matrix links in Gleichung (2.1) hat eine Determinante ungleich null und kann invertiert werden.

Durch die Verwendung des Kreuzproduktes in diesem Ansatz wird sichergestellt, dass das Glycin mit cb immer die gleiche Chiralität aufweist. Anderenfalls könnte es beim Vergleich zweier Glycine zu einem Sprung kommen, falls diese nicht die gleiche Händigkeit haben. Ist für jedes Glycin ein cb gesetzt, kann genau wie für die anderen Aminosäuren dann die Rotation von einer Struktur zur nächsten bestimmt werden.

2.3 Distanzmaÿ und Gruppierung der Bewegungen

Nun ist für jede Aminosäure in allen Strukturen des Ensembles ein Rotationsvektor bestimmt. Diese Information auszuwerten und zu klassizieren ist Teil dieses Schrittes.

Distanzmaÿ und Distance Geometry. Um Aussagen über die Ähnlichkeit bzw. Un- ähnlichkeit der Rotationsvektoren untereinander machen zu können, wurde ein Distanz- maÿ zwischen je zwei Vektoren bestimmt. Die Rotationsvektoren sind Elemente des R3. Auf diesem ist das Standardskalarprodukt

haaa,bbbi=

3

X

i=1

aibi

6 die n/c/cb-Koordinaten abzüglich der ca-Koordinaten

(30)

gegeben. Dieses induziert eine Norm

||aaa||=p haaa,aaai, die wiederum eine Metrik7

d(aaa,bbb) =||aaa−bbb||=p

haaa−bbb,aaa−bbbi

induziert. Aus einem Satz von N Rotationsvektoren8kann auf diesem Wege eine N×N - Matrix generiert werden. Das Element (i,j)dieser Matrix enthält den durch die Metrik bestimmten Abstand zwischen dem Rotationsvektor der i-ten Aminosäure und dem der j -ten Aminosäure. Aus diesem Distanzmaÿ können mit Distance Geometry (siehe An- hang a) Koordinaten von Punkten generiert werden, die den Abständen genügen. Diese Punkte haben nichts mehr mit den Koordinaten des Proteins zu tun. Der ihnen zu Grun- de liegende Raum ist auch nicht notwendigerweise dreidimensional. Jeder dieser Punkte repräsentiert eine Aminosäure und der Abstand zwischen zwei Punkten in diesem Raum ist gleich dem Abstand (durch das Distanzmaÿ bestimmt) der zugehörigen Rotationsvek- toren.

Damit Distance Geometry erfolgreich angewendet werden kann, ist es notwendig, dass die Einträge der Distanzmatrix wirklich die Axiome der Metrik erfüllen. Durch das hier denierte Abstandsmaÿ ist dies gesichert9. Hiermit hat Distance Geometry jedoch erst eine Menge von Punkten für die Verschiebung zu einer concoord-Struktur bestimmt.

Um nun die Information aller Ensemblestrukturen einzubeziehen, werden die Distanz- matrizen der einzelnen Verschiebungen einfach addiert. So ist die Distanz zwischen zwei Aminosäuren i und j gegeben durch die Metriken zwischen den zugehörigen Rotations- vektoren über alle Strukturen des Ensembles summiert:

d(i,j)≡

N

X

t=1

d(i,j;t).

Auch diese Denition ergibt wieder eine Metrik und Distance Geometry kann benutzt werden.

Hierzu sei der Beweis angeführt. Seien d1 und d2beliebige Metriken über dem selben Raum, dann ist auch d=d1+d2eine Metrik (über diesem Raum). Die Überprüfung der Metrikaxio- me ergibt:

d(a,b) =0d1(a,b) +d2(a,b) = 0d1(a,b) = 0d2(a,b) = 0a=b, a=bd1(a,b) = 0d2(a,b) = 0d1(a,b) +d2(a,b) = 0d(a,b) =0 d(a,b) =d1(a,b) +d2(a,b) =d1(b,a) +d2(b,a) =d(b,a),

d(a,b) =d1(a,b) +d2(a,b)d1(a,c) +d1(c,b) +d2(a,c) +d2(c,b) =d(a,c) +d(c,b). Dieses Ergebnis lässt sich auch auf beliebig viele aufzusummierende Metriken erweitern, indem ein Summand durch die Summe von zwei Summanden ersetzt wird.

7 Zu den Eigenschaften einer Metrik sei auf Anhang a verwiesen.

8 In unserem Fall ist N die Anzahl der Aminosäuren.

9 Hierzu sei auf auf einschlägige Mathematikbücher verwiesen, z.B. [1], S. 624

(31)

2.3 Distanzmaÿ und Gruppierung der Bewegungen 25

Aus der N×N -Distanzmatrix erzeugt Distance Geometry einen Satz von N Koordinaten, die möglichst gut die Abstände der Matrix erfüllen.

Es ist im Allgemeinen nicht gegeben, dass der Raum dieser Koordinaten niedrigdimensional ist. Eine exakte Übereinstimmung ist erst in(N1) Dimensionen zu erwarten. Distance Geometry sortiert die Koordinaten fallend nach ihrem Beitrag zu den Distanzen. So reicht es oft, die ersten Dimensionen der Punkte zu verwenden und die hohen Dimensionen wegzulassen.

Es hat sich hier gezeigt, dass die Verwendung der Koordinaten, deren zugehörige Eigenwerte der Gram'schen Matrix in Summe mindestens 80% der Summe aller Eigenwerte ausmacht, eine gute Genauigkeit liefert und dabei die Dimensionalität klein lässt10.

Gruppierung mit k-means. Um in diesem neuen Raum die Punkte zu gruppieren, d.h. ähnliche Rotationsvektoren zusammenzufassen, wurde das Clustering-Verfahren k- means [20] verwendet. Seine Arbeitsweise ist wie folgt. Man wählt eine Anzahl k an Clustern, in die man die Punktwolke einteilen will. Es werden in dem Raum k Punkte, die die Rolle von Cluster-Mittelpunkten spielen, zufällig generiert. Jeder Punkt der Da- tenmenge wird darauf dem Cluster zugeordnet, zu dessen Mittelpunkt er am nächsten ist. Im nächsten Schritt werden die Mittelpunkte auf die Positionen geschoben, die dem arithmetischen Mittel der einzelnen Cluster entsprechen. Nun werden die Datenpunkte erneut den nächsten Clustern zugeordnet usw. Das Verfahren wird solange fortgesetzt, bis sich die Zuordnung nicht mehr ändert. K-means ist ein schnelles Verfahren, das auf Grund der Mittelwertbildung zu sphärischen Clustern neigt. Andere Verfahren bevor- zugen z.B. eher längliche, zusammenhängende Gebilde, in denen jedes Element nah an mindestens einem anderen ist. Für die hier vorgestellte Arbeit sind jedoch möglichst kompakte Cluster besser geeignet und so ist k-means eine gute Wahl.

Ermitteln der besten Gruppierung. Im Gegensatz zu manchen komplexeren Algo- rithmen ist es beim k-means-Clustering nötig die gewünschte Anzahl an Clustern vorzuge- ben. Gesucht ist die Klassizierung, die im Endeekt ein gutes tls-Renement ergibt. In dieser Methode werden die Rotationsvektoren in unterschiedlich viele Cluster aufgeteilt (z.B. zwei bis acht). Mit diesen Gruppen wird ein tls-Renement durchgeführt. Die Be- trachtung des gewöhnlichen und freien R-Faktors der einzelnen Renements entscheidet dann, welche Aufteilung am sinnvollsten ist. Diese kann dann ein besseres Strukturmodell des Proteins im Kristall darstellen.

10 Gerade wenn die ermittelten Koordinaten visualisiert werden sollen, sind z.B. drei Dimensionen sehr viel dankbarer als zehn.

(32)
(33)

3 Anwendung der Methode

Zum Test der hier vorgestellten Methode wurden drei Systeme ausgewählt. Zunächst ein Lysozym, das aus einer Molekülkette besteht und bei dem bekannt ist, dass es eine Biegebewegung um die zentrale Bindungstasche vollführt. Das zweite System, eine Ribo- nuklease (Ribonuklease T1), besteht aus vier Molekülketten, die in recht loser Bindung miteinander sich nahezu unabhängig voneinander bewegen. Das dritte System liegt zwischen diesen zwei Extremen. Es ist eine aus zwei Ketten bestehende Oxidoredukta- se. Beide Ketten sind miteinander verhakt und beeinussen sich so maÿgeblich in ihrer Dynamik. Diese drei Systeme sollen beispielhaft die Funktionsweise, die Stärken und die Schwächen dieser Methode erläutern.

3.1 System eins: 2epe

Das System. Bei 2epe [22] handelt es sich um die 2.5Å Röntgenkristallographiestruk- tur eines Lysozyms des Hühnereiweiÿ. Lysozym zerstört bakterielle Zellwände, indem es Zuckerketten des Peptidoglucangerüsts dieser Wände zerschneidet. In Grak 3.1 ist die Cartoondarstellung von 2epe zu sehen.

Das Ensemble. Mit concoord wurde von 2epe ein Ensemble von 1000 Strukturen erzeugt. In Abbildung 3.2 ist ein Unterensemble von zehn Strukturen dargestellt. Es ist zu erkennen, dass die Schleifen (rot) eine stärkere Mobilität aufweisen als die anderen Sekundärstrukturelemente. Dennoch sind die Schleifen in ihrer Bewegung nicht ganz frei, sondern zeigen alle eine ähnliche Struktur.

Die Analyse. Die normierte Distanzmatrix der Rotationsvektoren für 2epe ist in Gra- k 3.3 zu sehen. Hat ein Element (i,j)den Wert eins, so sind die Aminosäuren i und j die im Rotationssinn am stärksten unkorrelierten Aminosäuren des Ensembles. Ist der Wert null, so zeigen i und j gleiches Rotationsverhalten. Hier lässt sich erkennen, dass die Rotationsvektoren der Residuen von eins bis ca. 40 und von ca. 80 bis 129 gut kor- reliert sind. Der Block dazwischen weist eine kleine Lücke um die 56. Residue auf. Zur Veranschaulichung sind in Abbildung 3.4 einzelne Bereiche des Proteins anhand dieser Blöcke eingefärbt. Der grüne und der gelbe Teil könnten im Blick auf die Distanzmatrix zusammengenommen werden. Der blaue Bereich wird von einer kleinen Schleife (rot), die in Kontakt zum grünen und gelben Bereich steht, unterbrochen. Aus dieser Distanz- matrix wurde mit Distance Geometry eine sechsdimensionale Punktmenge erzeugt. Die sechs Dimensionen stellten eine Repräsentation dar, die dem in Abschnitt 2.3 gewählten Kriterium genügt. Diese Punkte wurden mit k-means in zwei bis acht Cluster gruppiert.

In den Bilderserien 3.5 und 3.6 sind links jeweils die von Distance Geometry erzeugten Punkte dargestellt, wobei die Farben das Ergebnis des Clusterings verdeutlichen. Dabei sind von den sechs Dimensionen die ersten drei dargestellt. Rechts ist das Protein 2epe

(34)

Tabelle 3.1: Eigenschaften der Testsysteme

System Anzahl der

Aminosäurereste Molekülketten

2epe 129 1

5hoh 416 4

1zz6 364 2

Bild 3.1: Cartoondarstellung von 2epe; die Sekundärstrukturelemente sind farblich unterschie- den

Bild 3.2: Cartoondarstellung eines concoord-Ensemles von zehn Strukturen von 2epe; die Sekundärstrukturelemente sind farblich unterschieden

(35)

3.1 System eins: 2epe 29

Bild 3.3: Distanzmatrix der Rotationen für 2epe

Bild 3.4: Visualisierung der Distanzmatrix am Protein 2epe; Residuen 1-40: grün, 41-54, 58- 79: blau, 80-129: gelb, 55-57: rot

(36)

zu sehen, wobei die jeweils dem Clustering im Rotationsdistanzraum entsprechenden Residuen gleich gefärbt sind.

Das Renement und die Bewertung. Die von k-means ermittelten Gruppen wur- den als tls-Gruppen dem Renementprogramm refmac [30] übergeben. Als Quali- tätsmaÿ für das Renement sind in Grak 3.7 freier (rot) und gewöhnlicher R-Faktor (schwarz) für die tls-Renements in Abhängigkeit von der Gruppenanzahl aufgetragen.

Die zwei Geraden zeigen freien (rot) und gewöhnlichen (schwarz) R-Faktor des Modells ohne tls-Renement. Das tls-Renement mit zwei Gruppen hat den freien R-Faktor um ca. drei Prozent fallen lassen. Die weiteren Gruppierungen senken zwar den R-Faktor, he- ben den freien R-Faktor jedoch an. Eine Verwendung von mehr als zwei tls-Gruppen stellt also bereits eine Überanpassung dar. Die Einteilung in sechs Gruppen stellt hier eine Ausnahme dar. Sie bendet sich auf ähnlichem Qualitätsniveau wie die Zweiteilung, verwendet jedoch mehr Parameter als diese. Die Einteilung in zwei Gruppen ist also vorzuziehen.

Genauer: Die hier verwendete Aufteilung in zwei Gruppen ist den anderen Aufteilungen vorzuziehen. Damit ist nicht gesagt, dass jede Zweiteilung des Proteins das tls-Renement verbessert. Ebenso ist es möglich, dass Einteilungen in mehr als zwei Gruppen die Messdaten passender beschreiben, wenn sie besser vorgenommen werden als dies hier der Fall ist.

3.2 System zwei: 5hoh

Das System. 5hoh [19] ist eine 2.0Å Röntgenkristallographiestruktur der Ribonuklea- se (RNase) T1. RNase T1 katalysiert die Hydrolyse1der Ribonukleinsäure. In Grak 3.8 ist die Struktur von 5hoh dargestellt, wobei die vier Proteinketten farblich unterschieden sind.

Das Ensemble. Mit concoord wurde von 5hoh ein Ensemble von 1000 Strukturen generiert. In Abbildung 3.9 ist ein Unterensemble von zehn Strukturen dargestellt. Die Strukturen zeigen zueinander eine groÿe Beweglichkeit.

Die Analyse. Die normierte Distanzmatrix der Rotationsvektoren für 5hoh ist in Gra- k 3.10 dargestellt. Deutlich ist die ausgeprägte Blockstruktur: Fast jede Aminosäure einer Kette ist am stärksten mit Aminosäuren der gleichen Kette korreliert. Die stärkste Korrelation zwischen zwei Proteinketten zeigen die Ketten eins und drei. Am wenigsten korreliert sind die Ketten zwei und vier. In Grak 3.8 lässt sich erkennen, dass die Ketten eins und drei sich am nächsten sind und die Kette zwei und vier am weitesten voneinan- der entfernt liegen. Von der aus der Distanzmatrix mit Distance Geometry generierten Punktmenge genügen drei Dimensionen, um die geforderte Genauigkeit zu erreichen. In den Graken 3.11 und 3.12 sind wie bei dem ersten System die Clusteringergebnisse im Rotationsdistanzraum und die entsprechend gruppierte Proteinstruktur zu sehen.

1 Hydrolyse ist die Spaltung von Bindungen durch die Reaktion mit Wasser.

(37)

3.2 System zwei: 5hoh 31

Bild 3.5: Ergebnisse des k-means-Clusterings bei 2epe für zwei bis fünf Cluster; links: das Clustering im Rotationsdistanzraum, rechts: Übertragung auf die Proteinstruktur

Referenzen

ÄHNLICHE DOKUMENTE

Die Fourier - Theorie befasst sich mit der Darstellung periodischer Vorg¨ ange. Diese Pe- riodizit¨ at ist auch in der Musik von Bedeutung. Die Grundschwingung und die verschie-

Vorliegender Teilbereich verfolgt das Bestreben, gezieltes Hin- und Zuhören als auditive Wahrnehmungsleistung hervorzuheben und ihre zentrale Rolle im Übergang von

In den 1980er Jahren, also dem Jahrzehnt der »Politisierung« dieser Frauengeneration, führten Feminismus wie auch Gleichstellungspolitik noch eine vergleichsweise

Die Finanz- und Weltwirtschaftskrise, das Auseinanderklaffen der Vermögensschere, die sukzessive Verknappung endlicher Ressourcen, die fortschreitende Umweltzerstörung oder

Wenn man das Werk von Don Juan Manuel untersucht, lässt sich erkennen, dass in diesem Text der Gebrauch von <v> und <b> willkürlich scheint, auch

Auch hängt die Antisemitismusforschung stark vom politischen Klima ab (zum Beispiel gab es durch die „Waldheim-Affäre“ in den 1980er Jahren eine intensive Auseinandersetzung,

YouTube-Videos können didaktisiert oder nicht didaktisiert sein (vgl. Gut didaktisierte Videos, die sich für die Schulung der Hör- und Hör-Sehkompetenz eignen, sind für

Unter Suizid versteht man die gezielte Selbsttötung von Menschen 92. In der deutschen Literatur wird neben dem Begriff Suizid auch immer wieder von Selbstmord,