• Keine Ergebnisse gefunden

3. Der Bindungsmodus von Inhibitoren der Pf GSK-3 79

4.3. Ergebnisse

4.3.2. Analyse resultierender 3D-QSAR-Modelle

4.3.2.2. Das Modell AcDoSt

In Tabelle B.11 im Anhang auf Seite 245 sind vorhergesagte und tatsächliche pIC50-Werte sowie die entsprechenden Abweichungen (Residuen) für den Trainings- und den korrespondierenden

R1

H2N

NH2

N S NC

R2

Verbindung R1 R2

68 I 3,4-Dichlor-benzoyl 103 Cl Thien-2-yl-carbonyl 77 Cl 3-Chlor-benzoyl

40 I 4-Chlor-benzoyl

84 F 3-Chlor-benzoyl

56 H CN

4.0 4.5 5.0 5.5 6.0 6.5 7.0

pIC

50act

4.0 4.5 5.0 5.5 6.0 6.5 7.0

pI C

calc 50 68

103

77

40

56

84 Trainingssatz B Testsatz B

Abbildung 4.8. |Grafische Auftragung der Tabelle B.11 (Modell AcDoSt, Überlagerung nach Modus A).

Bei den bezeichneten Verbindungen weichen berechneter und gemessener pIC50-Wert mehr als 0.5 Einheiten voneinander ab.

Testsatz aufgeführt. Den daraus folgenden Residualplot zeigt Abbildung 4.8. Darin bezeichnet sind Verbindungen, deren berechnete Aktivität mehr als 0.5 pIC50-Einheiten von der gemes-senen abweicht. Als erstes fällt auf, dass es sich bei den Verbindungen mit großen Residuen ausschließlich um solche der Klasse 1 handelt, alle Verbindungen der Klasse 2 werden vom Modell gut beschrieben. Bei diesen 13 Verbindungen beträgt die größte Abweichung von be-rechnetem und tatsächlichem pIC50 im Falle von 137 gerade einmal -0.172.

Besonders stark weicht die Verbindung 68 ab. Sie ist die einzige, deren berechnete Aktivität auch in allen anderen berechneten Modellvarianten um mehr als eine logarithmische Einheit vom bestimmten Wert abweicht. Ihre strukturelle Beschaffenheit (Iodsubstitution am 4-Arylrest, Dichlorsubstitution am 2-Benzoylrest) wird vom Trainingssatz gut beschrieben, weshalb die starke Abweichung überrascht. Bedenkt man die Abweichungen bei Wiederholmessungen bei den nahe verwandten Substanzen40 und 77, ist eine Abweichung durch experimentell beding-te Schwankungen im Testsysbeding-tem denkbar (vgl. Tabelle B.3 im Anhang S. 234). Unbeding-ter dieser

Annahme ist auch die schlechte Vorhersage von 40und 77 verständlich. Mit einer Abweichung von -0.808 Einheiten wird die Aktivität der Verbindung103 vom Modell schlecht beschrieben.

Die tatsächliche Aktivität entspricht nur knapp 1/6 der berechneten. Dieses Ergebnis ist inso-fern interessant, als dass die nahe verwandte Verbindung102im Testsatz wiederum sehr genau vorhergesagt wird. Im Rahmen der Darstellung der Ergebnisse der biologischen Testung von 101-104 wurde die Widersprüchlichkeit der gemessenen biologischen Daten diskutiert (vgl. S.

118). Dabei wurde darauf hingewiesen, dass die Aktivität des 2-chlorsubstituierten Derivates 103 den bekannten Struktur-Wirkungsbeziehungen nach im Vergleich zum 2-iodsubstituierten 101 die höhere Aktivität zeigen sollte. Der vom Modell errechnete Wert von 5.029 für 103, entsprechend einem IC50von knapp 10 µM, wäre hinsichtlich der übrigen Schlüsse zu Struktur-Aktivitätsbeziehungen kongruent. Dies lässt einen Messfehler bei der biologischen Prüfung als mögliche Erklärung für die schlechte Vorhersage im Rahmen des Modells zu.

Die ungenaue Vorhersage der Verbindungen 56 und 84 im Testsatz lässt sich auf die nicht vorhandene bzw. kleine Substitution an Position 2 des 4-Arylrestes zurückführen. Während den im übrigen Datensatz beobachteten Struktur-Wirkungsbeziehungen zufolge die Aktivität mit abnehmender Größe des Substituenten steigen sollte, bilden die genannten Verbindungen hin-sichtlich ihrer Aktivität Ausnahmen von dieser Regel. Sie stellen gewissermaßen das Bindeglied zu den im Modell wegen der fehlenden diskreten pIC50-Werte nicht eingesetzten Verbindungen 97und106dar, deren 4-Phenylsubstituent nicht weiter substituiert ist. Die Verbindungen sind anPfGSK-3 und HsGSK-3β inaktiv (vgl. Abschnitt 3.2.1.1 auf S. 84).

Neben der LOO wird als zweiter Ansatz zur Validierung die in Abschnitt 4.1.3.2 erläuter-te Randomisierung der abhängigen Variablen miterläuter-tels Progressive Scrambling verwendet (siehe Abb. 4.9(a) auf S. 162). Aufgetragen werden die nach Randomisierung und durchgeführter Kreuzvalidierung erhaltenen Werte fürq2 gegen r2yy. Mit abnehmender Korrelation von durch-mischtem Datensatz mit den tatsächlichen Ergebnissen nimmt der q2 ab, allerdings gibt es 12 Durchläufe der LOO, in denen der Wert nach Randomisierung besser ist als im untersuchten Modell. Im Diagramm erscheinen diese Fälle als Punkte über der gestrichelten grauen Linie, die mit 0.406 denq2 des ursprünglichen Modells anzeigt. Wie im allgemeinen Abschnitt dargelegt, ist dies jedoch einsichtig, bedenkt man die Möglichkeit, dass bei hohem ryy2 nur benachbarte Werte getauscht wurden. Insbesondere bei einer so hohen Anzahl an nahe beieinanderliegenden Aktivitäten, wie sie im zugrunde liegenden Datensatz vorliegen (vgl. Abb. 4.2 auf S. 153), ist ein hoher q2 also bei gleichzeitig hohem ryy2 nicht verwunderlich. Zudem ist die Möglichkeit gegeben, dass zufällig Datenpunkte getauscht werden, die mit Messfehlern behaftet waren. Das Ergebnis des Y-Scramblings spricht also nicht gegen das Modell.

0.0 0.2 0.4 0.6 0.8 1.0

r

yy2

1.5

1.0

0.5

0.0 0.5 1.0

q

2

(a)

0.0 0.2 0.4 0.6 0.8 1.0

r

yy2

0.2

0.0 0.2 0.4 0.6 0.8 1.0

q

2

(b)

Abbildung 4.9. | Randomisierung der biologischen Daten mittels Progressive Scrambling für Modelle, die basierend auf Modus A berechnet wurden. Der rot markierte Wert stellt den q2 des ursprünglichen Modells mit nicht durchmischten abhängigen Variablen dar. (a) zeigt die Veränderungen in Abhängigkeit von r2yy

für die Felderkombination AcDoSt, (b) diejenigen für die Felderkombination AcEl.

Tabelle 4.3. | Farbkodierung für CoMSIA-Konturdiagramme.

CoMSIA-Feld + –

Farbe Bedeutung Farbe Bedeutung

Akzeptor violett Donor im Rezeptor ⇑ rot Donor im Rezeptor ⇓ Donor cyan Akzeptor im Rezeptor ⇑ blau Akzeptor im Rezeptor ⇓ elektrostatisch blau pos. des Liganden ⇑ gelb neg. des Liganden ⇑

sterisch grün Substitution in diesem Bereich⇑ gelb Substitution in diesem Bereich ⇓

/⇓: günstigt / ungünstig für die Aktivität des Liganden; pos.: positive Partialladung; neg.: negative Partialladung.

Analyse der CoMSIA-Konturdiagramme

Die visuelle Analyse der Felder erfolgt unter zwei Gesichtspunkten. Einerseits soll die Stimmig-keit des Modells in sich beurteilt werden, andererseits die InterpretierbarStimmig-keit im Bezug auf die Bindetasche. Dieser Aspekt ist besonders bei den Wasserstoffbrückendonor- und -akzeptorfel-dern von Bedeutung, die jeweils das begünstigende Vorhandensein eines Wasserstoffbrückenan-tipoden im Rezeptor markieren. Auch bei der Analyse des sterischen Feldes ist der Bezug auf den Rezeptor besonders naheliegend. Die Farbkodierung für die Darstellung aller Konturdia-gramme in dieser Arbeit ist in Tabelle 4.3 aufgeführt.

Die Wasserstoffbrückenakzeptor- und -donorfelder haben in diesem Modell einen gemeinsa-men Anteil von 70.8 % an der Vorhersage der Aktivität (vgl. Tab. 4.2). Die beiden Felder sind in Abbildung 4.10 gemeinsam mit den beiden Inhibitoren 62und 103 dargestellt. Die wichtige Rolle des Substituenten an der Position 2 des Thienopyridins wird deutlich. Für einen Liganden

(a) (b)

Abbildung 4.10. | 62 (grün) als aktive Verbindung und103 (orange) als weniger aktive mit Wasserstoff-brückenakzeptor- und -donorfeldern gemäß AcDoSt / Modus A (a); Oberfläche der Bindetasche (b).

mit hoher Affinität wie 62 (grün in Abb. 4.10(a)) ist das blaue Donorfeld in Verlängerung der Dreifachbindung des 2-Nitrils folgerichtig. Es besagt, dass hier ein Akzeptor im Rezeptor nega-tive Auswirkung auf die Aktivität hätte. Das direkt angrenzende violette Feld hingegen ist ein positives Akzeptorfeld – hier wird das begünstigende Vorhandensein eines Donors berechnet.

Diese Position könnte von dem Lys108 eingenommen werden, das allerdings in den Modellen der PfGSK-3 im roten Bereich liegt, der an das Carbonyl von103angrenzt. Dass diese Interaktion des Carbonyls in einen negativen Feldbeitrag ragt, erscheint zunächst widersprüchlich, lässt sich aber mit der Zusammensetzung des Datensatzes erklären (vgl. S. 83 ff., unterschiedliche Repräsentation Klasse 1a/b): Aktivere Verbindungen an der PfGSK-3 sind insgesamt diejeni-gen der Klasse 1a. Nur 64 hat mit 1.6 µM einen IC50 über 1, für alle anderen Verbindungen dieser Gruppe liegt er darunter. Für die benzoylsubstituierte Verbindungen der Klasse 1b hin-gegen gibt es zahlreiche Beispiele mit IC50-Werten über 1. Dieser Sachverhalt ist weniger darauf zurückzuführen, dass Verbindungen der Klasse 1b nicht hohe Aktivität aufweisen können, es wurden vielmehr wegen der Selektivität von Verbindungen dieses Typs deutlich mehr Derivate synthetisiert. Da dabei mehr variiert wurde, als es bei den offenbar nicht selektiven Verbindun-gen der Klasse 1a der Fall war, enthält der Datensatz eine höhere Anzahl von weniger aktiven Verbindungen der Klasse 1b. In der Folge werden die charakteristische Eigenschaften der Klas-se 1b vom statistischen Modell als negativ für die Aktivität eingestuft. Dies könnte das roten Donorfeld in Abbildung 4.10(a) in Verlängerung des Carbonyls von Verbindungen der Klasse 1b erklären.

Im Inneren des Proteins liegt neben der oben diskutierten Region um das Lys108 ein positi-ver Bereich des Akzeptorfeldes zwischen Lys208 und Gln210 (Abb. 4.10(b)). Hier ist ein Donor dann vorhanden, wenn die Seitenkette des Lysins sich in diesen Bereich bewegt oder das Amid des Gln210 die umgekehrte Anordnung von Sauerstoff und Stickstoff einnimmt. Damit wäre auch das entsprechende Carbonyl im Bereich eines positiven Donorfeldes (cyan). Da in solchen Bereichen ein Akzeptor im Rezeptor günstige Auswirkungen auf die Aktivität der Verbindun-gen hat, ist dieses Feld mit den Gegebenheiten im Rezeptor konform, wenn die umgekehrte Anordnung von Sauerstoff und Stickstoff im Amid von Gln210 angenommen wird.

Die blauen Donorfelder in der Nähe der 6-Aminosubstitution des Grundkörpers sind schwer interpretierbar. Sie zeigen an, dass dem Modell zufolge hier ein Akzeptor im Rezeptor ungüns-tige Auswirkungen auf die Aktivität des Liganden hat – allerdings wird im zugrunde liegenden Modus A über das entsprechende Amin eine Wasserstoffbrücke zur Hinge Region ausgebildet (vgl. Abb. 3.8 auf S. 102).

Die sterischen Felder sind in Abbildung 4.11 dargestellt. Hier ergibt sich ein auf den ersten Blick überraschender Befund: Gerade am Grund der Tasche in der Region um Thr163, Leu213 und Cys224, in die die 2-Substitution des 4-Arylsubstituenten zeigt, befindet sich ein negatives Feld, das die besagte Aushöhlung ausfüllt. Ein Erklärungsansatz ist der in Verbindung mit der schlechten Vorhersage von 56 und 84 im Testsatz genannte: Im Datensatz gibt es mehrere

N S R1

R2 NH2 NC

H2N

R1 R2 pIC50

62 CH3 CN 0.51

103 Cl Thien-2-yl-carbonyl 60

Abbildung 4.11. | Sterisches Feld mit Liganden 62 in Grün und 103 in Orange (pIC50 an der Pf GSK-3). Das Feld, das die Substitution des 4-Arylrestes in Position 2 verdeckt, passt genau auf das Profil des als blaues Gitter dargestellten Taschengrundes. Die Form des grünen Feldes verdeutlicht eine bevorzugte Substitution des Benzoylrestes in meta-Stellung.

Beispiele dafür, dass die Aktivität in der Folge I < Br < Cl zunimmt (Beispiele vgl. S. 84).

Der kleinere Substituent an dieser Stelle bewirkt also die höhere Aktivität, was sich im Modell durch das dargestellten Feld zeigt. Dass unsubstituierte Derivate der Klasse 1b inaktiv sind, wird vom Modell nicht berücksichtigt, da diese Verbindungen (97,106) aufgrund der fehlenden diskreten Angabe des IC50 nicht in das Modell eingingen.

Die Aktivität verstärkend wird dem Modell nach der durch den Benzoylsubstituenten besetzte Bereich, im Bild grün dargestellt. Diese Beobachtung steht im Widerspruch zu der Tatsache, dass Verbindungen der Klasse 1a häufig aktiver sind als diejenigen der Klasse 1b. Insbesondere die am 2-Benzoylrest unsubstituierten Derivate wie das in der Abbildung dargestellte103zählen zu den weniger aktiven Verbindungen des Datensatzes. Wird der Benzoylrest jedoch in meta-Position zum Carbonyl substituiert, sind die betreffenden Verbindungen mit Aktivitäten kleiner 1µM aktiv (z. B.66,74,77). Dem Modell zufolge verstärkt also eine Benzoylsubstitution dann die Aktivität, wenn der betreffende Aromat in meta-Stellung substituiert vorliegt, während eine Substitution in para vergleichsweise eine geringere Aktivität von Liganden mit sich bringt, die diesen Raum (gelbes Feld in Abb. 4.11) besetzen. Auch diese Beobachtung deckt sich mit den bekannten Struktur-Wirkungsbeziehungen nach Abschnitt 3.2.1.1.