• Keine Ergebnisse gefunden

System zur Berechnung der extrazellulären Raten

5. Etablierung der 13CFLUX2-Essentials 49

5.3. System zur Berechnung der extrazellulären Raten

Die extrazellulären Raten spielen eine wichtige Rolle bei der 13C-MFA. Grundsätzlich besteht kein Problem aus einzelnen Prozessdaten in entsprechenden Kalkulationsprogrammen (zum Bei-spielExceloderMatLab) die extrazellulären Raten mit den in Abschnitt 4.1.2 aufgestellten For-meln zu berechnen. Probleme treten erst auf, wenn die Raten mehrerer Kultivierungen berechnet werden sollen, eine korrekte Abschätzung der Fehler erfolgen soll oder eine variable Anzahl an Raten vorliegt. Am aufwändigsten erscheint jedoch die Einbindung der berechneten Raten und Abweichungen in das vorgeschriebene FluxML-Format (siehe hierzu Abschnitt 5.5). Eine Anfor-derungsanalyse erbrachte die folgenden Aspekte, die im Rahmen der Bearbeitung der extrazellu-lären Raten erfüllt werden müssen:

1siehe hierzu:http:// www.rfc-archive.org/ getrfc.php?rfc=4180

• Berücksichtigung aller experimentellen Fehler und deren Übertragung auf die berechneten Werte mittels Fehlerfortpflanzung

• Berechnung der extrazellulären Raten mit einer beliebigen Anzahl von Produktbildungsra-ten und Aufstellung der KohlenstoffbilanzΘC

• Automatische Erstellung von Nebenbedingungen für die Begrenzung der extrazellulären Raten sowie der Biomasseabflüsse

• Export der extrazellulären Raten in verschiedene Formate (absolute und normierte Raten sowie FluxML-spezifische Syntax)

Mit den vorher angesprochenen Kalkulationsprogrammen ist eine schnelle, flexible und fehlerlose Verarbeitung im Mitteldurchsatz kaum möglich, da eine erhöhte manuelle Verarbeitung erzwungen wird. Aufgrund dieser Aspekte wurde ein den Anforderungen entsprechendes Software-Modul in Python entwickelt, das sogenanntecalcExtRates.

5.3.1. Fehlerfortpflanzung

Die Fehlerfortpflanzung ist ein wesentlicher Bestandteil bei der Konvertierung der Prozessdaten in entsprechende extrazelluläre Raten. Die so erzeugten Abweichungen der extrazellulären Raten werden neben den Fehlern der Markierungsanteile für die Ermittlung der Standardabweichungen der geschätzten intrazellulären Raten verwendet. Ohne eine adäquate Berechnung dieser Fehler können die geschätzten intrazellulären Raten weder statistisch noch biologisch sinnvoll bewertet werden. Methodisch wurde die Gauß’sche Fehlerfortpflanzung eingesetzt, da sich alle Modell-funktionen der extrazellulären Raten hinreichend linear verhalten. Für die Messunsicherheit∆f einer aus den Parametermittelwertena . . . zberechneten Ratefwerden die quadrierten Unsicher-heiten der einzelnen unabhängigen Parameter mit der jeweiligen partiellen Ableitung multipliziert und über eine lineare Näherung nach Taylor addiert:

∆f=

¿Á ÁÀ(∂f

∂a ⋅∆a)2 + (∂f

∂b ⋅∆b)2 + . . . + (∂f

∂z ⋅∆z)2 (5.1)

5.3.2. Dynamische Erstellung der Gleichungen

Während die Gleichung für die Messunsicherheit der extrazellulären Raten für die jeweilige Rate immer gleich ist, variiert diese für die KohlenstoffbilanzΘC abhängig von der Anzahl der Raten.

Außerdem müssen für eine Bilanzierung des Kohlenstoffs die Anzahl der C-Atome#Ci berück-sichtigt werden. Für diese Berechnung wurde ein dynamischer und flexibler Algorithmus entwi-ckelt, der für eine beliebige Anzahl an extrazellulären Raten die jeweiligen Flussraten mit Stan-dardabweichungen sowieΘC ausrechnet. Beispielhaft soll der dafür entwickelte Algorithmus für einen Prozess mit zwei Produkten (P rod_AundP rod_B) hergeleitet werden (vgl. Formel 5.2).

ΘC= ΠCO2BMP rod_A⋅#CP rod_AP rod_B⋅#CP rod_B

ΠGlc⋅#CGlc (5.2)

Prinzipiell kann der Fehler der Kohlenstoffbilanz∆ΘC nach dem Schema in Formel 5.1 auf zwei Arten berechnet werden: entweder dienen die Raten als eigenständige Variablen mit entsprechen-den Standardabweichungen oder der Gesamtfehler∆ΘC wird auf die ursprünglichen Parameter bezogen (cGlc, Fmedium, BT M, V . . . ). Bei der ersten Methode wird Formel 5.2 nach den je-weiligen Raten als Variablen differenziert. Hier ergibt sich für alle Raten außerΠGlc die gleiche partielle Ableitung:

∂ΘC

∂Πi = 1

ΠGlc⋅#CGlc (5.3)

i =CO2,BM,P rod_A,P rod_B Die partielle Ableitung nach der Glukoseaufnahmerate lautet:

∂ΘC

∂ΠGlc = − ∑ (Πi⋅#Ci )

Glc⋅#CGlc)2 (5.4)

i=CO2,BM,P rod_A,P rod_B

#CCO2,#CBM =1

Mithilfe dieses Algorithmus können nun beliebig komplexe Kohlenstoffbilanzen aufgestellt wer-den. Problematisch ist allerdings die Schätzung des Fehlers der Kohlenstoffbilanzen aus den be-rechneten Messunsicherheiten der Raten. Diese fallen aufgrund einer zweifachen Anwendung der Fehlerfortpflanzung höher aus als bei einer direkten Berechnung aus den Fehlern der ursprüngli-chen Parameter. Daher wurde das zweite Verfahren realisiert. Hierbei wird die Messunsicherheit der Kohlenstoffbilanz auf die Unsicherheiten der ursprünglichen Parameter und nicht auf die Ab-weichungen der extrazellulären Raten bezogen. Dadurch muss das Software-Modul je nach Kom-bination der extrazellulären Raten die zugehörigen partiellen Ableitungenjust-in-time erzeugen.

Es ergeben sich komplizierte Formeln inklusive komplexer partieller Ableitungen nach den jewei-ligen Parametern. Python bietet mit sympyeine Bibliothek mit Computer-Algebra-Funktion, die seit 2006 entwickelt wird. Diese ist zwar noch nicht so funktional wie andere Systeme, die gefor-derten Möglichkeiten der partiellen Ableitung oder Verarbeitung von CSV-Dateien werden aber erfüllt. Somit ergibt sich die BilanzΘC in ausgeschriebener Form und vereinfacht zu:

ΘC =

12187,27⋅Fair

BT M⋅V⋅T ⋅ (1−c0,7902⋅cO2−cCO2CO2 −0,00038)

cGlc⋅#CGlc⋅Fmedium

ρ⋅BT M⋅V⋅MGlc

+

CBM⋅Fmedium

ρ⋅Mcarbon⋅V +cP rod_A⋅#ρ⋅BT M⋅VCP rod_A⋅Fmedium +cP rod_B⋅#ρ⋅BT M⋅VCP rod_B⋅Fmedium

cGlc⋅#CGlc⋅Fmedium

ρ⋅BT M⋅V⋅MGlc

= MGlc

cGlc⋅#CGlc ⋅ (12187,27⋅Fairρ

TFmedium ⋅ ( 0,7902⋅cCO2

1−cO2cCO2 −0,00038) +CBMBT M

Mcarbon +cP rod_A⋅#CP rod_A+cP rod_B⋅#CP rod_B)

(5.5)

Die nach den einzelnen Parametern partiell abgeleitete Modellfunktion wird aufgrund ihres Um-fangs nicht mehr dargestellt. In der Gleichung für den Gesamtfehler der Kohlenstoffbilanz∆ΘC werden für dieses Beispiel 12 solcher komplexer Ableitungen integriert, um dann letztendlich zu der korrekt geschätzen Messunsicherheit der Kohlenstoffbilanz zu führen. Je nach Anzahl der ex-trazellulären Raten ändert sich ebenfalls die Anzahl der benötigten partiellen Ableitungen. Für die Modellfunktion von ∆ΘC liegt bezüglich kleiner Änderungen der Fehlerwerte näherungs-weise ebenfalls ein lineares Verhalten vor (vgl. Abbildung 4.5a). Daher ist die Verwendung der Gauß’schen Fehlerfortpflanzung zulässig und dient in diesem Falle eher einer Abschätzung der Fehlergrenzen im Gegensatz zu den Standardabweichungen der extrazellulären Raten, die für wei-tere statistische Berechnungen benötigt werden.

5.3.3. Automatische Erstellung spezifischer Nebenbedingungen

Aus den experimentellen Rahmenbedingungen und dem verwendeten Mikroorganismus lassen sich eine Liste an Nebenbedingungen ableiten. Die manuelle Integration dieser Daten in eine FluxML-Datei ist aufgrund der spezifischen Syntax zeitaufwändig und fehleranfällig. Die spe-zifischen Nebenbedingungen für einen Organismus betreffen inbesondere die Biomasseabflüsse sowie Grenzen für die extrazellulären Raten. In dieser Arbeit wurden die Biomasseabflüsse nicht wie üblich rein aufgrund der eingestellten Verdünnungsrate berechnet, sondern wurden an die experimentell ermittelteΠBM angeglichen. Hierbei wurde die von Marx ermittelte Zusammenset-zung der Biomasse [133] in Anteile der Vorläuferφi und der Anzahl der Kohlenstoffatome#Ci konvertiert und mitΠBM in entsprechende BiomasseabflüsseΠi umgerechnet (Formel 5.6). Die Werte dieser Anteile und deren Berechung finden sich im Anhang unter Abschnitt D.3. Es ergeben sich für jedes einzelne Netzwerk unterschiedliche Flussraten.

ΠiBMφi⋅#Ci (5.6)

i = g6p_bm, f6p_bm, r5p_bm, e4p_bm, gap_bm, pga_bm, pep_bm, pyr_bm, acoa_bm, oaa_bm, akg_bm

Ein zweiter Punkt betrifft mögliche Grenzen für extrazelluläre Raten (ΠGlcP rod). Für diese wer-den experimentelle Werte inklusive Standardabweichungen berechnet und als Messdaten ebenfalls ins Netzwerk eingebunden. FürΠGlcliegt außerdem noch die Markierungsmischung vor, die sich in den Simulationen prinzipiell ändern kann. Um einerseits beim Sampling im mathematischen Lösungsraum nur sinnvolle Startpunkte zu erhalten und den Optimierer auch innerhalb biologi-scher Grenzen zu halten, wurden die Glukose-Mischung und die beiden extrazellulären Raten ΠGlc undΠP roddurch Nebenbedingungen eingeschränkt. Dabei durften die absoluten Werte der einzelnen Glukose-Aufnahmeraten (glc0_upt.n,glc1_upt.nundglcU_upt.n) um±1 % der gesamten Glukoseaufnahmerate schwanken (zum Beispiel für einen unmarkierten Anteil an Glu-kose von 63 %:glc0_upt > 0.62*pts.n; glc0_upt < 0.64*pts.n). Die absoluten Raten vonΠGlc undΠP rodsollten innerhalb der experimentell bestimmten Standardabeichungen liegen (zum Beispiellys_exp>ΠCO2−∆ΠCO2).

5.3.4. Export der extrazellulären Raten

Es wurden drei verschiedene Möglichkeiten für den Export der berechneten Werte implemen-tiert. Die einfachste Art besteht in der Ausgabe der Daten auf der Konsole. Dabei werden die

berechneten extrazellulären Raten sowie die jeweiligen Kennzahlen (vgl. Abschnitt 4.1.4) tabella-risch angezeigt. Eine zweite Funktion – die als Standard immer aktiviert ist – ist die Speicherung der Werte im CSV-Format, wobei für die absoluten Flusswerte, die Anteile der ΘC sowie die zugehörigen Kennzahlen jeweils einzelne Dateien erstellt werden. Die dritte Methode ist der au-tomatische Export in das definierte FluxML-Format. Die berechneten Raten inklusive ihrer Stan-dardabweichungen werden in einem Blockmeasurementexportiert (siehe Abbildung 3.12 in Ab-schnitt 3.4.9), der in diesem Fall nur die Flussmessungen beinhaltet (labelingmeasuremententfällt inklusive der dazugehörigen Einträge bei data). Diese Werte sind bereits im Netzwerk vorhan-den oder ein anderes Skript fügt diese ein (zum Beispiel mittelsJuMeDaSin Abschnitt 5.4.4 oder durchsetmeasurementsin Abschnitt 5.7). Eine beliebige Auswahl dieser drei Export-Formate ist möglich, wobei für die letzten beiden Methoden auch unterschiedliche Zielverzeichnisse ange-geben werden können.

Zusammendfassend ist das eben vorgestellte ModulcalcExtRates ein einfacher aber wich-tiger Baustein innerhalb der Datenvorbereitung angesehen werden. Dieses Programm löst die komplexe Aufgabe, aus experimentellen Rohdaten eine beliebige Kombination von extrazellulä-ren Raten zu berechnen und diese innerhalb von Sekundenbruchteilen in verschiedenste Formate zu exportieren. Besonders hilfreich ist hierbei die automatische Erstellung spezifischer Neben-bedingungen, die üblicherweise manuell mit hohem Zeitaufwand erstellt werden mussten. Mit calcExtRateswurde ein Baustein entwickelt, der nicht nur den Anforderungen einer13C-MFA gerecht wird, sondern ebenso für die Charakterisierung eines herkömmlichen Bioprozesses eine wesentliche Rolle spielen wird. Darin ist die Bilanzierung des Kohlenstoffs die Grundlage für ei-ne Verbesserung der Substratverwertung und Erhöhung von Produktausbeuten. Zahlreiche Tests und die intensive Anwendung in dieser Arbeit zeigten die Notwendigkeit eines solchen Software-Moduls und die optimale Integrität innnerhalb der13CFLUX2-Essentials. Die Bedienung über die Konsole ist in Abschnitt 5.7 näher erläutert.