System zur Berechnung der extrazellulären Raten

5. Etablierung der 13CFLUX2-Essentials 49

5.3. System zur Berechnung der extrazellulären Raten

Die extrazellulären Raten spielen eine wichtige Rolle bei der ¹³C-MFA. Grundsätzlich besteht kein Problem aus einzelnen Prozessdaten in entsprechenden Kalkulationsprogrammen (zum Bei-spielExceloderMatLab) die extrazellulären Raten mit den in Abschnitt 4.1.2 aufgestellten For-meln zu berechnen. Probleme treten erst auf, wenn die Raten mehrerer Kultivierungen berechnet werden sollen, eine korrekte Abschätzung der Fehler erfolgen soll oder eine variable Anzahl an Raten vorliegt. Am aufwändigsten erscheint jedoch die Einbindung der berechneten Raten und Abweichungen in das vorgeschriebene FluxML-Format (siehe hierzu Abschnitt 5.5). Eine Anfor-derungsanalyse erbrachte die folgenden Aspekte, die im Rahmen der Bearbeitung der extrazellu-lären Raten erfüllt werden müssen:

1siehe hierzu:http:// www.rfc-archive.org/ getrfc.php?rfc=4180

• Berücksichtigung aller experimentellen Fehler und deren Übertragung auf die berechneten Werte mittels Fehlerfortpflanzung

• Berechnung der extrazellulären Raten mit einer beliebigen Anzahl von Produktbildungsra-ten und Aufstellung der KohlenstoffbilanzΘ_C

• Automatische Erstellung von Nebenbedingungen für die Begrenzung der extrazellulären Raten sowie der Biomasseabflüsse

• Export der extrazellulären Raten in verschiedene Formate (absolute und normierte Raten sowie FluxML-spezifische Syntax)

Mit den vorher angesprochenen Kalkulationsprogrammen ist eine schnelle, flexible und fehlerlose Verarbeitung im Mitteldurchsatz kaum möglich, da eine erhöhte manuelle Verarbeitung erzwungen wird. Aufgrund dieser Aspekte wurde ein den Anforderungen entsprechendes Software-Modul in Python entwickelt, das sogenanntecalcExtRates.

5.3.1. Fehlerfortpflanzung

Die Fehlerfortpflanzung ist ein wesentlicher Bestandteil bei der Konvertierung der Prozessdaten in entsprechende extrazelluläre Raten. Die so erzeugten Abweichungen der extrazellulären Raten werden neben den Fehlern der Markierungsanteile für die Ermittlung der Standardabweichungen der geschätzten intrazellulären Raten verwendet. Ohne eine adäquate Berechnung dieser Fehler können die geschätzten intrazellulären Raten weder statistisch noch biologisch sinnvoll bewertet werden. Methodisch wurde die Gauß’sche Fehlerfortpflanzung eingesetzt, da sich alle Modell-funktionen der extrazellulären Raten hinreichend linear verhalten. Für die Messunsicherheit∆f einer aus den Parametermittelwertena . . . zberechneten Ratefwerden die quadrierten Unsicher-heiten der einzelnen unabhängigen Parameter mit der jeweiligen partiellen Ableitung multipliziert und über eine lineare Näherung nach Taylor addiert:

∆f=

¿Á ÁÀ(∂f

∂a ⋅∆a)² + (∂f

∂b ⋅∆b)² + . . . + (∂f

∂z ⋅∆z)² (5.1)

5.3.2. Dynamische Erstellung der Gleichungen

Während die Gleichung für die Messunsicherheit der extrazellulären Raten für die jeweilige Rate immer gleich ist, variiert diese für die KohlenstoffbilanzΘ_C abhängig von der Anzahl der Raten.

Außerdem müssen für eine Bilanzierung des Kohlenstoffs die Anzahl der C-Atome#^C_i berück-sichtigt werden. Für diese Berechnung wurde ein dynamischer und flexibler Algorithmus entwi-ckelt, der für eine beliebige Anzahl an extrazellulären Raten die jeweiligen Flussraten mit Stan-dardabweichungen sowieΘ_C ausrechnet. Beispielhaft soll der dafür entwickelte Algorithmus für einen Prozess mit zwei Produkten (P rod_AundP rod_B) hergeleitet werden (vgl. Formel 5.2).

Θ_C= Π_CO2+Π_BM +Π_{P rod_A}⋅#^C_{P rod_A}+Π_{P rod_B}⋅#^C_{P rod_B}

Π_Glc⋅#^C_Glc (5.2)

Prinzipiell kann der Fehler der Kohlenstoffbilanz∆Θ_C nach dem Schema in Formel 5.1 auf zwei Arten berechnet werden: entweder dienen die Raten als eigenständige Variablen mit entsprechen-den Standardabweichungen oder der Gesamtfehler∆Θ_C wird auf die ursprünglichen Parameter bezogen (c_Glc, F_medium, BT M, V . . . ). Bei der ersten Methode wird Formel 5.2 nach den je-weiligen Raten als Variablen differenziert. Hier ergibt sich für alle Raten außerΠ_Glc die gleiche partielle Ableitung:

∂Θ_C

∂Πi = 1

Π_Glc⋅#^C_Glc (5.3)

i =_CO2,_BM,_{P rod_A},_{P rod_B} Die partielle Ableitung nach der Glukoseaufnahmerate lautet:

∂ΘC

∂Π_Glc = − ∑ (Π_i⋅#^C_i )

(Π_Glc⋅#^C_Glc)² (5.4)

i=CO2,_BM,_{P rod_A},_{P rod_B}

#^C_CO2,#^C_BM =1

Mithilfe dieses Algorithmus können nun beliebig komplexe Kohlenstoffbilanzen aufgestellt wer-den. Problematisch ist allerdings die Schätzung des Fehlers der Kohlenstoffbilanzen aus den be-rechneten Messunsicherheiten der Raten. Diese fallen aufgrund einer zweifachen Anwendung der Fehlerfortpflanzung höher aus als bei einer direkten Berechnung aus den Fehlern der ursprüngli-chen Parameter. Daher wurde das zweite Verfahren realisiert. Hierbei wird die Messunsicherheit der Kohlenstoffbilanz auf die Unsicherheiten der ursprünglichen Parameter und nicht auf die Ab-weichungen der extrazellulären Raten bezogen. Dadurch muss das Software-Modul je nach Kom-bination der extrazellulären Raten die zugehörigen partiellen Ableitungenjust-in-time erzeugen.

Es ergeben sich komplizierte Formeln inklusive komplexer partieller Ableitungen nach den jewei-ligen Parametern. Python bietet mit sympyeine Bibliothek mit Computer-Algebra-Funktion, die seit 2006 entwickelt wird. Diese ist zwar noch nicht so funktional wie andere Systeme, die gefor-derten Möglichkeiten der partiellen Ableitung oder Verarbeitung von CSV-Dateien werden aber erfüllt. Somit ergibt sich die BilanzΘ_C in ausgeschriebener Form und vereinfacht zu:

Θ_C =

12187,27⋅Fair

BT M⋅V⋅T ⋅ (1−c^0,7902⋅c_O2−c^CO2_CO2 −0,00038)

cGlc⋅#^C_Glc⋅Fmedium

ρ⋅BT M⋅V⋅MGlc

CBM⋅Fmedium

ρ⋅Mcarbon⋅V +^c^{P rod_A}^⋅#_{ρ⋅BT M⋅V}^C^{P rod_A}^⋅F^medium +^c^{P rod_B}^⋅#_{ρ⋅BT M⋅V}^C^{P rod_B}^⋅F^medium

cGlc⋅#^C_Glc⋅Fmedium

ρ⋅BT M⋅V⋅MGlc

= M_Glc

cGlc⋅#^C_Glc ⋅ (12187,27⋅F_air⋅ρ

T ⋅F_medium ⋅ ( 0,7902⋅c_CO2

1−c_O2−c_CO2 −0,00038) +CBM⋅BT M

M_carbon +c_{P rod_A}⋅#^C_{P rod_A}+c_{P rod_B}⋅#^C_{P rod_B})

(5.5)

Die nach den einzelnen Parametern partiell abgeleitete Modellfunktion wird aufgrund ihres Um-fangs nicht mehr dargestellt. In der Gleichung für den Gesamtfehler der Kohlenstoffbilanz∆Θ_C werden für dieses Beispiel 12 solcher komplexer Ableitungen integriert, um dann letztendlich zu der korrekt geschätzen Messunsicherheit der Kohlenstoffbilanz zu führen. Je nach Anzahl der ex-trazellulären Raten ändert sich ebenfalls die Anzahl der benötigten partiellen Ableitungen. Für die Modellfunktion von ∆Θ_C liegt bezüglich kleiner Änderungen der Fehlerwerte näherungs-weise ebenfalls ein lineares Verhalten vor (vgl. Abbildung 4.5a). Daher ist die Verwendung der Gauß’schen Fehlerfortpflanzung zulässig und dient in diesem Falle eher einer Abschätzung der Fehlergrenzen im Gegensatz zu den Standardabweichungen der extrazellulären Raten, die für wei-tere statistische Berechnungen benötigt werden.

5.3.3. Automatische Erstellung spezifischer Nebenbedingungen

Aus den experimentellen Rahmenbedingungen und dem verwendeten Mikroorganismus lassen sich eine Liste an Nebenbedingungen ableiten. Die manuelle Integration dieser Daten in eine FluxML-Datei ist aufgrund der spezifischen Syntax zeitaufwändig und fehleranfällig. Die spe-zifischen Nebenbedingungen für einen Organismus betreffen inbesondere die Biomasseabflüsse sowie Grenzen für die extrazellulären Raten. In dieser Arbeit wurden die Biomasseabflüsse nicht wie üblich rein aufgrund der eingestellten Verdünnungsrate berechnet, sondern wurden an die experimentell ermittelteΠ_BM angeglichen. Hierbei wurde die von Marx ermittelte Zusammenset-zung der Biomasse [133] in Anteile der Vorläuferφ_i und der Anzahl der Kohlenstoffatome#^C_i konvertiert und mitΠ_BM in entsprechende BiomasseabflüsseΠ_i umgerechnet (Formel 5.6). Die Werte dieser Anteile und deren Berechung finden sich im Anhang unter Abschnitt D.3. Es ergeben sich für jedes einzelne Netzwerk unterschiedliche Flussraten.

Π_i=Π_BM ⋅φi⋅#^C_i (5.6)

i = g6p_bm, f6p_bm, r5p_bm, e4p_bm, gap_bm, pga_bm, pep_bm, pyr_bm, acoa_bm, oaa_bm, akg_bm

Ein zweiter Punkt betrifft mögliche Grenzen für extrazelluläre Raten (ΠGlc,Π_{P rod}). Für diese wer-den experimentelle Werte inklusive Standardabweichungen berechnet und als Messdaten ebenfalls ins Netzwerk eingebunden. FürΠ_Glcliegt außerdem noch die Markierungsmischung vor, die sich in den Simulationen prinzipiell ändern kann. Um einerseits beim Sampling im mathematischen Lösungsraum nur sinnvolle Startpunkte zu erhalten und den Optimierer auch innerhalb biologi-scher Grenzen zu halten, wurden die Glukose-Mischung und die beiden extrazellulären Raten Π_Glc undΠ_{P rod}durch Nebenbedingungen eingeschränkt. Dabei durften die absoluten Werte der einzelnen Glukose-Aufnahmeraten (glc0_upt.n,glc1_upt.nundglcU_upt.n) um±1 % der gesamten Glukoseaufnahmerate schwanken (zum Beispiel für einen unmarkierten Anteil an Glu-kose von 63 %:glc0_upt > 0.62*pts.n; glc0_upt < 0.64*pts.n). Die absoluten Raten vonΠ_Glc undΠ_{P rod}sollten innerhalb der experimentell bestimmten Standardabeichungen liegen (zum Beispiellys_exp>Π_CO2−∆Π_CO2).

5.3.4. Export der extrazellulären Raten

Es wurden drei verschiedene Möglichkeiten für den Export der berechneten Werte implemen-tiert. Die einfachste Art besteht in der Ausgabe der Daten auf der Konsole. Dabei werden die

berechneten extrazellulären Raten sowie die jeweiligen Kennzahlen (vgl. Abschnitt 4.1.4) tabella-risch angezeigt. Eine zweite Funktion – die als Standard immer aktiviert ist – ist die Speicherung der Werte im CSV-Format, wobei für die absoluten Flusswerte, die Anteile der Θ_C sowie die zugehörigen Kennzahlen jeweils einzelne Dateien erstellt werden. Die dritte Methode ist der au-tomatische Export in das definierte FluxML-Format. Die berechneten Raten inklusive ihrer Stan-dardabweichungen werden in einem Blockmeasurementexportiert (siehe Abbildung 3.12 in Ab-schnitt 3.4.9), der in diesem Fall nur die Flussmessungen beinhaltet (labelingmeasuremententfällt inklusive der dazugehörigen Einträge bei data). Diese Werte sind bereits im Netzwerk vorhan-den oder ein anderes Skript fügt diese ein (zum Beispiel mittelsJuMeDaSin Abschnitt 5.4.4 oder durchsetmeasurementsin Abschnitt 5.7). Eine beliebige Auswahl dieser drei Export-Formate ist möglich, wobei für die letzten beiden Methoden auch unterschiedliche Zielverzeichnisse ange-geben werden können.

Zusammendfassend ist das eben vorgestellte ModulcalcExtRates ein einfacher aber wich-tiger Baustein innerhalb der Datenvorbereitung angesehen werden. Dieses Programm löst die komplexe Aufgabe, aus experimentellen Rohdaten eine beliebige Kombination von extrazellulä-ren Raten zu berechnen und diese innerhalb von Sekundenbruchteilen in verschiedenste Formate zu exportieren. Besonders hilfreich ist hierbei die automatische Erstellung spezifischer Neben-bedingungen, die üblicherweise manuell mit hohem Zeitaufwand erstellt werden mussten. Mit calcExtRateswurde ein Baustein entwickelt, der nicht nur den Anforderungen einer¹³C-MFA gerecht wird, sondern ebenso für die Charakterisierung eines herkömmlichen Bioprozesses eine wesentliche Rolle spielen wird. Darin ist die Bilanzierung des Kohlenstoffs die Grundlage für ei-ne Verbesserung der Substratverwertung und Erhöhung von Produktausbeuten. Zahlreiche Tests und die intensive Anwendung in dieser Arbeit zeigten die Notwendigkeit eines solchen Software-Moduls und die optimale Integrität innnerhalb der13CFLUX2-Essentials. Die Bedienung über die Konsole ist in Abschnitt 5.7 näher erläutert.

Im Dokument Charakterisierung und Validierung der 13C-Stoffflussanalyse im Parallelansatz (Seite 67-71)