• Keine Ergebnisse gefunden

reine Datenmatrix

N/A
N/A
Protected

Academic year: 2021

Aktie " reine Datenmatrix"

Copied!
197
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

$QZHQGXQJGHU)DNWRUHQDQDO\VHDXIGLH

5|QWJHQDEVRUSWLRQVVSHNWURVNRSLH]XU%HVWLPPXQJ GHU6SH]LDWLRQYRQ8UDQLQ/|VXQJHQ

DISSERTATION

zur Erlangung des akademischen Grades Doctor rerum naturalium

(Dr. rer. nat.)

vorgelegt

der Fakultät für Mathematik und Naturwissenschaften der Technischen Universität Dresden

von

Diplomchemiker André Roßberg geboren am 6. März 1971 in Rodewisch

Gutachter: Professor Th. Fanghänel Professor T. Reich Professor J. Einax

Eingereicht am: 30.09.2001 Tag der Verteidigung: 06.09.2002

(2)

D

(3)

,QKDOWVYHU]HLFKQLV

9HU]HLFKQLVGHUYHUZHQGHWHQ$ENU]XQJHQXQG6\PEROH

(LQOHLWXQJXQG=LHOVWHOOXQJ

'LH)DNWRUHQDQDO\VH

2.1. Die Aufgabe und das Ziel der Faktorenanalyse, mathematische Beschreibung 7

2.1.1. Mathematische Symbolik 9

2.1.2. Die Analyse der Varianz 11

2.1.3. Die Transformation der abstrakten Faktorenlösung 45

2.2. Die Faktorenanalyse in der Spektroskopie 58

'LH5|QWJHQDEVRUSWLRQVVSHNWURVNRSLH

3.1. Theoretische Grundlagen 62

3.2. Die Messung von Röntgenabsorptionsspektren 69

3.2.1. Die Aufarbeitung der Röntgenabsorptionsspektren zur Analyse 70

3.3. Statistische Analyse der Meßdaten 75

3.4. Die Anwendung der Faktorenanalyse auf Röntgenabsorptionspektren 82

'LH$QZHQGXQJGHU)DNWRUHQDQDO\VHDXI;$1(66SHNWUHQ

4.1. Untersuchungen am System Arsen(III,V) im wäßrigen Medium 85 4.2. Untersuchungen zur Reduktion von Uran(VI) durch Bakterien 99 4.3. Untersuchung einer Konzentrationsserie von Uran(IV,VI)-Mischungen 116

'LH$QZHQGXQJGHU)DNWRUHQDQDO\VHDXI(;$)66SHNWUHQ

5.1. Uran(VI) und Essigsäure 128

5.2. Uran(VI) und Protocatechusäure 142

=XVDPPHQIDVVXQJGHU(UJHEQLVVH

$XVEOLFN

/LWHUDWXU

(4)

D

(5)

9HU]HLFKQLVGHUKlXILJYHUZHQGHWHQ$ENU]XQJHQXQG6\PEROH

c(N) normierte Modulation des Röntgenabsorptionskoeffizienten

( Energie der Röntgenstrahlung

ESRF (XURSHDQ6\QFKURWURQ5DGLDWLRQ)DFLOLW\

EXAFS ([WHQGHG;5D\$EVRUSWLRQ)LQH6WUXFWXUH

HASYLAB Hamburger Synchrotronstrahlungslabor HPLC +LJK3HUIRUPDQFH/LTXLG&KURPDWRJUDSK\

I0, I1, I2 Signale der Ionisationskammern ICP-MS ,QGXFWLYFRXSOHGPDVVVSHFWURVFRS\

,( LPEHGGHGHUURU

,1' LQGLFDWRUIXQFWLRQ

N Betrag des Wellenzahlvektors in [Å-1]

l Eigenwert des Faktors Q

0

l sekundärer Eigenwert des Faktors Q

MOSTAB Monochromator Stabilisierung

PCS Protocatechusäure

35 prozentuale Restvarianz

R radialer Abstand in [Å]

5( UHDOHUURU

ROBL Rossendorf Beamline

67' Standardabweichung, statistischer Fehler

TRLFS Zeitaugelöste laserinduzierte Fluoreszenzspektroskopie UV-VIS 8OWUDYLROHWYLVLEOH

;( H[WUDFWHGHUURU

XANES ;5D\$EVRUSWLRQ1HDU(GJH6WUXFWXUH

XAS ;5D\$EVRUSWLRQ6SHFWURVFRS\

XRD ;5D\'LIIUDFWLRQ

\ Konzentrationstestvektor des Faktors Q

(6)

a

(7)

(LQOHLWXQJXQG=LHOVWHOOXQJ

Die dauerhafte Isolierung radioaktiver Stoffe vom Lebensraum der Bevölkerung ist eine der großen wissenschaftlichen Herausforderungen unserer Zeit. Radioaktive Stoffe fallen bei der friedlichen und militärischen Nutzung der Kernenergie, d.h. bei der Uranerzgewinnung und –aufarbeitung, bei der Erzeugung und Verarbeitung von Brennelementen und bei der Produktion und dem Test von Kernwaffen an. Dabei und auch durch nukleare Störfälle kam es zu teilweise großflächigen Konta- minationen, besonders in den USA und der ehemaligen Sowjetunion [1].

In den Gebieten Sachsens und Thüringens wurden in der Zeit von 1946 bis 1990 insgesamt 220 000 Tonnen Uran durch die Wismut AG gewonnen [2]. In dieser Zeit war die ehemalige DDR der viertgrößte Uranerzeuger der Welt. Die Hinter- lassenschaften der in den relativ dicht besiedelten Gebieten betriebenen Uranerzgewinnung sind neben den weitverzweigten Grubensystemen die Aufarbeitungsanlagen, die zur Verarbeitung des Uranerzes notwendig waren und die Abraumhalden. Von diesen Hinterlassenschaften, welche noch nennenswerte Mengen an Uran und anderen Schwermetallen enthalten, geht die Gefahr der Freisetzung und Ausbreitung radioaktiver Stoffe aus. Um die Gefahr einer Ausbreitung von Uran und dessen Zerfallsprodukte in der Geosphäre abschätzen zu können sind umfangreiche wissenschaftliche Untersuchungen zur Wechselwirkung dieser Elemente mit umweltrelevanten Stoffen erforderlich. Jede Maßnahme zur Stillegung und der Rückbau der Anlagen der Uranerzgewinnung muß durch eine wissenschaftlich gesicherte Risikoabschätzung zum Ausbreitungsverhalten der Radionuklide begründet sein, weil damit ein Eingriff in die bestehende Chemie zwischen den Radionukliden und ihrer geochemischen Umgebung erfolgt. Die geochemische Umgebung der Radionuklide wird von den vorliegenden physikochemischen Parametern (Temperatur, Druck, pH- und Eh-Wert, Ionenstärke) und den vorliegenden anorganischen und organischen Verbindungen bestimmt.

Damit wird deutlich, daß eine geeignete Risikoabschätzung der bei der Ausbreitung von Radionukliden eintretenden makroskopischen Effekte, nur durch die gezielte Untersuchung der auf mikroskopischer bzw. molekularer Ebene stattfindenden Wechselwirkungsmechanismen zwischen den Radionukliden und ihrer geo- chemischen Umgebung ermöglicht werden kann. So ist die Erforschung der

(8)

Wechselwirkungsmechanismen zwischen den Radionukliden mit Kolloiden, wasserlöslichen Verbindungen und der Sorption gelöster und partikulärer Radionuklidspezies an mineralischen Oberflächen, sowie Untersuchungen zur Löslichkeit der gebildeten Radionuklidspezies die Aufgabe radioökologischer Untersuchungen [3]. Außerdem sind die Wechselwirkungen zwischen den Radionukliden und den in der Geosphäre vorkommenden lebenden Organismen, wie Pflanzen und Bakterien, zu berücksichtigen.

Die Flutung der Uranbergwerke ist eine wesentliche Maßnahme zur deren Stillegung und bedeutet einen Eingriff in die bestehenden Stoffkreisläufe. Eine der ergiebigsten Lagerstätten, Schlema/Alberoda, umfaßt beispielsweise ein weit verzweigtes Grubensystem mit einem bergmännischen Gesamtvortrieb von mehr als 4 000 km in einer Teufe bis zu 1 800 m [4]. Zur Stabilisierung der Schächte wurden 4 Millionen m3 Holz verwendet. Der entstandene Hohlraum hat ein Gesamtvolumen von 36 Millionen m3. Aufgrund der großen Teufe treten in den gefluteten Bergwerken Temperaturen bis zu 65o C und Drücke bis zu 20 MPa auf. Diese geochemischen Vorortbedingungen sorgen für den hydrothermalen und bakteriellen Abbau des Grubenholzes und führen zur Freisetzung seiner Degradationsprodukte (Holzabbauprodukte) [5]. Die phenolischen Degradationsprodukte können mit Uran im wäßrigen Medium Komplexe bilden und dabei wesentlich auf das Migrationsverhalten von Uran Einfluß nehmen. Der vorliegende pH-Wert hat einen entscheidenden Einfluß auf die Wechselwirkung zwischen Uran und den Degradationsprodukten. Protocatechusäure stellt ein Degradationsprodukt dar und bildet mit Uran sehr stabile wasserlösliche Komplexe [6]. Die Untersuchung der pH-abhängigen Komplexierung von Uran durch Protocatechusäure nimmt damit eine besondere Bedeutung zur Abschätzung des Migrationsverhaltens des Urans, im Falle einer Flutung der Uranbergwerke ein.

Bakterien sind die am häufigsten in der Biosphäre vorkommenden Organismen.

Einige Bodenbakterienarten besitzten eine enorme Anpassungsfähigkeit an die vorliegenden Umweltbedingungen. Zum Beispiel haben die mit Schwermetallen kontaminierten Böden von Abraumhalden der Uranerzgewinnung auf die biologische Aktivität bestimmter Bakterienarten keinen negativen Einfluß. So konnte beispiels- weise eine Bakterienart, 'HVXOIRPLFURELXP EDFXODWXP, aus uranhaltigen Abfällen

(9)

einer Abraumhalde isoliert werden, welche aufgrund ihres Metabolismus die Fähigkeit besitzt U(VI) zu U(IV) zu reduzieren [7, 8]. Da im wäßrigen Medium U(IV) eine geringere Löslichkeit als U(VI) besitzt, ist dieses Bakterium in der Lage, die Mobilität des Urans durch Bildung wasserunlöslicher U(IV)-Verbindungen zu reduzieren. Die Untersuchung der Effektivität der Reduktion von U(VI) zu U(IV) durch spezielle Bakterienarten ist deshalb ein wesentlicher Bestandteil radioökologischer Forschungen, da diese speziellen Bakterienarten ein großes Potential für die Bioremediation der mit Uran kontaminierten Hinterlassenschaften des Uranerzberg- baues darstellen.

Neben den im Erzgebirge vorkommenden Uranmineralien liegt Arsen vor. Die Grubenabwässer einiger stillgelegter Uranbergwerke enthalten Arsen in einer Konzentration von bis zu 10 mg/l. In den Absetzbecken der stillgelegten Uranerzaubereitungsanlagen ist die zehnfache Arsenkonzentration nachweisbar.

Von den vorliegenden Oxidationszuständen des Arsens und deren Konzentrations- verteilung können Rückschlüsse auf das Redoxpotential der Abwässer gezogen werden. Die Kenntnis des Redoxpotentials der Abwässer ist für die Bestimmung der vorliegenden chemischen Spezies von Radionukliden, wie Thorium und Radium, und damit zur Planung und Effektivitätssteigerung von Wasseraufbereitungssystemen von großer Bedeutung [9].

Zur Aufklärung der Wechselwirkung zwischen den Radionukliden und ihrer umweltrelevanten chemischen Umgebung werden spektroskopische Verfahren eingesetzt. Neben der Bestimmung des Redoxzustandes der Metalle kommt der Aufklärung der Struktur der Metallspezies eine zentrale Bedeutung zu [10]. Die seit den siebziger Jahren auf vielen Gebieten der Physik, Chemie, Biologie, Materialwissenschaften eingesetzte Röntgenabsorptionsspektroskopie (XAS) ist die einzige Methode, mit der die Struktur, d.h. die Bindungsabstände, die Art und Anzahl der Nachbaratome der unmittelbaren Umgebung eines Metallatoms in amorphen Feststoffen und flüssigen Proben direkt bestimmt werden kann [11-14]. Wie bei anderen spektroskopischen Verfahren bildet sich bei der EXAFS-Strukturanalyse (EXAFS - Extended X-ray Absorption Fine Structure) das gemessene EXAFS-Signal aus der Summe der spektroskopischen Beiträge aller in der Mischung vorliegenden Komplexe des Metallions. Die von diesem EXAFS-Spektrum mit Hilfe von

(10)

konventionellen, standardisierten Auswertealgorithmen erhaltenen Strukturparameter sind daher ein Mittelwert über alle vorhandenen Komplexe des betreffenden Metallions. Da in umweltrelevanten Proben das zu untersuchende Metall in Abhängigkeit von den geochemischen Bedingungen und physikochemischen Parametern häufig verschiedene chemische Spezies gleichzeitig bildet, war es das Ziel dieser Arbeit, ein Verfahren für die EXAFS-Analyse von Mischungen verschiedener Metallspezies zu entwickeln. Mit Hilfe dieses Verfahrens sollte es möglich werden, den Anteil und die Struktur der verschiedenen Spezies in einer Mischung mit Hilfe der EXAFS-Spektroskopie zu bestimmen.

Ausgangspunkt für das zu entwickelnde Verfahren ist die bereits für ähnliche Problemstellungen in der Chromatographie, IR- und UV-VIS-Spektroskopie eingesetzte statistische multivariate Methode der Faktorenanalyse [15-22]. Falls es innerhalb einer Probenserie zu einer Variation in den Röntgenabsorptionsspektren kommt, kann mit Hilfe der Faktorenanalyse die Zahl der reinen spektroskopischen Komponenten (Metallkomplexe) ermittelt werden. Anschließend können die EXAFS-Spektren der reinen Metallkomplexe isoliert und ihre Molekülstrukturen mit den herkömmlichen EXAFS-Auswerteverfahren bestimmt werden. Die Konzen- trationsverteilung der Metallkomplexe kann als Funktion des variierten physikochemischen Parameter berechnet werden, ohne das die Spektren der reinen Metallkomplexe gegeben sein müssen.

In der Literatur ist die Anwendung der Faktorenanalyse auf die kantennahe Feinstruktur des Röntgenabsorptionsspektrums (XANES - X-ray Absorption Near- Edge Structure) beschrieben [23-29]. Derzeit wird mit Hilfe der Faktorenanalyse der EXAFS-Bereich von Röntgenabsorptionsspektren nur qualitativ untersucht [30, 31].

Deshalb war es das Hauptanliegen dieser Arbeit, die Anwendung der Faktorenanlyse auf die Röntgenabsorptionsspektroskopie zu verallgemeinern und als quantitative Analysemethode auf den EXAFS-Bereich zu erweitern. Diese Zielstellung ist unter Berücksichtigung der dargelegten aktuellen Schwerpunkte radioökologischer Forschungen untergliedert in:

1. Auswahl eines geeigneten Algorithmus zur Faktorenanlyse von XANES- und EXAFS-Spektren. Entwicklung einer entsprechenden Computer-Software und ihre Überprüfung bzw. Testung.

(11)

2. Anwendung der Faktorenanlyse auf XANES-Spektren von wäßrigen Lösungen, die Uran bzw. Arsen in zwei verschiedenen Oxidationszuständen enthalten.

Vergleich der Ergebnisse mit denen der Auswertemethode der Linearkombination von Referenzspektren. Anwendung der Faktorenanalyse auf die Bestimmung des Oxidationszustandes von Uran nach dem Metabolismus durch das Bakterium

'HVXOIRPLFURELXPEDFXODWXP.

3. Anwendung der Faktorenanalyse auf EXAFS-Spektren von wäßrigen Uranyllösungen. Überprüfung der verwendeten Algorithmen anhand des chemisch gut charakterisierten Systems Uran(VI)/Essigsäure. Erstmalige Be- stimmung der pH-abhängigen Komplexierung für Komplexe von Uran(VI) mit dem Holzabbauprokukt Protocatechusäure.

(12)

'LH)DNWRUHQDQDO\VH

Die Faktorenanalyse zählt in der modernen Analytik zu den 3DWWHUQ 5HFRJQLWLRQ

(PARC) Methoden und dient wie die Clusteranalyse und die Diskriminanzanalyse zur explorativen Untersuchung multivariater Systeme [32, 33]. Das Potential der Faktorenanalyse ist in naturwissenschaftlichen Bereichen noch nicht ausgeschöpft.

Innerhalb der Grundlagenforschung und umweltrelevanter Forschungen kommt der Analyse von komplexen Multikomponentensystemen eine besondere Bedeutung zu.

Das Ziel des analytischen Prozesses ist die Charakterisierung der Komponenten.

Durch den multivariaten Charakter der Beobachtungsgrößen ist die Anwendbarkeit konventioneller Analyseverfahren begrenzt.

Inspiriert von diesem Problem beschreibt PEARSON in einem Artikel EHUÄ2Q/LQHV DQG 3ODQHV RI &ORVHVW )LW WR 6\VWHPV RI 3RLQWV LQ 6SDFH“ bereits 1901 eine allgemeine Prozedur zur Lösung solcher multivariater Probleme [34]. Dieser Artikel wird in der Literatur oft als maßgeblicher Beitrag zur Begründung der Faktorenanalyse für die Naturwissenschaften gewürdigt. Bis zum Beginn der 70er Jahre, der Formulierung der Chemometrie, stand die Faktorenanalyse noch im Hintergrund [35]. Einige Varianten der Faktorenanalyse lieferten bis dahin inkonsistente Ergebnisse. Der Grund dieser Tatsache resultierte auf die zur Zeit der

SUHFRPSXWHU HUD zur Verfügung stehenden beschränkten Rechenkapazitäten [35].

Individuelle Vereinfachungen mußten zur Lösung spezieller Probleme getroffen werden, um den Rechenaufwand überschaubar zu gestalten. Die fortschreitende Entwicklung der Rechnerarchitektur gewährleistet in der heutigen Zeit die Möglichkeit einer schnelleren problemorientierten Adaption der Faktorenanalyse an speziellen Aufgaben.

(13)

'LH $XIJDEH XQG GDV =LHO GHU )DNWRUHQDQDO\VH PDWKHPDWLVFKH

%HVFKUHLEXQJ

Im allgemeinen können komplexe Phänomene durch Faktoren beschrieben werden.

Faktoren sind latent und meist nicht direkt meßbar. Hinter einer relativ komplexen Variation von Beobachtungsgrößen verbirgt sich meist eine relativ geringe Anzahl von Faktoren, deren Einfluß in Abhängigkeit zu den gewählten Meßbedingungen steht. Die Intensität des Einflusses eines Faktors auf die Beobachtungsgrößen kann quantisiert werden. Die Beobachtungsgrößen sind Variablen, deren Varianz aus dem gemeinsamen Wirken von Faktoren resultiert. Ein einfaches Modell soll dies verdeutlichen [36]. Wenn die Beobachtungsgrößen bzw. Variablen ; von den Intensitäten bzw. Faktorladungen $ der Faktoren ) linear abhängig und die Eineindeutigkeiten 8 der zugeordneten ; untereinander mit den ) unkorreliert sind, dann kann ; als Linearkombination der ) modelliert werden, Gl. (2.1).

; = $1)1 + $2)2 +...+ $ ) + 8 mit L = 1,...,S (2.1) Sind die gemeinsamen Faktoren ) voneinander linear unabhängig, dann gilt das Fundamentaltheorem der Faktorenanalyse, Gl. (2.2) (; sei standardisiert) [36]:

5 = $$' (2.2)

Die Matrix 5 ist die Korrelationsmatrix der ; und berechnet sich aus dem Produkt der Faktorladungsmatrix $ und ihrer Transponierten. Wenn die Faktoren und deren Anzahl sowie deren Faktorladungen unbekannt sind, so beschränkt sich die Analyse auf die Korrelationsmatrix der ;, oder auch auf die Kovarianzmatrix der nicht standardisierten ;.

In der Spektroskopie umfaßt die Analyse von Multikomponentensystemen die Identifizierung der einzelnen Komponenten und deren Konzentrationen. Die einzelnen Komponenten sind meist nicht direkt analytisch zugänglich und können somit nicht voneinander separiert werden. In vielen Fällen ist auch die Anzahl der enthaltenen Komponenten unbekannt. Falls sich unter diesen Bedingungen das Meßsignal aus der Linearkombination der Beiträge der einzelnen Komponenten

(14)

bildet, dann ergibt sich, ähnlich zu Gl. (2.1), ein Modellansatz für die Faktoren- analyse. Ein Beispiel aus der Flüssigchromatographie soll diese Zusammenhänge verdeutlichen.

Eine Mischung einer unbekannten Anzahl Q verschiedener chemischer Komponenten wird einer Trennsäule zugegeben. Ein nach der Trennsäule angebrachtes UV-VIS Spektrometer soll während der Eluierung zu verschiedenen Zeiten simultan die Absorption innerhalb eines gegebenen Wellenlängenbereiches aufnehmen. Falls die Rf-Werte der Komponenten dicht beieinander liegen, kommt es zur unvollständigen Trennung und dadurch zu Überlappungsgebieten der chromatographischen Maxima.

Die Anzahl der aufgenommenen Spektren soll N betragen. Die totale Absorption, $ , bei der Wellenlänge l des Spektrums N kann durch das Lambert-Beersche Gesetz wie folgt beschrieben werden:

Ê

=

FHG

$

1

)

(l (2.3)

Hier ist G die Schichtdicke, H die unbekannte Extinktion der Komponente M bei der Wellenlänge l und F die Konzentration der Komponente M In diesen Multi- komponentensystemen kann die Konzentrationsverteilung der Komponenten als eine Funktion der Meßbedingungen aufgefaßt werden. Eine infinitesimale Änderung der Meßbedingungen, die hier durch die Probennahme bei verschiedenen Eluierungszeiten gewährleistet ist, wird eine infinitesimale Variation der Konzentrationsverteilung der Komponenten hervorrufen. Durch diese Untersuchung entstehen Spektren, deren Varianz allein durch die Variation der Anteile der Komponenten, als Funktion der Eluierungszeit, beeinflußt wird. Gesucht sind die Anzahl, die Spektren und die Konzentrationsverteilung der reinen Komponenten bei den verschiedenen Eluierungszeiten. Da nur die Spektren der Mischungen und die Eluierungszeiten gegeben sind, beschränkt sich die weitere Untersuchung auf die Varianz der Spektren.

Das aufgezeigte Beispiel stellt eine der praktischen Aufgaben dar, die mit Hilfe der Faktorenanalyse lösbar ist. Um zu einer allgemeinen mathematischen Beschreibung

(15)

der Aufgabenstellung und der Faktorenanalyse zu gelangen, wird im folgenden eine in der vorliegenden Arbeit konsistent benutzte mathematische Symbolik eingeführt.

0DWKHPDWLVFKH6\PEROLN

In der relevanten Literatur tritt häufig eine inkonsistente mathematische Symbolik auf.

Die von MALINOWSKI verwendete Symbolik wird in der vorliegenden Arbeit benutzt [35]. Aus der Literatur übernommene mathematische Formulierungen werden, wenn nötig, auf die hier dargestellte Symbolik angepaßt.

Die mathematische Beschreibung der Faktorenanalyse umfaßt das Gebiet der Linearen Algebra und beinhaltet somit Skalare, Vektoren und Matrizen.

Der Skalar

Skalare werden in Kleinbuchstaben dargestellt. Tiefgestellte Kleinbuchstaben charakterisieren den Skalar.

Beispiel:

E ist ein Skalar bzw. eine Zahl.

Der Vektor

Vektoren werden mit fettgedruckten Kleinbuchstaben dargestellt. Ein tiefgestellter Kleinbuchstabe charakterisiert den Vektor als eindimensionales Feld. Die am häufigsten verwendeten Vektoren sind sogenannte Spaltenvektoren. Deshalb wird bei der Verwendung eines Zeilenvektors mit einem hochgestellten Anstrich besonders darauf hingewiesen.

Beispiel:

ß ß ß à Þ

Ï Ï Ï Ð Î

=

E E E

3 2 1

E ist der N’te Spaltenvektor.

[ ]

EEE K=

E ist der i’te Zeilenvektor.

(16)

Die Matrix

Fettgedruckte Großbuchstaben in eckigen Klammern eingerahmt oder ohne Klammern symbolisieren Matrizen. Für Matrixtransformationen gelten die in der Mathematik gebräuchlichen Bezeichnungen.

Beispiel:

[ ]

ß ß ß à Þ

Ï Ï Ï Ð Î

=

=

32 31

22 21

12 11

E E

E E

E E

%

% ist eine Matrix mit dem Format (3,2).

[ ] ß

à Þ Ï

Ð

=Î

=

32 22 12

31 21

11

E E E

E E E

%

% ist die Transponierte Matrix mit dem Format (2,3).

Im folgenden werden häufig verwendete Matrizen eingeführt, die in der Faktoren- analyse eine besondere Bedeutung haben.

' ist die sogenannte Datenmatrix und enthält die Meßdaten G .

'ˆ and '~

repräsentieren aus mathematischen Operationen hervorgegangene Näherungen für '.

Die Datenmatrix'ist das Ergebnis der Reproduktion von ' unter Verwendung des reduzierten Faktorraumes.

Weitere im Text konsistent benutzte Formulierungen sind:

( 2)1/2 (UU)1/2

U = ÊU = ist die Norm des Vektors U.

L ist eine Diagonalmatrix und beinhaltet die Eigenwerte in ihrer Diagonalen.

(17)

'LH$QDO\VHGHU9DULDQ]

Die aufgeführten mathematischen Formulierungen folgen im wesentlichen [35]. Das o.g. Beispiel aus der Flüssigchromatographie soll nun näher untersucht werden.

Gleichung (2.3) kann entsprechend der eingeführten mathematischen Symbolik in Gl. (2.4) überführt werden. Mit U =GH (G ist die Schichtdicke) ist:

F N

Q M

U L

F U G

, , 1

, , 1

, , 1 mit

1 K

K K

=

=

=

=Ê (2.4)

Auf der linken Seite der Gleichung (2.4) befinden sich die experimentellen Meßwerte

G , welche sich aus den Summen der Faktoren bzw. Produktterme der Kofaktoren r und c ergeben. Die Anzahl der Produktterme, Q, wird als Anzahl der Faktoren bezeichnet. Die Gesamtzahl der Spektren beträgt F. Jedes Spektrum besteht aus U

Meßpunkten.

In Matrixschreibweise kann Gl. (2.4) wie folgt formuliert werden:

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

= ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

F F

F

F F

F

F F

F

U U

U

U U

U

U U

U

G G

G

G G

G

G G

G

L M M

M

L L

L M M

M

L L

L M M

M

L L

2 1

2 22

21

1 12

11

2 1

2 22

21

1 12

11

2 1

2 22

21

1 12

11

(2.5)

bzw.

' = 5& (2.6)

Die Matrix ' wird als Datenmatrix bezeichnet und enthält die experimentellen Spektren in ihren Spalten. Das Format der Datenmatrix ist (U,F). Die Matrix 5 enthält in ihren Spalten die Spektren der reinen Komponenten und hat das Format (U,Q). Die Konzentrationensverteilung der reinen Komponenten in den Spektren wird in der Matrix & zusammengefaßt. Das Format der Matrix & ist (Q,F). Da die Spaltenanzahl von & mit der Spaltenanzahl der Datenmatrix gleich ist, wird diese Matrix auch als

(18)

Spaltenmatrix bezeichnet. Die Matrix 5 wird dementsprechend als Zeilenmatrix bezeichnet, weil die Datenmatrix eine identische Anzahl von Zeilen hat. Es ist möglich, eine einfache Beziehung zwischen der mathematischen und der physikalischen Betrachtungsweise herzustellen. In den Spalten der Zeilenmatrix 5

befinden sich die Spektren der Hauptkomponenten oder auch einfach Faktoren. Die zugeordnete Spaltenmatrix & enthält folglich die Faktorladungen bzw. Konzen- trationen und kann als Faktorladungsmatrix bezeichnet werden.

Mit der Voraussetzung des in Abschnitt 2.1. aufgezeigten Beispiels aus der Flüssigchromatographie besteht für die Faktorenanalyse das Ziel der Ermittlung der Zeilenmatrix und der Spaltenmatrix unter Verwendung der Datenmatrix. Von grundlegender Bedeutung ist die Bestimmung des Ranges der gegebenen Datenmatrix. Der Rang ist gleich der Anzahl der Hauptkomponenten des Systems.

Bevor näher auf die konkrete Vorgehensweise zur Ermittlung des Ranges und von 5

und & eingegangen wird, soll zunächst Gl. (2.4) näher untersucht werden.

Wenn angenommen wird, daß die Datenmatrix und die Zeilenmatrix bekannt sind, dann stellt Gl. (2.4) ein inhomogenes Gleichungssystem [37] dar, weil für jedes N, mit

N = 1,...,F, mindestens ein Element der Datenmatrix G , mit L = 1,...,U, verschieden von Null ist. Zwischen den Meßwerten G und den Faktorladungen F besteht ein linearer Zusammenhang. Es handelt sich deshalb unter diesen Voraussetzungen bei Gl. (2.4) um ein inhomogenes lineares Gleichungssystem. Ein solches Gleichungssystem besteht aus einer Koeffizientenmatrix, 5, und den Lösungs- vektoren F . Die Linearkombination der Koeffizientenmatrix mit den Lösungsvektoren ergibt den linearen Vektorraum, in dem das Gleichungssystem existiert. Wenn dieses Gleichungssystem für einen speziellen Spaltenvektor der Matrix ', G , konstruiert wird, so ergibt sich unter der Annahme, daß 5 eine Matrix des Formates (U,Š) ist:

5F = G (2.7)

(19)

In ausführlicher Form ist:

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

= ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

G

G G

F F F

U U

U

U U

U

U U

U

M M

L M M

M

L L

2 1 2

1

2 1

2 22

21

1 12

11

(2.8)

Wenn die Basis des linearen Vektorraumes des Gleichungssystemes von Q linear unabhängigen Basisvektoren gebildet wird, so befinden sich in der Matrix 5 genau

ŠQ linear abhängige Spaltenvektoren U. Unter diesen Bedingungen kann das Format der Matrix 5 auf (U,Q) und die Anzahl der Zeilen von F auf Q beschränkt werden. Der Rang von 5 ist somit Q und man bezeichnet den von den linear unabhängigen Spaltenvektoren U aufgespannten Raum auch als Q-dimensionalen Faktorraum [37].

Zur Bildung des gegebenen Spaltenvektors G gibt es dann genau einen Lösungsvektor F mit der Zeilenanzahl Q. Das bedeutet, daß innerhalb eines Systems ein experimentell gemessenes Spektrum G einer beliebigen Mischung eindeutig aus den Q linear unabhängigen Spektren der Hauptkomponenten reproduziert werden kann, da diese die Basis des Faktorraumes darstellen, in der das Gleichungssystem existiert. Unter der Annahme, daß in den gemessenen Proben die Haupt- komponenten auch in reiner Form auftreten können, gelangt man zu folgender Formulierung:

Wenn die Spaltenvektoren von 5 eine Anzahl von F Spektren der Mischungen aller möglichen Konzentrationenverteilungen der Hauptkomponenten eines Systemes enthalten, dann gibt es eine definierte Anzahl Q von linear unabhängigen Spaltenvektoren in 5, aus denen sich alle Spektren der Mischungen mit den entsprechenden Lösungsvektoren F bilden lassen. Diese linear unabhängigen Spektren bzw. Faktoren sind aber gerade die Hauptkomponenten des Systems und stellen dessen Basisvektoren dar. Der Faktorraum hat jetzt die Dimension Q. Die Lösungsvektoren F haben folglich Q Zeilen und können in eine Matrix, &, zusammengefaßt werden. Das Format von 5 ist entspechend des Ranges Q

gleich (U,Q).

(20)

Wenn nur die experimentellen Spektren gegeben sind, dann folgt aus diesen Überlegungen, daß die Aufgabe darin besteht, den Rang der Datenmatrix zu bestimmen und eine geeignete Basis des Faktorraumes zu finden. Mittels univariater Methoden ist es z.B. möglich, den Rang der Datenmatrix abzuschätzen, indem die Spektren gesucht werden, welche sich von allen verbleibenden Spektren am stärksten unterscheiden. Dazu können im vereinfachten Fall die Varianzen, ] , der Spektren herangezogen werden, Gl (2.9).

Ê!

=

"

# #$

$%$ G

]

1

2 mit

F N

U L

,..., 1

,..., 1

=

= (2.9)

Unter Verwendung der Spektren mit der größten oder stark unterschiedlicher Varianz gelingt meist der Versuch, die Spektren der Serie durch eine Linearkombination zu reproduzieren. Diese Spektren stellen innerhalb einer Meßserie gewissermaßen linear unabhängige Vektoren dar, weil sie nicht unter Zuhilfenahme der verbleibenden Spektren reproduziert werden können. Die mit der Methode der Linearkombination erhaltene Konzentrationsverteilung wird jedoch nicht der wahren Konzentrationsverteilung der gewählten linear unabhängigen Spektren in den Spektren der Meßserie entsprechen, wenn diese selbst Spektren von Mischungen darstellen oder eine nicht berücksichtigte Komponente enthalten. Nur durch die Analyse der gesamten Varianz und Kovarianz der Meßdaten gelingt die Charakterisierung der tatsächlichen Hauptkomponenten des untersuchten Systems [33]. Die Faktorenanalyse berücksichtigt in diesem Zusammenhang, als eine multivariate Analysemethode nicht nur die einzelnen Varianzen, sondern die gesamte Kovarianzmatrix der experimentellen Daten, Gl. (2.10).

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

=

=

&%&

&

& &

&

] ]

]

] ]

]

] ]

]

K M M

M

K K

2 1

2 22

21

1 12

11

' '

= (2.10)

Das Format der so erzeugten Kovarianzmatrix ist (F,F). Es ist auch möglich, die Kovarianzmatrix nach Gl. (2.11) zu bilden, wobei die Ergebnisse der nachfolgenden Schritte sich nicht unterscheiden würden [35].

(21)

= = ''’ (2.11) Es ist ersichtlich, daß das Format von =, unter Verwendung von Gl. (2.11), (U,U) ist.

Da jedoch bei den meisten Messungen die Anzahl der Datenpunkte pro Spektrum größer als die Anzahl der vorhanden Spektren ist, und die Optimierung des Rechenzeitaufwandes an dieser Stelle eine große Bedeutung hat, wird in der vorliegenden Arbeit ausschließlich von der mittels Gl. (2.10) berechneten Kovarianzmatrix Gebrauch gemacht.

Um zunächst eine anschauliche Verbindung zwischen Faktorraum, Kovarianzmatrix und Datenmatrix zu vermitteln, wird im folgenden statt der Kovarianzmatrix die Korrelationsmatrix der Meßdaten verwendet. Die Korrelationsmatrix wird analog zu Gleichung (2.10) berechnet jedoch mit vorheriger Normierung von '. Die Elemente jeder einzelnen Spalte (Spektrum) von ' werden durch die Norm, G' , der jeweiligen Spalte geteilt und damit normiert, Gl. (2.12). Die Multiplikation der normierten Matrix

'( mit ihrer Transponierten, entsprechend Gl. (2.13) und analog zu Gl. (2.10), liefert die Korrelationsmatrix =( .

2 / 1

2 / 1

1

2 ( ) ) )

*

+ +)

) G GG

G ÜÜ =

Ý Û ÌÌ

Í

=ËÊ, mit N = 1,...,F (2.12)

=( = '( ''( (2.13)

Ausgehend von z.B. zwei Gaußfunktionen, die als Hauptkomponenten eines Systems betrachtet werden sollen, kann mit einem vorgegebenen Konzentrations- profil, durch entsprechende Linearkombinationen mittels Gl. (2.4) bis Gl. (2.6) und Gl. (2.12), eine Datenmatrix, '( , konstruiert werden. Das Konzentrationsprofil der Hauptkomponenten ist in Tab. 2.1 und die Linearkombinationen sind in Abb. 2.1 enthalten.

(22)

7DE: Prozentuale Anteile der Hauptkomponente I und der Hauptkomponente II in den Spektren. N entspricht dem Index des Spaltenvektors G .

N Hauptkomponente I [%] Hauptkomponente II [%]

1 100 0

2 75 25

3 50 50

4 25 75

5 0 100

$EE : Linearkombinationen von zwei Gaußfunktionen entsprechend des in Tab. 2.1 gegebenen Konzentrationsprofiles. Die Nummern an den Funktionen entsprechen den Indizes der Spaltenvektoren G .

In den Spalten von '( befinden sich die zum jeweiligen Argument [ zugehörigen Amplituden der Linearkombinationen. Die Kovarianzmatrix, =( , hat entsprechend Gl.

(2.13) folgende Form:

0.0 0.5 1.0 1.5 2.0 2.5

0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40

Hauptkomponenten Linearkombinationen

Amplitude

[

(23)

1.00000 0.95660 0.77769 0.48546 0.20961

0.95660 1.00000 0.92714 0.71916 0.48546

0.77769 0.92714 1.00000 0.92714 0.77769

0.48546 0.71916 0.92714 1.00000 0.95660

0.20961 0.48546 0.77769 0.95660 1.00000

=

-= (2.14)

Nach Gleichung (2.13) enthält =( das Skalarprodukt aller Paare der Spaltenvektoren

G der Datenmatrix. Da die Datenmatrix normiert wurde, entsprechen die Elemente von =( dem Kosinus des Winkels zwischen den jeweiligen Spaltenvektoren G . Weil die Datenmatrix aus zwei linear unabhängigen Hauptkomponenten gebildet wurde, werden alle linear abhängigen Spaltenvektoren von '( innerhalb der von den Spaltenvektoren der Hauptkomponenten aufgespannten Ebene liegen. Das gilt strenggenommen nur, wenn im Konzentrationsprofil keine negativen Werte zugelassen sind und die Funktionswerte der Hauptkomponenten im Positiven liegen.

Daraus ergibt sich die Schlußfolgerung, daß unter diesen Bedingungen die Hauptkomponenten jene sein werden, die den größten Winkel aufspannen. In diesem Fall bilden Spektum 1 und Spektrum 5 eine Basis des zweidimensionalen Faktorraumes. Eine graphische Darstellung zur vektoriellen Interpretation des Zusammenhanges zwischen Korrelationsmatrix und Datenmatrix ist durch Abb. 2.2 gegeben.

(24)

$EE: Vektorielle Beziehungen zwischen Datenmatrix und Korrelationsmatrix.

Beispielsweise ergibt sich der Winkel zwischen dem Vektor G1 und dem Vektor G3 mit

]1,3 zu 38.9504•. Da die Korrelationsmatrix gleich ihrer Transponierten ist, ergibt sich für ]3,1 der gleiche Winkel. Die Diagonalelemente von =n ergeben einen Winkel von 0•, da das Skalarprodukt eines Vektors mit sich selbst Eins ergeben muß. Mit dem Diagramm von Abb. 2.2 ist es mit Hilfe der linear unabhängigen Spaltenvektoren der Hauptkomponenten möglich, zu einer gegebenen Zeile der Datenmatrix alle Elemente der linear abhängigen Spaltenvektoren abzulesen [35]. Hierzu wird das Lot auf dem Spaltenvektor G1 und G5 gefällt. Der Abstand zur Basis ist gleich dem Wert der Elemente von G,1und G,5 und somit der Amplitude der Hauptkomponenten. Der Schnittpunkt der beiden Geraden sei P. Wenn von P aus das Lot zu den Spaltenvektoren G gefällt wird, dann entsprechen die Abstände der Schnittpunkte auf G zur Basis den Amplituden der Linearkombinationen G in der L’ten Zeile. Für die 3. Linearkombination G3 ergibt sich in der Zeile L = 23 eine Amplitude von 0.2458. Die

0.0 0.1 0.2 0.3 0.4

30°

60°

90°

120°

150°

180°

210°

240°

270°

300°

330°

0.0

0.1

0.2

0.3

0.4

P

G5

G./0 G4

G3

G2

G1

Amplitude

(25)

Zeile 23, der Linearkombination G3, entspricht dem Argument [ = 1.1. Eine be- merkenswerte Eigenschaft dieser graphischen Darstellung ist, daß Vorhersagen zu fehlenden Elementen der Datenmatrix getroffen werden können. Zu einem Datenpunkt der Hauptkomponenten läßt sich mittels der o.g. Prozedur graphisch ein Punkt finden, der auf den von den Linearkombinationen gebildeten Vektoren liegt.

Auf diese Tatsache wird später im Zusammenhang mit der sogenannten Target- transformation eingegangen. Es wurde bereits erwähnt, daß in diesem Beispiel die Spaltenvektoren der Hauptkomponenten den größten Winkel aufspannen, weil diese Komponenten linear unabhängig sind. Es muß in diesem Zusammenhang darauf hingewiesen werden, daß diese Komponenten nur innerhalb der vorliegenden Datenmatrix die Rolle der Hauptkomponenten einnehmen. Es ist z.B. möglich, daß sich die hier genutzten Funktionen der Hauptkomponenten wiederum aus den Linearkombinationen zweier Funktionen bilden lassen, welche nicht in der Datenmatrix enthalten sind. Wenn die Funktionen der Hauptkomponenten aus den Linearkombinationen von zwei anderen Funktionen gebildet werden können, dann werden diese wieder innerhalb der von den neuen Hauptkomponenten aufgespannten Ebene des Faktorraumes liegen. Generell sollten demnach Meßserien so gestaltet werden, daß die Spektren das Maximum der Varianz erreichen [38].

Das aufgezeigte Beispiel beinhaltet zwei Haupkomponenten. Wenn ein Spalten- vektor von ' nicht in der Ebene liegt, so ist der Faktorraum dreidimensional. Es sind dann drei Faktoren notwendig, um die Datenmatrix beschreiben zu können. In vielen Fällen beschreiben mehr als zwei Hauptkomponenten die Meßdaten. Der Faktorraum ist dann graphisch nicht mehr sinnvoll darstellbar. Außerdem wird es mit zunehmender Anzahl von Faktoren schwieriger, eine geeignete Basis zur Be- schreibung des Faktorraumes zu finden.

Wenn es gelingt, Vektoren zu finden, welche nach einer linearen Transformation des Faktorraumes unverändert bleiben, oder in ein Vielfaches (l) ihrer selbst übergehen, so können diese als eine geeignete Basis des Faktorraumes definiert werden. Die zu lösende Aufgabe besteht darin, die Vektoren T zu finden, für die gilt:

=( T = lT (2.15)

(26)

Gleichung (2.15) stellt eine Eigenwertaufgabe dar und l wird folglich als Eigenwert bezeichnet [37].

Der linke Term von Gl. (2.15) kann als Skalarprodukt aufgefaßt werden. Der Kosinus des Winkels zwischen dem Vektor T und einem Zeilen- oder Spaltenvektor ]1

entspricht dem Produkt aus l und dem Element den N’ten Zeile von T. Die Korrelationsmatrix kann somit durch die Vektoren, welche Gl. (2.15) erfüllen, unverändert dargestellt werden Gl. (2.16) und (2.17).

=( = l1T1T1'+ l2T2T2' +...+ l2T2 T2' (2.16) Die einzelnen Vektoren T bilden die Spalten einer Matrix 4. Da jetzt eine Basis der Eigenvektoren T existiert, können die Spaltenvektoren von '( auch in relativen Winkeln zu den Basisvektoren T, ähnlich zu Abb. 2.2, dargestellt werden. Es ist somit:

µ (]1 ,T3) = cos-1( l5 T45 ) mit N = 1,...,F und M = 1,...,F (2.17)

Der im rechten Term von Gl. (3.17) stehende Ausdruck, l5 T45 , repräsentiert die Faktorenladungen der Eigenvektoren [35]. Maximal können so viele Eigenwerte l

und dazugehörige Eigenvektoren T gefunden werden wie die Korrelationsmatrix Spalten bzw. Zeilen hat. Es kann gezeigt werden, daß die Eigenvektoren orthogonal zueinander sind. Wie später anhand von Gl. (2.36) dargestellt wird, beziehen sich die Basisvektoren T3 auf die Spaltenvektoren der Hauptkomponenten U3von 5, denn die Elemente der Basisvektoren können als Werte eines Skalarproduktes zwischen den normierten G1 und den Vektoren U3aufgefaßt werden. Außerdem ist ersichtlich, daß die Anzahl der notwendigen Basisvektoren zur Beschreibung des Faktorraumes gleich dem Rang der Datenmatrix sein muß. Für das o.g. Beispiel ergibt sich, daß die Anzahl der neuen Basisvektoren gleich zwei ist, denn mit zwei Hauptkomponenten ist die gesamte Varianz der Daten zu erklären. Für dieses Beispiel ergibt sich ein zu Abb. 2.2 ähnliches Diagramm für die Darstellung des zweidimensionalen Faktorraumes, Abb. 2.3.

(27)

$EE: Darstellung des Faktorraumes mittels der neuen Basisvektoren T1 und T2. Bei einem Vergleich der Abbildung 2.2 und 2.3 kann leicht überprüft werden, daß die Winkel zwischen den Spaltenvektoren G1 unverändert bleiben. Der Vektor G3 liegt auf dem Basisvektor T1. Die Ursache hierfür ist, daß der erste Eigenvektor gleich zu dem Vektor ist, der aus der Mittelung aller Linearkombinationen entsteht. Die Linear- kombination 3 stellt einen solchen Vektor dar. Es kann somit geschlußfolgert werden, daß der dem ersten Eigenvektor T1 entsprechende Spaltenvektor U1 der Matrix 5

ähnlich zum dritten Spaltenvektor der Datenmatrix sein muß. Der Winkel zwischen diesen Vektoren ist 0•. Sämtliche Linearkombinationen bzw. Spaltenvektoren der Datenmatrix können entsprechend der o.g. graphischen Auswertung unter Verwendung der Abb. 2.3 aus den Basisvektoren T1 und T2 bzw. U1 und U2 gebildet werden. Die nach der linearen Transformation durch Gl. (2.15) hervorgegangenen Eigenvektoren T müssen nicht den realen Basisvektoren der Datenmatrix entsprechen. Sie stellen gewissermaßen eine rein mathematische Basis des Faktorraumes dar und werden deshalb auch als abstrakte Hauptkomponenten oder abstrakte Faktoren bezeichnet. Bevor auf den Zusammenhang zwischen der neuen

0.0 0.1 0.2 0.3 0.4

30°

60°

90°

120°

150°

180°

210°

240°

270°

300°

330°

0.0

0.1

0.2

0.3

0.4

T2 T1

G5 G4

G3 G 2

G1

Amplitude

(28)

Basis des Faktorraumes und der Darstellung der Gl. (2.6) eingegangen wird, kann zusammenfassend Folgendes festgestellt werden:

1. Die Datenmatrix, welche mittels Gl. (2.6) erzeugt wurde, kann unter Zuhilfenahme der Korrelationsmatrix, Gl. (2.13), im Faktorraum vektoriell dargestellt und interpretiert werden, Abb. 2.2.

2. Die Lösung der Eigenwertaufgabe liefert eine orthogonale Basis von Eigenvektoren. Die Eigenvektoren verkörpern die abstrakten, latenten Haupt- komponenten, welche in der Datenmatrix enthalten sind.

3. Der gesamte Faktorraum und damit die Datenmatrix können mittels ihrer Eigenvektoren dargestellt werden, Abb. 2.3.

4. Es werden nicht alle Eigenvektoren benötigt, um die Spaltenvektoren der Datenmatrix zu reproduzieren.

Die für das Beispiel verwendete Datenmatrix entstand durch Anwendung von Gl. (2.6). Die aus der Korrelationsmatrix, durch lineare Transformation, hervor- gegangenen orthogonalen Basisvektoren T ermöglichen mit den dazugehörigen Eigenwerten l eine Rekonstruktion der Datenmatrix. Somit kann der Faktorraum mit dem auf der rechten Seite von Gl. (2.15) stehenden Term dargestellt werden. Wenn die Eigenwerte und die Eigenvektoren in Matrixform dargestellt werden, und unnormierte Daten benutzt werden, dann ergibt sich analog zu Gl. (2.15) die Gleichung (2.18). Bei Verwendung normierter Daten, ist = durch =( zu erstetzen.

=4 = L4 (2.18)

mit

L = [l3d31 ] (2.19)

Ó Ò Ñ

=

ž

=

N M

N M

67

n wen 1

n wen

d 0

(d31 - „Kronecker Delta“)

(29)

Die Lösung der Eigenwertaufgabe nach den Gleichungen (2.18) und (2.19) bedeutet eine Transformation der Matrix = auf die Matrix L. Da = eine symmetrische Matrix ist, kann dies durch eine Ähnlichkeitstransformation erreicht werden. Eine symmetrische Matrix kann damit zu einer sehr einfach strukturierten Diagonalmatrix Lüberführt werden.

Die Kovarianzmatrix kann innerhalb einer Ähnlichkeitstransformation [37] als eine diagonalähnliche Matix betrachtet werden. Eine diagonalähnliche Matrix ist der Diagonalmatrix ähnlich, das bedeutet, daß beide Matrizen zu den gleichen Eigenwerten auch die gleiche Anzahl linear unabhängiger Eigenvektoren besitzen.

Für jede diagonalähnliche Matrix = gibt es eine nichtsinguläre Matrix 4, so daß

L = 4-1

=4 (2.20)

eine Diagonalmatrix ist. Da die Diagonalelemente von L gleichzeitig die Eigenwerte von L sind, müssen sie wegen der Invarianz der Eigenwerte gegenüber einer Ähnlichkeitstransformation mit den Eigenwerten l1,l2,...,l2 von = übereinstimmen.

Die linear unabhängigen Eigenvektoren von L sind z.B. H1, H2,...,H2 . Die linear unabhängigen Eigenvektoren von = sind 4H1, 4H2,...,4H2 - das sind aber gerade die

F linear unabhängigen Spaltenvektoren T3 von 4. Diese Transformation entspricht einer Koordinatentransformation der von der Matrix = vermittelten linearen Abbildung im Q-dimensionalen Faktorraum mit den Basisvektoren H3 auf das neue von 4

erzeugte Koordinatensystem von L mit den Basisvektoren T3. Die Ähnlichkeits- transformation stellt damit gleichzeitig eine Streckung bzw. Stauchung der Koordinatenachsen bzw. Hauptachsen dar. Deshalb wird diese Art der linearen Transformation auch als Hauptachsentransformation oder Diagonalisierung von =

bezeichnet [39].

Die Matrix L hat als Diagonalmatrix nun die Form:

ß ß ß ß

à Þ

Ï Ï Ï Ï

Ð Î

=

8l

l l

L M M

M

L L

0 0

0 0

0 0

2 1

L (2.21)

(30)

Die Eigenvektoren von 4 sind orthogonal, es gilt demnach:

4-1

= 4’ (2.22)

Die Eigenvektoren in 4 bilden die nach der Hauptachsentransformation hervorge- gangene linear unabhängige Basis des neuen Koordinatensystemes [35, 40].

Die folgenden Schritte werden zeigen, daß 4 identisch zu & in Gl. (2.6) ist [35].

Wenn es gelingt, auch die Zeilenmatrix 5 ausschließlich unter Verwendung der Datenmatrix ' zu ermitteln, dann kann ' mit Gl. (2.6) reproduziert werden.

Die Gl. (2.20) kann mit Hilfe von Gl. (2.10) zu Gl. (2.23) umformuliert werden:

4-1

=4= 4-1

'''4 (2.23)

Eine Matrix 3 wird eingeführt mit:

3= '4 (2.24)

Mit Gl. (2.22) und Gl. (2.24) ist:

4-1

=4 = 4''''4 (2.25)

= 3'3

Durch Umstellen der Gl. (2.24) nach ' ergibt sich:

' 34' (2.26)

Bei einem Vergleich der Gl. (2.26) mit Gl. (2.6) kann gefolgert werden, daß:

4' = & (2.27)

und 3 = 5 ist.

(31)

Unter Verwendung von Gl. (2.27) und Gl. (2.22) ist:

&-1

= &’ (2.28)

Gleichung Gl. (2.6) kann nach 5 aufgelöst werden, Gl. (2.29).

5 = '&-1

(2.29)

Unter Berücksichtigung der Orthogonalität der Spaltenvektoren von &, entsprechend Gl. (2.28) ist:

5 = '&' (2.30)

Daraus ergibt sich, daß die Datenmatrix ' in Gl. (2.6) durch die Zerlegung der Kovarianzmatrix in ihre Eigenvektoren mit 5& = ' reproduzierbar ist.

Die Winkel µ (]1 ,T3), Gl. (2.17), können auch mittels den Spaltenvektoren U3 und G1

ausgedrückt werden. Die Gl. (2.6) kann mit Hilfe von Gl. (2.30) in der Form

' = U1T1 + U2T2 +...+ UcTc (2.31) formuliert werden.

Die Multiplikation von Gl. (2.31) mit U3' unter Berücksichtigung der Orthogonalität der Vektoren U3 liefert:

U3'' = U3' U3 T3 mit M=1,...,F (2.32) Es kann gezeigt werden, daß

l3 = U3' U3 = Ê9:

; ;<

1

U2 ist. (2.33)

(32)

Mit Gl. (2.32) ist

U3' = l3T3 (2.34)

und

U3'==T3 (2.35)

Eine Kombination von Gl. (2.34) und (2.35) ist äquivalent zu Gl. (2.16). Die Gleichung (2.34) bringt zum Ausdruck, daß die Elemente von T3 den Winkeln zwischen den Spaltenvektoren U3 und den Spaltenvektoren der Datenmatrix G1 entsprechen. Es ist somit:

µ (]1 ,T3) = µ (G1 ,U3) = cos-1( l< T< ) mit N = 1,...,F und M = 1,...,F (2.36)

Gl. (2.36) zeigt, daß die Spaltenvektoren von 5 sich auf die gefundenen orthogonalen Basisvektoren T beziehen. Die Spaltenvektoren von 5 entsprechen den Funktionen der Hauptkomponenten, welche den Q-dimensionalen Faktorraum definieren.

Durch die Änderung des Koordinatensystemes bzw. der Basis zur Beschreibung des Faktorraumes werden Vektoren als auch Matrizen einer Transformation unterworfen.

Deshalb enthalten 5 und &keine physikalisch sinnvollen Werte. Die Matrix 5 enthält abstrakte Spektren der Hauptkomponenten und die Matrix & ein abstraktes Konzentrationsprofil der Hauptkomponenten in den experimentellen Spektren. Die Matrizen 5 und & werden unter diesen Bedingungen auch als abstrakte Zeilen- und abstrakte Spaltenmatrix bezeichnet. Mit der Ähnlichkeitstransformation gelingt die Isolierung einer abstrakten Beschreibung von ' unter Verwendung einer auf rein mathematischem Weg isolierten orthogonalen Basis des Faktorraumes.

Es wurde schon darauf hingewiesen, daß die Lösung der Eigenwertaufgabe bzw. die Ähnlichkeitstransformation eine Basis des Faktorraumes liefert, die aus F Eigen- vektoren gebildet wird. Die Kovarianzmatrix hat das Format (F,F) und demzufolge F

Eigenwerte. Jedem Eigenwert l3 ist der jeweilige Eigenvektor T3 bzw. F3' und

(33)

Spaltenvektor U3 von 5 zugeordnet. In Abb. 2.4 sind für das Beispiel die Elemente aller fünf Spaltenvektoren mit den dazugehörigen Eigenwerten der abstrakten Lösung für 5 dargestellt.

$EE : Darstellung der Spaltenvektoren der abstrakten Zeilenmatrix 5. l ist der zugeordnete Eigenwert. (Darstellung mit Offset.)

Aus Abb. 2.4 wird deutlich, daß die Funktion des ersten Spaltenvektors von 5

identisch zur Funktion der dritten Linearkombination im aufgeführten Beispiel ist. Dies stimmt mit der graphischen Darstellung des Faktorraumes in Abb. 2.3 überein. Der Winkel zwischen den Vektoren G3 und U1 ist entsprechend Gl. (2.36) null Grad.

Die Datenmatrix kann mit den gefundenen Matrizen 5 und & vollständig reproduziert werden. Wenn die Matrizen 5 und & die abstrakte Lösung für ' enthalten, dann bezeichnet man die Reproduktion von ' auch als abstrakte Reproduktion. Wie leicht gezeigt werden kann, sind nicht alle Eigenvektoren zur abstrakten Reproduktion von

' notwendig. Die Eigenwerte der Faktoren drei bis fünf sind gleich null, deshalb ist auch die Amplitude der Spaltenvektoren U3 bis U5 gleich Null, Abb. 2.4. Diese abstrakten Komponenten bzw. Faktoren liefern keinen Beitrag zur abstrakten Reproduktion der Datenmatrix. Die Datenmatrix kann durch Multiplikation von 5, mit

0.0 0.5 1.0 1.5 2.0 2.5

0.0 0.5 1.0 1.5 2.0

2.5 l= = 0.00000

l4 = 0.00000

l3 = 0.00000

l2 = 1.07122

l1 = 3.92878

Amplitude

[

Abbildung

Abbildung  4.13  zeigt  den  Vergleich  der  berechneten  Spektren  der  reinen Komponenten  mit  den  experimentellen  Spektren  der  reinen  U(IV)-  und   U(VI)-Verbindungen.

Referenzen

ÄHNLICHE DOKUMENTE

3.4.2 Photometrie 58 3.4.3 Reichweite und photometrische Genauigkeit 58 3.5 Astronomische Interferometrie 61 3.5.1 Theoretischer Hintergrund 62 3.6 Radioastronomie 66

07.03.2018 David Singer ‐

In der Literatur wird diese Definition insofern erweitert, als dass es sich hierbei um ein akut einsetzendes fokales oder globales neurologisches Defizit aufgrund einer

Wie vielfaltig und verschiedenartig die Bedingungen der Steuerredlich- keit sind, aus denen im Experiment die eine oder andere herausgegriffen und isoliert untersucht wird, läßt sich

Hier wird zunächst untersucht, für welche der drei Möglichkeiten auf der Ereigniskarte im neunten Spielzug der dritten Runde sich die Versuchsperson entscheidet. einem der

Dies spricht für die parakrine Rolle von IL-1 β und die autokrine Aufga- be von IL-1 α im Hoden (Dinarello, 1996), die unterstützt wird durch den Befund von Jonsson et al., 2001,

Beim Vergleich der Probanden konnte eine höchstsignifikante Abhängigkeit festgestellt (Kruskall- Wallis Test, p&lt; 0.001). Schlussfolgerung: Der Metallkern beeinflusste

In Bezug auf das K14OVAp Mausmodell soll dieses noch weiter dem humanen PBC Erkrankungsverlauf angepasst werden. Hierfür soll eine Weiterentwicklung des Modells