• Keine Ergebnisse gefunden

Statistische Auswertung und datenbasierte Modellierung von Streichversuchen zur systematischen Identifikation der kritischen Parameter für die Produktqualität

N/A
N/A
Protected

Academic year: 2022

Aktie "Statistische Auswertung und datenbasierte Modellierung von Streichversuchen zur systematischen Identifikation der kritischen Parameter für die Produktqualität"

Copied!
57
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

Statistische Auswertung und datenbasierte Modellierung von Streichversuchen zur systematischen Identifikation der kritischen Parameter für die Produktqualität

Dr. Frank Goedsche, Dr. Josef Eckl

Zusammenfassung

Die Vielzahl der Einflussfaktoren bei der Oberflächenveredlung von Papier und Karton durch den Streichprozess erschwert in vielen Fällen zuverlässige Aussagen zu den Ursachen der Veränderungen in den Laufeigenschaften und der Qualität der Endprodukte. Durch die Kennt- nis der kritischen Parameter des Streichprozesses und deren Gewichtung in Bezug auf die Strichqualität der Papiere werden kostenintensive und zeitaufwändige Versuche zur Strichop- timierung reduziert und die Weiterentwicklungen der Streichsysteme deutlich beschleunigt. Der Einsatz von modellgestützten Prognosewerkzeugen bei der Entwicklung und Optimierung neuer Streichsysteme als Grundaufgabe der VESTRA und zugleich Kernkompetenz der PTS bringt entscheidende Vorteile für eine effiziente Kundenbetreuung. Die Vorhersagbarkeit der Strichqualität in Abhängigkeit von Parametern bezüglich der Rohpapiere, der Streichfarben und des Streichprozesses führt zu deutlichen Vereinfachungen bei der Entwicklung neuer in- novativer Strichsysteme und deren zielgerichteter Abstimmung auf die einzusetzenden Roh- papiere. Dies gilt sowohl für Pilotanlagen als auch für industrielle Streichanlagen.

Der umfangreiche Datenpool der VESTRA-Pilotanlage bietet hervorragende Voraussetzungen für die Entwicklung von modellgestützten Prognosewerkzeugen, prinzipiell können aber auch die Datenpools von industriellen Streichanlagen dafür herangezogen werden. Wegen der zahl- reichen kategoriellen Merkmale, die zur Strukturierung des Datenpools einzusetzen sind, ist jedoch die Bildung von in sich geschlossenen Subsystemen erforderlich. Der Fokus des vorlie- genden Projekts ist auf die datenbasierte Modellierung der Strichqualität von Offset-Druck- papieren gerichtet. Um Modelle mit möglichst großer Prognosesicherheit zu erhalten, ist im Rahmen der Datenvorverarbeitung eine Untersuchung der korrelativen Zusammenhänge aller Input- und Output-Variablen mit Hilfe der Korrelationsanalyse erforderlich. Die Abschätzung der Prognosefehler durch Validierung der datenbasierten Modellbildungen liefert den Maßstab zur Gewährleistung der Prognosesicherheit. Die erreichbare Kalibrierungsgenauigkeit der Mo- delle ist dabei kein hinreichendes Kriterium für die resultierende Prognosesicherheit. Es konnte nachgewiesen werden, dass nur Modelle, bei denen die Anzahl der bei der Kalibrierung zu be- stimmenden Modellparameter klein gegenüber der Anzahl der zur Verfügung stehenden Da- tensätze ist, eine hinreichend gute Prognosesicherheit bezüglich der Strichqualität besitzen.

Sowohl eine ungleichmäßig verteilte Variabilität der Kalibrierungsdaten als auch das Auftreten von Ausreißern mit untypischer Variabilität können die Prognosesicherheit der Modelle jedoch herabsetzen.

Unter diesen Bedingungen eignen sich als Prognosewerkzeuge für die Strichqualität von Pa- pieren folgende Modellvarianten: lineare multivariable Regressionsmodelle, wobei das MAT- LAB-„Graphical-User-Interface“ rstool direkt als Prognosetool einsetzbar ist, PLS-Regressions- modelle, deren Prognosesicherheit aufgrund des angewandten Prinzips der maximierten Kova- rianz und der Vermeidung von Kollinearität im Input-Bereich besonders stabil ist, sowie neuro- nale Netzwerke mit extrem einfacher Netzwerkstruktur. Weniger geeignet bis ungeeignet als Prognosewerkzeuge sind hingegen nichtlineare multivariable Regressionsmodelle und neuro- nale Netzwerke mit komplexer Netzwerkstruktur, weil diese Modellvarianten eine zu große Zahl von Modellparametern aufweisen und deshalb wesentlich größere Datenmengen mit ent- sprechend breiter Variabiltät erfordern.

(2)

Die entwickelten modellgestützten Prognosewerkzeuge für die Strichqualität von Offset-Druck- papieren wurden getestet zur Prognose der Papierdicke, der Opazität der Papiere, des Weiß- grades R457, der Glätte bzw. der Rauhigkeit und zur Prognose des Glanzes als Funktion aller wesentlichen Einflussparameter für die Strichqualität. In die Prognose einbezogen waren je- weils die Qualitätsparameter vor und nach der Satinage in Abhängigkeit von den Kalanderpa- rametern. Dadurch konnte mit den Modellen auch simuliert werden, in welchem Umfang Glätte und Glanz der gestrichenen Papiere durch Satinage weiter verbessert werden können und wie stark sich Dicke, Opazität und Weiße durch die Satinage verringern.

Die Strichqualitätsmodelle liefern praxisnahe Aussagen zur Produktqualität. Mit Hilfe der Prog- nosewerkzeuge können Streichversuche gezielter geplant und in ihrem Umfang reduziert wer- den. Die zuverlässige Prognostizierbarkeit von Qualitätsparametern, die experimentell nur mit großem Aufwand überprüft werden können, stellt ein innovatives Hilfsmittel dar zur Steigerung der Flexibilität der Produktion, für die Erhöhung der Produktionssicherheit und zur Beschleuni- gung von Entwicklungsprojekten und ermöglicht Kosteneinsparungen, von denen kleine und mittlere Unternehmen besonders profitieren.

Danksagung

Das Forschungsvorhaben PTS-BAY 2003/01 wurde mit finanziellen Mitteln des Bayerischen Staatsministeriums für Wirtschaft, Infrastruktur, Verkehr und Technologie gefördert. Für diese Förderung sei an dieser Stelle gedankt.

(3)

Inhaltsverzeichnis

Seite

Zusammenfassung ...1

1 Wissenschaftlich-technische und wirtschaftliche Problemstellung...4

1.1 Ausgangssituation ...4

1.2 Stand der Forschung ...6

2 Forschungsziel und Lösungsweg...8

2.1 Forschungsziel...8

2.2 Lösungsweg zur Erreichung des Forschungsziels ...9

2.2.1 Datenpool der Versuchsstreichanlage (VESTRA)...9

2.2.2 Korrelation der Eigenschaften der eingesetzten Streichrohpapiere...12

2.2.3 Korrelation der Eigenschaften von Streichfarben und gestrichenen Papieren ...15

2.2.4 Subsystembildung für gestrichene Offset-Druckpapiere ...16

2.2.5 Korrelationsanalyse und datenbasierte Modellbildung ...17

3 Forschungsergebnisse ...41

3.1 Modellgestützte Prognose der Strichqualität von Offset-Druckpapieren...41

3.1.1 Prognose der Papierdicke ...41

3.1.2 Prognose der Opazität...42

3.1.3 Prognose des Weißgrades R457 ...44

3.1.4 Prognose der Glätte nach Parker-Print-Surf ...46

3.1.5 Prognose des Glanzes ...49

4 Wirtschaftliche Bedeutung der Forschungsergebnisse für kleine und mittlere Unternehmen in Bayern...53

5 Beabsichtigte Umsetzung der Forschungsergebnisse ...53

Ansprechpartner ...54

Danksagung...54

Literaturverzeichnis...55

Anhang...57

(4)

1 Wissenschaftlich-technische und wirtschaftliche Problemstellung

1.1 Ausgangssituation

Bei den grafischen Papieren gewinnen die gestrichenen Papiere ständig an Bedeutung, d.h.

ihr Produktionsanteil und die jährlich produzierte Menge steigen überproportional im Vergleich zu Anteil und Menge der ungestrichenen Naturpapiere [1] (vgl. Abb. 1). Dies ist auf die unbe- strittenen Vorteile bezüglich deutlich überlegener Druckergebnisse zurückzuführen, die auf ein- bzw. mehrfach gestrichenen Papieren erreichbar sind.

0 5.000 10.000 15.000 20.000

1960 1970 1980 1990 2000

Papierherstellung [1.000t]

0%

5%

10%

15%

20%

25%

30%

35%

40%

Anteil gestrichener Produkte [%]

Gesamtprod. Papier & Karton 4.4% pa seit 1963 Gesamtproduktion gestrichen 8,5% pa

Gestrichene Grafische Papiere Gestrichener Karton

Anteil gestrichener Produkte

Abb. 1 Produktionszahlen für Naturpapiere und gestrichene Papiere [1]

Im Unterschied zu den Naturpapieren sind bei den gestrichenen Papieren die Faserstrukturen des Streichrohpapiers durch eine Strichschicht abgedeckt. Die Unebenheiten der Fasern sind dadurch besser ausgeglichen. Bei jedem Streichvorgang wird bei einwandfreier Ausführung eine entsprechend bessere Nivellierung der Oberfläche erreicht [2] (vgl. Abb. 2).

Die zum Streichen verwendete Streichfarbe besteht zu einem großen Teil (etwa 90%) aus mi- neralischen Stoffen, den Pigmenten, die mit Bindemitteln (Anteil bis etwa 15 Massenanteile bezogen auf trockenes Pigment) untereinander und an die Papieroberfläche gebunden sind.

Zusätzlich benötigt man für bestimmte gewünschte Eigenschaften bzw. für eine optimale Ver- arbeitung der Streichfarbe, insbesondere für die spezielle Einstellung der rheologischen Eigen- schaften und des Wasserrückhaltevermögens, weitere Additive.

(5)

Abb. 2 REM-Aufnahmen von Papieroberflächen [2]:

Bild links: Rohpapier vor dem Streichen; Bild rechts: gestrichenes Papier

Da die Streichfarbenrezepturen im Vergleich zu den Rohpapiereinträgen bei Massenpapieren deutlich billiger sind, sind die gestrichenen Papiere trotz des zusätzlichen Verfahrensschritts des Streichens nur geringfügig teurer als Naturpapiere mit gleicher Flächenmasse, die in der Regel schlechter bedruckbar sind. Daraus resultiert eine ausgeprägte Konkurrenzsituation zwi- schen den beiden Papierqualitäten. Dies führt dazu, dass eine ständige Weiterentwicklung der Produktqualität bei möglichst geringen Eintragskosten durchgeführt wird.

In Laborversuchen werden dazu mögliche neue Streichfarbenkomponenten (Pigmente und ih- re Mischungen, Bindemittel und Additive) auf ihre grundsätzliche Eignung für den vorgesehe- nen Zweck geprüft. Eine praxisnahe Bewertung mit einem anschließend durchzuführenden Probedruck ist aber nur möglich, wenn die vorgesehene Änderung auch auf einer Technikums- anlage auf ihre Eignung überprüft wird. Die dadurch entstehenden, nicht unerheblichen Kosten werden in der Regel als Entwicklungskosten in die Kostenkalkulation der verkauften Produkti- on aufgenommen. Um diese Entwicklungskosten zu minimieren, versucht man schon lange aussagekräftigere Laborversuche anzuwenden bzw. durch Simulationsrechnungen den Ver- suchsaufwand einzuschränken. Dabei ergeben Simulationen auf physikalisch-chemischer Ba- sis im Labor nur bedingt die gewünschten Ergebnisse. Die datenbasierende Modellierung von Qualitätsparametern aus der Vielzahl der praxisnahen Streichversuche auf einer Pilotanlage ergibt dagegen einen ganz neuen und vielversprechenden Ansatz.

(6)

1.2 Stand der Forschung

In der Streichmaschine [3, 4] (vgl. Abb. 3) wird das Streichrohpapier mit einem möglichst gleichmäßigen Film der flüssigen Streichfarbe belegt und beides dann der Trocknung zuge- führt. Man erhält das gestrichene, noch unsatinierte Papier. Durch die anschließende Satinage werden die Oberflächen weiter verbessert, jedoch durch eine gleichzeitig stattfindende Kom- pression des Papiers dabei aber auch die Dichte erhöht.

Gas IR Drier

(ceramics) Air Drier

Unwinder

FILMPRESS

COMBI-BLADE Rewinder

MODULAR COMBI-BLADE:

Modul JETFLOW F

Abb. 3 Schema einer Streichmaschine (VESTRA-Pilotcoater) [3]

Mit der Applikation der Streichfarbe auf das Streichrohpapier startet eine Rückbefeuchtung des Papiers unter gleichzeitiger Penetration der flüssigen Phase der Streichfarbe in das Rohpapier.

Dabei bildet sich an der der Streichfarbe zugewandten Seite des Papiers ein Filterkuchen aus – die Streichfarbe immobilisiert und der Filterkuchen baut einen Strömungswiderstand für den Durchtritt weiterer flüssiger Phase auf. Der Überschuss an Streichfarbe wird dann durch ein Egalisierelement, z.B. eine Rakel, abgenommen. Diese Vorgänge werden überlagert durch den hydrodynamischen Druck der Walzenspalte zwischen Auftragswerk bzw. Egalisierelement und Gegenwalze. Nach dem Auftragswerk liegt eine ein- oder beidseitig gestrichene Papier- bahn vor, deren Feuchtigkeitsverteilung in z-Richtung sehr ungleichmäßig ist.

In der anschließenden Trockenpartie wird das Wasser entfernt, wobei die Strichschicht mög- lichst gleichmäßig erhalten bleiben soll. Dabei muss berücksichtigt werden, dass das im Roh- papier enthaltene Wasser teilweise (bei gleichzeitigem beidseitigen Strich immer) durch die Strichschicht hindurch entfernt werden muss. Insbesondere dürfen dabei keine Markierungen in der Strichoberfläche zurückbleiben, da sonst das Papier aufgrund mangelhafter Qualität un- verkäuflich wäre.

(7)

Zur konventionellen Entwicklung von Streichfarbenrezepturen für Streichmaschinen im Labor startet man mit Versuchstreichfarben, deren Eigenschaften erfasst werden und die möglichst nahe den herrschenden Produktionsbedingungen eingestellt werden [4]. Dabei werden übli- cherweise folgende Prüfungen durchgeführt:

• Feststoffgehalt,

• pH-Wert,

• Viskositätsverhalten,

• Wasserretentionsverhalten,

• Herstellung von Handmustern mit dem Handrakel und Untersuchung der Papiereigen- schaften,

• Herstellung von gestrichenen Mustern auf Laborstreicheinrichtungen bei möglichst na- he an der Produktionsgeschwindigkeit liegenden Geschwindigkeiten und Untersuchung der Papiereigenschaften.

Bei den Prüfungen ist zu berücksichtigen, dass sowohl die Viskosität [5, 6, 7] als auch das Wasserretentionsverhalten [8] von Streichfarben nicht hinreichend genau bestimmt werden kann und mit den jeweiligen Messmethoden nur Vergleichsergebnisse erhalten werden.

Erst nach dem Erhalt erfolgversprechender Ergebnisse aus diesen Versuchen wird man die am besten erscheinenden Rezepturen der Überprüfung auf einer Technikumsanlage zuführen.

Da diese Vorgehensweise sehr arbeits- und zeitaufwändig ist, versucht man seit langem Teile des Streichvorgangs durch Modellbildung besser zu verstehen. Bereits 1971 hat Turai [9] ein mathematisches Modell des Rakelstreichverfahrens abgeleitet. In neueren Arbeiten (vgl. Giri et.al. [10]) wird festgestellt, dass unter dem Blade ein komplexes Druckprofil ausgebildet wird, das von der Rauhigkeit des verwendeten Substrats abhängt.

Für den Bereich der Streichfarbenapplikation konnte von Chen und Scriven [11] gezeigt wer- den, dass die maßgebenden Kräfte für die Flüssigkeitspenetration in das Rohpapier durch den hydrodynamischen Druck und den Kapillardruck bestimmt werden.

Aidun [12] zeigte, dass die weitere Steigerung der Geschwindigkeit von Streichmaschinen durch eine hydrodynamische Instabilität der Streichfarben kritisch beeinflusst wird. Insbeson- dere ist hierbei auch von Bedeutung, dass die Streichaggregate keine idealen Fließzustände erlauben.

Eine besondere Rolle bei allen Streichprozessen und deren Laufverhalten spielt das rheologi- sche Verhalten der Streichfarben. Auf die Problematik der hohen Schergefälle, die bei den Messungen kaum erreichbar sind, wurde schon lange hingewiesen z.B. in [13]. Durch eine Modifikation der Kapillarviskosimeter können zusätzlich die Dehnviskosität und die Gleiteigen- schaften der Streichfarben ermittelt werden [14]. Gleichzeitig spielt aber auch noch das Rela- xationsverhalten der Streichfarben nach einer Scherbeanspruchung eine wichtige Rolle beim Streichen [15].

Durch die Befeuchtung des Streichrohpapiers über die Streichfarbe wird gleichzeitig auch die Rauhigkeit der Papieroberfläche verändert [16]. Diese Aufrauhung der Oberfläche kann soweit gehen, dass auch die gestrichene Oberfläche beeinflusst wird. Sie ist u.a. auch abhängig vom Rakeldruck und der Geschwindigkeit der Streichmaschine. Zusätzlich wird festgestellt [17], dass das Oberflächenprofil des Rohpapiers im gestrichenen Papier von der Komprimierung während des Streichvorgangs und der Aufrauhung der Papieroberfläche während der Strich- verfestigung abhängt.

(8)

Schon seit langem wird der Einfluss der Trocknungsbedingungen nach dem Streichen auf die Strichqualität diskutiert, z.B. in [18]. Hierdurch werden speziell der Glanz und die Dru- ckungleichmäßigkeit, das sog. Mottling, beeinflusst. Speziell in der kritischen Trocknungsstufe bei Trockengehalten zwischen 73 und 81% muss die Trocknung mit angepassten Trock- nungsgeschwindigkeiten durchgeführt werden. Auch hierzu wurden Computersimulationen vorgenommen [19].

Für die nach dem Streichen noch notwendige Satinage wurden ebenfalls Modelle angegeben.

Ein neues Beispiel dafür liefert [20]. Hierbei wurde insbesondere die Abhängigkeit der Satinier- barkeit von der Glasübergangstemperatur der eingesetzten Bindemittel untersucht.

Diese Arbeiten, die sich mit Einzelschritten des Streichens beschäftigen, halfen die einzelnen Prozessschritte besser zu verstehen. Bisher gibt es jedoch keine Untersuchungen, in denen der Gesamtprozess des Streichens von Papier erfasst und mit Hilfe von Simulationen ein Zu- sammenhang zwischen den Prozessparametern und den Qualitätsparametern des gestriche- nen Endproduktes hergestellt wird.

Die Bestimmung der kritischen Variablen und Einflussfaktoren, welche die Qualität des Streichergebnisses signifikant beeinflussen, ist sowohl für die Entwicklung und Verbesserung von Streichprozessen als auch für die Optimierung von Streichfarben von höchstem Interesse.

Auf Grund der Vielzahl von Parametern und Einflussgrößen sowie aufgrund der multivariablen Korrelationen, die auf physikalischer Basis noch nicht hinreichend durchdringbar sind, bietet nur die statistische Auswertung und die datenbasierte Modellierung der Zusammenhänge zwi- schen Prozess- und Qualitätsparametern eine Möglichkeit zur Identifikation der kritischen Pa- rameter für die Strichoptimierung.

2 Forschungsziel und Lösungsweg

2.1 Forschungsziel

Durch die statistische Auswertung des Datenbestandes und die datenbasierte Modellierung der Streichversuche an der VESTRA-Pilotanlage werden die empirischen Zusammenhänge, die zwischen Rohpapierdaten, Streichfarbenkennzahlen, Streichmaschinenparametern und Satinagebedingungen und den Qualitätsmerkmalen der gestrichenen Papiere existieren, auf- geklärt und einer quantitativen Bewertung zugeführt.

Ziel des Projektes ist es, auf dieser Grundlage die Entwicklung von modellbasierten Progno- sewerkzeugen zur Vorhersage der Stricheigenschaften und zur Optimierung von Rezepturen durchzuführen und zu testen. Damit soll es in Zukunft ermöglicht werden, die erreichbare Qua- lität der gestrichenen Papiere bereits aus den Ausgangsdaten und den Einstellungen der Streichmaschine und des Kalanders abzuschätzen und den experimentellen Aufwand bei der Entwicklung neuer Papierqualitäten einzuschränken und damit die Entwicklungsprojekte zu beschleunigen und Kosten einzusparen.

Für die Entwicklung und Optimierung neuer Streichsysteme soll mit diesem Projekt ein innova- tives softwaregestütztes Werkzeug zur Verfügung gestellt werden.

(9)

2.2 Lösungsweg zur Erreichung des Forschungsziels

2.2.1 Datenpool der Versuchsstreichanlage (VESTRA)

Bislang wurden auf der Pilotstreichanlage der VESTRA bereits über 5000 Streichversuche durchgeführt, deren Daten zum größten Teil in anonymisierter Form für statistische Untersu- chungen und für datenbasierte Modellbildungen verwendet werden können.

Da bei den Streichversuchen im Pilotmaßstab eine Vielzahl von Prozessschritten der Reihe nach durchgeführt und unter gezielter Variation verschiedener Einflussparameter verfolgt wer- den können, stellen diese Daten eine sehr wertvolle Datenbasis zur Entwicklung von compu- tergestützten Prognosetools dar.

Ausgehend von der Rohpapierprüfung über die Streichfarbenherstellung bis hin zum Streich- prozess mit Vorstrich, Mittelstrich und Deckstrich sowie der Unterscheidung zwischen Obersei- te und Siebseite und der Einbeziehung der Prozesse der Ausrüstung in Form von Kalandrieren und Randbeschneiden als Vorbereitung für Versuchsdrucke können die Streichprozesse der Versuchsstreichanlage stufenweise rekonstruiert und nachvollzogen werden.

Die Standard-Datensätze umfassen dabei für jeden Einzelversuch in der Regel folgende Pa- rameter:

für das Streichrohpapier die Papierqualitätsparameter (jeweils getrennt für Oberseite und Sieb- seite der Papierprobe bei den Oberflächeneigenschaften

Dicke,

flächenbezogene Masse,

Weißgrad R457,

Opazität,

Glätte/Rauhigkeit PPS nach Parker-Print-Surf,

für die Streichfarbe die Streichfarbenrezeptur mit der Pigmentcharakterisierung (Pigmenttypen, Massenanteile, Partikelgrößenverteilungen), der Charakterisierung der Bindemittel (Typen, Massenanteile und Eigenschaften) und weiterer Additive, sowie Angaben für

Feststoffgehalt, pH-Wert,

Viskosität nach Brookfield bei 20 / 50 / 100 Upm, Auftragsgewichte, einseitig und beidseitig.

Die Papiereigenschaften der gestrichenen Papiere (unsatiniert und teilweise auch satiniert) stellen die wichtigsten Ergebnis- bzw. Output-Größen dar, die mit Hilfe von datenbasierten Modellbildungen als Funktionen der wichtigsten Einflussgrößen prognostizierbar gemacht wer- den sollen. Insbesondere werden betrachtet die Eigenschaftsparameter (jeweils seitenbezogen für Ober- und Siebseite)

Glanz (nach Tappi 75° und Lehmann 75°), Dicke,

Weiße R 457,

Opazität,

Glätte/Rauhigkeit PPS nach Parker-Print-Surf.

Von allen gestrichenen bzw. gestrichenen und nachfolgend satinierten Papieren liegen die Vergleichsproben und die Prüfergebnisse für die Streichrohpapiere vor. Zur Komplettierung

(10)

dieses Datenpools wurden die Archivdaten den jeweiligen Versuchen erneut zugeordnet und in Excel-Tabellen digitalisiert.

Im Rahmen des Projektes wurden von der VESTRA ca. 3800 Datensätze in Excel-Tabellen aufgenommen, welche die Eigenschaften und die Prozessparameter der erfolgten Verede- lungsschritte vom Rohpapier bis zum einfach, zweifach bzw. dreifach gestrichenen und ggf.

satinierten Papieren charakterisieren. Der Schwerpunkt der Datenaufnahme lag bei gestriche- nen Papieren für den Offset-Druck.

Von diesen Papieren liegen folgende Daten vor:

• die Art und Qualität des Rohpapiers,

• die Art der Behandlung (Siebseite (SS)-Oberseite (OS), Streichaggregat),

• als Prozessparameter die Streichgeschwindigkeit und das Strichgewicht,

• die Zusammensetzung der Streichfarben,

• die Streichfarbeneigenschaften (mit der Brookfield-Viskosität bei unterschiedlichen Ge- schwindigkeiten, Feststoffgehalt, pH-Wert),

• sowie die Qualitätsdaten der gestrichenen Papiere (Dicke, Glanz, Glätte/Rauhigkeit, Weiße und Opazität).

Für die datenbasierte Modellbildung ist eine generelle Unterscheidung der Daten in die Input- Variablen bzw. Einflussgrößen und die Qualitäts-Output-Variablen, deren Verhalten modelliert werden soll, erforderlich. Eine solche Einteilung ist jedoch nicht für alle Fälle eindeutig, da ge- wisse Output-Größen in den z.T. mehrstufigen Veredlungsprozessen nach einem Vorstrich beispielsweise wieder zu Input-Größen für den jeweiligen Nachfolgeprozess werden können.

Der Datenpool der VESTRA-Versuchsergebnisse auf Excel-Basis enthält sehr viele Input- Variable in Form von Kenngrößen für die Rohpapiere, die Strichrezepturen und die verfah- rensspezifischen Parameter des jeweils angewandten Streichverfahrens sowie die Output- Variablen, welche jeweils die Qualität des Strichs charakterisieren.

Im Datenpool gibt es zahlreiche kategorielle Merkmale wie z.B. Einfachstrich, Doppelstrich, Strich Oberseite/Siebseite, Typ des Streichaggregats, Art der Satinage etc., die numerisch nicht charakterisierbar sind und deshalb nicht als Input-Größen der datenbasierten Modelle in Frage kommen.

Je nach Wahl der Input- und Output-Gesamtheiten für die Modellierung besitzt der Datenpool mehr oder weniger große Datenlücken (missing data), welche die datenbasierte Modellbildung behindern. Es ist dabei zu berücksichtigen, dass jede datenbasierte Modellbildung einschließ- lich linearer und nichtlinearer Regressionen und insbesondere auch einschließlich nichtlinearer Modellbildungen wie neuronale Netzwerke zuverlässige Voraussagen in den festzulegenden Output-Kanälen nur für die Datenbereiche gestatten, für die repräsentative Input- und Output- Kalibrierungs- bzw. Trainingsdaten mit entsprechender Variabilität benutzt wurden. Extrapola- tionen über die Trainingsbereiche hinaus sind wegen des i.a. nichtlinearen Charakters der rea- len Zusammenhänge in der Regel nicht erfolgreich. Bei allen Modelltypen spielt die Menge der Datensätze im Vergleich zur Anzahl der zu bestimmenden Parameter des mathematischen Modells eine wesentliche Rolle für die Prognosefähigkeit des Modells, die deutlich zu unter- scheiden ist von der erreichbaren Kalibrierungsgenauigkeit der jeweiligen Modellbildung.

Wegen der zahlreichen kategoriellen Merkmale im Datenpool ist es notwendig, geeignete Sub- systeme herausziehen, für die jeweils Submodelle datenbasiert kalibriert werden und die u.a.

folgenden notwendigen Kriterien genügen müssen:

(11)

• keine Datenlücken im Input- und Output-Bereich der Submodelle,

• Festlegung der jeweiligen Input- und Output-Kanäle nach Korrelationsmaßstäben:

möglichst keine oder nur schwach ausgeprägte Korrelationen zwischen den Inputs, je- doch möglichst große Korrelationen zwischen den Inputs und den Outputs,

• keine Mischung von kategoriellen Merkmalen in einem Submodell, es sei denn, es lie- gen hinreichend starke Ähnlichkeiten vor,

• eine möglichst beschränkte Anzahl (im Vergleich zum gesamten Daten-Pool) von In- put- und Output-Kanälen, um die Prognosesicherheit zu erhöhen,

• Beschränkung auf Submodelle mit jeweils nur einer Output-Qualitätsvariablen.

Ein Generalmodell für den gesamten Datenpool, das insbesondere auch kategorielle Daten- Merkmale vermischt, ist realistisch nicht machbar. Für die Submodelle kann auf der Basis einer geeigneten Variablenauswahl eine gute Prognosefähigkeit erreicht werden, wenn hinreichend viele Datensätze zum Training der Modelle zur Verfügung stehen.

Unter Berücksichtigung der kategoriellen und der numerisch charakterisierbaren Merkmale er- gibt sich prinzipiell folgende Input-Output-Datenstruktur:

Input-Größen:

• numerische Merkmale des Ausgangsstreichrohpapiers o Flächengewicht,

o Glanz T75, o Dicke, o Weiße R457, o Opazität, o Glätte PPS 1/S,

• analoge numerische Merkmale des Papiers nach einem Vorstrich,

• kategorielle Input-Merkmale zur Prozessspezifikation o unsatiniert, satiniert,

o ungestrichen, o vorgestrichen, o mit Mittelstrich, o deckgestrichen, o leimpressepigmentiert, o oberflächengeleimt,

o Strich Siebseite (SS) / Oberseite (OS),

• weitere kategorielle Merkmale zum Prozess o Qualität (Tiefdruck, Offset etc.),

o Auftragsaggregat (Düsenauftrag, Walzenauftrag, Filmpresse), o Schaber- oder Rakeltypus,

o Pigment, o Bindemittel, o Co-Binder,

ƒ Stärke,

ƒ CMC,

ƒ Polyvinylalkohol, o optische Aufheller, o Viskositätsregler, o Vernetzer, o Dispergiermittel, o sonstige Additive,

(12)

• numerische Merkmale der Streichfarbe o pH-Wert,

o Brookfield Viskosität bei 20, 50, 100 Upm, o Feststoffgehalt,

• numerische Merkmale der Prozessführung o Auftragsgewicht, einseitig beidseitig, o Streichgeschwindigkeit,

o Kalander-Geschwindigkeit, o Kalander-Temperatur, o Kalander-Liniendruck.

Output-Größen: numerische Qualitätsparameter des gestrichenen Papiers:

• Dicke,

• Glanz T75 oder L75,

• Weiße R457,

• Opazität,

• Glätte PPS1/S.

2.2.2 Korrelation der Eigenschaften der eingesetzten Streichrohpapiere

Alle im VESTRA-Pilotcoater eingesetzten Rohpapiere wurden als industrielle Zwischenproduk- te ohne Strich auf unterschiedlichsten Papiermaschinen hergestellt. Die Eigenschaften der Rohpapiere wurden auf der Papierprüfstrasse der VESTRA gemessen und in Versuchsberich- ten archiviert. Einige wichtige Rohpapiereigenschaften als Ausgangsdaten für die Streichver- suche sind in den folgenden Abbildungen dargestellt. Gleichzeitig wurden für die Streichrohpa- piere statistische Auswertungen und Vergleiche vorgenommen.

Flächengewichtverteilung der Streichrohpapiere

25,0 35,0 45,0 55,0 65,0 75,0 85,0 95,0 105,0 115,0 125,0

0 200 400 600 800 1000

Rohpapiernummer

Flächengewicht [g/m²]

Abb. 4 Flächengewichtsverteilung der bisher eingesetzten 570 Rohpapiere für die Streichversuche

Abb. 4 stellt dabei die Flächengewichtsverteilung der bisher aufgenommenen 570 Rohpapiere für die Streichversuche dar.

(13)

Die in der Graphik dargestellten Flächengewichte der Rohpapiere überdecken statistisch den Flächengewichtsbereich zwischen 34 und 85 g/m² und bilden sorten- / produktionsanlagentypi- sche Inseln.

Mit den Eigenschaftsspektren dieser Streichrohpapiere wurden erste graphische Auswertun- gen durchgeführt, um Korrelationen zwischen verschiedenen Eigenschaften darzustellen.

In Abb. 5 ist der Zusammenhang zwischen dem Flächengewicht und der Papierdicke darge- stellt. Die Graphik zeigt dabei trotz der unterschiedlichen Papierzusammensetzung (insbeson- dere auch hinsichtlich des Füllstoffgehaltes) wie erwartet eine näherungsweise proportionale Abhängigkeit. In dem Bereich von ca. 55 g/m² bis ca. 105 g/m² ergibt sich dabei ein Flächen- gewichtsanstieg von ca. 1 g/m² bei einer Dickenzunahme von 1 µm. Im unteren wie auch im oberen Wertebereich (niedrige und hohe Flächengewichte) flacht sich der Anstieg jeweils ab.

Rohpapier Flächengewicht / Dicke

0,0 20,0 40,0 60,0 80,0 100,0 120,0

40,0 50,0 60,0 70,0 80,0 90,0 100,0 110,0 120,0 130,0 140,0 Dicke [µm]

Flächengewicht [g/m²]

Abb. 5 Zusammenhang zwischen Flächengewicht und Papierdicke bei den Rohpapieren

Die Korrelation von Opazität und Flächengewicht ist in Abb. 6 dargestellt. Im Gegensatz zu Abb. 5 ist hier aus der Datenverteilung kein proportionaler Zusammenhang ersichtlich. Viel- mehr zeigt sich vor allem bei niedrigen Flächengewichten bis ca. 60 g/ m² eine klare Inselbil- dung, die auf charakteristische Produkttypen hinweist.

(14)

Korrelation von Opazität und Flächengew icht

70,0 80,0 90,0 100,0 110,0

40,0 50,0 60,0 70,0 80,0 90,0 100,0 110,0 Flächengew icht [g/m²]

Opazität

Abb. 6 Zusammenhang zwischen Opazität und Flächengewicht bei den Rohpapieren

Abhängigkeit der Opazität von der Dicke

70,0 75,0 80,0 85,0 90,0 95,0 100,0

40,0 50,0 60,0 70,0 80,0 90,0 100,0 110,0 120,0 130,0 140,0 Rohpapierdicke [µm]

Opazität

Abb. 7 Zusammenhang zwischen Opazität und Rohpapierdicke

Die Opazitäts-Rohpapierdicken-Verteilung zeigt eine weniger ausgeprägte Inselbildung als in Abb. 6. Korreliert man, wie in Abb. 7 , die Dicke des Streichrohpapiers, die selbst wiederum vom Flächengewicht abhängt, mit der Opazität, so ergibt sich im Bereich der geringeren Pa- pierdicken (bis ca. 70 µm) ein deutlicher papierdickenabhängiger Anstieg der Opazität. Erst im oberen Dickenbereich und im Bereich der hohen Opazitäten scheint die produktspezifische Zusammensetzung der Papiere opazitätsbestimmend zu sein.

Wie aus den grafischen Darstellungen deutlich wird, überlagern sich bei dieser Art der Auswer- tung produktspezifische Eigenschaften und Eigenschaftskorrelationen einzelner Produktgrup- pen, so dass eine Gesamtauswertung ohne die Bildung von Untergruppen und ohne die ge-

(15)

trennte Betrachtung dieser Gruppen nicht aussagekräftig genug ist. Für weiterführende Aus- wertungen sind daher gezielte Subsystembildungen notwendig. Dies ist auch die Vorausset- zung für die gezielte Modellierung von Stricheigenschaften.

2.2.3 Korrelation der Eigenschaften von Streichfarben und gestrichenen Papieren Die Betriebsfenster hinsichtlich Viskosität und Feststoffgehalt der Streichfarben, mit denen ein Teil der o.g. Streichrohpapiere vorgestrichen wurde, sind in Abb. 8 dargestellt.

Feststoff und BV100

500 700 900 1100 1300 1500 1700 1900

55,00% 60,00% 65,00% 70,00%

Feststoff [%]

BV100 [mPas]

Abb. 8 Zusammenhang zwischen Viskosität und Feststoffgehalt bei den eingesetzten Streichfarben für den Vorstrich

Weitere Korrelationen bezüglich der Parameter der Vorstriche, Mittelstriche und Deckstriche sowie detaillierte Untersuchungen zu den Einflussgrößen und den Outputs der Prozesse sind noch zu untersuchen.

Die statistische Analyse der Daten wird auch durch die Vielzahl der eingesetzten Streichfar- benkomponenten (mehr als 100 Pigmente und über 250 Bindemittel und Additive) deutlich er- schwert. In gleichem Maße sind die Streichrohpapiere individuell sehr unterschiedlich. Dadurch ist eine weitere Klassifikation der Streichfarben und Strichsysteme und eine damit verknüpfte Subsystembildung bezüglich der Daten erforderlich.

Die Subsystembildung ist die Basis dafür, dass dann die Korrelationsanalyse und die datenba- sierte Modellbildung für speziell ausgewählte Streichprozesse (z.B. Einfachstrich für den Rol- len-/Bogen-Offset) in Abhängigkeit von den Stricheigenschaften und den Streichfarbeneigen- schaften durchgeführt werden können. Ein Schwerpunkt ist dabei, insbesondere den Einfluss des Rohpapiers und des Strichgewichtes auf die Verbesserungen von Glätte, Glanz, Opazität und Weiße beim Streichprozess herauszuarbeiten und datenbasiert zu modellieren.

(16)

2.2.4 Subsystembildung für gestrichene Offset-Druckpapiere

In der Papierveredlung besteht ein ausgeprägter Trend zu immer höherwertigeren gestriche- nen Papieren als Basis zur weiteren Steigerung der Qualität von Druckerzeugnissen. Insbe- sondere der Offset-Druck mit dem größten Marktanteil bestimmt diese Entwicklung entschei- dend mit. Dies spiegelt sich auch darin wider, dass an der VESTRA-Pilotanlage die Offset- Druckpapiere den größten Anteil an den Streichversuchen haben. Das breite Sortiment reicht dabei vom leichtgewichtigten ULWC-Papier mit 28 g/m² bis zum Karton mit Flächenmassen von 400 g/m² und darüber.

Die ausgewählten Offset-Papierqualitäten haben im Vergleich zu Zeitungsdruck- und Tief- druckpapieren zur Erzielung optimaler Druckergebnisse qualitativ höheren Ansprüchen in Be- zug auf die Gleichmäßigkeit und die optischen Eigenschaften Weiße, Opazität und Glanz zu genügen. Im ursprünglichen Datenpool waren Offset-Papiere mit einem Flächenmassenbe- reich von 32-71 g/m², einer Weiße von 59-80 und 91-96 bei Strichgewichten von 4 bis 17 g/m² pro Seite enthalten. Die Breite der Variabilität und die Anzahl der jeweils für eine Gruppe zur Verfügung stehenden Datensätze verringerten jedoch die Güte und die Prognosesicherheit der Modellbildungen. So waren Offset-Papiere mit DIP-haltigen, holzfreien und holzhaltigen Streichrohpapieren kaum miteinander zu vergleichen. Deshalb erfolgte eine Ausgliederung der DIP-haltigen aufgebesserten Zeitungsdruckpapiere und der holzfreien Papiere mit hohen Flä- chenmassen. Der Datenpool enthielt damit nur noch holzhaltige und gemischt holzhal- tig/holzfreie Offsetpapiere incl. ULWC- und LWC-Offsetpapiere. Die einbezogenen Papiere sind durch folgende Merkmale charakterisiert:

Rohpapiere nicht oberflächengeleimt,

keine oder nur geringe Masseleimung der Rohpapiere,

Flächenmassenbereich der Rohpapiere von 32,7 bis 65,5 g/m², Weiße der Rohpapiere von 66,7 bis 79,8,

Strichgewichte pro Seite von 4,8 bis 17 g/m², jeweils Einfachstrich.

Die Daten für die Oberseite (OS) und die Siebseite (SS) wurden getrennt einbezogen.

Die typische Offset-Streichfarbenzusammensetzung ist spezifiziert durch 60 – 90 Teile gemahlenes Calciumcarbonat (fein),

10 – 40 Teile Kaolin (fein, amerikanische Qualitäten mit geringem Flächen-Kanten- Verhältnis,

10 – 12 Teile Kunststoffbinder,

1 – 2 Teile Cobinder und Additive (Verdicker, Rheologieregler, optische Aufheller, Auf- hellerträger, Stearat),

Feststoffgehalt der Streichfarbe 67 – 70 %.

Diese Streichfarbenrezepturen sind für Applikationen mit einem Walzen- oder Düsenauftrags- werk mit nachfolgender Egalisierung durch Stiff- oder Bent-Blade ausgelegt. Die Qualitätspa- rameter zielen auf hohe Werte für Weiße, Opazität und Glanz. Die speziellen Pigment- Partikeleigenschaften konnten noch nicht in den Datenpool einbezogen werden. Zur Erhöhung von Glätte und Glanz wurden die gestrichenen Papiere im Regelfall satiniert, wobei durch möglichst geringe Kalanderbelastung Opazität und Weiße keine oder nur sehr geringe Quali- tätsverluste erleiden sollten.

Die Bedruckbarkeit der Papiere wird in starkem Maße durch die Gleichmäßigkeit des Strichs und die homogene Verteilung der Streichfarbe und ihrer Komponenten bestimmt. Beides hängt auch von der Qualität der Rohpapieroberfläche ab. Diese Merkmale konnten bislang noch nicht explizit berücksichtigt werden, da repräsentative und auf verschiedene Papiersorten an- wendbare Analysenmethoden nicht zur Verfügung stehen.

(17)

2.2.5 Korrelationsanalyse und datenbasierte Modellbildung

Der Offset-Datenpool, auf dessen Basis über die datenbasierte Modellbildung Prognosewerk- zeuge entwickelt werden, enthält Daten-Subsysteme für alle wichtigen Endprodukteigenschaf- ten gestrichener Offset-Papiere in Abhängigkeit von den Rohpapiereigenschaften, den Streich- farbenformulierungen, den Streichaggregatparametern und den Kalanderparametern.

Sowohl die multivariate statistische Auswertung der Daten über Korrelationsanalysen als auch die datenbasierte Modellbildung werden mit dem Programmsystem MATLAB und speziellen MATLAB-Toolboxen durchgeführt. Dazu werden die Daten von Excel in MATLAB-Matrix- Arrays exportiert. Die neben dem MATLAB-Kern im Projekt einzusetzenden MATLAB- Toolboxen sind [21]:

• MATLAB Statistics Toolbox,

• MATLAB Neural Network Toolbox,

• sowie die PLS_Toolbox für MATLAB [22].

Statistische Korrelationsanalyse:

Den ersten Schritt der Datenanalyse vor der datenbasierten Modellierung bildet die statistische Korrelationsanalyse, um auf diesem Wege alle signifikanten Korrelationen in den Daten he- rauszufinden, das Problem von kollinearen Variablen zu lösen und ggf. den Datenraum zu re- duzieren.

Kern der Korrelationsanalyse ist die Auswertung und Bewertung einfacher statistischer Koeffi- zienten wie der Varianz einer Variablen x,

=

= N

i

i x N

x x

1

2/( 1) )

( )

(

var , (2.1)

(x Mittelwert, N Anzahl der Datensätze) bzw. der Standardabweichung

std(x)= var(x) , (2.2) der Kovarianz eines Variablenpaars

=

= N

i

q iq p ip q

p x x x x x N

x

1

) 1 ( / ) (

) (

) , (

cov (2.3)

und insbesondere die Auswertung der daraus berechenbaren paarweisen Korrelationskoeffi- zienten mit Werten im Intervall [-1, 1]

r ( x

p

, x

q

) = cov ( x

p

, x

q

) / [ std ( x

p

) std ( x

q

)]

. (2.4) Im Falle r ≈ 1 liegen starke positive Korrelationen mit einer annähernd linearen Relation zwi- schen den beiden ausgewählten Variablen vor. Die für r ≈ -1 vorliegende starke negative Kor- relation, auch als Antikorrelation bezeichnet, ist charakterisiert durch eine lineare Beziehung zwischen diesen Variablen mit einem negativen Anstieg der Geraden. Im Falle r ≈ 0 liegen keine Paarkorrelationen vor, d.h. die Variablen sind dann statistisch unabhängig voneinander (wie z.B. bei stochastischen Rauschprozessen).

(18)

In multivariablen Systemen spielen sogenannte kollineare Variable im Input-Block eine negati- ve Rolle für die Modellbildung. Variable sind kollinear, wenn zwischen ihnen eine starke Korre- lation mit Korrelationskoeffizienten nahe den Werten +1 oder –1 besteht, d.h. wenn zwischen diesen Variablen eine lineare Abhängigkeit existiert.

Die multivariable lineare Regression mit der Methode der kleinsten Quadrate liefert in solchen Fällen meist instabile Regressionskoeffizienten und eine mangelhafte Prognosefähigkeit der Modelle, da die zu fittende Regressionsebene bezüglich zweier kollinearer Variablen im We- sentlichen auf eine gerade Linie in diese Ebene reduziert wird und die zu dieser Linie senk- rechte Richtung weitgehend unbestimmt bleibt, so dass die Regressionsebene gegenüber Drehungen um diese Gerade nicht stabil bestimmt werden kann.

Ein geeigneter Ausweg aus dem Problem mit kollinearen Input-Variablen besteht in der An- wendung der PLS (partial least squares)-Regression ([23], PLS_Toolbox für MATLAB [22]), auf die später noch detaillierter eingegangen wird.

Die Darstellung der paarweisen Korrelationskoeffizienten mit Werten im Intervall [-1, 1] (2,4) kann in übersichtlicher Weise durch ein Farbschema, sogenannte Correlation Maps, grafisch dargestellt werden. Abb. 9 zeigt das Correlation Map für das Subsystem top-Opacity (Opazität von gestrichenen unsatinierten Offset-Papieren).

Abb. 9 Correlation Map top-Opacity als Farbschema für die Korrelationskoeffizienten

(19)

Von besonderem Interesse für die Modellbildung und die daraus abzuleitende Eigenschafts- prognose sind die Korrelationskoeffizienten der letzten Spalte zwischen den 11 Input-Variablen und dem Eigenschafts-Output Opazität (top-opac bzw. top-opacity), die folgende Zahlenwerte haben:

Input-Output-Korrelationskoeffizienten für den Output top-opac:

top-opac (1) speed -0.4066 (2) base-gram 0.8347 (3) base-thickn 0.7777 (4) base-PPS1S -0.0692 (5) base-R457 0.2221 (6) base-opac 0.9298 (7) solid 0.2609 (8) VBV100 -0.5458 (9) cw-bs 0.5220 (10) cw-dry 0.5232 (11) top-gram 0.7868 top-opac 1.0000

Die Input-Variablen mit den betragsmäßig größten Korrelationskoeffizienten stellen die Haupt- einflussgrößen auf die Endprodukteigenschaft Opazität dar; dies sind hier die Grammatur bzw.

die Dicke und die Opazität des Rohpapiers (base-gram, base-thickn, base-opac) sowie die Grammatur nach den Strichauftrag (top-gram).

Wie am Beispiel der PLS-Regression noch gezeigt wird, lässt sich das Input-Output- Korrelationsverhalten auch sehr genau durch die sogenannten Loadings der 1. LV (latenten Variablen bzw. Hauptkomponente) reproduzieren, die das Gewicht der ursprünglichen Input- Variablen in dieser Hauptkomponente bezüglich der Output-Modellierung beschreiben (vgl.

Abb. 17).

Die Korrelationsanalyse ist ein wichtiger Schritt der Datenvorverarbeitung [24]. Sie kann er- gänzt werden durch eine Hauptkomponentenanalyse (Principal Components Analysis–PCA), die ebenfalls ein wirkungsvolles Hilfsmittel darstellt, um die am stärksten miteinander korrelier- ten Variablen herauszufinden und den Datenraum in weitere Subräume bezüglich der Stärke der Korrelationen zu strukturieren. In der vorliegenden Untersuchung wird jedoch vorzugswei- se die mit der PCA verwandte PLS eingesetzt, die gleichzeitig eine relativ prognosesichere Modellierung der Papierqualitäts-Outputs ermöglicht. Mit diesen Werkzeugen der Datenvorve- rarbeitung und Modellierung können die signifikanten Abhängigkeiten und die Trends in den multidimensionalen Daten transparent gemacht werden [25, 26].

Datenbasierte Modellbildung: Lineare und quadratische Regressionsmodelle

Die Qualität und die Prognosesicherheit eines aus Daten kalibrierten Modells hängt stark von der Anzahl und der Verteilung der zur Verfügung stehenden Datensätze im Vergleich zur An- zahl der zu bestimmenden Konstanten des Modells ab. Grundsätzlich sollte die Zahl der Da- tensätze groß gegenüber der Zahl der zu bestimmenden Modellkonstanten sein.

(20)

Liegt eine relativ geringe Anzahl von Datensätzen vor, liefern bereits lineare multivariable Reg- ressionsmodelle in der Regel gute Ergebnisse. Kollinearität im Input-Block sowie Ausreißer- Daten, die eine untypische Variabilität aufweisen, können die Modellkalibrierung jedoch negativ beeinflussen und die Prognosesicherheit der linearen Modelle herabsetzen.

Die mathematische Form von multivariablen linearen Regressionsmodellen ist gegeben durch

=

+ +

= K

k k

kx f

b b

y

1

0 , (2.5) y Output (zu modellierende Endprodukteigenschaft), xk (k = 1,...,K) Inputs (als Einflussgrößen), b0, b1,...,bK Regressionskoeffizienten, f als Kalibrierungsfehler.

Der MATLAB-Code zur Erzeugung linearer multivariabler Regressionsmodelle aus den Daten für die ausgewählten Subsysteme lässt sich folgendermaßen zusammenfassen:

% Datenmatrix D (alle Inputs und der Output in der letzten Spalte von D)

% Inputs

x = D(:,1:(end-1));

% Inputs plus konstanter Term xc_l = x2fx(x,'linear');

xc_q = x2fx(x,'quadratic');

% Output y = D(:,end);

% Datensätze DS = 1:size(x,1);

% Lineare multivariable Regression: rstool linear als Prognosetool rstool(x,y,'linear')

Variables have been created in the current workspace.

% Regressionskoeffizienten des Modells (der erste Koeffizient ist der konstante Term) beta_l =

71.7542 0.0000 -0.0568 0.0107 0.0684 -0.2176 0.3885 -0.0825 -0.0002 -0.0311 0.1868 0.0665

% Wurzel aus dem mittleren quadratischen Kalibrierungsfehler rmse_l =

0.4446

% simulierter Output ys_l = xc_l*beta_l;

% Vergleich simulierter-gemessener Output plot(DS,ys_l,DS,y);

(21)

Das Ergebnis der linearen multivariablen Regressionsmodellierung mit dem MATLAB-Interface rstool für den Beispiel-Output Opazität (von gestrichenen unsatinierten Offset-Papieren) ist in Abb. 10 dargestellt. Dieses rstool-GUI (graphical user interface) kann bereits als interaktiver Prognosetool verwendet werden, da alle Inputs (X1 bis x11) interaktiv editiert werden können und das Prognoseergebnis für top-opac automatisch nachgeführt wird.

Die gestrichelten Hüllgeraden liefern einen 95%-Vertauensbereich für die jeweilige lineare Ab- hängigkeit von den einzelnen Inputs. Bezüglich der näherungsweise kollinearen Inputs x2, x3 (base-gram, base thickn) und x9, x10 (cw-bs Strichgewicht beidseitig, cw-dry aktuell aufgetra- genes Strichgewicht) wird eine erhebliche Vorhersageunsicherheit deutlich, d.h. für diese In- puts kann nicht einmal das Vorzeichen der linearen Beziehung exakt ermittelt werden. Der zu- sätzliche Einsatz einer PLS-Regression stellt hier einen Ausweg aus der Kollinearitätsproble- matik dar.

Abb. 10 Das MATLAB-GUI rstool als interaktiver Prognose-Tool (hier für die Opazität top- opac) mit Vertrauensbereichen

Den Vergleich zwischen den mit dem Modell simulierten Opazitäten und den gemessenen Werten zeigt Abb. 11. Die Wurzel aus dem mittleren quadratischen Kalibrierungsfehler (rmse root-mean-square error) beträgt 0,4446.

(22)

Abb. 11 Vergleich zwischen simulierten und gemessenen Opazitätswerten für das lineare Regressionsmodell

Der mittlere Kalibrierungsfehler der Modellbildung als Analogon zur Standardabweichung

=

= N

i

i

N yi y

rmse

1

1 (ˆ )2 , (2.6)

(yˆi simulierte Outputwerte, yi gemessene Outputs)

ist zu unterscheiden von der Prognosegenauigkeit bzw. dem mittleren Prognosefehler des Mo- dells, der durch Validierung ermittelt wird und gegeben ist durch

=

= N

i

pi pi

N y y

rmsep

1

1 (ˆ )2 , (2.7)

wobei neue Input-Output-Datensätze benutzt werden, die vorher nicht zur Modellkalibrierung herangezogen wurden (yˆpi prognostizierte Outputwerte, ypi gemessene Outputs). Der mittle- re Prognosefehler rmsep (2.7) ist in der Regel etwas größer als der mittlere Kalibrierungsfehler (2.6) (vgl. Abb. 12).

(23)

0 50 100 150 200 231 250 300 89

90 91 92 93 94 95 96 97 98 99 100

Datensatz (DS)

top-Opac

Lineares Regressionsm odell: top-Opacity (Validierung ab DS 231) simuliert gemessen rmse = 0.4452

Abb. 12 Vergleich zwischen simulierten und gemessenen Opazitätswerten für ein lineares Regressionsmodell mit Validierungsintervall ab DS 231

Nichtlineare Regressionen mit einer wesentlich höheren Anzahl von Modellkonstanten können zwar die Kalibrierungsgenauigkeit deutlich verbessern, die Prognosefähigkeit solcher Modelle, d.h. die Vorhersagegenauigkeit bei Benutzung neuer Datensätze (Validierungsbereich), nimmt jedoch in der Regel deutlich ab, insbesondere dann, wenn die Anzahl der Kalibrierungsdaten- sätze nicht groß gegenüber der Anzahl der Modellkonstanten ist. Speziell ein quadratisches multivariables Regressionsmodell schließt alle quadratischen Kombinationen der Input- Variablen xk ein, so dass eine im Vergleich zum linearen Modell deutlich größere Anzahl von Regressionskoeffizienten bei der Kalibrierung zu bestimmen ist (speziell für die Opazitätsmo- dellierung Zunahme von 12 auf 78 Koeffizienten).

Abb. 13 zeigt den Vergleich zwischen simulierten und gemessenen Opazitäts-Outputs bei quadratischer Regression mit dem MATLAB-Tool rstool(x,y,'quadratic'). Der Validierungsbe- reich beginnt wieder bei DS 231. Der Prognosefehler in diesem Bereich zeigt einen deutlichen Anstieg.

(24)

0 50 100 150 200 231 250 300 89

90 91 92 93 94 95 96 97 98 99 100

Datensatz (DS)

top-Opac

Quadratische s Re gre ssionsm ode ll: top-Opacity (V alidie rung ab DS 231) simuliert gemessen rmse = 0.2222

Abb. 13 Vergleich zwischen simulierten und gemessenen Opazitätswerten für ein quadrati- sches Regressionsmodell mit Validierungsintervall ab DS 231

Die Prognose des Opazitätsverhaltens von gestrichenen (unsatinierten) Offset-Papieren als Funktion der Dicke und der Opazität des Streichrohpapiers, berechnet auf der Basis des linea- ren Regressionsmodells, ist in Abb. 14 grafisch als 3D-Plot dargestellt. Der zugehörige MAT- LAB-Code für diese Art der 3D-Prognose ist beigefügt. Darin kann die Auswahl der beiden In- put-Kanäle des 3D-Plots jedoch leicht geändert werden.

Bei dieser Art von Prognosedarstellung ist Folgendes zu beachten:

• Da bei der 3D-Darstellung alle restlichen Input-Kanäle auf Mittelwerte gesetzt wurden und damit relativ untypische Datensätze zusammengeführt werden, liefern solche Darstellun- gen nur eine approximative Trenddarstellung, insbesondere im Falle kollinearer Inputs.

Eine bessere Prognose der Strichqualität wird durch die Eingabe konkreter Messwerte für alle Input-Variablen bei der Simulation mit dem bestmöglichen Modell erreicht.

• Speziell die Abhängigkeit vom kollinearen Input (3) base-thickn kann nicht als zuverlässig bezeichnet werden, wie auch aus der zugehörigen Vertauensbereichsangabe in Abb. 10 hervorgeht. Dagegen kann die Abhängigkeit vom Input (6) base-opac mit deutlich höherer Zuverlässigkeit angegeben werden.

• Ein quadratisches Regressionsmodell mit 78 Koeffizienten ist wegen der durch die Mittel- wertbildung untypischen Auswahl der Datensätze, die nicht zum Trainingsbereich der Ka- librierung gehörten, für eine 3D-Trenddarstellung dieser Art wegen des hohen Prognose- fehlers ungeeignet.

(25)

50

60

70

80

90

75 80

85 90

95 100

88 90 92 94 96 98 100

base-thickness

Prognose top-Opacity

base-opacity

top-Opacity

Abb. 14 Prognose von top-Opacity in Abhängigkeit von der Dicke und der Opazität des Streichrohpapiers auf der Basis des linearen Regressionsmodells (alle anderen Input-Variablen wurden auf Mittelwerte gesetzt)

MATLAB m-File zum 3D-Prognose-Plot Abb. 14:

% x- und y-Achsen-Definition (interaktiv zu spezifizieren) varx = 3; % x-Achse = base-thickness

vary = 6; % y-Achse = base-opacity stepx = 30;

stepy = 30;

xa = min(x(:,varx)):((max(x(:,varx))-min(x(:,varx)))/stepx):max(x(:,varx));

ya = min(x(:,vary)):((max(x(:,vary))-min(x(:,vary)))/stepy):max(x(:,vary));

'Mittelwerte der Input-Channels' M = mean(x,1)

'Min-Max-Werte x-Achse' min(x(:,varx))

max(x(:,varx))

'Min-Max-Werte y-Achse' min(x(:,vary))

max(x(:,vary))

% nested For loop to calculate Z(x,y) Mup = M;

for i=1:size(xa,2) % xa-loop

(26)

Mup(varx) = xa(i);

for j=1:size(ya,2) % ya-loop Mup(vary) = ya(j);

Dup = x2fx(Mup,'linear'); % lineares Regressionsmodell Z(i,j) = Dup*beta_l; % simulierter Output

end end

meshz(xa,ya,Z') % 3D mesh-plot xlabel('base-thickness') % Achsen siehe oben ylabel('base-opacity')

zlabel('top-Opacity')

title('Prognose top-Opacity')

Datenbasierte Modellbildung: PLS-Regression

Bei der Hauptkomponentenanalyse (Principal Components Analysis–PCA) bzw. auch bei der PLS-Regression werden neue Variable (Hauptkomponenten (PC) bzw. latente Variable (LV)) als Linearkombinationen der ursprünglichen Variablen definiert, die orthogonal und unkorreliert zueinander sind, womit z.B. das bereits diskutierte Kollinearitätsproblem beseitigt werden kann.

Die ersten PC’s bzw. LV’s mit den größten Eigenwerten beschreiben den Hauptanteil der Vari- abilität der Originalvariablen des Systems. Es gilt das Prinzip der maximalen Varianz. Die Ma- thematik des Verfahrens besteht in einer Eigenvektor-Zerlegung der Kovarianz- bzw. Korrelati- onsmatrix durch Hauptachsentransformation.

Die mit der PCA verwandte PLS-Regression versucht die LV’s derart zu finden, dass die Kor- relation zum Output maximal wird und dabei der größtmögliche Anteil der Variation im Input- Block berücksichtigt wird. Es gilt hier das Prinzip der maximalen Kovarianz.

Besteht die Datenmatrix X aus N Zeilen (Datensätzen) und K Spalten (Variablen), und sind alle Spalten jeweils durch Abzug der Mittelwerte und Division durch die Standardabweichung auf Mittelwert Null und Varianz Eins normiert („autoscaled data“), gilt für die Kovarianz- bzw. Korre- lationsmatrix anstelle von (2.3)

) 1 (

cov −

= ′ N

X

X X (2.8)

(gestrichene Matrix kennzeichnet Transponierte).

Die Eigenvektorzerlegung dieser Matrix liefert die Eigenvektoren pi (genannt Loadings) zu den Eigenwerten λi . Die Loadings beschreiben, mit welchem korrelativen Gewicht die ursprüngli- chen Variablen in die i-te LV der Hauptkomponentenzerlegung der Datenmatrix

X = t1p1+t2p2+...+tKpK + E (2.9) (E Residual-Matrix) eingehen. Die ti-Vektoren (genannt Scores) sind die Projektionen der Da- tenmatrix X auf die Eigenvektoren und enthalten die Information über die korrelativen Zusam- menhänge der Datensätze zueinander. Das ti,pi-Paar mit dem größten Eigenwert λ repräsen- tiert die 1. Hauptkomponente bzw. die 1. LV mit dem größten Varianzanteil. Die weiteren LV’s

(27)

haben jeweils geringere Varianzanteile. LV’s mit Eigenwerten < 1 sind vernachlässigbar, da sie keine systematische Varianz mehr enthalten. Ziel ist eine Beschreibung der Daten mit mög- lichst wenigen LV’s, die möglichst große Varianz- bzw. Kovarianzanteile repräsentieren.

Ein wichtiges Auswahlkriterium für die Festlegung der Anzahl der zu berücksichtigenden LV’s in der PLS-Regression liefern die Variationen des mittleren Kalibrierungsfehlers und des mittle- ren Prognosefehlers. Abb. 15 zeigt die Abnahme des mittleren Kalibrierungsfehlers (2.6) (hier mit RMSEC bezeichnet) über der Anzahl der LV’s für PLS-Opazitätsmodelle (Output top-opac).

Bei mehr als 6 LV’s ist offenbar keine weitere Verringerung des Kalibrierungsfehlers mehr er- reichbar.

1 2 3 4 5 6 7 8 9 10 11

0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3

Latent Variable Number

RMSEC

SIMPLS Variance Captured and CV for x

Abb. 15 Kalibrierungsfehler in Abhängigkeit von der Anzahl der latenten Variablen im PLS- Opazitätsmodell

Der Prognosefehler (2.7) für Datensätze, die nicht zur Kalibrierung eingesetzt wurden, wird im Rahmen der PLS-Regression durch sogenannte „Cross-Validation“ bestimmt (deshalb hier mit RMSECV bezeichnet). Diese Funktion kann relative und globale Minima aufweisen.

Bei der „Cross-Validation“-Methode werden in bestimmter Weise Datensätze von der Modell- kalibrierung ausgenommen, z.B. einzelne Datensätze (leave one out), stochastisch ausge- wählte Datensätze (random subsets), zusammenhängende Datenblöcke (contiguous blocks) oder auch frei definierte Datensätze (custom). Bezüglich dieser ausgenommenen Datensätze wird dann die Prognosesicherheit des Modells durch die Berechnung von RMSECV überprüft.

Abb. 16 zeigt den Verlauf von RMSECV über der Anzahl der LV’s für die PLS-Opazitäts- modelle.

(28)

1 2 3 4 5 6 7 8 9 10 11 0.4

0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3

Latent Variable Number

RMSECV

SIMPLS Variance Captured and CV for x

Abb. 16 Prognosefehler durch Cross-Validation mit „random subsets“ in Abhängigkeit von der Anzahl der latenten Variablen im PLS-Opazitätsmodell

Der Prognosefehler ist etwas größer als der Kalibrierungsfehler und steigt bei der Mitnahme von mehr als 7 LV’s wieder an (Overfitting-Effekt). Die Berücksichtigung von 6 LV’s im PLS- Opazitätsmodell ist auch unter der Vorgabe, die Anzahl der LV’s möglichst gering zu halten, eine optimale Approximation.

Prinzipiell sind die Kalibrierungsgenauigkeit und die Prognosegenauigkeit zwei unterschiedli- che Aspekte der Modell-Performance. Ein möglichst kleiner Kalibrierungsfehler ist kein Kriteri- um für eine hohe Prognosesicherheit des Modells. Oft ist eine gegenläufige Tendenz beob- achtbar, d.h. sehr genau kalibrierte Modelle zeigen in der Regel eine relativ schlechte Progno- segenauigkeit.

Die Daten des ausgewählten PLS-Opazitätsmodells mit 6 LV’s lassen sich wie folgt zusam- menfassen (PLS_Toolbox [22]):

Linear regression model using

Partial Least Squares calculated with the SIMPLS algorithm Preprocessing: Autoscale

Num. LVs: 6

Cross validation: random samples w/ 10 splits and 11iterations RMSEC: 0.44239

RMSECV: 0.4708

Percent Variance Captured by Regression Model ---X-Block--- ---Y-Block---

Comp This Total This Total ---- --- --- --- --- 1 46.61 46.61 79.32 79.32 2 16.71 63.32 10.32 89.65

(29)

3 13.04 76.36 3.63 93.28 4 7.80 84.16 1.82 95.10 5 3.48 87.64 1.37 96.46 6 2.78 90.42 0.79 97.26

Die Vorgabe, möglicht viel Varianz der Daten sowohl im Input-Block (X-Block) als auch im Output-Kanal (Y-Block) durch das PLS-Modell abzudecken, ist weitgehend erfüllt.

Die Loadings der 1. LV bezüglich aller Input-Variablen des Opazitätsmodells sind in Abb. 17 dargestellt. Ähnliche Werte der Loadings stehen für ein vergleichbares korrelatives Verhalten dieser Inputs in Bezug auf den Output top-opacity. Unterschiedliche Vorzeichen bedeuten An- tikorrelationen. Die Loading-Werte der 1. LV für die 11 Input-Variablen des Modells reproduzie- ren relativ genau das Verhalten der gemäß Abb. 9 aufgelisteten Input-Output-Korrelations- koeffizienten für den Opazitäts-Output .

1 2 3 4 5 6 7 8 9 10 11

-0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

Variable

Loadings on LV 1 (46.61%)

Variables/Loadings Plot for x

Abb. 17 Loadings der 1. latenten Variablen (LV 1) für alle Input-Kanäle des Opazitätsmo- dells

Ein nicht unwesentlicher Aspekt der Modellqualität und der erreichbaren Prognosesicherheit der damit simulierten Outputs resultiert aus der Ausreißerkontrolle der verwendeten Daten.

Ausreißer-Datensätze zeigen ein untypisches Verhalten außerhalb des Bereiches der norma- len Variabilität und können Modellqualität und Prognosesicherheit negativ beeinflussen.

Einen ersten Überblick über die Existenz von Ausreißern liefert ein Diagramm, das die Scores von LV2 über den Scores von LV1 mit einer 95%-Vertrauensellipse darstellt (vgl. Abb. 18 ).

(30)

-4 -3 -2 -1 0 1 2 3 4 5 6 -3

-2 -1 0 1 2 3 4

Scores on LV 1 (46.61%)

Scores on LV 2 (16.71%)

Samples/Scores Plot of x

Abb. 18 Scores von LV2 über den Scores von LV1 mit 95%-Vertrauensellipse für das PLS- Opazitätsmodell (top-Opacity)

Es ist ersichtlich, dass eine Reihe von Datensätzen außerhalb der Vertrauensellipse liegen.

Eine noch leistungsfähigere Ausreißerkontrolle liefert eine Darstellung der Student-Verteilung der Output (Y)-Residuals über der sogenannten „Leverage“, wie sie aus Abb. 19 zu entneh- men ist. Die aus der T2-Statistik [23] ableitbare Leverage, berechnet aus den Score-Vektoren und den Eigenwerten der Kovarianzmatrix gemäß

a

A a

ia

i t

h N1 /λ

1

2

=

+

= (2.10) (A Anzahl der im PLS-Modell berücksichtigten LV’s), charakterisiert den Abstand des Daten- satzes i vom Zentrum aller Beobachtungen im Raum der Input-Variablen. Die Leverage ist ein Einflussmaß bzw. definiert das Einflusspotenzial einzelner Datensätze auf die Modellkalibrie- rung.

Einen negativen Einfluss auf die Modellqualität haben insbesondere Ausreißer-Datensätze, die verglichen mit der Hauptmasse der Werte durch große Y-Residuals und große Leverage- Werte gekennzeichnet sind. In Abb. 19 sind dies insbesondere die Datensätze 3 und 4.

Referenzen

ÄHNLICHE DOKUMENTE

Die Aufbereitung und Auswertung dieses Datenpools sowie eine auf dieser Basis zu entwickelnde Modellierung bieten eine einmalige Möglichkeit modellgestützte und praxisnahe

Aus diesen Gründen ist es für die deutsche Papierindustrie eine wirtschaftliche Notwendigkeit, diesen Geschwindigkeitsbereich auch beim Streichen der für den Offsetdruck

Oktober endete die Frist für Einwendungen zum Planfeststellungsver- fahren für den ersten Teilabschnitt zwischen Straubing und Deggendorf.. Am Stichtag haben auch die

Hauptseminar Erweiterungen des linearen Regressionsmodells und genomische Anwendungen in der Biomedizin WS 2014/2015..

Weitergehende Beratung und begleitende Gespräche auch über die Geburt hinaus, sowie intensive Begleitung nach einer Fehlgeburt oder einem Schwangerschaftsabbruch

Dieses Resul- tat lässt sich dadurch erklären, dass durch einen längeren Zeitraum mit gleicher Schrittweite nicht nur mehr Zeitschritte erzeugt werden, sondern auch Verbindun-

Diese Kombination diverser Sensordaten kann in einem zweiten Schritt durch externe Anwendungen als Kontextmodell eines Lernenden angefragt und zur Generierung von

Um die Informationsbedarfe bestimmter Rollen in einem Prozess zu identifizieren, wur- Diagrammen, werden in swimlanes nur die Prozessschritte und die dazugehörigen