• Keine Ergebnisse gefunden

4. Methode zur Identifikation stochastischer Druckmuster

4.4 Hamming Distanz

56 4. Methode zur Identifikation stochastischer Druckmuster Der Schwellwert t50 wird auf alle normierten Spaltenvektoren Vλ,θ,norm angewandt. Nach Abschluss der Merkmalsextraktion aus den P Instanzen Igray,rot,crop sind somit zunächst die P Merkmalsbilder Fλ,θ berechnet und die schlussendlich P Binärvektoren Sp,q erstellt worden.

Jeder Binärvektor Sp,q repräsentiert damit eine Aufnahme eines Druckmusters aus der optischen Bilderfassung. Diese Binärvektoren werden schließlich zur Berechnung der Hamming Distanzen verwendet.

4. Methode zur Identifikation stochastischer Druckmuster 57 Für den Fall, dass absolut stochastische Druckmuster untersucht werden, müssten sich die Inter-Hamming Distanz von HDnorm = 0,5 ergeben. Dies wird ersichtlich bei der Betrachtung des folgenden Beispiels in Abbildung 36.

Abbildung 36: Vergleich von Binärvektoren. Wird ein Binärvektor mit einem identischen Binärvektor verglichen, so ist die Anzahl der abweichenden Stellen gleich Null, die normierte Hamming Distanz beträgt entsprechend ebenfalls HDnorm = 0. Treten Fehler in der Messkette auf, so ergeben sich Abweichungen im Binärvektor und es resultiert eine HDnorm > 0. Werden zwei komplementäre Vektoren verglichen, ergibt sich der eine maximale Hamming Distanz von HDnorm = 1.

Die zugrundeliegende Hypothese der entwickelten Methode ist es, dass Bilddaten des gleichen Druckmusters untereinander einen geringeren Abstand aufweisen als Bilddaten unterschiedlicher Druckmuster. Die Intra-Hamming Distanz sollte somit prinzipiell geringere Werte als die Inter-Hamming Distanz aufweisen. Druckmuster sollen sich so anhand ihrer Bilddaten bzw. der berechneten Binärvektoren diskriminieren lassen. Werden Druckmuster der gleichen Druckmusterart bspw. auf unterschiedliche Verpackungen gedruckt, so soll die Stochastik aus dem Druckprozess ermöglichen, die einzelnen Verpackungen voneinander zu unterscheiden. Die Methode zur Identifikation stochastischer Druckmuster wird hierfür anhand des Vergleiches von Datenbanken validiert, in welchen jeweils die Binärvektoren zu den gleichen Druckmustern aus unterschiedlichen Erfassungen abgelegt sind. Es wird eine möglichst große Anzahl an Druckmustern angestrebt, um belastbare Aussagen bzgl. der Verteilungen der Hamming Distanzen treffen zu können. Die in den Abschnitten 4.2 und 4.3 beschriebene Vorverarbeitung und Merkmalsextraktion wird für jede Aufnahme jedes Druckmusters durchgeführt. Die resultierenden Binärvektoren werden als Datenbank zusammengefasst und abgespeichert.

Vergleich eines Druckmusters mit einer Datenbank

Zum Vergleich eines Druckmusters mit einer Datenbank werden zunächst P Druckmuster digitalisiert verarbeitet und die zugehörigen P Binärvektoren in eine Datenbank geschrieben.

58 4. Methode zur Identifikation stochastischer Druckmuster Wird nun eines der Druckmuster erneut digitalisiert, verarbeitet und der entstehende Binärvektor mit der Datenbank verglichen, werden P normierte Hamming Distanzen HDnorm

berechnet. Einer der P Vergleiche sollte dabei eine signifikant niedrigere normierte Hamming Distanz HDnorm aufweisen als die P-1 anderen Vergleiche und bspw. über einen Schwellwert diskriminierbar sein. Abbildung 37 zeigt beispielhaft einen solchen Datenbankvergleich mit einem Treffer. Aufgetragen wird die normierte Hamming Distanz HDnorm über der Nummer p der Druckmuster. Es ist zu erkennen, dass im vorliegenden Fall der Binärvektor des Druckmusters 15 in der Datenbank beim Vergleich mit dem neu digitalisierten Druckmuster 15 auf ein Minimum der normierten Hamming Distanz HDnorm führt.

Abbildung 37: Vergleich des Binärvektors eines Viscous Fingering Druckmusters mit einer Datenbank bestehend aus 270 Binärvektoren, welche 270 Druckmuster der Druckmusterart Viscous Fingering repräsentieren. Die niedrigste Hamming Distanz bei p = 15 (blaues Kreuz) entspricht dem Treffer (Intra-Hamming Distanz), die roten Kreuze entsprechen Nicht-Treffern (Inter-(Intra-Hamming Distanzen).

Der Vergleich eines Binärvektors mit einer Datenbank entspricht einer Überprüfung eines Druckerzeugnisses im industriellen Umfeld. Werden bspw. Verpackungen mit stochastischen Druckmustern der gleichen Druckmusterart bedruckt, erfolgt eine erste optische Erfassung in der Produktion. Im Handel wird zur Überprüfung einer Verpackung diese erneut optisch erfasst und der extrahierte Binärvektor mit einer Datenbank abgeglichen, in welcher die Daten aus der Produktion hinterlegt sind. Dabei wird zu einem vorliegenden Druckmuster nach einem Treffer in der Datenbank gesucht. In der Praxis ist diese Form der Suche bei einer

4. Methode zur Identifikation stochastischer Druckmuster 59 großen Anzahl P an Druckmustern nicht durchführbar, da der Aufwand bei der Identifikation linear mit der Anzahl P steigt. Daher werden sogenannte Robust Keys eingesetzt, welche in Abschnitt 6.6 diskutiert werden.

Vergleich von Datenbanken mit Datenbanken

Um verallgemeinerbare Aussagen bzgl. der Stochastik der Druckmuster treffen zu können wird die Digitalisierung und Verarbeitung der Druckmuster zweifach durchgeführt, sodass sich zwei Datenbanken ergeben, die P Binärvektoren zu den gleichen P Druckmustern enthalten. Die Binärvektoren resultieren dabei aus unterschiedlichen Bilddaten und die Binärvektoren weisen somit Unterschiede auf (siehe Abbildung 29 in Abschnitt 4.1). Die Datenbanken werden miteinander verglichen, es erfolgen P x P Berechnungen der normierten Hamming Distanz HDnorm. Werden diese Vergleiche in Matrixform dargestellt, finden sich die P Treffer auf der Hauptdiagonalen der Matrix während die übrigen P2-P Einträge Nicht-Treffern entsprechen. Treffer sind dabei gleichbedeutend mit Intra-Hamming Distanzen und Nicht-Treffer mit Inter-Hamming Distanzen. Die Verteilung der Intra-Hamming Distanzen wird nachfolgend als a bezeichnet und kurz Intra-Verteilung genannt, die Verteilung der Inter-Hamming Distanzen als e bezeichnet und kurz Inter-Verteilung genannt. Die Verteilungen dieser Hamming Distanzen können als Histogramme dargestellt werden (siehe Abbildung 38).

Dabei wird die normierte Häufigkeit über der normierten Hamming Distanz HDnorm

aufgetragen. Es ist zu erkennen, dass sich zwei Verteilungen ausbilden. Die linke Verteilung stellt die Intra-Verteilung dar und enthält die normierten Hamming Distanzen HDnorm zu P Treffern, welche sich aus dem Vergleich der zwei Datenbanken ergeben. Die rechte Verteilung stellt die Inter-Verteilung dar, sprich die P2-P Nicht-Treffer mit den entsprechenden normierten Hamming Distanzen HDnorm. Die Lücke zwischen den beiden Verteilungen stellt ein Maß für die Diskriminierbarkeit der Binärvektoren und damit der repräsentierten Druckmuster dar und wird als eine Kenngröße für die Stochastik der Druckmuster verwendet.

Die Frage, ob die Binärvektoren stochastisch sind, ist dabei nicht entscheidbar (siehe Abschnitt 2.2). Die Ausprägungen der Verteilungen sind dementsprechend als Indizien zu werten. Im Idealfall entstehen zwei nicht überlappende Verteilungen, wobei eine ideale Messkette für jeden Treffer (sprich Intrawert) die Hamming Distanz HDnorm = 0 ergibt.

60 4. Methode zur Identifikation stochastischer Druckmuster

Abbildung 38: Vergleich von Datenbanken mittels Hamming Distanz, Datenbank 1 beinhaltet dabei die Binärvektoren Sp,1 während die Datenbank 2 die Binärvektoren Sp,2 beinhaltet. Der Abstand zwischen den Verteilungen für die Intra- und Inter-Hamming Distanzen stellt ein Maß für die Diskriminierbarkeit der Druckmuster dar und wird nachfolgend als eine Kenngröße für die Stochastik der Druckmuster verwendet.

Die in Abschnitt 4.1 behandelten Abweichungen bei der Erfassung sowie bspw. Bitfehler in der Verarbeitung führen auf reale Intra-Hamming Distanzen HDnorm > 0. Der Vergleich von Datenbanken mit Datenbanken ist für die Entwicklung eines stochastischen Druckmusters entscheidend und wird zur Validierung der Methode zur Identifikation stochastischer Druckmuster in Kapitel 5 verwendet.