Qualitätsbetrachtungen - Anpassungsfähige Kontextbestimmung zur Unterstützung von Kommunikation

• Semantische Beschreibungsmerkmale: Die Beschreibung der Schnittstelle reicht nicht aus, um zu ent-scheiden, für welche Anfrage ein Sensor relevante Informationen anbietet. Ebenso geht aus einer einfachen Beschreibung der Schnittstellen nicht hervor, wie ein Rückgabeparameter zu interpretieren ist oder welche Informationen als Eingabeparameter geeignet sind. Hierzu werden zusätzliche Informationen benötigt, wel-che Rückschlüsse auf die Relevanz eines Sensors und die Bedeutung der Daten ermögliwel-chen - sogenannte semantische Beschreibungsmerkmale.

• Ontologien: Ontologien ermöglichen es Beziehungen zwischen Elementen zu deﬁnieren. Setzt man sie in Kombination mit semantischen Beschreibungsmerkmalen ein, bieten sie die Möglichkeit Dienste und deren Daten zueinander in Relation zu stellen. Hierzu verweisen semantische Beschreibungsmerkmale in der Regel auf Elemente innerhalb einer Ontologie. Innerhalb einer Ontologie werden Beziehungen häuﬁg in Form einer Subjekt-Prädikat-Objekt Beziehung dargestellt. Durch Verknüpfung vieler solcher Subjekt-Prädikat-Objekt Beziehungen lassen sich komplexe Beziehungsstrukturen abbilden. Solche Strukturen können je nach Um-setzung beispielsweise Baumstrukturen oder gerichtete Graphen ergeben.

• Weitere Meta-Informationen:Neben den Beschreibungselementen zur Bestimmung der Bedeutung des Sen-sors oder seiner Daten, werden Informationen benötigt, um die Verarbeitungsweise zu deﬁnieren. Beispiels-weise kann je nach Sensor die Gültigkeit, die Genauigkeit, die Auﬂösung oder das Format der Daten variie-ren. Diese Informationen werden benötigt, um Elemente wie Puffer, Vorverarbeitung oder Konvertierung zu steuern.

3.4 Qualitätsbetrachtungen

QoI beschreibt die Anforderung, Informationen mit möglichstausreichenderAussagekraft zur Verfügung zu stel-len. QoI Anforderungen sind also dann erfüllt, wenn es prinzipiell möglich ist, auf der Basis der verfügbaren Informationen, eine zutreffende Entscheidung zu fällen.

Die Qualität der Informationen kann durch verschiedene Aspekte beeinträchtigt sein [BDPT07]. Neben der Ge-nauigkeit, der Aktualität, der Verlässlichkeit und der Verfügbarkeit von Sensoren und deren Messdaten, spielt die Abdeckung der vom Konzept des Nutzers herangezogenen Merkmale durch Sensoren eine entscheidende Rolle.

Das Konzept des Nutzers kann als Funktion h() beschrieben werden, welche aus einer Menge von Merkmalen M=m₁,m₂, . . . ,m_n, das gewünschte Ergebnisk∈Kermitteltk=h(M).

Abbildung 3.5:Qualität der Information - Nutzerkonzept und Informationen

In Abbildung 3.5 wird das Problem skizziert. Gegeben sei ein Nutzer, der in einer Kontextdimension ein Nutzer-konzept mit fünf Kontextklassen besitzt:K=A,B,C,D,E. Diese Klassen basieren auf Merkmalen M, welche in der Abbildung als Kreise angedeutet sind. Jedem dieser Klassen kann eine Menge von Merkmalen zugeordnet werden, was wiederum als Wolke dargestellt wird. Die Zuordnung beschreibt die Abhängigkeit zwischen der jeweiligen Klassekund denjenigen Merkmalen, welche in der Funktionh()einen Einﬂuss auf das Resultat haben.

Dunkel dargestellte Kreise beschreiben diejenigen Merkmale, welche durch Sensoren erfasst werden können. Die hell dargestellten Merkmale verwendet der Nutzer implizit in seinem Konzept für seine Differenzierung zwischen den Klassen. Diese versteckten Merkmale sind dem System jedoch nicht zugänglich und können nicht für eine Entscheidungsﬁndung herangezogen werden.

Bei dieser Darstellung werden die Werte der Merkmale zunächst nicht betrachtet, sondern nur die Relevanz eines Merkmals für das Konzept des Nutzers. Je nach Kontextdimension und Konzept des Nutzers kommen andere Merkmale und Sensoren in Betracht.

Jede Kontextklasse k steht zu einer bestimmten Menge von Merkmalen M_k ⊆ M in Relation. Im Allgemeinen werden diese Merkmale werden jedoch nur zum Teil von Sensoren abgedecktS_k⊆M_k.

Die erreichbare QoI bestimmt sich durch:

• Der Anzahl der Merkmale einer Kontextklassem=|M_k|.

• Deren Abdeckung durch Sensorens=|Sk|.

• Der versteckten MerkmaleH_k=M_k−S_kmitv=|H_k|.

Ist m=0, liegt eine willkürliche Entscheidung vor, welche nicht durch Merkmale beschrieben und daher auch nicht über ein beobachtendes System ermittelt werden kann (entspricht Kontextklassen E). Je größer m ist, de-sto mehr Aussagen, können über einen Zustand getroffen werden. Gelingt es diese Aussagen durch Sensoren zu erfassen, so können diese genutzt werden, um Entscheidungen zu treffen. Die erreichbare QoI ist umso höher, je umfassender dies möglich ist. Beiv=0ist eine maximale erreichbare QoI gegeben (wie in Konzept A dargestellt).

Dagegen würde im Fallev=mder niedrigsten erreichbaren QoI entsprechen (siehe Konzept C).

Die Kontextklassen A und B beziehen sich zum Teil auf dieselben Sensoren. Gerade bei exklusiven Zuständen kann diese Menge ausschlaggebend für die Entscheidung zwischen den Zuständen sein.

Jedes Merkmal führt nur mit einer bestimmten Wahrscheinlichkeit zur korrekten Bestimmung des Zustandes. Im Allgemeinen werden mehrere Merkmale dazu genutzt, den Zustand eines Objektes zu beschreiben. Betrachtet man

38 3.4 Qualitätsbetrachtungen

die Kovarianz der Merkmale zueinander, so ist zu erwarten, dass diese häuﬁg Korrelationen zueinander aufweisen.

Je größer diese Korrelation zwischen den Merkmalen ist, desto höher ist die Redundanz r.

Der Wertrbezeichnet die durch die Korrelation der Aussagen der Merkmale hinzugewonnene Redundanz. Bei steigender Anzahl von Merkmalen, welche genutzt werden können, um einen Zustand zu beschreiben, und gleich-zeitig gleich bleibender Komplexität (siehe Abschnitt 3.4.4), steigt diese Redundanz im Allgemeinen.

Die Merkmale die mit den Kontextklassen B und D in Relation stehen, werden nur zum Teil abgedeckt. In dem Fall, dass die Kontextklassen B und D ähnliche Komplexität aufweisen, jedoch B durch eine größere Redundanz r in den Merkmalen die zur Verfügung stehen aufweist, kann davon ausgegangen werden, dass dort eine höhere Wahrscheinlichkeit besteht, ausreichend viele Informationen zu sammeln, um eine zutreffende Entscheidungen treffen, als für Zustand D.

3.4.3 Qualität des Kontextes

Nach der Deﬁnition aus Abschnitt 2.4.3, umfasst der Kontext eines Objektes eine Menge von Merkmalen, welche den Zustand des Objektes, beziehungsweise die Situation, in welcher es sich beﬁndet, beschreiben. Die Qualität des Kontextes (QoC) beschreibt die Qualität der Menge der von der Suche erfassten Merkmale. Die Qualität dieser Beschreibung hängt maßgeblich von folgenden Faktoren ab [Zim06]:

• Genauigkeit, Abstraktionsgrad, Alter der Daten (Aussagekraft).

• Bezug der Daten zum Kontextobjekt (Relevanz).

• Auswirkungen der Durchführung der Suche (Systematische oder statistische Fehler, welche im sich im End-effekt auf Aussagekraft und Relevanz der gesammelten Daten auswirken).

Die QoC ist genau dann ausreichend, wenn die gesammelten Informationen es ermöglichen, sicher zu anderen möglichen Kontextklassen innerhalb der Kontextdimension zu differenzieren. Dies ist jedoch sowohl stark von der Komplexität des Konzepts, als auch davon abhängig, ob diejenigen Merkmale als Informationen vorliegen, welche ausschlaggebend für eine Differenzierung zu anderen Resultaten sind.

B A

Relevanz

Aussagekraft

Niedrig Hoch

Hoch D

Relevanz

Aussagekraft

Niedrig Hoch

Hoch C

Abbildung 3.6:Qualität des Kontextes

In Abbildung 3.6 wird das Problem beispielhaft beschrieben. Die Informationen werden als Punkte und das Er-gebnis der Suche als Wolke dargestellt. Die Informationen sind in der Abbildung in zwei Dimensionen angeordnet:

• Relevanz:Auf der horizontalen Ebene wird zwischen der Relevanz von Informationen unterschieden. Als Ba-sis für die Relevanz einer Information steht deren Korrelation mit dem Ergebnis. Die Aussagekraft bestimmt sich jedoch auch durch die Anwendbarkeit auf das Modell, welches die gesammelten Informationen auswer-tet. Eine Information ist in der Regel vergleichbar mit einem Indiz. Es gibt schwache und starke Indizien.

Reichen die Indizien in ihrer Summe aus, um mit dem Modell eine sichere Entscheidung zu treffen, war die QoC ausreichend.

Wenn Informationen herangezogen werden, die keinen Bezug zu dem Konzept des Nutzers haben, können falsche Entscheidungen getroffen werden. Aufgabe der Suche ist es, potentiell relevante Sensoren mit einem Bezug zu dem Kontextobjekt zu bestimmen.

3 Konzept und Architektur 39

• Aussagekraft:Die vertikale Dimension beschreibt die Aussagekraft einer Information. Nicht jede Information kann direkt auf ein Modell angewandt werden oder sie erzielt bedingt durch ihre Darstellung nur geringe Aussagekraft innerhalb des Modells. Manche Informationen müssen geeignet dargestellt (z.B. Verlauf über die Zeit) oder vorverarbeitet (z.B. Objekterkennung auf Bilddaten oder Stichwortsuche in Texten) werden, um sinnvoll ausgewertet werden zu können. Durch Vorverarbeitung der Sensordaten (siehe Abschnitt 5.2.5) kann die Aussagekraft von Sensoren verbessert werden.

Eine irrelevante Informationsollteim Bezug auf das Modell keine hohe Relevanz erreichen. Da Informationen im Modell abhängig von ihrem (semantischen) Typ verarbeitet werden, kann eine suboptimaldurchgeführte Su-che jedoch dazu führen, dass irrelevante Sensoren anstelle von vergleichbaren Typen an dem Modell angewandt werden, welche in dem Modell eine hohe Relevanz haben.

Eine QoC-Anforderung an eine Suche könnte sein, möglichst aussagekräftigeundrelevante Sensoren zu identiﬁ-zieren und zu erfassen. Die Suche A in dem linken Teil der Darstellung würde diesem Ziel entsprechen. Die Suche B hingegen würde zwar relevante Sensoren ﬁnden, deren Aussagekraft würde jedoch eventuell nicht ausreichen, um mit dem Modell eine sichere Entscheidung zu treffen. In der rechten Darstellung ist die Suche C dargestellt.

Suche C erfasst Informationen über ein anderes Kontextobjekt als Suche A. Daher werden in diesem Beispiel zwei Sensoren, die für die Suche A relevant waren, für die Suche C irrelevant. Bei der Suche C würden Informationen zur Auswertung des Modells genutzt werden, welche nicht im Bezug zu dem Kontextobjekt stehen. Folglich wären nicht zutreffende Ergebnisse zu erwarten. Bei der Suche D würden zwar alle wesentlichen Sensoren gefunden wer-den, es würden jedoch auch irrelevante Sensoren zur Auswertung herangezogen werwer-den, welche (vergleichbar mit der Suche C) das Ergebnis negativ beeinﬂussen könnten.

Bei einer adaptiven, überwachten Auswertung (siehe Abschnitt 5.1.1) können Informationen durch Feedback und Modelladaption an Relevanz gewinnen. Innerhalb einer Trainingsphasekann eine Suche neben der Auswer-tung auch gegebenenfalls eine Modelladaption zum Ziel haben. Eine solche Suche hätte als eine QoI-Anforderung, möglichst viele der relevanten Informationen zu erhalten. Eine Kombination der Suchergebnisse von Suche A und B würde diesem Ziel entsprechen. Die Bestimmung der Relevanz einzelner Informationen, kann durch eine Analyse der Korrelation zwischen den Informationen und dem Verhalten des Nutzers (siehe Abschnitt 5.3.1) oder durch genetische Ansätze wie in [Zim06] beschrieben erfolgen.

3.4.4 Qualität des Modells

Zur Entscheidungsﬁndung werden die gesammelten Informationen ausgewertet. Innerhalb des Prozesses zur Ent-scheidungsﬁndung wird ein Modell zur Auswertung genutzt. Im Idealfall entspricht dieses Modell genau den An-forderungen des Nutzers, beschreibt also genau dasselbe Entscheidungsmuster (Konzept), wie der Nutzer es hat:

m() =h()

In Abbildung 3.7 a) wird das Problem beispielhaft beschrieben. Gegeben sei ein Nutzerkonzept, welches auf zwei Merkmalen basiert, welche durch die Sensoren A und B erfasst werden. In dem Beispiel unterscheidet das Konzept des Nutzers anhand der Zustände dieser Merkmale (dargestellt durch die gestrichelte Linie) exklusiv zwischen den Kontextklassen A, B, C und D.

Ein Modell kann das Nutzerkonzept nur näherungsweise beschreiben. Je mehr sich das Nutzerkonzept mit dem Modell deckt, desto höher ist die Qualität des Modells (QoM). Zum einen hängt die QoM von der Qualität der In-formationen und dem Feedback ab, welches zur Erstellung des Modells genutzt wird. Zum anderen basiert die QoM jedoch auch auf den Darstellung des Modells und den damit verbundenen Möglichkeiten, das Nutzerkonzept zu beschreiben. Ein Modell welches beispielsweise auf der Basis linearer Regression arbeitet, würde das Modell durch Hyperebenen beschreiben, mit denen es den Wertebereich der Sensoren unterteilt, wie es in der Abbildung 3.7 b) durch die durchgehende Linie dargestellt wird. Bei der Generierung des Modells würden die Fehler (grau dar-gestellten Bereiche) minimiert werden. die Mittel die dem Modell zur Verfügung stehen, würden jedoch auch im optimalen Fall keine vollständige Abdeckung des Nutzerkonzeptes erlauben.

Ein Modell kann jedoch nur mit den Merkmalen arbeiten, welche durch Informationsquellen erfasst, über die Suche gefunden und in geeigneter Form dargestellt wurden. Somit steht dem Modell zur Entscheidungsﬁndung in der Regel nur eine Untermenge der Merkmale zur Verfügung, welche bei der Auswertung des Nutzerkonzeptes angewendet werden.

40 3.4 Qualitätsbetrachtungen

Abgrenzung der Bereiche vom Konzept des Nutzers

(a)Konzept des Nutzers

Hyperebene des Modells Differenz

(b)Fehler im Modell

Fehler 1. Grades Fehler 2. Grades

(c)Versteckte Merkmale Abbildung 3.7:Qualität des Modells

In der Graﬁk 3.7 c) wird das Problem derversteckten Merkmale im Bezug auf das Modell dargestellt. Ange-nommen ein Nutzerkonzept beruht auf zwei Merkmalen, von denen nur eines über einen Sensor erfasst wird. Ein Verfahren zur Erstellung eines Modells wie aus dem vorherigen Beispiel würde zwar anhand der gesammelten Informationen des Sensors A versuchen eine möglichst gute Näherung an das Konzept des Nutzers zu ﬁnden. Da jedoch weder zur Generierung des Modells noch zur Auswertung des Modells Informationen bezüglich des Merk-mals B vorliegen, entstehen größere Abweichungen des Modells zu dem Konzept des Nutzers. In der Darstellung sind Fehler erster Ordnung (Abstandzwischen Resultat und Nutzerkonzept) durch hellgraue Flächen dargestellt, sowie Fehler zweiter Ordnung durch dunkelgraue.

3.4.5 Qualität des Feedbacks

Wie im nachfolgenden Kapitel genauer erläutert werden wird, wird Feedback benötigt, um das Modell zur Entschei-dungsﬁndung an das Konzept des Nutzers anzupassen. Ein Nutzer kann mittels Feedback das Modell verändern. Die Menge und Qualität des erhaltenen Feedbacks (siehe Abschnitt 3.2.4), kann die Qualität des Modells maßgeblich beeinﬂussen.

3 Konzept und Architektur 41

Für die Qualität des Feedbacks (QoF) sind hierbei mehrere Faktoren entscheidend:

• Komplexität des Nutzerkonzeptes:Je komplexer das Nutzerkonzept, umso mehraussagekräftigesFeedback wird benötigt.

• Aussagekraft:Feedback ist genau dann aussagekräftig, wenn es ermöglicht, zwischen verschiedenen Ergeb-nismengen innerhalb des Nutzerkonzeptes zu differenzieren.

• Korrektheit:Feedback, welches nicht dem Nutzerkonzept entspricht, liefert falsche Aussagen.

Abbildung 3.8:Qualität des Feedbacks

Diese Faktoren werden in Abbildung 3.8 erläutert. In dem Beispiel wird das Nutzerkonzept aus dem vorheri-gen Abschnitt 3.4.4 aufgegriffen. Die Punkte in der Darstellung entsprechen dem Feedback des Nutzers, wobei die Position eines Punktes den zum Feedback gesammelten Informationen entspricht und der Bezeichner des Punktes dem durch das Feedback übermittelten und vom Nutzer gewünschten Zustand. Der Raum, welcher die Kontextklas-se A des Nutzerkonzeptes beschreibt wird gut durch Feedback abgedeckt (hohes QoF). Das Feedback, welches die Kontextklasse B beschreiben soll, verteilt sich zwar gut über den Raum, es existieren jedoch einzelne Elemente, wel-che nicht dem Nutzerkonzept entsprewel-chen (unten rechts dargestellt). Solwel-che (eventuell versehentlich getätigten) Falsch-Aussagen reduzieren die Qualität des Feedbacks und können das resultierende Modell negativ beeinﬂussen.

Die Komplexität des dargestellten Nutzerkonzeptes benötigt Feedback über beide Sensoren, um die Kontextklas-sen umfasKontextklas-send zu beschreiben. Fällt ein Sensor weg oder wird der Raum, welcher von dem Zustand des Nutzer-konzeptes beschrieben wird, nicht durch Feedback abgedeckt (wie für den Zustand C dargestellt), ist die Qualität des Feedbacks reduziert. Für die Beschreibung des Raumes von Zustand C reicht das gegebene Feedback nicht aus.

Zu dem Zustand D wurde kein Feedback gegeben. In einem solchen Fall ist die Bestimmung dieses Zustandes (über ein, durch das Feedback generierte Modell) nicht möglich.

3.4.6 Qualität der Entscheidung

Die Qualität der Entscheidung (QoD) entspricht der Anzahl der korrekten Entscheidungen des Systems im Bezug auf das Konzept des Nutzers. Eine zutreffende Entscheidung liegt genau dann vor, wenn das Ergebnis der Auswer-tung des Modellsm()gleich ist mit der Auswertung des Konzeptes des Nutzersh(). Eine korrekte Entscheidung liegt genau dann vor, wennh(M) =m(f(M)). Als Funktion f()werden hierbei alle Effekte bezeichnet, welche Einﬂuss auf die Menge der Informationen haben, allen voran die Umsetzung der Suche.

3.4.7 Abhängigkeiten der Qualitätsmerkmale

Die Qualitätsmerkmale weisen Abhängigkeiten auf. QoC beschreibt die Aussagekraft der gesammelten Informa-tionen. Die Menge der gesammelten Informationen ist abhängig von der Umsetzung der Suche, der Verfügbarkeit aussagekräftiger Sensoren und vom Aufwand, welcher in die Suche investiert wurde. Somit ist die QoC vor allem

42 3.4 Qualitätsbetrachtungen

abhängig von der bestehenden QoS innerhalb der Suche nach Informationen und der Abdeckung der Merkmale durch zur Verfügung stehenden Sensoren (QoI):

QoC=f_Suche(QoS,QoI)

Das Modell kann mittels Feedback angepasst werden. Feedback bezieht sich immer auf eine Entscheidung des Systems und damit auf die jeweilige Situation und die Informationen, welche die Grundlage für die Entscheidung bildeten. Somit ist die QoM abhängig von der QoF und der QoC:

QoM=f_{Ad apt ion}(QoF,QoC)

Die Qualität der Entscheidung (QoD), welche von dem Gesamtsystem getroffen wird, ist abhängig von der Qualität des Modells und der Qualität der gesammelten Informationen:

QoD=fE valuat ion(QoM,QoC)

Das Gesamtresultat hängt von vielen Faktoren ab. Die Basis bildet die Umsetzung des Systems, also der Funk-tionen für die Suche, sowie der Adaption und der Evaluation des Modells. In der Phase der Nutzung des Systems können schließlich noch folgende Faktoren maßgeblich das Resultat beeinﬂussen:

QoD=fE valuat ion(f_{Ad apt ion}(QoF,f_Suche(QoS,QoI)),f_Suche(QoS,QoI))

Ziel dieser Arbeit ist es, unter den gegebenen Faktoren, eine möglichst hohe QoD zu erzielen.

Im Dokument Anpassungsfähige Kontextbestimmung zur Unterstützung von Kommunikationsdiensten (Seite 47-53)