• Keine Ergebnisse gefunden

Probleme der Datenerhebung

2 Das Internet als Quelle zur religionsgeschichtlichen Forschung

2.2 Probleme der Datenerhebung

Es ist in heutiger Zeit kein Problem, Daten in großer Menge aus dem Internet zu erhalten.

Standardanwendungen und Standardbrowser ermöglichen dies durch die direkte Eingabe einer Internetadresse oder mit Hilfe einer Suchmaschine. Doch das Internet als Quelle der Religionsgeschichte zu nutzen, führt automatisch auch zu Fragen der Datensicherheit und Verfügbarkeit von Daten. Die Archivierung, die Haltbarkeit und die Verfügbarkeit von Daten, die mehr als nur Blitzlichter singulärer Elemente der Religionsgeschichte sind, erweisen sich zur Zeit noch als zentrale ungelöste Probleme. Die Ursache hierfür liegt im

88 Zu verschiedenen Formen der Datenerhebung vgl. Döring, N., 1999, S. 172. “Solange die Tatsache der Beobachtung von den Beobachteten nicht bemerkt wird, spricht man auch von nonreaktiver Datenerhebung”.

Medienverbundsystem Internet selbst, da alle Daten im Internet einer Art „Leichtflüchtigkeit”

unterliegen. Diese „Leichtflüchtigkeit” bezieht sich sowohl auf Sicherheits- und Verfügbarkeitsprobleme von HTML-Seiten, ihre Platzierung auf dezentralen Servern und deren Funktionsfähigkeit wie auch auf die grundsätzliche Verweildauer von HTML-Seiten89. Religionsgeschichtlich relevante Daten für die vorliegende Arbeit sind innerhalb der letzten drei Jahre gesammelt90 und im Rahmen dieser Dissertation ausgewertet worden91. Einige dieser Daten sind in diese Untersuchung implementiert worden92.

2.2.1 Authentifikation und Datierung von Daten

Daten zu authentifizieren, um eine „sichere“ Datengrundlage zu bekommen, ist eines der Grundprobleme im Rahmen der Befundaufnahme und Analyse von Websites. In den folgenden Ausführungen werden einige Manipulationsmöglichkeiten dargestellt, die den Datenbefund verfälschen können.

2.2.2 Manipulationen auf der Seite des Internets

Die Manipulation von Daten (fake/cracking), aber auch von IP93-Adressen oder Internetnamen (Spoofing) ist ausführlich dokumentiert94. Daher kann selbst bei einer

89 „Zumindest die Webseiten aus den ersten Jahren des www sind unwiderruflich dahin, sofern nicht Firmen oder Privatleute das eine oder das andere gespeichert haben. Während von Büchern und Filmen zumeist etliche Exemplare oder Kopien existieren, sind Webseiten normalerweise Unikate: Sie liegen lediglich auf einem einzigen Server. Löscht der Eigentümer sie, so sind sie verschwunden. Fast 90 Prozent aller

Internetseiten sind derzeit jünger als ein Jahr, nur 0,1 Prozent stehen seit mehr als sechs Jahren unverändert im Netz.” Klempert, O., / Krempl, S., / Paulus, J. u. a., 2001, S. 165. Zur „Haltbarkeit“ von Websites vgl.

auch Beckerlegge, G., 2001a, S. 223.

90 Die Aufnahme der Daten erfolgte meist mit dem Programm Webcopier (http://www.maximumsoft.com/

verfügbar 05.06.03), die Speicherung dezentral auf CDs. Diese Vorgehensweise wurde als erster Schritt gewählt, um einen Datenbestand zu sichern, auf den weiter aufgebaut und der später eingegrenzt werden konnte. Vgl. hier auch Döring: „Auch die Analyse von Netzdokumenten (z.B. FAQ der beobachteten

Newsgroup, Homepage des beobachteten Chat-Channels etc.) spielt im Kontext der Feldforschung eine große Rolle. Typisch für Feldforschung ist die zeitliche Ausdehnung des Untersuchungsgegenstandes über Wochen, Monate oder Jahre hinweg, wobei man sich im Sinne des Fallstudien-Designs auf wenige

Untersuchungsobjekte konzentriert [...].” Döring, N., 1999, S. 175.

91 Vgl. zur Inhaltsanalyse von Webseiten Klein, H., http://www.gor.de/tband99/pdfs/i_p/klein.pdf (10.10.02).

92 Aufgrund der Datenmenge sind notwendigerweise Selektionen vorgenommen worden. „Das pragmatische Problem, extrem umfängliche Textkorpora systematisch zu archivieren und zu analysieren, mag in der Forschung ebenfalls dazu führen, automatisierte Beobachtungsaktivitäten zu beschränken bzw. bei der Auswertung stark selegierend und aggregierend (und damit auch anonymisierend) vorzugehen.“ Döring, N., 1999, S. 176.

93 Internet Protocol.

94 Z.B. Hacker’s Black Book in: http://spezialreporte.de/blackbook/ (01.04.01). Aufgrund des Grenzbereiches zur Computerkriminalität sind entsprechende Dokumentationen meist nur wenige Tage auf einem Server zu finden. Um sich ein Bild von den gegenwärtigen Möglichkeiten zu machen, ist es notwendig, mit Keywords (z.B. 0-day-warez) zu suchen, um zu den entsprechenden Dokumentationen über Netzsicherheit zu kommen.

elektronischen Dokumentation unterschiedlicher Gruppen aus dem Internet keine „letzte”

Sicherheit gegeben werden, ob eine Internetseite der Gemeinschaft zuzuordnen ist, die als Adressat angegeben wurdee. In einigen Fällen kann man sich durch die Analyse von Quellcodes Klarheit verschaffen, doch auch hier sind Grenzen gesetzt. Seiten, die beispielsweise Macromedia-Flashfilme enthalten, entziehen sich der genaueren Analyse auf Quelltextebene, da diese Filme meist in einem nicht-quelltextoffenen Endformat im Internet distribuiert werden. Möglich bleibt auch, dass die Editoren oder Webseitendesignerinnen mit Absicht ihre Spuren verwischt haben.

Bestimmte Software ermöglicht es zudem, alle elektronisch dokumentierten Daten zu verändern, ohne dass dies für einen Leser oder eine Leserin mit einfachen Mitteln festzustellen wäre.

2.2.3 Probleme der Datierung und der Herkunft von Internetseiten

Kurz nachdem begonnen wurde, in wissenschaftlichen Arbeiten auf Internetseiten zu verweisen, trat auch die Frage nach der “richtigen” Zitierweise und der Datierung von Internetseiten auf. Während das Zitieren selbst nur mit geringen Problemen zu kämpfen hat (z.B. dem der Zeichensätze oder der Formatierung), ist die Fragestellung bei der Datierung einer Webseite vor allem als religionsgeschichtliche Quelle weitaus diffiziler. Der momentane Grundkonsens zielt darauf, dass die Netzadresse95 und der Zeitpunkt der lokalen Verfügbarkeit anzugeben ist96. Dies ist als Arbeitsansatz zugrunde gelegt, aber er unterliegt bezüglich der Nachprüfbarkeit engen Grenzen, da schon Tage später eine Website vom Netz genommen sein kann.

Ein weiteres Problem ergibt sich bei den sog. Pop-Up-Seiten beziehungsweise bei Frameseiten und deren interner Verschachtelung. Pop–up–Seiten sind kleine Internetseiten, die meist in den Quellcode der Seite eingebunden sind und beim Öffnen der Seite aufspringen (pop-up). Diese Seiten haben kaum eindeutig sichtbare Adressen und sind nur über die Quellseiten zu zitieren und zu datieren. Wenn aber Pop–Up–Seiten auf externe Seiten

An dieser Stelle sei aber auf den kriminellen Charakter vieler Seiten hingewiesen. Die Nutzung der dort angegebenen Programme kann gegebenenfalls urheberrechtliche Probleme mit sich bringen und ist in gewissen Fällen auch strafbar.

95 Zu terminologischen Feinheiten innerhalb von Adressen im Internet vgl. Connoly, D., http://www.w3.org/Addressing/ (21.06.03).

96 Z.B. http://www.websprache.uni-hannover.de/zitat/zitieren.htm (30.04.01); Bleuel, J.,

http://ourworld.compuserve.com/homepages/jbleuel/ip-zit.pdf (30.04.01). Vgl. auch hier die bekannte Zitierform des APA-Style (American Psychological Associationhttp://www.apastyle.org/elecmedia.html (05.06.03). Oftmals werden die Begriffe „Verfügbarkeit“ und „Zugriff“ in diesem Zusammenhang synonym genutzt.

verweisen, die randomisiert und eingebunden sind, d.h. durch einen Zufallsgenerator gesteuert werden, ist die Angabe der Quelle kaum oder oftmals gar nicht möglich.

Problematisch sind auch die Techniken um das sog. „Hidden Web“. Hier werden HTML-Seiten zunehmend dynamisch generiert, d.h. die eigentlichen Daten liegen in einer Datenbank und die HTML-Seite wird dynamisch aufgebaut. Je nach Parameter, z.B. eines Zufallsgenerators, werden unterschiedliche Inhalte dargestellt. Auf die Inhalte der Datenbank hat man keinen direkten Zugriff!

Auch bei Frameseiten kann es Probleme bereiten, die Herkunft anzugeben97.

Bei einigen Webseiten ist es möglich, durch die Analyse des Quellcodes beziehungsweise des Verzeichnisbaumes das Entstehungsdatum oder das Datum der letzten Überarbeitung zu erkennen. Wenn dies nicht möglich ist oder nur unzureichende Ergebnisse zur Datierung erbringt, kann man anhand der implementierten Steuerelemente Rückschlüsse auf die Browserversion ziehen, für die diese Seiten optimiert wurden. Aufgrund der verschiedenen Browserversionen lässt sich dann ein ungefähres Entstehungsdatum festmachen.

2.2.4 Der Punkt am Ende des Zitates – ein besonderer Punkt

Das methodisch-philologische Problem des Punktes am Ende eines Zitates einer Internetquelle wird von einigen Autoren benannt98 und ganz unterschiedlichen Lösungen zugeführt99. Es ist eine Frage der Praktikabilität für den Leser und die Leserin, ob zur Überprüfung einer Quellenangabe einfach ein Link angeklickt werden kann, oder ob noch manuell ein Punkt, andere Satzteile oder Satzzeichen entfernt werden müssen. Dabei sind

97 Bei normalen Frameseiten ist die URL durch die Befehlskombination „open frame in new window/tab“ zu finden. Jedoch ist der Kontext je nach Gestaltung der Frameseite nicht mehr erkenntlich. Es können Hinweise auf Autor, Menüs etc. fehlen, die im umgebenden Frameset aber dargestellt werden.

98 Vgl. in diesem Zusammenhang den von Marcus Willamowski in der Internetzeitschrift für Rechtsinformatik publizierten Artikel, in dem explizit auf den abschließenden Punkt eines Zitates hingewiesen wird: “Ein für den versierten Benutzer marginaler, für den unerfahrenen Anwender möglicherweise entscheidender Punkt ist die Frage nach dem "Punkt". Gemeint ist die Tatsache, dass Zitate im besonderen und Fußnoten im

allgemeinen in aller Regel mit einem Punkt abgeschlossen werden. Zwar mag man als Verfasser von Zitaten auf den gesunden Menschenverstand vertrauen und hoffen, der Leser werde erkennen, dass es sich bei dem

"Punkt" um ein Satzzeichen handelt. Gerade aber weil Websites ohne Zwischenabstand formuliert werden, empfiehlt es sich meines Erachtens für den Fall, dass ein Satz mit der Quellenangabe abschließt, hier ausnahmsweise nach dem Zitat und vor dem Satzzeichen eine Leerstelle einzufügen. Gleiches gilt natürlich auch für die anderen Satzzeichen wie etwa Komma und Semikolon. Absehen sollte man davon auch dann nicht, wenn die zitierte Internetseite selbst drucktechnisch hervorgehoben wird.

Bsp.: Verfasser, Titel, 1.1.2000, http://www.internetadresse.de/dokument.html . Verfasser, Titel, 1.1.2000, http://www.internetadresse.de/dokument.html ; Verfasser usw.” Willamowski, M.,

http://www.jurpc.de/aufsatz/20000078.htm#fn0 (30.05.01).

99 Paape, B., http://www.rwth-aachen.de/zrs/v0001/fb8wd_hinweise_imwar.htm (05.03.03).

auch automatische Formatierungen zu beachten, die Punkte am Ende von Zitaten in die Netzadresse aufnehmen können100.

2.2.5 Verfügbarkeit, Archivierung und Zitation

Auf der technischen Seite gibt es einige Instrumentarien, um Internetquellen zu speichern, sie längerfristig zu archivieren und einem Leser zur Verfügung zu stellen.

Das Zitieren von Internetseiten mit Datum kann maximal ein Hinweis auf die Quelle sein, im Extremfall ist die Seite nicht mehr vorhanden. Dies darf in der Konsequenz aber nicht zu einer Abwertung dieser Quelle führen. Die neuen Quellen zur Religionsgeschichte sind zentrale und authentische Quellen und die „Leichtflüchtigkeit der Daten“ ist eine systemimmanente Eigenschaft mit eigener Dynamik und Konsequenz, die keinesfalls ausgeblendet werden darf.

Über die Verfügbarkeit einer Quelle als WWW-Seite in ihrer medialen Vielfalt und der Möglichkeit des Zugriffs bestimmt letztlich nur der Autor beziehungsweise der Webmaster101. Ihre Datierung und der Hinweis in einer Fußnote bleiben notgedrungen nur Annäherungen.

Die Zeichensetzung am Ende einer WWW-Adresse soll meines Erachtens der Prämisse der bestmöglichen Praktikabilität für die Leser folgen.

Die Frage nach den Kommunikations- und Informationswegen von Usern im Internet beinhaltet die Frage nach den Userinnen und Usern selbst. Im nächsten Unterkapitel soll nun die Frage auf die User im Medienverbundsystem Internet ausgeweitet werden.

2.3 Kommunikationsformen und Medien im Internet – theoretische

Outline

ÄHNLICHE DOKUMENTE