Suchmaschinenlabor an der Uni Hannover
Derek Daniel
Introduktion
1998 - Hotbot erfaßt 34%
1999 - nur noch 11%
alle zusammen 42%
1999
Metasuchmaschinen
Metacrawler
SavvySearch
MetaGer
Themen
MetaGer
Forschungsportal
Andere Projekte
MESA
de.*
HannUFind
MetaGer
1995 angefangen
Deutschsprachig
400,000+ Anfragen am Tag
ca. 90,000 externen Links auf MetaGer
25 Suchmaschine abfragbar
AND, OR, String Syntax
MetaGer Kriterien
1. Parallele Suche (keine all-in-one Forms) 2. Ergebnis-Merging
3. Doubletten-Eleminierung
4. mindestens AND und OR Operatoren 5. Übernahme Kurzbeschreibung
6. Searchengine hiding
Suchen
standardmäßig “AND”
“OR” möglich
String in Titel
“NOT” und “NEAR” nicht möglich
Stopwörter
Doubletten zusammengefaßt
Ranking
Eigenes Rankingsystem
Zusätzliche Überprüfung
Spamfilterung
Zeitliches Ranking
Server Clustern
Test auf Existenz
QuickTips
vor Suchergebnisse ausgegeben
2 Sorten
selbst ausgesucht von Menschen
D-N-S Quicktip gibt Domainnamen zurück
arbeitet weiter im Hintergrund
Beschleuniger
Statt QuickTips, Beschleuniger
Vorteil: viel schneller
Nachteil: möglicherweise veraltet
Qcheck (Quickcheck)
Existenz- und Inhaltsprüfung
Filtert Suchmaschinenbetrüger
Probleme
Geänderte Ausgaben
Korrekte Syntax
Ziele der Einzelsuchmaschinen
Werbung
Überlastung
Hardware
Verteilte System
Sun Enterprise E450 mit Solaris
4 CPUs
1.6GB RAM
155Mbit/s Anschluß
bis 5 weitere Sun/Linux Servers
Themen
MetaGer
Forschungsportal
Andere Projekte
MESA
de.*
HannUFind
Forschungsportal
Besonders für Forschung
Problem des Deepwebs lösen
folge jedes Link
besonders der Art: www.anyurl.dom/path?
parameters
2000 Benutzer am Tag
Beispiele
Typische wissenschaftliches Dokument:
www.evl.uic.edu/spiff/casa/
andere Forschungssuchmaschinen
www.tt.uni-hannover.de/UniForKat/suchen.cfm
www.uni-kassel.de/forschungsbericht/
Beispiele
Typische wissenschaftliches Dokument:
www.evl.uic.edu/spiff/casa/
andere Forschungssuchmaschinen
www.tt.uni-hannover.de/UniForKat/suchen.cfm
www.uni-kassel.de/forschungsbericht/
Suchen
2 Arten von Suchen
Textsuche
Einrichtungssuche
Operatoren: + - | _ “” ()
Ranking
Nach Institution
Anzahl der Hits
Adressen
Institution wichtiger als Dokument?
Suche auf einzelne Institution
Einschränkungen
Statische Links auf dem Inhalt
http Regelung
Browser lesbar
Weitere Feature
Forschungslandkarten
Hochschulen
Max-Planck-Gesellschaft
Frauenhofer Gesellschaft
…
Themen
MetaGer
Forschungsportal
Andere Projekte
MESA
de.*
HannUFind
Andere Projekte: MESA
Meta E-mail Search Agent
Eingabe Name, Ausgabe e-mail Adresse
Fragt 7 e-mail Suchmaschinen ab
Andere Projekte: de.*
Newsgroup Suchmaschine
Wird eingestellt wegen Google/Deja
Andere Projekte: HannUFind
Volltextsuche aller Webserver der Uni Hannover
Über 100 Webserver
ca. 100,000 HTML Seiten pro Woche erfaßt
Quellen
MetaGer Homepage
meta.rrzn.uni-hannover.de/suma.html
Internet Information Retrieval
www.uni-hannover.de/inet98/paper.html
Forschungsportal
forschungsportal.net
FUnktioniert das FUnkLAN?
Beispiel: suche nach “hamster futter”
Beispiel: suche nach “identifying changes corporate ekkehart frieling”
google, altavista, metacrawler, metager, forschungsportal
Beispiel: suche nach “solar cells”