Suchmaschinen
Inhaltsverzeichnis
Was sind Suchmaschinen?
Eine Suchmaschine (search engine) ist ein Programm zur Recherche von veröffentlichten Schriftstücken, die in einem Computernetzwerk gespeichert sind. Das wichtigste, verbreitetste und bekannteste Internet-Computernetzwerk ist das www-World Wide Web ( Weltweites-Netz ).
Die Suchanzeigen, z.B. nach Dokumenten, werden über Schlüsselwörter mit einer nach Wichtigkeit geordneten Trefferliste beantwortet. Der jeweilige Datenbestand wird in hierarchischer Form katalogisiert. Die Recherchen werden ferner gewichtet und ebenso für die Anzahl von Suchergebnissen begrenzt, die der Benutzer wünscht. Die Suchmaschine liefert dann eine Liste mit Verweisen auf möglicherweise passende Ergebnisse.
Leider gibt es auch viele Probleme bei Suchmaschinen, wodurch nicht immer das gewünschte Ergebnis erzielt werden kann.
Die wesentlichen Bestandteile bzw. Aufgabenbereiche einer Suchmaschine sind:
- • Erstellung und Pflege eines Index über Dokumente,
- • Verarbeiten von Suchanfragen sowie,
- • Aufbereitung der Ergebnisse in einer möglichst sinnvollen Form.
Suchmaschinen gibt es seit Beginn der Entwicklung und des Aufstiegs der Personalcomputer, seit Anfang des letzten Jahrzehnts des vorigen Jahrhunderts, das WWW seit 1993. Unter mehr als Hundert Suchmaschinen weltweit, hat sich in den letzten Jahren die Suchmaschine „Google“ eine eindeutige Vormachtstellung erobert, sodass der Name mittlerweile ein Synonym für Suchmaschinen geworden ist.
Arten der Suchmaschinen
Suchmaschinen lassen sich nach einer Reihe von Merkmalen kategorisieren. Die nachfolgenden Merkmale sind weitgehend unabhängig. Man kann sich beim Entwurf einer Suchmaschine also für eine Möglichkeit aus jeder der drei Merkmalsgruppen entscheiden, ohne dass dies die Wahl der anderen Merkmale beeinflusst.
Datenquellen
Verschiedene Suchmaschinen können unterschiedliche Arten von Daten durchsuchen. Zunächst lassen sich diese grob in „Dokumenttypen“ wie Text, Bild, Ton, Video und andere unterteilen. Ergebnisseiten werden in Abhängigkeit von dieser Gattung gestaltet. Bei einer Suche nach Textdokumenten wird üblicherweise ein Textfragment angezeigt, das die Suchbegriffe enthält. Bildsuchmaschinen zeigen eine Miniaturansicht der passenden Bilder an. Eine weitere feinere Aufgliederung geht auf datenspezifische Eigenschaften ein, die nicht alle Dokumente innerhalb einer Gattung teilen. Bleibt man beim Beispiel Text, so kann bei Usenet-Beiträgen nach bestimmten Autoren gesucht werden, bei Web-Seiten im HTML-Format nach dem Dokumententitel. Je nach Datengattung ist als weitere Funktion eine Einschränkung auf eine Untermenge aller Daten einer Gattung möglich. Dieses wird im Allgemeinen über zusätzliche Suchparameter realisiert, die einen Teil der erfassten Daten ausschließt. Alternativ kann sich eine Suchmaschine darauf beschränken, von Anfang an nur passende Dokumente aufzunehmen. Beispiele sind etwa eine Suchmaschine für Weblogs (statt für das komplette Web) oder Suchmaschinen, die nur Dokumente von Universitäten verarbeiten, oder ausschließlich Dokumente aus einem bestimmten Land, in einer bestimmten Sprache oder einem bestimmten Dateiformat.
Merkmale häufig genutzten Suchmaschinen
Die gängigste und meistgenutzte Kombination von Merkmalen benutzt das WWW als Datenquelle, für Text-Dokumente im HTML-Format und baut zur Realisierung einen Index auf. Die Interpretation der Eingabe erfolgt meist auf der Basis einer einfachen Syntax, bei der etwa durch ein dem vorangestelltes "-" ein Schlüsselwort ausgeschlossen werden kann. Die Suchmaschinen der drei größten Anbieter Google (53,7 %), Yahoo Search (22,7 %) und Microsofts Live Search (8,9 %) arbeiten nach diesem Muster, Markanteile in Deutschland: Google (89,2 %), Yahoo (3,3 %) und Live Search (2,2 %),