Diskussion:Suchmaschinen
Hier habe ich einige Vorschläge zur Gliederung des Themas "Suchmaschine" gemacht.
Inhaltsverzeichnis
Was sind Suchmaschinen?
Eine Suchmaschine (search engine) ist ein Programm zur Recherche von veröffentlichten Schriftstücken, die in einem Computernetzwerk gespeichert sind. Das wichtigste, verbreitetste und bekannteste Internet-Computernetzwerk ist das www-World Wide Web ( Weltweites-Netz ). Die Suchanzeigen, z.B. nach Dokumenten, werden über Schlüsselwörter mit einer nach Wichtigkeit geordneten Trefferliste beantwortet. Der jeweilige Datenbestand wird in hierarchischer Form katalogisiert. Die Recherchen werden ferner gewichtet und ebenso für die Anzahl von Suchergebnissen begrenzt, die der Benutzer wünscht. Die Suchmaschine liefert dann eine Liste mit Verweisen auf möglicherweise passende Ergebnisse.
Die wesentlichen Bestandteile bzw. Aufgabenbereiche einer Suchmaschine sind:
- • Erstellung und Pflege eines Index über Dokumente,
- • Verarbeiten von Suchanfragen sowie,
- • Aufbereitung der Ergebnisse in einer möglichst sinnvollen Form.
Suchmaschinen gibt es seit Beginn der Entwicklung und des Aufstiegs der Personalcomputer, seit Anfang des letzten Jahrzehnts des vorigen Jahrhunderts, das WWW seit 1993.
Unter mehr als Hundert Suchmaschinen weltweit, hat sich in den letzten Jahren die Suchmaschine „Google“ eine eindeutige Vormachtstellung erobert, sodass der Name
mittlerweile ein Synonym für Suchmaschinen geworden ist.
Arten der Suchmaschinen
Suchmaschinen lassen sich nach einer Reihe von Merkmalen kategorisieren. Die nachfolgenden Merkmale sind weitgehend unabhängig. Man kann sich beim Entwurf einer Suchmaschine also für eine Möglichkeit aus jeder der drei Merkmalsgruppen entscheiden, ohne dass dies die Wahl der anderen Merkmale beeinflusst.
Datenquellen
Merkmale häufig genutzten Suchmaschinen
Interpretationen der Eingaben
Suchverhalten der Nutzer
Informationsorientiert
Transaktionsorientiert
Probleme bei Suchmaschinen
Aktualität
Viele Webseiten werden häufig aktualisiert, was die Suchmaschinen zwingt, diese Seiten nach definierbaren Regeln immer wieder zu besuchen. Dieses ist auch notwendig, um zwischenzeitlich aus der Datenbasis entfernte Dokumente zu erkennen und nicht länger als Ergebnis anzubieten. Das regelmäßige Herunterladen der mehreren Milliarden Dokumente,
die eine Suchmaschine im Index hat, stellt große Anforderungen an die Netzwerkressourcen des Suchmaschinenbetreibers
Barrieren für Suchmaschinen
Spam
Mittels Suchmaschinen-Spamming versuchen manche Website-Betreiber, den Ranking-Algorithmus der Suchmaschinen zu überlisten, um eine bessere Platzierung für gewisse Suchanfragen zu bekommen. Sowohl den Betreibern der Suchmaschine als auch deren Kunden schadet dieses, da nun nicht mehr die relevantesten Dokumente zuerst angezeigt werden.
Technik
Suchen auf sehr großen Datenmengen so umzusetzen, dass die Verfügbarkeit hoch ist (trotz Hardware-Ausfällen und Netzengpässen) und die Antwortzeiten niedrig (obwohl oft pro Suchanfrage das Lesen und Verarbeiten mehrerer 100 MB Index-Daten erforderlich ist), stellt große Anforderungen an den Suchmaschinenbetreiber. Systeme müssen sehr redundant ausgelegt sein, zum einen auf den Computern vor Ort in einem Rechenzentrum, zum anderen sollte es mehr als ein Rechenzentrum geben, das die komplette Suchmaschinenfunktionalität anbietet.
Recht
Suchmaschinen werden meistens international betrieben und bieten somit Benutzern Ergebnisse von Servern, die in anderen Ländern stehen. Da die Gesetzgebungen der verschiedenen Länder unterschiedliche Auffassungen davon haben, welche Inhalte erlaubt sind, geraten Betreiber von Suchmaschinen oft unter Druck, gewisse Seiten von ihren Ergebnissen auszuschließen. Die deutschen Internet-Suchmaschinen wollen jugendgefährdende Seiten durch die Freiwillige Selbstkontrolle aus ihren Trefferlisten streichen
Verschiedenes
Suchfunktionen
Eine Suchfunktion ist eine Funktion eines Produkts (oft Software), die es erlaubt, einen bestimmten Datensatz in einer Datenmenge (schnell) zu finden.
Verfahren
Die Suche läuft dabei wie folgt ab:
- • der Suchende legt die Suchkriterien und weitere Parameter zur Steuerung der Funktion fest
- • es wird ein Verfahren angewendet um den Datenbestand mit den Suchkriterien zu vergleichen
- • es wird der erste oder alle oder die ersten N Treffer des Datenbestands, die zu den Suchkriterien passen, verwendet .
Beispiel Telefonbuch
Ein Beispiel aus dem Alltag ist das Telefonbuch. Das verwendete Verfahren ist die Index-Sequentielle Suche.
- • Zunächst wird über die Reiter am Rand des Telefonbuchs (Index) der erste Buchstabe des gesuchten Namens aufgeschlagen
- • Danach werden die nachfolgenden Seiten einzeln (sequentiell) durchlaufen bis der gesuchte Name gefunden ist.
Da das Telefonbuch nach Nachnamen und Vornamen sortiert ist, kann die Suche weiter beschleunigt werden, indem z. B. immer 5 Seiten überblättert werden und dann verglichen wird,
ob der zweite Buchstabe des Nachname passt. Falls er kleiner ist springt man wieder einige Seiten zurück. Ansonsten springt man entweder weiter oder fährt mit der sequentiellen
Suche fort.
Suchfunktionen in Software-Programmen
Intelligente Suchfunktion=
Komplexe Suchfunktion
Bei komplexen Suchfunktionen spielt der Aufwand für die Eingabe der Suchkriterien eine untergeordnete Rolle. Sie wird von ausgebildeten Experten durchgeführt und kann u. U. viele Tage dauern. Fast immer ist dazu das Erlernen einer umfangreichen Syntax einer spezialisierten Abfragesprache notwendig. Im Vordergrund steht die Präzision der Suchergebnisse, die Geschwindigkeit und der Ressourcenverbrauch. Es sollte möglich sein, bei der Durchführung zusätzliche Informationen zu gewinnen, z. B. statistische Daten. Bei einem Suchdurchlauf sollte man gleichzeitig nach mehreren Kriterien suchen können. Komplexe Suchfunktionen müssen mit riesigen Datenmengen zurechtkommen, z. B. Milliarden von Dateien oder Datenbanken mit mehreren Terabyte Umfang.
Suchmaschinenoptimiierung
Suchmaschinenoptimierung ist ein Fachbegriff für Maßnahmen, die dazu dienen, dass Webseiten auf den Ergebnisseiten von Suchmaschinen auf höheren Plätzen erscheinen
Arbeitsweise
Suchmaschinenoptimierung berücksichtigt die Vorgehensweise, nach der Webcrawler verschiedener Suchmaschinen Webseiten suchen, deren Inhalte lesen und verarbeiten, nach welchen Kriterien diese bewertet und wie Suchergebnisse zusammengestellt und sortiert werden (Suchmaschinenranking). Die Arbeitsweise der Sortieralgorithmen wird von den Betreibern der Suchmaschinen geheim gehalten und häufig geändert, um Missbrauch zu erschweren und dem Benutzer nur wirklich relevante Ergebnisse zu liefern. Auf sie muss deshalb indirekt durch die Analyse der Suchergebnisse geschlossen werden. Das Aufsuchen und Einlesen der Inhalte von Webseiten folgt dagegen bekannten HTML-Standards des Web,
deren Einhaltung bei der Erstellung von Webseiten den ersten und wesentlichen Schritt einer Optimierung darstellt.
Ein weiterer Schritt ist die Auswahl der geeigneten Suchbegriffe.
Hierzu kann man sich frei verfügbarer Datenbanken, wie einer Keyword-Datenbank oder dem Metager Web-Assoziator, bedienen.
Die Metatags, welche man im Headbereich einer Homepage einarbeiten kann, verlieren dabei immer mehr an Bedeutung. Um korrekte Suchergebnisse gewährleisten zu können, werden diese von großen Suchmaschinen wie Google kaum noch beachtet. Allein die Meta-Description wird noch zur Anzeige unterhalb des verlinkten Titels in den Suchergebnisseiten (SERPS) genutzt. Wichtig ist viel Text in der betreffenden Internetpräsenz, um möglichst viele Keywordphrasen gewährleisten zu können. Besonders bedeutsam sind außerdem die Wörter, die im Seitentitel (Title-Tag), in ausgewiesenen Überschriften (H1-, H2-Tags usw.), in Textlinks (auch solchen, die auf die betreffende Seite verweisen) sowie innerhalb der URL vorkommen.
Traditionelle Suchmaschinenoptimierung
Ethik der Suchmaschinenoptimierung
Grenzen der Suchmaschinenoptimierung
Rein grafisch orientierte, mit Filmen, Bildern und grafisch eingebetteten Texten gestaltete Seiten, wie es z.B. die Programmierung in Flash ermöglicht, bieten den Suchmaschinen kaum auswertbaren Textcode. Die Programmierung einer Webseite ausschließlich in Flash empfiehlt sich daher aus Sicht der Suchmaschinenoptimierung nicht. Von den Suchmaschinenbetreibern wird jedoch daran gearbeitet, reine Flash-Seiten zu durchsuchen und in den Index aufzunehmen. Um dennoch das Gestaltungspotential animierter Startseiten oder ganzer Internetauftritte in Flash ohne Ranking-Verlust zu ermöglichen, werden teilweise Brückenseiten eingesetzt. Dies widerspricht jedoch den Richtlinien der meisten Suchmaschinen. Derartig „optimierte“ Zielseiten werden, sobald sie bemerkt werden, von Suchmaschinenbetreibern ausgeschlossen.
Business Suchmaschinen
Business-Suchmaschinen durchsuchen das Internet nach ganz konkreten Inhalten, Informationen, Produkten, Preisen oder Kontakten. Sie existieren neben den bekannten allgemeinen Suchmaschinen wie Google, Yahoo! oder MSN. Sie haben sich in den letzten Jahren auf Geschäftskunden spezialisiert und durchsuchen Business-to-Business-Verzeichnisse wie Wer liefert was?, Gelbe Seiten Business oder Exportpages. Business-Suchmaschinen greifen dabei auf vorselektierte Quellen und Daten zurück und bearbeiten diese noch redaktionell.