Was speichert Google und andere Suchmaschinen bei Suchanfragen?

Aus Enigma
Version vom 14. Oktober 2010, 09:17 Uhr von Jaky (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „Was sammeln und speichern Google und andere Suchmaschinen? Einleitung. Laut einer Statistik vom 4. August 2010, im „Web-Barometer“ von „WebHits“ angezei…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Was sammeln und speichern Google und andere Suchmaschinen?

Einleitung.

Laut einer Statistik vom 4. August 2010, im „Web-Barometer“ von „WebHits“ angezeigt, teilt sich die Nutzung von Suchmaschinen auf in 89,6 % für Google, 2,6 % für Yahoo, 2,3 % für bing.com, 2,0 % für T-Online, 0,8 % für ask.com und 2,7 % für andere. Die Suchmaschine Ixquick ist mit einem Anteil von 0,2 % unter anderen Suchmaschinen zu finden. Siehe

http://www.webhits.de/deutsch/webstats.html Web-Barometer


Google, dem auf dem Markt überragend vertretenen Anbieter einer Einzel-Suchmaschine sei hier die Metasuchmaschine Ixquick gegenübergestellt. Die beiden Anbieter vertreten ganz unterschiedliche Auffassungen von einer Auswertung der Daten, die ein Nutzer von Suchmaschinen hinterlässt. Betont Google die Notwendigkeit einer Sammlung dieser Daten, sieht Ixquick hierfür keine Veranlassung, da Ixquick an einer kommerziellen Auswertung der Daten kein Interesse zeigt. Sagt Google, durch die auf der persönlichen Grundlage beruhenden Suchaktivitäten des Anwenders lassen sich bessere, weil personalisierte Treffer erzielen, findet Ixquick, als Metasuchmaschine decke sie größere Bereiche des Internet als eine Suchmaschine allein ab, da eine Metasuchmaschine diverse andere Suchmaschinen anonym an den Suchvorgängen beteilige und die Genauigkeit der Ergebnisse durch die Übereinstimmung der beteiligten Suchmaschinen bei der getroffenen Auswahl erzielt werde. Die verschiedenen Sichtweisen von Google und Ixquick bei der Datenauswertung von der Nutzung der Suchmaschinen führen zu ebenso unterschiedlichen Ansichten über den Datenschutz der gesammelten Daten. Wo Ixquick gänzlich darauf verzichtet anwenderbezogene Daten zu speichern, benötigt Google diese Daten für gewünschte Innovationen des Suchsystems wie für den Schutz der Daten seiner Nutzer.

Im Eckpunktpapier „Ein modernes Datenschutzrecht für das 21. Jahrhundert“, verabschiedet von der Konferenz der Datenschutzbeauftragten des Bundes und der Länder am 18. März 2010, heißt es im Vorwort u.a. „Datenschutz hat nicht nur eine Schutzfunktion, er beschreibt auch einen Gestaltungsanspruch der Betroffenen: Jeder Mensch soll selbst bestimmen können, wer was wann über ihn weiß. Datenschutz ist Grundrechtsschutz und die Wahrung der informellen Selbstbestimmung eine Funktionsbedingung einer menschenwürdigen Informationsgesellschaft…“

Siehe Vorwort im
„Ein modernes Datenschutzrecht für das 21. Jahrhundert“.
http://www.bfdi.bund.de/cln_134/SharedDocs/Publikationen/Allgemein/79DSKEckpunktepapierBroschuere.html?nn=408908


Informationen, die Google dem Nutzer von Suchmaschinen zur Verfügung stellt.

„Das Ziel von Google besteht darin, die auf der Welt vorhandenen Informationen zu organisieren und allgemein zugänglich und nutzbar zu machen.“ Siehe

www.google.de/intl/de/corporate/facts.html

Kurzprofil. Mission.


Die Lebensdauer einer Google Suchanfrage wird von Google geringer als eine halbe Sekunde angegeben. Mit Hilfe einer bildlichen Darstellung führt Google vereinfacht die Schritte vor, die in diesem Zeitraum für die Beantwortung der Suchanfrage ablaufen.

1. Die Suchanfrage an den Webserver, dem Programm, das Dienste und Daten im Netzwerk anbietet, wird an den Indexserver weitergeleitet.

Der Indexserver wird von Google durch den Vergleich mit einem alphabetischen Stichwortverzeichnis am Ende eines Buches erläutert. Die aufgefundenen Suchbegriffe führen über die im Verzeichnis angeführten Seitenangaben zu den gewünschten Textstellen im Buch. So  werden 

2. die im Indexserver notierten Seitenangaben an den Dokumentenserver weitergeleitet, welcher die gespeicherten Dokumente abruft. Von den ausgewählten Dokumenten werden Snippets, Textfragmente mit kurzer Inhaltsangabe oder eine kurze Beschreibung der Webseite erstellt. 3. Diese Suchergebnisse werden dem Nutzer innerhalb von Sekundenbruchteilen angezeigt.

Angemerkt sei, dass das bei der Auffindung von zutreffenden Dokumenten zusätzlich eingesetzte Seitenrank-Verfahren (PageRank-Verfahren), welches die Wichtigkeit der auszuwählenden Seiten in Hinblick auf die Position des Dokumentes auf der Ergebnisseite festlegt, eines von vielen Faktoren ist, die das Erscheinungsbild auf der Ergebnisseite mitbestimmen. Siehe „Lebenszyklus einer Google Suchanfrage“ und „PageRank-Technologie“ in

www.google.de/intl/de/corporate/tech.html

(Unternehmensbezogene Informationen. Technologie)


Informationen, die der Nutzer der Suchmaschine Google zur Verfügung stellt.

„…Unser Ziel ist es, hinsichtlich der uns vorliegenden Nutzerdaten und hinsichtlich der Art und Weise, in der diese Daten zur Bereitstellung unserer Services genutzt werden, gegenüber dem jeweiligen Nutzer so transparent wie möglich zu sein“, erläutert Google in seinen „Datenschutzprinzipien“.

Stellt der Nutzer eine Anfrage an einen Suchmaschinenanbieter, so nimmt der eigene Computer mit der Website des Anbieters Kontakt auf, genauer und auf Google als Anbieter bezogen, der eigene Browser sendet Informationen an die Server von Google, welche von diesen automatisch aufgezeichnet werden. Diese Serverprotokolle enthalten in der Regel als Information die Suchanfrage, die IP-Adresse, den Browsertyp und die Browsersprache, Datum und Uhrzeit der Anfrage und einen oder mehrere Cookies, welche den verwendeten Browser eindeutig identifizieren.

Die für den Nutzer von Suchmaschinen vertrauten und nachvollziehbaren Angaben, die sich in dem Serverprotokoll wiederfinden, sind, außer Datum und Uhrzeit, die Suchanfrage, die Browserversion und das Browsersprache benannte Betriebssystem. Nicht ohne Weiteres sichtbar für den Nutzer ist die Internet-Protokoll-Adresse (IP-Nummer) zur Identifikation der miteinander in Kommunikation sich befindenden Computer, desgleichen nicht direkt einsehbar sind die vom Server in den Browser des Nutzers eingestellten kleinen Textdateien, die Cookies.

Zur Definition der verwendeten Begriffe siehe Wikipedia

http://wikipedia.org/wiki/IP-Adresse

http://wikipedia.org/wiki/Cookie


Googles Orientierung am Nutzer.

„Wir verwenden die Informationen, die unsere Nutzer uns zur Verfügung stellen, um hochwertige Services und Produkte für Sie zu entwickeln…“ Siehe

(www.google.de/intl/de/corporate/privacy_principles.html)

(Datenschutzprinzipien) von Google.

Mit Hilfe der von den Servern von Google an den Computer des Nutzers gesendeten Cookies werden die Nutzereinstellungen des eigenen PC und die Nutzeraktivitäten im Internet gespeichert. Eine Nutzereinstellung ist z.B. die Festlegung der Sprache, in welcher die Recherche im Internet durchgeführt werden soll.

Die von den Servern der Google Services protokollierten Computereinstellungen und Aktivitäten des Nutzers dienen, so Google, dem Nutzer zu einer Verbesserung von Suchergebnissen, einer Verbesserung der Anzeigenauswahl und der Erneuerung von Nutzertrends. Über Nutzertrends, dem Verfolgen des Verhaltens von Nutzern lassen sich neue Strategien für die Suchtechnologie entwickeln. Als Beispiel für eine solche Entwicklung aufgrund der Beobachtung des Nutzerverhaltens im Internet führt Google die Rechtschreibprüfung an, welche die bei einer Anfrage verwendeten Suchbegriffe auf die gängige Schreibweise überprüft. Weicht die Suchfrage davon ab, wird über die Rückfrage „Meinten Sie…“ die aktuelle Bezeichnung zur Verwendung angeboten.


Warum sammelt Google Protokolldaten von Suchmaschinen? „Durch unser Engagement“, schreibt Google, „für die Verbesserung der Suchfunktionen konnten wir unsere erworbenen Kenntnisse auch auf neue Produkte wie Google Mail und Google Maps anwenden. Wir hoffen, den Erfolg der Suche auch auf zuvor unerforschte Bereiche übertragen zu können. Dadurch können Nutzer einen noch größeren Teil der ständig zunehmenden Informationsmenge für sich nutzen und in ihr Leben integrieren.“ Siehe Link „Speicherung von Protokolldaten“.

Die Sammlung der Protokolldaten seiner Suchmaschinenanwender begründet Google, außer mit der Ausführung von Verbesserungsmaßnahmen zur Bereitstellung von Suchergebnissen, mit Verbesserungen an der Sicherung des Systems, welches die Produkte und Services von Google zur Verfügung stellt, und mit dem Schutz der Daten der Nutzer vor Betrug und einer missbräuchlichen Verwendung der bereitgestellten Services.

Um diesen Anforderungen gerecht zu werden, betrachtet Google die Anonymisierung der IP-Adresse nach 9 Monaten und die der Cookies nach 18 Monaten als „ein gutes Maß“. Siehe

www.google.de/intl/de/privacy_faq.html

(Speicherung von Protokolldaten) von Google.


Zwei Werbeprogramme von Google.

„Google ist ein Wirtschaftsunternehmen. Die Firma erzielt Umsätze, indem sie anderen Unternehmen Suchtechnologien anbietet und Anzeigen verkauft, die auf der Website von Google und anderen Websites im Internet geschaltet werden…“ Siehe

www.google.de/intl/de/corporate/tenthings.html

(Unsere Philosophie) von Google.

Die Google Programme „AdWords“ und „AdSense“ liefern Online-Anzeigen auf den Websites und Services von Google sowie auf anderen Websites.

AdWords-Anzeigen finden sich zusammen mit den Suchergebnissen einer Anfrage unter der Rubrik „Anzeigen“ am rechten Rand oder im Kopfteil einer Ergebnisseite von einer Google-Suche. Die Anzeigenschaltung basiert auf der Fragestellung des Nutzers. Bezieht sich die Themensuche auf „Tennis“, werden zu diesem Thema Anzeigen geschaltet. Durch die Kenntnis der IP-Adresse, gespeichert in einem Cookie im Browser des Nutzers, lässt sich die geografische Zuordnung des Anfragenden bestimmen, sodass passende Anzeigen aus der Region, dem Ort des Fragestellers geschaltet werden können.

Das AdSense-Programm bietet Besuchern u.a. auf beliebig aufgerufenen Websites die Möglichkeit, von der aufgerufenen Seite die „Google Suche“ in einem standardmäßigen „Google Suchfeld“ zu starten. Auf den Ergebnisseiten einer Suchanfrage wie auf den Webseiten mit dem Google-Suchfeld selber werden hierzu Anzeigen geschaltet, die sich auf den Inhalt (Content) der Website, die das Goolge Werbeprogramm unterstützt, beziehen.

Zusätzlich zu den auf dem Inhalt der Websites basierenden Anzeigen beruht die Anzeigenschaltung auf den Interessen des Besuchers von Websites. Wird eine Website von Google Services und Produkten oder eine Website, deren Besitzer mit Google zusammenarbeitet, besucht, setzt Google ein „DoubleClick-Cookie“ in den Browser des Anwenders, um auf diesem Weg Informationen über die Art und den Inhalt der aufgesuchten Websites zu sammeln. Aus diesen Informationen lassen sich „Interessenkategorien“ aufstellen, mit deren Hilfe eine auf die Interessen des Anwenders bezogene Anzeigenschaltung ermöglicht wird.

Google Analytics.

Besitzer von Websites können mit Unterstützung des Services „Google Analytics“ Besuche auf ihren Websites analysieren. „Google Analytics“ verwendet anonym, für den Besucher dieser Websites nicht erkennbar, eine eigenes Cookie zur Erfassung der Aktionen des Besuchers auf dieser Website. Zu den in dem Cookie gespeicherten Informationen gehört der Zeitpunkt des Besuches, die Häufigkeit eines Besuches auf dieser Website und Angaben zu der Website, die den Besucher auf diese aufgesuchte Website verwiesen hat. Anhand der dem Website-Besitzer durch „Google Analytics“ zur Verfügung gestellten Informationen kann dieser die Website und die Zugriffsmöglichkeiten auf seine Website verbessern. Zugleich lässt sich das Maß der Integration von AdWords-Anzeigen auf den angesprochenen Websites durch die von „Google Analytics“ gesammelten Informationen besser verfolgen. Siehe

www.google.de/intl/de/privacy_ads.html

(Google Werbung)