Wie Google-Suche funktioniert

Wie Google-Suche funktioniert

Bevor du deinen Suchbegriff eingibst und auf Enter drückst, hat Google, die weltweit führende Suchmaschine, bereits ganze Arbeit geleistet und einen Index erstellt. Crawler sind dabei die fleißigen Arbeiter, die das Internet durchforsten. Sie folgen den Links auf einer Seite und den Links auf den neuen Seiten. Dieses Verfahren wiederholt sich immer weiter.

Nachdem die Seiten heruntergeladen wurden, untersucht das System sie auf eine ganz besondere Art und Weise. Es achtet auf Links, analysiert die Wörter auf der Seite, versucht Bilder zu erkennen und entsprechend einzuordnen. Jedes einzelne Wort landet im Index und findet sich in Gesellschaft von gleichen Wörtern auf anderen Webseiten wieder. Allein dieser Index ist gigantisch – etwa hundert Millionen Gigabyte groß. Dafür werden Zehntausende von Festplatten benötigt.

Mehr als nur Wörter

Als Google-Nutzer weißt du, dass die Suche viel mehr kann, als einfach nur nach einzelnen Wörtern zu suchen. Denn das würde in den meisten Fällen zu unbefriedigenden Ergebnissen führen. Deshalb gibt es Algorithmen, also mathematische Regeln, die dafür sorgen, dass die Suchergebnisse verbessert und gewichtet werden. Der Page-Rank-Algorithmus war die ursprüngliche Idee, auf der Googles Überlegenheit gegenüber anderen Suchmaschinen beruht. Die Grundannahme dahinter war, dass Seiten, auf die oft verlinkt wird, relevante Informationen bereithalten.

Der Page Rank spielt immer noch eine Rolle, ist jedoch nur noch eines von vielen Kriterien. Es gibt mittlerweile Hunderte von Algorithmen, und sie werden ständig angepasst. Als gewöhnlicher Nutzer merkst du meistens nicht viel davon, aber manchmal gibt es auch größere Veränderungen. Ein Grund dafür kann sein, dass Google Tricks unterbinden möchte, mit denen Seitenbetreiber versuchen, ihre Seiten in den Suchergebnissen nach vorne zu bringen.

LESEN  Lagune vs Bucht: Ein Vergleich der geografischen Formationen

Was wollen die Nutzer eigentlich?

Google ist bekannt dafür, alles zu automatisieren – allein schon aufgrund der schieren Größe des Suchindexes. Künstliche Intelligenz spielt dabei eine große Rolle bei der Ermittlung der relevantesten Suchergebnisse. Es beginnt damit, zu erkennen, was der Nutzer eigentlich möchte. Wann meint ein Nutzer mit “Bank” ein Geldinstitut und wann eine Parkbank? Immer raffiniertere KI-Systeme sorgen dafür, dass die Suche immer öfter von Anfang an gute Ergebnisse liefert, auch bei komplexeren Fragen. Das ist auch notwendig, denn etwa 15 Prozent aller Anfragen waren zuvor noch nie gestellt worden. Das liegt zum Beispiel an aktuellen Ereignissen wie Sportveranstaltungen oder politischen Entwicklungen.

Tausende Server helfen mit

Um Suchergebnisse schnell anzeigen zu können, kann eine Suchanfrage kurzzeitig tausend verschiedene Server-Computer in einem der Rechenzentren von Google beanspruchen. Dies ist notwendig, da der Index so groß ist und auf viele Server aufgeteilt werden muss. Algorithmen versuchen dann zu interpretieren, wonach gesucht wird, und bestimmen die Reihenfolge, in der die Ergebnisse angezeigt werden. Dabei werden viele Faktoren berücksichtigt, wie zum Beispiel die Art des Geräts (Handy oder Desktop-Computer), das gerade genutzt wird, oder ob es sich um ein aktuelles Thema handelt, wie das Ergebnis eines Fußballspiels. In den Einstellungen können Nutzer festlegen, welche ihrer Daten Google verwenden darf, zum Beispiel den aktuellen Standort. Je mehr Daten preisgegeben werden, desto individuellere und passendere Suchergebnisse werden angezeigt.

Die Suche führt immer öfter zu guten Ergebnissen, da KI-Algorithmen durch das Training mit riesigen Datenmengen immer besser verstehen, wonach wirklich gesucht wird. Sie erkennen Zusammenhänge zwischen den Suchbegriffen, auch wenn diese Begriffe nicht explizit in der Suchanfrage vorkommen. Google hat ein universelles System entwickelt, das unabhängig von den angewendeten Sprachen funktioniert.

LESEN  Canon: Die größte Kamera-Marke der Welt

Aber ohne Menschen geht es dennoch nicht. Jede Änderung an einem Algorithmus wird zunächst von einer Testgruppe überprüft, bevor sie auf alle Google-Nutzer angewendet wird. Nur die großen Anbieter haben Zugriff auf solch riesige Datenmengen. Mögliche Konkurrenten haben Schwierigkeiten, mitzuhalten, da ihnen sowohl die Daten als auch die Rechenkapazität fehlen, um diese zu verarbeiten.

Dieser Artikel ist Teil des Themenschwerpunkts “Googles Schatz”. Weitere Informationen und Links zu anderen Artikeln findest du hier: sz.de/GooglesSchatz.