MOOC

Onlinekurs seziert das Innenleben von Suchmaschinen

Potsdam, Februar 2023 - Einen Einblick ins Innenleben von Internet-Suchmaschinen will ein zweiwöchiger kostenloser Onlinekurs des Hasso-Plattner-Instituts (HPI) vermitteln. Er startet am 15. Februar auf der Lernplattform openHPI und wird von Wissenschaftlerin Dr. Anne Kayem geleitet. Anmelden für den Gratiskurs "Inside the Belly of a Search Engine" können sich Interessierte, die keine Vorkenntnisse aufzuweisen brauchen.

Dr. Anne Kayem, die am HPI-Lehrstuhl Internet-Technologien und -Systeme ein Team von Datenschutz- und Privatsphäre-Fachleuten leitet, will den Teilnehmenden einen aktuellen Gesamtüberblick über die Problematik des Suchens und Findens im Internet vermitteln - in englischer Sprache.
"Wer das World Wide Web nutzt, soll durchblicken, wie Suchmaschinen Seiten entdecken, indizieren und abrufen, um auf Anfragen hin Informationen in strukturierter Form anzeigen zu können", sagt die HPI-Forscherin, die zuvor an der University of Cape Town in Südafrika tätig war.

Die Potsdamer Informatikwissenschaftlerin will zeigen, wie Suchmaschinen Dokumente nach Ähnlichkeit clustern und gemäß ihrer Relevanz für Anfragen einstufen, um für die Nutzenden blitzschnell Antworten zu generieren. Auch verschiedene Formen der Visualisierung von Suchergebnissen und die unterschiedliche Beliebtheit von internationalen Anbietern wie Google, Microsoft Bing, DuckDuckGo, Baidu und anderen stehen auf dem Programm des openHPI-Onlinekurses. Zu lernen ist darin ferner, wie Webseiten so strukturiert und optimiert werden sollten, damit sie im Internet leicht gefunden werden können.

"Zusätzlich möchte ich das Bewusstsein dafür schärfen, dass viele Suchmaschinen-Betreiber personenbezogene Daten speichern wollen, um sie für Werbemaßnahmen nutzen oder durch sie sämtliche Nutzeraktivitäten webseitenübergreifend verfolgen zu können", betont Datenschutz-Expertin Kayem. Nach ihren Angaben liegt Google mit mehr als 5,6 Milliarden verarbeiteten Suchanfragen pro Tag und in Sachen Marktanteil bei den Suchmaschinen vorn.

"Im Kurs konzentrieren wir uns auf indexbasierte Suchmaschinen wie Google und Bing. Sie lesen die Inhalte der Webseiten ein und legen die Daten in einem Index ab. Darauf greifen sie bei Suchanfragen zurück, um die Inhalte schnell wiederzugeben", erläutert die Informatikwissenschaftlerin.
Solche Suchmaschinen nutzten das Internet eigentlich wie ein großer Dokumentenspeicher, aus dem - wie in einer physischen Bibliothek - gemäß der Relevanz von Schlüsselwörtern Dokumente abgerufen werden. Dadurch könne man frei die gewünschten Inhalte nutzen, ohne dass jemand zuvor das in gefundenen Dokumenten enthaltene Wissen selektiv auswähle oder interpretiere. Hierin sieht Kayem einen wesentlichen Unterschied zu Dialogsystemen wie Chat GPT oder YouChat, die derzeit für viel Aufmerksamkeit sorgen.