KI für die Cloud – DFKI und Google erweitern Partnerschaft
Kaiserslautern, Mai 2024 - Das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) und Google vertiefen ihre Zusammenarbeit. Durch eine Finanzierung von Google werden am DFKI vier neue Forschungsprojekte ins Leben gerufen, die zentrale Fragen zu Themen wie Künstlicher Intelligenz, souveräner Cloud und skalierbarer GPU-Cluster untersuchen werden. Im Rahmen der Forschung soll die Erfahrung von Google im Bereich Cloud mit der Expertise des DFKI in angewandter KI kombiniert werden. Google ist bereits seit 2015 Gesellschafter des DFKI.
Prof. Dr. Antonio Krüger, CEO DFKI: "Gemeinsam mit Google entwickeln unsere Forschenden KI-Technologien, die dabei unterstützen sollen, die unglaubliche Vielzahl an Informationen im Web der Allgemeinheit zugänglich zu machen. Die aktuellen Projekte reichen dabei von neuen Verarbeitungsmethoden für komplexe Suchanfragen bis hin zu der Erweiterung von GPU-Clustern in die Cloud. Die langjährige Zusammenarbeit mit Google ist ein weiteres perfektes Beispiel dafür, wie aus dem erfolgreichen Transfer von KI-Forschungsergebnissen in die Anwendung Mehrwerte am Markt entstehen und sich darüber hinaus bewährte Partnerschaften etablieren."
Dr. Wieland Holfelder, VP Engineering, Leiter des Google Entwicklungszentrums in München: "Mit dem DFKI als einer der international renommiertesten Forschungseinrichtungen verbindet uns seit vielen Jahren eine enge Partnerschaft. Wir freuen uns sehr, diese mit weiteren Forschungsprojekten weiter vertiefen zu können. In den vier Projekten werden die Kompetenzen des DFKI mit der Technologie der Google Cloud kombiniert, um die Forschung voranzubringen."
Das DFKI ist in der Verwendung der Fördermittel frei und wird die Forschung in den vier geförderten Projekten eigenständig vorantreiben. Die Ergebnisse sollen in Form von wissenschaftlichen Arbeiten veröffentlicht werden. Expert:innen von Google Cloud helfen dabei, umfangreiche Rechenarbeiten im maschinellen Lernen (ML) und die Speicherung von großen Datenmengen in der Cloud durchzuführen. Im Zuge dessen kann das DFKI Kompetenzen im Bereich Cloud Computing erweitern.
Mehr über die vier Forschungsprojekte
Private Data Adapters for ML. DFKI: Sebastian Palacio
"In diesem Projekt wollen wir das Problem des Kaltstarts bei Anwendungen des maschinellen Lernens für private Datensätze angehen", so Sebastian Palacio, Projektleiter und Forscher im Bereich Smarte Daten & Wissensdienste am DFKI in Kaiserslautern. Dieses Problem tritt auf, wenn nicht genügend gelabelte Daten für das Training von ML-Modellen zur Verfügung stehen, was die Entwicklung effektiver Lösungen behindert. Traditionell wurde zur Lösung dieses Problems die manuelle Anpassung von Modellen aus dem öffentlichen Bereich an einen privaten Datensatz vorgenommen. Ein solcher Trial-and-Error-Ansatz ist jedoch zeitaufwändig und oft ineffektiv.
Sovereign Cloud: Secure integration of business expert knowledge into large language models. DFKI: Sven Schmeier, Roland Roller
Große Sprachmodelle sollen mit den neuesten Methoden der künstlichen Intelligenz in die Webseiten des DFKI integriert werden. Damit können nicht nur einfache Fragen gestellt werden (“Wer ist CEO”?), sondern auch Dinge erfragt werden, die sonst kaum ersichtlich oder nur sehr schwer kombinierbar sind. "Ziel des Projekts ist es zu erforschen, inwieweit es möglich ist, Webseiten so zu erschließen, dass es möglich ist, komplexe Fragen über diese Webseiten zu stellen", sagt Sven Schmeier vom Bereich Speech and Language Technology am DFKI.
End-to-End Active Learning Framework for Medical Image Annotation. DFKI: Daniel Sonntag, Hans-Jürgen Profitlich, Ray Kodali
Eine große Herausforderung bei der Nutzung von künstlicher Intelligenz ist die ausreichende Verfügbarkeit von gekennzeichneten Daten. Die Annotation von Daten ist ein essentieller, aber auch zeitaufwändiger und kostspieliger Prozess. Ein besonders effektiver Ansatz ist das sogenannte "Aktive Lernen" durch Maschinen. Aktives Lernen verbessert Modelle des maschinellen Lernens durch die strategische Auswahl der informativsten Datenpunkte für die Kennzeichnung, was zu einem schnelleren und effizienteren Lernen führt, da weniger manuell gekennzeichnete Daten erforderlich sind.
Daniel Sonntag und sein Team von Forschenden am DFKI in Niedersachsen haben hierfür eine künstliche Intelligenz mit dem Namen "MedDeepCycAL" entwickelt, die aktives Lernen in der medizinischen Bildgebung bereitstellt. Sie bietet den Forschenden eine maschinelle Unterstützung bei der Klassifizierung und Segmentierung von medizinischen Bildern sowie eine freie Auswahl der Art der künstlichen Intelligenz.
Scaling on-premise GPU cluster to the cloud. DFKI: Christian Schulze
Für das Trainieren und Fine-Tuning von Sprachmodellen und anderen Deep-Learning-Modellen sind groß-skalige Berechnungen nötig, die maßgeblich auf spezialisierten Recheneinheiten, sogenannten Graphic Processing Units (GPUs) ausgeführt werden. Das DFKI hält entsprechende Computer-Cluster in seinen eigenen Rechenzentren vor, allerdings kann es passieren, dass der Bedarf das Angebot übersteigt, z.B. vor wissenschaftlichen Konferenzen.
"Das Projekt soll die Erweiterung der bestehenden GPU Ressourcen in die Cloud ermöglichen, wenn ein entsprechender Bedarf besteht, der mit den vorhandenen Ressourcen nicht bedient werden kann", erklärt Christian Schulze, Projektleiter und Forscher am DFKI in Kaiserslautern. Es handelt sich hierbei um einen Proof of Concept (POC), der die Grundlagen für Cloud Deployments on demand legen soll. Im Fokus steht hier insbesondere Infrastructure as Code.