Bild Datenraum

Datenräume und ML- Plattform

In diesem Querschnittsthema geht es um die Vertretung und Vertiefung von Know-how über zentrale Datenräume zur Verwaltung IT-gestützter kommunaler Daten. Es geht dabei um Dienste für ein einfaches, benutzerfreundliches, anwendungsbezogenes performantes, sicheres und einheitliches Datenmanagement.

Neben dem Datenraum geht es in diesem Schwerpunktthema um die KI-gestützte Auswertung der in Datenräumen bereitgestellten kommunalen Daten. Das Projektteam vertritt und vertieft in diesem Schwerpunkt sein langjähriges Know-how im Umgang moderner State-of-the-Art KI-basierter Modelle zur Extraktion relevanter Objekte. Neben einer breiten Palette statistischer Auswertungsverfahren besteht Expertise in der Auswahl, dem Training, der Inferenz, der Bewertung, der Integration, der Speicherung und der Versionierung von ML-Modellen zur Extraktion von Informationen. Dabei stehen in diesem Schwerpunkt die folgenden Fragestellungen im Vordergrund:

  • Design und Aufbau von Datenräumen
  • Effiziente KI-basierte Berechnung auf Datenräumen
  • Auswahl, Entwicklung und Bewertung von Smart Services und Methoden, um aus den großen Datenmengen konkrete Informationen, z. B. im Interesse strategischer Planungsfragen, zu extrahieren
  • Identifikation, Training, Fine-Tuning, Bewertung und Integration von KI-Modellen, die für konkrete kommunale Anforderungen geeignet sind
  • Auswahl und Bewertung der den Datenräumen und KI-Plattformen zugrunde liegenden Infrastrukturen
  • Konzeption, Aufbau/Auswahl und Bewertung geeigneter Plattformen, um auch technologieferneren Mitarbeitenden oder Entscheider:innen die Nutzung dieser KI-Methoden und somit einen zielgerichteten, assistierten Zugriff auf die interessierenden Daten zu ermöglichen


Kompetenzspektrum:
Das Projektteam berät die Kommunen und Unternehmen in den Fachthemen Datenräume, Data Mining, Data Analytics, Datengetriebene Steuerung und Daten-Infrastrukturen mit spezieller Ausrichtung auf den kommunalen Bedarf. Hierbei werden Dienstleistungen von der Analyse und dem Design von KI-Lösungen, dem Aufbau von KI-Infrastrukturen und der Auswahl geeigneter KI-Modelle über die Umsetzung (Implementierung und Test) bis hin zur Wartung und Auswertung derartiger Lösungen angeboten.

Werkzeuge und Anwendungen: Der „LLM Explore Hub“ des Fraunhofer IAIS stellt eine fortschrittliche Plattform dar, die zur Evaluierung, Erprobung und Implementierung verschiedener Open-Source-Sprachmodelle dient. Innerhalb einer gesicherten On-Premises-Infrastruktur ermöglicht diese Plattform Angehörigen des öffentlichen Sektors, die Effektivität und Anwendbarkeit von Sprachmodellen zu testen und zu beurteilen. Dies umfasst die Bewertung der Modellleistung basierend auf spezifischen Eingabedaten sowie die Fähigkeit der Modelle, relevante Informationen zu extrahieren und auf Basis dieser Informationen in einem erweiterten Kontext neue Texte zu generieren.

Aufbauend auf den umfangreichen Erfahrungen im Management und der Analyse vielfältiger und inhomogener Datenbestände und -quellen in der Anwendungsdomäne öffentliche Verwaltung (basierend auf offenen Plattformen und der von FOKUS entwickelten Datenmanagementplattform piveau) arbeitet Fraunhofer FOKUS an einer explorativen Datenauswertungsplattform (Data Exploration Lab), die alle Schritte von der initialen Bedarfsidentifikation auf der strategischen Ebene über die Definition und Verfeinerung von Zielen und diese umsetzenden Indikatoren über die Identifikation und Vorbearbeitung geeigneter Daten bis hin zur Umsetzung angepasster Analysen und Generierung von Visualisierungen, Dashboards und Reports assistiv unterstützt. Dabei kommen insbesondere generative KI-Verfahren zum Einsatz.

Mögliche Forschungsthemen:

  1. Aufbau eines zentralen Datenraums und einer ML-Plattform für kommunale Lösungen: Bei dieser Projektidee geht es um den Aufbau eines zentralen Datenraums zur Verwaltung aller IT-gestützter kommunaler Anwendungen. Der Datenraum soll über verschiedene Dienste einen einfachen, performanten und einheitlichen Zugriff auf die bzw. einen Umgang mit den immer umfangreicher werdenden, für die Kommunen relevanten Daten ermöglichen. Kommunen sollen damit in die Lage versetzt werden, Daten einfach zu managen (vorzuhalten, zu sichern, zu historisieren etc.), unterschiedliche Daten anwendungsfallbezogen, komfortabel und einfach zusammenführen sowie die Sicherheit der Daten (Integrität, Vertraulichkeit, Verfügbarkeit und Authentizität) zu gewährleisten. In enger Kopplung an den Datenraum entsteht die Konzeption und der Aufbau einer Auto-ML-Plattform zur automatisierten Extraktion von Verwaltungsinformationen, auf der ML-Modelle trainiert und verwaltet werden, die auf spezifische Aufgaben in den Kommunen spezialisiert sind. Dazu gehören auch sogenannte ML-Basismodelle (engl. Base oder Foundations Models), die für spezielle Aufgaben nachtrainiert werden können. Anwender:innen aus Kommunen und kommunale Dienstleister sollen die auf der Plattform hinterlegten KI-Modelle ohne komplexes IT und KI-Wissen auf einfache Weise nutzen. Die Plattform soll dabei verschiedene Schwerpunkte abbilden, etwa Objekterkennung aus kommunalen Geoinformationen oder die Automatische Strukturierung von Verwaltungsanträgen.
  2. Ausbau LLM Explore Hub für kommunale Lösungen: Der LLM Explore Hub stellt eine fortschrittliche Plattform dar, die zur Evaluierung, Erprobung und Implementierung verschiedener Open-Source-Sprachmodelle dient. Innerhalb einer gesicherten On-Premises-Infrastruktur ermöglicht diese Plattform Angehörigen des öffentlichen Sektors, die Effektivität und Anwendbarkeit von Sprachmodellen zu testen und zu beurteilen. Dies umfasst die Bewertung der Modellleistung basierend auf spezifischen Eingabedaten sowie die Fähigkeit der Modelle, relevante Informationen zu extrahieren und auf Basis dieser Informationen in einem erweiterten Kontext neue Texte zu generieren. Ziel des Forschungsthemas könnte es sein, das LLM Explore Hub speziell auf den Bedarf von Kommunen auszurichten. D. h. die auf der Plattform verfügbaren Modelle spezifisch fein zu trainieren und die bestehende IT-Infrastruktur von Kommunen zu integrieren. Dies führt zu einer gesteigerten Servicequalität und einer effizienteren Gestaltung öffentlicher Verwaltungsprozesse. Der LLM Explore Hub könnte damit Kommunen dabei unterstützen, fundierte Entscheidungen auf Basis umfassender Analysen zu treffen und ihre Dienstleistungsprozesse zu optimieren.
  3. Anpassung und Weiterentwicklung des Data Exploration Lab von FOKUS für die kommunalen Bedarfe. Durch eine Integration mit dem (im Vorhaben weiterentwickelten) IAIS LLM Explore Hub erhält das Data Exploration Lab Zugriff auf speziell für die Anforderungen der Kommunen fein trainierte und für die Integration in kommunale IT-Infrastrukturen vorbereitete Sprachmodelle. Diese ermöglichen es, zusammen mit der bei FOKUS weiterzuentwickelnden Prompt Engineering Entwicklungsumgebung, das Data Exploration Lab optimal auf die Datensituation und die Nutzungsszenarien der Kommunen abzustimmen und so Personal und Entscheider:innen der Kommunen bestmöglich dabei zu unterstützen, ihre „Datenschätze“ zu heben und daraus in kurzer Zeit, maßgeschneidert und ohne Einsatz knapper Entwicklungsressourcen die für die Fachprozesse bzw. Entscheidungen nötigen „Datenprodukte“ (Visualisierungen, Dashboards oder Berichte) zu erzeugen.

Weitere Innovationsbereiche

Bild Städteplanung

KI für Stadtplanung & (geo-) datenbasierte Infrastrukturen

KI-Technologien automatisieren die Aktualisierung von Katasterdaten und Erstellung von Zustandskarten und unterstützen die Erkennung von Vegetations- und Versiegelungsarten für klima- und umweltbezogene Analysen.

Bild Mobilitätsplanung

KI für Mobilitätsplanung & -steuerung

Durch die Integration von Fernerkundungsdaten und Crowddaten optimieren KI-basierte Systeme die Verkehrssteuerung, reduzieren Staus und CO2-Emissionen und verbessern das Nutzererlebnis im Verkehr.

Bild Umweltplanung

KI für Umweltplanung, Klimaschutz & Klimafolgenanpassu ng

KI-gestützte Auswertungen von Fernerkundungsdaten ermöglichen die Analyse kommunaler Liegenschaften und die Anpassung von Infrastrukturen an den Klimawandel durch die Erkennung von Versiegelungsflächen und Vegetationsarten.