Stadtplanung der Zukunft per intelligenter Luftbildanalyse

Einblicke in das Projekt aviary

Marius Maryniak
Marius Maryniak, Bild: URBAN.KI

Für die Planung und Optimierung urbaner Räume reichen einfache Straßenkarten längst nicht mehr aus. Kommunen benötigen heute detaillierte Abbildungen ihrer Umgebung – etwa 3D-Modelle von Gebäuden, aktuelle Informationen über versiegelte Flächen oder die genaue Lage von Grünflächen. Solche Daten stammen aus sogenannten Fernerkundungsquellen – also aus Luftbildern, Drohnenaufnahmen oder Satellitenbildern. Sie bilden die Grundlage für moderne, datenbasierte Stadtplanung.

Doch: Kommunen verfügen zwar zunehmend über diese hochaufgelösten Fernerkundungsdaten, deren Auswertung erfordert bislang jedoch spezialisierte, oft isolierte Softwarelösungen. Hier setzt das Projekt aviary von URBAN.KI an – für den Kreis Unna entwickeln wir eine universelle KI Engine, eine Plattform zur automatisierten Analyse von Luftbilddaten – flexibel, skalierbar und auf die Bedürfnisse von kommunalen Anwendern zugeschnitten.

 

KI-Entwicklung konkret – was passiert bei aviary?

Im Interview spricht Marius Maryniak, wissenschaftlicher Mitarbeiter von URBAN.KI, über die technische Vision hinter dem Projekt, die Zusammenarbeit mit dem Kreis Unna und den Anspruch, künstliche Intelligenz nicht nur leistungsfähig, sondern auch alltagstauglich zu gestalten.

I: Wer bist du und was genau machst du bei URBAN.KI?

MM: Ich bin Marius Maryniak und ich bin wissenschaftlicher Mitarbeiter an der Westfälischen Hochschule und im Forschungsteam geospaitial lab. Ich beschäftige mich seit 2022 im Team mit der Auswertung von Fernerkundungsdaten, also Luftbildern und mobile Mapping Daten, und bei URBAN.KI konkret mit deren Auswertung mithilfe von KI.

I: Wie bist du persönlich zu dem Projekt gekommen und was hat dich daran gereizt?

MM: Mein erstes Projekt hier an der WH beschäftigte sich mit der Erkennung versiegelter Flächen anhand von Luftbildern. Die damalige Herangehensweise war stark problemorientiert – wir haben eine Software speziell für dieses eine Problem entwickelt. Mit der Zeit habe ich jedoch erkannt, dass man solche Lösungen besser übergreifend denken sollte. Daraufhin haben wir dann an einer eher generischen, standardisierbaren Lösung gearbeitet. Im Rahmen der Innovationsinitiative von URBAN.KI hat sich der Kreis Unna dann mit einer universellen KI-Engine aviary beworben, was zu dieser Forschung sehr gut anschlussfähig ist. Nun sind wir dabei, das Ganze umzusetzen.

I: Worum geht es bei aviary konkret?

MM: Man muss ja zunächst eine Möglichkeit schaffen, dass ein KI-Modell ein Bild verarbeitet und daraus ein Ergebnis erzeugt. Genau dieser Prozess muss dann in eine Anwendung überführt werden – also mit vielen Bildern auf eine größere Fläche skaliert werden. Der gesamte Ablauf – von der Auswahl des Bereichs, über die notwendige Vorverarbeitung, die Wahl des passenden KI-Modells bis hin zur Nachbearbeitung – lässt sich abstrakt als Prozess denken. Dabei gibt es verschiedene Möglichkeiten, wie man mit diesem Prozess interagieren kann.
Das ist besonders für Softwareentwickler:innen relevant, aber nicht ausschließlich – auch für Kommunen oder andere Forschende ist das spannend. Dieses Framework bietet viele Ansatzpunkte zur Interaktion.

I: Was ist das Besondere an diesem Projekt im Vergleich zu bisherigen Lösungen am Markt?

MM: Es gibt bereits einige Lösungen, die KI mit Geodaten kombinieren, aber diese sind oft sehr einfach – da geht es hauptsächlich um das Trainieren von Modellen. Wir hingegen setzen genau da an, wo es um die tatsächliche Ausführung der KI-Modelle geht – und das gibt es bisher noch nicht.
Unser Ziel ist es, das Rahmengerüst, wir nennen das Framework, so zu gestalten, dass die einzelnen Komponenten möglichst flexibel und modular sind und gleichzeitig auf der komplexen Ausführungsebene eine möglichst einfache Anwendung ermöglicht wird – insbesondere für Kommunen, die nicht tief in der Technik stecken, aber dennoch von der Lösung profitieren wollen.

I: Wie unterstützt euer Ansatz Kommunen konkret im Alltag- kannst du ein Beispiel geben?

MM:  Kommunen werden damit die Möglichkeit haben, sehr viel mehr Informationen mit so einem System auszuwerten, beispielsweise auch die Erkennung von Solaranlagen, Gebäuden und versiegelten Flächen. Wichtig wird sein, wie die Eingangsdaten genutzt werden können, denn diese sind aktuell sehr unterschiedlich: Manchmal liegen Luftbilder mit bestimmter Auflösung oder von speziellen Kanälen wie Infrarot oder Höhendaten vor. Deshalb entwickeln wir Modelle, die so robust sind, dass sie flexibel mit unterschiedlichen Datenquellen umgehen können. Das heißt eine Kommune kann sagen „Ich habe nur RGB-Bilder in mittlerer Auflösung“, während eine andere Kommune vielleicht hochauflösende Bilder mit zusätzlichen Kanälen bereitstellt – und beide sollen mit dem System arbeiten können.

I: Welche technischen Grundlagen nutzt ihr – etwa beim KI-Modell oder bei der Bildverarbeitung?

MM: Konkret nutzen wir sogenannte „Semantic Segmentation“. Das bedeutet: Man gibt dem Modell ein Bild, das aus vielen einzelnen Pixeln besteht, und das KI-Modell weist jedem Pixel eine bestimmte Klasse zu – zum Beispiel: Solarpanel ja oder nein. Auf einer abstrakten Ebene kann man sich das wie eine Black Box vorstellen: Ein Bild mit 1000*1000 Pixeln geht rein, und heraus kommt ein Bild der gleichen Größe, bei dem jedes Pixel eine Klassenzuordnung hat.

I: Wie funktioniert die KI-Engine – was passiert bei der Auswertung eines Luftbilds konkret?

MM:  Da die Bilder georeferenziert sind, bedeutet das, dass jeder Pixel eine genaue Lage in der realen Welt hat – also wissen wir ganz genau, wo sich die erkannten Objekte befinden. So lassen sich die Daten später für die konkrete Stadtplanung einsetzen. Im Trainingsprozess braucht man dafür eine große Menge an Bildern – sogenannte Trainingsdaten. Das Modell wird dann nach und nach angepasst, bis es möglichst genau vorhersagen kann, zu welcher Klasse ein Pixel gehört. Im Idealfall stimmen die Ausgaben des Modells später mit den Labels überein – und hilft so den  Stadtplanern, Fachämtern für Geodaten und vielen weiteren, die von räumlichen Daten profitieren.

I: Wie weit seid ihr aktuell in der Umsetzung – gibt es schon etwas, dass ihr zeigen könnt?

MM: Ein wichtiger Erfolg war das Beta-Release, das wir auf der FOSSGIS Konferenz 2025 in Münster (Freie und Open Source Software für Geoinformationssysteme) vorgestellt haben.

Technisch gesehen ist eine der größten Herausforderungen, dass man möglichst nichts mehr verändert, was rückwirkend bestehende Funktionen bricht. Dafür muss man sich im Vorfeld viele Gedanken machen – auch über Dinge, von denen man noch gar nicht weiß, ob oder in welcher Form sie überhaupt einmal relevant werden.

Das Beta-Release bedeutet für uns, dass wir aktuell noch flexibel sind: Wir können Änderungen vornehmen, auch wenn sie rückwirkend größere Anpassungen erfordern. Gleichzeitig steht aber die Basis jetzt, und alles, was künftig dazukommt, sind zusätzliche Komponenten. Die Grundfunktionen sind bereits nutzbar – theoretisch kann man sie jetzt schon mit dem alten Modell verwenden, aber die Nutzung ist inzwischen deutlich angenehmer.

I: Was war bisher die größte Herausforderung im Projekt?

MM: Das Framework so robust und flexibel zu gestalten, dass sich neue Formate problemlos integrieren lassen. Ein konkretes Beispiel: Frameworks arbeiten in der Regel mit Rasterdaten, also Bildern, die aus Pixeln bestehen. Es gibt aber auch ganz andere Formate, wie Vektordaten Punktwolken, Text oder Audio. Es ist gut möglich, dass solche Datentypen in Zukunft eine Rolle spielen, auch wenn wir das heute noch nicht konkret absehen können.

I: Wie arbeitet Ihr bei dem Projekt mit dem Kreis Unna zusammen?

MM: Zu Beginn haben wir dem Kreis Unna unser Konzept für das Framework vorgestellt. Jetzt wird die Schnittstelle in den kommenden Monaten weiterentwickelt.

Danach folgen Workshops und Testphasen, im Kreis , mit der Stadt Gelsenkirchen und der Stadt Duisburg, die die Lösung selbst ausprobieren können. Wir haben ein gutes Netzwerk von Nutzenden, die sehr offen für neue Ideen sind und schnell Feedback geben. Dadurch können wir flexibel auf Rückmeldungen reagieren und zeitnah Anpassungen vornehmen.

Aktuell arbeiten wir vor allem mit den Geodaten-Abteilungen der Kommunen zusammen. Die Fachabteilung des Kreises Unna ist sehr kompetent, ebenso wie die Stadt Gelsenkirchen, die uns als Beispiel dient. Beide sind hervorragend aufgestellt und sehr motiviert. Diese Fachabteilungen haben das nötige Fachwissen und können uns problemlos folgen. Die Zusammenarbeit mit unserem Partner DFKI ist auch top.

Bisher gab es keinerlei Hürden – im Gegenteil, die Zusammenarbeit ist sogar überraschend gut.

I: Wie könnte sich die Arbeit mit Luftbilddaten in Kommunen durch eure Lösung verändern?

MM: Größtenteils verfügen die Kommunen überhaupt nicht über vergleichbare Daten. Es geht also nicht darum, bestehende Prozesse zu beschleunigen oder zu verbessern, sondern vielmehr darum, Daten bereitzustellen, die zuvor gar nicht existiert haben. Zwar gibt es vereinzelt Daten, wie zum Beispiel beim Wasserverband EGLV, der Versiegelungsdaten besitzt, aber solche Datensätze sind eher die Ausnahme. Wir entwickeln also wirklich etwas ganz Neues, das es so ohne die KI Engine nicht geben .

I: Wie plant ihr die Software weiterzuentwickeln – Was kommt also als nächstes?

MM: Das Wichtigste ist, eine Web-App zu entwickeln, über die die Kommunen mit dem Framework interagieren können. Man kann sich das so vorstellen: Am Ende gibt es eine Konfigurationsdatei, in der festgelegt wird, was passieren soll. Die Mitarbeiter in der Kommune möchten diese Datei nicht manuell in einem Texteditor erstellen. Stattdessen erhalten sie eine benutzerfreundliche Oberfläche, auf der sie Fragen beantworten, wie zum Beispiel, woher die Daten kommen. Sie können die relevanten Optionen einfach anklicken, und am Ende wird die Konfigurationsdatei automatisch erzeugt. Dann können sie die Software ausführen. Der große Plan ist es, die Nutzungsfreundlichkeit erheblich zu steigern.

I: Ein wichtiges Ziel ist es, auch Nicht-Techniker: innen die Nutzung zu ermöglichen – wie gelingt euch das?

MM: Das Ziel ist, dass die Anwendung einfach und intuitiv wird – unterstützt durch Feedback und ansprechende Visualisierungen.

I: Gibt es im Projekt konkrete Berührungspunkte mit dem Datenschutz und wie konnten etwaige Datenschutzhürden gelöst werden?

MM: Gab es nicht, da die Daten offen sind, die kann sich jeder angucken.

I: Wie werden die KI-Ergebnisse validiert? Gibt es Vergleichsdaten oder Feedbackschleifen?

MM: Beim KI-Training benötigt man Trainingsdaten. Das bedeutet, dass das, was die KI später herausgeben soll, zunächst manuell erstellt werden muss. Dann kann man beispielsweise 20 % dieses Trainingsdatensatzes für die Validierung verwenden. Diese 20 % werden der KI während des Trainings nicht gezeigt. Am Ende kann man dann prüfen, wie gut die KI auf diesen Daten performt – das ist ein gängiger Ansatz.

I: Stellt die Skalierung eine besondere Herausforderung da oder handelt es sich hierbei im „Lokal-Anwendungen“?

MM:  Je nachdem, wie man das System nutzen möchte, variiert die Ausführungsdauer. Auf einem Laptop kann es entsprechend länger dauern. Für eine kleine Kommune, die das auf ihrem lokalen Rechner ausführt, ist das noch vertretbar. Wenn wir jedoch Berechnungen für ganz Deutschland durchführen wollten, müssten die Anforderungen deutlich höher sein, und es wäre notwendig, die Rechenleistung entsprechend anzupassen.

I: Welche KPIs werden zur Erfolgsmessung von aviary verwendet?

MM: Wir hatten ja bereits ein früheres Projekt zu versiegelten Flächen. Das neue Framework kann man nun im Vergleich dazu benchmarken. Es wird mit denselben Ressourcen deutlich effizienter laufen. Und wenn zusätzlich mehr Rechenleistung zur Verfügung steht, geht es natürlich noch schneller.

Was klassische Qualitäts-KPIs betrifft, stehen hier vor allem die Nutzungsfreundlichkeit und die Effizienz im Vordergrund.

I: Was wünscht du dir persönlich für die Zukunft des Projekts?

MM: Es ist auf jeden Fall unser Ziel, dass viele Anwender das Framework nutzen – nicht nur Kommunen, sondern das gesamte Spektrum von Menschen, die an der Thematik interessiert sind. Ein konkretes Beispiel: Wir würden gerne die Möglichkeit haben, die Software über eine offene Web Schnittstelle zu konfigurieren, so dass sie auch andere Personen nutzen können, die sich zum Beispiel aus anderen Perspektiven mit Klimaschutz befassen. Das steht zwar noch nicht im Projektplan, aber es ist ein Wunsch von uns.   

I: Wenn du das Projekt in einem Satz beschrieben müsstest – wie würde dieser lauten?

MM: Übergreifend und praktisch für jeden Nutzungszweck.