đ Serie: Chatting with the Earth â Teil 1: Die 25-Terabyte-Herausforderung â aktuell: Teil 2 â Teil 3: Den öffentlichen Sektor automatisieren
Sie können kein rohes Satellitenbild in ein LLM werfen und eine prĂ€zise GeschĂ€ftsantwort erwarten. Was Sie brauchen, ist eine rĂ€umliche RAG-Pipeline: KI-interpretierte Landbedingungen werden in strukturierte Metadaten ĂŒbersetzt, die per natĂŒrlicher Sprache abfragbar sind.
Ein reales Beispiel: Das Deutsche Zentrum fĂŒr Luft- und Raumfahrt (DLR) und das Julius KĂŒhn-Institut nutzen Copernicus Sentinel-1 Radardaten, um Kartoffelfelder in Deutschland zu kartieren. Sentinel-1 ist ein Radarsatellit, der unabhĂ€ngig von Wolken und Tageszeit hochauflösende Aufnahmen liefert â ideal fĂŒr die LandwirtschaftsĂŒberwachung.
Die KI interpretiert die Radar-RĂŒckstreuung und kann unterscheiden: Ist auf diesem Feld Kartoffel angebaut oder Weizen? Wie weit ist die Vegetation fortgeschritten? Welche Bodenfeuchte liegt vor?
Doch was passiert mit diesen Erkenntnissen? Bisher landen sie in Forschungsberichten oder GIS-Dashboards. Der nĂ€chste Schritt: Sie in eine RAG-Pipeline einspeisen und per natĂŒrlicher Sprache abfragbar machen.
Spatial RAG: Von Bildmetadaten zur natĂŒrlichen Sprache
Der Kern der Innovation ist Spatial Retrieval-Augmented Generation. Der Ansatz:
- KI-Interpretation der Rohdaten: Sentinel-1 Radardaten werden durch spezialisierte KI-Modelle verarbeitet. Das Ergebnis: strukturierte Metadaten wie „Feld A: Kartoffeln, 12 Hektar, Bodenfeuchte 45 %, Vegetationsstadium 3“
- Metadaten in die Vektordatenbank: Diese Metadaten werden als Vektoren in einer spezialisierten Datenbank gespeichert â zusammen mit den Geokoordinaten (als Polygon), Zeitstempeln und Unsicherheitsmetriken
- NatĂŒrlichsprachliche Abfrage: Ein Landwirt oder Agrarberater fragt: „Wie ist das DĂŒrrerisiko fĂŒr die nördlichen Parzellen in dieser Woche?“
- RAG-Retrieval: Die Vektordatenbank findet die relevanten Metadaten: Parzellen 12, 14, 17 â aktuelle Bodenfeuchte unter 30 %, kein Niederschlag in den letzten 14 Tagen â das DĂŒrrerisiko ist hoch
- LLM-generierte Antwort: Das LLM formuliert eine prĂ€zise, belegbare Antwort: „Die nördlichen Parzellen 12, 14 und 17 haben ein hohes DĂŒrrerisiko. Die Bodenfeuchte liegt bei 28â32 % (unter dem kritischen Schwellenwert von 35 %). Eine BewĂ€sserung wird fĂŒr die nĂ€chsten 48 Stunden empfohlen.“
Der entscheidende Unterschied zu einem Standard-Chatbot: Die Antwort ist deterministisch belegbar â jede Aussage kann auf die zugrunde liegenden Copernicus-Metadaten zurĂŒckgefĂŒhrt werden.
Die technische Architektur einer Spatial RAG Pipeline
Eine rÀumliche RAG-Pipeline unterscheidet sich in mehreren Punkten von einer klassischen Text-RAG:
- Geospatiale Embeddings: Neben semantischen Vektoren werden auch Geokoordinaten und Polygon-Geometrien indexiert. Das ermöglicht Abfragen wie „innerhalb dieses Polygons“ oder „im Umkreis von 10 km“
- Zeitreihen-Indexierung: Satellitendaten sind zeitkritisch. Die Vektordatenbank muss Zeitstempel effizient verwalten können
- Multi-Modaler Retrieval: Die Pipeline muss sowohl Text-Embeddings (fĂŒr die Beschreibung) als auch numerische Metadaten (fĂŒr Bodenfeuchte, FlĂ€chengröĂen) abrufen können
- Unsicherheits-Quantifizierung: Jeder KI-interpretierte Wert hat eine Unsicherheit. Die RAG-Pipeline muss diese Unsicherheit an das LLM weitergeben, sodass es zurĂŒckhaltend formuliert, wenn die Daten unsicher sind
Die Experten von Cybereiche haben umfangreiche Erfahrung im Aufbau solcher RAG-Pipelines mit Multi-Modal-Retrieval und können diese speziell fĂŒr Geodaten-Anwendungen konfigurieren.
Anwendungsbeispiel: DĂŒrremonitoring fĂŒr die Landwirtschaft
Ein landwirtschaftlicher Betrieb in Norddeutschland bewirtschaftet 50 Parzellen mit Kartoffeln. Bisher muss ein Mitarbeiter tĂ€glich verschiedene Quellen prĂŒfen: Wetterdaten, Bodenfeuchtesensoren, Satellitenbilder.
Mit einer Spatial RAG Pipeline wird daraus:
- TĂ€gliches Update: Der Landwirt öffnet eine KI-Chatbot-OberflĂ€che und fragt: „Welche Parzellen brauchen heute Wasser?“
- PrĂ€zise Antwort: „Die Parzellen 7, 12 und 23 haben eine Bodenfeuchte unter 30 % und werden in den nĂ€chsten 2 Tagen kritisch. Parzelle 7 hat zusĂ€tzlich ein erhöhtes KrautfĂ€ule-Risiko aufgrund der aktuellen Temperatur.“
- Automatische Aktion: Auf Wunsch kann der Agent eine BewÀsserungsanlage aktivieren oder eine Warnung an den zustÀndigen Agrarberater senden
Fazit â und wie Sie Cybereiche kontaktieren
Spatial RAG verbindet die StĂ€rken der KI-gestĂŒtzten Erdbeobachtung mit der ZugĂ€nglichkeit natĂŒrlicher Sprache. Landwirte, Stadtplaner und UmweltschĂŒtzer können komplexe Satellitendaten abfragen, ohne GIS-Experten zu sein.
Möchten auch Sie eine Spatial RAG Pipeline fĂŒr Ihre Geodaten aufbauen? Die Experten von Cybereiche beraten Sie gerne â von der Datenmodellierung bis zur produktiven RAG-Architektur. Vereinbaren Sie ein unverbindliches GesprĂ€ch und erfahren Sie, wie Sie Satellitendaten per natĂŒrlicher Sprache abfragbar machen.