Regelmäßige Leser meines Blogs wissen, dass ich in den letzten Jahren eine ganze Reihe von Satellitenbild-Produkten produziert habe und daneben auch über die Arbeit anderer auf diesem Gebiet geschrieben habe. Neue Produkte wurden in den letzten 2-3 Jahren in diesem Bereich relativ oft von verschiedenen Firmen vorgestellt aber bemerkenswerterweise scheint die Qualität dabei kaum Fortschritte zu machen. Ein großer Teil der diese Tage vorgestellten Produkte in diesem Segment scheint nicht wirklich innovativ genug, dass sie eine detaillierte Betrachtung Wert sind.
Und das ist der Fall obwohl es eigentlich eine Menge Faktoren gibt, die so sollte man meinen recht gute Rahmenbedingungen für Qualitäts-Verbesserungen bieten:
- Es gibt neue Satelliten, welche Daten hoher Qualität liefern.
- Es gibt eine schnell wachsende Sammlung von Bilddaten, welche als Quelle für die Produktion von Bildzusammenstellungen zur Verfügung stehen.
- Computer zur Verarbeitung dieser Daten werden immer noch leistungsfähiger und günstiger.
Die Frage, die sich also stellt und die ich hier erörtern möchte ist, warum wir trotz der günstigen Rahmenbedingungen keine weit verbreiteten Verbesserungen in der Qualität von Satellitenbild-Zusammenstellungen für die Endanwendung in Diensten finden.
Es gibt natürlich wirtschaftliche Faktoren dafür, aber einer der wichtigsten Gründe ist technologischer Natur. Der Schwerpunkt im Bereich der Produktion von Satellitenbild-Mosaiken lag in den letzten 5-10 Jahren fast ausschließlich in einer Richtung die ich Pixel-Statistik-Methoden nennen möchte. Der „Cloudless Atlas“ von Mapbox war hierfür ein gutes Beispiel. Es war nicht das Erste – die Blue Marble Next Generation von 2005 ist technisch auch mit einer Pixel-Statistik-Methode produziert und im Grunde reichen die Urprünge solcher Techniken wenigstens bis zu frühen AVHRR-Produkten in den 1980er Jahren zurück. Aber das Mapbox-Mosaik war das erste kommerziell auf globalem Maßstab für die Visualisierungs-Anwendung produzierte Produkt.
Pixel-Statistik-Methoden bedeuten, dass man für jeden Pixel des Bearbeitungs-Gitters alle Ausgangsdaten-Punkte aus den verschiedenen zu verschiedenen Zeitpunkten aufgenommenen Bildern sammelt und dann mit einem statistischen Verfahren daraus einen idealen, repräsentativen Pixel-Wert abschätzt, welchen man für das erzeugte Bild verwendet.
Die Statistik kann dabei gegebenenfalls sehr einfach sein – was unter den richtigen Umständen zu erstaunlich guten Ergebnissen führen kann wie das Mapbox-Mosaik gut demonstriert. Aber man kann natürlich auch kompliziertere Ansätze wählen, ggf. auch unter Verwendung zusätzlicher nicht aus den eigentlichen Bilddaten abgeleiteter Informationen. Mein „Green Marble“-Bild demonstriert dies recht gut. Der zentrale Punkt ist, dass man jeden Pixel getrennt behandelt. Das macht solche Ansätze sehr attraktiv, denn sie sind (a) programmtechnisch sehr einfach zu formulieren und (b) sehr effizient in großem Maßstab auszuführen. Diese Vorteile haben dazu geführt, dass so gut wie jeder, der im Bereich der Produktion von Satellitenbild-Zusammenstellungen in den letzten Jahren etwas begonnen hat, einen solchen auf Pixel-Statistik basierten Ansatz gewählt hat.
Was viele Leute dabei jedoch nicht berücksichtigt haben ist, dass diese Verfahren nicht für jede räumliche Auflösung gleichermaßen geeignet sind. Die Zusammenstellung von Satellitenbildern ist kein Maßstabs-unabhängiges Problem. Ich hab darauf bereits bei meiner Besprechung des Google-Landsat-Mosaiks hingewiesen.
Bei einer Pixel-Größe von etwa 250m kann man recht gut jeden Pixel eines Bildes unabhängig bearbeiten. So lange man eine genügend breite Datenbasis für die Konvergenz der Statistik hat, so dass das unkorrelierte Rauschen sowie Streifen-Artefakte vernachlässigbar sind und die statistische Methode geeignet für die Aufgabe ist, kann man ein gut lesbares Ergebnis erhalten. Aber wenn man zu deutlich höheren Auflösungen wechselt, gilt dies nicht mehr, denn unsere Fähigkeit zum Lesen und Verstehen von Bildern höherer Auflösung hängt zunehmend von mehr oder weniger präzisen räumlichen Beziehungen innerhalb des Bildes ab. Und diese geht oft verloren, wenn man jeden Pixel eines Bildes unabhängig betrachtet.
Viele Mosaike auf Grundlage von Pixel-Statistik, welche mit Landsat- oder Sentinel-2-Daten produziert werden, erreichen gar nicht den Punkt wo die genannten Rahmenbedingungen erreicht werden (eine genügend breite Datenbasis und ein geeigneter statistischer Ansatz). Aber selbst wenn sie das tun ist das Ergebnis oft dennoch unübersichtlich und ist dem Einzel-Bild hinsichtlich Definition und Lesbarkeit weit unterlegen.
Kurz: Pixel-Statistik-Methoden sind eine hoch-attraktive Methode zur Produktion von Satellitenbild-Mosaiken und können sehr effizient bei geringen räumlichen Auflösungen verwendet werden. Aber sie sind bei deutlich höheren Auflösungen praktisch ungeeignet. Ich hab noch nie einen Versuch gesehen, solche Methoden bei Bildern sehr hoher Auflösung mit Pixel-Größen unter einem Meter anzuwenden und es würde vermutlich recht übel aussehen (wenngleich es auch recht schön mein Argument hier illustrieren dürfte). Im mittleren Auflösungs-Bereich wird der Gewinn an Qualität durch eine höhere Auflösung der Ausgangs-Daten und des Bearbeitungs-Gitters zunehmend schwächer bis zu dem Punkt, wo mit höherer Auflösung keine Steigerung der Qualität im Ergebnis mehr zu erwarten ist.
Praktisch überlappt dieser Effekt mit anderen Einflussfaktoren wie der begrenzten Positions-Genauigkeit der Daten und der typischerweise geringeren Zahl von verfügbaren Bildern bei höheren Auflösungen. Während die zuletzt genannten Probleme jedoch durch technologische Verbesserungen gelöst werden können, ist das beschriebene Hauptproblem prinzipieller Natur und bildet eine harte Grenze für Methoden auf Grundlage von Pixel-Statistik.
Und letztendlich ist dies der Grund, weshalb sich die Qualität von Satellitenbild-Mosaik-Produkten in den letzten Jahren nur wenig verbessert hat.
Aufgrund dieser Einschränkungen hab ich mich bei höher aufgelösten Zusammenstellungen im Bereich der Auflösung von Landsat/Sentinel-2 (10-15m) immer auf Methoden konzentriert, die nicht auf Pixel-Statistik basieren. Aber Pixel-Statistik hat natürlich wie erwähnt ihren Charme – in erster Linie natürlich ökonomisch, aber auch, weil man damit recht präzise Farben hinbekommen kann. Die Farben in einem einzelnen Satellitenbild sind immer stark davon abhängig, unter welchen Bedingungen das Bild aufgenommen wurde. Man kann jetzt eine Menge Aufwand bei der Atmosphären- und BRDF-Korrektur treiben, aber solche Methoden erzeugen zwangsläufig auch neue Varianz in den Daten durch ungenaue vereinfachende Annahmen, die ihnen zugrunde liegen. Mit einer genügend breiten Datenbasis kann Pixel-Statistik helfen, diese Varianz zu reduzieren und präzisere Farben zu produzieren.
Das ist der Grund, weshalb ich mich jetzt auch mal mit der Verwendung von Pixel-Statistik-Methoden für Landsat- und Sentinel-2-Bilder beschäftigt habe. Nicht so sehr für eine höhere Auflösung (welche natürlich gerne gesehen ist – wenngleich unter den beschriebenen Einschränkungen), sondern mehr für das, was man bei den Farben erreichen kann.
Mehr dazu im nächsten Beitrag. Bis dahin als Vorgeschmack: