imagico.de
imagico.de

imagico.de

Geo-Visualisierung

Englische Version

Zur Situation der Gewässer in OpenStreetMap

Bei meinen Untersuchungen zur Datenqualität der OpenStreetMap Küstenlinien habe ich die Unterschiede in der Datenqualität und Genauigkeit bei diesen Daten analysiert. Wie dort jedoch erläutert ist die Küstenline einfach strukturiert und die Art und Weise, wie diese in Openstreetmap verarbeitet wird, stellt zumindest eine formale Konsistenz sicher. Hier möchte ich jetzt einen Blick auf die Situation der Wasserflächen im Inland werfen.

Gewässer können schon seit langem in Openstreetmap erfasst werden. Derzeit existieren die folgenden etablierten Methoden zum Tagging der Wasserflächen im Inland:

  • Polygone mit natural=water werden weitverbreitet für alle Arten von Wasserflächen verwendet. water=* ermöglicht zusätzlich eine Angabe zur Art der Wasserfläche, beispielsweise ob es sich um eine See, Fluss, Kanal oder Sonstiges handelt.
  • Natürliche Wasserläufe werden mit waterway=river|stream getaggt. Die Reihenfolge der Punkte sollte dabei die Fließrichtung angeben.
  • Künstliche Wasserläufe werden mit waterway=canal|drain|ditch getaggt. Auch hier ist die Reihenfolge der Punkte in Fließrichtung anzugeben, falls es sich um ein Gewässer mit ausgeprägtem Wasserfluss handelt.
  • Breitere Wasserläufe wurden historisch als geschlossene ways mit waterway=riverbank getaggt. Dieses Tag ist sowohl bei einfachen Polygongn als auch bei Multipolygonen noch immer weit verbreitet. Zusätzlich zu den Umrissen sollte dabei immer auch eine Mittellinie mit waterway=river oder entsprechenden Tags eingezeichnet werden.
  • Einige sehr große Seen sind als natural=coastline getaggt.
  • Gewässer, welche regelmäßig trockenfallen können mit intermittent=yes oder water=intermittent getaggt werden.
  • Künstliche Wasserflächen und Stauseen wurden früher mit landuse=reservoir getaggt.
Wasserfläche Wasserlauf Kanal Flussufer See als Küstenlinie Stausee
Wasserfläche Wasserlauf Kanal Flussufer See als Küstenlinie Stausee

Wie man sehen kann gibt es eine Vielzahl von Möglichkeiten - in der normalen Karte werden diese jedoch alle im selben Blauton dargestellt. Es ist nicht möglich ausschließlich auf Basis der Kartendarstellung auf das verwendete Tagging zu schließen.

Hier ein paar Zahlen aus taginfo zur Häufigkeit der Verwendung:

TagAnzahl der ElementeBemerkungen
natural=water4 820 039
water=*321 360
  water=lake;pond58 059mindestens 57 252 davon aus NHD import
  water=lake19 680
  water=pond17 956
  water=reservoir10 608
  water=river3 822
  water=canal1 517
waterway=*8 608 656
  waterway=stream6 742 984mindestens 1 251 277 davon aus NHD import, ~2 300 000 aus CanVec import
  waterway=river624 282
  waterway=ditch376 597
  waterway=drain229 136
  waterway=canal156 891
waterway=riverbank257 409
intermittent=yes688 058mindestens 634 627 davon aus NHD import
water=intermittent196 756
landuse=reservoir267 230

Die Räumliche Verteilung dieser Elemente sieht man in den folgenden Bildern. Die Karten zeigen die Punktdichte der Elemente mit den oben angegebene Tags. Im ersten Bild in Rot dargestellt sind die Flächenelemente (also natural=water, waterway=riverbank und landuse=reservoir), während Blau die Linienelemente wiedergibt (also waterway=*).

Wasserflächen-Punktdichte in den OSM-Daten

Nun sind Wasserflächen natürlich in Wirklichkeit auf der Erde nicht gleichmäßig verteilt, ihre Häufigkeit hängt unter anderem von Klima, Relief und Geologie ab. Das macht es schwierig von der Dichteverteilung in Karten wie dieser auf die Vollständigkeit zu schließen.

Was man dennoch sehen kann ist, dass Mitteleurope und Teile von Nordamerika detailliert erfasst sind sowohl mit Flächen- als auch Linien-Elementen, was zu einem hellen Pinkton führt. Die relativ gesehen höhere Dichte der Linienelemente in Japan könnte an der gebirgigen Geographie liegen. Ähnlich könnte der rötlichere Farbton in Nordeuropa vermutlich von der großen Zahl von Seen dort herühren. Außerdem sind in trockenen Gebieten tendenziell weniger Seen vorhanden als in feuchten Regionen. Man kann jedoch auch in der Karte sehen, dass die Abdeckung in Nordamerika recht ungleichmäßig ist mit dicht erfassten Gebieten scharf und gradlinig abgegrenzt von Gebieten mit geringer Element-Dichte. Dies deutet auf teilweisen Import von Daten aus externen Quellen hin. Es gibt nur wenige Gebeite außerhalb von Nordamerika, wo solche geraden Import-Grenzen zu finden sind: Ein solches Gebiet findet sich in Zentral-Brasilien mit Linienelementen importiert aus IBGE-Daten. Ein weiteres liegt in Sibirien am unteren Jenissei mit Wasserflächen, welche vermutlich auf Satellitendaten basieren.

Die folgende Karte zeigt die Linienelemente mit waterway=river in Rot im Vergleich zu waterway=stream in Blau:

waterway Punktdichte in den OSM-Daten

Hier gut zu erkennen sind die Gebiete in Nordamerika mit aus anderen Quellen importierten Daten, welche in kräftigem Blau erscheinen. Bei der normalen Erfassung von Daten besteht ein Zusammenhang zwischen den beiden Linientypen – eine hohe Dichte von stream-Elementen würde immer auch mit einer Erfassung von größeren river-Elementen verbunden sein. Das kräftige Blau deutet an, dass hier die importierten Elemente durchgehend als waterway=stream getaggt wurden, einschließlich größerer Wasserläufe, welche eigentlich als waterway=river getaggt werden sollten.

Die geringe Anzahl von Gewässern in Wüstenregionen ist natürlich zu erwarten und kann nicht einer ungleichmäßigen Erfassung zugeschrieben werden. Es gibt jedoch noch andere Unterschiede in der Verteilung, welche deutlich auf Unterschiede in der Erfassung hindeuten. Die Häufigkeit von Wasserflächen in Sibirien, Nordkanada und Alaska ist beispielsweise recht vergleichbar mit der in Nordeuropa - dennoch sind diese Regionen in OSM wesentlich weniger dicht mit Wasserflächen abgedeckt. Ähnliches gilt für tropische Regionen.

Wenn man sich von den dicht erfassten Gebieten entfernt sind zwei Trends zu erkennen:

  1. Mit Abnahme der Erfassung von Details bei der Erfassung von Flüssen werden diese oft nur als Linie anstatt mit einer Fläche erfasst. In der ersten Karte oben lässt sich das zum Beispiel im europäischen Teil Russlands beobachten, wo außerhalb städtischer Bereiche blaue Farben dominieren. Überlagert wird dies von natürlichen Unterschieden – flache Küstenregionen zeigen beispielsweise oft einen rötlicheren Farbton.
  2. Bewegt man sich weiter von der Zivilisation weg, dann werden kleinere Wasserläufe zunehmend nicht mehr erfasst und es bleiben die als Flächen erfassten größeren Flüsse. Dies führt zu einem Netzwerk roter Linien in der Karte, wie man es weitverbreitet sehen kann. Insbesondere tritt dies auf in bewaldeten Gebieten wo die Erfassung weitgehend auf Basis von Satellitenbildern erfolgt. Kleinere Wasserläufe sind dort nicht sichtbar und es bleiben nur die größeren Wasserflächen für die Erfassung.

Unstimmigkeiten und Fehler

Bis jetzt habe ich nur untersucht, wie umfangreich die erfassten Daten in verschiedenen Teilen der Welt sind. Dies sagt noch nichts aus über die Qualität dieser Daten. Über die Genauigkeit lässt sich ohne Vergleich mit der Realität nicht viel sagen. Man kann jedoch einen Blick darauf werfen, wie konsistent die Daten sind.

Zunächst ein paar allgemeine Beobachtungen dazu, wie die zu Beginn beschriebenen Tagging-Konventionen in der Praxis angewandt werden:

  • Angaben zur Art von Wasser-Polygongn mittels water=* fehlen sehr oft. Es gibt insgesamt 4,8 Millionen Elemente, welche mit natural=water getaggt sind, jedoch nur etwa 100000 davon verfügen über ein water=*-Tag mit Angabe zur Art der Wasserfläche (also ohne water=intermittent oder ähnliches).
  • Die historischen Taggings von waterway=riverbank und landuse=reservoir sind weiterhin verbreitet und werden in verschiedenster Form mit den neuen Tags kombiniert, was die Interpretation schwierig macht.
  • Wasserflächen werden oft willkürlich geteilt. Ebenso finden sich verbreitet Überlappungen.

Die Überlappungen und verschiedenen Tagging-Varianten lassen sich durch aufwändigere Interpretation lösen. Als Ganzes betrachtet ist es jedoch weitgehend unmöglich, bei der Interpretation zwischen unterschiedlichen Arten von Wasserflächen zu unterscheiden. Dies ist eine große Einschränkung, wenn beispielsweise eine Aufteilung in Fließgewässer und Seen oder in natürliche und künstliche Wasserflächen notwendig ist. Daneben gibt es noch weitere Probleme:

  • Die Mittellinien von Flüssen sind oft nicht verbunden, insbesondere kleine Zuflüsse von größeren Flüssen enden oft am Ufer. Seen im Verlauf einen Flusses unterbrechen oft die Mittellinie. Als Folge davon ist die separate Nutzung der Liniendaten ohne die Flächen gewöhnlich nicht möglich.
  • intermittent=yes wird nur selten angegeben, selbst für Seen, welche die meiste Zeit trocken liegen. Eigentlich ist bei den nicht importierten Daten water=intermittent deutlich weiter verbreitet obwohl dies mit einer Typ-Angabe bei Wasserflächen kollidieren würde.
  • Linien-Elemente sind nicht immer in Fließrichtung orientiert.
  • Neben diesen für Gewässer-Elemete spezifischen Problemen sind kaputte Multipolygonen bei Wasserflächen häufig zu beobachten. Nach den administrativen Grenzen sind Wasserflächen vermutlich am häufigsten von diesem Problem betroffen.

HHier ein paar Beispiele für die beschriebenen Probleme illustriert mit mit JOSM-Screenshots:

Innere Ringe getagged als waterway=riverbank überlappende Flächen willkürliche Flächenaufteilungen
Innere Ringe mit waterway=riverbank überlappende Flächen willkürliche Flächenaufteilungen
nicht verbundene Linien überlappende Flächen willkürliche Flächenaufteilungen
nicht verbundene Linien überlappende Flächen willkürliche Flächenaufteilungen

Tagging-Probleme

Die fehlenden Angaben zur Art der Wasserflächen werden durch das Tagging-Schema begünstigt, denn natural=water reicht aus, damit die Fläche im Renderer als Wasser dargestellt wird und die Angabe weiterer Tags hat keine Wirkung auf die Darstellung. Das alte Verfahren für Flüsse mit waterway=riverbank war in dieser Hinsicht günstiger, da es die unterscheidung zwischen fließenden und stehenden Gewässern erzwingt. Bei den Fließgewässern gibt es die etablierte Unterscheidung zwischen river und stream, welche auch vom Renderer interpretiert wird (stream wird mit dünneren Linien dargestellt und erst ab höheren Vergrößerungen). Auch diese Unterscheidung bringt jedoch gewisse Probleme mit sich:

  • River und stream sind lediglich zwei Klassen zur Angabe der Flussgröße, welche eigentlich (egal wie man das genau definiert) eine kontinuierliche Größe darstellt. Für viele praktische Zwecke ist der Schwellenwert zwischen den beiden Klassen recht niedrig, so dass river eine sehr breite Einordnung ist.
  • Die Unterscheidung zwischen river und stream soll auf Basis der Breite gemacht werden (wenn man drüberspringen kann, ist es ein Stream). Wenngleich dies in Mitteleuropa oder in Regionen mit ählichem Klima ein recht brauchbares Kriterium ist, führt dies in anderen Teilen der Welt, insbesondere in Trockengebieten, zu großen Problemen. Ein zeitweise trockener Fluss erfüllt das Kriterium zumindest zeitweise unabhängig von seiner Größe. Als Folge hiervon sind Flüsse erheblicher Größe, manchmal von über 50km Länge als stream erfasst. Dies bedeutet nicht, dass die Unterscheidung river/stream keine nützliche Information darstellt, für die verwendung bei der Kartendarstellung ist sie jedoch nur von begrenztem Nutzen.

Es gibt derzeit keine etablierte Methode, das Umriss-Polygon eines Flusses oder Kanals mit der zugehörigen Mittellinie zu verbinden. Dies macht es weitgehend unmöglich, von den Eigenschaften der Mittellinie auf die der Fläche zu schließen, falls entsprechende Flächentags fehlen. Man könnte natürlich annehmen, dass eine Wasserfläche, welche von einer Linie mit waterway=canal geschnitten wird, ein Kanal ist. Bei einem Kanal welcher zum Beispiel zwei Seen verbindet wird die Linie jedoch auch die Seeflächen schneiden, wenngleich diese keine Kanäle sind.

Waterway-Relationen

Relationen mit type=waterway sind eingeführt worden, um die Daten von Wasserläufen in Openstreetmap zu strukturieren. Eine Waterway-Relation soll dabei einen Fluss im Sinne einer Linie mit Quelle und Mündung unter einem bestimmten Namen representieren. Die Verbindungen zwischen verschiedenen Flüssen können dabei mit Hilfe des Tags destination hergestellt werden. Dies geschieht jedoch über den Namen des Flusses, welcher oft keine eindeutige Zuordnung erlaubt und daher schwierig zu interpretierren ist. Außerdem ist dieses Verfahren für den Mapper umständlich und fehleranfällig, insbesondere bei Namen in einer fremden Sprache. Als Folge hiervon wird diese Methode selten verwendet. Einige Waterway-Relationen enthalten stattdessen die entsprechenden Relationen ihrer Zuflüsse als Elemente mit role=tributary, wodurch einer Hierarchie von Relationen entsteht. Dies ist jedoch auch schwierig mit den derzeitigen Editoren zu bearbeiten. Insgesamt gibt es derzeit etwa 8000 Waterway-Relationen in der Datenbank, die meisten davon in Europa wie auf der folgenden Karte zu sehen.

Punktdichte von Elementen in Waterway-Relationen in den OSM-Daten

Christoph Hormann, August 2013

Kommentare:

noch keine Kommentare.

Kommentar schreiben
Sie müssen Javascript aktivieren, um Kommentare schreiben zu können.
Verifikation Bitte geben Sie die Buchstabenfolge im Bild links in das Eingabefeld ein, damit ich Sie einfacher von Spam-Programmen unterscheiden kann.
* * Erforderliches Feld
Informationen über Sie
*
wird nicht veröffentlicht
wird mit ihrem Kommentar angezeigt
Ihr Kommentar (kein HTML)

*

Wenn Sie mir, dem Autor dieser Seite, eine private Nachricht senden möchten, können Sie dies per Email tun.

Die Kommentare werden erst nach einer Überprüfung freigeschaltet. Er kann somit einige Zeit dauern, bis Ihr Beitrag auftaucht.

Bitte beachten Sie, dass die Kommentarfunktion zum Kommentieren der Bilder und Texte und nicht zur Diskussion politischer oder religiöser Ansichten dient. Kommentare ohne Bezug zum Inhalt dieser Seite werden nicht freigeschaltet.