Ich hab schon ein paarmal erwähnt, dass ich hier über das Thema Überprüfbarkeit von Daten in OpenStreetMap schreiben werde, was ich jetzt hier tun möchte. Mein Bedürfnis darüber mal grundsätzlich zu schreiben rührt vor allem daher, dass, dass es in den letzten 1-2 Jahren zunehmend normal geworden ist, dass Leute in Diskussionen in der OSM-Community das Prinzip der Überprüfbarkeit entweder grundsätzlich ablehnen oder sich mit fadenscheinigen Argumenten drumherum winden.
OpenStreetMap ist gegründet worden und wurde erfolgreich als ein Projekt zur Sammlung von lokalem geographischen Wissen über die Welt. Dieses Wissen wird durch Leute überall auf der Welt als Beitragende am OpenStreetMap-Projekt lokal gesammelt, indem sie ihr lokales geographisches Wissen in eine gemeinsame Datenbank eintragen. Die recht anarchische Form, in der dies geschieht, bei der die einzelnen Mapper ein großes Maß an Freiheit genießen, wie sie ihre lokale Geographie dokumentieren wollen, mit nur sehr wenigen festen Regeln, hat sich als sehr erfolgreich erwiesen und war in der Lage, eine große Anzahl von Leuten zur Teilnahme zu motivieren und erlaubt es damit recht gut, die weltweite Geographie in ihrer Vielfalt abzubilden.
Eine der Schlüssel-Regeln, die das Ganze zusammenhält, ist das Prinzip der Überprüfbarkeit (Verifiability). Überprüfbarkeit ist die wichtigste innere Regel von OpenStreetMap (im Gegensatz zu äußeren Regeln, wie der Verwendung rechtlich zulässiger Quellen für die Daten-Erfassung), jedoch gleichzeitig, die am meisten missverstandene Regel. Überprüfbarkeit ist das Mittel, mit welchem OSM den Zusammenhalt und das Funktionieren der Zusammenarbeit in der OSM-Community sicherstellt – sowohl in der Gegenwart als auch für die Zukunft. Nur durch die Überprüfbarkeit ist sicher gestellt, dass neue Mapper, die anfangen, in OSM zu mappen, einen brauchbaren Startpunkt haben, ihre lokale Umgebung zu erfassen – egal wo auf der Welt sie leben, was sie mappen möchten und was ihr persönlicher und kultureller Hintergrund ist.
Man sollte Überprüfbarkeit auf keinen Fall mit Präzision oder Genauigkeit verwechseln. Es handelt sich nicht um den idealen Endpunkt einer Skala von sehr ungenau zu sehr präzise. Überprüfbarkeit ist ein Kriterium für die Art der Angaben, die wir in der Datenbank speichern. Nur bei überprüfbaren Angaben lässt sich überhaupt eine objektive Aussage über ihre Genauigkeit machen.
Überprüfbarkeit sollte man auch nicht mit dem Unterschied zwischen der Erfassung vor Ort (on-the-ground mapping) und der Erfassung auf die Ferne (armchair mapping) vermischen. Überprüfbarkeit erfordert es nicht, dass alle Angaben tatsächlich vor Ort überprüft werden, sie erfordert lediglich, dass die Möglichkeit dazu besteht. Bei der Erfassung auf die Ferne lässt sich dies grundsätzlich sehr viel schwieriger beurteilen, weshalb diese Art des Mappens schwieriger und anspruchsvoller ist und mehr Anforderungen an die Fähigkeit und Kompetenz des Mappers stellt, aber grundsätzlich lassen sich viele überprüfbare Angaben aus Bildern ableiten, manchmal besser als vor Ort am Boden.
Überprüfbarkeit sollte man auch nicht mit Verifikationismus verwechseln, welcher nicht überprüfbare Aussagen als sinnlos ablehnt. OpenStreetMap fällt damit, dass es nicht überprüfbare Aussagen nicht in seinen Daten einbezieht, kein Urteil über den Wert solcher Aussagen. Es sagt lediglich, dass diese Art von Daten nicht in die OSM-Datenbank gehören, da sie vom Projekt unter seinen Grundprinzipien nicht verwaltet und gepflegt werden können. Die Lebensfähigkeit von OpenStreetMap als Projekt hängt davon ab, dass es sich auf überprüfbare Angaben beschränkt. In der praktischen Anwendung (also wenn man zum Beispiel Konflikte löst) ist es meist besser, die Überprüfbarkeit in Form der Falsifizierbarkeit zu testen.
Ganz kurz und knapp formuliert erfordert Überprüfbarkeit, dass Angaben in der OpenStreetMap-Datenbank unabhängig überprüfbar sein müssen. Ein anderer Mapper muss in der Lage sein ohne Zugang zu den selben Quellen wie der Erfasser der Daten objektiv zu überprüfen und zu demonstrieren, ob diese Daten richtig oder falsch sind. Wer jetzt mit einer Philosophie des universellen Relativismus sagt es gibt ja in den meisten Fällen nicht nur eindeutig richtige oder falsche Aussagen, sondern auch Zwischentöne, der hat die Idee hinter der Überprüfbarkeit nicht begriffen und verwechselt Überprüfbarkeit mit Präzision während er a priori annimmt, dass alles überprüfbar ist. Bei Überprüfbarkeit geht es fanz fundamental um die Möglichkeit einer objektiven Beurteilung der Aussage auf Grundlage der beobachtbaren geographischen Realität.
Dieses Prinzip grenzt OpenStreetMap vom Wikipedia-Projekt ab, welches einen deutlich anderen Ansatz zur Erfassung von Informationen gewählt hat. Die Wikipedia hat ihr eigenes Überprüfbarkeits-Prinzip, welches aber etwas völlig anderes bedeutet als in OSM. Überprüfbarkeit in Wikipedia bedeutet, dass Aussagen sozial akzeptiert sein müssen, um wahr zu sein. Dies wird mit einem Recht traditionellen Ansatz getestet, welcher auf der Reputation von Quellen basiert. Solch ein Reputation-System ist natürlich sehr Kultur-spezifisch so dass Wikipedia versucht, den sozialen Zusammenhalt in der Community dadurch zu erhalten, dass auch sich widersprechende Aussagen und Vorstellungen aufgezeichnet werden können (insbesondere natürlich in den verschiedene Sprachen, in gewissem Rahmen aber jedoch auch innerhalb einer Sprach-Version). Dennoch sind Konflikte zwischen verschiedenen Vorstellungen und Sichtweisen, Machtkämpfe um Deutungshoheit zwischen verschiedenen politischen und sozialen Strömungen sowie widersprüchliche Aussagen in den verschiedenen Sprachen, welche verschiedene kulturspezifische Ansichten repräsentieren, ein verbreitetes Phänomen und ein definierendes Element des Projektes.
Auf einer fundamentalen Ebene spiegelt dieser Unterschied zwischen OpenStreetMap und Wikipedia ein bisschen den Unterschied zwischen Naturwissenschaften und Sozialwissenschaften wieder. Was jedoch nicht bedeutet, dass OpenStreetMap nur phsikalisch-geographische Angaben enthalten kann. Sehr viele kultur-geographische Elemente sind ja empirisch überprüfbar.
Dennoch ist für viele Leute mit einem sozialwissenschaftlichen Hintergrund oder einer Sozialisation in Wikipedia der Prinzip der Überprüfbarkeit sehr störend und lästig. Es gibt ein breites Bedürfnis von Leuten, in OpenStreetMap Aussagen zu speichern, die Teil ihrer Wahrnehmung der Geographie sind – selbst wenn sie sich fundamental von der Wahrnehmung anderer unterscheiden und damit nicht praktisch überprüfbar sind.
Eine der Ideen, die ich in diesem Zusammenhang oft höre ist, dass Überprüfbarkeit eine altmodische und obsolete konservative Idee ist, ein Relikt, welches den Fortschritt behindert. Da liegt eine ziemliche Ironie drin, denn die Idee der Überprüfbarkeit basiert direkt auf den Werten und Prinzipien der Aufkärung. Passend dazu scheinen manche der nicht überprüfbaren Mapping-Ideen, die gelegentlich vorgestellt werden, recht deutlich Elemente von Gegenaufklärung und romantischer Philosophie im Hintergrund zu haben.
Daneben gibt es auch Druck zur Einbeziehung von nicht überprüfbaren Angaben in der OpenStreetMap-Datenbank von Leuten, die in OpenStreetMap weniger eine Sammlung von lokalem Wissen, sondern mehr eine Sammlung nützlicher und geeignet vorverarbeiteter kartographischer Daten sehen – und die dabei ignorieren, dass der Erfolg von OpenStreetMap zu erheblichem Teil genau daraus rührt, diesen Ansatz nicht gewählt zu haben. Der Wunsch, Daten die als nützlich angesehen werden ungeachtet ihrer Überprüfbarkeit einzubeziehen, ist auch in der OSM-Community weit verbreitet. Solche Bedürfnisse sind aber meist recht kurzsichtig und selbstzentriert. Die Nützlichkeit von Informationen ist per Definition subjektiv (etwas ist für eine bestimmte Person in einer bestimmten Situation von Nutzen) und relativ (Pfeil und Bogen mögen sehr nützlich als Waffen sein, werden jedoch sofort deutlich weniger nützlich, wenn man Zugang zu einer Schusswaffe hat). Ein OpenStreetMap-Projekt, welches das Prinzip der Überprüfbarkeit durch den Grundsatz der Nützlichkeit ersetzt, würde recht schnell obsolet werden, denn Nützlichkeit ist im Gegensatz zu Überprüfbarkeit keine stabile Eigenschaft.
Und was so scheint es alle Gegner der Überprüfbarkeit halt ignorieren ist, dass die Aufgabe dieses Prinzips zu massiven Problemen für den sozialen Zusammenhalt im Projekt führen würden und es enorm behindern würden, weiter auf das Ziel hin zu arbeiten, in gemeinsamer Arbeit von vielen Leuten überall auf der Welt eine Datenbank des lokalen Wissens über die weltweite Geographie in all ihrer Vielfalt zu produzieren. Die objektiv beobachtbare geographische Realität als Grundlage aller Daten in OpenStreetMap ist der fundamentale Ansatz, mit dem OpenStreetMap sehr unterschiedliche Leute aus allen Teilen der Welt, die außerhalb von OpenStreetMap kaum in der Lage wären, miteinander zu kommunizieren, zusammenbringt, um zusammen zu arbeiten und ihr lokales geographisches Wissen zu teilen. Ohne diesen Grundsatz als verbindendes Prinzip funktioniert OpenStreetMap nicht und der Versuch, stattdessen eine Überprüfbarkeit a la Wikipedia einzuführen, würde nicht nur all die Probleme von Wikipedia wie dauernde Kämpfe um Deutungshoheit importieren, er wäre auch für die Art von Informationen in OpenStreetMap und die Arbeitsweise im Projekt völlig ungeeignet.
Wie schon oben angedeutet gibt es natürlich bereits eine ganze Menge nicht überprüfbare Daten in OpenStreetMap. Bis jetzt haben diese größtenteils den Charakter eines inneren Forks – es gibt Mapper, die aktiv solche Dinge erfassen, die meisten Mapper ignorieren sie jedoch in ihrer Arbeit. Es gibt jedoch auch Bereiche, in denen nicht überprüfbare Angaben das normale Mapping in OSM behindern, insbesondere wenn Leute versuchen, existierende überprüfbare Tags um neue, nicht überprüfbare Bedeutungen zu erweitern.
Nicht überprüfbare Daten in OpenStreetMap kann man grob in zwei Kategorien aufteilen: Nicht überprüfbare Tags und nicht überprüfbare Geometrien. Der verbreitetste Fall nicht überprüfbarer Geometrien sind abstrakte Polygon-zeichnungen. Der traditionelle Weg in OSM ein Objekt zu erfassen, welches überprüfbar existiert, dessen Ausdehnung jedoch nicht überprüfbar ist, ist es mit einem Node zu erfassen. Die Position des Nodes wird für ein geographisches Objekt, welches zumindest begrenzt lokalisierbar ist, üblicherweise auf einen überprüfbaren Ort konvergieren – selbst wenn die Streubreite dieser Ortsbestimmung recht hoch sein kann. Mit dem Argument der praktischen Nützlichkeit oder dem dogmatischen Glauben daran, dass ein zweidimensionales Objekt in OSM immer mit einem Polygon erfasst werden sollte, bevorzugen eine ganze Reihe von Mappern es jedoch, ein Polygon zu zeichnen – selbst wenn es keine überprüfbare Grundlage für dessen Geometrie gibt.
Bei nicht überprüfbaren Tags ist die meist verbreitete Variante nicht überprüfbare Klassifikationen. Das sind Ideen wie: “Ich betrachte Objekt X als eine Instanz von Klasse A, kann aber nicht genau in abstrakter Form sagen, was Klasse A eigentlich ausmacht, so dass andere meine Klassifikation überprüfen können”. Eines der am meisten verbreiteten tags dieses Typs ist das tracktype-Tag, was seit den frühen Tagen von OSM existiert. Der psychologische Hintergrund solcher Tagging-Ideen ist meist, dass Leute sich ein einfaches, eindimensionales Klassifikationssystem für die Beschreibung einer komplexen mehrdimensionalen Realität wünschen, jedoch nicht in der Lage oder gewillt sind, dieses konsequent zu durchdenken und eine konsistente, praktisch überprüfbare Definition zu entwickeln.
Der andere Typ nicht überprüfbarer Tags, der insbesondere in letzter Zeit populär geworden ist, sind berechenbare Informationen. Das bedeutet Angaben, die man entweder aus andere Angaben in der OSM-Datenbank ableiten kann oder aus Daten von außerhalb von OSM, die aber praktisch durch den Mapper nicht überprüfbar sind außer dass man genau diese Berechnung durchführt. Initiativen, solche Daten in OpenStreetMap aufzunehmen, basieren immer auf dem Argument der Nützlichkeit. Und obwohl es natürlich recht offensichtlich ist, dass es nicht viel Sinn macht, so was in OSM zu haben – sowohl wegen der Überprüfbarkeit als auch aufgrund des Problems der Wartung und Aktualisierung der Daten – ist der konkrete praktische Wunsch, bestimmte berechenbare Informationen fertig berechnet in der Datenbank zu haben, manchmal sehr stark.
Was helfen würde, diesen Konflikt in OpenStreetMap zwischen denjenigen, die das Prinzip der Überprüfbarkeit wertschätzen und denjenigen, für die dieses nur ein lästiges Hindernis für die Einbeziehung nützlicher Daten ist, zu lösen, wäre ein separates Datenbank-Projekt für die Sammlung solcher nicht überprüfbarer zusätzlicher Daten als Ergänzung zu OpenStreetMap. Aber obwohl sich das technisch durchaus machen ließe, ist die Notwendigkeit, hierfür eine eigene Community von Freiwilligen zu motivieren, eine erhebliche Hürde. Eines der Motive, weshalb Leute nicht überprüfbare Daten in OSM haben möchten ist ja, damit die Mapper dabei helfen, diese Daten zu erzeugen und zu pflegen.
Die letzentlich entscheidende Frage ist natürlich, ob vor dem Hintergrund von all diesem das Prinzip der Überprüfbarkeit in der Zukunft von OpenStreetMap Bestand haben wird. Ich bin mir da nicht sicher. Das hängt letztendlich davon ab, ob die Mapper-Community hinter diesem Grundsatz steht oder nicht. Was ich jedoch weiß und was ich versucht habe hier deutlich zu machen ist, dass OpenStreetMap ohne das Prinzip der Überprüfbarkeit als praktisch beherzigte Regel (als eine Regel, die nicht nur auf dem Papier existiert, sondern welcher die Mapper in der Praxis folgen) keine langfristige Zukunft hat. Es wäre also essentiell für die Zukunft von OpenStreetMap, allen, die mit dem Mappen anfangen, deutlich zu machen, dass die Akzeptanz und Wertschätzung für das Prinzip der Überprüfbarkeit als einer der Kern-Werte des Projektes die Grundlage dafür ist, in OpenStreetMap Daten zu erfassen und dass dies letztendlich Bedingung dafür ist, dass sie im Projekt als Mapper willkommen sind. Ich denke, dass das in den letzten Jahren ein bisschen vernachlässigt worden ist und dass es im Interesse der zukünftigen Tragfähigkeit des Projektes wichtig wäre, dies zu korrigieren.
24. Februar 2021 um 00:10 Uhr
Von einer Import-Liste Diskussion hier hergeleitet worden, mir gefällt, was ich hier lese. Zwei Beobachtungen und eine Frage:
In der Nähe gibt es zwei Berge, Olperer und Fußstein, vielleicht ist es auch nur ein Berg mit zwei Gipfeln, wer weiß. Aus verschiedenen Winkeln gesehen, erscheint mal der eine mal der andere höher. Lange war das strittig. Mittlerweile ist das ausgemessen; nachvollziehbar mit Hilfe entsprechender Geräte. Dabei ist es nicht viel weniger lange her, dass auch nicht klar war, welcher der beiden Gipfel mit welchem der beiden Namen denn gemeint ist. Mittlerweile gehen auch dazu die Meinungen nicht mehr auseinander, eine der beiden Ansichten hat sich durchgesetzt. Kein Wunder, amtliche Karten können oder wollen solche Differenzen nicht abbilden, ein beamteter Geograph hat entschieden; Für Routenbeschreibungen ist das auch nicht gewünscht, die Besteiger haben sich geeinigt; usw. Nachvollziehbar ist das durch Lektüre. Betrifft das Prinzip der Überprüfbarkeit den einen Streitpunkt anders als den andren?
Das Beispiel illustriert nicht zuletzt, dass Argumente der Art, “ist immer schon so gewesen” mit Vorsicht zu handhaben sind. Gerade vor Kurzem ist eine wenig mehr als mickrige 100 Jahre alte Karte aufgetaucht, auf der einige Gipfel anders heißen als heute. Sogar das Amt für Vermessungswesen gibt auf Anfrage zur Auskunft, dass die Namen von Gewässern nicht in gleicher Weise verbindlich sind, wie die von Straßen. Hier gibt es mindestens einen Bach, der heißt im GIS des Landes anders als im GIS der Stadt. Das Amt beschränkt sich in seiner Deutungshoheit auf die ihm gesetzte Basis.
24. Februar 2021 um 00:38 Uhr
Die Frage, welcher von zwei Gipfeln der höhere ist, ist aus Sicht der Erfassung in OpenStreetMap uninteressant und im Allgemeinen auch unentscheidbar. Die Höhe des einen Gipfels und dessen Bestimmung ist per Definition unabhängig von der des anderen. Und die Höhen-Bestimmung ist natürlich recht offensichtlich überprüfbar möglich. Die Frage, welcher von zwei Gipfeln höher ist als der andere ist hingegen eine Frage der Genauigkeit der Höhen-Werte und eine Aussage darüber erfordert bei sehr ähnlichen Höhen ggf. eine sehr hohe Genauigkeit der Höhen-Bestimmung. Das hat aber mit der Überprüfbarkeit der einzelnen Höhen nichts zu tun.
Was die Namens-Zuordnung angeht – in OpenStreetMap erfassen wir Namen in Form der lokal verwendeten Namen. Das bedeutet, dass die Namen der Gipfel nur dann überprüfbar sind, wenn unter den ortskundigen Einwohnern dort in der Gegend eine einheitliche Verwendung der Namen für die einzelnen Gipfel im praktischen Sprachgebrauch besteht. Kurz: Wenn man Einheimische fragt, welcher der Gipfel wie heißt und man erhält darauf eine konsistente Antwort, dann ist dies ein überprüfbarer Name. Dass das kollektive lokale geographische Wissen der Menschen vor Ort in OpenStreetMap mehr zählt als irgendwelche ggf. sehr renommierte Publikationen, ist für manche schwer nachvollziehbar, ist aber einer der Grundpfeiler des Projektes.
24. Februar 2021 um 21:54 Uhr
Danke chris für die Auskunft, dass Hörensagen (qualitative Sozialforschung) unter Nachprüfbar fällt. Ich denke ich verstehe ein wenig mehr, was Importe zum Problem machen kann: Mit Leuten plaudern, auf einen Berg steigen, das Gipfelbuch lesen, die gesammelten Informationen in die Datenbank/Karte eintragen, erzeugt ein tieferes Gefühl der Verbundenheit, als aus der Datenbank eines Dritten eine Liste von geocodierten Werten übernehmen; die wahrscheinlich zwar eh nicht viel anders gesammelt worden sind, aber eben von Dritten. Wenn die Quellen dann noch als unantastbare Autorität betrachtet werden, über das hinaus, was sie auf Nachfrage selber in Anspruch nehmen, dann läuft etwas schief.