Daten statt Dienste

Geschredderte Akten
Daten in der falschen Darreichungsform können oft mit nur viel Aufwand verwendet werden


Nachdem der Stadtrat Dresden schon vor fast vier Jahren eine OpenData Strategie verabschiedet hat, ist es nun endlich soweit und die Stadt hat ihr OpenData Portal live geschaltet. Ein kleiner Grund zum Feiern. Doch für die lange Wartezeit hatte sich die lokale OpenData-Community allerdings etwas mehr erwartet: Neben den schlechten (oder schlecht zugänglichen) Metadaten stehen die meisten Daten gar nicht als Download sondern nur als Dienst bereit. Einige der Dienste melden dann auch noch den Fehler, dass der Nutzer keine Zugriffsrechte hätte. Die Daten stehen also als Schnittstelle für die Ansicht in professioneller GIS-Software bereit, statt als Rohdaten zur Verarbeitung in eigener Software. Besonders ärgerlich daran finde ich, dass diese Kritik schon beim OpenData Crunch vor drei Jahren mehrfach geäußert wurde. Damals wurde angemerkt, dass man dieses Problem nicht auf dem Schirm hatte und versprach, dass man in Zukunft darauf achten werde, die Daten auch in üblichen Formaten als Download bereitzustellen. Ich finde es nicht verwerflich, dass eine Stadt im ersten Versuch nicht weiß, in welchen Formaten so eine OpenData Community die Daten gern hätte. Wenn man dann aber Besserung verspricht, es nach 3 Jahren aber immer noch nicht schafft, seine Daten sinnvoll bereitzustellen, dann fehlt es entweder an Wille oder an Kompetenz. Im Vorfeld des Startes des Portals kam von der Stadt übrigens noch die Kritik, dass es kein Feedback von der Community gibt. Gleichzeitig mussten die Vertreter der Stadt eingestehen, dass es weder einen geeigneten Feedbackkanal noch die personellen Ressourcen gibt, um das Feedback entgegen zu nehmen.

So, genug gemeckert, hier jetzt eine Zwischenlösung: Natürlich gibt es Tools um auch aus den bereitgestellten Schnittstellen alle Daten herunter zu laden und zu konvertieren. Mit den OGR-Tools kann man das alles sogar in einem Schritt machen. Um z.B. alle Straßenbahnlinien als GeoJSON herunterzuladen führt man einfach folgendes aus:

ogr2ogr -f GeoJSON "bahnlinien.geojson" "WFS:https://kommisdd.dresden.de/net3/public/ogc.ashx?NodeId=620&Service=WFS&Request=GetCapabilities" -t_srs EPSG:4326

Einige Datensätze bestehen aus mehreren Layern. Da GeoJSON das Konzept Layer nicht kennt, kann es hier zu Fehlern kommen. Wenn man das Argument -nln layer anfügt, landen alle Daten in einem Layer. Außerdem erkennt der WFS-Treiber die Datentypen nicht immer zuverlässig, was dazu führen kann, dass z.B. versucht wird, die Nummern von Buslinien als Ganzzahl zu parsen. Das schlägt bei einer Buslinie „B“ natürlich fehl. Deswegen kann man dem Parser sagen, dass er alle Daten als Zeichenkette lesen soll, indem man vorher export GML_FIELDTYPES=ALWAYS_STRING ausführt.

Damit das jetzt nicht jeder selber machen muss, habe ich das mal komplett für alle Services aus dem Portal gemacht. Das sind insgesamt fast 14GB, komprimiert 3GB und können hier oder auf meinem OpenData Portal heruntergeladen werden. Die Lizenz bleibt die dl-de/by-2-0 mit Namensnennung der Landeshauptstadt Dresden, wie in den nicht verlinkbaren Nutzungsbedingungen des OpenData Portals.

Veröffentlicht am