BahnRoulette


Die Deutsche Bahn versucht sich nun endlich an OpenData. Die interessanten Daten der Bahn, wie Fahrplandaten, die alle gern hätten, gibt es natürlich erst mal nicht. Die Daten die es im Daten-Portal gibt, scheinen erst einmal nicht so spannend, sind aber durchaus mal einen Blick wert. Ich habe mir den Datensatz mit allen Stationen der Deutschen Bahn angesehen. Dabei fällt als erstes auf, dass die Bahnhöfe nur Adressen und keine Geokoordinaten enthalten. Diese wären aber ganz nützlich um die Bahnhöfe z.B. mit den aus OpenStreetMap abzugleichen oder die OSM-Daten mit Daten der Bahn zu vervollständigen (z.B. Betriebsstellenkürzel, Adressen). Wenn die Bahn uns diese Daten nicht geben will, dann müssen wir uns die Daten eben selber machen: Ich habe ein Tool gebaut, welches ähnlich wie MapRoulette funktioniert. Man bekommt die Daten eines zufällig Bahnhofs aus den Bahndaten angezeigt. Daneben befindet sich eine Karte. Die Karte versucht anhand der Adressdaten des Bahnhofes in die richtige Region zu springen. Jetzt kann man den Bahnhof auf der Karte suchen, drauf klicken und dann diese Koordinate speichern und bekommt den nächsten Bahnhof vorgesetzt.

Das ganze macht ein bisschen süchtig und damit sollten wir ziemlich schnell alle Bahnhöfe verorten können. Wenn man dann die angereicherten Bahn-Daten neben die OpenStreetMap-Daten legt, könnte man schauen wo sich diese Datensätze unterscheiden. Dies hilft beim finden von Fehlern in beiden Datenquellen.

Wo wir schon bei Fehlern sind: Der Kartenausschnitt wird anhand der Adressdaten ermittelt. Leider ist weder die Adressabdeckung in OpenStreetMap vollständig, noch sind die Adressen der Bahnhöfe im Datensatz der Bahn immer ganz richtig oder vollständig. Dementsprechend kann es passieren, dass man den richtigen Bahnhof auf der Karte erst mal eine Weile suchen muss, bzw. an einem ganz falschen Ort landet. Das ist der Grund warum ich diese ganze Sache nicht vollautomatisch machen will. Durch Handarbeit fallen Fehler eher auf und und tragen so am Ende zur Qualitätssicherung beider Datenquellen bei.

Das Ergebnis dieser Anwendung werde ich dann unter CC-BY veröffentlichen. Da die Zuordnung anonym funktioniert, werde ich aber nicht jeden, der auf einen Bahnhof geklickt hat namentlich nennen können.

Die Anwendung kann auch in einer eigenen Seite geöffnet werden. Da ist dann ein bisschen mehr Platz für die Karte und Zoom per Scrollrad ist aktiviert. Viel Spaß beim Klicken!

Update: Die Sache ist abgeschlossen und das Ergebnis lässt sich hier runterladen. Danke noch mal an alle Teilnehmer.


Ja, ich spreche hier immer von Bahnhöfen. Ich weiß, dass es Bahnhöfe und Haltepunkte sind und es da einen Unterschied gibt, aber das ist für den Artikel und das Tool erstmal reichlich egal.

Veröffentlicht am , Flattr