1. Navigation
  2. Inhalt
  3. Herausgeber
Inhalt

Eingabedatei CSV-Datenstruktur

CSV-Datenstruktur

Das Datenformat der eingegebenen Daten ist CSV.

Allgemeine Hinweise

  • Das Trennzeichen zwischen den einzelnen Spalten ist das Semikolon.
  • In der ersten Zeile müssen die folgenden Spaltenüberschriften zwingend enthalten sein
                           id;ort;ortsteil;plz;strasse;hnr
  • Die Reihenfolge der Spalten ist unbedeutend.
  • Groß- und Kleinschreibung in der Spaltenbezeichnung und in den Daten wird nicht unterschieden.
  • Weitere, durch Semikolon getrennte Spalten [;...]  können enthalten sein. Diese werden bei der Geokodierung nicht betrachtet.
  • Ab Zeile 2 beginnen die eigentlichen Daten.
  • Jeder Datensatz sollte möglichst in allen Spalten die entsprechenden Angaben enthalten. Fehlende Angaben können sich negativ auf das Ergebnis auswirken.
  • Eine leere Spalte wird durch das Aufeinanderfolgen zweier Semikolons gekennzeichnet.
  • Entfernen Sie alle leeren Zeilen (meist am Ende der Textdatei). Diese können zu Fehlern oder ungewollten Effekten führen.
  • Entfernen Sie ggf. vorhandene Leerzeichen am Anfang oder Ende einer Spalte mittels Suchen und Ersetzen. Suchen Sie nach Semikolon und Leerzeichen ("; ") und ersetzen Sie das Muster mit Semikolon (";"). Wiederholen Sie die Suche mit Leerzeichen und Semikolon (" ;") und ersetzen Sie das Muster mit Semikolon.
  • Alle Spalten der Eingabedatei werden in der Ergebnisdatei wieder ausgegeben und mit "_org" gekennzeichnet.

Beschreibung der verpflichtenden Spalten

Spaltenname Beschreibung
id Identifer: Das kann eine Datenbank-ID sein oder eine einfache Zahl, die beim Durchnummerieren der Zeilen vergeben wird. Innerhalb der Tabelle ist sie eindeutig.
ort Ortsbezeichnung: Der Name soll die postalische Bezeichnung des Ortes oder die amtliche Bezeichnung der Gemeinde enthalten. Bei Verwendung des Gemeindenamens sollten die enthaltene Zusätze erhalten bleiben. Beispiel: Gelenau/Erzgeb.
ortsteil Ortsteilname: Die Angabe ist hilfreich, sobald ein Straßenname innerhalb einer Gemeinde mehrfach existiert.
plz Postleitzahl: 5-stellig. Bitte achten Sie auf die führende Null.
strasse Straßenname: Der Name soll die vollständige Bezeichnung enthalten. Abweichende Abkürzungen sollten nicht verwendet werden. (Ausnahme: "Str.", "Dr.-", "Prof.-")
hnr Hausnummer: Geben Sie hier die amtliche Hausnummer an. Zusätze in Form von Buchstaben folgen unmittelbar nach der Zahl (ohne Leerzeichen).
Die Angabe von Hausnummernbereichen wie bspw. 1-3 oder 1,2,3 sind nicht zulässig. Gleiches gilt auch für Zusätze wie Hinterhaus, Haus, HH, etc.

Beispiel:

id;ort;ortsteil;plz;strasse;hnr
1;Dresden;;01099;Olbrichtplatz;2
2;dresden;;01067;Dr.-Külz-Ring;19a

 

Hinweise zu Daten aus Excel

  • Achten Sie darauf, dass keine Zeilenumbrüche in den Zellen enthalten sind. Diese zerstören die Datenstruktur der CSV-Datei. Wie Sie Zeilenumbrüche automatisch entfernen können finden Sie im Netz, bspw. hier.
  • Beachten Sie, dass im Feld plz überall die führende Null enthalten ist! Passen Sie ggf. das Zellenformat auf Text an.
  • Speichern Sie die Datei unter dem Dateityp CSV (Trennzeichen-getrennt) (*.csv) ab.

 

Textkodierung (Encoding)

Damit Umlaute und Sonderzeichen richtig behandelt werden können, ist es wichtig, die richtige Textkodierung (Encoding) zu verwenden. Die Standardeinstellung ist die ANSI-Textcodierung, so wie sie standardmäßig von Excel wendet wird. Sind Sie sich unsicher oder werden in der Ergebnisdatei die Umlaute als "Schmierzeichen" dargestellt, prüfen Sie die Art des Textformates Ihrer CSV-Datei sicherheitshalber. Diese kann bspw. mit notepad++ ermittelt werden, indem Sie die "Datei laden" und danach das Menü "Encoding" (Kodierung) öffnen. Alternativ kann auch der Editor (Windows-Standard-Software) verwendet werden. Über das Menü "Datei" --> "Speichern unter" kann im Feld "Codierung" die verwendete Textkodierung abgelesen werden.

Bei der Verwendung von ANSI-kodierten Ausgangsdaten kann es bei der Verarbeitung einzelner Zeichen (z.B. &) zu Problemen kommen. Wir empfehlen daher die Verwendung des Encoding UTF-8.

Mit notepad++ können Sie die Textkodierung Ihrer Daten ganz leicht von ANSI nach UTF-8 konvertieren.

Bei der Verwendung des Editors stellen Sie die Textcodierung ein wie im nachfolgenden Bild dargestellt.

 

Sollten Sie anstelle der Standard-Einstellung ANSI die Kodierung UTF-8 verwenden, so stellen Sie das bei Encoding der Eingabedatei um.

 

Beispieldatei

Hier können Sie sich ein Muster einer CSV-Eingabedatei herunterladen.

Wir empfehlen Ihnen, die Datei mit einem Texteditor (z.B. Windows-Standard Editor oder notepad++) zu öffnen. Falls sich auf Grund Ihrer Einstellungen Excel automatisch öffnen sollte, empfehlen wir Ihnen die Datei zunächst auf Ihrem Rechner zu speichern. Gehen Sie dazu mit dem Mauscursor auf den Link und wählen im Kontextmenü der rechten Maustaste Ziel speichern unter.

Marginalspalte

© Staatsbetrieb Geobasisinformation und Vermessung Sachsen (GeoSN)