Inhaltsverzeichnis

CSV-Dateien einlesen

Was sind CSV-Dateien?

Das Dateiformat CSV (Comma Separated Values) dient zur Speicherung und zum Austausch einfach strukturierter Daten. Sie können Daten in übliche Tabellenkalkulationsprogramme (z.B. MS Excel, LibreOffice Calc) eingeben und im Dateiformat CSV speichern. Da es sich bei CSV-Dateien um einfache Textdateien handelt, können Sie diese auch mit jedem normalen Texteditor (Windows: Editor/Notepad; macOS: TextEdit) bearbeiten (aber besser nicht mit Textverarbeitungsprogrammen!)

Zum Beweis, dass CSV-Dateien keine auf Statistik-Lehrveranstaltungen beschränkte Exoten sind: Auch die Einzelverbindungsgnachweise eines großen österreichischen Mobilfunkanbieters können Sie als CSV-Datei herunterladen:
Dabei lernen wird auch gleich etwas Wichtiges: CSV-Dateien können verschieden aufgebaut sein. Die wichtigen Fragen sind: Was wird als Dezimalzeichen verwendet, das Komma oder der Punkt (z.B. 1,5 oder 1.5), und was wird als Spaltentrennzeichen verwendet (z.B. Strichpunkt ; oder Komma ,)?

  • In englischsprachigen Ländern ist ein Dezimalpunkt üblich, in deutschsprachigen Ländern ein Dezimalkomma.
    So gut wie alle Programmiersprachen und auch "R" verwenden einen Dezimalpunkt.
  • Wenn Sie auf einem PC mit deutschsprachiger Ländereinstellung aus der Tabellenkalkulation im CSV-Format speichern, wird als Dezimalzeichen üblicherweise das Komma und als Spaltentrennzeichen üblicherweise ein Strichpunkt (Semikolon) verwendet.
  • Wenn Sie auf einem PC mit englischsprachiger Ländereinstellung aus der Tabellenkalkulation im CSV-Format speichern, wird als Dezimalzeichen üblicherweise der Punkt und als Spaltentrennzeichen üblicherweise ein Komma verwendet.
  • Beim Importieren müssen Sie wissen, welche Zeichen wofür verwendet werden, damit "R" die Daten richtig konvertieren kann. Wenn Sie es nicht wissen, öffnen Sie die CSV-Datei mit einem Texteditor (Windows: z.B. Editor/Notepad; macOS: z.B. TextEdit) und SEHEN SIE NACH!

Sehen wir uns das an folgender Beispieldatei an: roggenversuch.csv

Links sehen Sie die Datei in einem Tabellenkalkulationsprogramm geöffnet, rechts sehen Sie die gleiche Datei in einem Texteditor geöffnet:

Import einer CSV-Datei mit dem R Commander

Zum Importieren einer CSV-Datei wählen Sie Menüpunkt 'Datenmanagement' > 'Importiere Daten' > 'aus Textdatei, Zwischenablage oder URL …'

An dieser Stelle ist es wichtig zu wissen, wie die CSV-Datei tatsächlich aufgebaut ist, also was als Dezimalzeichen und was als Spaltentrennzeichen / Datenfeldtrennzeichen verwendet wird.
Wenn Sie es nicht sicher wissen, öffnen Sie die CSV-Datei mit einem Texteditor (Windows: z.B. Editor/Notepad; macOS: z.B. TextEdit) und sehen Sie nach!

beziehungsweise

Wichtig: sehen Sie sich mit 'Datenmatrix betrachten' an, ob die Daten tatsächlich korrekt interpretiert wurden. Im Beispiel sehen Sie, dass das Dezimalkomma richtig in einen Dezimalpunkt konvertiert wurde.

Wichtig:
Kontrollieren Sie nach einem Import IMMER mit 'Datenmatrix betrachten', ob die Werte tatsächlich so aussehen, wie Sie sich das vorgestellt haben!

Vergleichen Sie alle Werte nochmals mit Ihrer Angabe, das erspart Ihnen später eine Menge Zeit, Mühe, Nerven.


Wie geht es nun weiter?