1 Die Grundidee von Variablen filtern
Neben dem Ausschließen bzw. Filtern von Fällen, kann es mitunter notwendig oder wünschenswert sein, Variablen auszuwählen oder auszuschließen – beides wird gezeigt. Ein Datensatz, der 200 Variablen hat, von denen mich nur 20 interessieren, wäre so ein typischer Anwendungsfall.2 Zwei Möglichkeiten: Variablen “behalten” und Variablen entfernen
Generell empfehle ich, mit sog. subsets zu arbeiten, was auch für das Filtern von Fällen anhand bestimmter Variablenausprägungen funktioniert.Man hat prinzipiell die Möglichkeit entweder a) nur bestimmte Variablen aus einem Ausgangsdatensatz zu entnehmen bzw. zu verwenden. Oder b) man entfernt Variablen aus einem Ausgangsdatensatz. Je nachdem, was weniger Schreibaufwand ist, kann die eine oder andere Vorgehensweise angewandt werden.
2.1 Zu behaltende Variablen benennen
data1 <- subset(data, select=c(Alter, Geschlecht, Größe, Gewicht))
Das Ergebnis ist nun ein Datensatz, der nur noch aus den Variablen Alter, Geschlecht, Größe und Gewicht besteht. Alle anderen Variablen sind im neuen Datensatz bzw. Data Frame "data1" nicht mehr enthalten.
2.2 Zu entfernende Variablen benennen
data2 <- subset(data, select=c(-Alter, -Geschlecht, -Größe, -Gewicht))
Im Beispiel übernehme ich alle Variablen aus dem Datensatz, bis auf Alter, Geschlecht, Größe und Gewicht, um z.B. keine personenbezogenen Daten und damit verbundene Rückschlüsse ziehen zu können.