Website-Icon Björn Walther

Daten in R sortieren


In R kann man den Datensatz anhand einer Variable sortieren. Eine mehrstufige Sortierung ist ebenso möglich. Dies kann im Vorfeld einer Analyse zur visuellen Prüfung des Datensatzes verwendet werden oder aber auch zum Export nach der Sortierung.
R bietet zudem die Möglichkeit, verschiedene Sortierverfahren anzuwenden, die bei sehr großen Datensätzen schneller sind. Dies fällt im typischen Anwendungsfall nicht ins Gewicht, weshalb dies hier nicht weiter thematisiert wird.

1 Einfaches Sortieren

1.1 Aufsteigende Sortierung

Das einfache oder einstufige Sortieren ist der Standardfall in R.


# Bisherigen Data Frame sortieren
df <- df[order(df$Sportnote),]
# Neuen Data Frame erstellen und diesen sortieren
df2 <- df[order(df$Sportnote),]

 

1.2 Absteigende Sortierung

Um statt der standardmäßigen aufsteigenden Sortierung absteigend zu sortieren, wird vor die zu sortierende Variable einfach ein "-" gesetzt.


# Absteigend nach Sportnote sortieren
df <- df[order(-df$Sportnote),]

 

2 Mehrstufiges Sortieren

Das Ziel des mehrstufigen Sortierens ist zunächst nach einer Variable zu sortieren und anschließend innerhalb dessen nach einer anderen Variable. Beispiel: Es wird aufsteigend nach Sportnote sortiert und dann absteigend nach Körpergewicht. Jede weitere Variable wird einfach per Komma hinter die anderen Variablen gesetzt. Die vorderste Variable in der Funktion ist die erste Stufe, nach der sortiert wird.


# Absteigend nach Sportnote, aufsteigend nach Gewicht sortieren
df <- df[order(-df$Sportnote, df$Gewicht),]

Eine mehrstufige Sortierung kann beliebig viele Stufen beinhalten. Allerdings sollten zwei Dinge beachtet werden:

 

3 Videotutorial

https://www.youtube.com/watch?v=142-MkfUrVk/

 

Die mobile Version verlassen