Website-Icon Björn Walther

Violinen-Plot in R erstellen

Ein Violinen-Plot, auch Geigen-Plot genannt, dient zur Darstellung der Verteilung einer Variable. Auf den ersten Blick ähnlich zum Boxplot, ist es aber aufschlussreicher, da es die Dichte der Verteilung darzustellen vermag. Dieser Beitrag zeigt die Erstellung des Geigen-Plots mittels des Paketes ggplot2.

Grundlagen

Ein Violinen-Plot kann für eine Variable, wahlweise auch unterteilt nach Gruppen erstellt werden. Ich zeige nachfolgend beide Wege für die Variable Abiturschnitt in meinem Datensatz (Artikel zum Einlesen von Daten).

Sollte das Paket “ggplot2” noch nicht installiert sein, wird es mit install.packages() installiert und mit und library() geladen.


install.packages("ggplot2")
library(ggplot2)

 

Violinen-Plot zeichnen

Einfacher Violinen-Plot

Zunächst wird mti dem Befehl ggplot() begonnen und mit dem aes()-Argument die abzutragende Variable (hier Abiturschnitt) als x-Variable festgelegt. y=”” wird nur eingefügt, weil es kein gruppiertes Violionen-Plot werden soll. Entscheidend ist dann die Funktion geom_violion(). Das trim-Argument ist nicht zwingend notwendig. Es trimmt die Enden der Verteilung entsprechend auf die Spannweite der Daten. Ich habe es mit trim=FALSE allerdings deselektiert.


ggplot(data_xls, aes(x=Abischni, y=""))+
  geom_violin(trim=TRUE)

 

Gruppierter Violinen-Plot

Hier ist es zunächst notwendig, dass die Variable, welche die Gruppe definiert, als Faktor hinterlegt ist. Typischerweise sind numerische Gruppenvariablen als solche auch nur in R hinterlegt. Demzufolge wird meine Variable “Motivat” zunächst faktorisiert, damit anschließend damit gearbeitet werden kann.


data_xls$Motivat <- as.factor(data_xls$Motivat)

Nun wird das Violinen-Plot ähnlich zu oben gezeichnet. Allerdings wird die y-Variable nun mit der Gruppenvariable definiert. Zusätzlich muss das fill-Argument ebenfalls mit der Gruppenvariable definiert werden.:


ggplot(data_xls, aes(x=Abischni, y=Motivat, fill=Motivat))+
  geom_violin(trim=FALSE)

 

Violinen-Plot drehen

Zum Drehen im rechten Winkel wird die coord_flip()-Funktion genutzt:


ggplot(data_xls, aes(x=Abischni, y=Motivat, fill=Motivat))+
  geom_violin(trim=FALSE)+
  coord_flip()

 

Achsen des Violinen-Plot beschriften

Um die Achsen korrekt zu beschriften, verwendet man die labs()-Funktion mit den Argumenten y und x:


ggplot(data_xls, aes(x=Abischni, y=Motivat, fill=Motivat))+
  geom_violin(trim=FALSE)+
  coord_flip()+
  labs(y="Motivation", x="Abiturschnitt")

 

Grafische Anpassungen

Einige wenige grafische Änderungen am Geigen-Plot kann man noch vornehmen. Mit dem Befehl theme_minimal() oder theme_bw() kann das Diagramm etwas nüchterner gestaltet werden


ggplot(data_xls, aes(x=Abischni, y=Motivat, fill=Motivat))+
  geom_violin(trim=FALSE)+
  coord_flip()+
  labs(y="Motivation", x="Abiturschnitt")+
  theme_bw()

 

Ein weiterer hilfreicher Befehl ist scale_fill_brewer(). Hier kann z.B. mit palette=”Blues” oder palette=”Greens” ein Farbverlauf angewendet werden.


ggplot(data_xls, aes(x=Abischni, y=Motivat, fill=Motivat))+
  geom_violin(trim=FALSE)+
  coord_flip()+
  labs(y="Motivation", x="Abiturschnitt")+
  theme_bw()+
  scale_fill_brewer(palette = "Blues")


 

Weitere Argumente für scale_fill_brewer()(kopiert aus der Dokumentation):

 

Videotutorial

https://www.youtube.com/watch?v=aWjW-YtK7aI/

 

Beispieldatensatz zum Download

 

Die mobile Version verlassen