Website-Icon Björn Walther

Pakete für R suchen und finden

Das Grundproblem Pakete zu finden

Das Finden von Paketen für spezielle Fragestellungen in R gestaltet sich manchmal recht schwierig. Zu häufig findet man nur über Hörensagen oder Forendiskussionen mal ein hilfreiches Paket. Ab und an wird auch mal eine hilfreiche Funktion in einem Buch erwähnt. Alles in allem ist eine strukturierte Suche mit ein paar Zusatzinfos bisher weniger komfortabel

 

Packagefinder schafft Abhilfe

Ironischerweise braucht es ein Paket, um gezielt weitere Pakete zu finden. Hier kommt packagefinder ins Spiel. Wie gewohnt wird dies mit install.packages() installiert und mit der library()-Funktion geladen.


install.packages("packagefinder")
library(packagefinder)

Anschließend kann die volle Funktionalität genutzt werden. Die wichtigste Funktion aus dem Paket packagefinder ist fp() – fp steht für find package.

 

Suchergebnisse im Viewer vom RStudio

Ein einfaches Stichwort wird in Anführungszeichen in fp() gegeben, z.B. “Regression“.


fp("Regression")

Im Anschluss wird das komplette CRAN mit knapp 19.000 Paketen nach diesem Stichwort durchsucht. Dazu werden Titel, Kurzbeschreibung und Langbeschreibung der Pakete durchsucht und in RStudio im Viewer geordnet nach einem Score ausgegeben. Je höher der Score, desto größer die Übereinstimmung in Titel, Kurz- und Langbeschreibung.

 

 

In der Ausgabe wird neben dem Score noch der Paketname und die Kurzbeschreibung angegeben. Ganz rechts steht der GO-Code, mit dem man zusätzlich das Handbuch vom CRAN anfordern oder die Webseite der Autoren (sofern vorhanden) besuchen kann.


go(15552, "website")
go(15552, "manual")

 

Suchergebnisse im Browser (Empfohlen!)

Wie es der Titel bereits verrät, ist dies die von mir empfohlene Variante der fp()-Funktion.
Ein besonders hilfreiches Argument innerhalb von fp() ist display=”browser”.


fp("regression", display="browser")

Hier öffnet sich der Browser mit weiteren Informationen zu den Suchergebnissen. Neben dem Score und der Kurzbeschreibung wird auch noch die Langbeschreibung gelistet. Die Anzahl der Downloads gibt auch Aufschluss darüber, wie beliebt oder etabliert das Paket ist. Die Links daneben führen zur PDF-Dokumentation auf CRAN, einer Überblicksseite auf CRAN sowie einer vorgefertigten Google-Suche zum Paket.

 

Besonders hilfreich ist der Button “Copy”, der den Installationscode für R in die Zwischenablage legt und in R direkt verwendet werden kann (z.B. install.packages(“SIMPLE.REGRESSIO“”, dependencies = TRUE). Hiermit werden zusätzliche s#mtliche Pakete mitinstalliert, auf die das jeweilige Paket zugreift.

 

Mehr als 1 Stichwort verwenden

Innerhalb von fp() werden mit c() die zwei oder mehr Stichwörter in Anführungszeichen gesetzt. Ein wichtiges Zusatzargument ist mode=““. Mit mode=“and“ müssen alle Stichwörter in der Suche beachtet werden. Mit mode=“or“ wird mindestens eins der Stichwörter in den Suchergebnissen beachtet.


fp(c("regression", "power"), mode="and", display="browser")
fp(c("regression", "power"), mode="or", display="browser")

 

Videotutorial

https://www.youtube.com/watch?v=6d-sG_Oqz2o

 

Die mobile Version verlassen