R für Dummies. Andrie de Vries
Variablen betrachten, die Sie erzeugt haben. (Wir beschreiben den Arbeitsbereich detailliert weiter hinten in diesem Kapitel.) Darüber hinaus können Sie hier die Historie Ihrer R-Anweisungen durchgehen.
Files, Plots, Packages und Help: Rechts unten befindet sich ein Fenster mit verschiedenen Registerkarten:Files: Hier können Sie die Dateien und Verzeichnisse Ihres Computers durchsuchen. Plots: Hier zeigt R Ihre Grafiken (Diagramme und Bilder) an; mehr dazu in Teil V dieses Buchs. Packages: Hier können Sie eine Liste aller installierten Pakete (englisch packages) ansehen. Ein Paket ist eine in sich abgeschlossene Sammlung von Funktionen und Daten, die den Funktionsumfang von R erweitert. Sie können sich das vorstellen wie die Add-ins bei Excel. Help: Hier können Sie die R-Hilfeseiten betrachten.Viewer: Hier zeigt RStudio eine Vorschau von verschiedenen fortgeschrittenen Ansichten wie beispielsweise Webseiten oder Präsentationen, die sich mit R und entsprechenden Zusatzpaketen erstellen lassen.
Ihre erste R-Sitzung starten
Wenn Sie so ähnlich gestrickt sind wie wir, juckt es Sie wahrscheinlich in den Fingern, endlich mal richtigen Code zu schreiben, und in diesem Abschnitt passiert genau das. Jetzt machen wir uns die Hände schmutzig!
Der Welt Hallo sagen
Programmierbücher fangen typischerweise mit einem sehr einfachen Programm an. Allzu häufig ist das Einzige, was das Programm kann, die Meldung "Hallo Welt!"
anzuzeigen. In R besteht dieses Programm aus einer Codezeile.
Beginnen Sie eine neue R-Sitzung, geben Sie das Folgende in die Konsole ein und bestätigen Sie mit der
-Taste:
> print("Hallo Welt!")
R reagiert umgehend mit dieser Ausgabe:
[1] "Hallo Welt!"
Herzlichen Glückwunsch! Sie haben gerade Ihr erstes R-Skript geschrieben.
Wie bereits in der Einleitung erwähnt, verbinden wir die beiden Elemente (Eingabe und Ausgabe) zu einem zusammenhängenden Block:
> print("Hallo Welt!")
[1] "Hallo Welt!"
Einfache Berechnungen durchführen
Geben Sie das Folgende in die Konsole ein, um die Summe aus fünf Zahlen zu berechnen :
> 1+2+3+4+5
[1] 15
Die Antwort ist 15, wie Sie leicht nachrechnen können. Womöglich denken Sie, es müsse doch einen einfacheren Weg geben, die Summe dieser Zahlenreihe zu berechnen – und Sie hätten recht. Wie das genau geht, sehen wir uns im nächsten Abschnitt an.
Vektoren verwenden
Ein Vektor ist die einfachste Datenstruktur in R. Im R-Handbuch ist ein Vektor als »einzelnes Objekt, das aus einer Ansammlung von Dingen besteht« definiert. Eine Ansammlung von Zahlen ist beispielsweise ein numerischer Vektor – die ersten fünf ganzen Zahlen bilden demnach einen numerischen Vektor der Länge 5.
Um einen Vektor zu erzeugen, geben Sie Folgendes in die Konsole ein:
> c(1,2,3,4,5)
[1] 1 2 3 4 5
Beim Erzeugen dieses Vektors haben Sie bereits erfolgreich eine Funktion in R verwendet. In der Programmierersprache ist eine Funktion ein Stück Code, das Eingaben erwartet und dann mit diesen Eingaben etwas vorher Definiertes anstellt. Beim Konstruieren des Vektors weisen Sie die Funktion c()
an, einen Vektor mit den ersten fünf ganzen Zahlen zu erzeugen. Die Angaben innerhalb der Klammern werden als Argumente bezeichnet.
Sie können einen Vektor auch mithilfe von Operatoren erzeugen. Ein Operator ist ein Symbol, das Sie zwischen zwei Werte setzen, um eine Aktion mit den beiden Werten durchzuführen. Die Symbole +
, -
, *
und /
sind allesamt Operatoren für die vier Grundrechenarten und bedeuten dasselbe wie in der Mathematik. Wenn Sie also 1+2
in R eingeben, erhalten Sie erwartungsgemäß 3
zurück.
Ein weiterer, sehr hilfreicher Operator ist der Sequenzoperator (von englisch sequence). Er sieht wie ein Doppelpunkt (:) aus. Geben Sie bitte das Folgende in die Konsole ein:
> 1:5
[1] 1 2 3 4 5
Das sieht schon eher aus wie R. Mit drei Tastendrücken haben Sie einen Vektor mit den Werten 1
bis 5
erzeugt. Die Summe der Elemente des Vektors erhalten Sie so:
> sum(1:5)
[1] 15
Auch wenn dies ein sehr einfaches Beispiel ist, zeigt es deutlich, dass Sie mit wenig Code komplexe Operationen durchführen können. Da Vektoren die kleinste mögliche Dateneinheit in R darstellen, werden wir uns später ausführlich mit ihnen beschäftigen.
Werte zuweisen und berechnen
Natürlich können Sie R einfach als Taschenrechner benutzen, und das war's. Möglicherweise reizen Sie es dann jedoch nicht ganz aus. Richtig nützlich wird R durch seine Fähigkeit, Werte zu speichern und mit diesen gespeicherten Werten Berechnungen durchzuführen.
Probieren Sie Folgendes:
> x <- 1:5
> x
[1] 1 2 3 4 5
In diesen zwei Zeilen weisen Sie zunächst die Folge 1:5
einer Variablen namens x
zu. Anschließend weisen Sie R an, Ihnen den Inhalt von x
anzuzeigen, indem Sie x
, gefolgt von der
Der Zuweisungsoperator lautet in R
<-
. Diesen geben Sie in R mit zwei Tasten ein: der »Kleiner«-Taste (<
) und der »Bindestrich«-Taste (-
). Die Kombination beider Zeichen ergibt den Zuweisungsoperator. Es ergibt aus Gründen der Übersichtlichkeit Sinn, vor und nach dem Zuweisungsoperator Leerzeichen zu verwenden.
Neben dem Anzeigen des Werts einer Variablen können Sie auch Berechnungen damit ausführen. Erzeugen Sie eine zweite Variable mit dem Namen y
und weisen Sie ihr den Wert 10
zu. Anschließend addieren Sie x
und y
, etwa so:
> y <- 10
> x + y
[1] 11 12 13 14 15
Die Werte der beiden Variablen verändern sich durch diese Operation nicht, es sei denn, Sie weisen ihnen einen neuen Wert zu. Das können Sie leicht überprüfen:
> x
[1] 1 2 3 4 5
> y
[1] 10
Erzeugen Sie jetzt eine neue Variable z
, weisen Sie ihr den Wert von x+y
zu und lassen Sie sich den Wert von z