R für Dummies. Andrie de Vries
395
375 397
376 398
377 399
378 400
379 401
380 402
381 403
382 404
383 405
384 406
385 407
386 408
387 409
388 410
389 411
390 412
391 413
392 414
393 415
394 416
395 417
396 418
397 419
398 420
399 421
400 422
401 423
402 424
403 425
404 426
405 427
406 428
407 429
408 430
409 431
Einleitung
Willkommen bei R für Dummies, dem Buch, das die Lernkurve für die Statistik- und Programmiersprache R zu einem aufregenden Erlebnis ähnlich der Nordkurve macht.
Wir garantieren keineswegs, dass Sie nach der Lektüre dieses Buchs ein R-Guru sind, die folgenden Dinge werden Sie allerdings auf jeden Fall beherrschen:
Sie führen Datenanalysen mit verschiedenen leistungsstarken Werkzeugen durch.
Sie benutzen R für statistische Analysen sowie andere Daten verarbeitende Aufgaben.
Sie lernen die Schönheit vektorbasierter Operationen im Vergleich zur Verwendung von Schleifen schätzen.
Sie verstehen die Bedeutung folgender Codezeile: knowledge <- apply(theory, 1, sum)
Sie wissen, wie Sie Code von Mitgliedern der R-Gemeinde und anderen Entwicklern finden, herunterladen und einsetzen können.
Sie wissen, wo Sie zusätzliche Hilfe und Ressourcen erhalten, um Ihre Fähigkeiten noch weiter auszubauen.
Sie erzeugen wundervolle Grafiken und Visualisierungen Ihrer Daten und Ergebnisse.
Über dieses Buch
R für Dummies ist eine Einführung in die statistische Programmiersprache R. Wir beginnen zunächst mit der Benutzeroberfläche und arbeiten uns dann von ziemlich einfachen Konzepten der Sprache vor bis zu schon recht anspruchsvollen Themen der Datenverarbeitung und -analyse.
Jeder Schritt wird von einfach durchzuführenden Beispielen begleitet. Dieses Buch enthält zahlreiche Codeausschnitte, einige Baukastenfunktionen, die Sie später weiterverwenden können, sowie komplette Analyseskripte. All das hat im Wesentlichen einen Zweck: Sie sollen es selbst ausprobieren.
Wir versuchen erst gar nicht, eine technische Beschreibung zu unternehmen, wie R selbst programmiert wurde. Davon abgesehen sollen sich unsere Ausführungen, wie etwas funktioniert, in etwa die Waage halten mit den Gründen, warum das so funktioniert. R ist keine durchschnittliche Skriptsprache und hat einige Eigenschaften, die auf den ersten Blick überraschen mögen. Anstatt Ihnen einfach nur zu erzählen, wie Sie mit R sprechen sollen, glauben wir schon, dass es wichtig ist, Ihnen zu verraten, wie R Ihre Eingaben liest und interpretiert. Nachdem Sie dieses Buch gelesen haben, sollten Sie in der Lage sein, Daten in der von Ihnen gewünschten Form zu verarbeiten und Funktionen zu verwenden, die wir in diesem Buch nicht vorgestellt haben (die wir vorgestellt haben, möglichst auch).
Dieses Buch ist als Referenz gedacht. Sie müssen es nicht von Anfang bis Ende lesen. Stattdessen können Sie einfach das Inhaltsverzeichnis und das Stichwortverzeichnis nutzen, um die Informationen, die Sie brauchen, zu finden. In jedem Kapitel verweisen wir auf andere Kapitel, in denen Sie weitere Informationen finden.
Änderungen der zweiten Auflage
Seit der Publikation der ersten Auflage hat sich R kontinuierlich weiterentwickelt und verbessert. Um die Korrektheit des Buchs zu gewährleisten, haben wir den Code entsprechend der letzten Version von R (Version 3.4.1) angepasst. Basierend auf dem Feedback von Lesern, Studenten und Kollegen konnten wir einige Abschnitte überarbeiten und so Fragen klären und Ungenauigkeiten beheben. Beispielsweise haben wir den Code dahin gehend geändert, dass wir nun hochgestellte Gänsefüße statt Hochkommata innerhalb von Text-Strings verwenden. Auch bezeichnen wir jetzt die Basiseinheiten von Listen als Komponenten statt Elementen.
Änderungen der dritten Auflage
Die dritte Auflage des Buchs basiert auf der R-Version 4.0.4, die im Februar 2021 veröffentlicht wurde. Falls sich geänderte und neue Features auf die Themen und Beispiele auswirken, die im Buch vorgestellt werden, dann wurden Text und Code entsprechend angepasst.
Das aktuelle rfordummies
-Paket enthält die Codebeispiele aus dem Buch. Sie können alles Weitere über das Paket in Anhang B erfahren.
R und RStudio
R für Dummies kann mit jedem Betriebssystem verwendet werden, auf dem R läuft. Ob Sie macOS, Linux oder Windows nutzen, mit diesem Buch bringen wir Sie auf den Weg mit R.
R ist mehr eine Programmiersprache als ein Anwendungsprogramm. Wenn Sie R herunterladen, laden Sie auch eine Konsolenanwendung herunter, die zu Ihrem Betriebssystem passt. Erwarten Sie jedoch keine Wunder: Die Funktionalität ist sehr eingeschränkt und variiert zwischen den einzelnen Betriebssystemen.
RStudio ist eine Plattform-übergreifende Anwendung, auch benannt als Integrated Development Environment (IDE), mit einigen sehr netten Eigenschaften in Bezug auf R. Dieses Buch setzt zwar keine spezielle Konsolenanwendung voraus. Da RStudio jedoch eine über alle Betriebssysteme einheitliche Anwendung ist, glauben wir, dass Sie es schnell zum Laufen bekommen. Daher nutzen wir lieber RStudio als den uneinheitlichen Editor, um die Konzepte im Buch vorzustellen.
Konventionen in diesem Buch
Codeausschnitte erscheinen wie in dem folgenden Beispiel, indem wir eine Million Würfe zweier sechsseitiger Würfel simulieren:
> set.seed(42)
> throws <- 1e6
> dice <- sapply(1:2,
+ function(x) sample(1:6, throws, replace = TRUE)
+ )
> table(rowSums(dice))
2 3 4 5 6 7 8 28007 55443 83382 110359 138801 167130 138808 9 10 11 12 110920 83389 55816 27945
Jede