Zum Inhalt springen

GNU R: Einleitung

Aus Wikibooks

Was ist R?

[Bearbeiten]

Dieses Buch führt in das Programm R ein. R steht dabei für The R Project for Statistical Computing.

  • R ist eine Software zur statistischen Datenverarbeitung, sowie deren grafischer Darstellungen (Visualisierung).
  • R ist eine Umsetzung der statistischen Programmiersprache S.
  • R läuft unter diversen UNIX-, Linux- und Unix-ähnlichen Betriebsystemen, sowie auf Windows und Mac OS X. Ältere R-Versionen sind auch noch für das klassische Mac OS verfügbar. Für viele Betriebssysteme gibt es bereits kompilierte Pakete.
  • Die Sprache kann leicht durch neue Funktionen erweitert werden.
  • Eine große Anzahl von existierenden Zusatzpaketen ergänzen die R-Funktionalität um Methoden aus Spezial- und Anwendungsbereichen der Statistik.
  • R kann mit anderen Programmiersprachen wie GRASS, Perl, Python, C oder Java verbunden werden.
  • R kann sowohl interaktiv, also im Einzelbefehlsmodus, als auch als Skriptsprache und im Batch-Modus verwendet werden.
  • Der R-Quelltext wird unter der GNU General Public License (GPL) der Free Software Foundation veröffentlicht.


Die Homepage von R lautet http://www.r-project.org


Zusätzliche Skripte zur Einführung in R können im Internet kostenfrei abgerufen werden (z.B. Handl 2006). Des Weiteren stehen diverse (meist englischsprachige) Internetseiten (z.B. Das R Wiki) sowie Publikationen (siehe Literatur) zum Thema R zur Verfügung.

Warum ?

[Bearbeiten]
  • Neben gängigen Programmen zur statistischen Auswertung, wie beispielsweise „SPSS“ oder „STATA“, bietet den Vorteil, dass es auf der ganzen Welt kostenlos (unter der freien GNU-Lizenz) zur Verfügung steht.
  • kann die meisten gängigen Formate importieren, gewährleistet volle Kontrolle über die Daten und bietet ein verlässliches, quelloffenes Format für erstellte Datensätze.
  • Darüber hinaus stellt z.T. mächtigere und mehr Auswertungsverfahren zur Verfügung als andere Programme.
  • ist eine Programmierumgebung. Funktionen können bequem den eigenen Bedürfnissen angepasst werden. Komplexe Probleme lassen sich auch dann lösen, wenn die Entwickler diese (noch) nicht implementiert haben.
  • wird von der Scientific Community kontinuierlich weiterentwickelt und erweitert. Neue statistische Verfahren werden in der Regel auch in integriert. Ein standardisiertes Pakete-System erleichtert die Nachinstallation ebenso wie die Veröffentlichung eigener Pakete.
  • erstellt professionelle Graphiken in einer Vielzahl an Formaten.
  • ist auch eine funktionierende Benutzer- und Entwickler-Gemeinschaft, die für Fragen offen ist und so den Einstieg erleichtert.
  • kann systemübergreifend auf verschiedenen Plattformen genutzt werden.
  • verfügt über äußerst flexible Schnittstellen der Daten-Ein- und -Ausgabe und kann mit verschiedenen anderen Applikationen zusammenarbeiten.
  • kann in einem Batch-Mode zur automatisierten Auswertung und Dokumenterstellung verwendet werden und lässt sich auch in Webserver / dynamische Websites integrieren.
  • ist trotz graphischer Benutzeroberflächen textbasiert. Im Zentrum steht nicht Design, sondern Funktion.

Was spricht gegen ?

[Bearbeiten]
  • Für den Anfänger ist die Funktionsweise und Bedienung von R zweifellos gewöhnungsbedürftig.
  • Bei der Programmierung in R fällt im Vergleich mit modernen Sprachen auf, dass Einiges in unerwarteter Weise funktioniert.
  • Bestimmte Grundverfahren (z. B. Modus/Modalwert) sind zur Zeit nur umständlich oder gar nicht implementiert.

Literatur

[Bearbeiten]

Mit folgender Literatur haben wir einen guten Einstieg in R gefunden:

  • Günter Faes (2007): "Einführung in R, Ein Kochbuch zur statistischen Datenanalyse mit R", BoD, ISBN 9783833491849
  • Dubravko Dolic (2003): „Statistik mit R. Einführung für Wirtschafts- und Sozialwissenschaftler“, Oldenbourg, ISBN 3486275372


Inhaltsverzeichnis

[Bearbeiten]