moinsen,
in meiner abschlussarbeit befindet sich ein recht großer teil statistik, genauer genommen multivariate datenanalyse (PCA, LDA und exotisches zeugs).
nun arbeite ich eigentlich mit matlab, bin aber zufällig auf R gestoßen. ich frage mich nun, ob es sinnvoll ist, diese sprache auch irgendwie zu verwenden, da sie auf den ersten blick viel mehr vorgefertigte funktionen in dem gebiet mitbringt als matlab.
bei matlab müsste ich quasi alles "from the scratch" selber schreiben. eigentlich wäre selber programmieren fürs verständnis besser, aber mit R könnte man (vermutlich) mehr ausprobieren und ich steh eher auf ergebnisse und praxis als auf formeljongliererei.
kennt hier jemand R oder vergleichbare statistische sprachen? was würdet ihr mir empfehlen? bei matlab bleiben? R lernen?
zeit übrig: bis ende september
Willkommen im #Neuland
Login wie bei quake.ingame.de zuvor, die Passwörter aus der alten Datenbank wurden aber gelöscht - einmal hier neu anfordern.
Wer seine E-Mail-Adresse nicht mehr hat oder kennt, bitte eine Nachricht mit Infos schicken o. im Discord melden.
PQ Discord Server: #planetquake Spenden? Hier entlang!
Login wie bei quake.ingame.de zuvor, die Passwörter aus der alten Datenbank wurden aber gelöscht - einmal hier neu anfordern.
Wer seine E-Mail-Adresse nicht mehr hat oder kennt, bitte eine Nachricht mit Infos schicken o. im Discord melden.
PQ Discord Server: #planetquake Spenden? Hier entlang!
Bachelorthesis: Statistische Sprachen und Matlab
-
- Rampage
- Beiträge: 14303
- Registriert: Jun 2001
- Steam: TomHonks
-
- Klesk
- Beiträge: 714
- Registriert: Feb 2005
Wir haben R dieses Semester in der Vorlesung zur Elementaren Stochastik verwendet. Die Syntax ist etwas gewöhnungsbedürftig und man kann auch echt hässliche Dinge damit anstellen (globale Variablen, Funktionen ohne definierte Rückgabe, etc), aber was die vorgefertigten Funktionen angeht, war es echt nett.
Man kann ohne Probleme Diagramme plotten, zufällig nach angegebenen Verteilungen Zufallswerte generieren, kann innerhalb von Vektoren komponentenweise filtern, d.h. gib mir alle Einträge des Vektors mit der Eigenschaft xy, und ziemlich einfach das mathematische Modell des Zufallsexperiments innerhalb weniger Zeilen ins Programm hacken.
Beispiel: Du willst 1000 Münzen mit Wahrscheinlichkeit p werfen und die Ergebnisse in einem Vektor speichern, dann sieht das in R so leicht aus:
ABER: Listen und Datenverwaltung in R generell fand ich persönlich sehr hässlich, vor allem Listen von Listen.
Dennoch: Als etwas besserer Taschenrechner ist R schon ganz brauchbar.
Soweit meine persönliche Meinung.
Man kann ohne Probleme Diagramme plotten, zufällig nach angegebenen Verteilungen Zufallswerte generieren, kann innerhalb von Vektoren komponentenweise filtern, d.h. gib mir alle Einträge des Vektors mit der Eigenschaft xy, und ziemlich einfach das mathematische Modell des Zufallsexperiments innerhalb weniger Zeilen ins Programm hacken.
Beispiel: Du willst 1000 Münzen mit Wahrscheinlichkeit p werfen und die Ergebnisse in einem Vektor speichern, dann sieht das in R so leicht aus:
Code: Alles auswählen
wurfnum <- sample(c("Kopf","Zahl"),1000,prob=c(p,1-p),replace=T)
Dennoch: Als etwas besserer Taschenrechner ist R schon ganz brauchbar.
Soweit meine persönliche Meinung.

"We can't pay and we wouldn't pay. Even if I had the money I would rather burn everything I owned, and I wouldn't even give them the ashes."
-
- Q3 Bronze
- Beiträge: 22811
- Registriert: Mär 2004
- Wohnort: M(ain)z
Habe mir R beigebracht, weil es für quantitatives Arbeiten ganz nützlich ist und mittlerweile bei uns immer mehr STATA verdrängt. Wenn du "richtig" programmieren kannst, sehe ich nicht was du mit R willst; R ist was für Leute die sich Sachen fertig runterladen und dann implementieren, ohne dass man groß verstehen muss wie das nun genau funktioniert (zumindest ist es hier so). Datenmanagement ist wie erwähnt armselig. Ich habe keine große Ahnung von Matlab, aber zu R würde ich eigentlich nicht raten, wenn du irgendwas anderes kannst.
-
- Rampage
- Beiträge: 14303
- Registriert: Jun 2001
- Steam: TomHonks
alles klar, vielen dank für eure ausführlichen antworten. da ich durch visual studio+gescheite programmiersprache ziemlich verwöhnt bin, geht mir schon matlab teilweise auf den sack (typenunsicher,kein richtiges überladen,matlab neustarten um änderung in methode zu übernehmen). da graut es mir jetzt schon davor, was ähnlich grottiges zu lernen.
nen besseren taschenrechner hab ich ja schon, interessant wäre höchstens ein performancevergleich denke ich, da meine felder sehr groß werden könnten (ab 10000x2048)
darf man fragen in welchem bereich du tätig bist gustavo?
nen besseren taschenrechner hab ich ja schon, interessant wäre höchstens ein performancevergleich denke ich, da meine felder sehr groß werden könnten (ab 10000x2048)
darf man fragen in welchem bereich du tätig bist gustavo?
-
- Stripe
- Beiträge: 2276
- Registriert: Apr 2003
Also bei Statistik fällt mir ja immer ein ganz anderes Programm zuerst ein: SPSS.
Habs jetzt paarmal benutzt in der Psychologie, aber nur für kleinere Analysen.
Das kann aber auch alle multivariaten Sachen und ist auch für sehr große Datenmengen geeignet.
Hier mal kleines tutorial grad gegooglet: Multivariate Analysis with SPSS
So ne SPSS Lizenz kriegste sicher über die Uni!
Allg. Info zu SPSS: SPSS - Wikipedia, the free encyclopedia
Für Statistik wie gesagt eigentlich DAS programm.
edit: Was es in SPSS nicht gibt, auch nicht mit addons, kann man auch selber eincoden, wie auf wiki erwähnt hat es ne proprietäre (aber nicht schwere) Sprache quasi eingebaut.
Habs jetzt paarmal benutzt in der Psychologie, aber nur für kleinere Analysen.
Das kann aber auch alle multivariaten Sachen und ist auch für sehr große Datenmengen geeignet.
Hier mal kleines tutorial grad gegooglet: Multivariate Analysis with SPSS
So ne SPSS Lizenz kriegste sicher über die Uni!
Allg. Info zu SPSS: SPSS - Wikipedia, the free encyclopedia
Für Statistik wie gesagt eigentlich DAS programm.
edit: Was es in SPSS nicht gibt, auch nicht mit addons, kann man auch selber eincoden, wie auf wiki erwähnt hat es ne proprietäre (aber nicht schwere) Sprache quasi eingebaut.
Das 'Ä' steht für Spast.
-
- Biker
- Beiträge: 1176
- Registriert: Feb 2008
Für einfache multivariaten ist SPSS sicher ein netter Einstieg. Sofern du aber Flexibilität wünschst und gerne auch komplexere Geschichten (zb. alles was mit Panel Daten zutun hat) angehen willst würde ich STATA empfehlen.
Zu diesen Progs gibt es auch mit Abstand die meisten Tutorials sodass das Erlernen relativ schnell gehen sollte.
Zu diesen Progs gibt es auch mit Abstand die meisten Tutorials sodass das Erlernen relativ schnell gehen sollte.