Bachelorthesis: Statistische Sprachen und Matlab

Schule, Ausbildung, Studium, Beruf, Erster und Zweiter Bildungsweg, etc.
Antworten
Nomschta
Rampage
Rampage
Beiträge: 14303
Registriert: Jun 2001
Steam: TomHonks

Bachelorthesis: Statistische Sprachen und Matlab

Beitrag von Nomschta »

moinsen,

in meiner abschlussarbeit befindet sich ein recht großer teil statistik, genauer genommen multivariate datenanalyse (PCA, LDA und exotisches zeugs).

nun arbeite ich eigentlich mit matlab, bin aber zufällig auf R gestoßen. ich frage mich nun, ob es sinnvoll ist, diese sprache auch irgendwie zu verwenden, da sie auf den ersten blick viel mehr vorgefertigte funktionen in dem gebiet mitbringt als matlab.

bei matlab müsste ich quasi alles "from the scratch" selber schreiben. eigentlich wäre selber programmieren fürs verständnis besser, aber mit R könnte man (vermutlich) mehr ausprobieren und ich steh eher auf ergebnisse und praxis als auf formeljongliererei.

kennt hier jemand R oder vergleichbare statistische sprachen? was würdet ihr mir empfehlen? bei matlab bleiben? R lernen?

zeit übrig: bis ende september
BildBild Danke an Drasora für ihr Wichtelgeschenk!
MAR hat geschrieben:Führt der durch den Terrence-Hill? :ugly:
mac_mario
Klesk
Klesk
Beiträge: 714
Registriert: Feb 2005

Beitrag von mac_mario »

Wir haben R dieses Semester in der Vorlesung zur Elementaren Stochastik verwendet. Die Syntax ist etwas gewöhnungsbedürftig und man kann auch echt hässliche Dinge damit anstellen (globale Variablen, Funktionen ohne definierte Rückgabe, etc), aber was die vorgefertigten Funktionen angeht, war es echt nett.
Man kann ohne Probleme Diagramme plotten, zufällig nach angegebenen Verteilungen Zufallswerte generieren, kann innerhalb von Vektoren komponentenweise filtern, d.h. gib mir alle Einträge des Vektors mit der Eigenschaft xy, und ziemlich einfach das mathematische Modell des Zufallsexperiments innerhalb weniger Zeilen ins Programm hacken.

Beispiel: Du willst 1000 Münzen mit Wahrscheinlichkeit p werfen und die Ergebnisse in einem Vektor speichern, dann sieht das in R so leicht aus:

Code: Alles auswählen

wurfnum <- sample(c("Kopf","Zahl"),1000,prob=c(p,1-p),replace=T) 
ABER: Listen und Datenverwaltung in R generell fand ich persönlich sehr hässlich, vor allem Listen von Listen.

Dennoch: Als etwas besserer Taschenrechner ist R schon ganz brauchbar.

Soweit meine persönliche Meinung.
Bild

"We can't pay and we wouldn't pay. Even if I had the money I would rather burn everything I owned, and I wouldn't even give them the ashes."
Gustavo
Q3 Bronze
Q3 Bronze
Beiträge: 22811
Registriert: Mär 2004
Wohnort: M(ain)z

Beitrag von Gustavo »

Habe mir R beigebracht, weil es für quantitatives Arbeiten ganz nützlich ist und mittlerweile bei uns immer mehr STATA verdrängt. Wenn du "richtig" programmieren kannst, sehe ich nicht was du mit R willst; R ist was für Leute die sich Sachen fertig runterladen und dann implementieren, ohne dass man groß verstehen muss wie das nun genau funktioniert (zumindest ist es hier so). Datenmanagement ist wie erwähnt armselig. Ich habe keine große Ahnung von Matlab, aber zu R würde ich eigentlich nicht raten, wenn du irgendwas anderes kannst.
Nomschta
Rampage
Rampage
Beiträge: 14303
Registriert: Jun 2001
Steam: TomHonks

Beitrag von Nomschta »

alles klar, vielen dank für eure ausführlichen antworten. da ich durch visual studio+gescheite programmiersprache ziemlich verwöhnt bin, geht mir schon matlab teilweise auf den sack (typenunsicher,kein richtiges überladen,matlab neustarten um änderung in methode zu übernehmen). da graut es mir jetzt schon davor, was ähnlich grottiges zu lernen.

nen besseren taschenrechner hab ich ja schon, interessant wäre höchstens ein performancevergleich denke ich, da meine felder sehr groß werden könnten (ab 10000x2048)

darf man fragen in welchem bereich du tätig bist gustavo?
BildBild Danke an Drasora für ihr Wichtelgeschenk!
MAR hat geschrieben:Führt der durch den Terrence-Hill? :ugly:
MeisterbrÄu
Stripe
Stripe
Beiträge: 2276
Registriert: Apr 2003

Beitrag von MeisterbrÄu »

Also bei Statistik fällt mir ja immer ein ganz anderes Programm zuerst ein: SPSS.

Habs jetzt paarmal benutzt in der Psychologie, aber nur für kleinere Analysen.

Das kann aber auch alle multivariaten Sachen und ist auch für sehr große Datenmengen geeignet.

Hier mal kleines tutorial grad gegooglet: Multivariate Analysis with SPSS

So ne SPSS Lizenz kriegste sicher über die Uni!

Allg. Info zu SPSS: SPSS - Wikipedia, the free encyclopedia

Für Statistik wie gesagt eigentlich DAS programm.

edit: Was es in SPSS nicht gibt, auch nicht mit addons, kann man auch selber eincoden, wie auf wiki erwähnt hat es ne proprietäre (aber nicht schwere) Sprache quasi eingebaut.
Das 'Ä' steht für Spast.
s4ma
Biker
Biker
Beiträge: 1176
Registriert: Feb 2008

Beitrag von s4ma »

Für einfache multivariaten ist SPSS sicher ein netter Einstieg. Sofern du aber Flexibilität wünschst und gerne auch komplexere Geschichten (zb. alles was mit Panel Daten zutun hat) angehen willst würde ich STATA empfehlen.
Zu diesen Progs gibt es auch mit Abstand die meisten Tutorials sodass das Erlernen relativ schnell gehen sollte.
Antworten