„People Should Prefer PSPP“ - Open Source Software für Datenaufbereitung, Datenanalyse und Statistik

Mo, 6. Dezember 2021, Caos

Ich arbeite schon seit vielen Jahren beruflich mit der Statistiksoftware SPSS, sowohl unter Windows als auch unter Linux. Erst letztes Jahr habe ich zufällig PSPP kennengelernt: GNU PSPP ist eine Freie Software für Datenaufbereitung, Datenanalyse und Statistik. Es ist eine freie und kostenlose Alternative zur proprietären und kommerziellen Statistiksoftware SPSS, die sehr ähnlich zu bedienen und (nahezu) vollständig mit SPSS-Dateiformaten kompatibel ist.

Das Akronym „SPSS“ steht für „Statistical Package for the Social Science“. Wofür aber steht „PSPP“? Dazu das Projekt selbst in den FAQs: „PSPP does not have any official acronymic expansion. But they're easy to come up with. For example: Perfect Statistics Professionally Presented, Probabilities Sometimes Prevent Problems, People Should Prefer PSPP“, ...

Funktionsumfang und Installation

Der Funktionsumfang von PSPP ist zwar schon weitaus geringer als der von SPSS, aber m.E. für viele Anwendungszwecke vollkommen ausreichend. Wichtige Funktionen für die Datenaufbereitung sind enthalten (Variablen berechnen, umkodieren). Alle gängigen Verfahren der deskriptiven Statistik, bivariate Analysen (Korrelation, Kreuztabellen, Mittelwertvergleiche u.ä.) sind dabei und auch viele relevante multivariate Verfahren (u.a. Multiple und logistische Regression, Faktorenanalyse, Quick Cluster). Einige speziellere Verfahren (bspw. Clusteranalyse nach WARD) fehlen aber im Vergleich zu SPSS. Wenn Ihr jedoch nicht auf diese Verfahren angewiesen seid, ist PSPP m.E. eine sehr gute Alternative.

Die Bedienung kann genau wie bei SPSS über das Menü/GUI erfolgen oder über Syntaxbefehle.

Es gibt zwar auch in PSPP die Möglichkeit, Ergebnisse grafisch darstellen zu lassen. Diese Funktionen sind jedoch (ebenso wie bei SPSS) nicht wirklich überzeugend, sodass (zumindest für Veröffentlichungs- oder Präsentationszwecke) Grafiken besser mit anderen Programmen wie bspw. Calc, in die die Ergebnisse aus PSPP kopiert oder exportiert werden können, erstellt werden sollten.

PSPP ist für viele Debian- und für Red-Hat-basierte Distributionen über die Anwendungsverwaltung installierbar. Darüber hinaus gibt es Downloads mit z.T. aktuelleren Versionen für ALT Linux, Arch Linux, Debian, Fedora, FreeBSD, NetBSD, openSUSE, PCLinuxOS, Slackware, Solus, Ubuntu unter https://pkgs.org/download/pspp

GNU/Linux hat für PSPP Priorität

Es existieren auch Versionen für Windows und Mac. Aber GNU/Linux hat für das Projekt explizit Priorität, wie dieses Statement verdeutlicht: „PSPP ist GNU-Software und Teil des GNU-Systems. Das heisst, die Plattformen, auf denen es am besten funktioniert, sind GNU und GNU/Linux. Wie bei jeder GNU-Software ist plattformübergreifende Portabilität etwas, das wir zu erreichen versuchen, aber es geniesst nicht die höchste Priorität. Ausserdem hat die Unterstützung freier Systeme Vorrang vor unfreien Plattformen wie Windows oder Mac OS, und PSPP wird grundsätzlich immer am besten auf einem freien Betriebssystem funktionieren. Zusammengefasst: Windows und Mac stehen auf unserer Prioritätenliste unten. Wir empfehlen, auf ein freies Betriebssystem zu wechseln.“

Falls Ihr also bspw. für Studium, Lehre, Befragungsprojekte oder Aufträge ein Programm zur Datenauswertung benötigt, schaut Euch PSPP mal an: https://www.gnu.org/software/pspp/

Für Analysen, für die die Funktionen von PSPP (oder auch von SPSS) nicht ausreichen, ist dann wiederum "R" eine sehr gute und freie Alternative, die jedoch erheblich mehr Einarbeitungszeit erfordert: https://www.r-project.org/

Mich würde interessieren: Habt Ihr selbst Erfahrung mit R, SPSS und/oder mit PSPP? Wenn ja, welche?