„People Should Prefer PSPP“ - Open Source Software für Datenaufbereitung, Datenanalyse und Statistik

  Datendetektivin   Lesezeit: 4 Minuten  🗪 2 Kommentare

PSPP als freie Alternative für SPSS ist plattformübergreifend, aber mit Priorität auf GNU/ Linux

„people should prefer pspp“ -  open source software für datenaufbereitung, datenanalyse und statistik

Ich arbeite schon seit vielen Jahren beruflich mit der Statistiksoftware SPSS, sowohl unter Windows als auch unter Linux. Erst letztes Jahr habe ich zufällig PSPP kennengelernt: GNU PSPP ist eine Freie Software für Datenaufbereitung, Datenanalyse und Statistik. Es ist eine freie und kostenlose Alternative zur proprietären und kommerziellen Statistiksoftware SPSS, die sehr ähnlich zu bedienen und (nahezu) vollständig mit SPSS-Dateiformaten kompatibel ist.

Das Akronym „SPSS“ steht für „Statistical Package for the Social Science“. Wofür aber steht „PSPP“? Dazu das Projekt selbst in den FAQs: „PSPP does not have any official acronymic expansion. But they're easy to come up with. For example: Perfect Statistics Professionally Presented, Probabilities Sometimes Prevent Problems, People Should Prefer PSPP“, ...

Funktionsumfang und Installation

Der Funktionsumfang von PSPP ist zwar schon weitaus geringer als der von SPSS, aber m.E. für viele Anwendungszwecke vollkommen ausreichend. Wichtige Funktionen für die Datenaufbereitung sind enthalten (Variablen berechnen, umkodieren). Alle gängigen Verfahren der deskriptiven Statistik, bivariate Analysen (Korrelation, Kreuztabellen, Mittelwertvergleiche u.ä.) sind dabei und auch viele relevante multivariate Verfahren (u.a. Multiple und logistische Regression, Faktorenanalyse, Quick Cluster). Einige speziellere Verfahren (bspw. Clusteranalyse nach WARD) fehlen aber im Vergleich zu SPSS. Wenn Ihr jedoch nicht auf diese Verfahren angewiesen seid, ist PSPP m.E. eine sehr gute Alternative.

Die Bedienung kann genau wie bei SPSS über das Menü/GUI erfolgen oder über Syntaxbefehle.

Es gibt zwar auch in PSPP die Möglichkeit, Ergebnisse grafisch darstellen zu lassen. Diese Funktionen sind jedoch (ebenso wie bei SPSS) nicht wirklich überzeugend, sodass (zumindest für Veröffentlichungs- oder Präsentationszwecke) Grafiken besser mit anderen Programmen wie bspw. Calc, in die die Ergebnisse aus PSPP kopiert oder exportiert werden können, erstellt werden sollten.

PSPP ist für viele Debian- und für Red-Hat-basierte Distributionen über die Anwendungsverwaltung installierbar. Darüber hinaus gibt es Downloads mit z.T. aktuelleren Versionen für ALT Linux, Arch Linux, Debian, Fedora, FreeBSD, NetBSD, openSUSE, PCLinuxOS, Slackware, Solus, Ubuntu unter https://pkgs.org/download/pspp

GNU/Linux hat für PSPP Priorität

Es existieren auch Versionen für Windows und Mac. Aber GNU/Linux hat für das Projekt explizit Priorität, wie dieses Statement verdeutlicht: „PSPP ist GNU-Software und Teil des GNU-Systems. Das heisst, die Plattformen, auf denen es am besten funktioniert, sind GNU und GNU/Linux. Wie bei jeder GNU-Software ist plattformübergreifende Portabilität etwas, das wir zu erreichen versuchen, aber es geniesst nicht die höchste Priorität. Ausserdem hat die Unterstützung freier Systeme Vorrang vor unfreien Plattformen wie Windows oder Mac OS, und PSPP wird grundsätzlich immer am besten auf einem freien Betriebssystem funktionieren. Zusammengefasst: Windows und Mac stehen auf unserer Prioritätenliste unten. Wir empfehlen, auf ein freies Betriebssystem zu wechseln.“

Falls Ihr also bspw. für Studium, Lehre, Befragungsprojekte oder Aufträge ein Programm zur Datenauswertung benötigt, schaut Euch PSPP mal an: https://www.gnu.org/software/pspp/

Für Analysen, für die die Funktionen von PSPP (oder auch von SPSS) nicht ausreichen, ist dann wiederum "R" eine sehr gute und freie Alternative, die jedoch erheblich mehr Einarbeitungszeit erfordert: https://www.r-project.org/

Mich würde interessieren: Habt Ihr selbst Erfahrung mit R, SPSS und/oder mit PSPP? Wenn ja, welche?

Tags

PSPP, SPSS, GNU, Linux, GNU-Software, Windows, Datenaufbereitung

Willi D.
Geschrieben von Willi D. am 7. Dezember 2021 um 07:02

Während meines Studiums der Sozialwissenschaften (Soziologie und VWL) habe ich an der Uni ausschließlich mit proprietären Programmen (STATA, SPSS, SAS) gearbeitet. Erst später habe ich dann freie Programmiersprachen wie R (RStudio als IDE) benutzt und mittlerweile arbeite ich mit Python (Spyder als IDE). Meine Erfahrung ist, dass heute im Bereich Statistik / ML nur noch Leute proprietäre Software benutzen, die das von früher gewohnt sind und nicht wechseln wollen. Alles spricht für freie Programme: die Kosten, die Anzahl der zusätzlichen Pakete und neuen Algorithmen, die Freiheit Programme so anzupassen wie man will, die Möglichkeit Programme und Algorithmen zu verstehen (i.e. den Code einzusehen).

caos
Geschrieben von caos am 10. Dezember 2021 um 17:20

Das war bei mir ähnlich...in meinem eigenen Studium waren weit und breit keine Open Source Anwendungen im Einsatz.

Als ich dann selbst (bis vor zwei Jahren) an der Uni unterrichtet habe, habe ich es aber leider auch nicht in der Lehre praktiziert. "R" kannte ich da zwar, PSPP aber noch nicht. Das war allerdings in Studiengängen, in denen Statistik und Datenanalyse nur ein sehr kleiner Teil des Studiums war. Da wäre dann "R" nur ziemlich schwer vermittelbar gewesen. SPSS/ PSPP ermöglicht da schon einen wesentlich niedrigschwelligeren Einstieg. Auch weil man erst mal mit dem Menü starten kann und dann aber die Befehle von dort einfügen kann, um so auch die Syntax kennenzulernen und zu sehen, dass man damit so einiges effizienter und auch einfacher und schneller durchführen kann.

Erschwerend könnte jedoch sein, dass die meisten Hochschulen (und Studierenden) ja leider nicht mit freien Betriebssystemen arbeiten. Und wie gut PSPP unter Windows/Mac läuft, kann ich nicht aus eigener Erfahrung beurteilen.