Klicke, um Tipps einzublenden
Beispiel ausprobieren
Wähle ein Szenario, um zu sehen, wie der Rechner funktioniert, und passe dann die Werte an
Klinische Studie
Einstichproben-t-Test fuer eine Medikamentenstudie zur Blutdrucksenkung.
Wichtige Werte: Stichprobenmittel: 105 · Pop.-mittel: 100 · n = 30, SD = 15
A/B-Test
Zweistichproben-t-Test zum Vergleich der Konversionsraten zwischen Kontroll- und Testvariante.
Wichtige Werte: Gruppe 1: 52, n=200 · Gruppe 2: 48, n=200 · Zweiseitig
Vorher-Nachher-Studie
Gepaarter t-Test zur Messung des Gewichtsverlusts in einem Fitnessprogramm.
Wichtige Werte: Mittlere Diff.: 3,5 kg · SD Diff.: 2,1 · 25 Paare
P-Werte und Hypothesentests verstehen
Statistische Signifikanztests mit durchgerechneten Beispielen
Was ist ein P-Wert?
Ein p-Wert ist ein Wahrscheinlichkeitswert, der Wissenschaftlern hilft festzustellen, ob ihre experimentellen Ergebnisse wahrscheinlich durch Zufall entstanden sind oder einen echten Effekt darstellen. Er ist ein grundlegendes Konzept der statistischen Hypothesentests.
Formal ist der p-Wert die Wahrscheinlichkeit, Testergebnisse zu erhalten, die mindestens so extrem sind wie die tatsaechlich beobachteten, unter der Annahme, dass die Nullhypothese korrekt ist.
Wichtiger Punkt: Der p-Wert ist nicht die Wahrscheinlichkeit, dass die Nullhypothese wahr ist. Er ist die Wahrscheinlichkeit, Ihre Daten (oder extremere) zu beobachten, wenn die Nullhypothese wahr waere.
Warum P-Werte wichtig sind
P-Werte werden in verschiedenen Forschungsbereichen wie Medizin, Psychologie, Wirtschaftswissenschaften und Naturwissenschaften weit verbreitet eingesetzt:
- Standardisierte Entscheidungsfindung: Sie bieten einen standardisierten Ansatz zum Ablehnen oder Nicht-Ablehnen der Nullhypothese.
- Forschungsvalidierung: Sie helfen Forschern festzustellen, ob ihre Ergebnisse statistisch signifikant sind.
- Wissenschaftliche Kommunikation: Sie ermoeglichen den Vergleich von Ergebnissen ueber verschiedene Studien hinweg.
So funktionieren P-Werte
Der Hypothesentest-Prozess umfasst mehrere Schritte:
- Nullhypothese (H0) formulieren: Die Standardannahme, typischerweise "kein Effekt" oder "kein Unterschied".
- Alternativhypothese (H1) formulieren: Was Sie zu zeigen hoffen.
- Teststatistik berechnen: z-Wert, t-Wert, Chi-Quadrat oder F-Wert.
- P-Wert bestimmen: Die Wahrscheinlichkeit, die Teststatistik (oder extremere) unter H0 zu beobachten.
- Entscheidung treffen: Wenn p < α (Signifikanzniveau), H0 ablehnen.
Kernkonzepte des Hypothesentests
Null- und Alternativhypothese
Die Nullhypothese (H0) beschreibt typischerweise "kein Effekt" oder "kein Unterschied", waehrend die Alternativhypothese (H1 oder Ha) die Forschungsbehauptung oder den Effekt beschreibt, der geprueft wird.
Nullhypothese (H0)
- Nimmt keinen Effekt oder keinen Unterschied an
- Beispiel: "Die Behandlung hat keinen Effekt"
- Beispiel: "Es gibt keinen Unterschied zwischen den Gruppen"
- Beispiel: "Es gibt keinen Zusammenhang zwischen Variablen"
Alternativhypothese (H1)
- Behauptet, dass ein Effekt oder Unterschied existiert
- Beispiel: "Die Behandlung hat einen Effekt"
- Beispiel: "Es gibt einen Unterschied zwischen den Gruppen"
- Beispiel: "Es gibt einen Zusammenhang zwischen Variablen"
Signifikanzniveau (α)
Das Signifikanzniveau (Alpha oder α) ist die Wahrscheinlichkeitsschwelle, unterhalb derer die Nullhypothese abgelehnt wird. Haeufige Alpha-Niveaus sind:
- α = 0,05 (5 %): Standard in vielen Fachgebieten; bedeutet eine 5%-Chance, eine wahre Nullhypothese abzulehnen
- α = 0,01 (1 %): konservativer; verwendet, wenn staerkere Evidenz erforderlich ist
- α = 0,10 (10 %): nachsichtiger; manchmal in explorativer Forschung verwendet
Teststatistik
Eine Teststatistik ist ein aus Stichprobendaten berechneter Zahlenwert, mit dem der p-Wert bestimmt wird. Verschiedene statistische Tests verwenden verschiedene Teststatistiken:
- t-Statistik: verwendet in T-Tests
- z-Statistik: verwendet in Z-Tests
- F-Statistik: verwendet in ANOVA und F-Tests
- Chi-Quadrat-Statistik: verwendet in Chi-Quadrat-Tests
Einseitige vs. zweiseitige Tests
Zweiseitiger Test
Prueft auf einen Effekt in beide Richtungen, also Erhoehung oder Verringerung. Die Alternativhypothese ist nicht gerichtet.
Beispiel H1: "Die Behandlung hat einen Effekt" (positiv oder negativ moeglich)
Einseitiger Test
Prueft auf einen Effekt nur in einer Richtung. Die Alternativhypothese ist gerichtet.
Beispiel H1: "Die Behandlung erhoeht die Leistung" (nur positiver Effekt gesucht)
Wichtig: Einseitige Tests liefern mehr Teststaerke, sollten aber nur verwendet werden, wenn vorab eine klare gerichtete Vorhersage besteht. Zweiseitige Tests sind konservativer und im Allgemeinen vorzuziehen, wenn es keinen starken theoretischen Grund fuer eine Richtungshypothese gibt.
Fehler 1. und 2. Art
| H0 ist wahr | H0 ist falsch | |
|---|---|---|
| H0 ablehnen | Typ-I-Fehler (falsch-positiv) Wahrscheinlichkeit = | Korrekte Entscheidung (richtig-positiv) Wahrscheinlichkeit = (Teststaerke) |
| H0 nicht ablehnen | Korrekte Entscheidung (richtig-negativ) Wahrscheinlichkeit = | Typ-II-Fehler (falsch-negativ) Wahrscheinlichkeit = |
- Typ-I-Fehler: Ablehnung einer wahren Nullhypothese (falsch-positiv)
- Typ-II-Fehler: Nicht-Ablehnung einer falschen Nullhypothese (falsch-negativ)
- Teststaerke: Wahrscheinlichkeit, eine falsche Nullhypothese korrekt abzulehnen ()
Teststatistik-Formeln
Z-Test (bekannte Populationsvarianz)
T-Test (geschaetzte Varianz)
Chi-Quadrat-Test
F-Test (ANOVA)
Haeufige statistische Tests und ihre Anwendungen
Verschiedene Forschungsfragen erfordern verschiedene statistische Tests. Die Wahl haengt davon ab, ob Sie Mittelwerte, Varianzen, Haeufigkeiten oder Zusammenhaenge zwischen kategorialen Variablen pruefen.
T-Tests
T-Tests werden verwendet, um zu pruefen, ob Mittelwerte statistisch signifikant voneinander abweichen.
Einstichproben-T-Test
Vergleicht einen Stichprobenmittelwert mit einem bekannten oder hypothetischen Populationsmittelwert.
Formel:
- : Stichprobenmittelwert
- : Populationsmittelwert
- : Standardabweichung der Stichprobe
- : Stichprobengroesse
Beispiel: Pruefen, ob der durchschnittliche IQ-Wert in einer Stichprobe vom Populationsmittelwert 100 abweicht.
Zweistichproben-T-Test
Vergleicht Mittelwerte aus zwei unabhaengigen Gruppen oder Stichproben.
Formel (bei gleichen Varianzen):
- , : Stichprobenmittelwerte
- : gepoolte Standardabweichung
- , : Stichprobengroessen
Hinweis: Diese Formel setzt gleiche Varianzen voraus. Bei ungleichen Varianzen wird der Welch-T-Test verwendet.
Beispiel: Vergleich durchschnittlicher Testergebnisse zwischen zwei Unterrichtsmethoden.
Gepaarter T-Test
Prueft Mittelwertdifferenzen derselben Gruppe zu verschiedenen Zeitpunkten oder unter verschiedenen Bedingungen.
Formel:
- : mittlere Differenz
- : Standardabweichung der Differenzen
- : Anzahl der Paare
Beispiel: Gewichtsmessung vor und nach einem Diaetprogramm.
Z-Test
Der Z-Test ist dem T-Test aehnlich, wird aber verwendet, wenn die Populations-Standardabweichung bekannt ist oder wenn die Stichprobe gross genug fuer eine zuverlaessige Normalapproximation ist.
Formel:
- : Stichprobenmittelwert
- : Populationsmittelwert
- : Populations-Standardabweichung
- : Stichprobengroesse
Beispiel: Pruefen, ob die mittlere Koerpergroesse in einer grossen Stichprobe vom bekannten Populationsmittelwert abweicht, wenn die Populations-Standardabweichung bekannt ist.
Chi-Quadrat-Tests
Chi-Quadrat-Tests werden fuer kategoriale Daten verwendet, um zu pruefen, ob Variablen statistisch zusammenhaengen oder ob beobachtete Haeufigkeiten von erwarteten Haeufigkeiten abweichen.
Chi-Quadrat-Unabhaengigkeitstest
Prueft, ob zwei kategoriale Variablen miteinander zusammenhaengen oder unabhaengig sind.
Formel:
- : beobachtete Haeufigkeit
- : erwartete Haeufigkeit
Beispiel: Pruefen, ob Geschlecht mit Wahlpraeferenz zusammenhaengt.
Chi-Quadrat-Anpassungstest
Prueft, ob beobachtete Haeufigkeiten zu erwarteten Haeufigkeiten passen.
Formel: wie beim Unabhaengigkeitstest
- : beobachtete Haeufigkeit
- : erwartete Haeufigkeit
Beispiel: Pruefen, ob die Blutgruppenverteilung in einer Stichprobe der erwarteten Populationsverteilung entspricht.
F-Tests und ANOVA
F-Tests werden verwendet, um Varianzen zu vergleichen oder mehrere Mittelwerte gleichzeitig zu vergleichen (ANOVA).
F-Test fuer Varianzen
Prueft, ob zwei Populationen gleiche Varianzen haben.
Formel:
- , : Stichprobenvarianzen
Beispiel: Pruefen, ob zwei Fertigungsprozesse dieselbe Konsistenz (Varianz) haben.
Einfaktorielle ANOVA
Prueft Mittelwertunterschiede zwischen drei oder mehr Gruppen.
Formel:
- : mittlere Quadratsumme zwischen Gruppen
- : mittlere Quadratsumme innerhalb der Gruppen
Beispiel: Vergleich der Wirksamkeit von drei oder mehr Medikamenten.
Den richtigen Test waehlen: Die passende Testwahl haengt von Ihrer Forschungsfrage, dem Datentyp (kontinuierlich oder kategorial), der Anzahl der verglichenen Gruppen und den Testvoraussetzungen ab.
p-Werte berechnen
Die genaue Methode zur Berechnung eines p-Wertes haengt von der Art des statistischen Tests ab, zum Beispiel T-Test, Z-Test oder Chi-Quadrat-Test, und davon, ob der Test einseitig oder zweiseitig ist. Grundsaetzlich wird die berechnete Teststatistik mit ihrer theoretischen Verteilung unter der Nullhypothese verglichen.
Eine Teststatistik verwenden (Z-Wert oder T-Wert)
Fuer viele Tests wird zuerst ein Z-Wert (bei grossen Stichproben oder bekannter Populationsvarianz) oder ein T-Wert (bei kleinen Stichproben oder unbekannter Populationsvarianz) berechnet:
Z-Wert-Formel
Dabei ist der Stichprobenmittelwert, der Populationsmittelwert unter H0, die Populations-Standardabweichung und die Stichprobengroesse.
T-Wert-Formel
Dabei ist der Stichprobenmittelwert, der Populationsmittelwert unter H0, die Stichproben-Standardabweichung und die Stichprobengroesse.
Sobald die Teststatistik (Z oder T) berechnet ist, wird der p-Wert ueber die Wahrscheinlichkeit in der Standardnormalverteilung oder in der t-Verteilung mit den passenden Freiheitsgraden bestimmt.
- Rechtsseitiger Test: p-Wert = P(Teststatistik ≥ beobachteter Wert)
- Linksseitiger Test: p-Wert = P(Teststatistik ≤ beobachteter Wert)
- Zweiseitiger Test: p-Wert = 2 × P(Teststatistik ≥ |beobachteter Wert|)
Dieser Rechner automatisiert die Verteilungsabfrage und liefert den p-Wert auf Basis Ihrer Eingaben: Teststatistik, Freiheitsgrade und Testrichtung.
Ergebnisse interpretieren
Signifikanzniveaus
| P-Wert-Bereich | Evidenz gegen H0 | Typische Interpretation |
|---|---|---|
| p < 0,001 | Sehr stark | Starke statistische Signifikanz |
| 0,001 ≤ p < 0,01 | Stark | Statistisch signifikant |
| 0,01 ≤ p < 0,05 | Maessig | Statistisch signifikant |
| 0,05 ≤ p < 0,10 | Schwach | Nicht signifikant (grenzwertig) |
| p ≥ 0,10 | Keine oder sehr schwach | Nicht signifikant |
Effektstaerke
Berichten Sie immer Effektstaerken zusammen mit p-Werten. Gaengige Masse sind Cohens d (fuer t-Tests), partielles Eta-Quadrat (fuer ANOVA) und Cramers V (fuer Chi-Quadrat-Tests).
Was statistische Signifikanz bedeutet
Wenn ein Ergebnis als statistisch signifikant beschrieben wird (p ≤ α), bedeutet das: Die beobachteten Daten waeren unter einer wahren Nullhypothese relativ unwahrscheinlich. Das Ergebnis liefert Evidenz gegen H0, aber keinen direkten Beweis fuer die Alternativhypothese.
Merken Sie sich: "H0 nicht ablehnen" ist nicht dasselbe wie "H0 beweisen". Es bedeutet nur, dass die Daten nicht genug Evidenz liefern, um H0 abzulehnen.
Statistische vs. praktische Signifikanz
Statistische Signifikanz (p-Wert) unterscheidet sich von praktischer oder klinischer Relevanz (Effektstaerke):
Statistische Signifikanz
- Zeigt, ob ein Effekt eher real als zufallsbedingt ist
- Wird von der Stichprobengroesse beeinflusst
- Sagt nichts ueber Groesse oder Wichtigkeit des Effekts aus
- Wird durch den p-Wert dargestellt
Praktische Signifikanz
- Zeigt, ob ein Effekt praktisch relevant genug ist
- Wird nicht direkt durch die Stichprobengroesse bestimmt
- Beschreibt die Groessenordnung des Effekts
- Wird durch Effektstaerkemasse wie Cohens d, r oder η² dargestellt
Ein Ergebnis kann statistisch signifikant sein und trotzdem praktisch bedeutungslos wirken, besonders bei sehr grossen Stichproben, die auch winzige Effekte nachweisen koennen.
Konfidenzintervalle
Konfidenzintervalle liefern einen Bereich plausibler Werte fuer einen Parameter und sind oft informativer als p-Werte allein:
- Ein 95%-Konfidenzintervall bedeutet: Wenn Sie das Experiment sehr oft wiederholen wuerden, enthielten etwa 95 % der berechneten Intervalle den wahren Parameterwert.
- Wenn ein 95%-Konfidenzintervall den Nullwert (bei Differenzen) oder 1 (bei Verhaeltnissen) einschliesst, ist das Ergebnis bei α = 0,05 nicht statistisch signifikant.
- Die Breite des Intervalls zeigt, wie praezise die Schaetzung ist.
Interpretationsbeispiele aus der Praxis
Beispiel 1: Medikamentenstudie
Ergebnis: t(48) = 2,65, p = 0,011
Interpretation: "Die Behandlung fuehrte im Vergleich zu Placebo zu einer statistisch signifikanten Symptomreduktion (p = 0,011). Das liefert maessige Evidenz, die Nullhypothese abzulehnen, dass das Medikament keinen Effekt hat."
Beispiel 2: Bildungsintervention
Ergebnis: F(2, 150) = 1,82, p = 0,17
Interpretation: "Zwischen den drei Unterrichtsmethoden wurden keine statistisch signifikanten Unterschiede gefunden (p = 0,17). Das bedeutet, dass keine signifikante Evidenz fuer einen Unterschied gefunden wurde; es beweist aber nicht, dass die Methoden gleich wirksam sind."
Haeufige Fehlinterpretationen
- Irrtum 1: "Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese wahr ist." -- Falsch. Der p-Wert sagt nichts ueber die Wahrscheinlichkeit der Hypothese aus.
- Irrtum 2: "Ein nicht-signifikantes Ergebnis beweist, dass kein Effekt existiert." -- Falsch. Es bedeutet nur unzureichende Evidenz, um die Nullhypothese abzulehnen.
- Irrtum 3: "Ein kleinerer p-Wert bedeutet einen groesseren Effekt." -- Falsch. Der p-Wert haengt sowohl von der Effektgroesse als auch von der Stichprobengroesse ab.
- Irrtum 4: "p = 0,05 ist eine magische Grenze." -- Falsch. Es gibt keinen qualitativen Unterschied zwischen p = 0,049 und p = 0,051.
Best Practices beim Berichten und Verwenden von p-Werten
P-Werte sind ein nuetzliches Werkzeug der statistischen Analyse, sollten aber immer zusammen mit Kontext, Effektstaerken, Konfidenzintervallen und einem vorab definierten Analyseplan interpretiert werden.
- Forschungsfrage und Methoden vorab festlegen: Definieren Sie Hypothesen, Testart, Signifikanzniveau und Ausschlusskriterien vor der Datenerhebung.
- Exakte p-Werte berichten: Schreiben Sie nach Moeglichkeit "p = 0,032" statt nur "p < 0,05" oder "nicht signifikant".
- Effektstaerken und Konfidenzintervalle angeben: Sie zeigen, wie gross und wie praezise der geschaetzte Effekt ist.
- Praktische Signifikanz pruefen: Fragen Sie, ob der Effekt im fachlichen Kontext wirklich relevant ist.
- Teststaerke beruecksichtigen: Eine kleine Stichprobe kann einen realen Effekt uebersehen; eine sehr grosse Stichprobe kann winzige Effekte signifikant machen.
- Multiple Vergleiche korrigieren: Bei vielen Tests erhoeht sich die Chance falsch-positiver Ergebnisse. Bonferroni- oder FDR-Verfahren koennen helfen.
- Bayessche Methoden erwaegen: In manchen Forschungsfragen liefern Bayes-Faktoren oder posteriori Wahrscheinlichkeiten eine nuetzliche Ergaenzung zu p-Werten.
Ueber p-Werte hinaus: Moderne statistische Praxis betont zunehmend einen vollstaendigeren Berichtsstil mit Effektstaerken, Konfidenzintervallen, Teststaerke und transparenten Analyseentscheidungen. Der p-Wert ist ein Belegstueck, nicht das letzte Wort.
Beispielszenarien
Die folgenden Beispiele zeigen, wie p-Werte in verschiedenen Forschungsbereichen angewandt werden:
Beispiel 1: Medikamentenstudie
Ergebnis: t(48) = 2,65, p = 0,011
Interpretation: Die Behandlung fuehrte zu einer statistisch signifikanten Reduktion der Symptome gegenueber Placebo. Fuer den Bericht gehoeren dazu die Effektstaerke, das Konfidenzintervall und die klinische Relevanz der Symptomveraenderung.
Beispiel 2: Bildungsintervention
Ergebnis: F(2, 150) = 1,82, p = 0,17
Interpretation: Die Daten liefern keine statistisch signifikante Evidenz fuer Unterschiede zwischen drei Unterrichtsmethoden. Der Bericht sollte trotzdem Stichprobengroesse, Effektstaerke und Unsicherheit nennen, damit die Aussage nicht als Beweis gleicher Wirksamkeit misslesen wird.
Diesen Rechner verwenden
Dieser Rechner hilft Ihnen, p-Werte fuer mehrere statistische Tests zu berechnen. Entscheidend ist, dass die Eingaben zur Forschungsfrage und zu den Testvoraussetzungen passen.
- Passenden Test auswaehlen: Waehlen Sie die Testart passend zu Datentyp, Gruppenzahl und Hypothese.
- Parameter eingeben: Tragen Sie Mittelwerte, Standardabweichungen, Stichprobengroessen, Freiheitsgrade oder Teststatistiken so ein, wie sie zu Ihrem Test gehoeren.
- p-Wert und Entscheidung pruefen: Vergleichen Sie den p-Wert mit dem festgelegten Signifikanzniveau und lesen Sie die Interpretation im Kontext.
Denken Sie daran: p-Werte sind nur ein Teil der Evidenz. Gute Berichte verbinden sie mit Studiendesign, Messqualitaet, Effektstaerke, Unsicherheit und fachlicher Plausibilitaet.
Kernaussagen
- Ein p-Wert quantifiziert Evidenz gegen die Nullhypothese; er misst nicht die Wahrscheinlichkeit, dass die Nullhypothese wahr ist.
- Berichten Sie exakte p-Werte, zum Beispiel p = 0,032, statt nur "p < 0,05".
- Kombinieren Sie Signifikanztests immer mit Effektstaerken und Konfidenzintervallen, um praktische Bedeutung einzuschaetzen.
- Eine A-priori-Poweranalyse hilft zu klaeren, ob die Stichprobe gross genug ist, um relevante Effekte zu erkennen.
- Bei mehreren Tests sollten Korrekturen wie Bonferroni oder FDR genutzt werden, um die familienweise Fehlerrate oder die Rate falscher Entdeckungen zu kontrollieren.
Haeufig gestellte Fragen
Was ist der Unterschied zwischen einem einseitigen und zweiseitigen Test?
Ein einseitiger Test prueft auf einen Effekt in einer bestimmten Richtung (z.B. die Behandlung erhoeht den Mittelwert), waehrend ein zweiseitiger Test auf einen Effekt in beide Richtungen prueft. Ein zweiseitiger p-Wert ist typischerweise doppelt so gross wie der einseitige p-Wert fuer dieselbe Teststatistik.
Ist ein p-Wert von 0,05 immer die richtige Schwelle?
Nein. Die 0,05-Schwelle ist eine Konvention, kein Naturgesetz. In manchen Bereichen (z.B. Teilchenphysik) ist die Schwelle viel strenger (p < 0,0000003 oder 5σ). Begruenden Sie immer Ihr gewaehltes Signifikanzniveau vor der Datenerhebung.
Was ist die Beziehung zwischen p-Wert und Konfidenzintervall?
Sie tragen aequivalente Information. Ein 95%-Konfidenzintervall schliesst den Nullwert genau dann aus, wenn der zweiseitige p-Wert unter 0,05 liegt. Konfidenzintervalle sind oft informativer, da sie auch die geschaetzte Groesse und Praezision des Effekts zeigen.
Warum kann eine grosse Stichprobe fast jeden Unterschied statistisch signifikant machen?
Weil der Standardfehler mit wachsender Stichprobengroesse schrumpft, kann selbst ein winziger Effekt eine grosse Teststatistik und einen kleinen p-Wert erzeugen. Deshalb sollten Effektstaerkemasse und Konfidenzintervalle immer p-Werte begleiten.
Was ist ein Typ-I-Fehler und wie haengt er mit dem p-Wert zusammen?
Ein Typ-I-Fehler tritt auf, wenn Sie die Nullhypothese ablehnen, obwohl sie wahr ist (falsch-positiv). Das Signifikanzniveau α legt die maximal akzeptable Wahrscheinlichkeit eines Typ-I-Fehlers fest.
Was sollte ich tun, wenn mein p-Wert knapp ueber 0,05 liegt?
Behandeln Sie das Ergebnis nicht als bedeutungslos. Ein p-Wert von 0,06 liefert fast genauso viel Evidenz gegen die Nullhypothese wie 0,04. Berichten Sie den genauen p-Wert, betrachten Sie Effektstaerken und Konfidenzintervalle.
Wie wird der p-Wert durch multiple Vergleiche beeinflusst?
Das Durchfuehren vieler Tests blaest die familienweise Fehlerrate auf. Korrekturen wie Bonferroni (teile α durch die Anzahl der Tests) oder das Benjamini-Hochberg-Verfahren helfen, diese Inflation zu kontrollieren.
Kann ich diesen Rechner fuer nicht-parametrische Tests verwenden?
Dieser Rechner berechnet p-Werte fuer Z-Tests und t-Tests basierend auf der Normal- und t-Verteilung. Nicht-parametrische Tests erfordern dedizierte Werkzeuge, aber die allgemeine Interpretation des p-Wertes bleibt gleich.
Haftungsausschluss
Dieser p-Wert-Rechner dient Bildungs- und Informationszwecken. Obwohl die statistischen Berechnungen auf etablierten mathematischen Formeln basieren, sollten sie nicht als alleinige Grundlage fuer medizinische, rechtliche oder sicherheitskritische Entscheidungen verwendet werden. Konsultieren Sie bei wichtigen Forschungsentscheidungen einen qualifizierten Statistiker.
Referenzen und weiterfuehrende Literatur
- Wasserstein, R. L. & Lazar, N. A. (2016). The ASA Statement on P-Values: Context, Process, and Purpose. The American Statistician, 70(2), 129-133.
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Lawrence Erlbaum Associates.
- Wasserstein, R. L., Schirm, A. L. & Lazar, N. A. (2019). Moving to a World Beyond "p < 0.05."The American Statistician, 73(sup1), 1-19.
- Greenland, S. et al. (2016). Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. European Journal of Epidemiology, 31, 337-350.
- NIST/SEMATECH e-Handbook of Statistical Methods. Hypothesis Testing. itl.nist.gov/div898/handbook
Spezialisierte Rechner
Wähle aus 4 spezialisierten Versionen dieses Rechners, jeweils optimiert für bestimmte Anwendungsfälle und Berechnungsmethoden.
Test Type
4 RechnerVerwandte Rechner
6 RechnerWeitere Statistik-Rechner