Die schließende Statistik schließt von Beobachtungen bei einer Stichprobe auf die gesamte Population. Dabei können Fehler passieren: Es kann in einer Stichprobe fälschlicherweise ein Zusammenhang beobachtet werden, der in der Gesamtpopulation tatsächlich nicht vorhanden ist (dann spricht man von Typ-I-Fehler oder Alphafehler), oder es kann in der Stichprobe ein Zusammenhang nicht beobachtet werden, der in der Gesamtpopulation tatsächlich vorhanden ist (Typ-II- oder Betafehler). Der Betafehler bestimmt die Wahrscheinlichkeit, kein falsch-negatives Ergebnis zu erzielen, also die „Power“ der Studie.
Unterschiede zwischen Gruppen nennt man statistisch signifikant, wenn die Wahrscheinlichkeit, dass sie durch Zufall so zustande kommen würden, nur gering ist, im Allgemeinen kleiner als 5 %. Überprüft wird die statistische Signifikanz durch statistische Tests, die eine Abschätzung der Irrtumswahrscheinlichkeit erlauben.
Treten statt 3 Ereignissen pro 100 Patienten nur 2 Ereignisse pro 100 Patienten auf, so ist das relative Risiko um ein Drittel, also um 33 % reduziert. Die absolute Risikoreduktion liegt jedoch nur bei einem Hundertstel oder 1 %. Treten in einem anderen Beispiel unter Behandlung statt 30 Ereignissen nur 20 Ereignisse pro 100 Patienten ein, so liegt zwar die relative Risikoreduktion wiederum bei 33 %, die absolute Risikoreduktion jedoch bei einem Zehntel oder 10 %. Die absolute Risikoreduktion ist also abhängig vom Ausgangsrisiko der Population.
Wichtig ist, dass die absolute Risikoreduktion die „Number needed to treat“, also die Zahl von Patienten, die man behandeln muss, um ein Ereignis zu verhindern, bestimmt. Diese kann leicht errechnet werden als 100 geteilt durch die absolute Risikoreduktion in Prozent.
Der härteste Endpunkt ist die Gesamtmortalität, es folgen spezifische Mortalität, Morbidität und Surrogatparameter. Die Aussagekraft einer Studie, die Surrogatparameter als Endpunkt verwendet, kann natürlich nicht mit jener einer Studie mit harten klinischen Endpunkten verglichen werden.