Przedziały ufności — konstrukcja i interpretacja
Przedział ufności prostymi słowami i rysunkami: jak go liczyć, co dokładnie znaczy 95% pewności (i czego NIE znaczy), związek z błędem standardowym
Znaczenie przedziału ufności
Załóżmy, że średnia płaca w próbie wynosi 5200 zł. To jednak wynik jednej próby — inna próba dałaby nieco inną liczbę. Sama wartość punktowa nie informuje, jak duża jest jej niepewność.
Przedział ufności uzupełnia oszacowanie o tę niepewność: zamiast „5200 zł" podajemy „5200 zł plus minus margines" — np. (4900, 5500). Pokazujemy w ten sposób nie tylko oszacowanie, lecz także jego rozrzut.
Wzór — i skąd się bierze
Dla średniej, przy dużej próbie, 95% przedział to:
$$ \bar{x} \pm 1{,}96 \cdot \underbrace{\frac{s}{\sqrt{n}}}_{\text{błąd standardowy}} $$- $\bar{x}$ — środek (nasze oszacowanie)
- $1{,}96$ — wartość krytyczna z rozkładu normalnego (95% masy mieści się w $\pm 1{,}96\sigma$)
- $s/\sqrt{n}$ — błąd standardowy: jak bardzo średnia skacze od próby do próby
Interpretacja poziomu ufności 95%
Jest to częsty błąd interpretacyjny. „95% ufności" nie znaczy, że prawdziwa średnia ma 95% szans leżeć w tym przedziale. Prawdziwa średnia $\mu$ jest stała — albo jest w środku, albo nie.
Znaczenie jest takie: gdybyśmy powtórzyli badanie wiele razy, każdym razem licząc nowy przedział, to 95% z nich zawierałoby prawdziwą $\mu$. To własność metody, nie pojedynczego przedziału.
Co steruje szerokością przedziału
Trzy dźwignie:
| Zmiana | Efekt na przedział | Dlaczego |
|---|---|---|
| Większa próba $n$ ↑ | węższy | SE = $s/\sqrt{n}$ maleje |
| Większa pewność (99% zamiast 95%) | szerszy | wartość krytyczna rośnie (2,58 zamiast 1,96) |
| Większy rozrzut $s$ ↑ | szerszy | dane bardziej niepewne |
Związek z testami hipotez
Przedział ufności i test hipotez to dwie strony tej samej monety:
Jeśli wartość (np. 0) leży poza 95% przedziałem ufności, to test odrzuci $H_0$: „parametr = 0" na poziomie 5%.
Dlatego w regresji patrzymy, czy przedział dla współczynnika zawiera zero. Jeśli nie — zmienna jest istotna.
W kodzie
# R — przedział ufności dla średniej
t.test(dane)$conf.int # domyślnie 95%
t.test(dane, conf.level = 0.99)$conf.int
# dla współczynników regresji
confint(model) # przedziały dla wszystkich parametrów
confint(model, level = 0.90)
# Python
import scipy.stats as st
import numpy as np
m, se = np.mean(dane), st.sem(dane)
st.t.interval(0.95, len(dane)-1, loc=m, scale=se)
# statsmodels — dla regresji
model.conf_int(alpha=0.05)
Zapamiętaj
- Postać: oszacowanie ± wartość krytyczna × błąd standardowy.
- „95%" to własność metody: 95% takich przedziałów (z różnych prób) trafia prawdziwą wartość.
- Węższy = precyzyjniejszy, ale mniej pewny. Większe $n$ zwęża przedział jak $1/\sqrt{n}$.
- Jeśli przedział nie zawiera zera → parametr istotny statystycznie.
Dalej: Testy hipotez · Centralne twierdzenie graniczne · p-wartość