Przedziały ufności — konstrukcja i interpretacja

Streszczenie

Przedział ufności prostymi słowami i rysunkami: jak go liczyć, co dokładnie znaczy 95% pewności (i czego NIE znaczy), związek z błędem standardowym

Znaczenie przedziału ufności

Załóżmy, że średnia płaca w próbie wynosi 5200 zł. To jednak wynik jednej próby — inna próba dałaby nieco inną liczbę. Sama wartość punktowa nie informuje, jak duża jest jej niepewność.

Przedział ufności uzupełnia oszacowanie o tę niepewność: zamiast „5200 zł" podajemy „5200 zł plus minus margines" — np. (4900, 5500). Pokazujemy w ten sposób nie tylko oszacowanie, lecz także jego rozrzut.

Wzór — i skąd się bierze

Dla średniej, przy dużej próbie, 95% przedział to:

$$ \bar{x} \pm 1{,}96 \cdot \underbrace{\frac{s}{\sqrt{n}}}_{\text{błąd standardowy}} $$

$\bar{x}$ — środek (nasze oszacowanie)
$1{,}96$ — wartość krytyczna z rozkładu normalnego (95% masy mieści się w $\pm 1{,}96\sigma$)
$s/\sqrt{n}$ — błąd standardowy: jak bardzo średnia skacze od próby do próby

Przedział ufności to środek ± margines. Margines = wartość krytyczna (1,96 dla 95%) razy błąd standardowy. Większa pewność lub mniejsza próba → szerszy przedział.

Interpretacja poziomu ufności 95%

Jest to częsty błąd interpretacyjny. „95% ufności" nie znaczy, że prawdziwa średnia ma 95% szans leżeć w tym przedziale. Prawdziwa średnia $\mu$ jest stała — albo jest w środku, albo nie.

Znaczenie jest takie: gdybyśmy powtórzyli badanie wiele razy, każdym razem licząc nowy przedział, to 95% z nich zawierałoby prawdziwą $\mu$. To własność metody, nie pojedynczego przedziału.

Każdy poziomy odcinek to przedział z innej próby. Pionowa linia to prawdziwa $\mu$. Przy 95% ufności mniej więcej 19 na 20 przedziałów trafia $\mu$ — a jeden (czerwony) ją mija. Tego się spodziewamy, nie jest to błąd.

Uwaga

Najczęstszy błąd interpretacji

Zdanie „jestem w 95% pewien, że $\mu$ jest w (4900, 5500)" jest nieścisłe. Poprawnie: „przedział policzyłem metodą, która w 95% przypadków trafia prawdziwą $\mu$". Subtelne, ale ważne — pewność dotyczy procedury, nie konkretnych liczb.

Co steruje szerokością przedziału

Trzy dźwignie:

Zmiana	Efekt na przedział	Dlaczego
Większa próba $n$ ↑	węższy	SE = $s/\sqrt{n}$ maleje
Większa pewność (99% zamiast 95%)	szerszy	wartość krytyczna rośnie (2,58 zamiast 1,96)
Większy rozrzut $s$ ↑	szerszy	dane bardziej niepewne

Intuicja

Kompromis pewność–precyzja

Stuprocentową pewność daje przedział od minus do plus nieskończoności — zawsze trafia w prawdziwą wartość, ale jest bezużyteczny. Im węższy (precyzyjniejszy) przedział, tym mniejsza pewność. Standard 95% to praktyczny kompromis między jednym a drugim.

Związek z testami hipotez

Przedział ufności i test hipotez to dwie strony tej samej monety:

Jeśli wartość (np. 0) leży poza 95% przedziałem ufności, to test odrzuci $H_0$: „parametr = 0" na poziomie 5%.

Dlatego w regresji patrzymy, czy przedział dla współczynnika zawiera zero. Jeśli nie — zmienna jest istotna.

W kodzie

# R — przedział ufności dla średniej
t.test(dane)$conf.int          # domyślnie 95%
t.test(dane, conf.level = 0.99)$conf.int

# dla współczynników regresji
confint(model)                 # przedziały dla wszystkich parametrów
confint(model, level = 0.90)

# Python
import scipy.stats as st
import numpy as np
m, se = np.mean(dane), st.sem(dane)
st.t.interval(0.95, len(dane)-1, loc=m, scale=se)

# statsmodels — dla regresji
model.conf_int(alpha=0.05)

Zapamiętaj

Definicja

Przedział ufności w pigułce

Postać: oszacowanie ± wartość krytyczna × błąd standardowy.
„95%" to własność metody: 95% takich przedziałów (z różnych prób) trafia prawdziwą wartość.
Węższy = precyzyjniejszy, ale mniej pewny. Większe $n$ zwęża przedział jak $1/\sqrt{n}$.
Jeśli przedział nie zawiera zera → parametr istotny statystycznie.

Dalej: Testy hipotez · Centralne twierdzenie graniczne · p-wartość