3.2. POPULACJA GENERALNA, PRÓBA, ESTYMATORY
Dokładne poznanie rozkładu normalnego wymaga wykonania
nieskończonej ilości pomiarów, co oczywiście
nie jest możliwe. Praktycznie dysponujemy jedynie skończoną,
i zwykle niewielką ilością pomiarów. Nazwijmy
zespół tych pomiarów próbą.
Próba może być duża, np. gdy ilość
pomiarów n > 30, jak też i mała 10
< n < 30 , lub bardzo mała n < 10.
Termin próba pojawił się dzięki następującej
analogii. Wyobraźmy sobie, że pojemnik zawiera nieskończenie
wiele kul, zaś na każdej z nich napisany jest wynik
pomiaru pewnej wielkości x, obarczony jedynie niepewnością
przypadkową, podlegającą rozkładowi normalnemu
N(
,
).
Nazwijmy ten zbiór kul populacją generalną.
W tej populacji najwięcej jest oczywiście kul, na których
znajdują się liczby bliskie m, zaś kul
z wartościami znacznie się różniącymi
od m jest dużo mniej. Gdy wykonujemy np. pięciokrotny
pomiar tej wielkości x, to jest tak, jakbyśmy
pięciokrotnie losowali w sposób zupełnie przypadkowy
kule z tej populacji generalnej. Liczby na tych wylosowanych kulach
to właśnie wyniki naszych pomiarów. Powstaje
pytanie, czy parametry obliczone z tych wartości pomiarowych
pozwolą obliczyć odpowiednie parametry populacji generalnej
tzn.
i
? Parametry obliczone z próby celem uzyskania
informacji o populacji generalnej nazywa się estymatorami.
Estymatory są tym lepszym przybliżeniem parametrów
z populacji, im są obliczone z próby o coraz większej
liczebności. Należy podkreślić, że estymatory
obliczone z próby, nie są identyczne z parametrami
populacji ogólnej i same podlegają prawom statystyki.
Poniżej podamy bez dowodu estymatory dla próby dużej i małej.
Próba duża n > 30
a) Estymatorem wartości oczekiwanej m jest średnia arytmetyczna

b) Estymatorem odchylenia standardowego s jest odchylenie standardowe
z próby Sx

Próba mała i bardzo mała n < 30
a) Estymatorem wartości oczekiwanej m jest średnia arytmetyczna

b) Estymatorem odchylenia standardowego s jest odchylenie standardowe
dla małej próby

W powyższym wzorze tn jest współczynnikiem liczbowym, zależnym od ilości pomiarów n, zwanym wartością krytyczną rozkładu Studenta. Wartości tych współczynników podano w tabeli.
Sens fizyczny średniej arytmetycznej z próby jest oczywisty: jest to taka wartość, która najbardziej zbliżona jest do wartości rzeczywistej mierzonej wielkości. Nie twierdzimy, że jest ona dokładnie równa wartości rzeczywistej, bowiem powtórne wykonanie serii pomiarowej da nam z reguły inną wartość średniej arytmetycznej. Wartości średnie różnych prób same podlegają rozkładowi normalnemu z własnym odchyleniem standardowym (patrz dalej ).
Odchylenie standardowe z prób interpretujemy jako miarę
niepewności przypadkowej pojedynczego pomiaru. Jest
to wiekość inna niż niepewność przypadkowa
średniej arytmetycznej, dla której miarą
jest odchylenie standardowe średniej arytmetycznej
a) dużej próby n > 30

b) dla próby małej i bardzo małej n < 30

Jak tego należało oczekiwać, te ostatnie odchylenia
standardowe
są mniejsze od
Sx, ponieważ w średniej niepewności
"kasują się", zmniejszając w ten sposób
niepewność pomiarową.
Przykład 6. Wykonano n = 8 pomiarów czasu zderzenia dwu metalowych kul
i uzyskano następujące wartości (wszystkie w ms): 125, 134, 121, 128,
127, 129, 130, 125. Obliczyć wartość średnią
i odchylenie standardowe. Wartość średnia

obliczymy z powyższych wzorów , otrzymując

Niepewność pomiarowa pojedynczego pomiaru wynosi zatem
4,2
s, a niepewność średniej arytmetycznej wynosi
1,5
s. Ostatecznie zapiszemy
3.3. ROZKŁAD STUDENTA, ESTYMACJA PRZEDZIAŁOWA WARTOŚCI
OCZEKIWANEJ
Dla prób o małej liczebności stosujemy zamiast
rozkładu normalnego rozkład Studenta. Dla dużej
próby jest on identyczny z rozkładem Gaussa, dla niewielkich
wartości n krzywa Studenta jest bardziej płaska
i odległość między punktami przegięcia jest większa niż dla rozkładu normalnego.
Rozkład Studenta jest stabelaryzowany, ale zwykle nie interesuje
nas ani gęstość prawdopodobieństwa, ani
dystrybuanta, lecz tzw. wartości krytyczne tn,a
Parametr a, występujący jako wskaźnik przy t,
nazywa się poziomem istotności, zaś (1
- a) nosi nazwę poziomu ufności.
Sens poziomu istotności (lub poziomu ufności) wynika
z poniższego równania
które mówi, że prawdopodobieństwo tego,
że wartość Q leży w przedziale (q1,
q2) jest równe 1 - a. Wartość
a przyjmuje się dowolnie, jednakże w pomiarach fizycznych
wybiera się ją tak, aby 1 - a było równe
lub większe od 0,95. Oznacza to, że będziemy
twierdzili coś z prawdopodobieństwem 95 % lub większym.
Szerokość przedziału (q1,q2)
zwanego przedziałem ufności zależy oczywiście
od poziomu ufności. Im wyższy poziom ufności, tym
szerszy przedział ufności.
Stosując rozkład Studenta, można udowodnić,
że
Jest to bardzo ważne równanie, bowiem pozwala wnioskować
o nieznanej rzeczywistej wartości (
Przykład 7: Posługując się danymi
z przykładu 6, podać przedział ufności dla
1 - a = 0,98.
Z tabeli odczytujemy wartość krytyczną t8;0,02
= 2,998. Wyrażenie:
Stąd
Oznacza to, że nieznana wartość oczekiwana (czyli
rzeczywista wartość czasu zderzenia kul)znajduje się
z prawdopodobieństwem 98 % w przedziale:
(Używam litery a zamiennie, ze zwyczajowo
używaną, literą
ze względu na wygodę pisania).
Wartości
tn,a podane są w tabeli . Zauważmy,
że tn występujące we wcześniejszych wzorach
jest wartością krytyczną tn,a dla a = 0,317.


) z obliczonej średniej
arytmetycznej
.
ma wartość
równą

(123,3
s;
131,5
s).