3.2. POPULACJA GENERALNA, PRÓBA, ESTYMATORY

Dokładne poznanie rozkładu normalnego wymaga wykonania nieskończonej ilości pomiarów, co oczywiście nie jest możliwe. Praktycznie dysponujemy jedynie skończoną, i zwykle niewielką ilością pomiarów. Nazwijmy zespół tych pomiarów próbą.
Próba może być duża, np. gdy ilość pomiarów n > 30, jak też i mała 10 < n < 30 , lub bardzo mała n < 10.
Termin próba pojawił się dzięki następującej analogii. Wyobraźmy sobie, że pojemnik zawiera nieskończenie wiele kul, zaś na każdej z nich napisany jest wynik pomiaru pewnej wielkości x, obarczony jedynie niepewnością przypadkową, podlegającą rozkładowi normalnemu N(,). Nazwijmy ten zbiór kul populacją generalną. W tej populacji najwięcej jest oczywiście kul, na których znajdują się liczby bliskie m, zaś kul z wartościami znacznie się różniącymi od m jest dużo mniej. Gdy wykonujemy np. pięciokrotny pomiar tej wielkości x, to jest tak, jakbyśmy pięciokrotnie losowali w sposób zupełnie przypadkowy kule z tej populacji generalnej. Liczby na tych wylosowanych kulach to właśnie wyniki naszych pomiarów. Powstaje pytanie, czy parametry obliczone z tych wartości pomiarowych pozwolą obliczyć odpowiednie parametry populacji generalnej tzn. i ? Parametry obliczone z próby celem uzyskania informacji o populacji generalnej nazywa się estymatorami. Estymatory są tym lepszym przybliżeniem parametrów z populacji, im są obliczone z próby o coraz większej liczebności. Należy podkreślić, że estymatory obliczone z próby, nie są identyczne z parametrami populacji ogólnej i same podlegają prawom statystyki.

Poniżej podamy bez dowodu estymatory dla próby dużej i małej.

Próba duża n > 30

a) Estymatorem wartości oczekiwanej m jest średnia arytmetyczna

b) Estymatorem odchylenia standardowego s jest odchylenie standardowe

z próby Sx

Próba mała i bardzo mała n < 30

a) Estymatorem wartości oczekiwanej m jest średnia arytmetyczna

b) Estymatorem odchylenia standardowego s jest odchylenie standardowe

dla małej próby

W powyższym wzorze tn jest współczynnikiem liczbowym, zależnym od ilości pomiarów n, zwanym wartością krytyczną rozkładu Studenta. Wartości tych współczynników podano w tabeli.

Sens fizyczny średniej arytmetycznej z próby jest oczywisty: jest to taka wartość, która najbardziej zbliżona jest do wartości rzeczywistej mierzonej wielkości. Nie twierdzimy, że jest ona dokładnie równa wartości rzeczywistej, bowiem powtórne wykonanie serii pomiarowej da nam z reguły inną wartość średniej arytmetycznej. Wartości średnie różnych prób same podlegają rozkładowi normalnemu z własnym odchyleniem standardowym (patrz dalej ).

Odchylenie standardowe z prób interpretujemy jako miarę niepewności przypadkowej pojedynczego pomiaru. Jest to wiekość inna niż niepewność przypadkowa średniej arytmetycznej, dla której miarą jest odchylenie standardowe średniej arytmetycznej

a) dużej próby n > 30

b) dla próby małej i bardzo małej n < 30

Jak tego należało oczekiwać, te ostatnie odchylenia standardowe są mniejsze od Sx, ponieważ w średniej niepewności "kasują się", zmniejszając w ten sposób niepewność pomiarową.

Przykład 6. Wykonano n = 8 pomiarów czasu zderzenia dwu metalowych kul

i uzyskano następujące wartości (wszystkie w ms): 125, 134, 121, 128,

127, 129, 130, 125. Obliczyć wartość średnią i odchylenie  standardowe. Wartość średnia


W tabeli odczytujemy wartość krytyczną t8 = 1,0765, a odchylenia standardowe St i obliczymy z powyższych wzorów , otrzymując

Niepewność pomiarowa pojedynczego pomiaru wynosi zatem 4,2 s, a niepewność średniej arytmetycznej wynosi 1,5 s. Ostatecznie zapiszemy

>

3.3. ROZKŁAD STUDENTA, ESTYMACJA PRZEDZIAŁOWA WARTOŚCI

OCZEKIWANEJ

Dla prób o małej liczebności stosujemy zamiast rozkładu normalnego rozkład Studenta. Dla dużej próby jest on identyczny z rozkładem Gaussa, dla niewielkich wartości n krzywa Studenta jest bardziej płaska i odległość między punktami przegięcia jest większa niż dla rozkładu normalnego. Rozkład Studenta jest stabelaryzowany, ale zwykle nie interesuje nas ani gęstość prawdopodobieństwa, ani dystrybuanta, lecz tzw. wartości krytyczne tn,a Parametr a, występujący jako wskaźnik przy t, nazywa się poziomem istotności, zaś (1 - a) nosi nazwę poziomu ufności.
(Używam litery a zamiennie, ze zwyczajowo używaną, literą ze względu na wygodę pisania).
Wartości tn,a podane są w
tabeli . Zauważmy, że tn występujące we wcześniejszych wzorach jest wartością krytyczną tn,a dla a = 0,317.

Sens poziomu istotności (lub poziomu ufności) wynika z poniższego równania

które mówi, że prawdopodobieństwo tego, że wartość Q leży w przedziale (q1, q2) jest równe 1 - a. Wartość a przyjmuje się dowolnie, jednakże w pomiarach fizycznych wybiera się ją tak, aby 1 - a było równe lub większe od 0,95. Oznacza to, że będziemy twierdzili coś z prawdopodobieństwem 95 % lub większym. Szerokość przedziału (q1,q2) zwanego przedziałem ufności zależy oczywiście od poziomu ufności. Im wyższy poziom ufności, tym szerszy przedział ufności.

Stosując rozkład Studenta, można udowodnić, że


Jest to bardzo ważne równanie, bowiem pozwala wnioskować o nieznanej rzeczywistej wartości () z obliczonej średniej arytmetycznej .

Przykład 7: Posługując się danymi z przykładu 6, podać przedział ufności dla

1 - a = 0,98.

Z tabeli odczytujemy wartość krytyczną t8;0,02 = 2,998. Wyrażenie:
ma wartość równą

Stąd

Oznacza to, że nieznana wartość oczekiwana (czyli rzeczywista wartość czasu zderzenia kul)znajduje się z prawdopodobieństwem 98 % w przedziale:
(123,3s; 131,5s).

DALEJ