5.2. REGRESJA LINIOWA

Często spotykamy się z taką sytuacją, gdy mierzono dwie wielkości x i y związane są ze sobą równaniem liniowym

y = ax + b

tak jest np. w przypadku temperaturowej zależności oporu elektrycznego metali

R = f(T), skręcenia płaszczyzny polaryzacji światła w funkcji stężenia roztworu cukru a = f(s), okresu drgań relaksacyjnych w obwodzie kondensatora i neonówki od pojemności kondensatora T = f(C) itp.

Wykonując pomiary tych dwu wielkości x i y uzyskujemy pary liczb (xi, yi) i naszym zadaniem jest znaleźć równanie linii prostej (tzn. parametry a i b w równaniu prostej), najlepiej "pasującej" do nich. Niech równanie to będzie miało postać

a "dopasowanie" zgodnie z metodą najmniejszych kwadratów oznacza, że

gdzie a i b są emiprycznymi współczynnikami regresji liniowej.

Jak łatwo zauważyć, wyrażenie w nawiasie w tym równaniu jest odchyleniem punktu eksperymentalnego (liczonym wzdłuż osi y) od odpowiadającej mu wartości wynikającej z równania prostej. Poszukując ekstremum związanego powyższego równania udowadnia się, że

gdzie i = 1,2,3,...,n, czyli n jest ilością par punktów (xi, yi).

Na odchylenie standardowe Sa i Sb, będące miarą niepewności pomiarowych współczynników regresji a i b otrzymuje się następujące równania

 

Kryterium tego, jak nasze punkty pomiarowe (xi,yi) potwierdzają liniową zależność pomiędzy wielkościami x i y, stanowi wartość tzw. współczynnika korelacji liniowej r. Jego wartość zmienia się w granicach od 1 do 0. Gdy |r| = 1, to dopasowanie jest idealne, wszystkie punkty pomiarowe leżą na prostej. Gdy r = 0, to zależność liniowa pomiędzy xi i yi nie istnieje. W pomiarach fizycznych wartość współczynnika korelacji r jest zwykle większa niż 0,98. Wzór na współczynnik korelacji

Przykład 11. Wykonując pomiary temperaturowej zależności oporu elektrycznego

metalu otrzymano następujące rezultaty:
temperatura [oC] 19 38 50 65 80
opór [] 150 159 170 175 185

Znaleźć równanie prostej najlepiej pasującej do tych danych oraz

współczynnik korelacji.

Wzory, z których będziemy korzystać ( zawierają różne sumy, które obliczymy na początku. U nas xi to temperatury, a yi to opory elektryczne, i = 1,2,3,4,5.

Podstawiając te wartości do wzorów (5.3) - (5.7) otrzymamy:

Tak więc nasze x i y spełniają równanie regresji liniowej postaci

y = 0,57 x + 139 lub y = 0,57(4) + 139(2)

Punkty pomiarowe i prosta o tym równaniu zostały pokazane na rysunku 5 , po lewej stronie.

5.3. TRANSFORMACJA NIEKTÓRYCH FUNKCJI NIELINIOWYCH

DO POSTACI LINIOWEJ

Regresję liniową można zastosować do tych zależności nieliniowych, które przez odpowiednią transformację zmiennych można zlinearyzować. Rozpatrzmy te, które spotyka się w pracowni studenckiej.

a) równanie typu

y = yoeax

gdzie yo i a są stałymi, które należy wyznaczyć.

Równanie tego typu opisuje np. zależność amplitudy drgań tłumionych od czasu

A = Aoe-t, aktywność próbki promieniotwórczej w czasie a = aoe-t itp. Sprowadźmy to równanie do postaci liniowej. W tym celu najpierw zlogarytmujmy je stronami

ln y = ln yo + ax

Jeżeli zatem na osi rzędnych odłożymy lny = z , to powyższe równanie będzie równaniem prostej

z = ln yo + ax

gdzie b = ln yo, zaś a= a

b) równanie typu

y = yoea/x

Z równaniem tego typu spotykamy się, gdy badamy temperaturową zależność oporu elektrycznego półprzewodników R = R0 e-a/T, temperaturowa zależność współczynnika lepkości cieczy = oeE/RT, zależność temperatury wrzenia wody od ciśnienia p = poe-E/RTitp. Aby sprowadzić takie równanie do postaci liniowej, należy je najpierw zlogarytmować

a następnie dokonać podstawienie

Wówczas otrzymamy

t = ln yo + az,

które jest równaniem liniowym, wiążącym t i z.

Zatem sporządzając wykres, należy na osi odciętych odłożyć 1/x a na osi rzędnych ln y.




DALEJ