Predikcia regresným modelom znamená, že do regresnej rovnice dosadíme hodnotu nezávislej premennej. Na popis predikčnej schopnosti modelu lineárnej regresie sa využíva koeficient determinácie R2. Je to proporcia variability odpovede, ktorá je vysvetľovaná nezávislou premennou / nezávislými premennými. Koeficient determinácie je v rozsahu od 0 (žiadny lineárny vzťah) do 1 (absolútny lineárny vzťah, či už pozitívny alebo negatívny).
Optimálny regresný model možno vytvoriť dvomi základnými spôsobmi:
|
-
Metóda doprednej selekcie slúži na testovanie signifikantnosti nezávislých premenných. Na začiatku je "prázdny" model bez nezávislých premenných, do ktorého sa postupne po jednej pridávajú nezávislé premenné,
doprednou selekciou
|
|
-
Metóda spätnej selekcie patrí medzi základné testy signifikantnosti nezávislých premenných. Začína s modelom, v ktorom sú všetky nezávislé premenné, ktorých vplyv na závislú premennú skúmame. Následne dochádza k odstráneniu premennej s najvyššou p-hodnotou na základe testu signifikantnosti, ktorá je vyššia, ako vopred určená hladina (napr. p>0,05) . Potom z redukovaného modelu (model, v ktorom boli všetky premenné, ktorých vplyv na závislú premennú sa skúmal bez premennej s najvššou p-hodnotou) opäť odstránime premennú s najvyššou p-hodnotou a tak ďalej. Proces ukončíme vtedy, keď už nemôžeme z modelu odstrániť žiadnu premennú na hladine významnosti 5%. Ak po každom odstránení nezávislej premennej je preverená signifikantnosť všetkých ostatných premenných v modeli, hovoríme o stepwise regression procedure.
spätnou selekciou .
|
Regresný koeficient pri jednoduchej lineárnej regresii interpretujeme ako zmenu závislej premennej pri jednotkovom náraste nezávislej premennej.
Regresný koeficient pri viacnásobnej lineárnej regresii interpretujeme ako zmenu závislej premennej pri jednotkovom náraste nezávislej premennej za predpokladu, že všetky ostatné nezávislé premenné v modeli sa zachovajú konštantné.