Metóda najmenších štvorcov je spôsob tvorby čo najlepšie prispôsobenej regresnej priamky párom údajov, ktoré máme k dispozícii. Prvýkrát bola publikovaná Legendrom, hoci Carl Friedrich Gauss popísal metódu už o 10 rokov skôr (vo svojich 17 rokoch). Základom metódy najmenších štvorcov je snaha nájsť takú hodnotu interceptu a sklon priamky, aby súčet štvorcov vertikálnej vzdialenosti každého z pozorovaných bodov od regresnej priamky bol čo najmenší možný.
Ak je predikovaný výsledok konštantný (má hodnotu priemeru závislej premennej), pri akejkoľvek zmene nezávislej premennej zostáva závislá premenná konštantná-priemer. Regresná priamka je v tom prípade horizontálna.
Nulová hypotéza jednoduchej lineárnej regresie znie, že neexistuje lineárny vzťah medzi premennými v populácii. Nulovú hypotézu prijímame, ak sklon priamky (regresný koeficient) nie je štatisticky odlišný od 0, alebo ak konfidenčný interval zahŕňa 0, pretože toto poukazuje na nedostatok signifikantnosti lineárneho vzťahu. Ak testujeme na hladine významnosti 95 % znamená to, že pri prijatí tohto rozhodnutia prijímame najviac 5 % šancu, že sa mýlime (
V procese rozhodovania sa môže stať chyba, zapríčinená pravdepodobnostným charakterom rozhodovacieho procesu: chyba I. typu - keď sa odmietne pravdivá nulová hypotéza alebo chyba II. typu - keď sa prijme falošná nulová hypotéza. Uvedomenie tejto možnosti, vyplývajúcej z faktu, že hypotézu prijímame, alebo odmietame s určitou pravdepodobnosťou (čiže môže dôjsť aj k situácii, ktorá je síce menej pravdepodobná, ale môže sa stať), vedie k tomu, že nikdy nie sme oprávnení na základe štatistickej inferencie niečo deterministicky tvrdiť, ale vždy je nutné poukázať na úroveň istoty (neistoty), ktorá je vo výsledku skrytá. Chyba I. typu a chyba II. typu sú vzájomne previazanými chybami. Znižovanie chyby jedného typu vedie k zväčšovaniu chyby druhého typu. Preto je potrebné nájsť kompromis medzi nimi. Z uvedeného dôvodu sa obvykle volí hladina významnosti = 0,05.
chyba I. typu
) .
Alternatívna hypotéza znie, že existuje lineárny vzťah medzi premennými v populácii.