Viacnásobná logistická regresia v programovom prostredí R
 
 
Step: Viacnásobná logistická regresia...
  Viacnásobná logistická regresia
Potom príkaz bude vyzerať nasledovne:
summary(glm (y~x1+x2+x3+x4+ ...+xn),family=binomial, data=nazov_objektu))



Vysvetlivky k príkazom

y - závislá binárna premenná
x
- nezávislá premenná
nazov_objektu - názov objektu/ databázy s údajmi
Príklad
Výskumník zisťoval, či má vplyv skóre prestíže zamestnania írskych otcov (fathocc) na ukončenie vzdelania ich detí s certifikátom (lvcert=1) alebo bez certifikátu (lvcert=0), pričom zobral do úvahy aj typ školy (schltype), ktorú dieťa navštevuje a úroveň kognitívnych schopností dieťaťa (meraná pomocou Drumcondra Reasoning Test- DVRT). Keďže premenná vyjadrujúca ukončenie vzdelania dieťaťa s alebo bez certifikátu je binárna, výskumník využil viacnásobnú logistickú regresiu na bližšiu charakteristiku vzťahu medzi prestížou zamestnania otca a vzdelaním jeho dieťaťa, pričom bral do úvahy aj typ školy a úroveň kognitívnych schopností dieťaťa. Výstupom príkazu
summary(glm (formula= lvcert~ fathocc+ schltype+ DVRT,family=binomial, data=irished))

sú regresné koeficienty pre skóre prestíže zamestnania otca, pre typ školy a pre úroveň kognitívnych schopností dieťaťa a pre každý regresný koeficient aj p-hodnota.

H0: Prestíž zamestnania otca nemá štatisticky významný vplyv na skutočnosť, či dosiahne dieťa vzdelanie s certifikátom, ak zoberieme do úvahy aj typ školy, ktorú dieťa navštevuje a úroveň kognitívnych schopností dieťaťa.
HA: Prestíž zamestnania otca má štatisticky vplyv na skutočnosť, či dosiahne dieťa vzdelanie s certifikátom ak zoberieme do úvahy aj typ školy, ktorú dieťa navštevuje a úroveň kognitívnych schopností dieťaťa.

Z výstupu logistickej regresie usúdil, že vplyv prestíže zamestnania otcov na ukončenie vzdelania ich detí je štatisticky významný (na hladine významnosti 95% p< 0,05) za predpokladu, že všetky ostatné nezávislé premenné v modeli sa zachovajú konštantné.
Regresný koeficient kvôli lepšej interpretovateľnosti prepočítal na OR.
 
 
Step: Prepočet regresného koeficienta na OR pri viacnásobnej logi...
  Prepočet regresného koeficienta na OR pri viacnásobnej logistickej regresii, výpočet konfidenčného intervalu
Potom príkaz bude vyzerať nasledovne:
# zistenie regresných koeficientov

sum.coef<-summary(glm (formula= y~x,family=binomial,data= nazov_objektu))$coef

# prepočet regresných koeficientov na OR

est<-exp(sum.coef[,1])

# výpočet horného konfidenčného intervalu

upper.ci<-exp(sum.coef[,1]+1.96*sum.coef[,2])

# výpočet dolného konfidenčného intervalu

lower.ci<-exp(sum.coef[,1]-1.96*sum.coef[,2])

# sumár (regresný koeficient, štandardná chyba, hodnota testovacej štatistiky z, p-hodnota, OR, dolný CI, horný CI)

cbind(sum.coef,est,lower.ci,upper.ci)


Vysvetlivky k príkazom

y - závislá binárna premenná
x
- nezávislá premenná
Príklad
S využitím nasledujúcich príkazov výskumník prepočítal regresné koeficienty pre skóre prestíže zamestnania otca, pre typ školy a pre úroveň kognitívnych schopností dieťaťa na OR a vypočítal 95% konfidenčný interval pre každé OR.
sum.coef<-summary(glm (formula= lvcert~ fathocc+ schltype+ DVRT,family=binomial,data=irished))$coef
est<-exp(sum.coef[,1])
upper.ci<-exp(sum.coef[,1]+1.96*sum.coef[,2])
lower.ci<-exp(sum.coef[,1]-1.96*sum.coef[,2])
cbind(sum.coef,est,lower.ci,upper.ci)
vlr2.jpg


Keď sa zvýši skóre prestíže zamestnania otca o jednu jednotku, zvýši sa šanca dieťaťa dosiahnuť vzdelanie s certifikátom 1,018-násobne (95%CI: 1,004-1,032)
 za predpokladu, že všetky ostatné nezávislé premenné v modeli sa zachovajú konštantné.