Import údajov do systému R
 
 
Step: Ak chceme priamo importovať do systému R numerické údaje...
  Ak chceme priamo importovať do systému R numerické údaje
Potom postupujeme nasledovne:
  • v programe R vytvoríme nový objekt, ktorý nazveme akýmkoľvek názvom (napr. vyska)
  • do vytvoreného objektu priamo (vpisovaním údajov) importujeme akýkoľvek rad číselných hodnôt, pričom využijeme zlučovaciu funkciu c(), ktorá nám slúži na zachovanie presného poradia vpísaných hodnôt
  • číselné údaje je potrebné písať do príkazu bez úvodzoviek
Napríklad, ak máme k dispozícii údaje o telesnej výške desiatich 5-ročných dievčat (102 cm, 103 cm, 120 cm, 106 cm, 124 cm, 116 cm, 105 cm, 102 cm, 110 cm a 107 cm), ktoré chceme importovať do objektu s názvom vyska, môžeme si vybrať jeden z niekoľkých spôsobov.
  • vyska<-c(102,103,120,106,124,116,105,102,110,107)
  • c(102,103,120,106,124,116,105,102,110,107)-> vyska
  • vyska=c(102,103,120,106,124,116,105,102,110,107)
  • assign("vyska", c(102,103,120,106,124,116,105,102,110,107))
Užitočná informácia
Ako desatinnú čiarku používame v systéme R bodku (.).
 
 
Step: Ak chceme priamo importovať do systému R textové údaje...
  Ak chceme priamo importovať do systému R textové údaje
Potom postupujeme nasledovne:
  • v programe R vytvoríme nový objekt, ktorý nazveme akýmkoľvek názvom (napr. bydlisko)
  • do vytvoreného objektu priamo (vpisovaním údajov) importujeme akýkoľvek rad textových údajov (údaje typu string), pričom využijeme zlučovaciu funkciu c(), ktorá nám slúži na zachovanie presného poradia vpísaných textových hodnôt
  • textové údaje je nevyhnutné uvádzať v príkaze v úvodzovkách
Napríklad ak máme k dispozícii údaje o bydlisku vybraných 5-ročných dievčat (Trnava, Diviaky, Gáň, Bardejov, Dolný Kubín, Bratislava, Liptovský Mikuláš, Šaľa, Trenčín a Ľubochňa), ktoré chceme importovať do nového objektu s názvom bydlisko, môžeme využiť príkaz

bydlisko<-c("Trnava", "Diviaky", "Gáň", "Bardejov", "Dolný Kubín", "Bratislava", "Liptovský Mikuláš", "Šaľa", "Trenčín", "Ľubochňa")

Špecifickým typom údajov sú dátumy, ktoré sa importujú podobne ako textové údaje (v úvodzovkách), následne sa však pomocou funkcie as.Date konvertujú na dátumy.

Ako príklad uvádzame dátumy narodenia vybraných 10 dievčat. Podotýkam, že dátumy je potrebné do úvodzoviek zadávať vo formáte YYYY-MM-DD.

datum_narodenia<-c("1999-07-03","1999-05-24","1999-06-21","1999-07-16","1999-10-10","1999-11-05","1999-10-08","1999-09-16","1999-05-20","1999-11-12") datum_narodenia<-as.Date(datum_narodenia)
 
 
Step: Ak chceme spojiť priamo importované údaje a vytvoriť tabuľk...
  Ak chceme spojiť priamo importované údaje a vytvoriť tabuľku
Potom postupujeme nasledovne:na spojenie niekoľkých objektov s importovanými údajmi do tabuľky sa najčastejšie využíva v programovom prostredí R funkcia data.frame

Napríklad ak chceme vytvoriť z údajov o výške, bydlisku a dátume narodenia 5-ročných dievčat tabuľku, pričom tabuľku chceme uložiť do nového objektu s názvom tabulka, využijeme príkaz

tabulka<-data.frame(vyska,bydlisko,datum_narodenia)

Výsledná tabuľka bude mať vzhľad, ako je na

This page uses iframes, but your browser doesn't support them. Sorry!

 
 
Step: Ak chceme importovať údaje z databáz údajov, ktoré sú priam...
  Ak chceme importovať údaje z databáz údajov, ktoré sú priamo v niektorých balíkoch softvéru R
Potom postupujeme nasledovne:
  • na zobrazenie všetkých dostupných balíkov softvéru R s databázami údajov využijeme príkaz
    data(package=.packages (all.available=TRUE))
  • na import údajov z konkrétnej databázy údajov využívame príkaz
    data(nazov_databazy, package="nazov_balika")
Ako príklad uvádzame import databázy údajov o hmotnosti tela a mozgu vybraných živočíchov (databáza Animals), ktorá je súčasťou balíka MASS. Využijeme príkaz
data(Animals, package="MASS")
 
 
Step: Ak chceme importovať údaje z Excelu...
  Ak chceme importovať údaje z Excelu
Potom potrebujeme inštalovať a načítať balík RODBC
  • postup pri načítavaní nových balíkov v programovom prostredí R je pre všetky balíky rovnaký
  • na inštaláciu nových balíkov využívame príkaz:
    install.packages("package.name")
  • na načítanie balíka v softvéri R využívame príkaz
    library(package.name)
    package.name je názov balíka, ktorý chceme inštalovať / načítať
  • majme na pamäti, že balík stačí nainštalovať do počítača iba jedenkrát, načítať ho však musíme vždy pred použitím príkazu, ktorý z konkrétneho balíka pochádza
Napríklad ak chceme nainštalovať balík RODBC, využijeme príkaz
install.packages("RODBC")

Na načítanie balíka RODBC slúži príkaz
library(RODBC)
 
 
Step: Ak máme nainštalovaný a načítaný balík RODBC...
  Ak máme nainštalovaný a načítaný balík RODBC
Potom postupujeme nasledovne pri importe údajov z Excelu
  • uložíme si súbor Excelu na disk (prípona.xls)
  • v systéme R vytvoríme objekt, ktorý nazveme akýmkoľvek názvom (napr. expozicia)
  • do vytvoreného objektu importujeme údaje, pričom využijeme funkciu
    nazov_objektu<-sqlFetch(odbcConnectExcel ("umiestnenie súboru na disku"), sqtable="nazov_harku", na.strings="NA", as.is=T)
    odbcCloseAll()
  • teda ak chceme do systému R importovať tabuľku údajov z Excelu, potrebujeme vedieť:
    • názov objektu, do ktorého chceme údaje importovať,
    • miesto na disku, kde máme súbor uložený (cestu),
    • názov súboru, pod akým je na disku uložený,
    • názov hárku v Exceli, kde je databáza údajov, ktoré chceme importovať, uložená,
    • spôsob označenia chýbajúcich údajov systémom R.
Ako príklad uvádzame import súboru z Excelu do objektu s názvom expozicia, ktorý je umiestený na disku D pod názvom trvanie_expozicie.xls na hárku s názvom databaza. Ak nám budú v Excelovej tabuľke chýbať údaje, chceme, aby do bunky s chýbajúcim údajom bola v systéme R vpísaná skratka NA (not available – nedostupný údaj). Zároveň chceme zabrániť konverzii vektorov na faktory. Toto všetko dosiahneme príkazom:

expozicia<-sqlFetch(odbcConnectExcel ("D:/trvanie_expozicie.xls"), sqtable="databaza", na.strings="NA", as.is=T)
odbcCloseAll()


Na

This page uses iframes, but your browser doesn't support them. Sorry!

 je zobrazená Excelová tabuľka a príkaz jej importu do programového prostredia R.
 
 
Step: Ak chceme importovať údaje z Accessu...
  Ak chceme importovať údaje z Accessu
Potom postupujeme nasledovne
  • uložíme si súbor Accessu na disk
  • v systéme R vytvoríme objekt, ktorý nazveme akýmkoľvek názvom (napr. dojcenie)
  • do vytvoreného objektu importujeme údaje, pričom využijeme funkciu odbcConnectAccess
    nazov_objektu < -odbcConnectAccess("umiestnenie súboru na disku")close(nazov_objektu)
  • teda ak chceme do objektu importovať údaje z Accessu, potrebujeme vedieť:
    • názov objektu, do ktorého chceme údaje importovať,
    • miesto na disku, kde máme súbor uložený,
    • názov súboru, pod akým je na disku uložený
Ako príklad uvádzame import údajov z Accessu do objektu v systéme R s názvom dojcenie, ktorý je umiestený na disku D pod názvom trvanie_dojcenia.

dojcenie < -odbcConnectAccess("D:/trvanie_dojcenia.mdb")close(dojcenie)