Posudzovanie distribúcie údajov s využitím histogramu
Histogram
Histogram sa využíva na vyjadrenie, koľkokrát sa vyskytujú jednotlivé hodnoty premennej (na vyjadrenie frekvencie distribúcie).

Ide o graf znázorňujúci na jednej z osí hodnoty pozorovaní, stĺpce histogramu vyjadrujú, koľkokrát sa konkrétne hodnoty v súbore údajov vyskytujú.

Histogram môže mať rozličný tvar a veľkosť, môže mať jeden vrchol, alebo viacero vrcholov (multimodálny histogram).

V ideálnom svete by boli údaje rozložené okolo stredu symetricky. Priamka vedená cez stred histogramu by rozdeľovala histogram na 2 rovnaké časti zrkadlovo obrátené. Takáto ideálna distribúcia je známa ako normálna distribúcia (Gaussova krivka). Má tvar zvona, čo vyjadruje, že väčšina údajov leží v okolí stredu a čím viac sa hodnota údajov odchyľuje od stredu, tým viac klesá frekvencia výskytu údajov.

Distribúciu vybraných údajov potom možno posúdiť porovnaním distribučnej krivky vybraných údajov s krivkou normálnej distribúcie. Odklon distribučnej krivky vybraných údajov od krivky normálnej distribúcie vyjadruje odklon distribúcie vybraných údajov od normality.

Pre distribúciu údajov platí, že čím je vzorka väčšia, tým sa distribúcia údajov viac približuje k normálnej distribúcii.