Statistiki uporabo tehnike linearne regresije , da bi našli premico , ki najbolje ustreza serije X in Y podatkovnih parov . To storite tako skozi vrsto izračunov , ki izhajajo enačbo najboljšo linijo. Ta matematični opis proge bolinearna enačba in imajo splošno obliko y = mx + b , kjer sta x in y dve spremenljivki v podatkovnih parov , m jenaklon črte in b je njegova y osi .
koeficient korelacije
izračuni , ki najdejo najboljšo premico, bo dala linearno enačbo , da se prilega kateri koli niz podatkov , čeprav je, da podatki niso pravzaprav zelo linearna. Da bi imeli podatke o tem, kako dobro se podatki dejansko fit ravne črte , statistiki izračunali tudi številna znana kot korelacijskim koeficientom . Ta je podan simbol R ali R in jemerilo, kako tesno usklajene podatkovne pari so na najboljši ravni liniji skozi njih .
Pomen R
R ima lahko katerokoli vrednost med -1 in 1.negativna vrednost R preprosto pomeni, da se nagnepremica premikanje navzdol, od leve proti desni , ne pa navzgor . Bližje R je bodisidveh ekstremov ,boljšeprileganje podatkovnih točk črto , bodisi -1 ali 1 papopolno prileganje invrednost R nič smislu , da ni sposoben in točke so povsem naključno. Če so podatkovne točke dobro usklajena na premico , ki je tam dejal, da je povezava med njimi , od tod tudi ime koeficient korelacije za R.
R2
Nekateri statistiki raje dela z vrednostjo R2, ki je preprostokoeficient korelacije kvadrat ali pomnoženo sam, in je znan kot determinacijski koeficient . R2 je zelo podoben R in opisuje tudi korelacijo med obema spremenljivk , vendar je prav tako nekoliko drugačen . Meri odstotkov variacije spremenljivke y , ki jih je mogoče pripisati razlike v spremenljivko x . R2 vrednost 0,9 , na primer , pomeni , da je 90 odstotkov variacije v podatkih y zaradi razlik v x podatkov . To ne pomeni nujno, da x je resnično vpliva na y , vendar se zdi , da se delaš tako .