\(R^2\)

I forrige avsnitt viste vi hvordan man kunne finne den funksjonen som passer best til en rekke koordinatsett. At vi har funnet den beste funksjonen til å beskrive en mengde koordinatsett betyr dog ikke at det er en sammenheng mellom de to variablene. I eksempelet vi brukte tidligere ser det ut som om det er en sammenheng, men vi vil gjerne ha et mål for sammenhengen. 

Det første skrittet er å finne det samlede arealet under antakelse av at et ikke er en sammenheng mellom de to variablene. Her måler vi ikke avstanden til en funksjon \( y = a \cdot x\), men derimot \(\bar{y}\). Her er \(\bar{y}\) lik den gjennomsnittlige y-verdien for alle koordinatsettene. I vårt eksempel er \(\bar{y}= \frac{2+7+15}{3} = 8\).

Ved å bruke \(\bar{y}\) til å finne det samlede arealet hvis de er uavhengige, \(T_u\), får vi:

\((2 - 8)^2 + (7 - 8)^2 + (15 - 8)^2 = 86\)

Det er tydeligvis en mye dårligere funksjon enn den vi fant tidligere. For å få et generelt uttrykk for hvor stor sammenhengen mellom variablene er skal vi nå finne det som heter R2-verdien. Den kan beskrives som vist under, og den gir alltid et tall mellom 0 og 1. Jo tettere på 1, jo bedre er sammenhengen.

\(R^2 = 1 - \frac{T}{T_u}\)

Innenfor forskjellige vitenskapet har man forskjellige krav på hvor god en sammenheng skal være før den anses som "gyldig". I naturvitenskap sikter man etter en (R^2\) på mer enn 0,95-mens man innenfor samfunnsvitenskapen ofte godtar sammenhenger fra 0,65 og oppover.

I vårt eksempel er vår \(R^2\) lik:

\(R^2 = 1 - \frac{T}{T_u} = 1 - \frac{T(\frac{270}{132})}{86} = \frac{1851}{1892} \approx 0,98\)

Det betyr at det er en meget sterk sammenheng. 
Et tilfelle med en dårlig sammenheng er avbildet under.

Regression3

Den røde linjen er her den funksjonen som best forklarer den proporsjonelle sammenhengen (funnet på den måten som er beskrevet tidligere). Den har forskriften \(y = \frac{10}{13} \cdot x\) og den stiplede blå linjen er den gjennomsnittlige y-verdien. R2-verdien for dette eksempelet er 0,49-noe som er veldig lavt. Det er altså ikke snakk om en proporsjonell sammeheng. Dette utelukker ikke en annen type sammenheng som f.eks. eksponentiell funksjon.

Har du et spørsmål, du vil stille om \(R^2\)? Send oss en mail!
Har du en kommentar til innholdet på denne siden? Send oss en mail!