Regresjon

I forrige avsnitt har vi kun vist at \(y = 2,5 \cdot x\) beskriver punktene bedre enn \(y = 1,5 \cdot x\). Vi har enda ikke funnet den optimale funksjonen. Her skal vi bruke den kunnskapen vi kjenner fra derivasjon og vekstfart

Hvis vi forestiller oss kvadratenes samlede areal \(T\) som en funksjon av proporsjonalitetsfaktoren \(a\), så vil den være et andregradspolynom. Det kan vi vise med en utvidelse av kvadratregelen \((c - a \cdot b)^2 = c^2 + a^2 \cdot b^2 - 2abc\).
Da \(a\) er den eneste ukjente, så kan alle de andre leddene reduseres til enkelte tall, og når den samlede sum finnes vil den høyeste eksponenten \(a\) fortsatt være \(2\).

En av fordelen med et andregradspolynom er at det alltid har et ekstremalpunkt som kan finnes ved å sette funksjonen lik null. At toppunktet i vår modell vil være de globale minimum, skyldes at alle koeffisientene for \(a^2\) er positive, da de er våre x-verdier kvadrert.

Regression2

I eksempelet fra tidligere hadde vi punktene \(P\), \(Q\) og \(S\). Setter vi dem inn i vår funksjon for \(T(a)\) får vi:

\(T(a) = (2 - a \cdot 1)^2 + (7 - a \cdot 4)^2 + (15 - a \cdot 7)^2 = 66 \cdot a^2 - 270 \cdot a + 278\)
\(T'(a) = 66 \cdot 2 \cdot a - 270 = 132 \cdot a - 270\)

Hvis vi deretter setter T’(a) lik med null får vi toppunktets førstekoordinat, som er:

\(132 \cdot a - 270 = 0\)
\(a = \frac{270}{132} \approx 2,045\)

Den best beskrivende proporsjonalitetsfaktoren er altså cirka 2,045. Og det samlede arealet er:

\(T( \frac{270}{132} ) = \frac{41}{22} \approx 1,86\)

Den samme prosedyren kan overføres til eksponentialfunksjoner av typen \(a^x\) og potensfunksjoner \(x^a\). Det neste logiske skritt ville være å tilføye en ekstra variabel til de tre tilfellene.

Har du et spørsmål, du vil stille om Regresjon? Send oss en mail!
Har du en kommentar til innholdet på denne siden? Send oss en mail!