Lineær regresjon og minste kvadrats metode
Contents |
Innledning
Modellering kan vi forenklet si handler om å finne en matematisk formel som kan beskrive sammenhengen mellom to eller flere størrelser fra det virkelige liv. I tabellen som du finner nedenfor, er skonummer og høyde koblet sammen for 9 utvalgte personer, og vi vil finne den linjen som best beskriver sammenhengen mellom disse to størrelsene. (Tallene er hentet fra Oppgave 4.10 i Sigma 2P, Gyldendal forlag)
Vi skal i alt bruke tre metoder for å løse denne oppgaven. Alle oppgavene blir løst ved dynamiske arbeidsark der GeoGebra er underliggende programvare.
Enhver linje kan bli uttrykt på formen y = ax + b hvor vi kaller a for stigningstallet og b for konstantleddet. Å løse oppgaven betyr derfor å finne den a og b som gjør at linjen ligger nærmest mulig punktene.
Løsning ved å bruke øyemål
Gå inn i følgende html-fil og følg instruksjonene:
-
[1] av Torger Nilsen
Igjen minnes om at du må skrive ned den beste linjen som du kan finne ved denne bare å bruke øyemål, det som ser riktig ut. Du skal skrive formelen for linjen på formen y = ax + b.
Løsning ved å bruke kvadratsum
Gå inn i følgende html-fil og følg instruksjonene:
-
[2] av Torger Nilsen
Kvadratsummen er, som det kommer fram av ovennevnte html-fil, summen av kvadratene til alle linjestykkene som går loddrett fra hvert punkt og ned/opp på linjen c. Det vil alltid være et definisjonsspørsmål hva som er den beste linjen. Ved denne metoden sier vi at den beste linjen er det linjen som gir den laveste kvadratsummen. Vi har altså nå fått en målbar størrelse til å vurdere hva som er den beste linjen. Svaret er derfor ikke bare et resultat av synsing som tilfellet var ved forrige metode.
Minstekvadrats metode er en vanlig metode for å finne den beste modellen for sammenhengen mellom ulike størrelser. Metoden som vi har brukt her, ligger svært nær minstekvadrats metode. Imidlertid har en i tillegg utviklet algebraiske metoder for å finne de beste verdiene for a og b . Det går nok raskere enn den prøvingen og feilingen som vi er nødt til å bruke.
Løsning ved bruk av lineær regresjon
De to første metodene som vi har arbeidet med, viser seg både å være noe usikre og tidkrevende. Vi trenger derfor en metode som kan gjøre dette raskere og sikrere. Følg instruksjonene i følgende pdf-fil:
-
[3] av Torger Nilsen
Vurdering av modellen
Når vi arbeider med modeller, er det nødvendig at vi vurderer den modellen vi er kommet fram til. Dette kommer vi ikke inn på i dette opplegget utover å poengtere nødvendigheten av å gjøre slike vurderinger
Tilbake til den norske hovedsiden