4.1 Lineaire regressie
- Eerste stap is het fitten van het model met de functie
lm()
. - Tweede stap is de output bekijken met
summary()
- Derde stap zou kunnen zijn om het geschatte model te gebruiken voor voorspellingen
Deze stappen worden geïllustreerd aan de hand van een dataset van boomhoogte, diameter en volume:
data(trees)
<- lm(trees$Height~trees$Girth)
fit summary(fit)
Wil je nu voorspellen wat de hoogte is van een boom met een diameter 10 inch, dan kan dat met de functie predict
.
Voorwaarde voor de functie is dat de vectornamen van je model exact overeenkomen met die van je voorspelling.
De oplossing is om de functie lm()
uit te voeren in de volgende vorm:
<- lm(Height~Girth, data=trees) fit
Verder moet de info voor de voorspelling aangereikt worden in de vorm van een dataframe:
<- data.frame(Girth=10) voorspelling
predict(fit, voorspelling)
Wil je een 95%-betrouwbaarheidfsinterval van de voorspelling kan je dan aangeven met een argument:
predict(fit, voorspelling, interval = "confidence")
Standaard staat het niveau op 95%.
Wil je dat veranderen, kan dat met het argument level
.
Als voorbeeld het 80%-betrouwbaarheidsinterval:
predict(fit, voorspelling, interval = "confidence", level = 0.8)