3.3 GLM in R

De functie voor de GLM in R is lm(r~v), waarbij r de responsvariabele is en v de verklarende variabele. Wanneer v een interval/ratio-variabele is, dan voert de lm een regressie uit. Wanneer v een nominale variabele is dan verdeelt de lm de data in groepen (zoals in bovenstaande figuur).

De output van lm bekijk je met de functie anova(). Hoe ziet dan een mogelijk script uit?

library(readxl)
df <- read_excel("data.xlsx")
fit <- lm(df$r~df$v)
anova(fit)

De stappen uitgelegd:

  • Library readxl activeren om data uit Excel te kunnen lezen.
  • Data importeren uit bijv. Excel.
  • GLM uitvoeren en opslaan als object met de naam fit.
  • De anova-tabel van de GLM bekijken.

In de volgende hoofdstukken gaan we stap voor stap de GLM uitvoeren, te beginnen met de lineaire regressie.