1.6 Innlesing av data
Vi leser inn tabellen i excelfilen som en tabell (“data frame”) i R ved hjelp av funksjonen read_xls()
i readxl
-pakken og ser på noen enkle kommandoer for å jobbe med en slik tabell.
# Datasettet er i .xls-formatet, så vi trenger readxl-pakker for å laste det inn
# i R.
library(readxl)
# Inne i denne pakken så er det en funksjon som heter read_excel:
read_excel("testdata.xls")
# Det gikk bra, men for å bruke dette datasettet, så må vi lagre det til en
# variabel.
testdata <- read_excel("testdata.xls")
# Skriver ut (toppen av) datasettet.
testdata
# Nå ser vi datasettet i vinduet oppe til høyre. Vi kan se på det ved å
# skrive navnet til datasettet i konsollen, og vi kan hente ut individuelle
# kolonner som vektorer ved å bruke dollartegnet $:
testdata$X1
# Regner ut gjennomsnittet for X1 og X2:
mean(testdata$X1)
mean(testdata$X2)
# Hvor mange rekker/observasjoner har vi?
nrow(testdata)
Oppgave:
- Hvor mange kolonner har datasettet vårt?
- Kan du finne en måte å skrive ut en vektor som inneholder summen av
X1
- ogX2
-kolonnene i datasettet? (Altså, vi vil vite summen av de to første elementene iX1
ogX2
, summen av de to andre elementene, osv.) - Hva er summen av alle tallene i
X1
- ogX2
-kolonnene itestdata
?