1.6 Innlesing av data

Vi leser inn tabellen i excelfilen som en tabell (“data frame”) i R ved hjelp av funksjonen read_xls() i readxl-pakken og ser på noen enkle kommandoer for å jobbe med en slik tabell.

# Datasettet er i .xls-formatet, så vi trenger readxl-pakker for å laste det inn 
# i R.
library(readxl)

# Inne i denne pakken så er det en funksjon som heter read_excel:
read_excel("testdata.xls")

# Det gikk bra, men for å bruke dette datasettet, så må vi lagre det til en 
# variabel.
testdata <- read_excel("testdata.xls")

# Skriver ut (toppen av) datasettet.
testdata

# Nå ser vi datasettet i vinduet oppe til høyre. Vi kan se på det ved å 
# skrive navnet til datasettet i konsollen, og vi kan hente ut individuelle
# kolonner som vektorer ved å bruke dollartegnet $:
testdata$X1

# Regner ut gjennomsnittet for X1 og X2:
mean(testdata$X1)
mean(testdata$X2)

# Hvor mange rekker/observasjoner har vi?
nrow(testdata)

Oppgave:

  1. Hvor mange kolonner har datasettet vårt?
  2. Kan du finne en måte å skrive ut en vektor som inneholder summen av X1- og X2-kolonnene i datasettet? (Altså, vi vil vite summen av de to første elementene i X1 og X2, summen av de to andre elementene, osv.)
  3. Hva er summen av alle tallene i X1- og X2-kolonnene itestdata?
Løsning
# 1
ncol(testdata)

# 2 
testdata$X1 + testdata$X2

# 3
sum(testdata$X1 + testdata$X2)