9.1 Tidligere eksamensoppgaver (skoleeksamen)
I tabellen under finner du en lang rekke eksamenssett som er gitt tidligere i MET4. Vi har lagt til en kolonne med oppgaver som åpenbart ligger utenfor pensum i dag. Utover det er selvsagt oppgavene relevante i større eller mindre grad for kurset i dag, uten at vi har mulighet til å gå nærmere inn på en slik detaljert rangering.
Lenger nede på siden finner du noen kommentarer og rettelser til oppgavesett og løsningsforslag som har dukket opp i ettertid.
Semester | Oppgaver | Løsningsforslag | Ikke lenger pensum per 2023 |
---|---|---|---|
2017 - Vår | Oppgaveformulering | Løsningsforslag | 1c |
2017 - Høst | Oppgaveformulering | Løsningsforslag | 1f-1h |
2018 - Vår | Oppgaveformulering | Løsningsforslag | |
2018 - Høst | Oppgaveformulering | Løsningsforslag | 1d, 1g |
2019 - Vår | Oppgaveformulering | Løsningsforslag | 1c |
2019 - Høst | Oppgaveformulering | Løsningsforslag | |
2020 - Vår | Oppgaveformulering | Løsningsforslag | |
2020 - Høst | Oppgaveformulering | Løsningsforslag | |
2021 - Vår | Oppgaveformulering | Løsningsforslag | |
2021 - Høst | Oppgaveformulering | Løsningsforslag | |
2022 - Vår | Oppgaveformulering | Løsningsforslag | |
2022 - Høst | Oppgaveformulering | Løsningsforslag | |
2023 - Vår | Oppgaveformulering | Løsningsforslag | |
2023 - Høst | Oppgaveformulering | Løsningsforslag | |
2024 - Vår | Oppgaveformulering | Løsningsforslag |
Rettelser og kommentarer til oppgaver og løsningsforslag
Her vil du finne en del kommentarer og rettelser som er spesifikke for de enkelte oppgavesettene. Dette er basert på et dokument som Jarle Møen startet på i sin tid, og som senere er oppdatert av Benjamin Narum. Curipod tok over for denne oversikten, så man finner andre spørsmål og svar der som også er mer nylig. Søk eller bruk “tags” for årgangene av oppgaver. Vi lar spørsmålene under stå i tilfelle de også er av nytte.
Overskriftene under kan trykkes på, så ekspanderes innholdet for hver eksamen.
Vår 2017
Oppgave 2c: Eksamen V17, oppgave 2c): Man blir bedt om å regne ut om koeffisienten er signifikant, hvorfor er frihetsgraden 282 (\(v = n - k - 1\)) og ikke 286 (\(n-2\))?
Den generelle regelen for lineær regresjon er at man trekker fra antall frihetsgrader som svarer til antall parametre man har estimert først, som så brukes i beregningen av standardavviket. I oppgave 2c på analyse (1) er det brukt 6 estimerte parametre (5 koeffisienter og ett konstantledd) dermed blir det \(n - 5 - 1\). I sliden du viser er det en koeffisient og ett konstantledd, dermed \(n - 2\).
Høst 2017
Oppgave 1b: “Viser resultatet av testen at studentene i gruppe A kanskje har plagiert?”. F-testen vil jo kun teste om variansene er den samme for gruppe A og gruppe B, eller ulik? Hvordan kan vi svare på dette spørsmålet ved hjelp av en F-test? I fasiten står det at studentene i gruppe A har kanskje plagiert. Er dette fordi variansen i gruppe A er minst, dermed har de mer like respons, noe som kan indikere plagiat?
Ja, oppgave a og b henger tett sammen. Det stemmer at F-testen bare kan si om de er ulik. Man må tolke hva ulike standardavvik må bety utfra konteksten av “eksperimentet” for å komme frem til at det er juks på gang. Det stemmer som du sier at lavt standardavvik betyr plagiat. Poenget her er at gruppe B skal være representativt for studenter generelt, så ettersom standardavviket er signifikant forskjellig fra det det skulle vært (statistisk lik gruppe B) er det noe som foregår.
Vår 2018
Oppgave 1b: I fasiten står det at man også kan bruke T-test for å sammenligne forventningsverdiene i de to datasettene, er det fordi n er stor og dermed vil normal og t-fordeling være omtrent det lik?
Vi kan gjøre to forskjellige argumenter når \(n\) er stor i dette tilfellet:
- Når \(n\) er stor er det ikke så farlig med normalitetsantakelsen for observasjonene, siden sentralgrenseteoremet sørger for at testobservatoren er tilnærmet normalfordelt uansett, og da kan vi bruke Z-test eller t-test avhengig av om vi kjenner det/de sanne standardavviket/standardavvikene eller ikke.
- I tillegg ser vi at når \(n\) blir stor så er de kritiske verdiene for hypotesetesten nesten like. Det følger av at vi da kan estimere standardavviket mer presist, så de empiriske standandardavvikene \(s\) (eventuelt (\(s_1\) og \(s_2\)) er nærme de sanne verdiene \(\sigma\) (eventuelt \(\sigma_1\) og \(\sigma_2\)).
Høst 2018
Oppgave 1c: I oppgaven skal man se hvorvidt “… the trimmed mean of the offers is smaller in 2008 than in 2006.” De setter opp H0 = Mean(Libor2006) = Mean(Libor2008), men så setter de opp H1 : Mean(Libor2006) < Mean(Libor2008). Burde det ikke være omvendt her ettersom vi skal se om gjennomsnittet er lavere i 2008 enn i 2006? altså at H1: Mean(Libor2006) > Mean(Libor2008). Videre konkluderer man med at “The test indicates that the Libor in 2006 is lower than the Libor in 2008”. Men i summary tabellen får man oppgitt at gjennomsnittlig libor i 2006 = 3.09 og 2.00 i 2008. Hvordan kan det ha seg da at man konkluderer med at libor er lavere i 2006 enn i 2008?
De har snudd ulikheten. Det er feil i fasiten og det skal egentlig være Mean(Libor2006) > Mean(Libor2008). I konklusjonen skal det følgelig konkluderes med at Libor i 2006 er større enn i 2018.
Høst 2019
Oppgave 1a: Oppgaven spør om hvilke tester man kan utføre for å finne ut hvilket land som har den signifikant største andelen kjempelykkelige land. Er det ikke z-test man da bruker? Videre blir vi bedt om å gi et datatransformasjon for Norge, hva mener de med dette? Hvorfor har fasiten kun brukt det som står under brøkstreken i testobservatoren?
Det stemmer at de bruker en z-test i fasit, men det er også mulig å bruke en chi-squared goodness-of-fit test. Poenget her er at man skal finne ut hvem som er mest lykkelig i forhold til hverandre og dermed må man teste to og to land mot hverandre ved bruk av flere z-tester. Tanken med “transformasjonen” er at man tar tallene fra tabellen og beregner noe man enkelt kan sammenligne to og to land basert på, det blir da estimatet av “sannsynlighet for kjempelykkelig” med et empiriske standardavvik. Det empiriske standardavviket er da det som står i nevneren for testobservatoren (se kap 12-3c i boken). Siden testen i teorien må gjennomføres 3 ganger er det bedre å regne p og empirisk standardavvik for så å sette disse tallene inn i uttrykket for testobservatoren etterpå.
Oppgave 1b: Etter at \(z = 5.33\) er regnet ut dukker det opp en \(z = 0.11\) under. Hvor kommer denne fra og hva forklarer den? Den blir ikke kommentert videre.
I oppgave B har de først regnet ut z dersom man antar pooled standardavvik, deretter har de beregnet z med hvert sitt standardavvik og testet om disse to z-verdiene er ulike. Det er en litt knotete måte å gjøre det på. De kunne bare brukt den sistnevnte z og testet den ulik null heller enn lik førstnevnte z. Konklusjonen blir den samme. Se side 482, Case 2. I eksemplene i boken beregner de ikke D først slik de har gjort i fasit, men sier at den er kjent.
Oppgave 1j: Vi blir bedt om å skissere regresjonslinjen for råalders samlede påvirkning på lykkenivået. Jeg forstod fasiten, men dersom oppgaven hadde bedt om å skissere regresjonslijen for rettferdighet samlede påvirkning på rettferdighet, hadde linjen bare vært lineær med en stigningstall på 0.03? Måtte vi gjøre alle de beregningene igjen siden variabelen var logaritmen til alder?
Det stemmer. Rettferdighet-til-lykke-forholdet er linært, så det hadde bare blitt en linje. Her spørres det om en skisse nettopp fordi forholdet skal være ikke-lineært, så du ville nok ikke fått samme spørsmål for “rettferdighet” med mindre begge skulle inn i figuren samtidig som sammenligning. Beregningene var for å støtte at plottet ble riktig. I det lineære tilfellet kunne du jo bare ha funnet to punkter og dratt en linje imellom, det går jo ikke i det ikke-lineære tilfellet.
Vår 2020
Oppgave 3c: Jeg er litt usikker ifm oppgave c) hvor vi blir spurt om redisualserien er stasjonær. Jeg forstår resonnementet i fasiten, men er litt usikker når det kommer til denne figuren. Her ser det jo ut til at variansen øker med tiden? Et av forutsetningene for stasjonær tidsrekke er jo at variansen skal være konstant og uavhengig av t? Hvordan ser vi forresten om forventningen er konstant eller ikke?
Visuell inspeksjon kan gi deg en del innsikt, men noen ganger kan det være vanskelig å konkludere eksakt kun fra figuren. Om det er tvil må man støtte seg videre på beregninger.
For residualserien er den litt kort til å konkludere bare fra plottet om variansen øker eller ikke. De laveste residualverdiene (på bunnen av plottet) ser ikke ut til å endre seg slik som det kanskje kan se ut for de høyeste (på toppen av plottet). Om du hadde plottet denne over lenger tid ville du kanskje ikke lenger tenkt at variansen endrer seg.
Forventningen er konstant, og lik 0, om det er ca like mange punkter over som under 0-linjen over tid. Det ser ut til å være tilfelle her.