ST2304 Statistisk modellering for biologer/bioteknologer, vår 2014

Kursbeskrivelse, timeplan og eksamensinfo finnes i studiehåndboka.

Beskjeder

  • Løsningsforslag til eksamen vår 2014 finner du her. Og oppgaven for vår 2014 her.
  • Spørretjeneste før eksamen: Torsdag 15 og fredag 16 mai svarer øvingslærerne på spørsmål mellom kl. 10 og 14.
  • Oppsummering før eksamen, stedsinfo F3 Gamle fysikk: Mandag 19 og tirsdag 20, sannsynligvis kl. 14-16, kjører vi to runder i auditorium med oppsummering og spørsmålsrunde. Send meg gjerne epost med spørsmål eller ønsker om tema for gjennomgang i forkant.
  • Pensum er gitt i tabellen Plan og kursinnhold (under). Alle referansene til lærebøkene (Dalgaard og Løvås), de 5 handout'ene og øvingene.
  • Godkjenningslistene for øvingene er nå sendt avgårde. Hvis noen som har fått "ikke godkjent" mener at dette er feil, så må de ta kontakt med meg så snart som mulig.
  • 30. mars: Dette blir siste uke med ordinære forelesninger, siste uke før påske (uke 15) er det ekskursjoner. Det blir oppsummering av pensum, og kanskje gjennomgang av noen utvalgte gamle eksamensoppgaver, de siste dagene før eksamen - mandag 19 mai og tirsdag 20 mai. Info om tid og sted kommer nærmere eksamen.
  • 19. jan: Øvingslærerne har brukt Sweave (kan kjøres i Rstudio) til å lage rapport, så de som vil ha litt mer utfordring kan kikke på fila og se om de lærer seg hvordan.
  • 14. jan: Alle skal nå ha mottatt en epost fra Inst. for matematiske fag (IMF) ang. adgang til datasal H3-524. De som ikke har mottatt en slik epost kan kontakte instituttkontoret ved IMF (postmottak@math.ntnu.no).
  • 7. jan:Her er en mal for hvordan en øvingsbesvarelse i ST2304 kan skrives. Merk at 6 av 12 øvinger må være godkjente for å få gå opp til eksamen.
  • Første forelesning blir mandag 6. januar kl. 14:15 i EL2. Velkommen!
  • NB: Det blir ingen øvingstimer den første uka. Starter uke 3.
  • RSS-feed for this webpage and subpages are available through the orange icon (choose "current namespace") to the right in the address bar of most web browsers.

Plan og kursinnhold

UkeTemaØvinger
2Dalgaard, kap. 1 og kap 3. Øving 1, LF Ø1
3Plotte funksjoner og parametriske kurver. Lineær regresjon, residualer, prediksjon og konfidensbånd (Dalg. 6.1-6.3). Multippel regresjon (Dalg. 11.1, 11.2, Løvås, 7.5). Dummy variabler. Øving 2, LF Ø2
4F-fordelingen. Sammenligning av varianser (Dalg. 5.4). En- og toveis variansanalyse med balansert design (Løvås 8.3, Dalg. 7).Faktorer kodet som dummy variabler (Dalg. 12.3) Øving 3 LF Ø3
5Lineære modeller uten balansert design, modellseleksjon (Handout 1, Dalg. kap 11.3) Øving 4 LF Ø4
6 Multinomisk fordeling, kontingenstabeller, kji-kvadrat tester (Løvås 5.9.4, 8.5, Dalg. 8, Handout 2 unntatt 2.2.3). Øving 5 LF Ø5
7 Generaliserte lineære modeller: Logistisk regresjon, deviance (Dalg. 13, unntatt 13.3, Handout 4). Delta metoden (Handout 3). Lineær separasjon (Handout 4, seksjon 4). Øving 6 LF Ø6
8Probit- og cloglog-link, offset-variables Handout 4. Poisson response (Dalg. 15.2). Øving 7 LF Ø7
9 Overdispersjon (Handout 4, seksjon 6). Interaksjoner mellom kovariater (Dalg. 12.5, 12.7.2). Litt om programmering (Dalg. 2.3) Øving 8 LF Ø8
10 Litt mer om programmering (Dalg. 2.3). Numerisk maksimering av likelihood, asymptotisk teori for tilnærmede standard feil (Handout 5 og seksjon 2.2.3 i Handout 2) Øving 9 LF Ø9
11 Asymptotisk teori for likelihood ratio tester og simuleringsbaserte metoder (fra 2.2 i Handout 5) Øving 10 LF Ø10 (Se kommentar a) under)
12 Styrke og beregning av utvalgsstørrelse (Dalg. 9). Simuleringsbaserte styrkeberegninger (Handout 5 - 4.5) Øving 11 LF Ø11
13 Robusthet for t-test (Handout 5 - 4.6). Simulering av stokastiske populasjonsmodeller Øving 12 LF Ø12
14 Eksamensgjennomgang Vår 2013. Eksempler på "virkelige" problemer.
15 Ekskursjon
16 Påskeferie

Hver øving skal leveres inn fredag kl. 12:00 (i uke 3 for øving 1 osv.).

a) Tillegg til løsningsforslaget for Ø11, oppgave 1.5: Hvis du går fra 2 til 3 parametre, som i denne oppgaven, får kjikvadratfordelingen k-p-1=4-3-1=0 frihetsgrader og vi kan dermed ikke gjøre en Goodness-of-fit test/vurdering.

Eksamen

Den endelige eksamenen (21. mai) vil bli arrangert uten bruk av pc eller R. Tillatte hjelpemidler vil være kalkulator, Tabeller og formler i statistikk (Tapir forlag), Matematisk formelsamling (Rottmann), og et håndskrevet gult a4-ark.

Se gamle eksamenssett for å se oppgavetype og vanskelighetsgrad. Oppgavene kan inkludere:

  • Tolkning av oppsummeringen (summary) av en tilpasset modell, residualplott osv. Hvilke modellforutsetninger må aksepteres? Hva er meningen med de forskjellige parameter estimatene? Hvordan kan modellen forbedres?
  • Et datasett kan bli presentert, med en beskrivelse av de forskjellige variablene og den biologiske sammenhengen. Du skal så kunne foreslå en passende modell (f.eks. en generalisert lineære modell med link funksjon). Modellvalget skal begrunnes, med en diskusjon av forutsetninger for modellen osv.
  • Et enkelt problem hvor du skal kunne skrive et uttrykk, eller R funksjon, som utfører en enkel beregning, for å vise at du har forstått vektoroperasjoner, indeksering, hvordan standard fordelinger behandles (de forskjellige d-, p-, q-, og r- funksjonene), sammenhengen mellom matematisk og symbolsk notasjon for modellformlene osv.
  • Noen enkle matematiske utledninger basert på sannsynlighetsteori eller den statistiske inferensen dekket her eller i ST0103.

Husk at den endelige eksamenen ikke er målet for dette kurset; målet er heller å få praktisk erfaring med å analysere data. Dette vil være svært nyttig for din seinere forskning, både mht. din egen masteroppgave og det å kunne lese og forstå den vitenskapelige litteraturen.

2018-02-12, Hallvard Norheim Bø