ST2304 Statistisk modellering for biologer/bioteknologer, vår 2015

Kursbeskrivelse, timeplan og eksamensinfo finnes i studiehåndboka.

Beskjeder

  • Forelesningene flyttes til S6 på mandager og S1 på onsdager!
  • Øvingsrapporter kan skrives i word. Rapportene skal skrives på korrekt norsk eller engelsk. Dette innebærer bruk av hele, grammatisk korrekte setninger, riktig tegnsetting og bruk av avsnitt. Matematiske uttrykk og ligninger skal aldri stå alene men skal kunne leses som grammatisk korrekte deler av setningene de inngår i. Lim R-kode, R-output og grafer inn i teksten på hensiktsmessig sted. Bruk en egen monospaced font, f.eks. courier, for å skille R-kode og R-output fra resten av teksten. Læreboka er her et godt eksempel. Lever besvarelsen i doc- eller pdf-format via itslearning.
  • Bruk diskusjonsgruppa på itslearning ved behov!
  • Meld deg på øvingsgruppe (se link på underside med tidspunkter i venstremarg).
  • Første forelesning mandag 5. januar, kl 15:15 i F6
  • Øvingstimene starter i uke 3

Foreløpig plan og kursinnhold

Uke Tema Øvinger
2/3 Dalgaard, kap. 1 og kap 3. Øving 1, LF Ø1
3/4 Plotte funksjoner og parametriske kurver. Lineær regresjon, residualer, prediksjon og konfidensbånd (Dalg. 6.1-6.3). Multippel regresjon (Dalg. 11.1, 11.2, Løvås, 7.5). Dummy variabler. Øving 2, LF Ø2
4/5 F-fordelingen. Sammenligning av varianser (Dalg. 5.4). En- og toveis variansanalyse med balansert design (Løvås 8.3, Dalg. 7).Faktorer kodet som dummy variabler (Dalg. 12.3) Øving 3 LF Ø3
5/6 Lineære modeller uten balansert design, modellseleksjon (Handout 1, Dalg. kap 11.3) Øving 4 LF Ø4
6/7 Multinomisk fordeling, kontingenstabeller, kji-kvadrat tester (Løvås 5.9.4, 8.5, Dalg. 8, Handout 2 unntatt 2.2.3). Øving 5 LF Ø5
7/8 Generaliserte lineære modeller: Logistisk regresjon, deviance (Dalg. 13, unntatt 13.3, Handout 4). Delta metoden (Handout 3). Lineær separasjon (Handout 4, seksjon 4). Øving 6 LF Ø6
8/9 Probit- og cloglog-link, offset-variables Handout 4. Poisson response (Dalg. 15.2). Øving 7 LF Ø7
9/10 Overdispersjon (Handout 4, seksjon 6). Interaksjoner mellom kovariater (Dalg. 12.5, 12.7.2). Litt om programmering (Dalg. 2.3) Øving 8 LF Ø8
10/11 Litt mer om programmering (Dalg. 2.3). Numerisk maksimering av likelihood, asymptotisk teori for tilnærmede standard feil (Handout 5 og seksjon 2.2.3 i Handout 2) Øving 9 LF Ø9
11/12 Asymptotisk teori for likelihood ratio tester og simuleringsbaserte metoder (fra 2.2 i Handout 5) Øving 10 LF Ø10 (Se kommentar a) under)
12/15 Styrke og beregning av utvalgsstørrelse (Dalg. 9). Simuleringsbaserte styrkeberegninger (Handout 5 - 4.5) Øving 11 LF Ø11
13 Ekskursjon
14 Påskeferie
15/16 Robusthet for t-test (Handout 5 - 4.6). Øving 12 LF Ø12
16 Oppsummering. Gjennomgang av noen eksamensoppgaver.

Eksamen

Den endelige eksamenen (15. mai) vil bli arrangert uten bruk av pc eller R. Tillatte hjelpemidler vil være kalkulator, Tabeller og formler i statistikk (Tapir forlag), Matematisk formelsamling (Rottmann), og et håndskrevet gult a4-ark.

Se gamle eksamenssett for å se oppgavetype og vanskelighetsgrad. Oppgavene kan inkludere:

  • Tolkning av oppsummeringen (summary) av en tilpasset modell, residualplott osv. Hvilke modellforutsetninger må aksepteres? Hva er meningen med de forskjellige parameter estimatene? Hvordan kan modellen forbedres?
  • Et datasett kan bli presentert, med en beskrivelse av de forskjellige variablene og den biologiske sammenhengen. Du skal så kunne foreslå en passende modell (f.eks. en generalisert lineære modell med link funksjon). Modellvalget skal begrunnes, med en diskusjon av forutsetninger for modellen osv.
  • Et enkelt problem hvor du skal kunne skrive et uttrykk, eller R funksjon, som utfører en enkel beregning, for å vise at du har forstått vektoroperasjoner, indeksering, hvordan standard fordelinger behandles (de forskjellige d-, p-, q-, og r- funksjonene), sammenhengen mellom matematisk og symbolsk notasjon for modellformlene osv.
  • Noen enkle matematiske utledninger basert på sannsynlighetsteori eller den statistiske inferensen dekket her eller i ST0103.

Husk at den endelige eksamenen ikke er målet for dette kurset; målet er heller å få praktisk erfaring med å analysere data. Dette vil være svært nyttig for din seinere forskning, både mht. din egen masteroppgave og det å kunne lese og forstå den vitenskapelige litteraturen.

2018-02-12, Hallvard Norheim Bø