ST2304 Statistisk modellering for biologer/bioteknologer, vår 2017
Kursbeskrivelse, timeplan og eksamensinfo finnes i studiehåndboka.
Beskjeder
- 31.05 Det har vært noen forespørsler om øvingsgodkjenningen - de som ikke har nok godkjente øvinger skal ha fått en e-post fra instituttkontoret om dette, så hvis dere ikke har hørt noe er dere godkjente for å gå opp til eksamen. Lykke til.
- 24.05 Spørretjenesten blir holdt i følgende auditorium: R9 tirsdag 6. juni kl. 12-15, og R5 fredag 9. juni kl. 09-12
- 31.03 Det vil bli "spørretjeneste" før eksamen tirsdag 6 juni kl. 12-15 og fredag 9 juni 9-12. Jeg bestiller auditorium, gir beskjed om hvilket det blir når det er avklart.
- 31.03 Onsdagen etter påske (19.04) blir det ingen forelesning. Fredag 21.04, onsdag 26.04 og fredag 28.04 vil bli brukt til repetisjon og gjennomgang av eksamensoppgave (vår 2016).
- 30. jan Har lagt ut en ny versjon av oppgaveteksten til øving 3 - dropper genereringen av nye data og legger ut lenke til et gammelt. Ellers er oppgavene som i forrige versjon.
- 23. jan Nå har øvingslærerne ordnet med bedre lokaler, og ekstra tidspunkt: Tirsdag 18-20 eller onsdag 16-18 i rom D1-185. Se ellers itslearning-sidene for mer detaljer om øvingsopplegget, bl.a. hvordan dere skriver dere opp på øvingsgruppe.
- Husk at 6 av 12 øvinger (3 av de 6 første og 3 av 6 siste) må være godkjent for å kunne gå opp til eksamen.
- NB: Hver øving skal leveres inn fredag kl. 12:00 (i uke 3 for øving 1 osv.).
- Øvingene kan gjøres i grupper på 2-5 studenter (avhengig av hva som gir best læringsutbytte). Besvarelsen skal svare på spørsmålene som er stilt i oppgaven men må også inneholde en kort introduksjon av problemstillingen slik at besvarelsen er forståelig for medstudenter som et selvstendig dokument. Dette innebærer bl.a. bruk av hele, grammatisk korrekte setninger, riktig tegnsetting og bruk av avsnitt. Øvingsrapporter kan skrives i f.eks. word, i google docs, eller i sharelatex (de to siste alternativene er hensiktsmessige hvis dere jobber flere sammen). Dere kan skrive på norsk eller engelsk. Lim R-kode, R-output og grafer inn i teksten på hensiktsmessig sted. Bruk en egen monospaced font, f.eks. courier, for å skille R-kode og R-output fra resten av teksten. Matematiske uttrykk og ligninger skal kunne leses som grammatisk korrekte deler av setningene de inngår i og inkludere riktig bruk av komma og punktum (se denne guiden). Lever besvarelsen i pdf- eller doc-format via itslearning og bruk funksjonene for gruppeinnlevering med mindre dere levere individuelt. Flere nyttige tips kan leses her.
- Man 16. jan: Da har vi endelig fått tildelt øvingslærere i kurset så møt opp til første øvingstime i morgen.
- Første forelesning blir onsdag 11. januar kl. 14:15 i R9. Velkommen!
- NB: Det blir ingen øvingstimer den første uka. Starter uke 3.
Forelesningsplan og kursinnhold
Uke | Tema | Øvinger |
---|---|---|
2 | Dalgaard, kap. 1 og kap 3. | Øving 1; Løsn.forslag 1 |
3 | Plotte funksjoner og parametriske kurver. Lineær regresjon, residualer, prediksjon og konfidensbånd (Dalg. 6.1-6.3). Multippel regresjon (Dalg. 11.1, 11.2, Løvås, 7.5). Dummy variabler. | Øving 2; Løsn.forslag 2 |
4 | F-fordelingen. Sammenligning av varianser (Dalg. 5.4). En- og toveis variansanalyse med balansert design (Løvås 8.3, Dalg. 7).Faktorer kodet som dummy variabler (Dalg. 12.3) | Øving 3 Løsn.forslag 3 |
5 | Lineære modeller uten balansert design, modellseleksjon (Handout 1, Dalg. kap 11.3) | Øving 4 Løsn.forslag 4 |
6 | Multinomisk fordeling, kontingenstabeller, kji-kvadrat tester (Løvås 5.9.4, 8.5, Dalg. 8, Handout 2 unntatt 2.2.3). | Øving 5 Løsn.forslag 5 |
7 | Generaliserte lineære modeller: Logistisk regresjon, deviance (Dalg. 13, unntatt 13.3, Handout 4). Delta metoden (Handout 3). Lineær separasjon (Handout 4, seksjon 4). | Øving 6 Løsn.forslag 6 |
8 | Probit- og cloglog-link, offset-variables Handout 4. Poisson response (Dalg. 15.2). | Øving 7 Løsn.forslag 7 |
9 | Overdispersjon (Handout 4, seksjon 6). Interaksjoner mellom kovariater (Dalg. 12.5, 12.7.2). Litt om programmering (Dalg. 2.3) | Øving 8 Løsn.forslag 8 |
10 | Litt mer om programmering (Dalg. 2.3). Numerisk maksimering av likelihood, asymptotisk teori for tilnærmede standard feil (Handout 5 og seksjon 2.2.3 i Handout 2) | Øving 9 Løsn.forslag 9 |
11 | Asymptotisk teori for likelihood ratio tester og simuleringsbaserte metoder (fra 2.2 i Handout 5) | Øving 10 Løsn.forslag 10 |
12 | Styrke og beregning av utvalgsstørrelse (Dalg. 9). Simuleringsbaserte styrkeberegninger (Handout 5 - 4.5) | Øving 11 Løsn.forslag 11 |
13 | Robusthet for t-test (Handout 5 - 4.6). Simulering av stokastiske populasjonsmodeller | Øving 12 Løsn.forslag 12 |
14 | Ekskursjon - ingen forelesning | |
15 | Påskeferie | |
16 | Repetisjon fredag 21. april. Ingen forelesning onsdag 19. april | |
17 | Repetisjon og gjennomgang av eksamensoppgaver ons. 26.04 og fre 28.04 |
Hver øving skal leveres inn fredag kl. 12:00 (i uke 3 for øving 1 osv.).
Eksamen
Den endelige eksamenen (10. juni) vil bli arrangert uten bruk av pc eller R. Tillatte hjelpemidler vil være kalkulator, Tabeller og formler i statistikk (Tapir forlag), Matematisk formelsamling (Rottmann), og et håndskrevet gult a4-ark.
Se gamle eksamenssett for å se oppgavetype og vanskelighetsgrad. Oppgavene kan inkludere:
- Tolkning av oppsummeringen (summary) av en tilpasset modell, residualplott osv. Hvilke modellforutsetninger må aksepteres? Hva er meningen med de forskjellige parameter estimatene? Hvordan kan modellen forbedres?
- Et datasett kan bli presentert, med en beskrivelse av de forskjellige variablene og den biologiske sammenhengen. Du skal så kunne foreslå en passende modell (f.eks. en generalisert lineære modell med link funksjon). Modellvalget skal begrunnes, med en diskusjon av forutsetninger for modellen osv.
- Et enkelt problem hvor du skal kunne skrive et uttrykk, eller R funksjon, som utfører en enkel beregning, for å vise at du har forstått vektoroperasjoner, indeksering, hvordan standard fordelinger behandles (de forskjellige d-, p-, q-, og r- funksjonene), sammenhengen mellom matematisk og symbolsk notasjon for modellformlene osv.
- Noen enkle matematiske utledninger basert på sannsynlighetsteori eller den statistiske inferensen dekket her eller i ST0103.
Husk at den endelige eksamenen ikke er målet for dette kurset; målet er heller å få praktisk erfaring med å analysere data. Dette vil være svært nyttig for din seinere forskning, både mht. din egen masteroppgave og det å kunne lese og forstå den vitenskapelige litteraturen.