Forslag til prosjekt- og masteroppgaver for studieåret 2020/2021

Veileder: Håkon Tjelmeland

Nedenfor beskrives kort to områder hvor undertegnede gjerne veileder prosjekt- og masteroppgaver for studieåret 2020/2021. Du vil her ikke finne veldig konkrete prosjektforslag. I stedet håper jeg at områdene som beskrives høres spennende ut og at du vil ønske å jobbe innen et av disse. Mer konkret hva som skal inngå i et prosjekt må vi i tilfelle diskutere nærmere på slutten av vårsemesteret 2020 eller i starten av høstsemesteret 2020. Det er erfaringsmessig lite hensiktsmessig å spesifisere dette i januar/februar når du uansett ikke skal begynne å arbeide med det før i august.

Dersom du finner et av områdene beskrevet under av interesse, bør du ta kontakt med meg for å diskutere et eventuelt prosjekt nærmere. Du kan stikke innom mitt kontor i 10. etg. i sentralbygg 2 ved en passende anledning, eller du kan sende meg en epost (haakon [dot] tjelmeland [at] ntnu [dot] no) for å avtale et møtetidspunkt.


Stokastisk simulering og approksimative algoritmer for kompliserte sannsynlighetsfordelinger

Statistikk brukes i dag til å analysere data som man tenker seg er generert fra komplekse systemer. Ofte modellerer man dataene ved hjelp av bayesianske modeller. Ofte ender man da opp med en aposteriorifordeling som det i liten grad er mulig å utføre analytiske beregninger på. I stedet benytter man enten en variant av stokastisk simulering eller en approksimativ algoritme som beregner en tilnærming til de størrelser man er interessert i.

For å beskrive basisideen for stokastisk simulering, anta at man har en (typisk høydimensjonal) stokastisk vektor \(X\) med sannsynlighetsfordeling \(f(x)\) og at man ønsker å beregne forventingsverdien \(E[g(X)]\), der \(g(x)\) er en kjent funksjon. \(E[g(X)]\) er definert som et høydimensjonalt integral som man ofte ikke greier å evaluere analytisk. I stedet kan man da estimere \(E[g(X)]\) ved først å generere mange realisasjoner, \(X_1,X_2,\ldots,X_n\) fra \(f(x)\) og så beregne gjennomsnittet av \(g(X_1),g(X_2),\ldots,g(X_n)\). Ved å velge \(n\) stor nok kan man få standardavviket til dette estimatet vilkårlig lite. Men merk at denne metoden forutsetter at man er i stand til å simulere realisasjoner fra fordelingen \(f(x)\). Dersom fordelingen \(f(x)\) er komplisert vil det ofte ikke være mulig å lage realisasjoner fra \(f(x)\) direkte. I stedet må man, slik du lærte litt om i TMA4265 Stokastisk modellering og vil lære mer om i TMA4300 Beregningskrevende statistiske metoder i vårsemesteret, benytte såkalte MCMC-metoder (Markov chain Monte Carlo), dvs. konstruere en markovkjede som har \(f(x)\) som sin grensefordeling og så simulere denne markovkjeden til den har konvergert. Ved denne metoden kan man i prinsippet simulere fra de fleste fordelinger som kunne være av interesse. Dessverre (eller kanskje heldigvis?) er verden ikke alltid like enkel i praksis som teorien skulle tilsi. Et av problemene i denne sammenheng er at de markovkjeder man mest naturlig vil ønske å benytte for en del sannsynlighetsfordelinger f(x) vil konvergere så ekstremt sakte at de i praksis er ubrukelige. Man må derfor velge sin markovkjede med omhu og det er av interesse å utforske hvordan man best kan velge en slik markovkjede for spesielle klasser av sannsynlighetsfordelinger f(x).

Et alternativ til stokastisk simulering for å evaluere/estimere/approksimere \(E[g(X)]\) er å benytte ulike approksimative algoritmer. Ofte vil fordelingen \(f(x)\) og/eller funksjonen \(g(x)\) ha en markovegenskap (betinget uavhengighet) og i noen tilfeller kan dette benyttes til å konstruere meget effektive eksakte algoritmer. I andre tilfeller er markovegenskapene til \(f(x)\) og/eller \(g(x)\) ikke tilstrekkelige til å kunne lage effektive eksakte algoritmer. I så fall kan man approksimere \(f(x)\) og/eller \(g(x)\) slik at de tilsvarende approksimative funksjonene har sterkere markovegenskaper.

Et prosjekt vil typisk bestå av at man setter seg inn i en del relevant litteratur, at man ut fra dette studerer/ tilpasser/ videreutvikler metoder og ideer derfra og tester ut/ evaluerer dette ved hjelp av simulering. Det siste betyr typisk at man må implementere metodene som studeres, så det kreves at man er interessert i programmering (det kreves dog ikke at man er en kløpper i programmering, kun at man ikke er redd for å lære dette). Bruk av metodene på sannsynlighetsfordelinger som fremkommer ved analyse av datasett vil vanligvis også bli en naturlig del av et prosjekt.

Merk at det også er flere andre som tilbyr prosjekter innenfor stokastisk simulering og/eller approksimative algoritmer for kompliserte stokastiske modeller: Jo Eidsvik, Sara Martino, Geir-Arne Fuglstad, Henning Omre og Ingelin Steinsland.

For å ta et prosjekt innen dette temaet må man, i tillegg til de obligatoriske kursene på Industriell matematikk, ta eller ha tatt kursene

Andre kurs som kan være "kjekke å ha" er


Bayesianske modeller for å forstå bedre hvordan friske og schizofrene personer tar beslutninger

I dagliglivet må vi mennesker stadig ta beslutninger. Skal jeg ta stå opp og gå på forelesning eller skal jeg sove lenger? Skal jeg gå over gata på rødt lys eller skal jeg vente på grønn mann? Skal jeg sykle fort nedover denne bakken eller skal jeg være mer forsiktig? Hvordan tar hjernen slike belutninger. Hvis man skal analysere beslutningsproblemet statistisk vil man typisk bruke en bayesiansk modell, formulere en sannsynlighetsfordeling for hva som kan skje og en tapsfunksjon som sier noe om konsekvenser og så velge den beslutningen som har minst forventet tap. Ved hjelp av papir og blyant kan vi så regne oss frem til den "optimale" beslutningen. Men i praksis setter man seg selvfølgelig ikke ned med papir og blyant og regner før man bestemmer som om man skal gå over gata på rødt lys. Vi tar beslutninger mer basert på intuisjon. Så kan vi lure på hvordan de beslutningene vi tar basert på intuisjon stemmer overens med de beslutningene vi ville ha tatt dersom vi hadde tatt oss tid til å regne på situasjonen ved hjelp av en bayesiansk modell. Dette er blant annet psykologer interessert i og de gjør ulike kontrollerte forsøk hvor testpersoner er blitt bedt om å ta beslutninger basert på noen observasjoner. Spesielt interessant er det å se på forskjeller mellom hvordan presumptivt friske personer tar beslutninger og hvordan schizofrene personer tar sine beslutninger. Hvis man forstår denne forskjellen bedre kan man kanskje i fremtiden ved hjelp av slike kontrollerte beslutningsforsøk bli i stand til å si hvilke personer som har spesiell høy sannsynlighet for å utvikle slike sinnslidelser og dermed kunne sette inn behandling som forhindrer at de utvikler alvorlig sykdom.

Et prosjekt innen dette temaet vil bli formulert i samarbeid med Gerit Pfuhl ved Norges arktiske universitet. Hun arbeider med problemstillingen beskrevet over, har foretatt ulike kontrollerte forsøk, og er interessert i å utvikle statiske modeller som kan beskrive hvordan testpersonene tar sine beslutninger.

Et prosjekt vil typisk bestå av at man setter seg inn i en del relevant litteratur, dette kan være både statistikklitteratur og artikler skrevet av psykologer som omhandler kontrollerte beslutningsforsøk. Man vil så studere/tilpasse/videreutvikle modeller og ideer derfra og tilpasse modellene til observerte beslutninger hos testpersoner. Spesielt aktuelt er det å benytte bayesianske modeller for å beskrive hvordan mennesker tar beslutninger og da vil man ende opp med en aposteriorfordeling, og dersom man ikke er istand til å behandle denne analytisk må man utforske den ved hjelp av MCMC, som beskrevet lenger oppe på denne siden. Dette betyr typisk at man må implementere MCMC-algoritmen som skal benyttes, så det kreves at man er interessert i programmering (det kreves dog ikke at man er en kløpper i programmering, kun at man ikke er redd for å lære dette).

For å ta et prosjekt innen dette temaet må man, i tillegg til de obligatoriske kursene på Industriell matematikk, ta eller ha tatt kursene


Og til slutt:

Forhåpentligvis henger du fremdeles med og finner noe av dette interessant. I så fall oppfordres du som som sagt til å ta kontakt slik at vi kan ta en prat.

Håkon Tjelmeland

2019-12-05, Håkon Tjelmeland