Nyttige begreper


Ansvarlige for innholdet: Henning Omre og Mina Spremic, 10.05.2021.

Hvis du har spørsmål om innholdet, har tips til forbedring eller ønsker tips til flere ressurser, send en e-post til en av oss, henning.omre(at)ntnu.no eller mina.spremic(at)ntnu.no.

Denne begreps-listen med sannsynligheter og statistikk kan virke noe overveldende for elever på ungdoms- og videregående-skoler. Ungdomskole-elever med interesse og evner for matematiske fag bør gyve løs - men selv da er det slett ikke sikkert en kommer helt gjennom med god forståelse. Elever på videregående-skoler som liker matematiske fag bør kunne arbeide seg gjennom listen med grei forståelse. Men det vil nok kreve studier i noen iterasjoner.

Begrepene i sannsynlighet og statistikk listet og forklart under gir innblikk i innholdet i universitets-studier i Statistikk.


For å kunne navigere i feltet sannsynlighet og statistikk er det nyttig å forstå noen begreper.

Først bør en beskrive en sannsynlighets-modell:

Sannsynlighets-modell kan defineres for et forsøk som har en tilfeldig komponent og derfor kan resultere i, ett og bare ett, av ulike utfall. Hvert utfall er tilegnet ett tall mellom null og en, som beskriver sannsynligheten for at forsøket resulterer i akkurat dette utfallet. Summen av sannsynlighetene må være en.

  • Eksempel: Forsøket er - kast av en balansert terning og registrer antall øyne. Siden terningen ikke settes ned men kastes, kan det ansees som en tilfeldig komponent. Terningen vil når den faller til ro vise et bestemt antall øyne - så utfallene er [1,2,3,4,5,6]. Fordi terningen er balansert og kastingen er omhyggelig, er det rimelig å tilegne hvert utfall lik sannsynlighet en-seks-del, slik at summen av sannsynlighetene er en.
  • Eksempel: Forsøket er - trekking av 20-årig norsk gutt og registrering av kropps-høyde. Siden trekkingen er tilfeldig, er det en tilfeldig komponent og utfallene er alle positive tall. En oversikt over høydene til alle norske 20-årige gutter viser at en Gaussisk (normal) fordeling med forventning på 180 cm og standard avvik på 7 cm er en god sannsynlighets-modell for forsøket.

Deretter bør en skille på sannsynlighetsregning og statistisk analyse:

Sannsynlighetsregning er en matematisk disiplin. Baset på forsøket med kjente sannsynligheter, beregn sannsynligheten for resultater fra ett eller fler gjentakelser av forsøket.

  • Eksempel: Betrakt terning-modellen over. Sannsynlighetsregning kan gi oss sannsynligheten for at en observerer at summen av antall øyne fra tre gjentatte kast med terningen blir ni.
  • Eksempel: Betrakt høyde-modellen over. Sannsynlighetsregning kan gi oss sannsynligheten for at en observerer en gutt med høyde under 170 cm og to gutter med høyder over 190 cm i tre gjentatte tekninger av gutter.

Statistisk analyse er en særegen disiplin. Basert på forsøket med ukjente sannsynligheter, bruk resultatene av gjentatte forsøk til å beregne de aktuelle sannsynlighetene.

  • Eksempel: Betrakt terning-modellen over. Anta at en tviler på om terningen er balansert slik at sannsynlighetene i forsøket må ansees som ukjente. Statistisk analyse av øynene registrert i gjentatte kast med terningen kan gi anslag på de virkelige sannsynlighetene.
  • Eksempel: Betrakt høyde-modellen over. Anta at en nå er interessert i høyden på 20-årige norske jenter. Det er rimelig å anta at sannsynlighets-modellen er Gaussisk (normal) som for guttene, men at forventning og standard avvik er ulike for jenter og gutter. Statistisk analyse av høydene registrert på gjentatte trekninger av jenter kan gi anslag på jentenes forventning og standard avvik.

Sannsynlighet

Tilfeldig (Stokastisk) Variabel


Betrakt et tilfeldig forsøk, hvor en registrer en tallverdi \(X\). Den tilfeldige variabelen \(X\) kan enten ta diskrete eller kontinuerlige utfalls-verdier på tall-linjen.

  • Eksempel: Betrakt terning-forsøket over. Den tilfeldige variablen \(X\) er da antall øyne som kan ta diskrete utfalls-verdier blant verdiene \([1,2,3,4,5,6]\).
  • Eksempel: Betrakt høyde-målings-forsøket over. Den tilfeldige variablen \(X\) er da høyden som kan ta kontinuerlige verdier i intervallet \([0,∞]\).

Dersom en registrer flere tallverdier \([X_1, X_2,…, X_k]\) fra et tilfeldig forsøk, benevnes den tilfeldige variablen multi-variat (k-variat).

  • Eksempel: Betrakt terning-forsøket over samt at en samtidig kaster en mynt. Den tilfeldige bi-variate variablen \([X_1, X_2]\) er antall øyne på terningen og antall kron på mynten, som kan ta diskrete utfalls-verdier blant verdiene \([(1,0),(2,0),(3,0),(4,0),(5,0),(6,0),(1,1),(2,1),(3,1),(4,1),(5,1),(6,1)]\).
  • Eksempel: Betrakt høyde-målings-forsøket over samt at en også registrer vekten. Den tilfeldige bi-variate variablen \([X_1,X_2]\) er da høyden og vekten som kan ta kontinuerlige verdier i intervallene \([(0,∞), (0,∞)]\).

Sannsynlighetsfordeling


Sannsynlighets-egenskapene til det tilfeldige forsøket representert ved den tilfeldige variablen \(X\) kan spesifiseres med en sannsynlighets-funksjon \(P_X(x) = Prob{(X \leq x)}\). Funksjonen \(P_X(x)\) leses som sannsynligheten (probability) for at det tilfeldige forsøket resulterer i en utfalls-verdi mindre enn \(x\).

  • Eksempel: Betrakt terning-forsøket over. Sannsynlighets-funksjonen for den tilfeldige variablen \(X\) er skissert i Figuren nedenfor.

  • Eksempel: Betrakt høyde-målings-forsøket over. Sannsynlighets-funksjonen for den tilfeldige variablen \(X\) er skissert i Figuren nedenfor.

Merk at sannsynligheten for utfall mindre enn \(-∞\) er lik 0 og at utfall mindre enn \(∞\) er 1. Ordningen av tall-linjen medfører også at for verdiene \(x’ \leq x’’\) har en \(P_X(x’) \leq P_X(x’’)\), og at sannsynlighets-funksjonen \(P_X(x)\) må være en monotont ikke-avtakende funksjon. Det er altså en ikke-negativ sannsynlighet \(P_X(x’’) – P_X(x’)\) for at utfalls-verdien faller i intervallet \([x’,x’’]\).

Sannsynlighets-egenskapene for multi-variate tilfeldige forsøk kan spesifiseres på tilsvarende måter med sannsynlighets-funksjonen \(P_{X_1,..,X_k}(x_1,…,x_k)\). I det bi-variate tilfellet må sannsynlighets-funksjonen \(P_{X_1,X_2}(x_1,x_2)\) være monotont ikke-avtakende med økende \((x_1,x_2)\). Dersom de tilfeldige variablene, \([X_1,X_2]\), er uavhengige har en \(P_{X_1,X_2}(x_1 , x_2 ) = P_{X_1}(x_1) P_{X_2}( x_2)\).

  • Eksempel: Betrakt terning- og mynt-forsøket over. Sannsynlighets-funksjonen for den bi-variate tilfeldige variablen \([X_1,X_2]\) er skissert i Figuren nedenfor. Kastene av terning og mynt er uavhengige, fordi kast av terning og mynt ikke påvirker hverandre.

  • Eksempel: Betrakt høyde- og vekt-målings-forsøket over. Sannsynlighets-funksjonen for den tilfeldige variablen \([X_1,X_2]\) er skissert i Figuren nedenfor. Målingene av høyde og vekt på samme person er avhengige – større høyde medfører oftest større vekt, og motsatt.

Sannsynlighets-tettheten \(p_X(x)\) defineres som sannsynligheten for at utfalls-verdien \(X\) faller i intervallet \([ \frac{x-Δx}{2}, \frac{x+Δx}{2}]\), dividert med \(Δx\), når \(Δx\) går mot null.

  • Eksempel: Betrakt terning forsøket over. Sannsynlighets-tettheten for den tilfeldige variablen \(X\) er skissert i Figuren nedenfor. Sannsynlighets-tettheten er lik en-seks-del for alle utfalls-verdier.

  • Eksempel: Betrakt høyde-målings forsøket over. Sannsynlighets-tettheten for den tilfeldige variablen \(X\) er skissert i Figuren nedenfor. Sannsynlighets-tettheten er størst for høyde lik 180 cm.

Sannsynlighets-egenskapene for multi-variate tilfeldige forsøk kan spesifiseres på tilsvarende måter med sannsynlighets-tetthet \(p_{X_1,..,X_k} (x_1,…,x_k)\). I det bi-variate tilfellet må sannsynlighets-tettheten \(p_{X_1,X_2}(x_1,x_2)\) være ikke-negative for alle \((x_1,x_2)\). Dersom de tilfeldige variablene er uavhengige har en \(p_{X_1,X_2}(x_1 , x_2 ) = p_{X_1} (x_1)p_{X_2}( x_2)\).

  • Eksempel: Betrakt terning- og mynt-forsøket over. Sannsynlighets-tettheten for den tilfeldige bi-variate variablen \([X_1,X_2]\) er skissert i Figuren nedenfor. Sannsynlighets-tettheten er lik en-tolv-del for alle utfalls-verdier.

  • Eksempel: Betrakt høyde- og vekt-målings forsøket over. Sannsynlighets-tettheten for den tilfeldige bi-variate variablen \([X_1,X_2]\) er skissert i Figuren nedenfor. Sannsynlighets-tettheten indikerer at det er et positivt samspill mellom høyde og vekt – større høyde medfører ofte større vekt, og motsatt.

Simulering


Simulering av utfalls-verdien fra et tilfeldig forsøk med sannsynlighets-funksjon \(P_X(x)\) kan brukes til å gjenskape forsøk på datamaskin uten å utføre selve det fysiske forsøket. Det er mulig fordi sannsynlighets-funksjonen spesifiserer alle sannsynlighetsegenskapene til forsøket. Simuleringen kan utføres som følger:

- trekk ett tilfeldig kontinuerlig tall \(u^s\) i intervallet \([0,1]\) ved hjelp av en tilfeldig-tall-generator på datamaskinen.

- gå baklengs gjennom sannsynlighets-funksjonen ved verdi \(u^s\) og observer \(x^s\), dvs \(x^s = P_{X}^{-1}(u^s)\). Da vil \(x^s\) være en simulert utfalls-verdi fra det tilfeldige forsøket.

  • Eksempel: Betrakt terning forsøket over. Simulering av utfalls-verdien av et terning-kast er skissert i Figuren nedenfor.

  • Eksempel: Betrakt høyde-målings forsøket over. Simulering av utfalls-verdien av en trekning av gutt er skissert i Figuren nedenfor.

Tilsvarende simuleringer kan utføres for multi-variate tilfeldige forsøk.

Betinget sannsynlighet og Bayes Regel


Betinget sannsynlighet tallfester samspillet mellom variablene i en tilfeldig bi-variat variabel \([X_1,X_2]\). Den betingete sannsynlighetsfordelingen for en tilfeldig variabel \(X_1\) gitt utfalls-verdien på \(X_2\) benevnes \(P_{X_1|X_2} ( x_1 | x_2 ) = P_{X_1 X_2} (x_1 , x_2 ) / p_{X_2} ( x_2)\). Hvis de tilfeldige variablene er uavhengige vil denne fordelingen være lik \(P_{X_1} (x_1)\), altså uavhengig av utfalls-verdien av \(X_2\). Den betingete sannsynlighetsfordelingen er ikke symmetrisk i \(X_1\) og \(X_2\), og asymmetrien defineres av Bayes regel \(P_{X_1|X_2} (x_1 | x_2) = P_{X_2 | X_1} (x_2 | x_1 ) p_{X_1} (x_1) / p_{X_2} ( x_2 )\).

  • Eksempel: Betrakt terning- og mynt-forsøket over. Sannsynlighets-funksjonen for den tilfeldige variablen \(X_1\) gitt at \(X_2=0\), altså antall øyne på terningen gitt at mynten viser mynt, er skissert i Figuren nedenfor. De to tilfeldige variablene er åpenbart uavhengige.

  • Eksempel: Betrakt høyde- og vekt-målings forsøket over. Sannsynlighets-funksjonen for den tilfeldige variablen \(X_1\) gitt at \(X_2=80\), altså høyden gitt at vekten er 80 kg, er skissert i Figuren nedenfor. De to tilfeldige variablene er åpenbart avhengige.

Forventning og Varians


Forventning (expectation) \(E\{X\}\) og varians (variance) \(Var\{X\}\) tallfester lokasjon og spredning på utfalls-verdiene i et tilfeldig forsøk. Forventet verdi er et sannsynlighets-veid gjennomsnitt av alle mulige utfalls-verdier. Varians verdi er et sannsynlighets-veid gjennomsnitt av kvadratisk avvik mellom utfalls-verdi og forventet verdi. Standard avviks verdi (standard deviation) \(Sd\{X\}\) er definert som kvadratroten av varians verdi, og forventet verdi og standard avviks verdi har samme enhet og er derfor sammenlignbare.

  • Eksempel: Betrakt terning-forsøket over. Forventet verdi er \(E\{X\}= \frac{1}{6}×1 + \frac{1}{6} × 2 + … + \frac{1}{6}× 6 = 3.5\) og varians verdi er \(Var\{X\} = \frac{1}{6} × (1 – 3.5)^2 + \frac{1}{6} × (2 – 3.5)^2 + … + \frac{1}{6} × (6 – 3.5)^2 = 2.3\). Herav, får en standard avviks verdi \(Sd\{X\} = \sqrt{Var\{X\}}=1.71\) .

Korrelasjon og Kausalitet


Korrelasjon (correlation) \(Corr\{X_1,X_2\}\) og kausalitet (causiality) \(Cau\{X_1|X_2\}\) tallfester samvariasjonen og følge-avhengighet i tilfeldige bi-variate variable \([X_1,X_2]\). Korrelasjon er et normert mål på symmetrisk samvariasjon slik at \( -1 \leq Corr\{X_1,X_2\} = Corr\{X_2,X_1\} \leq 1\) og dette målet er nært knyttet til den bi-variate sannsynlighetsfordelingen.

Kausalitet er et asymmetrisk avhengighets-mål slik at \(Cau\{X_1|X_2\} \neq Cau\{X_2|X_1\}\) og dette målet er nært knyttet til de betingete sannsynlighetsfordelingene mellom variablene. Samspillet mellom de tilfeldig bi-variate variablene kan presenteres i en graf, hvor korrelasjon og kausalitet representeres med henholdsvis tosidige og ensidige piler, se Figur nedenfor.

Statistikk

Prøvetaking


Et tilfeldig utvalg på størrelse \(n\) av en tilfeldig variabel \(X\) fra et tilfeldig forsøk med sannsynlighets-funksjon \(P_X(x)\) genereres ved å gjenta forsøket n ganger, uavhengig av hverandre, og registrere utfall-verdiene, \(x_1, x_2, … ,x_n\).

  • Eksempel: Betrakt terning forsøket over. Etter gjentatte kast av terning og registrering av antall øyne, får en utfalls-verdiene: 2,6,4,4,5,2, ……..
  • Eksempel: Betrakt høyde-målings forsøket over. Etter gjentatte trekninger av gutter og registrering av høyder, får en utfalls-verdiene: 176.4,183.8,184.0, ……

Et tilfeldig utvalg fra et tilfeldige forsøk som resulterer i tilfeldige multi-variate variable kan genereres på tilsvarende måte.

Data-analyse


Data analysen utføres uten noen sannsynlighets-antakelser på et tilfeldig utvalg \(x_1, x_2, … ,x_n\), og det består i å synligjøre egenskaper ved den underliggende ukjente sannsynlighetsfordelingen. En kan anslå forventet verdi og varians verdi ved å regne ut gjennomsnitt av utvalget og gjennomsnitt av kvadratisk avvik mellom utvalget og beregnet forventet verdi.

Videre kan en synliggjøre sannsynlighets-funksjonen og sannsynlighets-tettheten ved å presentere henholdsvis et akkumulasjons-plott eller et histogram.

Et akkumulasjons-plott viser andelen i det tilfeldige utvalget som er mindre enn en spesifisert verdi \(x\), og dette plottet er åpenbart relatert til sannsynlighets-funksjonen for det tilfeldige forsøket. Et histogram er basert på en oppdeling av tall-linjen i linjestykker, og plotting av andelen i det tilfeldige utvalget som faller innenfor hvert linje-stykke, og dette plottet er åpenbart relatert til sannsynlighets-tettheten for det tilfeldige forsøket.

For tilfeldige utvalg fra multi-variate tilfeldige forsøk kan en beregne forventet verdi og varians verdi for hver av variablene samt presentere bi-plott for å synliggjøre de bi-variate sannsynlighets-tetthetene. Kreative diagrammer og plott av det tilfeldige utvalget \(x_1, x_2, …, x_n\) kan ofte gi uvurderlig innsikt i sannsynlighets-egenskapene til den underliggende tilfeldige variablen fra det tilfeldige forsøket.

  • Eksempel: Betrakt terning forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. Akkumulasjons-plott og histogram, med anslag på forventet verdi og standard avviks verdi, er skissert i Figurene nedenfor.

  • Eksempel: Betrakt høyde-målings forsøket over. Akkumulasjons-plott og histogram, med anslag på forventet verdi og standard avviks verdi, er skissert i Figurene nedenfor.

Estimering


Basert på akkumulasjons-plott og histogrammer av det tilfeldige utvalget \(x_1, x_2, .. ,x_n\) kan en tilpasse sannsynlighets-funksjonen og sannsynlighets-tettheten til den underliggende tilfeldige variabelen, henholdsvis \(P_X(x)\) og \(p_X(x)\). Denne tilpassingen benevnes estimering av henholdsvis sannsynlighets-funksjonen og sannsynlighets-tettheten, og estimatene benevnes \(\hat{P}_X(x)\) og \(\hat{p}_X(x)\).

Forventningen og variansen til den tilfeldige variablen, henholdsvis \(E\{X\}\) og \(Var\{X\}\), kan estimeres som gjennomsnitt av det tilfeldige utvalget og gjennomsnitt av kvadratavviket av det tilfeldige utvalget minus estimert forventning. Estimatene benevnes \(\hat{E}\{X\}\) og \(\hat{Var}\{X\}\).

  • Eksempel: Betrakt terning forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. Akkumulasjons-plott og histogram skissert i Figurene nedenfor, er gode estimater for henholdsvis sannsynlighets-funksjonen og sannsynlighets-tettheten for det tilfeldige forsøket. Likeledes er gjennomsnittet og gjennomsnittet av kvadratavviket gode estimater for forventning og varians.

  • Eksempel: Betrakt høyde-målings forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. Akkumulasjons-plott og histogram skissert i Figurene nedenfor, er gode estimater for henholdsvis sannsynlighets-funksjonen og sannsynlighets-tettheten for det tilfeldige forsøket. Likeledes er gjennomsnittet og gjennomsnittet av kvadratavviket gode estimater for forventning og varians.

Sannsynlighets-funksjonen antas ofte å komme fra en klasse av funksjoner, \(P_X(x; \theta)\) som er definert av en parameter \(\theta\). Basert på et tilfeldig utvalg fra denne tilfeldige variablen, \(x_1, x_2, … ,x_n\), ønsker en ofte å tilpasse den beste funksjonen fra denne klassen. Dette gjøres ved å estimere de aktuelle klasse-parameter verdiene , \(\theta\) ,basert på det tilfeldige utvalget, og estimatene benevnes \(\hat{\theta}\).

  • Eksempel: Betrakt høyde-målings forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. La en anta at sannsynlighetsfordelingen til den tilfeldige variablen \(X\) er Gaussisk (normal) fordelt med parametre \(\mu\) og \(\sigma\) som tilsvarer forventning og standard avvik. Sam-plot av akkumulasjons-plott samt histogram og beste tilpassede Gaussiske fordeling er skissert i Figurene nedenfor. Beste estimat for \(\mu\) og \(\sigma\) vil være anslagene på \(E\{X\}\) og \(Sd\{X\}\), og estimatene benevnes \(\hat{\mu}\) og \(\hat{\sigma}\).

Estimering av sannsynlighetsfordelingen, eller andre egenskaper som forventning og varians, av et tilfeldig forsøk, basert på et tilfeldig utvalg av størrelse \(n\), vil selvsagt være beheftet med usikkerhet. Hvis vi gjentok de tilfeldige forsøkene i det tilfeldige utvalget ville vi fått andre utfalls-verdier og derfor andre estimater for sannsynlighets-funksjonen osv. Tallfesting av denne estimerings-usikkerheten er en viktig del av statistisk metodikk.

Den enkleste, og ofte beste, måten å tallfeste denne estimerings-usikkerheten på er bruk av en såkalt ‘Bootstrap’ (etter-håret-løfting) teknikk, som består av følgende steg:

  • Et tilfeldig utvalg fra tilfeldig forsøk har resultert i utfalls-verdier: \(x_1, x_2, x_3, … , x_n\). Basert på disse utfalls-verdiene, bruk et akkumulasjons-plott som estimat for sannsynlighets-funksjonen til den tilfeldige variablen. Dette estimatet vil være en trappe-funksjon med trinn av høyde \(1/n\) i utfalls-verdiene.
  • Simuler et tilfeldig utvalg av størrelse \(n\) basert på den estimerte sannsynlighets-funksjonen, benevnt ‘Bootstrap’ utvalget. Det gir utfalls-verdiene: \(x^b_{1}, x^b_{2}, … ,x^b_{n}\), og det er lett å forstå at dette tilsvarer å trekke uavhengig fra utfalls-verdiene over. Bruk disse simulerte utfalls-verdiene til å estimere den sannsynlighets-egenskapen en er interessert i, benevnt \(\hat{\theta}^{b}\), det såkalte ‘Bootstrap’ estimatet.
  • Gjenta simuleringen i steget over tusenvis av ganger \(B\). En har da beregnet \(\hat{\theta}^b\) , \(b=1,2, … , B\), som er et svært stort antall ‘Bootstrap’ estimater.
  • Variasjonen i disse ‘Bootstrap’ estimatene representerer usikkerheten i estimatet for \(\theta\) basert på det tilfeldige utvalget.
  • Eksempel: Betrakt høyde-målings forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. La en anta at sannsynlighetsfordelingen til den tilfeldige variablen \(X\) er Gaussisk (normal) fordelt med parametre \(\mu\) og \(\sigma\) som tilsvarer forventning og standard avvik. Bootstrap-usikkerheten i estimatene, basert på utfalls-verdi listen med \(B=1000\), av den Gaussiske sannsynlighets-funksjonen og \(E\{X\}=\mu\) og \(Sd\{X\}=\sigma\) er skissert i Figurene nedenfor.

Prediksjon


Basert på det tilfeldige utvalget \(x_1, x_2, … ,x_n\) fra en ukjent underliggende sannsynlighetsfordeling ønsker en ofte å forutsi utfalls-verdien fra et fremtidig tilfeldig forsøk, eller del-forsøk. Dette forsynet blir benevnt å predikere den tilfeldige variablen.

Prediksjon kan baseres på estimerte sannsynlighets-funksjoner eller sannsynlighets-tettheter eller baseres på antakelser om parametriske sannsynlighetsfordelinger med estimerte parametre.

  • Eksempel: Betrakt høyde- og vekt-målings forsøket over, med et tilfeldig utvalg. Et typisk prediksjons problem vil være å anslå vekten til en gutt når høyden er målt til 185 cm. Det tilsvarer å estimere den betingete sannsynlighets-funksjonen \(P_{X_2|X_1}( x_2 | 185)\). Dette kan gjøres ved et akkumulasjons-plott for vektene av de utfalls-verdiene som har høyde på omtrent 185.

Hypotese-testing


Sannsynlighets-funksjonen antas ofte å komme fra en parametrisk klasse av funksjoner, \(P_X( x; \theta)\). Basert på et tilfeldig utvalg fra denne fordelingen, \(x_1, x_2, … ,x_n\), ønsker en ofte å bekrefte/avkrefte at parameteren , \(\theta\), har en gitt verdi \(\theta_0\). Da utføres en hypotese test for om en kan forkaste påstanden om parameter-verdien, \(\theta=\theta_0\), med en spesifisert signifikans, \(\alpha\).

  • Eksempel: Betrakt høyde-målings forsøket over, med et tilfeldig utvalg som resulterte i utfalls-verdier listet over. La en anta at sannsynlighetsfordelingen til den tilfeldige variablen \(X\) er Gaussisk (normal) fordelt med parametre \(\mu\) og \(\sigma\) som tilsvarer forventning og standard avvik. Betrakt et akkumulasjons-plott av ‘Bootrap’ estimater for forventning \(\mu\), basert på \(B=1000\) i Figuren nedenfor. La hypotesen være at \(\mu=183\) og krev signifikans \(\alpha=0.1\) for å forkaste hypotesen. Dersom intervallet mellom det 50-ende minste og 50-ende største ‘Bootstrap’ estimatet inneholder verdien \(183\), kan ikke hypotesen om at \(\mu=183\) forkastes. I Figuren ser en at hypotesen kan forkastes.

2021-05-10, Mina Spremic