Temaside for TMA4240/TMA4245 Statistikk
Regneregler og regneprosedyrer
Anta at vi har gitt en eller flere stokastiske variabler og at en annen stokastisk variabel \(Y\) er definert som en funksjon av denne eller disse. På temasiden som diskuterer begreper, definisjoner og tolkninger for funksjoner av stokastiske variabler beskrives tre teknikker som kan benyttes til å finne sannsynlighetsfordelingen til \(Y\) i en slik situasjon. For å benytte disse teknikkene i en konkret situasjon kan man trenge regneregler og det kan være nyttig med trinn for trinn regneprosedyrer som spesifiserer hvordan man skal gå frem for å beregne eller bevise det man ønsker. På temasiden du nå ser på finner du dette for hver av de tre teknikkene diskutert på temasiden med begreper, definisjoner og tolkninger for funksjoner av stokastiske variabler.
Trykk på det grå feltet for mer informasjon om temaet.
Transformasjonsformelen
Transformasjonsformelen
Situasjon: Anta at man har en kontinuerlig stokastisk variabel \(X\) og at vi har gitt en formel for sannsynlighetstettheten til \(X\), \(f(x)\). Anta videre at en annen stokastisk variabel \(Y=u(X)\) er definert som en gitt funksjon av \(X\). Man har altså gitt en formel for funksjonen \(u(X)\). Videre forutsettes det at sammenhengen mellom \(X\) og \(Y\) er én-entydig. Målet er da å finne sannsynlighetstettheten til \(Y\), som man ofte betegner med \(g(y)\).
Siden funksjonen \(u(X)\) er antatt å være én-entydig vil den ha en tilhørende invers funksjon \(w(Y)\), dette betyr at vi skal ha \[ Y=u(X) ~~~\Leftrightarrow~~~ X=w(Y). \] Man bør merke seg at man vanligvis ikke vil ha oppgitt en formel for funksjonen \(w(Y)\), men siden \(u(X)\) er én-entydig vet man at en slik funksjon \(w(Y)\) finnes. Hvordan man kan finne en formel for funksjonen \(w(Y)\) er diskutert under beregningsprosedyre under.
Kriterium: For å finne en formel for sannsynlighetstettheten \(g(y)\) benytter man den såkalte transformasjonsformelen, \[ g(y) = f(w(y))\cdot |w^\prime(y)|. \] Denne formelen er nærmere diskutert under 'Transformasjon av en kontinuerlig stokastisk variabel' på temasiden for begreper, definisjoner og tolkninger for funksjoner av stokastiske variabler
Beregningsprosedyre: Fremgangsmåten for å utlede en formel for \(g(y)\) er:
Eksempel: Som et eksempel på beregningsprosedyren gitt over skal vi se på tilfellet at \(X\) er eksponensialfordelt med parameter \(\lambda\) og \(Y=e^{-X}\). Man har altså da at \[ f(x) = \left\{\begin{array}{ll} \lambda e^{-\lambda x}, & ~~~\text{når}~ x\geq 0,\\ 0 & ~~~\text{ellers,} \end{array}\right. \] og \[ Y = u(X) = e^{-X}. \] Utregningen blir da:
Teorem: La \(X\) være en stokastisk variabel med momentgenererende funksjon \(M_X(t)\), og la \(X_1,X_2,\ldots,X_n\) være \(n\) uavhengige stokastiske variabler med momentgenererende funksjoner henholdsvis \(M_{X_1}(t),M_{X_2}(t),\ldots,M_{X_n}(t)\). La dessuten \(a\) være en konstant. Da har vi at:
Bevis
Bevis
For å bevise de tre regnereglene i teoremet benytter man definisjonen av momentgenererende funksjoner og regneregler for forventningsverdier.
Kommentar: Ved å kombinere de tre regnereglene i teoremet over kan man finne uttrykk for enhver lineær funksjon av en eller flere uavhengige stokastiske variabler. Den typiske anvendelsen av disse regnereglene er for å bevise teoremer som sier at en gitt lineær funksjon av stokastiske variabler har en angitt sannsynlighetsfordeling, se diskusjon lenger nede på denne siden.
Benytte momentgenererende funksjoner til å bevise at en gitt (lineær) funksjon av variabler har en angitt fordeling
Benytte momentgenererende funksjoner til å bevise at en gitt (lineær) funksjon av variabler har en angitt fordeling
Situasjon: Man har gitt et teorem hvor situasjonen er som følger. Man har gitt en stokastisk variabel \(X\) eller flere stokastiske variabler \(X_1,X_2,\ldots,X_n\). Dersom det er flere stokastiske variabler er disse antatt å være uavhengige, og det er angitt hvilken sannsynlighetsfordeling den eller de stokastiske variabler har. Videre er en annen stokastisk variabel, som vi her kaller \(Y\), gitt som en funksjon av \(X\) eller \(X_1,X_2,\ldots,X_n\). Resultatet i teoremet er enten at \(Y\) har en spesifisert sannsynlighetsfordeling, eller at sannsynlighetsfordelingen til \(Y\) konvergerer mot en spesifisert fordeling når noe går mot en angitt grense. Man ønsker så å bevise dette teoremet.
Løsningsstrategi: Man starter med å definere seg en stokastisk variabel \(Z\) som har den sannsynlighetsfordelingen man ønsker å bevise at \(Y\) har, eventuelt at \(Z\) har den sannsynlighetsfordelingen man ønsker å bevise at sannsynlighetsfordelingen til \(Y\) konvergerer mot. Man vil så finne de momentgenererende funksjonene til \(Y\) og \(Z\) og se at disse er identiske, eventuelt at den momentgenererende funksjonen til \(Y\) konvergerer mot den momentgenererende funksjonen til \(Z\). Siden to stokastiske variabler har samme momentgenererende funksjon hvis og bare hvis de har samme sannsynlighetsfordeling er teoremet bevist.
Bevisprosedyre: En trinn for trinn fremgangsmåte for å bevise et slikt teorem er som følger.
Eksempel: I dette eksemplet skal vi bevise følgende teorem:
La \(X_1,X_2,\ldots,X_n\) være uavhengige og eksponensialfordelte, alle med samme forventningsverdi \(\mu\). Da er \(X_1+X_2+\ldots+X_n\) gammafordelt med parametre \(\alpha=n\) og \(\beta=\mu\).
Før man starter med selve beviset bør man merke seg at det er \(X_1+X_2+\ldots+X_n\) man skal bevise er gammafordelt. For å benytte bevisprosedyren diskutert over bør man derfor først innføre notasjonen \(Y=X_1+X_2+\ldots+X_n\). Det videre beviset blir da som følger.
Eksempel: I dette eksemplet ser vi på beviset for et teorem som sier at sannsynlighetsfordelingen til \(Y\) konvergerer mot en angitt fordeling. Vi tar utgangspunkt i følgende teorem:
La \(X\) være binomisk fordelt med parametre \(n\) og \(p\). Når \(n\rightarrow \infty\) og \(p\rightarrow 0\) slik at \(np=\mu\) er konstant vil sannsynlighetsfordelingen til \(X\) konvergere mot en poissonfordeling med forventningsverdi \(\mu\).
Før man starter med selve beviset bør man her merke seg at det er sannsynlighetsfordelingen til \(X\) man skal bevise konvergerer mot en poissonfordeling. For å benytte samme notasjon som i bevisprosedyren diskutert over bør man derfor innføre notasjonen \(Y=X\). Det videre beviset blir som følger:
Regne ut fordelingen for ekstremvariabler
Regne ut fordelingen for ekstremvariabler
Situasjon: Anta at \(X_1,X_2,\ldots,X_n\) er uavhengige stokastiske variabler og at de har kumulative sannsynlighetsfordelinger henholdsvis \(F_{X_1}(x),F_{X_2}(x),\ldots,F_{X_n}(x)\). Vi ønsker så å finne sannsynlighetsfordelingene til ekstremvariablene \[X_{(1)}=\min\{ X_1,X_2,\ldots,X_n\} ~~~~\text{og}~~~~ X_{(n)} = \max\{X_1,X_2,\ldots,X_n\}.\]
Fordeling for \(F_{X_{(n)}}(x)\): Det sentrale punktet for å komme frem til en formel for \(F_{X_{(n)}}(x)\) er å innse at \(X_{(n)}=\max\{X_1,X_2,\ldots,X_n\}\) er mindre enn eller lik et tall \(x\) hvis og bare hvis alle \(X_1,X_2,\ldots,X_n\) er mindre enn eller lik \(x\). Ved i tillegg å benytte at \(X_i\)'ene er uavhengige får man \begin{eqnarray} F_{X_{(n)}}(x) &=& P(X_{(n)}\leq x) = P(\max\{ X_1,X_2,\ldots,X_n\} \leq x)\\ &=& P(X_1\leq x, X_2\leq x,\ldots,X_n\leq x)\\ &=& P(X_1\leq x) \cdot P(X_2\leq x)\cdot \ldots\cdot P(X_n\leq x) \\ &=& F_{X_1}(x) \cdot F_{X_2}(x)\cdot \ldots\cdot F_{X_n}(x). \end{eqnarray} Dersom \(X_i\)'ene er kontinuerlige stokastiske variabler kan man finne sannsynlighetstettheten til \(X_{(n)}\) ved å regne ut \(F^\prime_{X_{(n)}}(x)\). På temasiden for begreper, definisjoner og tolkninger for funksjoner av stokastiske variabler er dette gjort i spesialtilfellet at \(F_{X_1}(x),F_{X_2}(x),\ldots,F_{X_n}(x)\) alle er like. Alle utregningene for dette tilfellet finnes i beviset gitt på den temasiden.
Fordeling for \(F_{X_{(1)}}(x)\): Det sentrale punktet for å komme frem til en formel for \(F_{X_{(1)}}(x)\) er å innse at \(X_{(1)}=\min\{X_1,X_2,\ldots,X_n\}\) er ekte større enn et tall \(x\) hvis og bare hvis alle \(X_1,X_2,\ldots,X_n\) er ekte større enn \(x\). Ved i tillegg å benytte at \(X_i\)'ene er uavhengige får man \begin{eqnarray} F_{X_{(1)}}(x) &=& P(X_{(1)}\leq x) = 1- P(X_{(1)} > x) = 1 - P(\min\{ X_1,X_2,\ldots,X_n\} > x)\\ &=& 1 - P(X_1 > x, X_2 > x,\ldots,X_n > x)\\ &=& 1 - P(X_1 > x) \cdot P(X_2 > x)\cdot \ldots\cdot P(X_n > x) \\ &=& 1 - (1-P(X_1\leq x))\cdot (1-P(X_2\leq x))\cdot\ldots\cdot (1-P(X_n\leq x))\\ &=& 1- (1-F_{X_1}(x)) \cdot (1-F_{X_2}(x))\cdot \ldots\cdot (1-F_{X_n}(x)). \end{eqnarray} Dersom \(X_i\)'ene er kontinuerlige stokastiske variabler kan man finne sannsynlighetstettheten til \(X_{(1)}\) ved å regne ut \(F^\prime_{X_{(1)}}(x)\). På temasiden for begreper, definisjoner og tolkninger for funksjoner av stokastiske variabler er dette gjort i spesialtilfellet at \(F_{X_1}(x),F_{X_2}(x),\ldots,F_{X_n}(x)\) alle er like. Alle utregningene for dette tilfellet finnes i beviset gitt på den temasiden.