Temaside for TMA4240/TMA4245 Statistikk
Begreper, definisjoner og tolkninger
Hendelser og sannsynlighet
Sannsynlighet er et begrep vi ofte benytter i dagligtalen, og vi har en intuitiv forståelse av hva ordet betyr. For å kunne regne med sannsynlighet trenger vi en presis matematisk definisjon av begrepet. Ut fra en slik definisjon kan vi utlede regneregler for sannsynlighet. Før vi kan definere sannsynlighet trenger vi å definere begrepene stokastisk forsøk og hendelser. Vi definerer deretter sannsynlighet som en reell funksjon som er definert på hendelser og som har noen spesifikke egenskaper.
Sentrale begreper
Trykk på det grå feltet for mer informasjon om temaet.
Stokastisk forsøk, utfallsrom, hendelser og venndiagram
Stokastisk forsøk, utfallsrom, hendelser og venndiagram
Definisjon: Et stokastisk forsøk er et forsøk der resultatet er underlagt tilfeldigheter. Et mulig resultat i et stokastisk forsøk kalles et enkeltutfall eller utfall. Menden av alle multige enkeltutfall i et stokastisk forsøk kalles vi utfallsrom.
Notasjon: Enkeltutfall betegnes gjerne med bokstaven \( e\). Hvis vi trenger notasjon for flere enkeltutfall brukes ofte \( e_1,e_2,e_3\) osv. Utfallsrommet til et stokastisk forsøk betegner vi gjerne med \( S\).
Kommentar: Et utfallsom \( S\) kan ha endelig mange elementer, tellbart uendelig mange elementer eller ikke-tellbart uendelig mange elementer. Typiske utfallsrom med tellbart uendelig mange elementer er \( \{1,2,3,\ldots\}\) og \( \{0,1,2,3,\ldots\}\). Typiske utfallsrom med ikke-tellbart uendelig mange elementer er et intervall på tallinja og hele \( R \).
Definisjon: En hendelse er en delmengde av utfallsommet.
Notasjon: Vi benytter som oftest store bokstaver tidlig i alfabetet til å betegne hendelser, for eksempel \( A, B, C\) osv.
Vi har tre operasjoner som opererer på hendelser. Disse er union, snitt og komplement.
- Snittet av to hendelser \( A\subseteq S\) og \( B\subseteq S\) er hendelsen som inneholder alle utfall som er i både \( A\) og \( B\). Snittet av \( A\) og \( B\) betegner vi med \( A\cap B\) og snitt kan da matematisk defineres som
\[ A\cap B = \{ e\in S \ |\ e\in A ~\text{og}~ e\in B\}. \]
- Unionen av to hendelser \( A\subseteq S\) og \( B\subseteq S\) er hendelsen som inneholder alle utfall som er i \( A\) eller i \( B\), eller i både \( A\) og \( B\). Unionen av \( A\) og \( B\) betegner vi med \( A\cup B\) og union kan da matematisk defineres som
\[ A\cup B = \{ e\in S\ |\ e\in A ~\text{eller}~ e\in B\}. \]
- Komplementet til en hendelse \( A\subseteq S\) er hendelsen som inneholder alle utfall i \( S\) som ikke er i \( A\). Komplementet til \( A\) betegner vi med \( A^\prime\) eller \( A^C\). Benytter vi førstnevnte notasjon kan komplement matematisk defineres som
\[ A^\prime = \{ e\in S\ |\ e\not\in A\}. \]
For å illustrere hendelser og operasjoner på hendelser er det vanlig å benytte venndiagram. I de følgende tre venndiagrammene er henholdsvis \( A\cap B\), \( A\cup B\) og \( A^\prime\) markert med rødt.
To hendelser \( A\) og \( B\) sies å være disjunkte dersom \( a\cap B = \emptyset\). I et venndiagram vil to disjunkte hendelser ikke overlappe, som i dette venndiagrammet.
Relevante videoer:
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (12:36, Mette Langaas).
Relevante oppgaver:
\(\ \ \ \)Eksamen mai 2013, oppgave 2 (b,n,e).
\(\ \ \ \)Eksamen mai 2012, oppgave 4 (b,n,e).
\(\ \ \ \)Eksamen desember 2011, oppgave 1ab (b,n,e).
\(\ \ \ \)Eksamen august 2011, oppgave 1a (b).
\(\ \ \ \)Eksamen juni 2011, oppgave 2a (b,n,e).
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (b,n,e).
Sannsynlighet
Sannsynlighet
Definisjon: Et sannsynlighetsmål \( P\) på et utfallsrom \( S\) er en reell funksjon definert på hendelser i \( S\) slik at
- \( 0\leq P(A)\leq 1\) for alle hendelser \( A\subseteq S\),
- \( P(S) = 1\), og
- dersom \( A_1,A_2,\ldots\) er parvis disjunkte hendelser (dvs \( A_i\cap A_j=\emptyset\) for alle \( i\neq j\) ) så er
\[ P\left( \bigcup_{i=1}^\infty A_i\right) = \sum_{i=1}^\infty P(A_i). \]
Tolkning: Man kan tolke \( P(A)\) som arealet av hendelsen \( A\) i et venndiagram. Merk at krav 2 i definisjonen av sannsynlighet \( P\) da gir at utfallsrommet \( S\) har areal en i et venndiagram. Ved å benytte denne analogien mellom \( P(A)\) og arealet av \( A\) i venndiagram kan man også finne en del regneregler for sannsynlighet, se mer om dette under temasiden om regneregler for sannsynlighet.
Kommentar: Denne definisjonen av sannsynlighet er en ren matematisk definisjon. For å få intuitiv forståelse av hva sannsynlighet er, og dermed kunne gi en tolkning til begrepet sannsynlighet, må vi formulere et sannsynlighetsmål \( P\) relevant for et konkret stokastisk forsøk.
Tolkning: For å gi en tolkning til sannsynlighet skal vi se på et stokastisk forsøk der vi kaster en terning og registrerer antall øyne. Utfallsrommet blir da \(S=\{ 1,2,3,4,5,6\}\) og det er rimelig å anta en uniform sannsynlighetsmodell hvor man har at \( P(\{ e\}) = 1/6\) for \(e = 1,2,3,4,5,6\). Betrakt så hendelsen \( A=\{ 5,6\}\). For å gi en tolkning av \( P(A)\) må vi tenke oss at vi kaster terningen gjentatte ganger. La \( n\) være antall ganger vi kaster terningen og la \( x\) være antall ganger hendelsen \( A\) skjer i disse \( n\) kastene. Vi lar altså \( x\) være antall ganger vi får en femmer eller sekser. Den relative hyppigheten av hendelsen \( A\) er da \( x/n\). Hvis vi nå lar \( n\rightarrow\infty\) vil naturlig nok også \( x\) vokse mot uendelig. Det kan vises at i en viss forstand vil \[ \text{relativ hyppighet} = \frac{x}{n} \rightarrow P(A) = \frac{1}{3} \] når \( n\rightarrow\infty\). \( P(A)\) er altså lik den relative hyppigheten av hendelsen \( A\) dersom vi gjentar forsøket undelig mange ganger.
Kommentar: Man kan merke seg at det fra definisjonen for sannsynlighet følger at sannsynligheten for den tomme mengde er lik null, \[ P(\emptyset ) = 0. \] For å se dette kan man benytte egenskap 2 og 3 i definisjonen for sannsynlighet for hendelsene \( A_1=S\) og \( A_i=\emptyset\) for \(i=2,3,\ldots\). Da har vi at \( A_1,A_2,\ldots\) er parvis disjunkte hendelser (\( A_i\cap A_j=\emptyset\) for \( i\neq j\)), samt at \( S = \bigcup_{i=1}^\infty A_i\), slik at \[ 1 = P(S) = P\left( \bigcup_{i=1}^\infty A_i\right) = \sum_{i=1}^\infty P(A_i) = P(S) + \sum_{i=2}^\infty P(\emptyset) = 1 + \sum_{i=2}^\infty P(\emptyset) \Rightarrow P(\emptyset) = 0. \]
Kommentar: Man kan også merke seg at det fra definisjonen av sannsynlighet følger at man for endelig mange parvis disjunkte hendelser \( A_1,A_2,\ldots,A_n\) har at \[ P\left( \bigcup_{i=1}^n A_i\right) = \sum_{i=1}^n P(A_i). \] For å se dette kan man først velge \( A_i=\emptyset\) for \( i=n+1,n+2,\ldots\). Da har vi at \( A_1,A_2,\ldots\) er parvis disjunkte slik at egenskap 3 i definisjonen for sannsynlighet skal gjelde. Dessuten har vi åpenbart at \( \bigcup_{i=1}^n A_i = \bigcup_{i=1}^\infty A_i\), slik at vi får \[ P\left(\bigcup_{i=1}^n A_i\right) = P\left(\bigcup_{i=1}^\infty A_i\right) = \sum_{i=1}^\infty P(A_i) = \sum_{i=1}^n P(A_i) + \sum_{i=n+1}^\infty P(\emptyset) = \sum_{i=1}^n P(A_i), \] siden \( P(\emptyset) = 0\).
Relevante videoer:
Relevante oppgaver:
Uniform sannsynlighetsmodell
Uniform sannsynlighetsmodell
Definisjon: Vi sier at vi har en uniform sannsynlighetsmodell hvis
- antall elementer i utfallsommet er endelig, \( S=\{ e_1,e_2,\ldots,e_m\}\), og
- sannsynligheten for alle hendelser som kun inneholder et enkeltutfall er like, dvs
\[ P(\{ e_1\}) = P(\{ e_2\}) =\ldots = P(\{ e_m\}). \]
Teorem: I en uniform sannsynlighetsmodell har vi for enhver hendelse \( A\subseteq S\) at \[ P(A) = \frac{g}{m} = \frac{\text{antall gunstige utfall}}{\text{antall mulige utfall}}. \]
Bevis
Bevis
For å bevise dette teoremet bruker vi antagelsene som gjøres for en uniform sannsynlighetsmodell og egenskaper for \( P\). La \( w\) betegne sannsynligheten for hendelsene som inneholder kun et enkeltutfall, dvs \[ P(\{ e_1\}) = P(\{ e_2\}) =\ldots = P(\{ e_m\}) = w. \] Siden \( \{e_1\},\{e_2\},\ldots,\{e_m\}\) er parvis disjunkte hendelser og \( S=\bigcup_{i=1}^m \{ e_i\}\) har vi da at \[ 1 = P(S) = P\left( \bigcup_{i=1}^m \{ e_i\}\right) = \sum_{i=1}^m P(\{ e_i\}) = \sum_{i=1}^m w = mw \Rightarrow w = \frac{1}{m}. \] Betrakt så en vilkårlig hendelse \( A=\{ e_{i_1},e_{i_2},\ldots,e_{i_g}\}\subseteq S\) der vi forutsetter at \( e_{i_1},e_{i_2},\ldots,e_{i_g}\) er \( g\) forskjellige enkeltutfall i utfallsrommet \( S\). Da har vi at \( \{e_{i_1}\},\{e_{i_2}\},\ldots,\{e_{i_g}\}\) er parvis disjunkte hendelser og \( A=\bigcup_{j=1}^g \{ e_{i_j}\}\) slik at \[ P(A) = P\left( \bigcup_{j=1}^g \{e_{i_j}\}\right) = \sum_{j=1}^g P(\{ e_{i_j}\}) = \sum_{j=1}^g w = gw = \frac{g}{m}. \]
Kommentar: Unntatt i svært enkle situasjoner vil både antall gunstige utfall og antall mulige utfall være svært store tall og det er i praksis ikke gjennomførbart å bestemme \( g\) og \( m\) ved å telle opp antall elementer i henholdsvis \( A\) og \( S\). Til bruk i slike situasjoner finnes det en del telleregler som ofte relativt enkelt gir antall enkeltutfall i \( A\) og \(S\). De viktigste slike regler beskrives på temasiden om kombinatorikk eller telleregler.
Relevante videoer:
\(\ \ \ \)Uniform sannsynlighetsmodell (20:58, Håkon Tjelmeland)
\(\ \ \ \)Eksamen desember 2012, oppgave 2a (10:12, Mette Langaas).
Relevante oppgaver:
\(\ \ \ \)Eksamen desember 2015, oppgave 1a (b,n,e).
\(\ \ \ \)Eksamen desember 2013, oppgave 1a (b,n,e).
\(\ \ \ \)Eksamen august 2013, oppgave 4 (b,n,e).
Betinget sannsynlighet
Betinget sannsynlighet
Definisjon: La \( A\) og \(B\) være to hendelser i et utfallsrom \(S\) og anta at \( P(A) > 0\). Den betingede sannsynligheten for \(B\) gitt \( A\) er da \[ P(B|A) = \frac{P(A\cap B)}{P(A)}. \]
Tolkning: Betinget sannsynlighet er sannsynlighet under tilleggsinformasjon. \(P(B|A)\) er sannsynligheten for at hendelsen \( B\) dersom vi allerede vet at hendelsen \( A\) har skjedd. Tilleggsinformasjonen vi får er altså at hendelsen \( A\) har skjedd, og det kan naturlig nok endre sannsynligheten for hendelsen \( B\).
Motivasjon: En intuitiv motivasjon for definisjonen av betinget sannsynlighet gitt over får vi vet å tolke sannsynlighet for en hendelse som arealet av denne hendelsen i et venndiagram.
Når vi vet at hendelsen \( A\) har skjedd vil mengden av alle mulige utfall bare være de som er inneholdt i \( A\). Når vi da betrakter en hendelse \( B\) vil det kun være den delen av \( B\) som også er inneholdt i \( A\), dvs \( A\cap B\), som kan skje. Det er dermed naturlig å si at sannsynligheten for \( B\) gitt \( A\) er andelen av arealet av \( A\) som også er inneholdet i \( B\),
\[
P(B|A) =\frac{\text{areal}(A\cap B)}{\text{areal}(A)}.
\]
Ved å sette inn tolkningene \( P(A\cap B) = \text{areal}(A\cap B)\) og \( P(A)=\text{areal}(A)\) i denne ligningen får vi
\[
P(B|A) = \frac{P(A\cap B)}{P(A)},
\]
som er identisk med definisjonen gitt over.
Relevante videoer:
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (12:36, Mette Langaas).
Relevante oppgaver:
\(\ \ \ \)Eksamen desember 2013, oppgave 1a (b,n,e).
\(\ \ \ \)Eksamen august 2013, oppgave 4 (b,n,e).
\(\ \ \ \)Eksamen desember 2011, oppgave 1b (b,n,e).
\(\ \ \ \)Eksamen august 2011, oppgave 1b (b).
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (b,n,e).
\(\ \ \ \)Eksamen juni 2010, oppgave 1b (b,n,e).
Uavhengige hendelser
Uavhengige hendelser
Definisjon: To hendelser \( A\) og \( B\) er uavhengige dersom \[ P(B|A) = P(B), \] og hvis ikke er \( A\) og \( B\) avhengige.
Tolkning: Hvis hendelsene \( A\) og \( B\) er uavhengige vil altså tilleggsinformasjonen om at hendelsen \(A\) har skjedd ikke endre sannsynligheten for hendelsen \(B\).
Kommentar: Kravet \(P(B|A)=P(B)\) gitt i definisjonen over er det kanskje mest naturlig å lese som at '\(B\) er uavhengig av \(A\)', men man bør merke seg at uavhengighet faktisk er en symmetrisk egenskap, i den forstand at '\( B\) er uavhengig av \( A\)' hvis og bare hvis '\(A\) er uavhengig av \(B\)'. Matematisk kan dette uttrykkes som \[ P(B|A)=P(B) \Leftrightarrow P(A|B)=P(A). \] For å se hvorfor dette er korrekt er det naturlig å starte med \( P(A|B)\) og så benytte definisjonen av betinget sannsynlighet og multiplikasjonssetningen, \[ P(A|B) = \frac{P(A\cap B)}{P(B)} = \frac{P(B|A)P(A)}{P(B)}. \] Dermed får vi at \[ P(B|A)=P(B) \Rightarrow P(A|B) = \frac{P(B)P(A)}{P(B)} = P(A), \] og den motsatte implikasjonen får man ved å ta utgangspunkt i \( P(B|A)\) og regne tilsvarende.
Relevante videoer:
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (12:36, Mette Langaas).
Relevante oppgaver:
\(\ \ \ \)Eksamen mai 2013, oppgave 2 (b,n,e).
\(\ \ \ \)Eksamen desember 2011, oppgave 1ab (b,n,e).
\(\ \ \ \)Eksamen august 2011, oppgave 1b (b).
\(\ \ \ \)Eksamen juni 2011, oppgave 2a (b,n,e).
\(\ \ \ \)Eksamen desember 2010, oppgave 1 (b,n,e).