\[\newcommand{\N}{\mathbb N} \newcommand{\Z}{\mathbb Z} \newcommand{\Q}{\mathbb Q} \newcommand{\R}{\mathbb R} \newcommand{\C}{\mathbb C} \newcommand{\ba}{\mathbf{a}} \newcommand{\bb}{\mathbf{b}} \newcommand{\bc}{\mathbf{c}} \newcommand{\bd}{\mathbf{d}} \newcommand{\be}{\mathbf{e}} \newcommand{\bff}{\mathbf{f}} \newcommand{\bh}{\mathbf{h}} \newcommand{\bi}{\mathbf{i}} \newcommand{\bj}{\mathbf{j}} \newcommand{\bk}{\mathbf{k}} \newcommand{\bN}{\mathbf{N}} \newcommand{\bn}{\mathbf{n}} \newcommand{\bo}{\mathbf{0}} \newcommand{\bp}{\mathbf{p}} \newcommand{\bq}{\mathbf{q}} \newcommand{\br}{\mathbf{r}} \newcommand{\bs}{\mathbf{s}} \newcommand{\bT}{\mathbf{T}} \newcommand{\bu}{\mathbf{u}} \newcommand{\bv}{\mathbf{v}} \newcommand{\bw}{\mathbf{w}} \newcommand{\bx}{\mathbf{x}} \newcommand{\by}{\mathbf{y}} \newcommand{\bz}{\mathbf{z}} \newcommand{\bzero}{\mathbf{0}} \newcommand{\nv}{\mathbf{0}} \newcommand{\cA}{\mathcal{A}} \newcommand{\cB}{\mathcal{B}} \newcommand{\cC}{\mathcal{C}} \newcommand{\cD}{\mathcal{D}} \newcommand{\cE}{\mathcal{E}} \newcommand{\cF}{\mathcal{F}} \newcommand{\cG}{\mathcal{G}} \newcommand{\cH}{\mathcal{H}} \newcommand{\cI}{\mathcal{I}} \newcommand{\cJ}{\mathcal{J}} \newcommand{\cK}{\mathcal{K}} \newcommand{\cL}{\mathcal{L}} \newcommand{\cM}{\mathcal{M}} \newcommand{\cN}{\mathcal{N}} \newcommand{\cO}{\mathcal{O}} \newcommand{\cP}{\mathcal{P}} \newcommand{\cQ}{\mathcal{Q}} \newcommand{\cR}{\mathcal{R}} \newcommand{\cS}{\mathcal{S}} \newcommand{\cT}{\mathcal{T}} \newcommand{\cU}{\mathcal{U}} \newcommand{\cV}{\mathcal{V}} \newcommand{\cW}{\mathcal{W}} \newcommand{\cX}{\mathcal{X}} \newcommand{\cY}{\mathcal{Y}} \newcommand{\cZ}{\mathcal{Z}} \newcommand{\rA}{\mathrm{A}} \newcommand{\rB}{\mathrm{B}} \newcommand{\rC}{\mathrm{C}} \newcommand{\rD}{\mathrm{D}} \newcommand{\rE}{\mathrm{E}} \newcommand{\rF}{\mathrm{F}} \newcommand{\rG}{\mathrm{G}} \newcommand{\rH}{\mathrm{H}} \newcommand{\rI}{\mathrm{I}} \newcommand{\rJ}{\mathrm{J}} \newcommand{\rK}{\mathrm{K}} \newcommand{\rL}{\mathrm{L}} \newcommand{\rM}{\mathrm{M}} \newcommand{\rN}{\mathrm{N}} \newcommand{\rO}{\mathrm{O}} \newcommand{\rP}{\mathrm{P}} \newcommand{\rQ}{\mathrm{Q}} \newcommand{\rR}{\mathrm{R}} \newcommand{\rS}{\mathrm{S}} \newcommand{\rT}{\mathrm{T}} \newcommand{\rU}{\mathrm{U}} \newcommand{\rV}{\mathrm{V}} \newcommand{\rW}{\mathrm{W}} \newcommand{\rX}{\mathrm{X}} \newcommand{\rY}{\mathrm{Y}} \newcommand{\rZ}{\mathrm{Z}} \newcommand{\pv}{\overline} \newcommand{\iu}{\mathrm{i}} \newcommand{\ju}{\mathrm{j}} \newcommand{\im}{\mathrm{i}} \newcommand{\e}{\mathrm{e}} \newcommand{\real}{\operatorname{Re}} \newcommand{\imag}{\operatorname{Im}} \newcommand{\Arg}{\operatorname{Arg}} \newcommand{\Ln}{\operatorname{Ln}} \DeclareMathOperator*{\res}{res} \newcommand{\re}{\operatorname{Re}} \newcommand{\im}{\operatorname{Im}} \newcommand{\arsinh}{\operatorname{ar\,sinh}} \newcommand{\arcosh}{\operatorname{ar\,cosh}} \newcommand{\artanh}{\operatorname{ar\,tanh}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\diag}{\operatorname{diag}} \newcommand{\proj}{\operatorname{proj}} \newcommand{\rref}{\operatorname{rref}} \newcommand{\rank}{\operatorname{rank}} \newcommand{\Span}{\operatorname{span}} \newcommand{\vir}{\operatorname{span}} \renewcommand{\dim}{\operatorname{dim}} \newcommand{\alg}{\operatorname{alg}} \newcommand{\geom}{\operatorname{geom}} \newcommand{\id}{\operatorname{id}} \newcommand{\norm}[1]{\lVert #1 \rVert} \newcommand{\tp}[1]{#1^{\top}} \renewcommand{\d}{\mathrm{d}} \newcommand{\sij}[2]{\bigg/_{\mspace{-15mu}#1}^{\,#2}} \newcommand{\abs}[1]{\lvert#1\rvert} \newcommand{\pysty}[1]{\left[\begin{array}{@{}r@{}}#1\end{array}\right]} \newcommand{\piste}{\cdot} \newcommand{\qedhere}{} \newcommand{\taumatrix}[1]{\left[\!\!#1\!\!\right]} \newenvironment{augmatrix}[1]{\left[\begin{array}{#1}}{\end{array}\right]} \newenvironment{vaugmatrix}[1]{\left|\begin{array}{#1}}{\end{array}\right|} \newcommand{\trans}{\mathrm{T}} \newcommand{\EUR}{\text{\unicode{0x20AC}}} \newcommand{\SI}[3][]{#2\,\mathrm{#3}} \newcommand{\si}[2][]{\mathrm{#2}} \newcommand{\num}[2][]{#2} \newcommand{\ang}[2][]{#2^{\circ}} \newcommand{\meter}{m} \newcommand{\metre}{\meter} \newcommand{\kilo}{k} \newcommand{\kilogram}{kg} \newcommand{\gram}{g} \newcommand{\squared}{^2} \newcommand{\cubed}{^3} \newcommand{\minute}{min} \newcommand{\hour}{h} \newcommand{\second}{s} \newcommand{\degreeCelsius}{^{\circ}C} \newcommand{\per}{/} \newcommand{\centi}{c} \newcommand{\milli}{m} \newcommand{\deci}{d} \newcommand{\percent}{\%} \newcommand{\Var}{\operatorname{Var}} \newcommand{\Cov}{\operatorname{Cov}} \newcommand{\Corr}{\operatorname{Corr}} \newcommand{\Tasd}{\operatorname{Tasd}} \newcommand{\Ber}{\operatorname{Ber}} \newcommand{\Bin}{\operatorname{Bin}} \newcommand{\Geom}{\operatorname{Geom}} \newcommand{\Poi}{\operatorname{Poi}} \newcommand{\Hyperg}{\operatorname{Hyperg}} \newcommand{\Tas}{\operatorname{Tas}} \newcommand{\Exp}{\operatorname{Exp}} \newcommand{\tdist}{\operatorname{t}} \newcommand{\rd}{\mathrm{d}}\]

Kokonaistodennäköisyys ja Bayesin kaava¶

Oletetaan sitten, että tapahtumat \(B_1, B_2, \ldots, B_n \subseteq \Omega\) muodostavat otosavaruuden \(\Omega\) osituksen (partition), eli että tapahtumat \(B_i\), \(1 \leq i \leq n\) ovat pareittain erillisiä ja että

\[\Omega = \bigcup_{i = 1}^{n}B_i = B_1 \cup B_2 \cup \cdots \cup B_n.\]

Tällöin mikä tahansa tapahtuma \(A \subseteq \Omega\) voidaan esittää pareittain erillisten tapahtumien \(A \cap B_i\), \(1 \leq i \leq n\) yhdisteenä

\[A = A \cap \Omega = A \cap \bigcup_{i = 1}^{n}B_i = \bigcup_{i = 1}^{n}(A \cap B_i) = (A \cap B_1) \cup (A \cap B_2) \cup \cdots \cup (A \cap B_n).\]

Erillisten tapahtumien yhdisteenä tapahtuman \(A\) todennäköisyys on siis

\[P(A) = \sum_{i = 1}^{n}P(A \cap B_i),\]

mikä voidaan edelleen tulkita kertolaskusäännön avulla seuraavasti.

Lause 1.5.1

Jos tapahtumat \(B_1, B_2, \ldots, B_n \subseteq \Omega\) muodostavat otosavaruuden \(\Omega\) osituksen ja todennäköisyys \(P(B_i) > 0\) kaikille \(i = 1, 2, \ldots, n\), niin

\[P(A)=\sum_{i=1}^{n}P(B_i)P(A\mid B_i).\]

Tällä kokonaistodennäköisyyden kaavalla voidaan laskea todennäköisyys \(P(A)\), kun tunnetaan ositteiden \(B_i\) todennäköisyydet ja tapahtuman \(A\) todennäköisyydet ositteissa \(B_i\). Tämän tärkeänä seurauksena voidaan laskea ehdollinen todennäköisyys

\[P(B_k\mid A)=\frac{P(B_k\cap A)}{P(A)}\]

käyttämällä ehdollisia todennäköisyyksiä \(P(A \mid B_i)\).

Lause 1.5.2 (Bayesin kaava)

Jos tapahtumat \(B_1, B_2, \ldots, B_n \subseteq \Omega\) muodostavat otosavaruuden \(\Omega\) osituksen ja todennäköisyys \(P(B_i)>0\) kaikille \(i=1,2,\ldots,n\), sekä \(P(A)>0\), niin

\[P(B_k\mid A)=\frac{P(B_k)P(A\mid B_k)}{\sum\limits_{i=1}^{n}P(B_i)P(A\mid B_i)}.\]

Kirjoittamalla Bayesin kaava tapahtumien \(B\) ja \(\overline{B}\) muodostamalle ositukselle saadaan käyttökelpoinen erikoistapaus.

Seuraus 1.5.3

Jos \(0 < P(B) < 1\) ja \(P(A) > 0\), niin

\[P(B \mid A) = \frac{P(B)P(A \mid B)}{P(B)P(A \mid B) + P(\overline{B})P(A \mid \overline{B})}.\]

Esimerkki 1.5.4

Tehtaan tuotannosta \(1~\%\) on viallisia (tapahtuma \(B_1\)), \(5~\%\) huonoja (tapahtuma \(B_2\)) ja \(94~\%\) hyviä (tapahtuma \(B_3\)). Kehitettiin testauslaite, joka hylkää viallisen tuotteen todennäköisyydellä \(0{,}90\) ja huonon tuotteen todennäköisyydellä \(0{,}70\). Todennäköisyydellä \(0{,}10\) testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä. Oletetaan, että on valittu satunnainen tuote ja että testilaite on hylännyt sen. Mikä on todennäköisyys, että tämä tuote on todella viallinen?

Piilota/näytä ratkaisu

Annettujen tietojen perusteella \(P(B_1)=0{,}01\), \(P(B_2)=0{,}05\) ja \(P(B_3)=0{,}94\). Olkoon \(A\) tapahtuma “tuote hylätään”. Tällöin \(P(A\mid B_1)=0{,}90\), \(P(A\mid B_2)=0{,}70\) ja \(P(A\mid B_3)=0{,}10\), joten todennäköisyys hylätylle tuotteelle olla viallinen on Bayesin kaavan mukaisesti

\[\begin{split}\begin{aligned} P(B_1\mid A) &= \frac{P(B_1)P(A\mid B_1)}{P(B_1)P(A\mid B_1)+P(B_2)P(A\mid B_2)+P(B_3)P(A\mid B_3)}\\ &= \frac{0{,}01\cdot 0{,}90}{0{,}01\cdot 0{,}90 + 0{,}05\cdot0{,}70+0{,}94\cdot 0{,}10} \approx 0{,}065. \end{aligned}\end{split}\]

Näin päätellään (frekvenssitulkinnassa), että hylätyistä tuotteista vain noin \(6{,}5~\%\) on viallisia! Toinen tapa lähestyä ongelmaa olisi laskea hylkäämisen todennäköisyys

\[\begin{split}\begin{aligned} P(A) &= P(B_1)P(A\mid B_1)+P(B_2)P(A\mid B_2)+P(B_3)P(A\mid B_3) \\ &= 0{,}01\cdot 0{,}90 + 0{,}05\cdot0{,}70+0{,}94\cdot 0{,}10 \approx 0{,}138 \end{aligned}\end{split}\]

kokonaistodennäköisyyden kaavalla, ja sen jälkeen soveltaa ehdollisen todennäköisyyden määritelmää ja kertolaskusääntöä kysytyn todennäköisyyden laskemiseksi.

Esimerkki 1.5.5

Testissä saadaan selville \(95~\%\) dopingia käyttäneistä. \(2~\%\) urheilijoista saa niinsanotun väärän positiivisen tuloksen, eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että \(1~\%\) urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia?

Piilota/näytä ratkaisu

Olkoot \(D\) ja \(T\) tapahtumat “käyttää dopingia” ja “tulos on positiivinen” tässä järjestyksessä. Tietojen perusteella \(P(D) = 0{,}01\), \(P(\overline{D}) = 0{,}99\), \(P(T \mid D) = 0{,}95\) ja \(P(T \mid \overline{D}) = 0{,}02\). Soveltamalla Bayesin kaavaa nähdään, että kysytty todennäköisyys

\[P(D \mid T) = \frac{P(D)P(T \mid D)}{P(D)P(T \mid D) + P(\overline{D})P(T \mid \overline{D})} = \frac{0{,}01 \cdot 0{,}95}{0{,}01 \cdot 0{,}95 + 0{,}99 \cdot 0{,}02} \approx 0{,}32.\qedhere\]