- MATH.APP.210
- 4. Todennäköisyysjakaumia
- 4.3 Poissonin jakauma
Poissonin jakauma¶
Toinen sovellusten kannalta erittäin tärkeä diskreetti todennäköisyysjakauma käsittelee suhteellisen harvinaisten, mutta keskimäärin vakiotahdilla riippumattomasti toistuvia tapahtumia. Annetaan aluksi jakauman määritelmä, ja palataan myöhemmin sen tulkintaan sovelluksissa.
Määritelmä 4.3.1
Diskreetti satunnaismuuttuja \(X\), jonka otosavaruus \(\Omega=\{0,1,2,3,\ldots\}\), noudattaa Poissonin jakaumaa (Poisson distribution) parametrinaan \(\lambda>0\), \(X\sim\Poi(\lambda)\), jos sen tiheysfunktio
Voidaan osoittaa, että määritelmässä annettu funktio on tiheysfunktio. Sen arvot ovat ei-negatiivisia ja laskettaessa tiheysfunktioiden arvojen summa, saadaan sarjan summaksi \(= 1\).
Lause 4.3.2
Jos satunnaismuuttuja \(X\sim\Poi(\lambda)\), niin sen odotusarvo ja varianssi ovat
Kun \(X\sim\Poi(\lambda)\)
Nyt odotusarvo
missä eri vaiheiden perusteluna ovat
- Diskreetin satunnaismuuttujan odotusarvon määritelmä
- Summan ensimmäinen termi \(=0\), kun \(x=0\). Siksi summan arvo ei muutu, vaikka indeksointi aloitetaan arvosta \(x=1\).
- Supistetaan luvulla \(x\) ja otetaan yksi \(\lambda\) vakiona summan eteen.
- Korvataan \(x-1 \to x\) ja aloitetaan summaus arvosta \(x=0\). Summa ei muutu.
- Summa on koko otosavaruuden todennäköisyys \(P(\Omega)=1\)
Varianssia varten määritetään \(\rE(X^2)\). Toimitaan vastaavalla tavalla.
missä eri vaiheiden perusteluna ovat
- Diskreetin satunnaismuuttujan funktion odotusarvon määritelmä
- Summan ensimmäinen termi \(=0\), kun \(x=0\). Siksi summan arvo ei muutu, vaikka indeksointi aloitetaan arvosta \(x=1\).
- Supistetaan luvulla \(x\) ja otetaan yksi \(\lambda\) vakiona summan eteen.
- Korvataan \(x-1 \to x\), \(x\to x+1\) ja aloitetaan summaus arvosta \(x=0\). Summa ei muutu.
- Jaetaan summa kahdeksi summaksi.
- Ensimmäinen osa on odotusarvo = \(\lambda\) ja toinen osa on koko otosavaruuden todennäköisyys \(P(\Omega)=1\).
Näin
Poissonin jakauman odotusarvo ja varianssi ovat siis yhtä suuret. Tämän jakauman tärkeä sovellus on sen käyttö stokastisten prosessien käsittelyssä silloin, kun ollaan kiinnostuneita tietyn tapahtuman \(A\) realisoitumisten lukumäärästä tietyllä aikavälillä. Oletetaan prosessille seuraavat ominaisuudet.
- Jos \(I_1,I_2,\ldots,I_n\) ovat pistevieraita (erillisiä) aikavälejä, niin tapahtuman \(A\) esiintymisten lukumäärät eri aikaväleillä ovat riippumattomia.
- Tapahtuman \(A\) esiintymisten keskimääräistä lukumäärää aikayksikössä voidaan pitää vakiona \(q\).
- Todennäköisyys sille, että \(A\) realisoituu hyvin lyhyellä aikavälillä \(\Delta t\) useammin kuin kerran, on likimain nolla.
Jos stokastinen prosessi toteuttaa oletukset 1–3 ja satunnaismuuttuja \(X\) kuvaa tapahtuman \(A\) esiintymisten lukumäärää aikavälillä \((t_1, t_2)\), niin voidaan osoittaa että
eli \(X\) noudattaa Poissonin jakaumaa parametrinaan \(\lambda = q(t_2 - t_1)\).
Esimerkki 4.3.3
Yksi gramma radiumin isotooppia lähettää keskimäärin \(3.57 \cdot 10^{10}\) \(\alpha\)-hiukkasta sekunnissa. Laske todennäköisyys sille, että yhden nanosekunnin (\(10^{-9}\)s) aikana se lähettää
- täsmälleen \(35\) \(\alpha\)-hiukkasta,
- \(27\), \(28\) tai \(29\) \(\alpha\)-hiukkasta.
Radioaktiivinen hajoaminen toteuttaa varsin hyvin edellä esitellyt Poissonin prosessin oletukset. Olkoon \(X\) radium-näytteen lähettämien \(\alpha\)-hiukkasten lukumäärä nanosekunnissa, jolloin \(X \sim \Poi(\lambda)\), missä
Todennäköisyys sille, että nanosekunnissa vapautuu täsmälleen \(35\) \(\alpha\)-hiukkasta on
\[P(X = 35) = p(35; 35.7) = \frac{35.7^{35}}{35!}e^{-35.7} \approx 0.0668.\]Matlabin Poissonin jakaumaan liittyvät tiheys- ja kertymäfunktiot ovat
poisspdf
japoisscdf
. R:n vastaavat funktiot ovatdpois
jappois
. Sama tulos saataisiin siis Matlab- ja R-komennoillapoisspdf(35, 35.7) % Matlab dpois(35, 35.7) # R
Todennäköisyys sille, että nanosekunnissa vapautuu \(27\), \(28\) tai \(29\) \(\alpha\)-hiukkasta on
\[\begin{split}\begin{aligned} P(27 \leq X \leq 29) &= \sum_{x = 27}^{29}p(x; 35.7) = \sum_{x = 27}^{29}\frac{35.7^x}{x!}e^{-35.7} \\ &= e^{-35.7}\left(\frac{35.7^{27}}{27!} + \frac{35.7^{28}}{28!} + \frac{35.7^{29}}{29!}\right) \approx 0.0924. \end{aligned}\end{split}\]Matlab- ja R-komennot
poisscdf(29, 35.7) - poisscdf(26, 35.7) % Matlab ppois(29, 35.7) - ppois(26, 35.7) # R
antavat saman tuloksen. Huomaa, että tapahtuman \(27 \leq X \leq 29\) todennäköisyys lasketaan kertymäfunktion \(F\) avulla erotuksena \(F(29) - F(26)\).
Huomautus 4.3.4
Poissonin jakaumaa voidaan soveltaa myös satunnaiskokeisiin, joissa ollaan kiinnostuneita tapahtuman \(A\) realisoitumien lukumäärästä tietyllä pituuden, pinta-alan tai tilavuuden osalla. Satunnaiskokeen tulee toteuttaa oletuksia 1–3 vastaavat oletukset, joissa aika korvataan sopivasti muilla käsitteillä.
Tietyissä tilanteissa Poissonin jakaumaa voidaan käyttää myös binomijakauman approksimoimiseen. Oletetaan, että satunnaismuuttuja \(X\sim\Bin(n, p)\), ja että \(np = \lambda\) on vakio. Jos nyt \(n\to\infty\), niin \(p = \frac{\lambda}{n} \to 0\). Tällöin
aina, kun \(x \in \N = \{0, 1, 2, \ldots\}\), sillä
kun \(n \to \infty\), sillä
ja eksponenttifunktion raja-arvomääritelmän mukaan raja-arvo
Kyseisen lukujonon suppeneminen tapahtuu nopeasti silloin, kun \(\lambda \ll n\).
Lause 4.3.5
Jos \(n\)-toistokokeessa \(n\) on suuri, onnistumisen todennäköisyys on pieni \(p\) ja \(\lambda \ll n\), eli kyseessä on harvinainen tapahtuma hyvin monen toiston sarjassa, niin binomijakauma
Huomautus 4.3.6
Milloin ehdot \(n\) on suuri ja \(p\) on pieni riittävän hyvin täyttyvät? Yksi päätössääntö on, että Poissonjakaumaa voidaan käyttää binomijakauman approksimoimiseen, kun \(n\geq 100\) ja \(np\leq 10\). Tämän approksimaation merkitys laskennassa on vähäinen, kun todennäköisyydet voi Matlabilla/Rllä laskea myös suoraan alkuperäisellä binomijakaumalla.
Esimerkki 4.3.7
Tiedetään, että sadasta signaalista keskimäärin yksi välittyy virheellisesti. Lähetetään \(200\) toisistaan riippumatonta signaalia ja lasketaan todennäköisyys sille, että ainakin kolme signaalia välittyy virheellisesti. Olkoon satunnaismuuttuja \(X\) virhesignaalien lukumäärä, jolloin \(X\sim\Bin(200, 0.01)\). Tarkka todennäköisyys
Kun approksimoidaan \(\Bin(200, 0.01) \approx \Poi(2)\), todennäköisyydeksi saadaan \(4\) desimaalin tarkkuudella sama tulos:
Matlabilla laskut saa komennoilla
1- binocdf(2, 200, 0.01) % Matlab, Binomijakauma 1- poisscdf(2, 2) % Matlab, Poisson jakauma
Vastaavat R-komennot ovat
1- pbinom(2, 200, 0.01) # R, Binomijakauma 1- ppois(2, 2) # R, Poisson jakauma
Poissonin jakaumalla ja eksponenttijakaumalla on seuraavanlainen yhteys.
Esimerkki 4.3.8
Oletetaan, että satunnaisen tapahtuman esiintymiskertojen lukumäärä \(X\) tietyllä aikavälillä \([0, t]\) noudattaa Poissonin jakaumaa. Jos tapahtumien keskimääräistä lukumäärää aikayksikössä merkitään luvulla \(\lambda>0\), niin aikavälille \([0, t]\) osuu \(\lambda t\) tapahtumaa ja \(X \sim \Poi(\lambda t)\) tiheysfunktiolla
Olkoon ensimmäisen tapahtuman realisoitumisaika satunnaismuuttuja \(T\). Jos aikavälillä \([0,t]\) ei satu yhtään tapahtumaa, on \(T>t\). Tämän todennäköisyys
joten komplementtitapahtuman todennäköisyys on
Näin on saatu satunnaismuuttujan \(T\) kertymäfunktio ja tiheysfunktio saadaan derivoimalla
Tämä jakauma on eksponenttijakauma. Tapahtumien aikavälit Poissonin prosessissa noudattavat siis eksponenttijakaumaa \(\Exp(\lambda)\), missä \(\lambda\) on tapahtumien keskimääräinen määrä aikayksikössä.