본문 바로가기
공부/정보과학

[확률과정] 푸아송 과정

by 죠옹 2017. 12. 16.

 확률과정이라는 말과의 거리감을 줄이기 위해 예를 먼저 들어보자.

 이메일의 착신수, 교통사고, 신축주택수, 외국인의 유입수, 서비스 창구 대기인원수.... 등등 한 시점에 관측을 시작하여, 시간이 지날수록 발생횟수가 변화해 나가는 과정을 확률과정을 통해 생각해볼 수 있다. 관측을 시작한 시점을 't=0'로 두고, 발생횟수를 'N(t)'로 두어, 발생횟수에 대해 분석해 나간다.

 

 오늘은 확률과정 중 한 시점에 사상의 확률이 직전의 결과에만 영향을 받는 확률과정인 마루코프 과정, 그 중에서도 푸아송 과정에 대해 정리해 보려고 한다. 푸아송 과정은 정해진 시간 t내에 사건이 k번 발생할 확률을 나타내는 분포가 푸아송 분포로 나타나는 과정이다.

 

 지금부터 푸아송 과정의 네가지 성질과, 이로인해 사건의 발생확률이 푸아송 분포로 나타나는 이유까지의 과정을 수학적으로 분석해 보려한다. 나는 수학이 강한 사람이 아니므로, 수학이 약한 분들도 이 내용을 찬찬히 읽어보면 이해가 갈 수 있을거라 생각한다.

 

 푸아송과정은 네가지 성질로 표현할 수 있다.


(1) 관측을 시작한 시점에 발생횟수는 0이다.

   

 

(2) 발생횟수는 '정상독립증분'의 성질을 지닌다.

   - 서로 다른 시간구간에서 일어나는 사건의 발생횟수가 서로 연관이 없을 경우, '독립증분'의 성질을 가진다.

   - 두 시점 사이에서 일어나는 사건의 발생횟수가 두 시점간의 시간폭에만 의존할 때 '정상증분'의 성질을 가진다.

   - 두 성질을 합하여 정상독립증분 이라 칭한다.

   - 식으로 나타내면 다음과 같다. 

      "독립증분 = #1과 #2는 독립이다"

      "정상증분 = #3과 #4는 임의의 시간의 폭 h에 대해 같은 분포를 가진다."

       

 

(3) 충분히 작은 시간구간 h에서 사건이 1회 발생할 확률은 다음과 같다.

   

   - λ는 파라미터

   - o(h)는 h로 미분하였을 때, h가 0인 지점에서 기울기 0을 가지는 함수를 나타내는 기호다. 이는 h가 충분히 작은 값을       가질 때, o(h)는 무시가능한 항으로 보는 것이 가능함을 뜻하기도 한다.

   - h가 충분히 작을 때, o(h)를 무시하면, 사건의 발생확률은 시간의 폭 h에 비례한다.

 

(4) 충분히 작은 시간구간 h에서, 사건이 2회 이상 발생할 확률은 o(h)이다.

   

   - h가 충분히 작을 때, 사건의 발생횟수가 2 이상이 될 확률은 0이다.

   - h가 충분히 작을 때, 사건의 발생횟수가 2 이상이 될 확률이 0이라면, 발생횟수는 0번이나 1번이 되는데, 1번이 될 

     확률은 λh 이므로, 사건이 발생하지 않을 확률은 1 - λh 이다.


 

 위의 성질 중 (3), (4)를 종합해보면, 임의의 시간 t에서 사건이 발생할 확률은 0번, 1번 2번... 모든 발생할 확률이 1이므로 다음과 같이 표시할 수 있고,

 

 

t 가 충분히 작은 구간 h에서는 다음과 같은 성질을 지닌다.

 

 

그리고 위의 성질 (2)를 통해 시간구간 (0, t], (t, t+h] 에서 발생할 확률을 다음과 같이 표기할 수 있다. 

"("는 초과, "]"는 이하를 나타낸다.

 

 

(0, t] 구간과 (t, t+h] 구간의 사건은 독립이므로 두 사건이 일어날 확률은 각각의 확률의 곱으로 나타낼 수 있다. (윗식)

그리고 이 식을 변형하면 밑의 식이 구해진다.

 

 밑에식에서 h는 충분히 짧은 시간이므로, 좌측의 식은 사건이 일어나지 않을 확률의 시간 t에 대한 미분식이 되며 다음과 같이 시간 t에서 사건이 일어나지 않을 확률이 구해진다.

 

 

위의 성질 (1)에서 시간이 0일 때, 사건은 발생하지 않았으므로, t에 0을 대입하여 확률이 1이 된다. 고로, C는 1이 되며 사건이 발생하지 않을 확률이 완성된다!

 

 

다음에는 사건이 여러번 발생할 확률을 구해보자. 

시간 t+h시점에서 사건이 k번 발생할 경우, 확률은 시간 t까지 k번 발생하고, 이후 시간 h의 구간에서 0번 발생할 경우, 시간 t까지 k-1번 발생하고, 이후 사건 h의 구간에서 1번 발생할 경우......... 들의 합으로 표현할 수 있다.

 

그리고 h가 충분히 작은 시간구간일 경우, 밑의 식으로 나타낼 수 있다. 이를 변형하면

 

 

처럼 변형할 수 있다.

 

다음, 양변에 자연수 e의 λt 승을 곱하면 다음과 같은 기법을 사용할 수 있다.

 

 

수학이 굉장한 무기라는 생각이 드는 과정이다.

t에 0을 대입하고, 시간 0인 지점에서 사건이 발생할 확률은 위에서 정의한 성질(1)을 통해 0이므로, 이를 통해 C를 구하면 우리가 원하는 공식이 얻어진다.

 

 

 k에 따라 확률이 어떻게 변하는지 보자.

 먼저 k = 1일 때는 

 

 

 다음 k = 2일 때는 

 

 

 뭔가보이는가? 그렇다. k =3에 위의 식이 다시 들어가고, t의 2승이 적분된다면 분모에 3이 곱해질 것이다.

 팩토리얼이 되는 것이다! 그리고, t는 계속해서 λ와 함께 승수를 올려 나갈 것이다. 이를 통해 포아송 과정에서 시간 t의 구간동안 사건이 k 번 발생할 확률을 식으로 도출해내는 것이 가능해졌다. 식은 다음과 같다.

 

 

 이 분포는 익숙한 분포이다. 기대값  'λt' 을 가지는 확률이 정해진 시간 t 내에 k번 발생할 확률을 나타낸 푸아송 분포이다. 즉, 우리는 위의 네 성질을 지니는 확률과정에서 사건이 발생할 확률이 푸아송 분포를 따르게 된다는 것을 증명해냈다.

 

>> 실제 데이터로부터 푸아송 과정을 살펴보는 방법

 

[확률과정] 푸아송 과정 실전편 - 발생 시간 간격의 관점에서

이전 푸아송 과정을 설명하는 글에 이은 실전편. 푸아송 과정을 사건 발생 시간 간격의 관점에서 분석해보자. 시간 간격의 관점에서 분석하는 이유 이전 푸아송 과정 글에서 최종적으로 유도한

mons1220.tistory.com

 

 

 

+) 2023.08.28추가

 

인터넷을 떠돌다가, 푸아송 과정을 포함한 Queing theory (대기열에 사람이 들어오고 나가는 과정)에 대해 쉬우면서도 디테일한 설명이 담긴 끝내주는 영상을 발견했다. 영어 자막이 제공되는데, 한글 자동번역이 꽤 읽을만 하다.

 

 

 

 

반응형

댓글