티스토리 뷰

박사과정이야기

베이즈정리(Bayes' theorem)

지식in 이박사 2017. 9. 29. 09:00

오늘 알아볼 내용은 베이즈정리(Bayes' theorem) 입니다.

베이즈 정리는 실험의 결과로써 얻은 정보를 토대로 하여 어떤 사건의 알려져 있지 않은

확률을 구하려고 하는 가장 간단한 방법을 의미합니다.

정의가 추상적이고 포괄적이라 어렵죠?

예를 들어 보겠습니다.

 

 

예를 들어 상자 5개에 두개는 흰상자 세개는 검은 상자이고

흰상자에는 빨간 펜 5개, 검은 상자에는 검은 펜 3개가 있다면

무작위로 상자를 선택하여 1개의 볼펜을 골랐을때

그 볼펜이 빨간 펜이었다면 이 사람이 검은 상자를 선택했을 가능성은

"0" 입니다.

하지만 상자 5개가 있는데 두개는 흰상자 세개는 검은상자이고

흰상자에는 빨간 펜 1개, 검정펜 4개, 검은 상자에는 빨간 펜 2개, 검정펜 1개가 들어있고

무작위로 1개의 볼펜을 뽑았을 때 이 펜이 검정펜이었다면

이 사람이 흰상자를 택했을 확률은 얼마일까요?

이 문제를 의사결정수(decision tree)로 그려서 풀어보면 다음과 같습니다.

 

 

이때 A는 흰상자를 선택하는 것울, A바는 검은상자를 택하는 것을,

검정볼펜을 선택하는 것은 B, 빨간볼펜을 선택하는 사건은 B바라고 합니다.

그러면 검정볼펜이 나올 확률은 흰상자에서 나올확률 (A ∩ B)

또는 검은 상자에서나올 확률 (A바 ∩ B) 이므로

각각 0.32 와 0.20의 합이 검정볼펜이 나올 확률이 됩니다.

 

그렇다면 검정볼펜이 나올 확률은 얼마일까요?

검정 볼펜이 흰 상자에서 나왔을 확률은 P(A|B)로 표시할 수 있고

이는 검정볼펜이 나올 전체의 확률에서 흰상자로부터 검정볼펜이 뽑혔을 확률의 비율을

의미한다고 표현할 수 있습니다.

그러므로 아래와 같이 정리될 수 있습니다.

 

이상의 논리를 일반화시켜본다면, 사건 B를 일으킬 수 있는 사건들이 n개가 있고

이를 Ai로 나타내면 사건 B가 발생할수 있는 모든 확률 P(B)는 다음과 같습니다.

 

 

따라서 B가 발생했을 때 이것이 Ak에서 나왔을 가능성은 다음과 같습니다.

 

 

이 식이 바로 베이즈 정리(Bayes' treorem)이며 우리가 알아봤던 곱셈법칙에 의해

P(Ak|B)를 풀면 아래와 같은 산식이 성립합니다.

 

오늘은 베이즈 정리에 대해 알아봤는데요.

사실 통계기초에서는 스킵하고 넘어가는 경우가 많습니다.

그만큼 까다롭기 때문이니 한번에 이해가 안된다고 해서 걱정하지 마시고

그냥 "이런게 있구나"식으로 알고 넘어가시면 될 것 같다는 생각입니다.

오늘 하루도 여러분의 것이 되기를 희망하며

다음시간에 또 뵈요~~

댓글