mle map 예제

각 메서드로 전환하기 전에 MLE 및 MAP이 통계 모델의 매개 변수를 추정하는 방법이기 때문에 이 예제의 모델과 매개 변수를 명확히 설명하겠습니다. 여기서 α와 β를 하이퍼매개변수라고 하며, 데이터는 결정할 수 없습니다. 오히려 우리는 우리의 이전 지식을 잘 표현하기 위해 주관적으로 설정합니다. 예를 들어, 아래 그래프는 α와 β의 다른 값을 가진 감마 분포의 일부 시각화입니다. 왼쪽 상단 그래프는 위의 예에서 사용한 그래프(θ=0.5가 이전 지식에 따라 가장 가능성이 높은 값임을 표현함)이며, 오른쪽 상단 그래프도 동일한 사전 지식을 표현하고 있지만, 이것은 지난 시즌의 resul을 믿는 신자를 위한 것입니다. ts는 리버풀의 진정한 능력을 잘 반영하고 있습니다. MAP 추정기는 베이지안 추정기입니다. 이 사람들은 $p_0 $을 간단한 매개 변수로 고려하지 않고, 오히려 $p_0 $의 가치에 대한 우리의 사전 믿음인 이전 분포라는 자체 분포를 가진 또 다른 임의의 변수로 간주합니다. 이 예에서, 나는 아마 내 인생에서 본 동전의 대부분이 균형 (또는 그래서 내가 생각)으로, $p_0 = 0.5 $를 믿는 경향이있을 것입니다. 따라서 p에 대한 이전 이 $p sim Normal (0.5,1)$이라고 가정 해 봅시다. 우리의 후방 확률은 다음과 같습니다 : 구체적으로, 우리의 예에서, 우리는 $x $의 확률 질량 함수를 적어 줄 수 있습니다 : 나는 MLE에 대한이 예제 “http://www.math.utah.edu/~levin/M5080/mle.pdf”을 발견했다.

동전 던지기 예제로 돌아갑니다. 우리의 데이터가 다음과 같이 보이는 경우 : 나는 MLE, MAP 및 순진한 Bayes 분류기를 이해하려고 노력하고 있지만 몇 가지 숫자 예없이 차이점을 이해하기가 어렵습니다. 누군가가 이들 각각에 대한 간단한 직관적 인 수치 예를 줄 수 있으며 결과가 서로 어떻게 다른지? 따라서 많은 다른 분포에 대해 많은 지점에서 밀도가 1보다 큰 것은 완전히 정상입니다. 아래 베타 분포의 PDF를 예로 들어 보겠습니다: 최대 가능성은 지정된 데이터 집합의 경우 관찰된 데이터 집합의 확률을 최대화하는 값은 무엇입니까? 사소한, 우리가 관찰 하는 경우 우리의 구부러진된 동전 예제에서 30 H 결과 및 70 T 결과, 우리의 관찰 된 데이터 집합을 볼 확률을 극대화 하는 값은 = .3, 즉 우리의 구부러진 된 동전 머리를 오고의 30% 기회가 있다. 하지만 어떻게 그곳에 도착할 수 있을까요? MAP는 나이브 베이즈 분류기의 기초역할을 합니다. 이제 임의 변수의 결과를 결정하는 매개 변수가 하나뿐아니라 다수라고 가정해 보겠습니다. 동전의 굴곡에 따라 결과 대신 동전 플립 예제를 확장하여 이제 동전 굽힘, 바람, 바닥의 표면 각도, 바닥 재료의 탄성, 동전 던지기 높이, 중력의 함수로 H와 T의 결과를 모델링합니다. …

이름을 지정합니다. 이제, N 예측 기능의 벡터를 감안할 때 우리의 동전 착륙 H의 확률은 무엇입니까? 마지막 예로, 새로운 데이터를 제공 하면 후방 업데이트 하는 방법의 반복 된 프로세스를 살펴보겠습니다. 진정한 $theta$를 0.7로 가정해 봅시다. $alpha=beta=2$로 이전에 평평하지 않은 베타를 사용해 보겠습니다. MLE는 이전 예제에서 꽤 잘 작동합니다. 그러나 이것은 인간이 무언가를 추론하는 방법만큼 직관적이지 않습니다. 일반적으로 사물에 대한 우리의 믿음은 시간이 지남에 따라 달라질 수 있습니다. 특히, 우리는 초기 추측을 그릴 몇 가지 사전 지식으로 시작합니다. 더 많은 증거로, 우리는 우리의 믿음을 수정하고 관심의 일부 이벤트의 사후 확률을 얻을 수 있습니다. 이것은 정확히 베이지안 통계입니다. MLE는 데이터가 충분할 때 강력합니다.

그러나 관찰된 데이터 크기가 작으면 잘 작동하지 않습니다. 예를 들어, 리버풀이 2경기만 이기고 2경기에서 승리한 경우 MLE의 θ 예상 값은 2/2 = 1입니다.