MAXIMUM LIKELIHOOD ESTIMATOR

Agustus 12th, 2021

Di berbagai post saya sebelumnya telah diuraikan bagaimana cara melakukan penaksiran terhadap parameter populasi, seperti rata-rata populasi, variansi populasi, proporsi, dan sebagainya. Dalam post ini akan dibahas bagaimana cara melakukan penaksiran parameter suatu distribusi peluang atau fungsi densitas peluang dengan menggunakan metode maximum likelihood. Sebagai ilustrasi, misalnya kita mengetahui bahwa banyaknya kedatangan kendaraan di suatu gerbang tol berdistribusi Poisson. Jika X menyatakan banyaknya kendaraan yang datang di gerbang tol tersebut dalam selang waktu 10 menit maka besarnya peluang dalam 10 menit tiba x buah kendaraan adalah p(x) = \frac{e^{- \lambda} \cdot \lambda^x}{x!}. Namun masalahnya sekarang adalah λ tidak diketahui nilainya. Bagaimana cara menaksir λ? Ada beberapa cara untuk menentukan penaksir (estimator) tersebut, salah satunya adalah dengan metode maximum likelihood yang merupakan topik utama post saya kali ini.

 

Untuk menerapkan metode maximum likelihood, diperlukan sampel-sampel acak x1, x2, …, xn. Sampel-sampel tersebut diasumsikan merupakan realisasi dari suatu distribusi peluang atau fungsi densitas peluang tertentu dengan parameter θ. Secara garis besar, penaksir maximum likelihood bagi θ merupakan suatu fungsi dalam variabel-variabel acak X1, X2, …, Xn yang mengakibatkan besarnya peluang kemunculan x1, x2, …, xn yang sebesar mungkin. Untuk memahami ini dengan lebih tepat, perhatikan uraian berikut ini.

 

Definisi 1 [Fungsi Likelihood]
Misalkan X1, X2, …, Xn adalah n buah variabel acak dengan fungsi distribusi F(x1,x2,…,xn|θ) di mana θ ∈ Θ merupakan parameter distribusi yang nilainya tidak diketahui. Di sini Θ adalah himpunan semua nilai taksiran yang mungkin bagi θ. Fungsi likelihood didefinisikan sebagai berikut.

dengan ketentuan bahwa f atau p dievaluasi pada titik acak hasil observasi (realisasi) X1, X2, …, Xn.

 

Definisi 2 [Penaksir Maximum Likelihood]

\hat{\theta} \in \Theta merupakan penaksir maximum likelihood (maximum likelihood estimator) bagi θ apabila L(\hat{\theta}) = sup \{L(t) | t \in \Theta \}. [Catatan: \hat{\theta} semacam ini mungkin tidak ada, mungkin hanya satu buah, mungkin juga lebih dari satu buah.]

 

Jika X1, X2, …, Xn saling bebas satu sama lain dan Xi memiliki densitas atau fungsi peluang fi(x|θ) dengan i = 1, 2, …, n, maka L(θ) = f1(X1|θ). f2(X2|θ). … . fn(Xn|θ). Jika ternyata f1 = f2 = … = fn = maka L(θ) = f(X1|θ). f(X2|θ). … . f(Xn|θ).

 

Untuk menentukan penaksir maximum likelihood, dalil-dalil dalam kalkulus dapat membantu. Dengan menggunakan persamaan \frac{dL(\theta)}{d \theta} = 0 dan menerapkan uji turunan kedua terhadap penyelesaian persamaan tersebut, akan dihasilkan penaksir maximum likelihood yang diminta.

 

Sebagai contoh, misalkan dalam n buah pengamatan terhadap banyaknya kendaraan yang memasuki suatu gerbang tol dalam setiap 10 menit diperoleh hasil sampling x1, x2, …, xn. Diketahui pula kedatangan tersebut berdistribusi Poisson. Bagaimana menentukan penaksir maximum likelihood bagi λ sebagai parameter tunggal distribusi tersebut?

 

Pada contoh ini, yang kita hadapi adalah n buah variabel acak dengan fungsi distribusi F(x1,x2,…,xn|λ) yang memiliki fungsi peluang p(X1,X2,…,Xn|λ). Karena X1, X2, …, Xn saling bebas satu sama lain dan Xi memiliki fungsi peluang p_i(x|\lambda) = \frac{e^{- \lambda} \cdot \lambda^x}{x!} untuk i = 1, 2, …, n, fungsi likelihood pada kasus ini adalah:

Karena fungsi logaritma natural merupakan fungsi monoton naik, memaksimumkan L dapat dilakukan dengan memaksimumkan ln L. Pengambilan logaritma natural terhadap L menghasilkan:

Untuk menentukan nilai λ yang akan menghasilkan ln L yang sebesar-besarnya, susun persamaan \frac{d \ln L(\lambda)}{d \lambda}=0. Ini menghasilkan:

Untuk memasikan bahwa \lambda = \frac{\sum_{i=1}^n X_i}{n} akan menghasilkan nilai maksimum ln L, langkah selanjutnya adalah melakukan uji turunan kedua terhadap ln L.

Dari (1) dan (2) diperoleh:

Tanda aljabar \frac{d^2 \ln L(\lambda)}{d \lambda^2} ditentukan oleh tanda aljabar \sum_{i=1}^n X_i. Jika \sum_{i=1}^n X_i > 0 maka \frac{d^2 \ln L(\lambda)}{d \lambda^2} < 0. Karena Xi diketahui berdistribusi Poisson untuk i = 1, 2, …, n, berlakulah Xi ≥ 0 untuk setiap i ∈ {1, 2, …, n}. Kemudian, dari asumsi bahwa Xi berdistribusi Poisson, tidak mungkin nilai Xi ≡ 0 (konstan). Dengan demikian, secara umum kita berlaku \sum_{i=1}^n X_i > 0 dan \frac{d^2 \ln L(\lambda)}{d \lambda^2} < 0. Jadi, \lambda = \frac{\sum_{i=1}^n X_i}{n} merupakan nilai yang akan memaksimumkan ln L. Sebagai kesimpulan, \hat{\lambda}= \frac{\sum_{i=1}^n X_i}{n} merupakan penaksir maximum likelihood bagi λ.

 

Perhatikan bahwa \hat{\theta} pada Definisi 2 merupakan suatu fungsi dari variabel-variabel acak X1, X2, …, Xn. (Bandingkan dengan \hat{\lambda} pada contoh di atas.) Dengan kata lain, \hat{\theta} = \hat{\theta}(X_1,X_2, \cdots ,X_n). Jika hasil sampling menunjukkan X1 = x1, X2 = x2, …, Xn = xn maka \hat{\theta}(x_1,x_2, \cdots ,x_n) dinamakan taksiran (titik) maximum likelihood bagi θ.

 

Sebagai contoh, misalkan pada contoh di atas diperoleh hasil sampling X1 = 2, X2 = 0, X3 = 5, X4 = 2, dan X5 = 1. Karena penaksir maximum likelihood bagi λ adalah \hat{\lambda}= \frac{\sum_{i=1}^n X_i}{n}, taksiran titik maximum likelihood bagi λ adalah \hat{\lambda}= \frac{2+0+5+2+1}{5}=2.

 

Tagging: ,

Most visitors also read :



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *