UJI KOLMOGOROV-SMIRNOV

Juli 2nd, 2016

Sebagian peneliti sering salah menafsirkan kegunaan Uji Kolmogorov-Smirnov dengan mengidentikkannya dengan uji normalitas. Padahal, secara umum uji Kolmogorov-Smirnov digunakan untuk memeriksa apakah data hasil sampling tertentu berasal dari suatu populasi dengan distribusi peluang teoretis tertentu. Distribusi peluang teoretis yang dimaksud di sini adalah sembarang distribusi peluang teoretis yang kontinu, seperti distribusi normal, distribusi eksponensial, distribusi Weibull, distribusi gamma, dan sebagainya. Jadi, tidak benar apabila dikatakan bahwa uji ini hanya untuk menguji apakah suatu populasi berdistribusi normal atau tidak. Juga tidak benar apabila dikatakan bahwa satu-satunya cara menguji normalitas dengan uji Kolmogorov-Smirnov. Ada cara lain melakukan uji normalitas, di antaranya dengan Chi-Square Test, Anderson-Darling Test.

 

Hipotesis nol dan hipotesis tandingan dalam uji ini adalah sebagai berikut.

H0: F(x) = F0(x)

H1: F(x) ≠ F0(x)

Dengan kata-kata, dapat ditulis misalnya

H0: Tinggi badan berdistribusi normal

H: Tinggi badan tidak berdistribusi normal

atau misalnya

H0: Selang waktu antarkedatangan pelanggan berdistribusi eksponensial

H1: Selang waktu antarkedatangan pelanggan tidak berdistribusi eksponensial

 

Uji ini mengasumsikan distribusi yang mendasari variabel yang diuji bersifat kontinu sebagaimana ditentukan/dinyatakan oleh distribusi frekuensi kumulatifnya. Jadi, uji ini cocok untuk menguji kebaikan-suai (goodness-of-fit) bagi variabel-variabel yang diukur dengan tingkat ordinal atau tingkat yang lebih tinggi.

 

Statistik uji yang digunakan adalah penyimpangan maksimum, D, yang didefinisikan sebagai berikut.

Stat_D1

dengan:

F0(x) = frekuensi relatif kumulatif yang dihitung menggunakan distribusi teoretis sebagaimana dnyatakan dalam hipotesis nol.

Fn(x) = frekuensi relatif kumulatif yang dihitung menggunakan distribusi empiris (yang sedang diuji)

 

Untuk menghitung D, perlu didefinisikan F_{n}(y_{k})={F_{k}}/{n}

; dengan Fk adalah banyaknya pengamatan yang nilainya tidak melebihi yk.

Apabila y1, y2, y3, …, yn adalah data hasil sampling yang telah diurutkan sedemikian hingga y1y2y3 ≤ … ≤ yn, nilai D secara teknis dapat ditentukan dengan rumus:

Stat_D2

Penggunaan tabel sebagaimana dicontohkan di bawah, akan mempermudah perhitungan D di atas.

 

Untuk menguji signifikansi uji ini, digunakanlah Tabel Nilai Kritis D dalam Uji Satu-Sampel Kolmogorov-Smirnov, yaitu untuk menentukan daerah penolakan H0 dengan taraf nyata tertentu. Jika nilai D hasil perhitungan terletak di daerah kritis, kita tolak H0 dan kita simpulkan populasi yang kita amati tersebut tidak berdistribusi sebagaimana yang dinyatakan dalam H0.

 

Contoh:

Hasil sampling tinggi badan 10 orang siswa di suatu sekolah (dalam satuan cm) adalah sebagai berikut: 165, 163, 167, 166, 159, 167, 167, 169, 172, 165. Apakah cukup bukti untuk menyatakan bahwa sampel tersebut tidak berasal dari populasi yang tingginya berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm? Gunakan taraf nyata 0,05.

 

Jawab:

H0: Tinggi badan siswa di sekolah itu berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm

H1: Tinggi badan siswa di sekolah itu tidak berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm

 

Untuk memudahkan, kita urutkan ke-10 data tersebut dari yang terkecil sampai terbesar, sehingga y1 = 159, y2 = 163, y3 = y4 = 165, y5 = 166, y6 = y7 = y8 = 167, y9 = 169, dan y10 = 172.

Frekuensi relatif kumulatif untuk masing-masing yk (i = 1, 2, 3, …, 10) adalah sebagai berikut.

Hitung_F0

Fi untuk masing-masing yk dihitung sebagai berikut:

F1 = 1 karena terdapat 1 buah data yang nilainya ≤ y1 = 159

F2 = 2 karena terdapat 2 buah data yang nilainya ≤ y2 = 163, yaitu y1 dan y2

F3 = 4 karena terdapat 4 buah data yang nilainya ≤ y3 = 165, yaitu y1, y2, y3, dan y4

F4 = 4 karena terdapat 4 buah data yang nilainya ≤ y4 = 165, yaitu y1, y2, y3, dan y4

F5 = 5 karena terdapat 5 buah data yang nilainya ≤ y5 = 166, yaitu y1, y2, y3, y4, dan y5

F6 = F7 = F8 = 8 karena terdapat 8 data yang nilainya ≤ y6 = y7 = y8 = 167 yaitu y1 hingga y8

F9 = 9 karena terdapat 9 data yang nilainya ≤ y9 = 169, yaitu y1 hingga y9

F10 = 10 karena terdapat 10 data yang nilainya ≤ y10 = 172, yaitu y1 hingga y10

Karena F_{n}(y_{k})={F_{k}}/{n}, diperolehlah:

F10(y1) = F10(159) = 1/10 = 0,1

F10(y2) = F10(163) = 2/10 = 0,2

F10(y3) = F10(y4) = F10(165) = 4/10 = 0,4

F10(y5) = F10(166) = 5/10 = 0,5

F10(y6) = F10(y7) = F10(y8) = F10(167) = 8/10 = 0,8

F10(y9) = F10(169) = 9/10 = 0,9

F10(y10) = F10(172) = 10/10 = 1,0

 

Hasil-hasil tersebut dapat diringkaskan pada tabel berikut.

Tabel 1

k Tinggi

(cm)

z Fn(yk-1) F0(yk) Fn(yk) Fn(yk-1) – F0(yk) Fn(yk) – F0(yk)
1 159 -2,02 0,0 0,0217 0,1 -0,0217 0,0783
2 163 -0,87 0,1 0,1932 0,2 -0,0932 0,0068
3 165 -0,29 0,2 0,3864 0,4 -0,1864 0,0136
4 165 -0,29 0,4 0,3864 0,4 0,0136 0,0136
5 166 0,00 0,4 0,5000 0,5 -0,1000 0,0000
6 167 0,29 0,5 0,6136 0,8 -0,1136 0,1864
7 167 0,29 0,8 0,6136 0,8 0,1864 0,1864
8 167 0,29 0,8 0,6136 0,8 0,1864 0,1864
9 169 0,87 0,8 0,8068 0,9 -0,0068 0,0932
10 172 1,73 0,9 0,9584 1,0 -0,0584 0,0416

Catatan:

Kolom z di atas ditampilkan untuk keperluang menghitung F0(yk), yaitu frekuensi relatif kumulatif hingga y = yk dengan menggunakan distribusi peluang sebagaimana dinyatakan dalam H0. Sebagai contoh, karena dalam kasus ini distribusi normal merupakan distribusi peluang teoretis pada H0, maka:

Hitung_F0y1

Dengan cara serupa akan diperoleh F0(y2), dan seterusnya, hingga F0(y10). [Lihat Tabel 1 di atas.]

 

Apabila semua bilangan di kedua kolom terkanan tabel di atas diambil harga mutlaknya, diperoleh tabel berikut.

Tabel 2

k Fn(yk-1) – F0(yk) Fn(yk) – F0(yk)
1 0,0217 0,0783
2 0,0932 0,0068
3 0,1864 0,0136
4 0,0136 0,0136
5 0,1000 0,0000
6 0,1136 0,1864
7 0,1864 0,1864
8 0,1864 0,1864
9 0,0068 0,0932
10 0,0584 0,0416

Bilangan terbesar di antara kedua kolom pada tabel terakhir adalah nilai statistik D dari Uji Kolmogorov-Smirnov. Jadi, D = 0,1864

 

Dari Tabel Nilai Kritis D dalam Uji Satu-Sampel Kolmogorov-Smirnov dengan n = 10 dan α = 0,05, diperoleh nilai kritis D0,05;10 = 0,409 dan karena D < D0,05;10 kita tak dapat menolak H0. Hasil sampling yang ada tidak cukup untuk menyangkal pernyataan bahwa populasi tinggi badan siswa di sekolah itu berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm.

Sebagai perbandingan, saya tampilkan hasil pengujian di atas dengan menggunakan SPSS:

SPSS_D

Catatan: [mengenai hasil SPSS di atas]

  1. Bilangan -0,186 pada tabel tersebut merupakan bilangan negatif terkecil di kolom Fn(yk-1) – F0(yk) pada Tabel 1 di atas.
  2. Nilai Positive 0,186 pada tabel tersebut merupakan bilangan positif terbesar di kolom Fn(yk) – F0(yk) pada Tabel 1 di atas.
  3. Nilai Absolute 0,186 adalah nilai D sebagaimana dimaksud pada rumus D=max delim{[}{max_{k}delim{|}{F_{n}(y_{k-1})-F_{0}(y_{k})}{|} ,max_{k}delim{|}{F_{n}(y_{k})-F_{0}(y_{k})}{|} }{]}, yaitu bilangan terbesar di antara kedua kolom pada Tabel 2.
  4. Nilai Kolmogorov-Smirnov Z sebesar 0,589 diperoleh dari D sqrt{n}=0,1864 sqrt{10} approx 0,5894

 

Berikut ini adalah tautan-tautan yang terkait dengan Uji Kolmogorov-Smirnov.

  1. Tabel Nilai Kritis D Kolmogorov-Smirnov
  2. File Excel untuk menghitung statistik D Kolmogorov-Smirnov yang digunakan untuk perhitungan pada contoh dalam tulisan ini
  3. Contoh-contoh kasus lain mengenai goodness-of-fit dengan Uji Kolmogorov-Smirnov: (belum tersedia)
  4. Bagaimana apabila parameter-parameter distribusi peluang yang dihipotesiskan tidak diketahui? Uji Lilliefors adalah solusinya. (belum tersedia)
Tagging: ,

Most visitors also read :



Satu tanggapan untuk “UJI KOLMOGOROV-SMIRNOV”

  1. asri berkata:

    Assalamualaikum
    maaf ka mau nanya nih, kan untuk menguji normalitas itu ada yang pakai shapiro dan kolmogorov.. trus bedanya iyu apa antara keduanya??

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *