UJI KOLMOGOROV-SMIRNOV

Juli 2nd, 2016

Sebagian peneliti sering salah menafsirkan kegunaan Uji Kolmogorov-Smirnov dengan mengidentikkannya dengan uji normalitas. Padahal, secara umum uji Kolmogorov-Smirnov digunakan untuk memeriksa apakah data hasil sampling tertentu berasal dari suatu populasi dengan distribusi peluang teoretis tertentu. Distribusi peluang teoretis yang dimaksud di sini adalah sembarang distribusi peluang teoretis yang kontinu, seperti distribusi normal, distribusi eksponensial, distribusi Weibull, distribusi gamma, dan sebagainya. Jadi, tidak benar apabila dikatakan bahwa uji ini hanya untuk menguji apakah suatu populasi berdistribusi normal atau tidak. Juga tidak benar apabila dikatakan bahwa satu-satunya cara menguji normalitas dengan uji Kolmogorov-Smirnov. Ada cara lain melakukan uji normalitas, di antaranya dengan Chi-Square Test, Anderson-Darling Test.

Hipotesis nol dan hipotesis tandingan dalam uji ini adalah sebagai berikut.

H₀: F(x) = F₀(x)

H₁: F(x) ≠ F₀(x)

Dengan kata-kata, dapat ditulis misalnya

H₀: Tinggi badan berdistribusi normal

H₁: Tinggi badan tidak berdistribusi normal

atau misalnya

H₀: Selang waktu antarkedatangan pelanggan berdistribusi eksponensial

H₁: Selang waktu antarkedatangan pelanggan tidak berdistribusi eksponensial

Uji ini mengasumsikan distribusi yang mendasari variabel yang diuji bersifat kontinu sebagaimana ditentukan/dinyatakan oleh distribusi frekuensi kumulatifnya. Jadi, uji ini cocok untuk menguji kebaikan-suai (goodness-of-fit) bagi variabel-variabel yang diukur dengan tingkat ordinal atau tingkat yang lebih tinggi.

Statistik uji yang digunakan adalah penyimpangan maksimum, D, yang didefinisikan sebagai berikut.

dengan:

F₀(x) = frekuensi relatif kumulatif yang dihitung menggunakan distribusi teoretis sebagaimana dnyatakan dalam hipotesis nol.

F_n(x) = frekuensi relatif kumulatif yang dihitung menggunakan distribusi empiris (yang sedang diuji)

Untuk menghitung D, perlu didefinisikan terlebih dahulu:

; dengan F_k adalah banyaknya pengamatan yang nilainya tidak melebihi y_k.

Apabila y₁, y₂, y₃, …, y_n adalah data hasil sampling yang telah diurutkan sedemikian hingga y₁ ≤ y₂ ≤ y₃ ≤ … ≤ y_n, nilai D secara teknis dapat ditentukan dengan rumus:

Penggunaan tabel sebagaimana dicontohkan di bawah, akan mempermudah perhitungan D di atas.

Untuk menguji signifikansi uji ini, digunakanlah Tabel Nilai Kritis D dalam Uji Satu-Sampel Kolmogorov-Smirnov, yaitu untuk menentukan daerah penolakan H₀ dengan taraf nyata tertentu. Jika nilai D hasil perhitungan terletak di daerah kritis, kita tolak H₀ dan kita simpulkan populasi yang kita amati tersebut tidak berdistribusi sebagaimana yang dinyatakan dalam H₀.

Contoh:

Hasil sampling tinggi badan 10 orang siswa di suatu sekolah (dalam satuan cm) adalah sebagai berikut: 165, 163, 167, 166, 159, 167, 167, 169, 172, 165. Apakah cukup bukti untuk menyatakan bahwa sampel tersebut tidak berasal dari populasi yang tingginya berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm? Gunakan taraf nyata 0,05.

Jawab:

H₀: Tinggi badan siswa di sekolah itu berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm

H₁: Tinggi badan siswa di sekolah itu tidak berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm

Untuk memudahkan, kita urutkan ke-10 data tersebut dari yang terkecil sampai terbesar, sehingga y₁ = 159, y₂ = 163, y₃ = y₄ = 165, y₅ = 166, y₆ = y₇ = y₈ = 167, y₉ = 169, dan y₁₀ = 172.

Frekuensi relatif kumulatif untuk masing-masing y_k (i = 1, 2, 3, …, 10) adalah sebagai berikut.

Hitung_F0

F_i untuk masing-masing y_k dihitung sebagai berikut:

F₁ = 1 karena terdapat 1 buah data yang nilainya ≤ y₁ = 159

F₂ = 2 karena terdapat 2 buah data yang nilainya ≤ y₂ = 163, yaitu y₁ dan y₂

F₃ = 4 karena terdapat 4 buah data yang nilainya ≤ y₃ = 165, yaitu y₁, y₂, y₃, dan y₄

F₄ = 4 karena terdapat 4 buah data yang nilainya ≤ y₄ = 165, yaitu y₁, y₂, y₃, dan y₄

F₅ = 5 karena terdapat 5 buah data yang nilainya ≤ y₅ = 166, yaitu y₁, y₂, y₃, y₄, dan y₅

F₆ = F₇ = F₈ = 8 karena terdapat 8 data yang nilainya ≤ y₆ = y₇ = y₈ = 167 yaitu y₁ hingga y₈

F₉ = 9 karena terdapat 9 data yang nilainya ≤ y₉ = 169, yaitu y₁ hingga y₉

F₁₀ = 10 karena terdapat 10 data yang nilainya ≤ y₁₀ = 172, yaitu y₁ hingga y₁₀

Menggunakan rumus (+), diperolehlah:

F₁₀(y₁) = F₁₀(159) = 1/10 = 0,1

F₁₀(y₂) = F₁₀(163) = 2/10 = 0,2

F₁₀(y₃) = F₁₀(y₄) = F₁₀(165) = 4/10 = 0,4

F₁₀(y₅) = F₁₀(166) = 5/10 = 0,5

F₁₀(y₆) = F₁₀(y₇) = F₁₀(y₈) = F₁₀(167) = 8/10 = 0,8

F₁₀(y₉) = F₁₀(169) = 9/10 = 0,9

F₁₀(y₁₀) = F₁₀(172) = 10/10 = 1,0

Hasil-hasil tersebut dapat diringkaskan pada tabel berikut.

Tabel 1

Catatan:
Kolom z di atas ditampilkan untuk keperluang menghitung F₀(y_k), yaitu frekuensi relatif kumulatif hingga y = y_k dengan menggunakan distribusi peluang sebagaimana dinyatakan dalam H₀. Sebagai contoh, karena dalam kasus ini distribusi normal merupakan distribusi peluang teoretis pada H_0,maka:Catatan:

Hitung_F0y1

Dengan cara serupa akan diperoleh F₀(y₂), dan seterusnya, hingga F₀(y₁₀). [Lihat Tabel 1 di atas.]

Apabila semua bilangan di kedua kolom terkanan tabel di atas diambil harga mutlaknya, diperoleh tabel berikut.

Tabel 2

Bilangan terbesar di antara kedua kolom pada tabel terakhir adalah nilai statistik D dari Uji Kolmogorov-Smirnov. Jadi, D = 0,1864

Dari Tabel Nilai Kritis D dalam Uji Satu-Sampel Kolmogorov-Smirnov dengan n = 10 dan α = 0,05, diperoleh nilai kritis D_0,05;10 = 0,409 dan karena D < D_0,05;10 kita tak dapat menolak H₀. Hasil sampling yang ada tidak cukup untuk menyangkal pernyataan bahwa populasi tinggi badan siswa di sekolah itu berdistribusi normal dengan rata-rata 166 cm dan simpangan baku 3,464 cm.

Sebagai perbandingan, saya tampilkan hasil pengujian di atas dengan menggunakan SPSS:

SPSS_D

Catatan: [mengenai hasil SPSS di atas]

Bilangan -0,186 pada tabel tersebut merupakan bilangan negatif terkecil di kolom F_n(y_k-1) – F₀(y_k) pada Tabel 1 di atas.
Nilai Positive 0,186 pada tabel tersebut merupakan bilangan positif terbesar di kolom F_n(y_k) – F₀(y_k) pada Tabel 1 di atas.
Nilai Absolute 0,186 adalah nilai D sebagaimana dimaksud pada rumus:

yaitu bilangan terbesar di antara kedua kolom pada Tabel 2.

4. Nilai Kolmogorov-Smirnov Z sebesar 0,589 diperoleh dari:

Pengayaan

Berikut ini adalah perintah-perintah dalam perangkat lunak statistika R, untuk melakukan uji Kolmogorov-Smirnov pada contoh di atas.

> tinggi<-c(159,163,165,165,166,167,167,167,169,172)
> ks.test(tinggi,”pnorm”,mean(tinggi),sd(tinggi))

Hasil yang diperoleh adalah sebagai berikut:

Berikut ini adalah tautan-tautan yang terkait dengan Uji Kolmogorov-Smirnov.

Tabel Nilai Kritis D Kolmogorov-Smirnov
File Excel untuk menghitung statistik D Kolmogorov-Smirnov yang digunakan untuk perhitungan pada contoh dalam tulisan ini
Contoh-contoh kasus lain mengenai goodness-of-fit dengan Uji Kolmogorov-Smirnov: (belum tersedia)
Bagaimana apabila parameter-parameter distribusi peluang yang dihipotesiskan tidak diketahui? Uji Lilliefors adalah solusinya. (belum tersedia)

Tagging: Kolmogorov-Smirnov, uji normalitas

Most visitors also read :

5 tanggapan untuk “UJI KOLMOGOROV-SMIRNOV”

asri berkata:

April 25, 2018 pukul 11:47

Assalamualaikum
maaf ka mau nanya nih, kan untuk menguji normalitas itu ada yang pakai shapiro dan kolmogorov.. trus bedanya iyu apa antara keduanya??

Balas
Gianina berkata:

Agustus 10, 2020 pukul 12:53

Pak saya mau bertanya, kalau untuk uji distribusi Poisson dan distribusi eksponensial menggunakan KS-Test stepnya seperti apa ya? terima kasih banyak

Balas
- Eduard Sondakh berkata:
  
  Agustus 19, 2020 pukul 09:56
  
  Pengujian Distribusi Poisson tidak bisa dengan KS test karena KS test hanya untuk pengujian distribusi kontinu, sedangkan Distr Poisson diskrit. Untuk pengujian distr. eksponensial caranya sama, yang beda hanya fungsi densitas peluang yang digunakan. Demikian.
  
  Balas
  - Gianina berkata:
    
    Agustus 19, 2020 pukul 10:35
    
    terima kasih atas jawabannya pak. tapi di SPSS disediakan KS_Test untuk Uniform dan Poisson itu bagaimana ya pak?
    
    Balas
    - Eduard Sondakh berkata:
      
      September 20, 2020 pukul 19:28
      
      Dengan menggunakan SPSS kita dapat juga menguji apakah suatu sampel berasal dari populasi yang berdistribusi uniform atau tidak. Untuk menguji hal tersebut, dapat digunakan uji Kolmogorov-Smirnov.
      
      Balas

edscyclopedia.com

Untuk anak bangsa yang lebih cerdas

UJI KOLMOGOROV-SMIRNOV

Pengayaan

Most visitors also read :

5 tanggapan untuk “UJI KOLMOGOROV-SMIRNOV”

Tinggalkan Balasan Batalkan balasan

Arsip

Kategori

Follow Us!

edscyclopedia.com

Untuk anak bangsa yang lebih cerdas

UJI KOLMOGOROV-SMIRNOV

Pengayaan

Bagikan ini:

Most visitors also read :

DEKOMPOSISI NILAI SINGULAR (SINGULAR VALUE DECOMPOSITION)

MAXIMUM LIKELIHOOD ESTIMATOR

JARAK STATISTIKAL

SOAL DAN PEMBAHASAN ANALISIS KOMPONEN UTAMA

5 tanggapan untuk “UJI KOLMOGOROV-SMIRNOV”

Tinggalkan Balasan Batalkan balasan

Arsip

Kategori

Follow Us!