ONE-WAY ANOVA

Maret 30th, 2020

Uji t 2-sampel digunakan untuk memeriksa selisih di antara rata-rata dua populasi. Uji tersebut sering digunakan untuk memeriksa apakah dua populasi memiliki rata-rata yang sama. Bagaimana apabila sekarang terdapat lebih dari dua populasi dan kita ingin mengetahui apakah populasi-populasi tersebut memiliki rata-rata yang sama? Pertanyaan ini dijawab dengan menggunakan one-way ANOVA (one-way analysis of variance). One-way ANOVA merupakan perluasan dari uji t untuk perbedaan dua rata-rata populasi dengan variansi sama (pooled variance t test for the difference between two means).

Contoh-contoh kasus yang dapat dijawab oleh one-way ANOVA, misalnya:

  1. Apakah beberapa buah kantor cabang penjualan suatu produk memiliki rata-rata hasil penjualan yang sama?
  2. Apakah beberapa pabrik yang memproduksi suatu barang sama dalam hal rata-rata persentase barang cacat yang dihasilkan?
  3. Apakah beberapa metode pelatihan yang berbeda yang diterapkan kepada pegawai baru memberikan hasil yang berbeda?
  4. Apakah ada perbedaan dalam hal rata-rata lamanya anak-anak usia Taman Kanak-kanak menonton iklan makanan, mainan, dan pakaian?

 

Asumsi-asumsi ANOVA
1. Syarat kenormalan: masing-masing populasi berdistribusi normal
2. Syarat kehomogenan variansi: semua populasi bervariansi sama
3. Setiap sampel yang diambil merupakan sampel acak yang saling bebas

Jika terdapat k buah populasi yang akan diuji rata-ratanya, maka dalam one-way ANOVA pasangan hipotesisnya adalah:

H0: {\mu}_1 = {\mu}_2 = {\mu}_3 = \cdots = {\mu}_k
H1: tidak semua {\mu}_j bernilai sama (j = 1, 2, 3, …, k)

Statistik uji yang digunakan adalah: F = \frac{MSA}{MSE}
Daerah kritis uji ini adalah F > F_{\alpha}, di mana F_{\alpha} adalah nilai kritis distribusi F untuk taraf nyata \alpha, derajat kebebasan pembilang {\nu}_1=k-1 dan derajat kebebasan penyebut {\nu}_2 = n - k.
Pada statistik F di atas,
MSA = \frac{SSA}{k-1} (= mean square treatment atau rata-rata kuadrat treatment)
MSE = \frac{SSE}{n-k} (= mean square error atau rata-rata kuadrat galat)
SSA = \sum_{j=1}^{k} n_j ({\bar{X}}_j - {\bar{X}}_G)^2 (= jumlah kuadrat treatment)
SSE = \sum_{j=1}^{k} {\sum_{i=1}^{n_j} (X_{ij}-{\bar{X}}_j)^2} (= jumlah kuadrat galat)
{\bar{X}}_G=\frac{\sum_{j=1}^{k} {\sum_{i=1}^{n_j} X_{ij}}}{n} (dinamakan grand mean, rata-rata keseluruhan)
n=\sum_{j=1}^{k} n_j (total banyaknya sampel)
X_{ij} adalah sampel ke-i yang diambil dari populasi ke-j
{\bar{X}}_j adalah rata-rata sampel yang diambil dari populasi ke-j (= rata-rata treatment)
n_j adalah banyaknya sampel yang diambil dari populasi ke-j

Catatan:
Dalam ANOVA, jumlah antara SSA dan SSE adalah SST, yaitu Sum of Squares Total: SST = SSA + SSE

Dalam one-way ANOVA, dari masing-masing populasi yang akan diperbandingkan rata-ratanya, diambil sejumlah sampel. Untuk mengidentifikasikan populasi yang berbeda dalam one-way ANOVA, biasa digunakan istilah treatment. Jadi, dalam memperbandingkan k buah populasi dengan one-way ANOVA, kita dihadapkan pada k buah treatment. Misalnya, pada contoh kasus 4 di atas, terdapat tiga buah treatment, yaitu iklan mainan, iklan makanan, dan iklan pakaian. Sampel ke-i yang diambil dari treatment j dilambangkan dengan X_{ij}. Di tahap awal setelah nilai-nilai X_{ij} didapatkan perlu dihitung rata-rata sampel masing-masing treatment {\bar{X}}_j untuk j = 1, 2, 3, …, k. Selain itu, rata-rata keseluruhan {\bar{X}}_G juga dihitung dengan rumus yang telah diuraikan di atas. Setelah semua rata-rata ini dihitung, statistik F dapat dihitung.

 

Contoh
Untuk mengetahui apakah di antara Kabupaten Bandung, Bandung Barat, dan Cimahi terdapat perbedaan rata-rata penghasilan penduduknya, diambil sampel acak penduduk masing-masing daerah tersebut. Dari populasi penduduk Kab. Bandung diambil 10 sampel, dari Bandung Barat 5 sampel, dan dari Cimahi juga 5 sampel. Hasil sampling tersebut (dalam satuan juta Rupiah) diringkaskan dalam tabel berikut.

Apakah terdapat perbedaan rata-rata penghasilan penduduk di ketiga daerah tersebut? Gunakan taraf nyata 0,05. Anggaplah masing-masing populasi berdistribusi normal dan memiliki variansi yang sama.

Misalkan:
Rata-rata penghasilan penduduk Kab. Bandung adalah {\mu}_1
Rata-rata penghasilan penduduk Kab. Bandung Barat adalah {\mu}_2
Rata-rata penghasilan penduduk Kota Cimahi adalah {\mu}_3

H0: {\mu}_1 = {\mu}_2 = {\mu}_3 (Rata-rata penghasilan penduduk di ketiga daerah sama)
H1: Rata-rata penghasilan penduduk di antara ketiga daerah tersebut ada yang berbeda

Taraf nyata: \alpha = 0,05

Statistik uji yang digunakan adalah F = \frac{MSA}{MSE}

Untuk menentukan daerah kritis dalam uji ini, hitung dulu derajat kebebasan (df) pembilang dan penyebut. Dalam contoh ini ada 3 buah treatment, sehingga k = 3, dan diperoleh derajat kebebasan pembilang adalah df_1 = k - 1 = 3 - 1 = 2. Total banyaknya sampel adalah n = n_1 + n_2 + n_3 = 10 + 5 + 5 = 20, sehingga derajat kebebasan penyebut adalah df_2 = n - k = 20 - 3 = 17. Dari tabel nilai kritis F untuk \alpha = 0,05, \: {\nu}_1 = 2, \: {\nu}_2 = 17, diperoleh nilai kritis sebesar 3,59. Jadi, kriteria untuk menolak hipotesis nol adalah F > 3,59.

Langkah berikutnya adalah menghitung nilai F hasil sampling. Ini diawali dengan menghitung rata-rata sampel masing-masing treatment.
Kab. Bandung: {\bar{X}}_1=\frac{4,2+3,7+2,8+ \cdots +2,9 }{10} = \frac{40}{10} = 4,0
Kab. Bandung Barat: {\bar{X}}_2 = \frac{1,5+4,2+2,0+4,1+3,2}{5} = \frac{15}{5} = 3,0
Kota Cimahi: {\bar{X}}_2 = \frac{1,8+4,2+5,4+3,8+4,8}{5} = \frac{20}{5} = 4,0
(Lihat tabel berikut)

n = n_1 + n_2 + n_3 = 10 + 5 + 5 = 20
Grand mean hasil sampling tersebut adalah {\bar{X}}_G = \frac{40,0+15,0+20,0}{20} = 3,75
SSA = n_1 ({\bar{X}}_1 - {\bar{X}}_G)^2 + n_2 ({\bar{X}}_2 - {\bar{X}}_G)^2 + n_3 ({\bar{X}}_3 - {\bar{X}}_G)^2
SSA = 10 \cdot (4 - 3,75)^2 + 5 \cdot (3 - 3,75)^2 + 5 \cdot (4 - 3,75)^2 = 3,75
MSA = \frac{SSA}{k-1} = \frac{3,75}{3-1} = 1,875
SSE = \sum_{i=1}^{10} (X_{i1} - {\bar{X}}_1)^2 + \sum_{i=1}^{5} (X_{i2} - {\bar{X}}_2)^2 + \sum_{i=1}^{5} (X_{i3} - {\bar{X}}_3)^2
SSE = \left[ \sum_{i=1}^{10} (X_{i1} - 4,0)^2 \right] + \left[ \sum_{i=1}^{5} (X_{i2} - 3,0)^2 \right] + \left[ \sum_{i=1}^{5} (X_{i3} - 4,0)^2 \right]
SSE = [(4,2 - 4)^2 + \cdots + (2,9 - 4)^2] + [(1,5 - 3)^2 +  \cdots + (3,2 - 3)^2] + [(1,8 - 4)^2 +  \cdots + (4,8 - 4)^2]
SSE = 9,46 + 5,94 + 7,52 = 22,92
MSE = \frac{SSE}{n-k} = \frac{22,92}{20-3} \approx 1,35
F = \frac{MSA}{MSE} = \frac{1,875}{1,35} \approx 1,39

Karena hasil sampling menunjukkan F = 1,39 (sedangkan daerah kritisnya adalah F > 3,59) kita tidak dapat menolak hipotesis nol. Tidak cukup bukti untuk menyatakan adanya perbedaan signifikan di antara rata-rata pendapatan penduduk ketiga daerah tersebut.

 

Catatan:
Hasil perhitungan ANOVA biasanya ditampilkan dalam Tabel Ringkasan ANOVA dengan format berikut.

 

Jadi, pada contoh ini, Tabel Ringkasan ANOVA-nya adalah sebagai berikut.

 

Tabel nilai kritis F dapat diunduh di (klik di sini)

Youtube Channel materi ini: (klik di sini)

File pdf materi di Youtube Channel di atas : (klik di sini)

Latihan Soal: (klik di sini)



Most visitors also read :



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *