DISTRIBUSI SAMPLING RATA-RATA

Pebruari 20th, 2020

Salah satu “kesaktian” dari statistika, khususnya statistika inferensial, adalah dapat memberikan suatu kesimpulan mengenai keseluruhan populasi yang sedang dipelajari berdasarkan hasil sampling. Dalam hal ini kita dapat mempertanyakan berapa besar kemungkinannya hasil sampling ini benar-benar mencerminkan keadaan populasi sesungguhnya. Juga kita dapat mempertanyakan berapa besar peluang hasil sampling ini “meleset jauh” dari keadaan populasi yang sesungguhnya. Pertanyaan-pertanyaan ini berkenaan atau berkaitan dengan konsep distribusi penarikan contoh (sampling distribution, distribusi sampling) dalam statistika.

Ada beragam distribusi sampling, namun kali ini akan diuraikan distribusi sampling dari rata-rata. Pada keadaan sesungguhnya, biasanya populasi yang dipelajari memiliki banyak sekali atau bahkan tak berhingga banyaknya anggota. Namun untuk memudahkan pembahasan, anggaplah populasinya hanya beranggotakan 5 orang, bernama A, B, C, D, dan E. Tabel berikut menyatakan berat badan masing-masing anggota populasi tersebut, dalam satuan kg.

Tabel 1

Misalkan kita tidak mengetahui data berat badan tersebut, sehingga kita tidak mengetahui berapa rata-rata populasi berat badan tersebut. Namun, kita akan melakukan penaksiran/estimasi terhadap rata-rata populasi berat badan berdasarkan hasil sampling. Kita akan meninjau dua kasus, yaitu sampling tanpa pengembalian dan sampling dengan pengembalian.

 

Bagian I: sampling tanpa pengembalian dengan ukuran sampel 3

Dalam sampling tanpa pengembalian (sampling without replacement), sampel yang telah diambil datanya/diukur tidak dikembalikan lagi/tidak bergabung lagi ke populasi asalnya, sehingga sampel tersebut tidak mungkin terpilih lagi sebagai sampel. Apabila di antara 5 orang anggota populasi tersebut dipilih 3 orang sebagai sampel, ada 10 kemungkinan kelompok sampel, yaitu ABC, ABD, ABE, BCD, BCE, CDE, ACD, ACE, ADE, BDE. Dengan penulisan kelompok sampel tersebut, ABC menyatakan bahwa dalam sampel berukuran 3 tersebut, yang kebetulan terpilih menjadi sampel adalah A, B, dan C. ABD menyatakan bahwa dalam sampel berukuran 3 tersebut, yang kebetulan terpilih sebagai sampel adalah A, B, dan D. Demikian pula selanjutnya.

Jika yang terpilih sebagai sampel adalah A, B, dan C maka rata-rata berat badan yang diperoleh adalah \bar{x} = \frac{78+60+60}{3} \: kg = 66 \: kg. Seandainya yang kebetulan terpilih sebagai sampel adalah A, B, dan D maka rata-rata berat badan yang diperoleh adalah \bar{x} = \frac{78+60+54}{3} \: kg = 64 \: kg. Tabel berikut ini menampilkan rata-rata sampel yang mungkin didapat dengan menggunakan ukuran sampel 3.

 

Tabel 2

Frekuensi kemunculan rata-rata sampel yang mungkin dihasilkan diringkaskan pada tabel berikut.

 

Tabel 3

Apa yang dapat disimpulkan dari hasil pada tabel terakhir di atas? Apabila kita mengambil sampel acak berukuran 3 dari populasi berat badan tersebut, peluangnya 20% kita akan mendapatkan rata-rata sampel sebesar 54 kg. Serupa dengan itu, 10% peluangnya kita mendapatkan rata-rata sampel 56 kg; 10% peluangnya kita mendapatkan rata-rata sampel 58 kg. Demikian seterusnya.

Distribusi sampling dari rata-rata tersebut dapat digambarkan sebagai berikut.


Gambar 1

Pada Gambar 1, sumbu tegak mewakili p, yaitu peluang didapatkannya rata-rata sampel yang nilainya ditunjukkan pada sumbu mendatar. Pada Tabel 3, nilai p ditunjukkan oleh fr.

Kode R terkait hasil di atas dapat diunduh di: (klik di sini)

Dengan cara serupa yang diuraikan di atas, kita dapat juga distribusi sampling rata-rata dengan menggunakan ukuran sampel 2. Dengan ukuran sampel ini, akan diperoleh distribusi sampling rata-rata sebagaimana ditunjukkan pada tabel di bawah ini.

 

Tabel 4

Bentuk distribusi sampling tersebut dapat dilihat pada gambar berikut.

Gambar 2

 

Bagian II: sampling dengan pengembalian menggunakan ukuran sampel 2

Dalam sampling dengan pengembalian (sampling with replacement), sampel yang telah diambil datanya/diukur dikembalikan lagi ke dalam populasi asalnya, sehingga sampel tersebut mungkin saja terpilih lagi sebagai sampel. Apabila di antara 5 orang anggota populasi tersebut dipilih 2 orang sebagai sampel, ada 25 kemungkinan kelompok sampel, yaitu: AA, AB, AC, AD, AE, BB, BC, BD, BE, CC, CD, CE, DD, DE, EE, BA, CA, DA, EA, CB, DB, EB, DC, EC, ED.

Padanan Tabel 2, Tabel 3, dan Gambar 1 untuk sampling dengan pengembalian menggunakan 2 sampel dapat dilihat pada Tabel 5, Tabel 6, dan Gambar 3.

 

Tabel 5

 

Tabel 6

 

Gambar 3

 

Kode R terkait hasil di atas dapat diunduh di: (klik di sini)

Bagaimana kaitan antara rata-rata populasi \mu dengan rata-rata dari distribusi sampling rata-rata {\mu}_{\bar{X}} ?
Mari kita hitung rata-rata populasi (data pada Tabel 1).
\mu = \frac{78+60+60+54+48}{5} \: kg = 60 \: kg
Sekarang kita hitung rata-rata dari distribusi sampling rata-rata (yaitu rata-rata data yang terdapat di Tabel 6) sebagai berikut.

 

Tabel 7

 

Rata-rata dari distribusi sampling rata-rata adalah {\mu}_{\bar{X}}=\frac{1500}{25} \: kg = 60 \: kg

Ternyata, {\mu}_{\bar{X}} = \mu. Ini bukan kebetulan, karena suatu dalil dalam statistika menyatakan bahwa rata-rata sampel \bar{X}=\frac{X_1+X_2+X_3+ \cdots +X_n}{n} merupakan penaksir tak bias (unbiased estimator) bagi rata-rata populasi \mu. Hasil ini berlaku baik untuk sampling dengan pengembalian maupun tanpa pengembalian.

Sekarang, bagaimana kaitan antara variansi populasi {\sigma}^2 dengan variansi dari distribusi sampling rata-rata {{\sigma}^2}_{\bar{X}} ?

Variansi populasi tinggi badan kelima orang tersebut adalah:
{\sigma}^2 = \frac{(78-60)^2 + (60-60)^2 + (60-60)^2 + (54-60)^2 + (48-60)^2}{5} = 100,8 \: kg^2

Untuk menghitung variansi dari distribusi sampling rata-rata, dilakukan perhitungan berikut.

 

Tabel 8

 

Variansi distribusi sampling rata-rata: {{\sigma}^2}_{\bar{X}} = \frac{1260}{25} \: kg^2 = 50,4 \: kg^2

Hubungan antara variansi distribusi sampling rata-rata dengan variansi populasi apabila sampling dilakukan dengan pengembalian memenuhi hubungan berikut: {{\sigma}^2}_{\bar{X}} = \frac{{\sigma}^2}{n}. Apabila ukuran populasi sangat banyak (menuju tak berhingga) maka rumus ini pun berlaku apabila sampling dilakukan tanpa pengembalian.
Periksalah!

Apabila sampling dilakukan tanpa pengembalian, hubungan antara variansi distribusi sampling rata-rata dengan variansi populasi adalah {{\sigma}^2}_{\bar{X}} = (\frac{N-n}{n(N-1)}) {\sigma}^2, dengan N = banyaknya anggota populasi dan n = ukuran sampel
Periksalah!

 

Penjelasan audiovisual tentang distribusi sampling rata-rata: klik di sini

 

Latihan Bagian I

Suatu populasi tinggi badan enam orang siswa (dalam cm) adalah sebagai berikut: 163, 168, 165, 165, 156, 167. Populasi tersebut dikenakan sampling tanpa pengembalian dengan ukuran sampel 2. a) Tentukan rata-rata populasi. b) Buatlah tabel yang mewakili distribusi sampling dari rata-ratanya (serupa Tabel 3 di atas). c) Gambarkan distribusi sampling rata-rata tsb. seperti Gambar 1 di atas. d) Tentukan simpangan baku populasi. e) Tentukan standard error dari rata-rata. f) Apakah hubungan {{\sigma}^2}_{\bar{X}} = (\frac{N-n}{n(N-1)}) {\sigma}^2 berlaku?

 

Latihan Bagian II

Suatu populasi tinggi badan enam orang siswa (dalam cm) adalah sebagai berikut: 163, 168, 165, 165, 156, 167. Populasi tersebut dikenakan sampling dengan pengembalian dengan ukuran sampel 2. a) Tentukan rata-rata populasi. b) Buatlah tabel yang mewakili distribusi sampling dari rata-ratanya (serupa Tabel 3 di atas). c) Gambarkan distribusi sampling rata-rata tsb. seperti Gambar 1 di atas. d) Tentukan simpangan baku populasi. e) Tentukan standard error dari rata-rata. f) Apakah hubungan {{\sigma}^2}_{\bar{X}} = \frac{{\sigma}^2}{n} berlaku?



Most visitors also read :



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan.