MENGENAL SAMPLING DISTRIBUTION

November 7th, 2016

Anggaplah kita diminta untuk menghitung rata-rata tinggi badan 1000 orang di suatu tempat. Ada dua cara yang dapat kita lakukan. Pertama, cara sensus, kita melakukan pengukuran tinggi badan terhadap 1000 orang tersebut satu demi satu. Jelas ini memerlukan banyak sekali waktu dan sumber daya. Cara kedua adalah dengan melakukan sampling (pengambilan sampel/penarikan contoh). Anggaplah kita mengukur tinggi badan 5 orang sebagai sampel, dan diperoleh tinggi badan masing-masing orang tersebut misalnya 158 cm, 162 cm, 171 cm, 144 cm, 160 cm. Rata-rata tinggi kelima orang tersebut adalah 159 cm. Apakah 159 cm ini adalah rata-rata 1000 orang tersebut? Belum tentu. Penarikan contoh bersifat untung-untungan. Kalau penarikan contoh/sampling tersebut diulangi lagi dengan mengambil secara acak 5 orang dari 1000 orang yang ada untuk diukur tinggi badannya, boleh jadi kali ini yang terambil sebagai sampel adalah orang-orang yang tingginya 168 cm, 169 cm, 169 cm, 170 cm, dan 174 cm yang apabila dihitung rata-ratanya adalah 170 cm, berbeda dengan hasil sampling pertama. Apakah 170 cm ini merupakan rata-rata 1000 orang tersebut? Belum tentu juga. Apabila kita melakukan sampling lainnya terhadap 5 orang yang diambil secara acak dari 1000 orang itu, bisa jadi kita memperoleh nilai rata-rata yang berbeda lagi. Inilah yang diistilahkan dengan fluktuasi sampling. Rata-rata sebesar 159 cm dan 170 cm yang dihitung tadi merupakan rata-rata sampel, bukan rata-rata populasi 1000 orang tersebut! Padahal yang diminta adalah rata-rata tinggi badan 1000 orang tersebut.

Pertanyaannya sekarang adalah apakah mungkin kita melakukan estimasi rata-rata tinggi badan 1000 orang tersebut dengan menggunakan hasil sampling terhadap beberapa orang saja dari anggota populasi tersebut? Justru itulah letak “kesaktian” ilmu statistika, khususnya statistika inferensial (inferential statistics) atau statistika induktif (inductive statistics). Dengan statistika inferensial, hal tersebut sangat dimungkinkan. Dalam statistika, masalah semacam ini dinamakan penaksiran parameter populasi (estimation of population parameters). Sebelum sampai pada penaksiran parameter ini, perlu dipahami terlebih dahulu konsep distribusi sampel (sampling distribution). Post saya kali ini memperkenalkan mengenai distribusi sampel; mengenai penaksiran paramater akan dibahas pada post saya yang lain.

 

Ilustrasi

Misalkan terdapat 6 orang yang tinggi badannya masing-masing 168 cm, 146 cm, 150 cm, 164 cm, 170 cm, dan 168 cm. Anggaplah populasi kita hanya memuat 6 anggota populasi. Rata-rata populasi ini adalah 161 cm. Misalkan Andi diminta untuk melakukan sampling terhadap 2 orang yang diambil secara acak untuk melakukan penaksiran rata-rata populasi keenam orang tersebut, berapa peluangnya Andi mendapatkan nilai 167 cm sebagai rata-rata sampelnya?

Terdapat 15 hasil sampling yang mungkin didapatkan Andi. Tabel berikut menampilkan hasil sampling yang mungkin didapat dan rata-rata sampelnya.

 

Tabel 1

distribusi_sampel_1

Frekuensi kemunculan rata-rata pada tabel di atas diringkaskan pada tabel berikut.

 

Tabel 2

distribusi_sampel_2

Menggunakan Tabel 2, dapat kita ketahui bahwa besarnya peluang Andi mendapatkan nilai 167 cm sebagai rata-rata sampel adalah 0,0667 atau 6,67%.

 

Catatan:

Tabel 2 di atas menunjukkan distribusi sampel dari rata-rata, atau disingkat distribusi sampel rata-rata.

 

Rata-rata Populasi versus Rata-rata dari Distribusi Sampel Rata-rata

Pada ilustrasi di atas, rata-rata populasi dihitung sebagai berikut.

[pmath]mu ~=~ {168 + 146 + 150 + 164 + 170 + 168}/6 ~cm ~=~ 161 ~ cm[/pmath]

Berapakah rata-rata dari nilai rata-rata yang disajikan pada Tabel 2? Rata-rata inilah yang disebut rata-rata dari distribusi sampel rata-rata, dilambangkan dengan [pmath]mu_{overline{X}}[/pmath]. Hal ini dihitung sebagai berikut.

 

Tabel 3

distribusi_sampel_3

[pmath]mu_{overline{X}} ~=~ 2415/15 ~cm ~=~ 161 ~ cm[/pmath].

 

Ternyata [pmath]mu_{overline{X}} ~=~ mu ~=~ 161 ~ cm[/pmath]. Ini bukan suatu kebetulan, namun memang secara umum berlaku bahwa nilai rata-rata populasi sama dengan nilai rata-rata dari distribusi sampel rata-rata:

[pmath]mu_{overline{X}} ~=~ mu[/pmath] ……………………………………………………………………………. (1)

 

Variansi Populasi versus Variansi dari Distribusi Sampel Rata-rata

Variansi populasi di atas dihitung sebagai berikut.

[pmath]{sigma}^2 ~=~ {(168-161)^2 + (146-161)^2 + (150-161)^2 + (164-161)^2 + (170-161)^2 + (168-161)^2}/6 ~ {cm}^2 ~=~ 89 ~ {cm}^2[/pmath] …………………………………………………………….. (+++)

Variansi dari nilai-nilai rata-rata yang disajikan pada Tabel 2 dinamakan variansi dari distribusi sampel rata-rata, dilambangkan dengan [pmath]{sigma_{overline{X}}}^2[/pmath]. Variansi tersebut dihitung sebagai berikut.

 

Tabel 4

distribusi_sampel_4

[pmath]{sigma_{overline{X}}}^2 ~=~ 534/15 {cm}^2 ~=~ 35,6 ~ {cm}^2[/pmath] ……………………….. (*)

Hubungan antara variansi populasi dengan variansi distribusi sampel rata-rata adalah dinyatakan sebagai berikut.

[pmath]{sigma_{overline{X}}}^2 ~=~ {N ~-~ n}/{n(N ~-~ 1)} {sigma}^2[/pmath] ………………………….. (2)

dengan N adalah banyaknya anggota populasi dan n adalah ukuran sampel.

 

Substitusikan N = 6, n = 2, dan hasil (+++) pada rumus (2), diperoleh:

[pmath]{sigma_{overline{X}}}^2 ~=~ {6 ~-~ 2}/{2(6 ~-~ 1)} ~.~ 89 ~ {cm}^2 ~=~ 35,6 ~ {cm}^2[/pmath]

Bandingkan hasil menggunakan rumus (2) dengan (*), hasilnya sama.

 

Catatan Penting:

Rumus (2) berlaku apabila sampling dilakukan tanpa pengembalian (sampling without replacement). Jika dilakukan sampling with replacement, maka berlaku:

[pmath]{sigma_{overline{X}}}^2 ~=~ {{sigma}^2}/n[/pmath]

 

Catatan:

Akar kuadrat dari [pmath]{sigma_{overline{X}}}^2[/pmath], dilambangkan dengan [pmath]sigma_{overline{X}[/pmath] dinamakan galat baku (standard error) dari distribusi sampel rata-rata. Jadi, apabila sampling dilakukan tanpa pengembalian berlaku

[pmath]sigma_{overline{X}} ~=~ sqrt{{N ~-~ n}/{n(N ~-~ 1)}} ~.~ sigma[/pmath] ………………………… (3)

dan apabila sampling dilakukan dengan pengembalian berlaku

[pmath]sigma_{overline{X}} ~=~ {sigma}/{sqrt{n}}[/pmath]

 

DISTRIBUSI SAMPEL RATA-RATA APABILA SAMPLING DILAKUKAN DENGAN PENGEMBALIAN

                Tadi telah diuraikan bagaimana hubungan antara rata-rata populasi dengan rata-rata dari distribusi sampel rata-rata, juga hubungan antara variansi populasi dengan variansi dari distribusi sampel rata-rata. Pada ilustrasi yang disajikan di atas, sampling dilakukan tanpa pengembalian. Apabila sampling dilakukan tanpa pengembalian, tidak mungkin ada orang yang sama terpilih sebagai sampel lebih dari satu kali. Sebagai contoh: pada ilustrasi di atas, misalkan nama-nama anggota populasinya adalah Ani (tinggi: 160 cm), Berna (146 cm), Caca (150 cm), Dani (164 cm), Edwin (170 cm), dan Fahrul (168 cm). Apabila diambil secara acak 2 orang sebagai sampel, tidak mungkin Caca terpilih sebagai sampel pertama dan sebagai sampel kedua. Mengapa demikian? Karena jika Caca sudah terpilih sebagai sampel pertama, maka sampel kedua diambil dari anggota populasi sisanya, yaitu Ani, Berna, Dani, Edwin, dan Fahrul sehingga kedua sampel tersebut merupakan orang-orang yang berbeda.

Lain halnya dengan sampling dengan pengembalian: mungkin saja ada seorang anggota populasi terpilih beberapa kali sebagai sampel. Mengapa demikian? Jika misalnya Caca terpilih secara acak menjadi sampel yang pertama, ia “digabungkan kembali” dengan populasinya sehingga ia mempunyai kesempatan lagi untuk terpilih (secara acak) menjadi sampel yang kedua.

Bagaimana distribusi sampel rata-rata pada ilustrasi di atas apabila sampling dilakukan dengan pengembalian? Padanan Tabel 1 apabila sampling dilakukan dengan pengembalian adalah Tabel 1A berikut ini.

 

Tabel 1A

distribusi_sampel_5_1a

Frekuensi kemunculan rata-rata pada tabel di atas diringkaskan pada tabel berikut, yaitu padanan Tabel 2 di atas.

 

Tabel 2A

distribusi_sampel_6_2a

Rata-rata dari distribusi sampel rata-rata, [pmath]mu_{overline{X}}[/pmath] dihitung menggunakan tabel bantu sebagai berikut.

Tabel 3A

distribusi_sampel_7_3a

Dari tabel tersebut, diperoleh [pmath]mu_{overline{X}} ~=~ {5796}/{36} ~cm ~=~ 161 ~ cm[/pmath].

Perhatikan bahwa (1) pun berlaku dalam kasus sampling dengan pengembalian.

 

Variansi distribusi sampel rata-rata dihitung dengan bantuan Tabel 4A berikut ini.

 

Tabel 4A

distribusi_sampel_8_4a

Dari Tabel 4A [pmath]{sigma_{overline{X}}}^2[/pmath] dihitung sebagai berikut.

[pmath]{sigma_{overline{X}}}^2 ~=~ 1602/36 ~ {cm}^2 ~=~ 44,5 ~ {cm}^2[/pmath] ………………………………………………………. (**)

Dalam sampling dengan pengembalian atau populasi tak terhingga, berlaku:

[pmath]{sigma_{overline{X}}}^2 ~=~ {{sigma}^2}/n[/pmath] ……………………………………………………………………………………….. (4)

dan

[pmath]sigma_{overline{X}} ~=~ {sigma}/{sqrt{n}}[/pmath] …………………………………………………….. (5)

(**) dapat juga diperoleh dengan menggunakan (4) dan hasil (+++) sebagai berikut.

[pmath]{sigma_{overline{X}}}^2 ~=~ 89/2 ~ {cm}^2 ~=~ 44,5 ~ {cm}^2[/pmath]

Bandingkan hasil menggunakan rumus (4) dengan (**), hasilnya sama.

(bersambung)

Tagging: , , , , , , ,

Most visitors also read :



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan.