Kata “statistika” dan “statistik” bukan merupakan kata yang asing lagi dalam kehidupan sehari-hari. Masyarakat awam sering salah kaprah dalam mempergunakan kedua kata itu. Jika demikian, apakah arti kedua kata tersebut sebenarnya?
Kata “statistika” diturunkan dari kata dalam bahasa Latin status atau Italia statista yang berarti keadaan politik. Di tahun-tahun awal perkembangannya statistika memiliki konotasi kumpulan fakta mengenai negara atau penduduk negara tersebut untuk kepentingan administratif dan politik. Agar penyelenggaraan pemerintahan di suatu negara dapat berlangsung baik, pemerintah menyelenggarakan pengumpulan data mengenai keadaan penduduknya, yang lazim disebut sensus. Pada saat itu statistika mendapat julukan “ilmu pengetahuan mengenai negara”. Namun dalam perkembangan selanjutnya, statistika tidak hanya digunakan untuk mempelajari keadaan penduduk suatu negara, namun dipergunakan secara sangat luas. Sir R. A. Fisher memandang ilmu statistika sebagai “matematika yang diterapkan pada data hasil pengamatan”.
Apa definisi statistika? Pengarang-pengarang buku tentang statistika memberikan pengertian yang berlainan mengenai statistika. Dua contoh di antaranya: Spiegel, seorang profesor matematika di Rensellaer Polytechnic Institute, dalam bukunya “Theory and Problems of Statistics” menerangkan statistika sebagai “metode ilmiah untuk mengumpulkan, mengorganisasikan, meringkas, menyajikan dan menganalisis data, juga mengambil kesimpulan yang sahih dan membuat keputusan yang beralasan berdasarkan analisis tersebut; sedangkan Lind dalam bukunya “Statistical Techniques in Business and Economics” menyatakan bahwa statistika adalah adalah ilmu mengumpulkan, mengorganisasikan, menyajikan, menganalisis, dan menafsirkan data untuk membantu membuat keputusan dengan lebih efektif”.
Walau berbagai definisi bertebaran dalam banyak literatur, tetapi pada umumnya terdapat kesamaan maksud, yaitu bahwa statistika, sebagaimana dijelaskan Spiegel, memuat dua fase, yaitu statistika deskriptif dan statistika inferensial/induktif. Statistika deskriptif hanya menggambarkan dan menganalisis mengenai suatu kelompok tanpa menarik kesimpulan mengenai kelompok yang lebih besar sedangkan statistika inferensial berupaya mengambil kesimpulan terhadap populasi berdasarkan hasil sampling (penarikan contoh). Karena pengambilan sampel ini bersifat untung-untungan, tentu dalam pengambilan kesimpulannya terbuka lebar peluang terjadinya kesalahan. Karena itu statistika inferensial tidak mungkin lepas hubungannya dengan teori peluang (Probability Theory).
Tadi digunakan istilah populasi dan sampel. Apakah arti kedua istilah tersebut? Populasi dan sampel tidak lepas hubungannya dengan dua metode pengambilan data, yaitu sensus dan sampling (penarikan contoh). Seandainya Anda diminta untuk menghitung berapa rata-rata tinggi badan seluruh mahasiswa yang terdaftar di suatu universitas. Cara pertama yang dapat dilakukan adalah Anda meminta suatu daftar lengkap mahasiswa dari bagian administrasi kemahasiswaan di universitas tersebut dan kemudian bagaimana pun caranya Anda melakukan pengukuran tinggi badan terhadap semua mahasiswa yang ada dalam daftar itu tanpa terkecuali. Cara inilah yang disebut dengan cara sensus. Sebagai alternatif, Anda tidak perlu melakukan pengukuran tinggi badan terhadap semua mahasiswa, tetapi Anda hanya mengukur tinggi badan terhadap hanya sebagian saja mahasiswa yang terdapat dalam daftar tersebut, kemudian berdasarkan data yang diperoleh (dan setelah melalui suatu perhitungan tertentu) mengambil kesimpulan terhadap rata-rata tinggi badan seluruh mahasiswa yang terdaftar di universitas tersebut. Cara inilah yang disebut cara sampling. Jelas cara pertama (sensus) memerlukan waktu dan sumber daya yang lebih banyak daripada cara kedua (sampling). Lind menerangkan populasi dan sampel sebagai berikut. Populasi adalah keseluruhan individu atau objek yang sedang kita amati atau hasil-hasil pengukuran yang diperoleh dari individu atau objek yang kita amati tersebut. Sampel adalah sebagian dari populasi yang sedang diamati tersebut. Pada contoh mengenai tinggi badan ini, populasinya adalah seluruh/semua mahasiswa yang terdaftar di universitas tersebut. Setelah data tinggi badan seluruh mahasiswa tersebut diperoleh, bisa juga seluruh data ini dinamakan populasi. Sekarang misalnya digunakan cara kedua, yaitu cara sampling. Anggaplah terdapat 100 orang mahasiswa yang diukur tinggi badannya dari antara seluruh mahasiswa yang terdaftar. Data 100 buah hasil pengukuran tinggi badan ini dinamakan sampel.
Mari kita lihat contoh lainnya. Misalnya kita ingin mengetahui siapa di antara Andi dan Tono yang lebih disukai sebagai calon Presiden Mahasiswa suatu universitas. Cara pertama yang dapat dilakukan adalah dengan menanyai semua mahasiswa universitas tersebut tanpa kecuali. Anggaplah dari keseluruhan mahasiswa sebanyak 1000 orang, 750 di antaranya lebih menyukai Andi dan sisanya lebih menyukai Tono. Di sini bisa kita simpulkan bahwa proporsi pendukung Andi adalah 0,75 dan proporsi pendukung Tono adalah 0,25. Kedua angka ini merupakan proporsi populasi. 0,75 adalah proporsi populasi pendukung Andi dan 0,25 adalah proporsi populasi pendukung Tono. Mengapa dinamakan proporsi populasi? Karena proporsi tersebut kita dapatkan setelah kita melakukan pengumpulan data terhadap keseluruhan anggota populasi, yaitu semua mahasiswa yang terdaftar di universitas itu. Sekarang, misalnya akan digunakan cara kedua, yaitu cara sampling. Misalkan di antara 1000 orang anggota populasi tersebut, hanya 400 orang yang ditanyai preferensinya. Ternyata dari 400 orang tersebut, 250 orang mendukung Andi dan 150 orang mendukung Tono. Dari hasil sampling ini diperoleh proporsi pendukung Andi adalah 0,625 dan proporsi pendukung Andi adalah 0,375. Kedua angka ini merupakan proporsi sampel karena dihitung berdasarkan hasil sampling. Ternyata proporsi pendukung Andi maupun Tono berbeda antara hasil sensus dan hasil sampling. Mungkinkah ini terjadi? SANGAT MUNGKIN, bahkan HAMPIR PASTI TIDAK SAMA PERSIS. Ini bisa terjadi karena dalam proses sampling terdapat sifat untung-untungan. Justru dalam statistika inferensial kita akan belajar bagaimana cara menyimpulkan mengenai keadaan populasi berdasarkan hasil sampling. Inilah yang saya katakan sebagai “kesaktian” statistika yang tidak dimiliki ilmu lain, yaitu: menyimpulkan “yang seluruh” berdasarkan “yang sedikit” dengan hasil yang dapat dipercaya.
Tadi telah diterangkan mengenai sensus, sampling, populasi, dan sampel. Empat hal ini selalu ditemui dalam dunia statistika. Statistika tidak bisa lepas dari keempat hal tersebut. Juga telah dikatakan bahwa masyarakat awam sering salah kaprah mengenai penggunaan istilah statistika dan statistik. Sekarang, apakah “statistik” itu? Secara teoretis, statistik adalah sembarang fungsi dari variabel-variabel acak yang membentuk suatu sampel acak. Sebagai contoh, dalam upaya menentukan rata-rata populasi tinggi badan seluruh mahasiswa di contoh pertama kita, kita melakukan sampling dengan mengambil data tinggi badan 100 mahasiswa. Misalkan tinggi badan mahasiswa ke-i adalah Xi. Maka statistik yang digunakan untuk menaksir rata-rata tinggi badan seluruh mahasiswa adalah statistik . Dari statistik ini kemudian akan disimpulkan mengenai rata-rata populasi tinggi badan seluruh mahasiswa di universitas tersebut. Pada contoh kedua, statistik yang dipergunakan untuk menaksir proporsi pendukung Andi adalah statistik dengan x adalah banyaknya mahasiswa yang terpilih sebagai sampel yang mendukung Andi. Dengan diperolehnya nilai statistik p kemudian dapat disimpulkan mengenai proporsi populasi pendukung Andi. Nilai statistik merupakan nilai yang selanjutnya akan dipergunakan dalam statistika inferensial untuk mengambil kesimpulan terhadap populasi yang diamati.
EVALUASI
Apakah yang dipelajari dalam statistika?
Apakah yang dimaksud dengan: a) statistika deskriptif? b) statistika inferensial?
Mengapa teori peluang diperlukan dalam statistika inferensial?
Apa yang dimaksud dengan sensus? Bagaimana keterkaitan antara sensus dengan populasi?
Apa yang dimaksud dengan sampling? Bagaimana keterkaitan antara sampling dengan sampel?
Apa perbedaan antara statistika dengan statistik?
Referensi:
Spiegel, M. R., Theory and Problems of Statistics, McGraw-Hill Inc., 1981
Lind, D.A., W. G. Marchal, S. A. Wathen, Statistical Techniques in Business and Economics 10th Ed., McGraw-Hill Irwin, 1999
Shukla, M. C., S. S., Gulshan, Elements of Statistics for Commerce Students, S. Chand&Co.(Pvt) Ltd., 1971
PENDAHULUAN STATISTIKA
Kata “statistika” dan “statistik” bukan merupakan kata yang asing lagi dalam kehidupan sehari-hari. Masyarakat awam sering salah kaprah dalam mempergunakan kedua kata itu. Jika demikian, apakah arti kedua kata tersebut sebenarnya?
Kata “statistika” diturunkan dari kata dalam bahasa Latin status atau Italia statista yang berarti keadaan politik. Di tahun-tahun awal perkembangannya statistika memiliki konotasi kumpulan fakta mengenai negara atau penduduk negara tersebut untuk kepentingan administratif dan politik. Agar penyelenggaraan pemerintahan di suatu negara dapat berlangsung baik, pemerintah menyelenggarakan pengumpulan data mengenai keadaan penduduknya, yang lazim disebut sensus. Pada saat itu statistika mendapat julukan “ilmu pengetahuan mengenai negara”. Namun dalam perkembangan selanjutnya, statistika tidak hanya digunakan untuk mempelajari keadaan penduduk suatu negara, namun dipergunakan secara sangat luas. Sir R. A. Fisher memandang ilmu statistika sebagai “matematika yang diterapkan pada data hasil pengamatan”.
Apa definisi statistika? Pengarang-pengarang buku tentang statistika memberikan pengertian yang berlainan mengenai statistika. Dua contoh di antaranya: Spiegel, seorang profesor matematika di Rensellaer Polytechnic Institute, dalam bukunya “Theory and Problems of Statistics” menerangkan statistika sebagai “metode ilmiah untuk mengumpulkan, mengorganisasikan, meringkas, menyajikan dan menganalisis data, juga mengambil kesimpulan yang sahih dan membuat keputusan yang beralasan berdasarkan analisis tersebut; sedangkan Lind dalam bukunya “Statistical Techniques in Business and Economics” menyatakan bahwa statistika adalah adalah ilmu mengumpulkan, mengorganisasikan, menyajikan, menganalisis, dan menafsirkan data untuk membantu membuat keputusan dengan lebih efektif”.
Walau berbagai definisi bertebaran dalam banyak literatur, tetapi pada umumnya terdapat kesamaan maksud, yaitu bahwa statistika, sebagaimana dijelaskan Spiegel, memuat dua fase, yaitu statistika deskriptif dan statistika inferensial/induktif. Statistika deskriptif hanya menggambarkan dan menganalisis mengenai suatu kelompok tanpa menarik kesimpulan mengenai kelompok yang lebih besar sedangkan statistika inferensial berupaya mengambil kesimpulan terhadap populasi berdasarkan hasil sampling (penarikan contoh). Karena pengambilan sampel ini bersifat untung-untungan, tentu dalam pengambilan kesimpulannya terbuka lebar peluang terjadinya kesalahan. Karena itu statistika inferensial tidak mungkin lepas hubungannya dengan teori peluang (Probability Theory).
Tadi digunakan istilah populasi dan sampel. Apakah arti kedua istilah tersebut? Populasi dan sampel tidak lepas hubungannya dengan dua metode pengambilan data, yaitu sensus dan sampling (penarikan contoh). Seandainya Anda diminta untuk menghitung berapa rata-rata tinggi badan seluruh mahasiswa yang terdaftar di suatu universitas. Cara pertama yang dapat dilakukan adalah Anda meminta suatu daftar lengkap mahasiswa dari bagian administrasi kemahasiswaan di universitas tersebut dan kemudian bagaimana pun caranya Anda melakukan pengukuran tinggi badan terhadap semua mahasiswa yang ada dalam daftar itu tanpa terkecuali. Cara inilah yang disebut dengan cara sensus. Sebagai alternatif, Anda tidak perlu melakukan pengukuran tinggi badan terhadap semua mahasiswa, tetapi Anda hanya mengukur tinggi badan terhadap hanya sebagian saja mahasiswa yang terdapat dalam daftar tersebut, kemudian berdasarkan data yang diperoleh (dan setelah melalui suatu perhitungan tertentu) mengambil kesimpulan terhadap rata-rata tinggi badan seluruh mahasiswa yang terdaftar di universitas tersebut. Cara inilah yang disebut cara sampling. Jelas cara pertama (sensus) memerlukan waktu dan sumber daya yang lebih banyak daripada cara kedua (sampling). Lind menerangkan populasi dan sampel sebagai berikut. Populasi adalah keseluruhan individu atau objek yang sedang kita amati atau hasil-hasil pengukuran yang diperoleh dari individu atau objek yang kita amati tersebut. Sampel adalah sebagian dari populasi yang sedang diamati tersebut. Pada contoh mengenai tinggi badan ini, populasinya adalah seluruh/semua mahasiswa yang terdaftar di universitas tersebut. Setelah data tinggi badan seluruh mahasiswa tersebut diperoleh, bisa juga seluruh data ini dinamakan populasi. Sekarang misalnya digunakan cara kedua, yaitu cara sampling. Anggaplah terdapat 100 orang mahasiswa yang diukur tinggi badannya dari antara seluruh mahasiswa yang terdaftar. Data 100 buah hasil pengukuran tinggi badan ini dinamakan sampel.
Mari kita lihat contoh lainnya. Misalnya kita ingin mengetahui siapa di antara Andi dan Tono yang lebih disukai sebagai calon Presiden Mahasiswa suatu universitas. Cara pertama yang dapat dilakukan adalah dengan menanyai semua mahasiswa universitas tersebut tanpa kecuali. Anggaplah dari keseluruhan mahasiswa sebanyak 1000 orang, 750 di antaranya lebih menyukai Andi dan sisanya lebih menyukai Tono. Di sini bisa kita simpulkan bahwa proporsi pendukung Andi adalah 0,75 dan proporsi pendukung Tono adalah 0,25. Kedua angka ini merupakan proporsi populasi. 0,75 adalah proporsi populasi pendukung Andi dan 0,25 adalah proporsi populasi pendukung Tono. Mengapa dinamakan proporsi populasi? Karena proporsi tersebut kita dapatkan setelah kita melakukan pengumpulan data terhadap keseluruhan anggota populasi, yaitu semua mahasiswa yang terdaftar di universitas itu. Sekarang, misalnya akan digunakan cara kedua, yaitu cara sampling. Misalkan di antara 1000 orang anggota populasi tersebut, hanya 400 orang yang ditanyai preferensinya. Ternyata dari 400 orang tersebut, 250 orang mendukung Andi dan 150 orang mendukung Tono. Dari hasil sampling ini diperoleh proporsi pendukung Andi adalah 0,625 dan proporsi pendukung Andi adalah 0,375. Kedua angka ini merupakan proporsi sampel karena dihitung berdasarkan hasil sampling. Ternyata proporsi pendukung Andi maupun Tono berbeda antara hasil sensus dan hasil sampling. Mungkinkah ini terjadi? SANGAT MUNGKIN, bahkan HAMPIR PASTI TIDAK SAMA PERSIS. Ini bisa terjadi karena dalam proses sampling terdapat sifat untung-untungan. Justru dalam statistika inferensial kita akan belajar bagaimana cara menyimpulkan mengenai keadaan populasi berdasarkan hasil sampling. Inilah yang saya katakan sebagai “kesaktian” statistika yang tidak dimiliki ilmu lain, yaitu: menyimpulkan “yang seluruh” berdasarkan “yang sedikit” dengan hasil yang dapat dipercaya.
Tadi telah diterangkan mengenai sensus, sampling, populasi, dan sampel. Empat hal ini selalu ditemui dalam dunia statistika. Statistika tidak bisa lepas dari keempat hal tersebut. Juga telah dikatakan bahwa masyarakat awam sering salah kaprah mengenai penggunaan istilah statistika dan statistik. Sekarang, apakah “statistik” itu? Secara teoretis, statistik adalah sembarang fungsi dari variabel-variabel acak yang membentuk suatu sampel acak. Sebagai contoh, dalam upaya menentukan rata-rata populasi tinggi badan seluruh mahasiswa di contoh pertama kita, kita melakukan sampling dengan mengambil data tinggi badan 100 mahasiswa. Misalkan tinggi badan mahasiswa ke-i adalah Xi. Maka statistik yang digunakan untuk menaksir rata-rata tinggi badan seluruh mahasiswa adalah statistik . Dari statistik ini kemudian akan disimpulkan mengenai rata-rata populasi tinggi badan seluruh mahasiswa di universitas tersebut. Pada contoh kedua, statistik yang dipergunakan untuk menaksir proporsi pendukung Andi adalah statistik dengan x adalah banyaknya mahasiswa yang terpilih sebagai sampel yang mendukung Andi. Dengan diperolehnya nilai statistik p kemudian dapat disimpulkan mengenai proporsi populasi pendukung Andi. Nilai statistik merupakan nilai yang selanjutnya akan dipergunakan dalam statistika inferensial untuk mengambil kesimpulan terhadap populasi yang diamati.
EVALUASI
Referensi:
Materi selanjutnya: Tingkat Data
Bagikan ini:
Most visitors also read :
DEKOMPOSISI NILAI SINGULAR (SINGULAR VALUE DECOMPOSITION)
MAXIMUM LIKELIHOOD ESTIMATOR
JARAK STATISTIKAL
SOAL DAN PEMBAHASAN ANALISIS KOMPONEN UTAMA