UKURAN SEPATU BERHUBUNGAN DENGAN PRESTASI AKADEMIK?

Juni 28th, 2016

Saya yakin bahwa pembaca judul tulisan ini akan menyangkal tegas-tegas apabila ada seseorang ahli statistik mengatakan bahwa ada hubungan atau korelasi antara ukuran sepatu yang dipakai mahasiswa dengan prestasi akademik (yang ditunjukkan dengan Indeks Prestasi Kumulatif, IPK, misalnya). Barangkali ahli statistik itu, untuk meyakinkan Anda, ia menceritakan bahwa ia telah melakukan sampling terhadap 500 orang mahasiswa dan kemudian ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara ukuran sepatu yang dipakai mahasiswa dengan IPK mereka. Kepada ahli stastistik itu, Anda boleh saja menjawab, “Ya, ya, ya …” untuk menghargai hasil karyanya itu. Tetapi, saya katakan kepada Anda bahwa apabila Anda memercayai kesimpulan ahli statistik tersebut, berarti Anda sama-sama tidak waras dengan ahli tersebut.

 

Sebagian peneliti abal-abal (ironinya, sebagian di antara mereka adalah dosen) menggunakan statistika secara salah. Dengan kata lain, mereka menyalahgunakan statistika. Tulisan ini sebenarnya mempunyai dua tujuan, yaitu: 1) memperkenalkan Koefisien Korelasi Rank Spearman (Spearman’s Rank Correlation Coefficient) dan 2) mengingatkan bahaya kesalahan penafsiran korelasi ini.

 

Bilamana koefisien korelasi Spearman digunakan? Lain halnya dengan korelasi product-moment Pearson, korelasi Spearman dapat digunakan apabila kedua variabel memiliki tingkat data minimal ordinal. [Catatan: korelasi Pearson memerlukan banyak asumsi yang harus dipenuhi, salah satunya adalah: masing-masing variabel memiliki tingkat data minimal interval].

 

Berikut adalah suatu contoh bagaimana memeriksa ada atau tidaknya hubungan/korelasi antara dua buah variabel dengan tingkat data ordinal. Suatu hal yang dapat diterima akal sehat kita adalah skor TOEFL mahasiswa berkorelasi/ada hubungan dengan nilai akhir mata kuliah Bahasa Inggris mahasiswa tersebut. Namun, untuk dapat menyimpulkan demikian, perlu dukungan data empiris. Pada taraf nyata 0,05 ia ingin mengetahui apakah ada hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah bahasa Inggris. Untuk itu, ia mengambil 12 sampel secara acak dan hasil sampling tersebut diringkaskan sebagai berikut.

 

Skor TOEFL Nilai Akhir Bahasa Inggris Skor TOEFL Nilai Akhir Bahasa Inggris
475 76 480 79
450 77 526 88
510 78 460 74
465 75 465 70
500 80 490 83
512 85 485 82

Dengan mengikuti langkah-langkah uji hipotesis, kita tuliskan hipotesis nol dan hipotesis tandingannya sebagai berikut:

H0: Tak ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris

H1: Ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris

Taraf nyata yang digunakan adalah α = 0,05. Dengan menggunakan Tabel Nilai Kritis rs (koefisien korelasi rank-order Spearman), diperoleh daerah kritis rs > 0,587 atau rs < -0,587.

Nilai uji statistik yang digunakan adalah r_{s}=1-{6 sum{i=1}{n}{{d_{i}}^2}}/{n^3-n} dengan di = rank(Xi) – rank(Yi)

Misalkan data skor TOEFL adalah Xi dan data nilai akhir Bahasa Inggris adalah Yi. Terhadap data Xi diberikan ranking/peringkat rank(Xi) dan terhadap data Yi diberikan peringkat rank(Yi) dengan ketentuan data yang nilainya terkecil diberikan peringkat yang terkecil dan data yang nilainya terbesar diberikan peringkat yang terbesar. Pada data mengenai skor TOEFL, 450 merupakan nilai terkecil, sehingga untuk data 450 ini diberikan peringkat/rank 1. Skor TOEFL 460 diberikan peringkat 2. Skor TOEFL berikutnya yang lebih besar dari 450 adalah 465, namun ada dua data skor TOEFL yang nilainya 465, yaitu data ke-4 dan ke-10. Seharusnya data yang satu diberikan peringkat 3 dan yang satunya lagi peringkat 4. Tetapi karena mereka harus memiliki rank/peringkat yang sama, mereka diberikan peringkat {3 ~+~ 4}/2 ~=~ 3,5.

 

Nilai-nilai Xi, Yi, rank(Xi), rank(Yi), di, dan di2 dapat dilihat pada tabel berikut.

Xi Yi rank(Xi) rank(Yi) di di2
475 76 5 4 1 1,00
450 77 1 5 -4 16,00
510 78 10 6 4 16,00
465 75 3,5 3 0,5 0,25
500 80 9 8 1 1,00
512 85 11 11 0 0,00
480 79 6 7 -1 1,00
526 88 12 12 0 0,00
460 74 2 2 0 0,00
465 70 3,5 1 2,5 6,25
490 83 8 10 -2 4,00
485 82 7 9 -2 4,00
JUMLAH 49,50

 

Dari tabel tersebut diperoleh r_{s}=1-{6.49,50}/{12^3-12} approx 0,827

Nilai rs = 0,827 ini jatuh di daerah kritis/daerah penolakan yang telah dinyatakan di atas [rs > 0,587]. Jadi, H0 ditolak dan kita simpulkan adanya hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah Bahasa Inggris.

 

Catatan:

Perhitungan di atas merupakan contoh penerapan. Teori mengenai koefisien korelasi Spearman dapat diperoleh pada tautan berikut: Teori_Korelasi_Spearman.

 

Sebagaimana telah dikemukakan, tujuan kedua tulisan ini adalah untuk mengingatkan bahaya kesalahan penafsiran korelasi ini. Kembali ke contoh kasus mengenai korelasi antara ukuran sepatu dengan IPK di atas. Ahli statistik tadi mengatakan bahwa ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara kedua variabel tersebut. Apakah hasil ini bisa dipercaya? Sama sekali tidak! Ini tidak masuk akal! Kalau begitu, bagaimana dengan hasil uji hipotesis mengenai korelasi yang telah ia kerjakan? Abaikan saja hasil tersebut, itu tidak ada artinya. Ini merupakan suatu contoh dari apa yang disebut dengan nonsense correlations atau spurious correlation. Mengenai “nonsense correlations”, Wonnacott mengatakan, “Correlations such as the above are often called ‘nonsense’ correlations. It would be more accurate to say that the observed mathematical correlation is real enough, but any naive inference of cause and effect is nonsense.” Hal serupa itu dinyatakan juga oleh Kendall dan Stuart, “A statistical relationship, however strong enough and however suggestive, can never establish causal connection: our ideas of causation must come from outside stastistics, ultimately from some theory or other.” Dengan pernyataan Wonnacott, Kendall dan Stuart tersebut, statistika ‘sendirian’ tidak dapat memberikan penjelasan yang masuk akal mengenai hubungan antara dua buah variabel. Penjelasan yang masuk akal antara kedua variabel tersebut hanya dapat ditemukan dari luar statistika, misalnya dari suatu teori atau dari ilmu yang berkenaan dengan kedua variabel yang diamati tersebut. Dalam hal ini, peran statistika bersifat confirmatory atau menyajikan bukti empiris mengenai keberadaan hubungan di antara kedua variabel. Sebagai contoh, salah sebuah teori di bidang ekonomi mengatakan bahwa ada hubungan antara konsumsi dengan pendapatan. Peran statistika di sini adalah untuk memeriksa apakah hasil sampling mendukung apa yang dinyatakan dalam teori tersebut.

 

Apa akibatnya pemahaman mengenai spurious correlations ini terhadap analisis korelasi secara umum? Akibatnya adalah kita tidak boleh menyimpulkan adanya suatu hubungan dari uji statistik mengenai korelasi ini tanpa didahului oleh suatu latar belakang teoretis. Kajian teoretis harus menjadi ‘titik berangkat’ dari setiap uji statistik mengenai korelasi. Tanpa penjelasan yang masuk akal menurut ilmu atau teori yang relevan, suatu hubungan yang disimpulkan dari hasil uji statistik (walaupun signifikan) tetap merupakan suatu tanda tanya.

 

Referensi:

  1. Kendall, M. G. and A. Stuart, The Advanced Theory of Statistics, Charles Griffin Publishers, 1961.
  2. Siegel, S. and N. J. Castellan, Jr., Nonparametric Statistics for the Behavioral Sciences, McGraw-Hill, 1988.
  3. Wonnacott, R.J. and T. H. Wonnacott, Econometrics, John Wiley&Sons, Inc., 1970.

 

Berikut ini adalah tautan-tautan yang berhubungan dengan korelasi:

  1. Koefisien Cramer
  2. Tabel_Nilai_Kritis_Korelasi_Spearman
  3. Koefisien Korelasi Product-Moment Pearson: (tautan belum tersedia)

 

LATIHAN SOAL KORELASI RANK SPEARMAN

Tagging: , ,

Most visitors also read :



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *