UKURAN SEPATU BERHUBUNGAN DENGAN PRESTASI AKADEMIK?
Juni 28th, 2016
Saya yakin bahwa pembaca judul tulisan ini akan menyangkal tegas-tegas apabila ada seseorang ahli statistik mengatakan bahwa ada hubungan atau korelasi antara ukuran sepatu yang dipakai mahasiswa dengan prestasi akademik (yang ditunjukkan dengan Indeks Prestasi Kumulatif, IPK, misalnya). Barangkali ahli statistik itu, untuk meyakinkan Anda, ia menceritakan bahwa ia telah melakukan sampling terhadap 500 orang mahasiswa dan kemudian ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara ukuran sepatu yang dipakai mahasiswa dengan IPK mereka. Kepada ahli stastistik itu, Anda boleh saja menjawab, “Ya, ya, ya …” untuk menghargai hasil karyanya itu. Tetapi, saya katakan kepada Anda bahwa apabila Anda memercayai kesimpulan ahli statistik tersebut, berarti Anda sama-sama tidak waras dengan ahli tersebut.
Sebagian peneliti abal-abal (ironinya, sebagian di antara mereka adalah dosen) menggunakan statistika secara salah. Dengan kata lain, mereka menyalahgunakan statistika. Tulisan ini sebenarnya mempunyai dua tujuan, yaitu: 1) memperkenalkan Koefisien Korelasi Rank Spearman (Spearman’s Rank Correlation Coefficient) dan 2) mengingatkan bahaya kesalahan penafsiran korelasi ini.
Bilamana koefisien korelasi Spearman digunakan? Lain halnya dengan korelasi product-moment Pearson, korelasi Spearman dapat digunakan apabila kedua variabel memiliki tingkat data minimal ordinal. [Catatan: korelasi Pearson memerlukan banyak asumsi yang harus dipenuhi, salah satunya adalah: masing-masing variabel memiliki tingkat data minimal interval].
Berikut adalah suatu contoh bagaimana memeriksa ada atau tidaknya hubungan/korelasi antara dua buah variabel dengan tingkat data ordinal. Suatu hal yang dapat diterima akal sehat kita adalah skor TOEFL mahasiswa berkorelasi/ada hubungan dengan nilai akhir mata kuliah Bahasa Inggris mahasiswa tersebut. Namun, untuk dapat menyimpulkan demikian, perlu dukungan data empiris. Pada taraf nyata 0,05 ia ingin mengetahui apakah ada hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah bahasa Inggris. Untuk itu, ia mengambil 12 sampel secara acak dan hasil sampling tersebut diringkaskan sebagai berikut.
Skor TOEFL
Nilai Akhir Bahasa Inggris
Skor TOEFL
Nilai Akhir Bahasa Inggris
475
76
480
79
450
77
526
88
510
78
460
74
465
75
465
70
500
80
490
83
512
85
485
82
Dengan mengikuti langkah-langkah uji hipotesis, kita tuliskan hipotesis nol dan hipotesis tandingannya sebagai berikut:
H0: Tak ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris
H1: Ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris
Taraf nyata yang digunakan adalah α = 0,05. Dengan menggunakan Tabel Nilai Kritis rs (koefisien korelasi rank-order Spearman), diperoleh daerah kritis rs > 0,587 atau rs < -0,587.
Nilai uji statistik yang digunakan adalah dengan di = rank(Xi) – rank(Yi)
Misalkan data skor TOEFL adalah Xi dan data nilai akhir Bahasa Inggris adalah Yi. Terhadap data Xi diberikan ranking/peringkat rank(Xi) dan terhadap data Yi diberikan peringkat rank(Yi) dengan ketentuan data yang nilainya terkecil diberikan peringkat yang terkecil dan data yang nilainya terbesar diberikan peringkat yang terbesar. Pada data mengenai skor TOEFL, 450 merupakan nilai terkecil, sehingga untuk data 450 ini diberikan peringkat/rank 1. Skor TOEFL 460 diberikan peringkat 2. Skor TOEFL berikutnya yang lebih besar dari 450 adalah 465, namun ada dua data skor TOEFL yang nilainya 465, yaitu data ke-4 dan ke-10. Seharusnya data yang satu diberikan peringkat 3 dan yang satunya lagi peringkat 4. Tetapi karena mereka harus memiliki rank/peringkat yang sama, mereka diberikan peringkat .
Nilai-nilai Xi, Yi, rank(Xi), rank(Yi), di, dan di2 dapat dilihat pada tabel berikut.
Xi
Yi
rank(Xi)
rank(Yi)
di
di2
475
76
5
4
1
1,00
450
77
1
5
-4
16,00
510
78
10
6
4
16,00
465
75
3,5
3
0,5
0,25
500
80
9
8
1
1,00
512
85
11
11
0
0,00
480
79
6
7
-1
1,00
526
88
12
12
0
0,00
460
74
2
2
0
0,00
465
70
3,5
1
2,5
6,25
490
83
8
10
-2
4,00
485
82
7
9
-2
4,00
JUMLAH
49,50
Dari tabel tersebut diperoleh
Nilai rs = 0,827 ini jatuh di daerah kritis/daerah penolakan yang telah dinyatakan di atas [rs > 0,587]. Jadi, H0 ditolak dan kita simpulkan adanya hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah Bahasa Inggris.
Catatan:
Perhitungan di atas merupakan contoh penerapan. Teori mengenai koefisien korelasi Spearman dapat diperoleh pada tautan berikut: Teori_Korelasi_Spearman.
Sebagaimana telah dikemukakan, tujuan kedua tulisan ini adalah untuk mengingatkan bahaya kesalahan penafsiran korelasi ini. Kembali ke contoh kasus mengenai korelasi antara ukuran sepatu dengan IPK di atas. Ahli statistik tadi mengatakan bahwa ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara kedua variabel tersebut. Apakah hasil ini bisa dipercaya? Sama sekali tidak! Ini tidak masuk akal! Kalau begitu, bagaimana dengan hasil uji hipotesis mengenai korelasi yang telah ia kerjakan? Abaikan saja hasil tersebut, itu tidak ada artinya. Ini merupakan suatu contoh dari apa yang disebut dengan nonsense correlations atau spurious correlation. Mengenai “nonsense correlations”, Wonnacott mengatakan, “Correlations such as the above are often called ‘nonsense’ correlations. It would be more accurate to say that the observed mathematical correlation is real enough, but any naive inference of cause and effect is nonsense.” Hal serupa itu dinyatakan juga oleh Kendall dan Stuart, “A statistical relationship, however strong enough and however suggestive, can never establish causal connection: our ideas of causation must come from outside stastistics, ultimately from some theory or other.” Dengan pernyataan Wonnacott, Kendall dan Stuart tersebut, statistika ‘sendirian’ tidak dapat memberikan penjelasan yang masuk akal mengenai hubungan antara dua buah variabel. Penjelasan yang masuk akal antara kedua variabel tersebut hanya dapat ditemukan dari luar statistika, misalnya dari suatu teori atau dari ilmu yang berkenaan dengan kedua variabel yang diamati tersebut. Dalam hal ini, peran statistika bersifat confirmatory atau menyajikan bukti empiris mengenai keberadaan hubungan di antara kedua variabel. Sebagai contoh, salah sebuah teori di bidang ekonomi mengatakan bahwa ada hubungan antara konsumsi dengan pendapatan. Peran statistika di sini adalah untuk memeriksa apakah hasil sampling mendukung apa yang dinyatakan dalam teori tersebut.
Apa akibatnya pemahaman mengenai spurious correlations ini terhadap analisis korelasi secara umum? Akibatnya adalah kita tidak boleh menyimpulkan adanya suatu hubungan dari uji statistik mengenai korelasi ini tanpa didahului oleh suatu latar belakang teoretis. Kajian teoretis harus menjadi ‘titik berangkat’ dari setiap uji statistik mengenai korelasi. Tanpa penjelasan yang masuk akal menurut ilmu atau teori yang relevan, suatu hubungan yang disimpulkan dari hasil uji statistik (walaupun signifikan) tetap merupakan suatu tanda tanya.
Referensi:
Kendall, M. G. and A. Stuart, The Advanced Theory of Statistics, Charles Griffin Publishers, 1961.
Siegel, S. and N. J. Castellan, Jr., Nonparametric Statistics for the Behavioral Sciences, McGraw-Hill, 1988.
Wonnacott, R.J. and T. H. Wonnacott, Econometrics, John Wiley&Sons, Inc., 1970.
Berikut ini adalah tautan-tautan yang berhubungan dengan korelasi:
UKURAN SEPATU BERHUBUNGAN DENGAN PRESTASI AKADEMIK?
Saya yakin bahwa pembaca judul tulisan ini akan menyangkal tegas-tegas apabila ada seseorang ahli statistik mengatakan bahwa ada hubungan atau korelasi antara ukuran sepatu yang dipakai mahasiswa dengan prestasi akademik (yang ditunjukkan dengan Indeks Prestasi Kumulatif, IPK, misalnya). Barangkali ahli statistik itu, untuk meyakinkan Anda, ia menceritakan bahwa ia telah melakukan sampling terhadap 500 orang mahasiswa dan kemudian ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara ukuran sepatu yang dipakai mahasiswa dengan IPK mereka. Kepada ahli stastistik itu, Anda boleh saja menjawab, “Ya, ya, ya …” untuk menghargai hasil karyanya itu. Tetapi, saya katakan kepada Anda bahwa apabila Anda memercayai kesimpulan ahli statistik tersebut, berarti Anda sama-sama tidak waras dengan ahli tersebut.
Sebagian peneliti abal-abal (ironinya, sebagian di antara mereka adalah dosen) menggunakan statistika secara salah. Dengan kata lain, mereka menyalahgunakan statistika. Tulisan ini sebenarnya mempunyai dua tujuan, yaitu: 1) memperkenalkan Koefisien Korelasi Rank Spearman (Spearman’s Rank Correlation Coefficient) dan 2) mengingatkan bahaya kesalahan penafsiran korelasi ini.
Bilamana koefisien korelasi Spearman digunakan? Lain halnya dengan korelasi product-moment Pearson, korelasi Spearman dapat digunakan apabila kedua variabel memiliki tingkat data minimal ordinal. [Catatan: korelasi Pearson memerlukan banyak asumsi yang harus dipenuhi, salah satunya adalah: masing-masing variabel memiliki tingkat data minimal interval].
Berikut adalah suatu contoh bagaimana memeriksa ada atau tidaknya hubungan/korelasi antara dua buah variabel dengan tingkat data ordinal. Suatu hal yang dapat diterima akal sehat kita adalah skor TOEFL mahasiswa berkorelasi/ada hubungan dengan nilai akhir mata kuliah Bahasa Inggris mahasiswa tersebut. Namun, untuk dapat menyimpulkan demikian, perlu dukungan data empiris. Pada taraf nyata 0,05 ia ingin mengetahui apakah ada hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah bahasa Inggris. Untuk itu, ia mengambil 12 sampel secara acak dan hasil sampling tersebut diringkaskan sebagai berikut.
Dengan mengikuti langkah-langkah uji hipotesis, kita tuliskan hipotesis nol dan hipotesis tandingannya sebagai berikut:
H0: Tak ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris
H1: Ada hubungan antara skor TOEFL dengan nilai akhir Bahasa Inggris
Taraf nyata yang digunakan adalah α = 0,05. Dengan menggunakan Tabel Nilai Kritis rs (koefisien korelasi rank-order Spearman), diperoleh daerah kritis rs > 0,587 atau rs < -0,587.
Nilai uji statistik yang digunakan adalah dengan di = rank(Xi) – rank(Yi)
Misalkan data skor TOEFL adalah Xi dan data nilai akhir Bahasa Inggris adalah Yi. Terhadap data Xi diberikan ranking/peringkat rank(Xi) dan terhadap data Yi diberikan peringkat rank(Yi) dengan ketentuan data yang nilainya terkecil diberikan peringkat yang terkecil dan data yang nilainya terbesar diberikan peringkat yang terbesar. Pada data mengenai skor TOEFL, 450 merupakan nilai terkecil, sehingga untuk data 450 ini diberikan peringkat/rank 1. Skor TOEFL 460 diberikan peringkat 2. Skor TOEFL berikutnya yang lebih besar dari 450 adalah 465, namun ada dua data skor TOEFL yang nilainya 465, yaitu data ke-4 dan ke-10. Seharusnya data yang satu diberikan peringkat 3 dan yang satunya lagi peringkat 4. Tetapi karena mereka harus memiliki rank/peringkat yang sama, mereka diberikan peringkat .
Nilai-nilai Xi, Yi, rank(Xi), rank(Yi), di, dan di2 dapat dilihat pada tabel berikut.
Dari tabel tersebut diperoleh
Nilai rs = 0,827 ini jatuh di daerah kritis/daerah penolakan yang telah dinyatakan di atas [rs > 0,587]. Jadi, H0 ditolak dan kita simpulkan adanya hubungan signifikan antara skor TOEFL dengan nilai akhir mata kuliah Bahasa Inggris.
Catatan:
Perhitungan di atas merupakan contoh penerapan. Teori mengenai koefisien korelasi Spearman dapat diperoleh pada tautan berikut: Teori_Korelasi_Spearman.
Sebagaimana telah dikemukakan, tujuan kedua tulisan ini adalah untuk mengingatkan bahaya kesalahan penafsiran korelasi ini. Kembali ke contoh kasus mengenai korelasi antara ukuran sepatu dengan IPK di atas. Ahli statistik tadi mengatakan bahwa ia telah menghitung koefisien korelasi Spearman di antara kedua variabel tersebut dan hasil uji hipotesis menunjukkan bahwa terdapat hubungan yang signifikan antara kedua variabel tersebut. Apakah hasil ini bisa dipercaya? Sama sekali tidak! Ini tidak masuk akal! Kalau begitu, bagaimana dengan hasil uji hipotesis mengenai korelasi yang telah ia kerjakan? Abaikan saja hasil tersebut, itu tidak ada artinya. Ini merupakan suatu contoh dari apa yang disebut dengan nonsense correlations atau spurious correlation. Mengenai “nonsense correlations”, Wonnacott mengatakan, “Correlations such as the above are often called ‘nonsense’ correlations. It would be more accurate to say that the observed mathematical correlation is real enough, but any naive inference of cause and effect is nonsense.” Hal serupa itu dinyatakan juga oleh Kendall dan Stuart, “A statistical relationship, however strong enough and however suggestive, can never establish causal connection: our ideas of causation must come from outside stastistics, ultimately from some theory or other.” Dengan pernyataan Wonnacott, Kendall dan Stuart tersebut, statistika ‘sendirian’ tidak dapat memberikan penjelasan yang masuk akal mengenai hubungan antara dua buah variabel. Penjelasan yang masuk akal antara kedua variabel tersebut hanya dapat ditemukan dari luar statistika, misalnya dari suatu teori atau dari ilmu yang berkenaan dengan kedua variabel yang diamati tersebut. Dalam hal ini, peran statistika bersifat confirmatory atau menyajikan bukti empiris mengenai keberadaan hubungan di antara kedua variabel. Sebagai contoh, salah sebuah teori di bidang ekonomi mengatakan bahwa ada hubungan antara konsumsi dengan pendapatan. Peran statistika di sini adalah untuk memeriksa apakah hasil sampling mendukung apa yang dinyatakan dalam teori tersebut.
Apa akibatnya pemahaman mengenai spurious correlations ini terhadap analisis korelasi secara umum? Akibatnya adalah kita tidak boleh menyimpulkan adanya suatu hubungan dari uji statistik mengenai korelasi ini tanpa didahului oleh suatu latar belakang teoretis. Kajian teoretis harus menjadi ‘titik berangkat’ dari setiap uji statistik mengenai korelasi. Tanpa penjelasan yang masuk akal menurut ilmu atau teori yang relevan, suatu hubungan yang disimpulkan dari hasil uji statistik (walaupun signifikan) tetap merupakan suatu tanda tanya.
Referensi:
Berikut ini adalah tautan-tautan yang berhubungan dengan korelasi:
Materi audiovisual tentang korelasi peringkat Spearman dapat diperoleh di: (klik di sini)
LATIHAN SOAL KORELASI RANK SPEARMAN
Bagikan ini:
Most visitors also read :
DEKOMPOSISI NILAI SINGULAR (SINGULAR VALUE DECOMPOSITION)
MAXIMUM LIKELIHOOD ESTIMATOR
JARAK STATISTIKAL
SOAL DAN PEMBAHASAN ANALISIS KOMPONEN UTAMA