Cilok Mr. Omon dijual di banyak kampus di daerah Bandung. Banyaknya penjualan per hari berbeda-beda di antara kampus-kampus yang menjadi titik-titik penjualan cilok tersebut. Sementara itu, SPP di suatu kampus berbeda dengan SPP di kampus lainnya. Hampir bisa dipastikan mahasiswa yang berkuliah di kampus yang SPP-nya lebih mahal mempunyai daya beli yang lebih baik. Cukup masuk akal apabila (dalam kondisi ceteris paribus), penjualan Cilok Mr. Omon lebih banyak di kampus yang SPP-nya lebih mahal daripada di kampus yang SPP-nya lebih murah; apalagi harga Cilok Mr. Omon relatif lebih mahal dibandingkan dengan harga cilok pada umumnya, sehingga sebagian besar pembeli Cilok Mr. Omon adalah golongan ekonomi “menengah ke atas”. Apakah SPP yang dikenakan terhadap mahasiswa memengaruhi penjualan Cilok Mr. Omon? Untuk menguji hal ini, diambillah 20 buah sampel perguruan tinggi di Bandung yang berbeda-beda SPP-nya. Terhadap 20 sampel tersebut, diambil data mengenai pendapatan dari penjualan cilok secara-rata untuk setiap 50 mahasiswa setiap harinya. Hasil sampling itu diringkaskan pada tabel berikut.
No.
SPP
(juta Rupiah)
Pendapatan harian
(Ribu Rupiah)
1
2,90
122
2
3,00
120
3
3,20
119
4
3,20
130
5
3,27
128
6
3,50
157
7
3,55
160
8
3,75
162
9
3,80
159
10
3,90
160
11
3,92
165
12
4,25
180
13
4,30
185
14
4,33
190
15
4,40
175
16
4,50
190
17
4,80
203
18
5,00
199
19
5,10
210
20
5,30
246
Walaupun dalam contoh kasus ini banyak asumsi dan penyederhanaan masalah, contoh ini saya pergunakan untuk tujuan memperkenalkan salah satu cara dalam ilmu statistika, yang dinamakan metode regresi. Banyak sekali macam dari model regresi, namun sebagai perkenalan, tulisan saya kali ini akan membahas yang paling sederhana, yaitu simple linear regression (regresi linier sederhana).
Dalam model regresi linier sederhana, ada satu buah variabel bebas (= independent variable = variabel penjelas = explanatory variable) dan satu buah variabel terikat (= dependent variable). Variabel penjelas dalam konteks regresi adalah variabel yang diduga mempunyai pengaruh terhadap variabel terikat. (Pada contoh kasus ini, variabel penjelasnya adalah SPP dan variabel terikatnya adalah pendapatan dari penjualan cilok). Selanjutnya, dalam regresi linier sederhana diasumsikan bahwa terdapat suatu hubungan linier antara variabel penjelas dengan variabel terikatnya, yang secara lebih tepatnya dinyatakan dalam fungsi regresi populasi (FRP) sebagai berikut.
Yi = E(Y∣Xi) + ui
dengan E(Y∣Xi) = β1 + β2Xi
E(Y∣Xi) berarti rata-rata nilai Y apabila X = Xi ; Y = variabel terikat dan X = variabel penjelas. Sebagai contoh, E(Y∣2,5)=93 berarti apabila nilai X = 2,5 maka rata-rata nilai Y = 93. Seandainya 2,5 dan 93 ini merupakan SPP dan pendapatan cilok pada contoh kasus ini, E(Y∣2,5)=93 berarti: Apabila SPP suatu kampus adalah Rp 2,5 juta maka rata-rata pendapatan dari penjualan cilok untuk setiap 50 orang mahasiswa adalah Rp 93 ribu per harinya. Secara implisit dapat kita simpulkan bahwa untuk suatu nilai Xi yang sama, nilai Y-nya bisa beragam dan untuk nilai Xi tersebut rata-rata nilai Y-nya adalah E(Y∣Xi).
Apa makna Yi = E(Y∣Xi) + ui? Tadi dikatakan bahwa untuk suatu nilai Xi yang sama, nilai Y-nya bisa beragam. Secara matematis, (untuk nilai Xi yang sama) yang membuat Yi berbeda-beda adalah ui. Sebagai ilustrasi, misalnya ada tiga kampus yang SPP-nya sama yaitu sebesar Rp 2,5 juta/semester. Tetapi rata-rata pendapatan dari penjualan cilok untuk setiap 50 orang mahasiswa per harinya di ketiga kampus tersebut tidak sama, yaitu Rp 92.000, Rp 94.500, dan Rp 93.500. Seandainya E(Y∣2,5)=93, ketiga pendapatan yang berbeda tersebut dapat dituliskan sebagai:
Rp 92.000 = Rp 93.000 + (-Rp 1.000) [dalam hal ini ui = – Rp 1.000]
Rp 94.500 = Rp 93.000 + Rp 1.500 [dalam hal ini ui = Rp 1.500]
Rp 93.500 = Rp 93.000 + Rp 500 [dalam hal ini, ui = Rp 500]
ui pada persamaan tersebut dinamakan stochastic disturbanceatau stochastic error term. Secara praktis, ui ini dapat dianggap sebagai suatu surrogate atau proxy dari variabel-variabel lain yang dapat memengaruhi Y namun tidak disertakan ke dalam model regresi. Sebagai contoh, dalam kasus cilok ini, bisa saja ada faktor-faktor lain yang memengaruhi penjualan cilok yaitu misalnya kebersihan tempat berjualan cilok, penempatan penjual cilok di kantin kampus, dan lain-lain. Semuanya ini dan yang lainnya diwakili oleh ui. Pada persamaan Yi = E(Y∣Xi) + ui, E(Y∣Xi) dinamakan komponen deterministik atau komponen sistematis sedangkan ui dinamakan komponen acak/random atau komponen nonsistematis.
Dalam regresi linier sederhana, diasumsikan bahwa di antara E(Y∣Xi) dengan Xi terdapat hubungan linier E(Y∣Xi) = β1 + β2Xi. Lebih lengkapnya, asumsi-asumsi dalam regresi linier sederhana adalah:
Model regresi bersifat linier terhadap parameter-parameter: Yi = β1 + β2Xi + ui
Nilai-nilai X tetap dalam sampling Dengan kata lain, X nonstokastik.
Nilai rata-rata ui sama dengan nol; lebih tepatnya ditulis E(ui,Xi) = 0.
ui bersifat homoskedastis; secara matematis var(ui∣Xi) = σ2 (konstan) untuk setiap i; var(ui∣Xi) = σ2 berarti: jika X = Xi variansi variabel acak ui bernilai σ2 (suatu konstanta)
Tidak terdapat autokorelasi di antara disturbances: cov(ui,uj∣Xi,Xj) = 0 untuk setiap i≠j. cov di sini berarti kovarians antara ui dan uj.
Banyaknya pengamatan lebih besar dari banyaknya paramater yang akan ditaksir.
Nilai X beragam dan berhingga: var(X) > 0 dan var(X) < ∞
Model regresi dinyatakan secara tepat (correctly specified)
(Sumber: Gujarati)
Sekarang pertanyaannya adalah bagaimana dengan Yi = β1 + β2Xi + ui kita bisa mengetahui apakah Xi berpengaruh terhadap Yi? Apabila β2 = 0, berapapun nilai Xi tidak akan memengaruhi Yi sehingga keberagaman nilai Yi hanya karena ui yang bersifat acak. Jadi jika β2 = 0 maka Xi tidak memengaruhi Yi secara sistematis. Gagasannya adalah: apabila kita ingin menguji ada atau tidaknya pengaruh sistematis Xi terhadap Yi, cukup kita memeriksa apakah β2 = 0 atau β2 ≠ 0. Secara lebih tepat dikatakan bahwa untuk menguji ada atau tidaknya pengaruh ini, kita lakukan uji hipotesis dengan hipotesis nol dan hipotesis tandingan sebagai berikut:
H0: β2 = 0
H1: β2 ≠ 0
Secara teknis, untuk menguji hipotesis tersebut, dilakukanlah sampling yang menghasilkan sebagai taksiran bagi nilai β2. Setelah itu dilakukan penghitungan statistik t untuk menguji hipotesis itu. Ternyata nilai t pada contoh ini jatuh di daerah penolakan H0. Dari sini disimpulkan bahwa SPP yang dikenakan terhadap mahasiswa di kampus berpengaruh signifikan terdapat penjualan cilok di kampus tersebut. [Tentang bagaimana mendapatkan kesimpulan ini secara terinci dapat dilihat pada tautan yang disediakan di akhir tulisan ini.]
PERLU EKSTRA HATI-HATI DALAM MENAFSIRKAN KATA PENGARUH ATAU MEMENGARUHI DALAM KONTEKS MODEL REGRESI! Kata “pengaruh” atau “memengaruhi” memang lazim digunakan dalam konteks regresi, tetapi perlu digarisbawahi di sini adalah bahwa hubungan “pengaruh” atau “sebab-akibat” tidak dapat disimpulkan dari model regresi; gagasan mengenai sebab-akibat tersebut harus timbul dari luar statistika, yaitu dari suatu teori yang relevan. Seperti yang diungkapkan Kendall dan Stuart, “A statistical relationship, however strong enough and however suggestive, can never establish causal connection: our ideas of causation must come from outside stastistics, ultimately from some theory or other.” Dalam hal ini, model regresi hanya bersifat confirmatory atau menyajikan bukti empiris mengenai adanya pengaruh suatu variabel terhadap variabel lainnya. Jika dalam suatu model regresi ternyata disimpulkan adanya pengaruh yang signifikan antara variabel penjelas dengan variabel terikat, ini lebih tepat diartikan sebagai: variabel penjelas memiliki daya prediksi terhadap variabel terikat; dengan kata lain, variabel terikat dapat diprediksikan nilainya apabila nilai variabel penjelas diketahui. Dalam contoh kasus ini, sangat tidak masuk akal apabila dikatakan SPP memiliki pengaruh logis terhadap penjualan cilok. Yang lebih masuk akal untuk memengaruhi penjualan cilok Mr. Omon barangkali selera mahasiswa terhadap cilok dan daya beli mahasiswa tersebut. Tetapi, (barangkali karena lebih sukar untuk mengukur daya beli mahasiswa) digunakanlah SPP untuk memprediksi pendapatan dari penjualan cilok di kampus-kampus. Mengenai mengapa SPP memiliki daya prediksi terhadap pendapatan dari penjualan cilok, bisa jadi karena SPP tersebut ada hubungannya/korelasi terhadap daya beli mahasiswa. Kita tidak bisa meningkatkan penjualan cilok dengan cara membujuk manajemen kampus untuk menaikkan SPP mahasiswa. Tidak ada hubungan kausal antara SPP dengan pendapatan dari penjualan cilok!
Seperti telah disinggung sebelumnya, model regresi dapat digunakan untuk keperluan predicting atau forecasting. Untuk keperluan ini, perlu ditentukan terlebih dahulu apa yang dinamakan sample regression function (SRF), yaitu bersamaan berbentuk:
Dengan menggunakan hasil sampling pada contoh kasus ini, diperoleh nilai [pmath]hat{beta}_{2}=45,545[/pmath] dan [pmath]hat{beta}_{1}=-14,112[/pmath] sehingga diperoleh fungsi regresi sampel sebagai berikut:
[pmath]Y_{i}=hat{Y}_{i}+hat{u}_{i}[/pmath]
dengan [pmath]hat{Y}_{i}=hat{beta}_{1}+hat{beta}_{2}X_{i}[/pmath].
Dalam contoh kasus ini, [pmath]hat{Y}_{i}=-14,112+45,545X_{i}[/pmath]. Ini adalah persamaan yang digunakan untuk melakukan estimasi terhadap rata-rata pendapatan apabila diketahui SPP sebesar Xi. [Detail cara mendapatkan kedua estimasi terhadap β2 dan β1 persamaan ini dapat dilihat pada tautan yang disediakan di akhir tulisan ini.]
Bagaimana cara menggunakan fungsi regresi sampel tersebut untuk melakukan forecasting? Sebagai contoh, kita ingin mengetahui berapa rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta? Untuk menjawab ini, substitusikan X0 = 3,6 ke persamaan [pmath]hat{Y}_{i}[/pmath] di atas, diperoleh [pmath]hat{Y}_{0}=-14,112+45,545.3,6=149,85[/pmath] (dalam ribu Rupiah). Rp 149.850 merupakan taksiran titik (point estimate) terhadap rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta. Dari taksiran titik ini, kita dapat menentukan taksiran selang (interval estimate) bagi rata-rata pendapatan ini. Misalnya, selang kepercayaan 95% bagi rata-rata pendapatan ini adalah: 145,11 ≤ E(Y0∣3,6) ≤ 154,59. Jadi, kita 95% yakin bahwa rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta adalah antara Rp 145.110 hingga Rp 154.590. [Detail perhitungan dapat dilihat pada tautan di akhir tulisan ini.] Sekarang, berapakah pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta? Ini suatu contoh pertanyaan yang berkaitan dengan individual prediction. Dengan derajat kepercayaan 95%, diperoleh 130,831 ≤ Y0∣ X0 = 3,6 ≤ 168,870. Jadi, apabila SPP di suatu kampus Rp 3,6 juta, kita 95% yakin bahwa pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus tersebut adalah antara Rp 130.831 hingga Rp 168.870. [Detail perhitungan dapat dilihat pada tautan di akhir tulisan ini.]
Referensi:
Gujarati, D. N., Basic Econometrics, McGraw-Hill, 1995
Kendall, M.G. and A. Stuart, The Advanced Theory of Statistics, Charles Griffin Publishers, 1961
PENGARUH SPP TERHADAP PENJUALAN CILOK
Cilok Mr. Omon dijual di banyak kampus di daerah Bandung. Banyaknya penjualan per hari berbeda-beda di antara kampus-kampus yang menjadi titik-titik penjualan cilok tersebut. Sementara itu, SPP di suatu kampus berbeda dengan SPP di kampus lainnya. Hampir bisa dipastikan mahasiswa yang berkuliah di kampus yang SPP-nya lebih mahal mempunyai daya beli yang lebih baik. Cukup masuk akal apabila (dalam kondisi ceteris paribus), penjualan Cilok Mr. Omon lebih banyak di kampus yang SPP-nya lebih mahal daripada di kampus yang SPP-nya lebih murah; apalagi harga Cilok Mr. Omon relatif lebih mahal dibandingkan dengan harga cilok pada umumnya, sehingga sebagian besar pembeli Cilok Mr. Omon adalah golongan ekonomi “menengah ke atas”. Apakah SPP yang dikenakan terhadap mahasiswa memengaruhi penjualan Cilok Mr. Omon? Untuk menguji hal ini, diambillah 20 buah sampel perguruan tinggi di Bandung yang berbeda-beda SPP-nya. Terhadap 20 sampel tersebut, diambil data mengenai pendapatan dari penjualan cilok secara-rata untuk setiap 50 mahasiswa setiap harinya. Hasil sampling itu diringkaskan pada tabel berikut.
(juta Rupiah)
(Ribu Rupiah)
Walaupun dalam contoh kasus ini banyak asumsi dan penyederhanaan masalah, contoh ini saya pergunakan untuk tujuan memperkenalkan salah satu cara dalam ilmu statistika, yang dinamakan metode regresi. Banyak sekali macam dari model regresi, namun sebagai perkenalan, tulisan saya kali ini akan membahas yang paling sederhana, yaitu simple linear regression (regresi linier sederhana).
Dalam model regresi linier sederhana, ada satu buah variabel bebas (= independent variable = variabel penjelas = explanatory variable) dan satu buah variabel terikat (= dependent variable). Variabel penjelas dalam konteks regresi adalah variabel yang diduga mempunyai pengaruh terhadap variabel terikat. (Pada contoh kasus ini, variabel penjelasnya adalah SPP dan variabel terikatnya adalah pendapatan dari penjualan cilok). Selanjutnya, dalam regresi linier sederhana diasumsikan bahwa terdapat suatu hubungan linier antara variabel penjelas dengan variabel terikatnya, yang secara lebih tepatnya dinyatakan dalam fungsi regresi populasi (FRP) sebagai berikut.
Yi = E(Y∣Xi) + ui
dengan E(Y∣Xi) = β1 + β2Xi
E(Y∣Xi) berarti rata-rata nilai Y apabila X = Xi ; Y = variabel terikat dan X = variabel penjelas. Sebagai contoh, E(Y∣2,5)=93 berarti apabila nilai X = 2,5 maka rata-rata nilai Y = 93. Seandainya 2,5 dan 93 ini merupakan SPP dan pendapatan cilok pada contoh kasus ini, E(Y∣2,5)=93 berarti: Apabila SPP suatu kampus adalah Rp 2,5 juta maka rata-rata pendapatan dari penjualan cilok untuk setiap 50 orang mahasiswa adalah Rp 93 ribu per harinya. Secara implisit dapat kita simpulkan bahwa untuk suatu nilai Xi yang sama, nilai Y-nya bisa beragam dan untuk nilai Xi tersebut rata-rata nilai Y-nya adalah E(Y∣Xi).
Apa makna Yi = E(Y∣Xi) + ui? Tadi dikatakan bahwa untuk suatu nilai Xi yang sama, nilai Y-nya bisa beragam. Secara matematis, (untuk nilai Xi yang sama) yang membuat Yi berbeda-beda adalah ui. Sebagai ilustrasi, misalnya ada tiga kampus yang SPP-nya sama yaitu sebesar Rp 2,5 juta/semester. Tetapi rata-rata pendapatan dari penjualan cilok untuk setiap 50 orang mahasiswa per harinya di ketiga kampus tersebut tidak sama, yaitu Rp 92.000, Rp 94.500, dan Rp 93.500. Seandainya E(Y∣2,5)=93, ketiga pendapatan yang berbeda tersebut dapat dituliskan sebagai:
Rp 92.000 = Rp 93.000 + (-Rp 1.000) [dalam hal ini ui = – Rp 1.000]
Rp 94.500 = Rp 93.000 + Rp 1.500 [dalam hal ini ui = Rp 1.500]
Rp 93.500 = Rp 93.000 + Rp 500 [dalam hal ini, ui = Rp 500]
ui pada persamaan tersebut dinamakan stochastic disturbance atau stochastic error term. Secara praktis, ui ini dapat dianggap sebagai suatu surrogate atau proxy dari variabel-variabel lain yang dapat memengaruhi Y namun tidak disertakan ke dalam model regresi. Sebagai contoh, dalam kasus cilok ini, bisa saja ada faktor-faktor lain yang memengaruhi penjualan cilok yaitu misalnya kebersihan tempat berjualan cilok, penempatan penjual cilok di kantin kampus, dan lain-lain. Semuanya ini dan yang lainnya diwakili oleh ui. Pada persamaan Yi = E(Y∣Xi) + ui, E(Y∣Xi) dinamakan komponen deterministik atau komponen sistematis sedangkan ui dinamakan komponen acak/random atau komponen nonsistematis.
Dalam regresi linier sederhana, diasumsikan bahwa di antara E(Y∣Xi) dengan Xi terdapat hubungan linier E(Y∣Xi) = β1 + β2Xi. Lebih lengkapnya, asumsi-asumsi dalam regresi linier sederhana adalah:
(Sumber: Gujarati)
Sekarang pertanyaannya adalah bagaimana dengan Yi = β1 + β2Xi + ui kita bisa mengetahui apakah Xi berpengaruh terhadap Yi? Apabila β2 = 0, berapapun nilai Xi tidak akan memengaruhi Yi sehingga keberagaman nilai Yi hanya karena ui yang bersifat acak. Jadi jika β2 = 0 maka Xi tidak memengaruhi Yi secara sistematis. Gagasannya adalah: apabila kita ingin menguji ada atau tidaknya pengaruh sistematis Xi terhadap Yi, cukup kita memeriksa apakah β2 = 0 atau β2 ≠ 0. Secara lebih tepat dikatakan bahwa untuk menguji ada atau tidaknya pengaruh ini, kita lakukan uji hipotesis dengan hipotesis nol dan hipotesis tandingan sebagai berikut:
H0: β2 = 0
H1: β2 ≠ 0
Secara teknis, untuk menguji hipotesis tersebut, dilakukanlah sampling yang menghasilkan sebagai taksiran bagi nilai β2. Setelah itu dilakukan penghitungan statistik t untuk menguji hipotesis itu. Ternyata nilai t pada contoh ini jatuh di daerah penolakan H0. Dari sini disimpulkan bahwa SPP yang dikenakan terhadap mahasiswa di kampus berpengaruh signifikan terdapat penjualan cilok di kampus tersebut. [Tentang bagaimana mendapatkan kesimpulan ini secara terinci dapat dilihat pada tautan yang disediakan di akhir tulisan ini.]
PERLU EKSTRA HATI-HATI DALAM MENAFSIRKAN KATA PENGARUH ATAU MEMENGARUHI DALAM KONTEKS MODEL REGRESI! Kata “pengaruh” atau “memengaruhi” memang lazim digunakan dalam konteks regresi, tetapi perlu digarisbawahi di sini adalah bahwa hubungan “pengaruh” atau “sebab-akibat” tidak dapat disimpulkan dari model regresi; gagasan mengenai sebab-akibat tersebut harus timbul dari luar statistika, yaitu dari suatu teori yang relevan. Seperti yang diungkapkan Kendall dan Stuart, “A statistical relationship, however strong enough and however suggestive, can never establish causal connection: our ideas of causation must come from outside stastistics, ultimately from some theory or other.” Dalam hal ini, model regresi hanya bersifat confirmatory atau menyajikan bukti empiris mengenai adanya pengaruh suatu variabel terhadap variabel lainnya. Jika dalam suatu model regresi ternyata disimpulkan adanya pengaruh yang signifikan antara variabel penjelas dengan variabel terikat, ini lebih tepat diartikan sebagai: variabel penjelas memiliki daya prediksi terhadap variabel terikat; dengan kata lain, variabel terikat dapat diprediksikan nilainya apabila nilai variabel penjelas diketahui. Dalam contoh kasus ini, sangat tidak masuk akal apabila dikatakan SPP memiliki pengaruh logis terhadap penjualan cilok. Yang lebih masuk akal untuk memengaruhi penjualan cilok Mr. Omon barangkali selera mahasiswa terhadap cilok dan daya beli mahasiswa tersebut. Tetapi, (barangkali karena lebih sukar untuk mengukur daya beli mahasiswa) digunakanlah SPP untuk memprediksi pendapatan dari penjualan cilok di kampus-kampus. Mengenai mengapa SPP memiliki daya prediksi terhadap pendapatan dari penjualan cilok, bisa jadi karena SPP tersebut ada hubungannya/korelasi terhadap daya beli mahasiswa. Kita tidak bisa meningkatkan penjualan cilok dengan cara membujuk manajemen kampus untuk menaikkan SPP mahasiswa. Tidak ada hubungan kausal antara SPP dengan pendapatan dari penjualan cilok!
Seperti telah disinggung sebelumnya, model regresi dapat digunakan untuk keperluan predicting atau forecasting. Untuk keperluan ini, perlu ditentukan terlebih dahulu apa yang dinamakan sample regression function (SRF), yaitu bersamaan berbentuk:
[pmath]Y_{i}= hat{beta}_{1}+ hat{beta}_{2}X_{i}+hat{u}_{i}[/pmath]
Dengan menggunakan hasil sampling pada contoh kasus ini, diperoleh nilai [pmath]hat{beta}_{2}=45,545[/pmath] dan [pmath]hat{beta}_{1}=-14,112[/pmath] sehingga diperoleh fungsi regresi sampel sebagai berikut:
[pmath]Y_{i}=hat{Y}_{i}+hat{u}_{i}[/pmath]
dengan [pmath]hat{Y}_{i}=hat{beta}_{1}+hat{beta}_{2}X_{i}[/pmath].
Dalam contoh kasus ini, [pmath]hat{Y}_{i}=-14,112+45,545X_{i}[/pmath]. Ini adalah persamaan yang digunakan untuk melakukan estimasi terhadap rata-rata pendapatan apabila diketahui SPP sebesar Xi. [Detail cara mendapatkan kedua estimasi terhadap β2 dan β1 persamaan ini dapat dilihat pada tautan yang disediakan di akhir tulisan ini.]
Bagaimana cara menggunakan fungsi regresi sampel tersebut untuk melakukan forecasting? Sebagai contoh, kita ingin mengetahui berapa rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta? Untuk menjawab ini, substitusikan X0 = 3,6 ke persamaan [pmath]hat{Y}_{i}[/pmath] di atas, diperoleh [pmath]hat{Y}_{0}=-14,112+45,545.3,6=149,85[/pmath] (dalam ribu Rupiah). Rp 149.850 merupakan taksiran titik (point estimate) terhadap rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta. Dari taksiran titik ini, kita dapat menentukan taksiran selang (interval estimate) bagi rata-rata pendapatan ini. Misalnya, selang kepercayaan 95% bagi rata-rata pendapatan ini adalah: 145,11 ≤ E(Y0∣3,6) ≤ 154,59. Jadi, kita 95% yakin bahwa rata-rata pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta adalah antara Rp 145.110 hingga Rp 154.590. [Detail perhitungan dapat dilihat pada tautan di akhir tulisan ini.] Sekarang, berapakah pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus yang SPP-nya Rp 3,6 juta? Ini suatu contoh pertanyaan yang berkaitan dengan individual prediction. Dengan derajat kepercayaan 95%, diperoleh 130,831 ≤ Y0∣ X0 = 3,6 ≤ 168,870. Jadi, apabila SPP di suatu kampus Rp 3,6 juta, kita 95% yakin bahwa pendapatan dari penjualan cilok terhadap tiap 50 orang mahasiswa di kampus tersebut adalah antara Rp 130.831 hingga Rp 168.870. [Detail perhitungan dapat dilihat pada tautan di akhir tulisan ini.]
Referensi:
Tautan-tautan yang berkenaan dengan tulisan ini:
Materi audiovisual mengenai regresi linier sederhana dapat diperoleh di: (klik di sini)
Bagikan ini:
Most visitors also read :
DEKOMPOSISI NILAI SINGULAR (SINGULAR VALUE DECOMPOSITION)
MAXIMUM LIKELIHOOD ESTIMATOR
JARAK STATISTIKAL
SOAL DAN PEMBAHASAN ANALISIS KOMPONEN UTAMA