Regresi Binary Logit

Sebagai kelanjutan dari tulisan mengenai model pilihan kualitatif, pada bagian ini, akan dijelaskan contoh model binary logit dan estimasinya dengan menggunakan program SPSS. Sebagai contoh ilustratif, misalnya ingin diprediksi pengaruh umur, jenis kelamin dan pendapatan terhadap pembelian mobil. Berdasarkan hasil survai terhadap 48 responden, didapatkan datanya sebagai berikut:

Dimana:
Y = 1, jika konsumen membeli mobil, = 0 jika konsumen tidak membeli mobil
X1 = umur responden dalam tahun
X2 = 1, jika konsumen berjenis kelamin wanita, = 0 jika konsumen berjenis kelamin pria
X3 = 0, jika konsumen berpendapatan rendah, = 1 jika konsumen berpendapatan sedang
= 2 jika konsumen berpendapatan tinggi
Tahapan-tahapan estimasi dalam SPSS sebagai berikut:
1. Setelah data diinput dalam lembar kerja SPSS kemudian klik Analyze > Regression > Binary Logistic , selanjutnya akan muncul tampilan berikut:

2. Masukkan Y sebagai variable dependent dengan cara klik Y di kotak kiri, kemudian klik tanda panah disamping kotak Dependent. Masukkan X1, X2 dan X3 kedalam kotak Covariates, dengan cara klik masing-masing variable, kemudian klik tanda panah disamping kotak covariates.
3. Selanjutnya, karena variabel X3 merupakan peubah kategori (ordinal) dengan lebih dari dua kategori (yaitu 0=pendapatan rendah, 1=pendapatan sedang dan 2=pendapatan tinggi) maka diubah terlebih dahulu ke dalam 2 variabel dummy, untuk mengembangkan model yang logis dan mudah diinterpretasi, sebagai berikut: (ini sama dengan prosedur regresi dengan variabel bebas dummy sebelumnya)
X3_1 = 1, jika konsumen berpendapatan menengah
0, jika selainnya
X3_2 = 1, jika konsumen berpendapatan tinggi
0, jika selainnya
Dalam program SPSS untuk mengkonversi ini dengan cara klik Categorical dari tampilan diatas, maka akan muncul tampilan berikut:

Selanjutnya, klik X3, klik tanda panah disamping Categorical Covariates. Pilih Reference Category dengan First, kemudian klik Change dan Continue. Selanjutnya klik OK.

4. Akan keluar output SPSS untuk regresi logit sebagai berikut (disini hanya ditampilkan bagian-bagian terpenting saja yang akan dibahas):


Printout di tabel pertama diatas menjelaskan transformasi variabel X3 dengan kategori 0,1 dan 2 menjadi dua variabel dummy yaitu X3_1 dan X3_2. Seperti yang terlihat dari tabel tersebut, variabel X3_1 bernilai 1 untuk kategori 1 (pendapatan menengah) dan 0 untuk kategori lainnya. Variabel X3_2 bernilai 1 untuk kategori 2 (pendapatan tinggi) dan 0 untuk kategori lainnya. Dengan demikian, kategori 0 (pendapatan rendah) akan bernilai 0 baik pada variabel X3_1 dan X3_2.
Printout di tabel kedua diatas merupakan nilai Khi-kuadrat (χ2) dari model regresi. Sebagaimana halnya model regresi linear dengan metode OLS, kita juga dapat melakukan pengujian arti penting model secara keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit menggunakan uji G. Statistik G ini menyebar menurut sebaran Khi-kuadrat (χ2). Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai χ2 tabel pada α tertentu dan derajat bebas k-1. (kriteria pengujian dan cara pengujian persis sama dengan uji F pada metode regresi OLS). Tetapi, kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan oleh sofware-software statistik, termasuk SPSS.
Dari output SPSS, didapatkan nilai χ2 sebesar 18,131 dengan p-value 0,001. Karena nilai ini jauh dibawah 10 % (jika menggunakan pengujian dengan α=10%), atau jauh dibawah 5% (jika menggunakan pengujian dengan α=5%), maka dapat disimpulkan bahwa model regresi logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan konsumen dalam membeli mobil.
Printout di tabel ketiga memberikan estimasi koefisien model dan pengujian hipotesis parsial dari koefisien model. Dalam pelaporannya, model regresi logistiknya dapat dituliskan sebagai berikut:

Dari output SPSS diatas menjadi sebagai berikut:

Model ini merupakan model peluang membeli mobil [(P(xi)] yang dipengaruhi oleh faktor-faktor umur, jenis kelamin dan pendapatan. Model tersebut adalah bersifat non-linear dalam parameter. Selanjutnya, untuk menjadikan model tersebut linear, dilakukan transformasi dengan logaritma natural, (transformasi ini yang menjadi hal penting dalam regresi logistik dan dikenal dengan istilah ”logit transformation”), sehingga menjadi (pembahasan lebih rinci, silakan dibaca buku-buku ekonometrik):


1-P(xi) adalah peluang tidak membeli mobil, sebagai kebalikan dari P(xi) sebagai peluang membeli mobil. Oleh karenanya, ln [P(xi)/1-P(xi)] secara sederhana merupakan log dari perbandingan antara peluang membeli mobil dengan peluang tidak membeli mobil. Oleh karenanya juga, koefisien dalam persamaan ini menunjukkan pengaruh dari umur, jenis kelamin dan pendapatan terhadap peluang relative individu membeli mobil yang dibandingkan dengan peluang tidak membeli mobil.
Selanjutnya, untuk menguji faktor mana yang berpengaruh nyata terhadap keputusan pilihan membeli mobil tersebut, dapat menggunakan uji signifikansi dari parameter koefisien secara parsial dengan statistik uji Wald, yang serupa dengan statistik uji t atau uji Z dalam regresi linear biasa, yaitu dengan membagi koefisien terhadap standar error masing-masing koefisien.
Dari output SPSS ditampilkan nilai Wald dan p-valuenya. Berdasarkan nilai p-value (dan menggunakan kriteria pengujian α=10%), dapat dilihat seluruh variabel (kecuali X3_1), berpengaruh nyata (memiliki p-value dibawah 10%) terhadap keputusan membeli mobil.
Lalu, bagaimana interpretasi koefisien regresi logit dari persamaan di atas ? Dalam model regresi linear, koefisien βi menunjukkan perubahan nilai variabel dependent sebagai akibat perubahan satu satuan variabel independent. Hal yang sama sebenarnya juga berlaku dalam model regresi logit, tetapi secara matematis sulit diinterpretasikan.
Koefisien dalam model logit menunjukkan perubahan dalam logit sebagai akibat perubahan satu satuan variabel independent. Interpretasi yang tepat untuk koefisien ini tentunya tergantung pada kemampuan menempatkan arti dari perbedaan antara dua logit. Oleh karenanya, dalam model logit, dikembangkan pengukuran yang dikenal dengan nama odds ratio (ψ). Odds ratio untuk masing-masing variabel ditampilkan oleh SPSS sebagaimana yang terlihat tabel diatas (kolom Exp(B)).
Odds ratio dapat dirumuskan: ψ = eβ, dimana e adalah bilangan 2,71828 dan β adalah koefisien masing-masing variabel. Sebagai contoh, odds ratio untuk variabel X2 = e-0.1602 = 0,201 (lihat output SPSS).
Dalam kasus variabel X2 (jenis kelamin dimana 1 = wanita dan 0 = pria), dengan odds ratio sebesar 0,201 dapat diartikan bahwa peluang wanita untuk membeli mobil adalah 0,201 kali dibandingkan pria, jika umur dan pendapatan mereka sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil dibandingkan pria.
Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan bahwa konsumen yang berumur lebih tua satu tahun peluang membeli mobilnya adalah 1,153 kali dibandingkan konsumen umur yang lebih muda (satu tahun), jika pendapatan dan jenis kelamin mereka sama. Artinya orang yang lebih tua memiliki peluang yang lebih tinggi dalam membeli mobil.
Dalam konteks umur ini (yang merupakan variabel dengan skala ratio), hati-hati menginterpretasikan nilai perbedaan peluangnya. Jika perbedaan umur lebih dari 1 tahun, misalnya 10 tahun, maka odds rationya akan menjadi 4,14, yang diperoleh dari perhitungan sbb: ψ=e(10 x 0.142) . Artinya peluang membeli mobil konsumen yang berumur lebih tua 10 tahun adalah 4,14 kali dibandingkan konsumen yang lebih muda (10 tahun) darinya.
Selanjutnya, dalam konteks variabel pendapatan, terlihat bahwa X31 tidak berpengaruh signifikan. Artinya, peluang membeli mobil antara konsumen pendapatan sedang dan pendapatan rendah adalah sama saja. Sebaliknya, untuk X32, dapat diinterpretasikan bahwa peluang membeli mobil konsumen pendapatan tinggi adalah 6,45 kali dibandingkan pendapatan rendah, jika umur dan jenis kelaminnya sama.

One thought on “Regresi Binary Logit

  1. halo, mau tanya soal regresi logistik, tau cara menggunakannya secara manual tanpa tools statistik? tahapannya seperti apa? sy ada tugas membandingkan hasil reg log dari SPSS, Oracle, kemudian dengan manual ka. Mohon petunjuknya ya. Saya tunggu kiriman emailnya😀

    Thank’s

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s