Kode sumberVideo

Command Palette

Search for a command to run...

Statistika

Koefisien Determinasi

Apa Itu Koefisien Determinasi?

Setelah kita menemukan garis regresi linear yang paling pas (best-fit) untuk data kita, pertanyaan selanjutnya adalah: seberapa baik garis tersebut benar-benar mewakili atau menjelaskan data kita?

Ukuran yang menjawab pertanyaan ini adalah Koefisien Determinasi, yang dilambangkan dengan r2r^2 (dibaca: r-kuadrat).

Sederhananya, r2r^2 memberitahu kita proporsi atau persentase dari variasi (naik-turunnya nilai) pada variabel dependen (Y) yang dapat dijelaskan oleh variasi pada variabel independen (X) menggunakan model regresi linear kita.

Koefisien Determinasi dari Diagram Pencar

Nilai r2r^2 sangat berkaitan dengan seberapa dekat titik-titik data mengumpul di sekitar garis regresi:

  1. r2r^2 Tinggi (mendekati 1 atau 100%)

    r2r^2 Tinggi
    Titik-titik data sangat dekat dengan garis regresi.

    Lihat bagaimana titik-titik data di atas sangat rapat dan dekat dengan garis regresi? Ini menunjukkan nilai r2r^2 yang tinggi (misalnya, mungkin sekitar 0.95 atau 95%). Artinya, sebagian besar variasi nilai Y dapat dijelaskan dengan baik oleh garis regresi (atau oleh variabel X).

  2. r2r^2 Rendah (mendekati 0 atau 0%)

    r2r^2 Rendah
    Titik-titik data tersebar jauh dari garis regresi.

    Bandingkan dengan diagram ini. Titik-titiknya lebih tersebar jauh dari garis regresi (garis residunya lebih panjang-panjang). Ini menandakan nilai r2r^2 yang rendah (misalnya, mungkin sekitar 0.40 atau 40%). Artinya, garis regresi ini kurang baik dalam menjelaskan variasi nilai Y; hanya sebagian kecil variasi Y yang bisa dijelaskan oleh X melalui model ini.

Menghitung Koefisien Determinasi

Cara paling mudah menghitung r2r^2 adalah dengan mengkuadratkan Koefisien Korelasi (rr) yang sudah kita pelajari sebelumnya.

r2=(r)2r^2 = (r)^2

Jadi, jika kamu sudah menghitung nilai rr, tinggal kuadratkan saja!

Karena nilai rr selalu antara -1 dan +1 (1r1-1 \le r \le 1), maka nilai r2r^2 akan selalu berada di antara 0 dan 1.

0r210 \le r^2 \le 1

Secara Matematis (menggunakan Sum of Squares):

Nilai r2r^2 juga bisa dihitung langsung menggunakan nilai-nilai Jumlah Kuadrat (Sum of Squares) yang digunakan untuk menghitung rr:

r2=(SSxy)2SSxxSSyyr^2 = \frac{(SS_{xy})^2}{SS_{xx} SS_{yy}}

Interpretasi sebagai Persentase

Nilai r2r^2 sering diubah menjadi persentase (dengan dikalikan 100) untuk interpretasi yang lebih mudah.

  • Jika r2=0.81r^2 = 0.81, artinya 81% dari total variasi variabel Y dapat dijelaskan oleh variasi variabel X melalui model regresi linear.
  • Sisa variasinya (1r21 - r^2 atau 19% dalam contoh ini) dijelaskan oleh faktor-faktor lain yang tidak ada dalam model (bisa jadi variabel lain, atau random error).

Semakin tinggi persentase r2r^2, semakin baik model regresi linear kita dalam menjelaskan hubungan antara X dan Y.