Kode sumberVideo

Command Palette

Search for a command to run...

Statistika

Metode Kuadrat Terkecil

Apa Itu Metode Kuadrat Terkecil?

Bayangkan kita punya sekumpulan data hasil pengamatan atau eksperimen yang terdiri dari pasangan nilai (x, y). Jika kita plot titik-titik data ini di diagram pencar, kadang kita melihat adanya pola atau tren yang menyerupai garis lurus.

Pertanyaannya, dari sekian banyak garis lurus yang bisa kita gambar melewati titik-titik itu, mana garis lurus terbaik yang paling mewakili keseluruhan data?

Metode Kuadrat Terkecil (Least Squares Method) adalah sebuah prosedur matematis untuk menemukan satu garis lurus unik yang dianggap paling "pas" atau "cocok" (best fit) dengan kumpulan titik data tersebut.

Meminimalkan Kesalahan Kuadrat

Ide utamanya adalah meminimalkan kesalahan atau residu dari setiap titik data ke garis prediksi. Lalu bagaimana cara menentukan garis "yang paling pas"?

  1. Garis Prediksi: Kita coba gambar sebuah garis lurus (y^=a+bx\hat{y} = a + bx) di antara titik-titik data.

  2. Kesalahan (Residual): Untuk setiap titik data asli (yiy_i), akan ada jarak vertikal ke garis prediksi (y^i\hat{y}_i). Jarak ini disebut kesalahan atau residu:

    ei=yiy^ie_i = y_i - \hat{y}_i
  3. Minimalkan Jumlah Kuadrat Kesalahan: Metode Kuadrat Terkecil bekerja dengan mencari garis lurus yang membuat jumlah dari kuadrat semua kesalahan (ei2\sum e_i^2) menjadi sekecil mungkin. Inilah mengapa disebut "Kuadrat Terkecil".

Kenapa dikuadratkan?

  • Mengkuadratkan kesalahan membuat semua nilai menjadi positif, sehingga kesalahan di atas garis dan di bawah garis tidak saling meniadakan.
  • Kesalahan yang lebih besar akan memberikan kontribusi yang jauh lebih besar pada jumlah total (karena dikuadratkan), sehingga metode ini sangat berusaha untuk meminimalkan kesalahan-kesalahan besar.

Contoh Visualisasi

Misalnya, sebuah perusahaan ingin melihat hubungan antara biaya iklan yang mereka keluarkan (dalam jutaan rupiah) dengan jumlah produk yang terjual (dalam ribuan unit). Data yang mereka kumpulkan adalah sebagai berikut:

Garis Hasil Metode Kuadrat Terkecil (Iklan vs Penjualan)
Garis menunjukkan tren hubungan linear antara biaya iklan dan penjualan.

Garis lurus yang tergambar pada diagram di atas adalah garis best-fit yang ditemukan menggunakan Metode Kuadrat Terkecil untuk data biaya iklan dan penjualan ini. Garis ini mewakili tren linear umum yang paling mendekati semua titik data, dan garis putus-putus menunjukkan residu yang sedang diminimalkan.

Dasar Matematis

Secara matematis, kita mencari garis dengan persamaan:

y^=a+bx\hat{y} = a + bx

Di mana nilai aa (intercept) dan bb (slope) dipilih sedemikian rupa sehingga nilai dari:

ei2=(yiy^i)2=(yi(a+bxi))2\sum e_i^2 = \sum (y_i - \hat{y}_i)^2 = \sum (y_i - (a + bx_i))^2

menjadi minimum.

Melalui proses kalkulus (yang tidak perlu kita turunkan di sini), ditemukan rumus untuk mendapatkan nilai aa dan bb yang memenuhi syarat tersebut:

b=n(xy)(x)(y)n(x2)(x)2b = \frac{n(\sum xy) - (\sum x)(\sum y)}{n(\sum x^2) - (\sum x)^2}
a=yˉbxˉa = \bar{y} - b\bar{x}

Keterangan rumus:

  • nn = Jumlah pasangan data.
  • x\sum x, y\sum y = Jumlah semua nilai x dan y.
  • xy\sum xy = Jumlah hasil kali setiap pasangan x dan y.
  • x2\sum x^2 = Jumlah kuadrat setiap nilai x.
  • xˉ\bar{x} = Rata-rata x (xn\frac{\sum x}{n} ).
  • yˉ\bar{y} = Rata-rata y (yn\frac{\sum y}{n} ).

Jadi, Metode Kuadrat Terkecil memberikan cara yang sistematis dan objektif untuk menemukan garis lurus terbaik yang mewakili tren linear dalam data berdasarkan prinsip meminimalkan jumlah kuadrat kesalahan.