Regresi linier sederhana merupakan pendekatan linier yang memodelkan hubungan antara suatu variabel terikat dan satu variabel bebas.

Rumus regresi linier sederhana adalah:

y = β0​+β1​x

Dimana:
y adalah variabel terikat.

x adalah variabel independen.

β0​ adalah titik potong y.

β1​ adalah kemiringan garis.

Tujuannya adalah menemukan garis paling sesuai yang meminimalkan jumlah selisih kuadrat (sisa) antara nilai yang diamati (nilai aktual) dan nilai yang diprediksi oleh model.

Untuk tujuan demonstrasi, mari kita:
1. Hasilkan beberapa data sintetik untuk x (variabel bebas) dan y (variabel terikat) dengan tambahan noise.
2. Hitung koefisien β0 dan β1 untuk garis regresi.
3. Plot titik data dan garis regresi.

Mari kita mulai dengan membuat data sintetis dan memvisualisasikannya.

Inilah data sintetis yang kami hasilkan. Seperti yang Anda lihat, ada tren linier dalam data, tetapi juga menimbulkan gangguan karena residu acak yang kami tambahkan.

Selanjutnya, kita akan menghitung koefisien β0 dan β1 untuk garis regresi menggunakan rumus berikut:

1. β0​ = ∑(xi​−xˉ)2 / ∑(xi​−xˉ)(yi​−yˉ​)​
2. β1 = yˉ​−β1​xˉ

Dimana:
- xˉ adalah mean dari variabel independen x.
- yˉ​ adalah mean dari variabel dependen y.

Mari kita hitung β0 dan β1 lalu plot garis regresi beserta titik datanya.

Inilah hasilnya:

Garis merah mewakili garis regresi dengan persamaan:

y = 2.00 + 0.32x

Titik biru adalah titik data sintetik yang kami hasilkan.

Koefisien yang kami hitung untuk garis regresi adalah:
- β0 (perpotongan y): 2,00
- β1 (kemiringan): 0,32

Artinya, setiap kenaikan satu unit pada variabel independen x, variabel dependen y meningkat sekitar 0,32 unit, sehingga faktor lainnya tetap konstan.