บทนำ
- การถดถอยเป็นกระบวนการทำนายค่าต่อเนื่องโดยใช้ตัวแปรที่กำหนด
- โดยทั่วไปตัวแปรจะมี 2 ประเภท:- ตัวแปรอิสระและตัวแปรตาม
- ตัวแปรตามคือตัวแปรที่เราพยายามทำนาย หรือเรียกอีกอย่างว่าอาร์เรย์เป้าหมาย (y)
- ตัวแปรอิสระคือตัวแปรที่เก็บค่าของคุณลักษณะของข้อมูล แสดงเป็นคุณสมบัติ (X)
- โดยพื้นฐานแล้ว แบบจำลองการถดถอยเชื่อมโยง y กับ x
ประเภทของแบบจำลองการถดถอย
- Machine Learning มีโมเดลการถดถอยอยู่ 2 ประเภทหลักๆ
การถดถอยอย่างง่าย:-
- มันถูกใช้เมื่อมีการใช้ตัวแปรอิสระตัวหนึ่งเพื่อทำนายตัวแปรตามตัวหนึ่ง
- ตัวอย่าง:- อัลกอริทึมการถดถอยเชิงเส้นอย่างง่าย
การถดถอยพหุคูณ:-
- มันถูกใช้เมื่อมีการใช้ตัวแปรอิสระหลายตัว (มากกว่า 1) ตัวเพื่อทำนายตัวแปรตามตัวเดียว
- ตัวอย่าง:- อัลกอริธึมการถดถอยเชิงเส้นหลายตัว
อัลกอริทึมการถดถอยเชิงเส้นอย่างง่าย
- การถดถอยเชิงเส้นคือการประมาณแบบจำลองเชิงเส้นที่ใช้อธิบายความสัมพันธ์ระหว่างตัวแปร 2 ตัวขึ้นไป
- ตามที่กล่าวไว้ข้างต้น เมื่อมีการใช้ตัวแปรเพียงตัวเดียวในการทำนายตัวแปรอีกตัวหนึ่งโดยใช้แบบจำลองเชิงเส้น แบบจำลองการถดถอยดังกล่าวเรียกว่าการถดถอยเชิงเส้นอย่างง่าย
- เราต้องคำนวณความชันและค่าตัดกันเพื่อค้นหาเส้นที่เหมาะสมที่สุดเพื่อ "พอดี" ข้อมูล เนื่องจากการถดถอยเชิงเส้นจะประมาณค่าสัมประสิทธิ์ของเส้น
- เราต้องปรับพารามิเตอร์ (ความชันและจุดตัด) เพื่อจัดแนวเส้นที่พอดีที่สุดในโมเดล
- ข้อผิดพลาดตกค้าง:- ระยะห่างจากจุดข้อมูลถึงเส้นการถดถอยที่ติดตั้งไว้
- ค่าเฉลี่ยของข้อผิดพลาดที่เหลือทั้งหมดแสดงให้เราเห็นว่าจุดข้อมูลได้รับการติดตั้งได้ไม่ดีเพียงใด ในทางคณิตศาสตร์สามารถแสดงได้ด้วยสมการของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE)
- ดังนั้น วัตถุประสงค์คือการหาเส้นตรงที่ MSE น้อยที่สุด และย่อให้เล็กสุด เราจำเป็นต้องค้นหาพารามิเตอร์ที่ดีที่สุด (ค่าความชันและจุดตัดแกนที่ดีที่สุด)
ในการค้นหาพารามิเตอร์ที่ดีที่สุดหรือย่อสมการ MSE ให้เหลือน้อยที่สุด เราใช้วิธีกำลังสองน้อยที่สุดแบบธรรมดา หัวข้อนี้จะกล่าวถึงในบล็อกถัดไป