บทนำ

  • การถดถอยเป็นกระบวนการทำนายค่าต่อเนื่องโดยใช้ตัวแปรที่กำหนด
  • โดยทั่วไปตัวแปรจะมี 2 ประเภท:- ตัวแปรอิสระและตัวแปรตาม
  • ตัวแปรตามคือตัวแปรที่เราพยายามทำนาย หรือเรียกอีกอย่างว่าอาร์เรย์เป้าหมาย (y)
  • ตัวแปรอิสระคือตัวแปรที่เก็บค่าของคุณลักษณะของข้อมูล แสดงเป็นคุณสมบัติ (X)
  • โดยพื้นฐานแล้ว แบบจำลองการถดถอยเชื่อมโยง y กับ x

ประเภทของแบบจำลองการถดถอย

  • Machine Learning มีโมเดลการถดถอยอยู่ 2 ประเภทหลักๆ

การถดถอยอย่างง่าย:-

  • มันถูกใช้เมื่อมีการใช้ตัวแปรอิสระตัวหนึ่งเพื่อทำนายตัวแปรตามตัวหนึ่ง
  • ตัวอย่าง:- อัลกอริทึมการถดถอยเชิงเส้นอย่างง่าย

การถดถอยพหุคูณ:-

  • มันถูกใช้เมื่อมีการใช้ตัวแปรอิสระหลายตัว (มากกว่า 1) ตัวเพื่อทำนายตัวแปรตามตัวเดียว
  • ตัวอย่าง:- อัลกอริธึมการถดถอยเชิงเส้นหลายตัว

อัลกอริทึมการถดถอยเชิงเส้นอย่างง่าย

  • การถดถอยเชิงเส้นคือการประมาณแบบจำลองเชิงเส้นที่ใช้อธิบายความสัมพันธ์ระหว่างตัวแปร 2 ตัวขึ้นไป
  • ตามที่กล่าวไว้ข้างต้น เมื่อมีการใช้ตัวแปรเพียงตัวเดียวในการทำนายตัวแปรอีกตัวหนึ่งโดยใช้แบบจำลองเชิงเส้น แบบจำลองการถดถอยดังกล่าวเรียกว่าการถดถอยเชิงเส้นอย่างง่าย

  • เราต้องคำนวณความชันและค่าตัดกันเพื่อค้นหาเส้นที่เหมาะสมที่สุดเพื่อ "พอดี" ข้อมูล เนื่องจากการถดถอยเชิงเส้นจะประมาณค่าสัมประสิทธิ์ของเส้น
  • เราต้องปรับพารามิเตอร์ (ความชันและจุดตัด) เพื่อจัดแนวเส้นที่พอดีที่สุดในโมเดล
  • ข้อผิดพลาดตกค้าง:- ระยะห่างจากจุดข้อมูลถึงเส้นการถดถอยที่ติดตั้งไว้

  • ค่าเฉลี่ยของข้อผิดพลาดที่เหลือทั้งหมดแสดงให้เราเห็นว่าจุดข้อมูลได้รับการติดตั้งได้ไม่ดีเพียงใด ในทางคณิตศาสตร์สามารถแสดงได้ด้วยสมการของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (MSE)

  • ดังนั้น วัตถุประสงค์คือการหาเส้นตรงที่ MSE น้อยที่สุด และย่อให้เล็กสุด เราจำเป็นต้องค้นหาพารามิเตอร์ที่ดีที่สุด (ค่าความชันและจุดตัดแกนที่ดีที่สุด)

ในการค้นหาพารามิเตอร์ที่ดีที่สุดหรือย่อสมการ MSE ให้เหลือน้อยที่สุด เราใช้วิธีกำลังสองน้อยที่สุดแบบธรรมดา หัวข้อนี้จะกล่าวถึงในบล็อกถัดไป