สิ่งตีพิมพ์ในหัวข้อ 'linear-regression'
ในที่สุดที่ปรึกษาของเราก็มีความสุข
บทนำ
สวัสดีทุกคน ฉันดีใจที่ได้แจ้งให้ทราบว่าฉันได้สำเร็จภารกิจที่ 1 แล้วโดยเป็นส่วนหนึ่งของการฝึกงาน Data Science และ Business Analytics ที่มูลนิธิ Sparks ภายใต้โครงการ Graduate Rotational Internship Program
สถานการณ์
มีที่ปรึกษาที่มูลนิธิ Sparks ซึ่งคอยให้คำปรึกษาแก่นักเรียนหลายคนตลอดเส้นทางการให้คำปรึกษาของเธอ
และตอนนี้เธอได้เลื่อนตำแหน่งเป็นที่ปรึกษาอาวุโสที่ The Sparks Foundation ควบคู่กับตอนนี้เธอต้องให้คำปรึกษานักเรียน 25 คนในชุดที่เพิ่งเข้ามาในมาตรฐานที่ 12..
การถดถอยเชิงเส้น
การถดถอยเชิงเส้นเป็นโปรแกรมคอมพิวเตอร์ประเภทหนึ่งที่ช่วยทำนายอนาคตโดยดูจากข้อมูลในอดีต โดยเฉพาะอย่างยิ่ง จะพิจารณาว่าสิ่งหนึ่งหรือหลายอย่าง (เช่น อุณหภูมิหรือยอดขาย) เกี่ยวข้องกับสิ่งอื่นอย่างไร (เช่น เวลาหรืองบประมาณการโฆษณา) สิ่งนี้ช่วยให้เราเข้าใจว่าการเปลี่ยนแปลงในสิ่งหนึ่งส่งผลต่ออีกสิ่งหนึ่งอย่างไร
การถดถอยเชิงเส้นทำงานโดยการวาดเส้นตรงผ่านจุดข้อมูลที่เหมาะกับรูปแบบของข้อมูลมากที่สุด เส้นนี้แสดงถึงความสัมพันธ์ระหว่างสิ่งที่เรากำลังวัด ตัวอย่างเช่น หากเรากำลังวัดอุณหภูมิและเวลา..
การสำรวจความแตกต่างระหว่างตัวแบบเชิงเส้น: จากกำลังสองน้อยสุดสามัญไปจนถึงการถดถอยพหุนาม
โมเดลเชิงเส้นเป็นเครื่องมืออันทรงพลังสำหรับการทำความเข้าใจความสัมพันธ์ในข้อมูลและการคาดการณ์ ในบทความนี้ เราจะสำรวจแนวคิดต่างๆ ที่เกี่ยวข้องกับแบบจำลองเชิงเส้น ตั้งแต่กำลังสองน้อยสุดสามัญไปจนถึงการถดถอยพหุนาม ในตอนท้าย คุณจะมีความเข้าใจอย่างครอบคลุมเกี่ยวกับเทคนิคต่างๆ และการนำไปใช้งาน
กำลังสองน้อยที่สุดสามัญ (OLS): OLS เป็นวิธีการที่ใช้กันอย่างแพร่หลายในการประมาณค่าสัมประสิทธิ์ของแบบจำลองการถดถอยเชิงเส้น โดยจะลดผลรวมของความแตกต่างกำลังสองระหว่างค่าที่คาดการณ์กับค่าจริง..
การถดถอยเชิงเส้นอย่างง่าย
การถดถอยเชิงเส้นอย่างง่ายเป็นแนวทางเชิงเส้นในการสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระหนึ่งตัว
สูตรสำหรับการถดถอยเชิงเส้นอย่างง่ายคือ:
y = β 0+ β 1 x
โดยที่: y เป็นตัวแปรตาม
x คือตัวแปรอิสระ
β0 คือค่าตัดแกน y
β1 คือความชันของเส้น
วัตถุประสงค์คือเพื่อค้นหาเส้นที่เหมาะสมที่สุดที่จะลดผลรวมของผลต่างกำลังสอง (ค่าคงเหลือ) ระหว่างค่าที่สังเกตได้ (ค่าจริง) และค่าที่ทำนายโดยแบบจำลองให้เหลือน้อยที่สุด
เพื่อจุดประสงค์ในการสาธิต เรามา: 1...
แนวทางที่ใช้งานง่ายสำหรับ Gradient Descent
ในบทความนี้ เราจะพยายามทำความเข้าใจอัลกอริธึมการไล่ระดับสีและคณิตศาสตร์ที่เกี่ยวข้อง
ลองใช้ปัญหาการถดถอยเชิงเส้นง่ายๆ โดยเราต้องการทำนายน้ำหนักของบุคคลที่กำหนดตามส่วนสูงของเขาหรือเธอ เพื่อเริ่มต้นด้วยปัญหาการเรียนรู้ของเครื่องภายใต้การดูแล อันดับแรกเราจำเป็นต้องมีข้อมูลการฝึกอบรมที่ให้ความสัมพันธ์ระหว่างเอนทิตี ได้แก่ ส่วนสูงและน้ำหนักในกรณีนี้ เอนทิตีที่ช่วยในกระบวนการทำนายเรียกว่า ตัวแปรอิสระหรือคุณลักษณะ อาจมีตัวแปรอิสระได้ตั้งแต่หนึ่งตัวขึ้นไป ตัวอย่างเช่น ในตัวอย่างของเรา..
การถดถอยเชิงเส้นหลายตัวแปร
ในการถดถอยเชิงเส้นหลายตัวแปร เป้าหมายของคุณคือการสร้างข้อความสมมุติที่จะสร้างค่าที่ใกล้เคียงกับข้อมูลของคุณมากที่สุด (รูปที่ 1) ในกรณีนี้ ฟังก์ชันสมมติฐานจะถูกสร้างขึ้นเพื่อทำนายค่าโดยใช้ตัวแปรอิสระมากกว่าหนึ่งตัว จากนั้นใช้การไล่ระดับสีที่เหมาะสม น้ำหนักของคุณลักษณะต่างๆ จะถูกเลือกเพื่อลดความแตกต่างระหว่างข้อมูลให้เหลือน้อยที่สุด
สัญกรณ์
คำแถลงสมมุติฐาน
ฟังก์ชันสมมติฐานที่ไม่แปรผันตามชื่อ จะใช้ตัวแปรตัวเดียวในการทำนายค่า
ในที่นี้ x คืออินพุตคุณลักษณะ/ตัวแปรที่ฟังก์ชัน..
การถดถอยเชิงเส้น
เราจะให้คำนิยามมันอย่างไร
การถดถอยเชิงเส้นเป็นการวิเคราะห์ทางสถิติประเภทหนึ่งที่ใช้ในการทำนายความสัมพันธ์ระหว่างตัวแปรสองตัว โดยถือว่าความสัมพันธ์เชิงเส้นระหว่างตัวแปรอิสระและตัวแปรตาม และมุ่งหวังที่จะค้นหาเส้นที่เหมาะสมที่สุดที่อธิบายความสัมพันธ์
การถดถอยเชิงเส้นมักใช้ในหลายสาขา รวมถึงเศรษฐศาสตร์ การเงิน และสังคมศาสตร์ เพื่อวิเคราะห์และทำนายแนวโน้มของข้อมูล
การถดถอยเชิงเส้นอย่างง่าย
ในการถดถอยเชิงเส้นอย่างง่าย จะมีตัวแปรอิสระหนึ่งตัวและตัวแปรตามหนึ่งตัว..