สิ่งตีพิมพ์ในหัวข้อ 'logistic-regression'
พื้นฐานการเรียนรู้ของเครื่อง (ตอนที่ 3)
หลังจากการแนะนำครั้งล่าสุดในส่วนที่ 2 เกี่ยวกับการถดถอยเชิงเส้น เรามาข้ามไปที่ Logistic Regression พร้อมกับแนวคิดพื้นฐานบางอย่างกันดีกว่า
เงื่อนไขพื้นฐาน
ความเป็นไปได้สูงสุด
ใช้เพื่อค้นหาเส้นที่เหมาะสมที่สุดสำหรับการถดถอยลอจิสติก แนวคิดนี้เหมือนกับการถดถอยเชิงเส้น เราจะหมุนเส้นไปเรื่อยๆ จนกว่าเราจะพบเส้นที่มีความน่าจะเป็นสูงสุด ขั้นแรก เราต้องฉายข้อมูลลงในแกน x และแกน y (log(odd)) จากนั้นเราจำเป็นต้องแปลงกลับเป็นความน่าจะเป็น และคำนวณบันทึกความน่าจะเป็น เราทำเช่นนี้ต่อไปจนกระทั่ง...
ปัญหาการรักษาพนักงาน ตอนที่ 2
ในส่วนนี้ผมขอใช้ Logistic Regression เพื่อคาดการณ์ว่าพนักงานจะลาออกหรือไม่
คำอธิบายโดยย่อของการถดถอยโลจิสติก
หากคุณเคยศึกษาสถิติมาก่อน คุณจะคุ้นเคยกับ Linear Regression การถดถอยเชิงเส้นสามารถทำนายตัวแปรตาม Y โดยให้ตัวแปรอิสระ X แบบจำลองของการถดถอยเชิงเส้นสามารถแสดงได้ด้วยสมการ (1)
หรือสำหรับชุดข้อมูลที่มี X มากกว่าหนึ่งตัว โมเดลจะแสดงด้วยสมการ (2)
ทุกอย่างเป็นไปด้วยดีจนกว่าเราจะมีข้อมูลที่เป็นหมวดหมู่สำหรับ Y เช่น เป้าหมายที่เรามีคือการคาดการณ์ว่าพนักงานจะลาออกหรือไม่..
รีวิว Machine Learning Zoomcamp 2022 — สัปดาห์ที่ 03: Machine Learning เพื่อการจำแนกประเภท
ฉันเพิ่งเสร็จสิ้นสัปดาห์ที่สามของ "Machine Learning Zoomcamp 2022" โดย Alexey Grigorev และฉันจะแชร์บันทึกและความคืบหน้าผ่านสื่อนี้ บทความรายสัปดาห์ที่เขียนขึ้นเป็นการสัมภาษณ์โดยกล่าวถึงหัวข้อหลักที่ได้เรียนรู้ในสัปดาห์ ตลอดจนเนื้อหาทั่วไปอื่นๆ ของหลักสูตรหรือคำแนะนำสำหรับงานที่ได้รับมอบหมายหรือโครงการ ฉันหวังว่าคุณจะสนุกกับมัน และยินดีรับข้อเสนอแนะใดๆ
-ในที่สุดเราก็มาถึงสัปดาห์ที่สามแล้ว เวลาผ่านไปเร็วแค่ไหน แต่ฉันแน่ใจว่ามันไม่ได้ไร้ประโยชน์เลย ขอบคุณทุกสิ่งที่เราได้เรียนรู้..
การประมาณค่าความน่าจะเป็นระดับและการถดถอยลอจิสติก
คุณเคยสงสัยบ้างไหมว่าเหตุใด Logistic Regression จึงใช้สำหรับปัญหาการจำแนกประเภท แต่ยังคงมี "Regression" อยู่ในนั้น
ในโพสต์นี้ เราจะตอบคำถามเช่น ทำไมจึงมีคำว่าการถดถอยในการถดถอยแบบลอจิสติก และ สามารถแปลงเป็นความน่าจะเป็นของชั้นเรียนได้อย่างไร
สำหรับปัญหาการจำแนกประเภทในแมชชีนเลิร์นนิง เรามักจะต้องการทราบว่าอินสแตนซ์นั้น มีแนวโน้ม อย่างไร แทนที่จะเป็นคลาสใด ดังนั้นในหลายกรณี เราต้องการใช้ความน่าจะเป็นระดับโดยประมาณในการตัดสินใจ
พิจารณาสถานการณ์ที่เราต้องตรวจจับการฉ้อโกงเครดิต..
การจัดหมวดหมู่ในการคาดการณ์อัตราการคลิกผ่านในโฆษณาแบบดิสเพลย์
บทนำ
ปัจจุบันการโฆษณาแบบดิสเพลย์ออนไลน์เป็นธุรกิจที่มีมูลค่าหลายพันล้านดอลลาร์ โดยมีรายได้ต่อปี 31.7 พันล้านดอลลาร์สหรัฐในปีงบประมาณ 2016 เพิ่มขึ้น 29% จากปีงบประมาณ 2015 ปัญหาหลักประการหนึ่งที่โฆษณาแบบรูปภาพพยายามแก้ไขคือการแสดงโฆษณาที่เหมาะสมแก่ คนที่เหมาะสม ในบริบทที่ถูกต้อง ในเวลาที่เหมาะสม การคาดการณ์อัตราการคลิกผ่าน (CTR) อย่างแม่นยำเป็นสิ่งสำคัญในการแก้ปัญหานี้ และได้รับความสนใจจากการวิจัยมากมายในช่วงไม่กี่ปีที่ผ่านมา
ข้อมูลที่เกี่ยวข้องกับการทำนาย CTR..
เรียนรู้จากความผิดพลาดของเรา 📈
เรียนรู้จากความผิดพลาดของเรา 📈
Python, scikit-learn, Logistic Regression และ Looker มารวมกันเพื่อช่วยผู้จัดการฝ่ายขายของเราค้นหา 'เข็มในกองหญ้า' ได้อย่างไร
นี่เป็นบทความสั้นที่มุ่งเป้าไปที่นักวิเคราะห์การขายและผู้ปฏิบัติงานที่อาจต้องการสำรวจศักยภาพการใช้งาน ML ในขั้นตอนการทำงานของตน มีข้อมูลโค้ด ตัวอย่าง และบทเรียนที่ฉันได้เรียนรู้จากการฝังโมเดลการจัดหมวดหมู่ในกระบวนการขายของเราที่นี่ Qubit
บริบท
ที่ Qubit เราใช้ Salesforce เป็นเครื่องมือ CRM หลักของเรา..
การตรวจจับการฉ้อโกงบัตรเครดิตโดยใช้การเรียนรู้ของเครื่อง
คุณสามารถค้นหารหัสที่สมบูรณ์ได้ ที่นี่
ในโลกดิจิทัลที่เปลี่ยนแปลงไปอย่างรวดเร็วนี้ เราได้รวมเข้ากับสังคมธุรกรรมดิจิทัล คาดว่าในปีต่อๆ ไป ธุรกรรมที่ไม่ใช่เงินสดจะมีการเติบโตอย่างต่อเนื่อง เนื่องจากธุรกรรมดิจิทัลนี้เพิ่มขึ้นทุกปี จำนวนการฉ้อโกงบัตรเครดิตจึงเพิ่มขึ้นอย่างต่อเนื่องเช่นกัน ผลการศึกษาล่าสุดระบุว่า ผู้คน 15.4 ล้านคนประสบปัญหาการฉ้อโกงเครดิตในปี 2559 เพียงในสหรัฐอเมริกาเพียงแห่งเดียว
มีหลายวิธีในการหยุดกิจกรรมฉ้อโกงเหล่านี้..