สิ่งตีพิมพ์ในหัวข้อ 'logistic-regression'


พื้นฐานการเรียนรู้ของเครื่อง (ตอนที่ 3)
หลังจากการแนะนำครั้งล่าสุดในส่วนที่ 2 เกี่ยวกับการถดถอยเชิงเส้น เรามาข้ามไปที่ Logistic Regression พร้อมกับแนวคิดพื้นฐานบางอย่างกันดีกว่า เงื่อนไขพื้นฐาน ความเป็นไปได้สูงสุด ใช้เพื่อค้นหาเส้นที่เหมาะสมที่สุดสำหรับการถดถอยลอจิสติก แนวคิดนี้เหมือนกับการถดถอยเชิงเส้น เราจะหมุนเส้นไปเรื่อยๆ จนกว่าเราจะพบเส้นที่มีความน่าจะเป็นสูงสุด ขั้นแรก เราต้องฉายข้อมูลลงในแกน x และแกน y (log(odd)) จากนั้นเราจำเป็นต้องแปลงกลับเป็นความน่าจะเป็น และคำนวณบันทึกความน่าจะเป็น เราทำเช่นนี้ต่อไปจนกระทั่ง...

ปัญหาการรักษาพนักงาน ตอนที่ 2
ในส่วนนี้ผมขอใช้ Logistic Regression เพื่อคาดการณ์ว่าพนักงานจะลาออกหรือไม่ คำอธิบายโดยย่อของการถดถอยโลจิสติก หากคุณเคยศึกษาสถิติมาก่อน คุณจะคุ้นเคยกับ Linear Regression การถดถอยเชิงเส้นสามารถทำนายตัวแปรตาม Y โดยให้ตัวแปรอิสระ X แบบจำลองของการถดถอยเชิงเส้นสามารถแสดงได้ด้วยสมการ (1) หรือสำหรับชุดข้อมูลที่มี X มากกว่าหนึ่งตัว โมเดลจะแสดงด้วยสมการ (2) ทุกอย่างเป็นไปด้วยดีจนกว่าเราจะมีข้อมูลที่เป็นหมวดหมู่สำหรับ Y เช่น เป้าหมายที่เรามีคือการคาดการณ์ว่าพนักงานจะลาออกหรือไม่..

รีวิว Machine Learning Zoomcamp 2022 — สัปดาห์ที่ 03: Machine Learning เพื่อการจำแนกประเภท
ฉันเพิ่งเสร็จสิ้นสัปดาห์ที่สามของ "Machine Learning Zoomcamp 2022" โดย Alexey Grigorev และฉันจะแชร์บันทึกและความคืบหน้าผ่านสื่อนี้ บทความรายสัปดาห์ที่เขียนขึ้นเป็นการสัมภาษณ์โดยกล่าวถึงหัวข้อหลักที่ได้เรียนรู้ในสัปดาห์ ตลอดจนเนื้อหาทั่วไปอื่นๆ ของหลักสูตรหรือคำแนะนำสำหรับงานที่ได้รับมอบหมายหรือโครงการ ฉันหวังว่าคุณจะสนุกกับมัน และยินดีรับข้อเสนอแนะใดๆ -ในที่สุดเราก็มาถึงสัปดาห์ที่สามแล้ว เวลาผ่านไปเร็วแค่ไหน แต่ฉันแน่ใจว่ามันไม่ได้ไร้ประโยชน์เลย ขอบคุณทุกสิ่งที่เราได้เรียนรู้..

การประมาณค่าความน่าจะเป็นระดับและการถดถอยลอจิสติก
คุณเคยสงสัยบ้างไหมว่าเหตุใด Logistic Regression จึงใช้สำหรับปัญหาการจำแนกประเภท แต่ยังคงมี "Regression" อยู่ในนั้น ในโพสต์นี้ เราจะตอบคำถามเช่น ทำไมจึงมีคำว่าการถดถอยในการถดถอยแบบลอจิสติก และ สามารถแปลงเป็นความน่าจะเป็นของชั้นเรียนได้อย่างไร สำหรับปัญหาการจำแนกประเภทในแมชชีนเลิร์นนิง เรามักจะต้องการทราบว่าอินสแตนซ์นั้น มีแนวโน้ม อย่างไร แทนที่จะเป็นคลาสใด ดังนั้นในหลายกรณี เราต้องการใช้ความน่าจะเป็นระดับโดยประมาณในการตัดสินใจ พิจารณาสถานการณ์ที่เราต้องตรวจจับการฉ้อโกงเครดิต..

การจัดหมวดหมู่ในการคาดการณ์อัตราการคลิกผ่านในโฆษณาแบบดิสเพลย์
บทนำ ปัจจุบันการโฆษณาแบบดิสเพลย์ออนไลน์เป็นธุรกิจที่มีมูลค่าหลายพันล้านดอลลาร์ โดยมีรายได้ต่อปี 31.7 พันล้านดอลลาร์สหรัฐในปีงบประมาณ 2016 เพิ่มขึ้น 29% จากปีงบประมาณ 2015 ปัญหาหลักประการหนึ่งที่โฆษณาแบบรูปภาพพยายามแก้ไขคือการแสดงโฆษณาที่เหมาะสมแก่ คนที่เหมาะสม ในบริบทที่ถูกต้อง ในเวลาที่เหมาะสม การคาดการณ์อัตราการคลิกผ่าน (CTR) อย่างแม่นยำเป็นสิ่งสำคัญในการแก้ปัญหานี้ และได้รับความสนใจจากการวิจัยมากมายในช่วงไม่กี่ปีที่ผ่านมา ข้อมูลที่เกี่ยวข้องกับการทำนาย CTR..

เรียนรู้จากความผิดพลาดของเรา 📈
เรียนรู้จากความผิดพลาดของเรา 📈 Python, scikit-learn, Logistic Regression และ Looker มารวมกันเพื่อช่วยผู้จัดการฝ่ายขายของเราค้นหา 'เข็มในกองหญ้า' ได้อย่างไร นี่เป็นบทความสั้นที่มุ่งเป้าไปที่นักวิเคราะห์การขายและผู้ปฏิบัติงานที่อาจต้องการสำรวจศักยภาพการใช้งาน ML ในขั้นตอนการทำงานของตน มีข้อมูลโค้ด ตัวอย่าง และบทเรียนที่ฉันได้เรียนรู้จากการฝังโมเดลการจัดหมวดหมู่ในกระบวนการขายของเราที่นี่ Qubit บริบท ที่ Qubit เราใช้ Salesforce เป็นเครื่องมือ CRM หลักของเรา..

การตรวจจับการฉ้อโกงบัตรเครดิตโดยใช้การเรียนรู้ของเครื่อง
คุณสามารถค้นหารหัสที่สมบูรณ์ได้ ที่นี่ ในโลกดิจิทัลที่เปลี่ยนแปลงไปอย่างรวดเร็วนี้ เราได้รวมเข้ากับสังคมธุรกรรมดิจิทัล คาดว่าในปีต่อๆ ไป ธุรกรรมที่ไม่ใช่เงินสดจะมีการเติบโตอย่างต่อเนื่อง เนื่องจากธุรกรรมดิจิทัลนี้เพิ่มขึ้นทุกปี จำนวนการฉ้อโกงบัตรเครดิตจึงเพิ่มขึ้นอย่างต่อเนื่องเช่นกัน ผลการศึกษาล่าสุดระบุว่า ผู้คน 15.4 ล้านคนประสบปัญหาการฉ้อโกงเครดิตในปี 2559 เพียงในสหรัฐอเมริกาเพียงแห่งเดียว มีหลายวิธีในการหยุดกิจกรรมฉ้อโกงเหล่านี้..