สิ่งตีพิมพ์ในหัวข้อ 'statistics'
สนับสนุนการถดถอยเวกเตอร์
Support Vector Regression (SVR) เป็นอัลกอริทึมการถดถอยประเภทหนึ่งที่ใช้ Support Vector Machines (SVM) เพื่อทำการวิเคราะห์การถดถอย ตรงกันข้ามกับอัลกอริธึมการถดถอยแบบดั้งเดิมซึ่งมีจุดมุ่งหมายเพื่อลดข้อผิดพลาดระหว่างค่าที่คาดการณ์ไว้กับค่าจริง SVR มุ่งหวังที่จะติดตั้ง "ทูบ" ไว้รอบข้อมูล เพื่อให้จุดข้อมูลส่วนใหญ่จะอยู่ภายในทูบ เป้าหมายของ SVR คือการค้นหาฟังก์ชันที่มีระยะขอบสูงสุดจากหลอด
ใน SVR ข้อมูลอินพุตจะถูกแปลงเป็นพื้นที่มิติที่สูงกว่า โดยจะใช้แบบจำลองการถดถอยเชิงเส้น จากนั้น SVM..
พื้นฐานการเรียนรู้ของเครื่อง (ตอนที่ 3)
หลังจากการแนะนำครั้งล่าสุดในส่วนที่ 2 เกี่ยวกับการถดถอยเชิงเส้น เรามาข้ามไปที่ Logistic Regression พร้อมกับแนวคิดพื้นฐานบางอย่างกันดีกว่า
เงื่อนไขพื้นฐาน
ความเป็นไปได้สูงสุด
ใช้เพื่อค้นหาเส้นที่เหมาะสมที่สุดสำหรับการถดถอยลอจิสติก แนวคิดนี้เหมือนกับการถดถอยเชิงเส้น เราจะหมุนเส้นไปเรื่อยๆ จนกว่าเราจะพบเส้นที่มีความน่าจะเป็นสูงสุด ขั้นแรก เราต้องฉายข้อมูลลงในแกน x และแกน y (log(odd)) จากนั้นเราจำเป็นต้องแปลงกลับเป็นความน่าจะเป็น และคำนวณบันทึกความน่าจะเป็น เราทำเช่นนี้ต่อไปจนกระทั่ง...
การจัดอันดับส่วนบุคคลแบบเบย์โดยนัย (ใน Tensorflow)
ผู้แนะนำ BPR โดยนัย (ใน Tensorflow)
นี่คือบทสรุปและการนำแนวคิดของ Tensorflow ไปใช้ในรายงานเรื่อง "BPR: Bayesian Personal Ranking from Implicit Feedback" โดย Steffen Rendle, Christoph Freudenthaler, Zeno Gantner และ Lars Schmidt-Thieme
เนื้อหา:
บทนำ การจัดอันดับส่วนบุคคลแบบเบย์เซียน โมเดลเทนเซอร์โฟลว์ ชุดข้อมูล เอาล่ะ มาเขียนกันเลย! (รหัส) สรุป ข้อมูลอ้างอิง
การแนะนำ
โพสต์นี้อาศัยแนวคิดที่ครอบคลุมโดยละเอียดในเรื่องราวของฉันเกี่ยวกับ..
การทดสอบสมมติฐานสองตัวอย่างในอาร์
ในบทที่ 99 เราเรียนรู้วิธีดำเนินการทดสอบสมมติฐานสองตัวอย่างใน R ซึ่งรวมถึงการทดสอบความแตกต่างในค่าเฉลี่ยและสัดส่วน และความเท่าเทียมกันของความแปรปรวน คุณจะได้เรียนรู้วิธีเขียนโค้ดการทดสอบสมมติฐานบูตสแตรป
บทที่ 99 - การทดสอบสมมติฐานสองตัวอย่างใน R ในเจ็ดบทเรียนที่ผ่านมา เราได้เตรียมทฤษฎีที่จำเป็นของการทดสอบสมมติฐานสองตัวอย่างไว้แล้ว… www.dataanalysisclassroom.com
วิธีเชี่ยวชาญความรู้พื้นฐาน R ในการอ่านครั้งเดียว: คู่มือสำหรับผู้เริ่มต้น
R เป็นภาษาโปรแกรมยอดนิยมที่ใช้สำหรับการคำนวณทางสถิติและกราฟิก หากคุณเป็นมือใหม่ที่ต้องการเรียนรู้ R คู่มือนี้จะครอบคลุมพื้นฐานของการเขียนโปรแกรม R และให้ตัวอย่างการเขียนโค้ดเพื่อช่วยให้คุณเชี่ยวชาญพื้นฐานได้ในเวลาอันรวดเร็ว
ตัวแปรและประเภทข้อมูล
ใน R ตัวแปรถูกใช้เพื่อจัดเก็บข้อมูล ในการกำหนดค่าให้กับตัวแปร ให้ใช้ตัวดำเนินการกำหนด ‹- หรือเครื่องหมายเท่ากับ =:
# Assigning values to variables
x <- 5
y = 3.14
R มีข้อมูลหลายประเภท รวมถึงตัวเลข จำนวนเต็ม อักขระ และตรรกะ..
การเรียนรู้ทั้งมวล
ในฐานะมืออาชีพด้านวิทยาศาสตร์ข้อมูล คุณต้องคุ้นเคยกับวิธีการทั้งมวลและอัลกอริธึมที่ใช้วิธีเหล่านั้น แต่สำหรับผู้ที่ยังใหม่กับสาขานี้ บางครั้งอาจสร้างความสับสนได้ ในบล็อกนี้ ฉันจะอธิบายทั้งหมดเกี่ยวกับการเรียนรู้แบบ Ensemble และเมตาอัลกอริธึมที่ใช้งานได้
การเรียนรู้แบบวงดนตรีคืออะไร
ในสถิติและการเรียนรู้ของเครื่อง วิธีการทั้งมวลใช้อัลกอริธึมการเรียนรู้ที่หลากหลายเพื่อให้ได้ประสิทธิภาพการทำนายที่ดีกว่าที่จะได้รับจากอัลกอริธึมการเรียนรู้ที่เป็นส่วนประกอบใดๆ เพียงอย่างเดียว
โมเดลหลายแบบ..
สถิติสำหรับการเรียนรู้ของเครื่อง — คู่มือที่ครอบคลุมส่วนที่ 3 จาก 4
ต่อจาก "ตอนที่ 1" และ "ตอนที่ 2" ก่อนหน้านี้
กระบวนการอนุมานทางสถิติแบบคลาสสิกประกอบด้วยขั้นตอนด้านล่าง:
สมมติฐาน — ข้อเสนอที่จัดทำขึ้นเพื่อเป็นพื้นฐานในการให้เหตุผล โดยไม่มีสมมติฐานใดๆ เกี่ยวกับความจริง (ราคา A มีกำไรมากกว่าราคา B) การออกแบบการทดสอบ —การทดสอบ A/B — การทดลองที่ออกแบบมาเพื่อทดสอบสมมติฐานเพื่อให้ได้ผลลัพธ์ที่สรุปได้ การเก็บรวบรวมข้อมูล การอนุมาน — ข้อมูลจะถูกรวบรวม วิเคราะห์ และสรุปผล
การทดสอบ A/A
การทดสอบ A/A..