ผลการจัดประเภท WEKA คล้ายกันแต่มีประสิทธิภาพต่างกัน

ครั้งแรกที่ฉันอ่านสิ่งนี้: จะตีความการจำแนกประเภท weka ได้อย่างไร แต่มันไม่ได้ช่วยฉัน .

จากนั้น เพื่อตั้งค่าพื้นหลัง ฉันกำลังพยายามเรียนรู้ในการแข่งขัน kaggle และแบบจำลองได้รับการประเมินด้วยพื้นที่ ROC

จริงๆ แล้ว ฉันสร้างโมเดลขึ้นมาสองโมเดลและข้อมูลเกี่ยวกับโมเดลเหล่านี้แสดงในลักษณะนี้:

Correctly Classified Instances       10309               98.1249 %
Incorrectly Classified Instances       197                1.8751 %
Kappa statistic                          0.7807
K&B Relative Info Score             278520.5065 % 
K&B Information Score                  827.3574 bits      0.0788 bits/instance 
Class complexity | order 0            3117.1189 bits      0.2967 bits/instance 
Class complexity | scheme              948.6802 bits      0.0903 bits/instance  
Complexity improvement     (Sf)       2168.4387 bits      0.2064 bits/instance 
Mean absolute error                      0.0465 
Root mean squared error                  0.1283 
Relative absolute error                 46.7589 % >72<69
Root relative squared error             57.5625 % >72<69
Total Number of Instances            10506     

=== Detailed Accuracy By Class ===

           TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
             0.998     0.327      0.982     0.998     0.99       0.992    0
             0.673     0.002      0.956     0.673     0.79       0.992    1
Weighted Avg.    0.981     0.31       0.981     0.981     0.98       0.992

นอกเหนือจากคะแนนข้อมูลสัมพัทธ์ของ K&B; ข้อผิดพลาดสัมพัทธ์สัมพัทธ์และข้อผิดพลาดกำลังสองสัมพัทธ์ของรากซึ่งด้อยกว่า เหนือกว่า และเหนือกว่าตามลำดับในแบบจำลองที่ดีที่สุดที่ประเมินโดยเส้นโค้ง ROC ข้อมูลทั้งหมดจะเหมือนกัน ฉันสร้างโมเดลที่สามที่มีพฤติกรรมคล้ายกัน (อัตรา TP เป็นต้น) แต่คะแนนข้อมูลสัมพัทธ์ K&B อีกครั้ง ข้อผิดพลาดสัมพัทธ์สัมพัทธ์และข้อผิดพลาดกำลังสองสัมพัทธ์ของรูตแปรผัน แต่นั่นไม่อนุญาตให้คาดเดาได้ว่ารุ่นที่สามนี้เหนือกว่าทั้งสองรุ่นก่อนหรือไม่ (รูปแบบที่เหมือนกันเมื่อเปรียบเทียบกับรุ่นที่ดีที่สุด ดังนั้นในทางทฤษฎีแล้วควรจะเหนือกว่า แต่ก็ไม่ได้เป็นเช่นนั้น)

ฉันควรทำอย่างไรเพื่อคาดการณ์ว่าโมเดลจะทำงานได้ดีเมื่อมีรายละเอียดดังกล่าวหรือไม่

ขอบคุณล่วงหน้า.


person Ando Jurai    schedule 27.05.2015    source แหล่งที่มา
comment
ทำสิ่งนี้: scikit-learn.org/stable/modules/model_evalue.html ช่วยคุณ? ตอนที่ฉันศึกษา Machine Learning บางครั้งไซต์ต่างๆ ก็ให้ความช่วยเหลือ แม้ว่าไซต์เหล่านั้นจะไม่ได้ใช้ Weka หรือ Java ก็ตาม หากคุณสามารถอ่านโค้ดที่นั่นได้ คุณอาจปรับเปลี่ยนข้อมูลเพื่อสร้างวิธีแก้ไขปัญหาของคุณได้ ฉันไม่เคยคาดการณ์คุณภาพของแบบจำลองมาก่อน ดังนั้นฉันจึงไม่สามารถให้ข้อมูลโดยละเอียดเพิ่มเติมแก่คุณได้   -  person KJaeg    schedule 27.05.2015
comment
สิ่งนี้ก็น่าสนใจเช่นกัน: www2.geog ucl.ac.uk/~mdisney/teaching/GEOGG121/bayes/   -  person KJaeg    schedule 27.05.2015
comment
ขอบคุณ ฉันไม่แน่ใจว่าจะสามารถตอบคำถามของฉันด้วยสิ่งนั้นได้ แต่อย่างน้อยฉันก็จะได้เรียนรู้อะไรบางอย่าง มันค่อนข้างจะขัดกับสัญชาตญาณเล็กน้อยที่บางรุ่นที่มีข้อผิดพลาดมากกว่าจะทำงานได้ดีกว่า นอกจากนี้ ฉันยังคิดว่าคะแนนข้อมูลสัมพัทธ์เป็นสิ่งที่ประเมินความสมบูรณ์ของโมเดลเมื่อเปรียบเทียบกับข้อมูลที่โมเดลได้รับการฝึกฝน (นั่นคือ หากกฎการจัดหมวดหมู่ที่พบอนุญาตให้จัดหมวดหมู่สำหรับอินสแตนซ์ทั้งหมด) แต่ดูเหมือนว่าจะไม่เป็นเช่นนั้น   -  person Ando Jurai    schedule 27.05.2015
comment
นานมาแล้วตั้งแต่ฉันต้องทำงานเกี่ยวกับหัวข้อแมชชีนเลิร์นนิง ฉันตรวจสอบคุณภาพของแบบจำลองของฉันโดยการเปรียบเทียบผลลัพธ์ที่แท้จริงเท่านั้น แต่ฉันไม่เคยมาถึงสถานการณ์เพื่อทำนายพฤติกรรมของพวกเขา ฉันรู้ว่า Google ส่งคืนข้อมูลที่เกี่ยวข้องน้อยเกินไปสำหรับคำถามเกี่ยวกับแมชชีนเลิร์นนิง ปรากฎว่า Machine Learning จาก Peter Flach เป็นแหล่งข้อมูลที่ดีที่สุดในที่เดียวที่ฉันมี แม้ว่าจะไม่ใช่หนังสือที่เขียนดีที่สุดก็ตาม หากคุณสามารถเข้าถึงหนังสือเล่มนี้ได้ลองดูในนั้น บางทีคุณอาจจะพบบางสิ่งบางอย่าง   -  person KJaeg    schedule 27.05.2015
comment
กลับมาที่คำถามของคุณ: ฉันจะตรวจสอบโมเดลอย่างไร้เดียงสาด้วยการตรวจสอบข้ามชุดข้อมูลที่แตกต่างกัน และนำผลลัพธ์มาเป็นการคาดการณ์ นั่นเป็นตัวเลือกเหรอ?   -  person KJaeg    schedule 27.05.2015
comment
มันค่อนข้างจะ ฉันแบ่งชุดข้อมูลที่ให้มาเป็น 5 เท่าแล้วทำเช่นนั้น แต่จริงๆ แล้วมันไม่ได้ดีขึ้นมากนัก ฉันไม่สามารถได้รับสิ่งที่มีความหมายในแง่ของ ROC แต่ส่วนหนึ่งเกี่ยวข้องกับความจริงที่ว่าชุดการทดสอบมีอคติที่แตกต่างจากชุดการฝึก (ปัญหาคือบางอย่างเช่นอนุกรมเวลา เราต้องใช้เวลาหลายปีในการฝึก และหลายปีในการคาดการณ์ แต่มันก็ค่อนข้างจะไม่ดีในภาพรวม) อย่างไรก็ตาม ขอบคุณสำหรับการชี้ไปยังหนังสือของ Peter Flach ฉันจะพยายามอ่านมัน ขอบคุณทุกคนที่พยายามช่วยเหลือ   -  person Ando Jurai    schedule 25.06.2015