สิ่งตีพิมพ์ในหัวข้อ 'data-mining'
ข้อความสั้น ๆ เกี่ยวกับตัวแยกประเภท Bayesian แบบไร้เดียงสา
ลักษณะสำคัญของลักษณนามแบบเบย์ที่ไร้เดียงสาคือถือว่ามีความเป็นอิสระแบบมีเงื่อนไข
อัลกอริธึมการจำแนกแบบ Naive Bayesian เป็นตัวแยกประเภทความน่าจะเป็น
ขึ้นอยู่กับแบบจำลองความน่าจะเป็นที่รวมเอาสมมติฐานที่เป็นอิสระที่แข็งแกร่ง
สมมติฐานที่เป็นอิสระเหล่านี้มักไม่มีผลกระทบต่อความเป็นจริง ซึ่งเป็นเหตุผลว่าทำไมสิ่งนี้จึงเรียกว่าไร้เดียงสา
Naive Bayesian สามารถได้รับการฝึกฝนในสภาพแวดล้อมการเรียนรู้ที่มีการดูแล
หลักการ:
ในที่นี้ คุณลักษณะทุกคู่ที่ถูกจัดประเภทมีความเป็นอิสระจากกัน..
การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล
การทำเหมืองข้อมูล
การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล
ใน Data Science ชุดข้อมูลที่ไม่สมดุลไม่ใช่เรื่องน่าประหลาดใจ หากชุดข้อมูลที่มีไว้สำหรับปัญหาการจำแนกประเภท เช่น การวิเคราะห์ความรู้สึก การสร้างภาพทางการแพทย์ หรือปัญหาอื่นๆ ที่เกี่ยวข้องกับการวิเคราะห์เชิงคาดการณ์แบบแยกส่วน (เช่น การทำนายความล่าช้าของเที่ยวบิน) มีจำนวนอินสแตนซ์ไม่เท่ากัน (ตัวอย่างหรือจุดข้อมูล) สำหรับคลาสที่แตกต่างกัน ชุดข้อมูลเหล่านั้นจะถูกกล่าวถึง..
คำถามในหัวข้อ 'data-mining'
วิธีสร้างกฎเกณฑ์ที่มีชุดไอเท็มบ่อยครั้งโดยใช้ควาญช้าง
ฉันกำลังเรียนรู้ fpgrowth ในควาญ ฉันพบหน้าที่ของชุดสิ่งของที่เกิดบ่อยๆ แต่จะสร้างกฎสำหรับชุดสิ่งของที่พบบ่อยโดยใช้ควาญได้อย่างไร มันยังใช้กับควาญช้างไม่ได้เหรอ?
1817 มุมมอง
schedule
08.11.2023
เทคนิคการจัดประเภทข้อความสำหรับสถานการณ์นี้
ฉันยังใหม่กับอัลกอริธึม Machine Learning มากและมีคำถามสั้นๆ เกี่ยวกับการจำแนกชุดข้อมูล
ขณะนี้มีข้อมูลการฝึกอบรมที่ประกอบด้วยสองคอลัมน์ข้อความและตัวระบุ
ข้อความ - ข้อความทั่วไปที่ดึงมาจากบันทึกที่มีการประทับเวลาและตัวระบุข้อความบางส่วน -...
78 มุมมอง
schedule
03.12.2023
การใช้ LabelEncoder ของ sklearn บนคอลัมน์ของ dataframe
ถ้าฉันมี dataframe ให้พูดว่า df และถ้า
df["levels"] = pd.Series(["low", "low", "med", "low", "med", "high"])
มีวิธีการเปลี่ยนแปลงสิ่งนี้ให้เป็น:
df["levels"] = pd.Series([0,0,1,0,1,2])
ฉันได้ลองใช้ preprocessing.LabelEncoder()...
1192 มุมมอง
schedule
03.12.2023
จะกำจัดจุดที่อยู่ใกล้มากในพื้นที่เพื่อกรองจุดสนใจได้อย่างไร?
ฉันกำลังทำงานกับจุดสนใจและกำลังค้นหาวิธีกรองจุดที่ใกล้เคียงที่สุดเพื่อหลีกเลี่ยงความซ้ำซ้อนและอำนวยความสะดวกในการอธิบาย มีใครมีความคิดบ้างไหม? ขอบคุณ
29 มุมมอง
schedule
23.12.2023