สิ่งตีพิมพ์ในหัวข้อ 'data-mining'


ข้อความสั้น ๆ เกี่ยวกับตัวแยกประเภท Bayesian แบบไร้เดียงสา
ลักษณะสำคัญของลักษณนามแบบเบย์ที่ไร้เดียงสาคือถือว่ามีความเป็นอิสระแบบมีเงื่อนไข อัลกอริธึมการจำแนกแบบ Naive Bayesian เป็นตัวแยกประเภทความน่าจะเป็น ขึ้นอยู่กับแบบจำลองความน่าจะเป็นที่รวมเอาสมมติฐานที่เป็นอิสระที่แข็งแกร่ง สมมติฐานที่เป็นอิสระเหล่านี้มักไม่มีผลกระทบต่อความเป็นจริง ซึ่งเป็นเหตุผลว่าทำไมสิ่งนี้จึงเรียกว่าไร้เดียงสา Naive Bayesian สามารถได้รับการฝึกฝนในสภาพแวดล้อมการเรียนรู้ที่มีการดูแล หลักการ: ในที่นี้ คุณลักษณะทุกคู่ที่ถูกจัดประเภทมีความเป็นอิสระจากกัน..

การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล
การทำเหมืองข้อมูล การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล ใน Data Science ชุดข้อมูลที่ไม่สมดุลไม่ใช่เรื่องน่าประหลาดใจ หากชุดข้อมูลที่มีไว้สำหรับปัญหาการจำแนกประเภท เช่น การวิเคราะห์ความรู้สึก การสร้างภาพทางการแพทย์ หรือปัญหาอื่นๆ ที่เกี่ยวข้องกับการวิเคราะห์เชิงคาดการณ์แบบแยกส่วน (เช่น การทำนายความล่าช้าของเที่ยวบิน) มีจำนวนอินสแตนซ์ไม่เท่ากัน (ตัวอย่างหรือจุดข้อมูล) สำหรับคลาสที่แตกต่างกัน ชุดข้อมูลเหล่านั้นจะถูกกล่าวถึง..

คำถามในหัวข้อ 'data-mining'

วิธีสร้างกฎเกณฑ์ที่มีชุดไอเท็มบ่อยครั้งโดยใช้ควาญช้าง
ฉันกำลังเรียนรู้ fpgrowth ในควาญ ฉันพบหน้าที่ของชุดสิ่งของที่เกิดบ่อยๆ แต่จะสร้างกฎสำหรับชุดสิ่งของที่พบบ่อยโดยใช้ควาญได้อย่างไร มันยังใช้กับควาญช้างไม่ได้เหรอ?
1817 มุมมอง
schedule 08.11.2023

เทคนิคการจัดประเภทข้อความสำหรับสถานการณ์นี้
ฉันยังใหม่กับอัลกอริธึม Machine Learning มากและมีคำถามสั้นๆ เกี่ยวกับการจำแนกชุดข้อมูล ขณะนี้มีข้อมูลการฝึกอบรมที่ประกอบด้วยสองคอลัมน์ข้อความและตัวระบุ ข้อความ - ข้อความทั่วไปที่ดึงมาจากบันทึกที่มีการประทับเวลาและตัวระบุข้อความบางส่วน -...
78 มุมมอง

การใช้ LabelEncoder ของ sklearn บนคอลัมน์ของ dataframe
ถ้าฉันมี dataframe ให้พูดว่า df และถ้า df["levels"] = pd.Series(["low", "low", "med", "low", "med", "high"]) มีวิธีการเปลี่ยนแปลงสิ่งนี้ให้เป็น: df["levels"] = pd.Series([0,0,1,0,1,2]) ฉันได้ลองใช้ preprocessing.LabelEncoder()...
1192 มุมมอง
schedule 03.12.2023

จะกำจัดจุดที่อยู่ใกล้มากในพื้นที่เพื่อกรองจุดสนใจได้อย่างไร?
ฉันกำลังทำงานกับจุดสนใจและกำลังค้นหาวิธีกรองจุดที่ใกล้เคียงที่สุดเพื่อหลีกเลี่ยงความซ้ำซ้อนและอำนวยความสะดวกในการอธิบาย มีใครมีความคิดบ้างไหม? ขอบคุณ
29 มุมมอง