สิ่งพิมพ์ตามแท็ก data-mining

สิ่งตีพิมพ์ในหัวข้อ 'data-mining'

ข้อความสั้น ๆ เกี่ยวกับตัวแยกประเภท Bayesian แบบไร้เดียงสา

ลักษณะสำคัญของลักษณนามแบบเบย์ที่ไร้เดียงสาคือถือว่ามีความเป็นอิสระแบบมีเงื่อนไข อัลกอริธึมการจำแนกแบบ Naive Bayesian เป็นตัวแยกประเภทความน่าจะเป็น ขึ้นอยู่กับแบบจำลองความน่าจะเป็นที่รวมเอาสมมติฐานที่เป็นอิสระที่แข็งแกร่ง สมมติฐานที่เป็นอิสระเหล่านี้มักไม่มีผลกระทบต่อความเป็นจริง ซึ่งเป็นเหตุผลว่าทำไมสิ่งนี้จึงเรียกว่าไร้เดียงสา Naive Bayesian สามารถได้รับการฝึกฝนในสภาพแวดล้อมการเรียนรู้ที่มีการดูแล หลักการ: ในที่นี้ คุณลักษณะทุกคู่ที่ถูกจัดประเภทมีความเป็นอิสระจากกัน..

การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล

การทำเหมืองข้อมูล การประยุกต์ใช้เทคนิคการสุ่มตัวอย่างเกินของชนกลุ่มน้อยสังเคราะห์ (SMOTe) สำหรับชุดข้อมูลที่ไม่สมดุล ใน Data Science ชุดข้อมูลที่ไม่สมดุลไม่ใช่เรื่องน่าประหลาดใจ หากชุดข้อมูลที่มีไว้สำหรับปัญหาการจำแนกประเภท เช่น การวิเคราะห์ความรู้สึก การสร้างภาพทางการแพทย์ หรือปัญหาอื่นๆ ที่เกี่ยวข้องกับการวิเคราะห์เชิงคาดการณ์แบบแยกส่วน (เช่น การทำนายความล่าช้าของเที่ยวบิน) มีจำนวนอินสแตนซ์ไม่เท่ากัน (ตัวอย่างหรือจุดข้อมูล) สำหรับคลาสที่แตกต่างกัน ชุดข้อมูลเหล่านั้นจะถูกกล่าวถึง..

คำถามในหัวข้อ 'data-mining'

วิธีสร้างกฎเกณฑ์ที่มีชุดไอเท็มบ่อยครั้งโดยใช้ควาญช้าง

ฉันกำลังเรียนรู้ fpgrowth ในควาญ ฉันพบหน้าที่ของชุดสิ่งของที่เกิดบ่อยๆ แต่จะสร้างกฎสำหรับชุดสิ่งของที่พบบ่อยโดยใช้ควาญได้อย่างไร มันยังใช้กับควาญช้างไม่ได้เหรอ?

1817 มุมมอง

data-mining mahout

08.11.2023

เทคนิคการจัดประเภทข้อความสำหรับสถานการณ์นี้

ฉันยังใหม่กับอัลกอริธึม Machine Learning มากและมีคำถามสั้นๆ เกี่ยวกับการจำแนกชุดข้อมูล ขณะนี้มีข้อมูลการฝึกอบรมที่ประกอบด้วยสองคอลัมน์ข้อความและตัวระบุ ข้อความ - ข้อความทั่วไปที่ดึงมาจากบันทึกที่มีการประทับเวลาและตัวระบุข้อความบางส่วน -...

78 มุมมอง

machine-learning cluster-analysis classification data-mining

03.12.2023

การใช้ LabelEncoder ของ sklearn บนคอลัมน์ของ dataframe

ถ้าฉันมี dataframe ให้พูดว่า df และถ้า df["levels"] = pd.Series(["low", "low", "med", "low", "med", "high"]) มีวิธีการเปลี่ยนแปลงสิ่งนี้ให้เป็น: df["levels"] = pd.Series([0,0,1,0,1,2]) ฉันได้ลองใช้ preprocessing.LabelEncoder()...

1192 มุมมอง

python pandas scikit-learn data-mining

03.12.2023

จะกำจัดจุดที่อยู่ใกล้มากในพื้นที่เพื่อกรองจุดสนใจได้อย่างไร?

ฉันกำลังทำงานกับจุดสนใจและกำลังค้นหาวิธีกรองจุดที่ใกล้เคียงที่สุดเพื่อหลีกเลี่ยงความซ้ำซ้อนและอำนวยความสะดวกในการอธิบาย มีใครมีความคิดบ้างไหม? ขอบคุณ

29 มุมมอง

computer-vision image-processing data-mining

23.12.2023