สิ่งตีพิมพ์ในหัวข้อ 'data-visualization'


การทดสอบสมมติฐานโดยใช้การทดสอบแบบไม่อิงพารามิเตอร์: เครื่องมืออันทรงพลังสำหรับการวิเคราะห์ข้อมูล
การทดสอบสมมติฐานเป็นลักษณะพื้นฐานของการวิเคราะห์ทางสถิติที่ช่วยให้เราได้ข้อสรุปที่มีความหมายเกี่ยวกับประชากรจากข้อมูลตัวอย่าง ตามเนื้อผ้า การทดสอบแบบพาราเมตริกถูกนำมาใช้กันอย่างแพร่หลายสำหรับการทดสอบสมมติฐาน โดยถือว่าสมมติฐานการกระจายเฉพาะเกี่ยวกับข้อมูล อย่างไรก็ตาม ในกรณีที่ไม่เป็นไปตามสมมติฐานเหล่านี้หรือเมื่อต้องรับมือกับข้อมูลที่ไม่ใช่ตัวเลข การทดสอบแบบไม่อิงพารามิเตอร์จะเป็นทางเลือกที่มีคุณค่า ในบล็อกโพสต์นี้..

EDA และระบบการแนะนำใน Python
ที่นี่คือจุดเริ่มต้นที่ฉันเริ่มต้นการเดินทางในฐานะบล็อกเกอร์ Data Science จุดประสงค์ของการเข้าโครงการนี้คือเพื่อสนับสนุนนักวิเคราะห์ข้อมูลรุ่นเยาว์และผู้ที่ชื่นชอบวิทยาศาสตร์ข้อมูลเช่นฉัน หวังว่าคุณจะสนุก! หนังสือ 50 อันดับแรกของ Amazon (2009–2019) ในช่วงหลายปีที่ผ่านมา อีคอมเมิร์ซได้ครอบครองทั่วโลก และผู้เล่นรายใหญ่ เช่น Amazon, Flipkart, ebay ฯลฯ ได้รับผู้บริโภคจำนวนมหาศาล ฉันได้นำชุดข้อมูลนี้มาจาก kaggle เพื่อสำรวจและให้ข้อมูลเชิงลึกต่างๆ โดยใช้แนวทาง CRISP- DM..

เข้าสู่โลกแห่งวิทยาศาสตร์ข้อมูล
เข้าสู่โลกแห่งวิทยาศาสตร์ข้อมูล ดังที่อัลเบิร์ต ไอน์สไตน์กล่าวไว้ว่า จุดมุ่งหมายอันยิ่งใหญ่ของวิทยาศาสตร์คือการครอบคลุมข้อเท็จจริงเชิงทดลองจำนวนมากที่สุดโดยการอนุมานเชิงตรรกะจากสมมติฐานหรือสัจพจน์จำนวนน้อยที่สุด คุณอาจไม่รู้ แต่การเรียนรู้ของเครื่องนั้นอยู่รอบตัวคุณ เมื่อคุณพิมพ์ข้อความค้นหาลงในเครื่องมือค้นหา วิธีการที่เครื่องยนต์จะพิจารณาว่าจะแสดงผลลัพธ์ใดให้คุณเห็น (และโฆษณาใดด้วย) มาพูดถึงแพลตฟอร์มสตรีมมิ่งออนไลน์ที่เราชื่นชอบอย่าง 'Netflix'..

Gephisto: Gephi ในคลิกเดียว!
โดย ดร.เวโรนิกา เอสปิโนซา, 2022 / Twitter @Verukita1 คุณให้ข้อมูลเครือข่ายแก่มัน และมันช่วยให้คุณเห็นภาพได้ ไม่มีการตั้งค่า ไม่จำเป็นต้องมีทักษะ การออกแบบของ Gephisto เป็นตัวอย่างว่าเราสามารถแทรกแซงเป้าหมายที่เป็นประโยชน์ของผู้ใช้ได้อย่างไร โดยให้สิ่งที่พวกเขาต้องการ (วิธีง่ายๆ ในการรับแผนที่เครือข่าย) แต่ในรูปแบบที่ไม่เชื่อฟัง (แผนที่ที่สร้างขึ้นจะแตกต่างกันทุกครั้งที่ใช้เครื่องมือ) ซึ่งสนับสนุนให้พวกเขา มีส่วนร่วมเพิ่มเติมกับหลักระเบียบวิธีของเครื่องมือ ในฐานะเครื่องมือ..

สนุกกับการวางแผนข้อมูลกระรอกใน R
เซสชั่นเขียนโค้ดยามว่าง 5 นาทีสามารถสร้างสิ่งมหัศจรรย์ให้กับนักวิทยาศาสตร์ข้อมูลได้ เจ้าหน้าที่ในนิวยอร์กใช้เวลาส่วนหนึ่งและเงินสาธารณะจำนวนมากในการรวบรวมข้อมูลเกี่ยวกับกระรอก ชุดข้อมูลนี้เรียกว่าข้อมูล NYC Squirrel Census rfordatascience/tidytuesday ข้อมูลของสัปดาห์นี้มาจาก NYC Squirrel Census ซึ่งเป็นข้อมูลดิบที่พอร์ทัล NY Data สวัสดี Sara Stoudt สำหรับการแบ่งปันนี้... github.com ชุดข้อมูล..

การตรวจสอบความถูกต้องข้ามแบบแบ่งชั้น k-fold โดยใช้ python
การตรวจสอบความถูกต้องข้ามแบบแบ่งชั้น k-fold โดยใช้ python การสุ่มตัวอย่างแบบแบ่งชั้นคืออะไร? ใน ตัวอย่างแบบแบ่งชั้น นักวิจัยแบ่งประชากรออกเป็นประชากรย่อยที่เป็นเนื้อเดียวกันที่เรียกว่า ชั้น ตามลักษณะเฉพาะ (เช่น เชื้อชาติ อัตลักษณ์ทางเพศ สถานที่ ฯลฯ) สมาชิกทุกคนของประชากรที่ศึกษาควรอยู่ในชั้นเดียว นักวิจัยอาศัยการสุ่มตัวอย่างแบบแบ่งชั้นเมื่อลักษณะของประชากรมีความหลากหลาย และพวกเขาต้องการให้แน่ใจว่าทุกคุณลักษณะจะแสดงอย่างถูกต้องในกลุ่มตัวอย่าง..