บทนำ:

แมชชีนเลิร์นนิงเป็นวิธีที่มีประสิทธิภาพในการแก้ปัญหาทางการเกษตร เช่น การทำนายผลผลิต การแนะนำพืชผลและการเพิ่มประสิทธิภาพ โรคพืชและการตรวจหาศัตรูพืช ฯลฯ และช่วยเกษตรกรได้เนื่องจากการวินิจฉัยโรคทางการเกษตรผิดพลาดอาจนำไปสู่การใช้ยาฆ่าแมลงอย่างไม่ถูกต้องและการระบาดของโรคที่ไม่ได้รับการรักษา ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องรู้และรักษาโรคทางใบตั้งแต่เนิ่นๆ ผลลัพธ์ที่แตกต่างกันและบางครั้งการขาดผลลัพธ์ที่น่าพอใจนั้นเนื่องมาจากโรคที่มีความคล้ายคลึงกันในระดับสูง โดยต้องใช้ข้อมูลที่ครอบคลุมในการฝึกอบรมและเทคนิคสมัยใหม่ในการจำแนกโรค โปรเจ็กต์นี้มุ่งเน้นไปที่การตรวจหาโรคใบแอปเปิ้ล และจุดมุ่งหมายโดยรวมของการศึกษานี้คือเพื่อระบุโรคต่างๆ ในใบแอปเปิ้ลได้อย่างแม่นยำ โดยใช้การประมวลผลภาพและการเรียนรู้เชิงลึก เพื่อให้บรรลุเป้าหมายนี้ การศึกษาจึงเกี่ยวข้องกับการประมวลผลภาพ การดึงคุณสมบัติ และเทคนิคการเรียนรู้ของเครื่อง นอกเหนือจากวัตถุประสงค์หลักแล้ว ยังสามารถเน้นวัตถุประสงค์เฉพาะต่อไปนี้ได้:

วัตถุประสงค์ 1: ตรวจหาใบแอปเปิ้ลที่ป่วย และในกรณีนี้ เราเน้นไปที่โรค 3 ชนิด:

1: ตกสะเก็ด; 2: สนิม; 3: โรคหลายชนิด; และยังมีภาพลักษณ์ที่ดีต่อสุขภาพอีกด้วย

Obj2: ใช้โมเดลการเรียนรู้เชิงลึก

Obj3: ค้นหาค่าความแม่นยำสูงสุดและค่าต่ำสุดสำหรับการสูญเสีย

Obj4: ทดสอบโมเดลของเราและค้นหาผลลัพธ์ที่ดี

โครงสร้างโครงการ:

โครงการมีโครงสร้างตามขั้นตอนเหล่านี้:

1/ การอ่านและวิเคราะห์ข้อมูล: ในขั้นตอนนี้ เรามุ่งเน้นไปที่การอ่านข้อมูลที่เรามี ไฟล์แรกมีรูปภาพ และไฟล์ที่สองเป็นไฟล์ CSV

แล้ววิเคราะห์ข้อมูลโดยรู้จำนวนภาพในแต่ละขั้นตอน เราก็สามารถสร้างกราฟให้มีประสิทธิภาพมากขึ้นได้

ผลลัพธ์ของโครงการของเราแสดงอยู่ในแผนภูมิวงกลมนี้:

สุดท้ายเราก็พิมพ์ภาพออกมาเพื่อจะได้ดูและเรียนรู้ว่าโรคทางใบมีลักษณะอย่างไร

2/ การประมวลผลภาพล่วงหน้า: การประมวลผลภาพเป็นขั้นตอนสำคัญในแอปพลิเคชันแมชชีนเลิร์นนิงจำนวนมากที่เกี่ยวข้องกับข้อมูลภาพ สามารถใช้เพื่อแยกคุณสมบัติที่มีความหมายออกจากรูปภาพ ลบสัญญาณรบกวน ปรับปรุงคุณภาพของภาพ และเพิ่มความสามารถในการตีความข้อมูล

นอกจากนี้ การประมวลผลภาพยังเป็นเครื่องมือสำคัญในการเรียนรู้ของเครื่องสำหรับการประมวลผลล่วงหน้าและการเตรียมข้อมูลภาพสำหรับการวิเคราะห์และการสร้างแบบจำลอง

ในโครงการของเรา เราใช้ Image Denoising, Edge Detection โดยใช้ตัวกรอง Sobel, การแบ่งส่วนภาพ และการแบ่งส่วนข้อมูล

การลดสัญญาณรบกวนภาพ: เทคนิคการลดสัญญาณรบกวนภาพมีจุดมุ่งหมายเพื่อขจัดสัญญาณรบกวนในขณะที่ยังคงรักษาข้อมูลที่เป็นประโยชน์ในภาพไว้ ซึ่งสามารถทำได้โดยใช้ตัวกรองหรืออัลกอริธึมทางคณิตศาสตร์ที่วิเคราะห์ภาพและกำจัดสัญญาณรบกวนที่ไม่ต้องการ

การตรวจจับขอบโดยใช้ Sobel fiter:การตรวจจับขอบเป็นเทคนิคการประมวลผลภาพทั่วไปที่ใช้ในการระบุการเปลี่ยนแปลงที่คมชัดในความสว่างของภาพหรือค่าสี ฟิลเตอร์ Sobel เป็นฟิลเตอร์ตรวจจับขอบยอดนิยมที่ใช้ในการคำนวณการไล่ระดับสีของฟังก์ชันความเข้มของภาพ

การแบ่งส่วนภาพ:เป้าหมายของการแบ่งส่วนภาพคือการแบ่งภาพออกเป็นส่วนที่มีความหมายและเป็นเนื้อเดียวกัน ซึ่งสามารถวิเคราะห์ จดจำ หรือปรับแต่งเพิ่มเติมได้ ส่วนผลลัพธ์ควรมีความเกี่ยวข้องในการรับรู้หรือความหมาย เช่น วัตถุ ขอบเขต ขอบเขต หรือพื้นผิว การแบ่งส่วนอาจขึ้นอยู่กับคุณลักษณะต่างๆ ของรูปภาพ เช่น สี พื้นผิว ความเข้ม รูปร่าง หรือการเคลื่อนไหว

การเพิ่มข้อมูล:การเพิ่มข้อมูลมีประโยชน์ในสถานการณ์ที่ปริมาณข้อมูลที่มีอยู่จำกัด หรือชุดข้อมูลไม่สมดุล กล่าวคือ บางคลาสมีตัวอย่างน้อยกว่าคลาสอื่น ด้วยการใช้เทคนิคการเพิ่มข้อมูล เราสามารถสร้างตัวอย่างใหม่ที่คล้ายกับตัวอย่างต้นฉบับแต่มีการเปลี่ยนแปลงที่แตกต่างกัน ทำให้ชุดข้อมูลมีความสมดุลมากขึ้นและเพิ่มความทนทานของแบบจำลอง

3) การเตรียมชุดข้อมูลสำหรับการเรียนรู้เชิงลึก:

*การจัดการชุดข้อมูลที่ไม่สมดุล: การวิเคราะห์ข้อมูลเชิงสำรวจแสดงให้เห็นว่ากลุ่มโรคหลายชนิดอยู่ในกลุ่มน้อย ทำให้เกิดความไม่สมดุลระหว่างการแจกแจงกลุ่ม เพื่อแก้ไขปัญหานี้ อัลกอริธึม SMOTE จะถูกนำมาใช้เพื่อเพิ่มคลาสของชนกลุ่มน้อย

ผลลัพธ์ของการใช้อัลกอริทึม SMOTE แสดงในแผนภูมิวงกลมด้านล่าง:

*ปรับขนาดและทำให้รูปภาพเป็นมาตรฐาน: เราเปลี่ยนขนาดของรูปภาพทั้งหมดเป็น 224x 224

*แยกชุดข้อมูลออกเป็นการฝึกอบรมและการทดสอบ

4/ การใช้โมเดล CNN อย่างง่าย

5/ ใช้โมเดลการเรียนรู้แบบถ่ายโอน:โมเดลที่เราใช้คือ: VGG16, InceptionV3, ResNet50, ResNet101 และ DenseNet

6/ทดสอบโมเดลโดยใช้ชุดข้อมูลใหม่

7/ สร้างเมทริกซ์สหสัมพันธ์

ผลลัพธ์และการสนทนา:

แบบจำลอง CNN อย่างง่ายแสดงผลลัพธ์ที่ดีในการฝึกอบรม โดยสูญเสียการตรวจสอบความถูกต้องเท่ากับ 0.0013 และความแม่นยำในการตรวจสอบความถูกต้อง 100% แต่เมื่อเราทดสอบแล้วกลับไม่ได้ผลลัพธ์ที่ดี ความแม่นยำในการทดสอบคือ 50%

ในกรณีนี้ เราตัดสินใจใช้โมเดลการเรียนรู้แบบถ่ายโอนเนื่องจากได้รับการฝึกอบรมล่วงหน้าและจะแสดงผลการทดสอบที่ดีกว่า

เราเลือกแบบจำลองห้าแบบและเปลี่ยนแปลงพารามิเตอร์ เช่น อัตราการเรียนรู้ ฟังก์ชันตัวเพิ่มประสิทธิภาพ และขนาดแบทช์ เพื่อระบุผลลัพธ์ที่ดี

ในทุกกรณี เราพบว่า DenseNet ดีกว่าโดยให้การสูญเสียการตรวจสอบเท่ากับ 0.187 และความแม่นยำในการตรวจสอบเท่ากับ 97.18% หลังจากนั้น เราได้ทดสอบแบบจำลองนี้ และได้ผลลัพธ์ที่มีความแม่นยำดีถึง 90%

บทสรุป:

เราทำการวิเคราะห์แบบจำลองการเรียนรู้แบบถ่ายโอน 5 รูปแบบสำหรับการจำแนกและการตรวจหาโรคในแอปเปิล ประเมินประสิทธิภาพและสร้างข้อมูลเชิงลึก

DenseNet ให้ความแม่นยำและความน่าเชื่อถือในการจำแนกประเภทและการตรวจหาโรคในระดับสูงสุด ทำให้เป็นตัวเลือกที่ดีที่สุดสำหรับชุดข้อมูลนี้

เทคนิคการเรียนรู้เชิงลึกสามารถช่วยให้เกษตรกรและนักวิจัยระบุโรคได้ตั้งแต่เนิ่นๆ อำนวยความสะดวกในการแทรกแซงอย่างรวดเร็ว และลดผลกระทบของโรคต่อผลผลิตแอปเปิล จำเป็นต้องมีการศึกษาและพัฒนาเพิ่มเติมเพื่อใช้ระบบสนับสนุนการตัดสินใจอันชาญฉลาด