Введение:
Машинное обучение — это мощный способ решения сельскохозяйственных проблем, таких как прогноз урожайности, рекомендации и оптимизация культур, обнаружение болезней сельскохозяйственных культур и вредителей и т. д., и оно помогает фермерам, поскольку неправильный диагноз сельскохозяйственных болезней может привести к неправильному использованию пестицидов и вспышкам невылеченных болезней. поэтому важно знать и лечить болезнь листьев на ранней стадии. Эта разница в исходах, а иногда и отсутствие удовлетворительных результатов обусловлены высокой схожестью заболеваний, требующей использования обширных данных для обучения и современных методов классификации болезней. Этот проект направлен на обнаружение болезней листьев яблони, и общая цель этого исследования — точно определить различные болезни листьев яблони с помощью обработки изображений и глубокого обучения. Для этого в исследовании используются методы обработки изображений, выделения признаков и машинного обучения. Помимо основной цели, можно выделить следующие частные задачи:
Задача 1: Обнаружение больных листьев яблони, и в этом случае мы сосредоточились на трех заболеваниях:
1: парша; 2: ржавчина; 3: множественные заболевания; а также имеют здоровые изображения.
Цель 2: использовать модели глубокого обучения.
Obj3: Найдите самое высокое значение точности и самое низкое значение потерь.
Obj4: Протестируйте наши модели и получите хорошие результаты.
Структура проекта:
Структура проекта состоит из следующих этапов:
1/ Чтение и анализ данных. На этом этапе мы сосредоточились на чтении имеющихся у нас данных; первый файл содержит изображения, а второй — файл csv.
Затем проанализируйте данные, зная количество изображений на каждом этапе, и мы можем построить графики, чтобы быть более эффективными.
Результат нашего проекта показан на этой круговой диаграмме:
В конце мы распечатываем изображения, чтобы посмотреть и узнать, как выглядят болезни листьев.
2/ Предварительная обработка изображений. Обработка изображений – важный этап во многих приложениях машинного обучения, которые работают с визуальными данными. Его можно использовать для извлечения значимых признаков из изображений, удаления шума, улучшения качества изображения и улучшения интерпретируемости данных.
Кроме того, обработка изображений является важным инструментом машинного обучения для предварительной обработки и подготовки визуальных данных для анализа и моделирования.
В нашем проекте мы использовали шумоподавление изображения, обнаружение краев с помощью фильтра Собеля, сегментацию изображения и сегментацию данных.
Шумоподавление изображения. Методы шумоподавления изображения направлены на удаление шума при сохранении полезной информации в изображении. Это можно сделать, применяя фильтры или математические алгоритмы, которые анализируют изображение и удаляют нежелательный шум.
Обнаружение краев с помощью фильтра Собеля.Обнаружение краев — это распространенный метод обработки изображений, используемый для выявления резких переходов в значениях яркости или цвета изображения. Фильтр Собеля — это популярный фильтр обнаружения краев, который используется для вычисления градиента функции интенсивности изображения.
Сегментация изображения.Цель сегментации изображения — разделить изображение на значимые и однородные области, которые можно в дальнейшем анализировать, распознавать или манипулировать ими. Результирующие сегменты должны иметь некоторое отношение к восприятию или семантике, например объекты, регионы, границы или текстуры. Сегментация может основываться на различных характеристиках изображения, таких как цвет, текстура, интенсивность, форма или движение.
Увеличение данных.Увеличение данных полезно в сценариях, когда количество доступных данных ограничено или набор данных несбалансирован, т. е. в некоторых классах меньше примеров, чем в других. Применяя методы увеличения данных, мы можем создавать новые выборки, похожие на исходные, но с другими вариациями, что делает набор данных более сбалансированным и повышает надежность модели.
3) Подготовка набора данных для глубокого обучения:
* Обработка несбалансированного набора данных: Исследовательский анализ данных показал, что класс множественных заболеваний был в меньшинстве, что создавало дисбаланс между распределениями классов. Чтобы решить эту проблему, алгоритм SMOTE будет использоваться для увеличения класса меньшинства.
Результат применения алгоритма SMOTE показан на круговой диаграмме ниже:
*Измените размер и нормализуйте изображения: мы изменили размер всех изображений на 224x224.
* Разделите набор данных на обучение и тестирование.
4/ Использование простой модели CNN
5/ Используйте модели трансферного обучения: мы использовали следующие модели: VGG16, InceptionV3, ResNet50, ResNet101 и DenseNet.
6/Тестирование моделей с использованием нового набора данных
7/ Создайте корреляционную матрицу.
Результаты и обсуждение:
Простая модель CNN показала хорошие результаты при обучении с потерями при проверке, равными 0,0013, и точностью проверки 100%. но когда мы тестировали, хороших результатов не было; точность теста составила 50%.
В данном случае мы решили использовать модели трансферного обучения, потому что они предварительно обучены и будут показывать лучшие результаты тестов.
Мы выбрали пять моделей и изменили параметры, такие как скорость обучения, функция оптимизатора и размер пакета, чтобы определить хорошие результаты.
Во всех случаях мы обнаружили, что DenseNet лучше, давая потери при проверке, равные 0,187, и точность проверки, равную 97,18%. После этого мы протестировали модель, и она добилась хорошего результата точности 90%.
Вывод:
Мы провели анализ пяти моделей трансфертного обучения для классификации и обнаружения болезней яблони, оценили их эффективность и сделали выводы.
DenseNet обеспечивает высочайший уровень точности и надежности классификации и обнаружения заболеваний, что делает его лучшим вариантом для этого набора данных.
Методы глубокого обучения могут помочь фермерам и исследователям выявлять болезни на ранней стадии, способствовать оперативному вмешательству и уменьшать влияние болезней на урожайность яблок. Для внедрения интеллектуальных систем поддержки принятия решений необходимы дальнейшие исследования и разработки.