Введение:

Машинное обучение — это мощный способ решения сельскохозяйственных проблем, таких как прогноз урожайности, рекомендации и оптимизация культур, обнаружение болезней сельскохозяйственных культур и вредителей и т. д., и оно помогает фермерам, поскольку неправильный диагноз сельскохозяйственных болезней может привести к неправильному использованию пестицидов и вспышкам невылеченных болезней. поэтому важно знать и лечить болезнь листьев на ранней стадии. Эта разница в исходах, а иногда и отсутствие удовлетворительных результатов обусловлены высокой схожестью заболеваний, требующей использования обширных данных для обучения и современных методов классификации болезней. Этот проект направлен на обнаружение болезней листьев яблони, и общая цель этого исследования — точно определить различные болезни листьев яблони с помощью обработки изображений и глубокого обучения. Для этого в исследовании используются методы обработки изображений, выделения признаков и машинного обучения. Помимо основной цели, можно выделить следующие частные задачи:

Задача 1: Обнаружение больных листьев яблони, и в этом случае мы сосредоточились на трех заболеваниях:

1: парша; 2: ржавчина; 3: множественные заболевания; а также имеют здоровые изображения.

Цель 2: использовать модели глубокого обучения.

Obj3: Найдите самое высокое значение точности и самое низкое значение потерь.

Obj4: Протестируйте наши модели и получите хорошие результаты.

Структура проекта:

Структура проекта состоит из следующих этапов:

1/ Чтение и анализ данных. На этом этапе мы сосредоточились на чтении имеющихся у нас данных; первый файл содержит изображения, а второй — файл csv.

Затем проанализируйте данные, зная количество изображений на каждом этапе, и мы можем построить графики, чтобы быть более эффективными.

Результат нашего проекта показан на этой круговой диаграмме:

В конце мы распечатываем изображения, чтобы посмотреть и узнать, как выглядят болезни листьев.

2/ Предварительная обработка изображений. Обработка изображений – важный этап во многих приложениях машинного обучения, которые работают с визуальными данными. Его можно использовать для извлечения значимых признаков из изображений, удаления шума, улучшения качества изображения и улучшения интерпретируемости данных.

Кроме того, обработка изображений является важным инструментом машинного обучения для предварительной обработки и подготовки визуальных данных для анализа и моделирования.

В нашем проекте мы использовали шумоподавление изображения, обнаружение краев с помощью фильтра Собеля, сегментацию изображения и сегментацию данных.

Шумоподавление изображения. Методы шумоподавления изображения направлены на удаление шума при сохранении полезной информации в изображении. Это можно сделать, применяя фильтры или математические алгоритмы, которые анализируют изображение и удаляют нежелательный шум.

Обнаружение краев с помощью фильтра Собеля.Обнаружение краев — это распространенный метод обработки изображений, используемый для выявления резких переходов в значениях яркости или цвета изображения. Фильтр Собеля — это популярный фильтр обнаружения краев, который используется для вычисления градиента функции интенсивности изображения.

Сегментация изображения.Цель сегментации изображения — разделить изображение на значимые и однородные области, которые можно в дальнейшем анализировать, распознавать или манипулировать ими. Результирующие сегменты должны иметь некоторое отношение к восприятию или семантике, например объекты, регионы, границы или текстуры. Сегментация может основываться на различных характеристиках изображения, таких как цвет, текстура, интенсивность, форма или движение.

Увеличение данных.Увеличение данных полезно в сценариях, когда количество доступных данных ограничено или набор данных несбалансирован, т. е. в некоторых классах меньше примеров, чем в других. Применяя методы увеличения данных, мы можем создавать новые выборки, похожие на исходные, но с другими вариациями, что делает набор данных более сбалансированным и повышает надежность модели.

3) Подготовка набора данных для глубокого обучения:

* Обработка несбалансированного набора данных: Исследовательский анализ данных показал, что класс множественных заболеваний был в меньшинстве, что создавало дисбаланс между распределениями классов. Чтобы решить эту проблему, алгоритм SMOTE будет использоваться для увеличения класса меньшинства.

Результат применения алгоритма SMOTE показан на круговой диаграмме ниже:

*Измените размер и нормализуйте изображения: мы изменили размер всех изображений на 224x224.

* Разделите набор данных на обучение и тестирование.

4/ Использование простой модели CNN

5/ Используйте модели трансферного обучения: мы использовали следующие модели: VGG16, InceptionV3, ResNet50, ResNet101 и DenseNet.

6/Тестирование моделей с использованием нового набора данных

7/ Создайте корреляционную матрицу.

Результаты и обсуждение:

Простая модель CNN показала хорошие результаты при обучении с потерями при проверке, равными 0,0013, и точностью проверки 100%. но когда мы тестировали, хороших результатов не было; точность теста составила 50%.

В данном случае мы решили использовать модели трансферного обучения, потому что они предварительно обучены и будут показывать лучшие результаты тестов.

Мы выбрали пять моделей и изменили параметры, такие как скорость обучения, функция оптимизатора и размер пакета, чтобы определить хорошие результаты.

Во всех случаях мы обнаружили, что DenseNet лучше, давая потери при проверке, равные 0,187, и точность проверки, равную 97,18%. После этого мы протестировали модель, и она добилась хорошего результата точности 90%.

Вывод:

Мы провели анализ пяти моделей трансфертного обучения для классификации и обнаружения болезней яблони, оценили их эффективность и сделали выводы.

DenseNet обеспечивает высочайший уровень точности и надежности классификации и обнаружения заболеваний, что делает его лучшим вариантом для этого набора данных.

Методы глубокого обучения могут помочь фермерам и исследователям выявлять болезни на ранней стадии, способствовать оперативному вмешательству и уменьшать влияние болезней на урожайность яблок. Для внедрения интеллектуальных систем поддержки принятия решений необходимы дальнейшие исследования и разработки.