Аннотации:
В Российской Федерации агропромышленный комплекс является одной из лидирующих
отраслей экономики с объемом внутреннего валового продукта 4,5 %. России принадлежат
10 % всех пахотных земель мира. Согласно данным о посевных площадях по культурам в
2020 году, большую часть сельскохозяйственных площадей России занимает пшеница. Российская Федерация занимает третье место в рейтинге стран-лидеров по производству данного
вида зерновых культур, а также лидирующие позиции по ее экспорту. Бурая (листовая) и линейная (стеблевая) ржавчина – наиболее вредоносная болезнь зерновых культур. Она является
причиной изреженности посевов пшеницы и приводит к резкому снижению урожайности.
Поэтому одной из главных задач аграриев является сохранение урожая от заболеваний. Помочь справиться с этой задачей способно применение таких областей искусственного интеллекта, как компьютерное зрение, машинное обучение и глубокое обучение. Данные технологии искусственного интеллекта позволяют успешно решать прикладные задачи агропромышленного комплекса при помощи автоматизированного анализа фотоматериалов. Цель исследования. Рассмотреть применение методов компьютерного зрения для задачи классификации
поражений культурных растений на примере пшеницы. Материалы и методы. Набор данных
CGIAR Computer Vision for Crop Disease для задачи распознавания поражений культурных
растений взят из открытого источника Kaggle. Предлагается использовать подход к распознаванию поражений культурных растений с использованием известных нейросетевых моделей
ResNet50, DenseNet169, VGG16 и EfficientNet-B0. На вход нейросетевым моделям поступают
изображения пшеницы. Выходом нейронных сетей является класс поражения растения. Для
преодоления эффекта переобучения нейронных сетей исследуются различные техники регуляризации. Результаты. Приводятся результаты качества классификации, оцениваемые с использованием метрики F1-score, являющейся среднегармоническим между мерами Precision и
Recall. Заключение. В результате проведенного исследования установлено, что наилучшую
точность распознавания показала модель DenseNet c применением комбинации технологии
трансферного обучения и технологий регуляризации DropOut и L2 для преодоления эффекта
переобучения. Применение данного подхода позволило достичь точности распознавания 91 %. In the Russian Federation, the agro-industrial complex is one of the leading sectors of the economy
with a volume of domestic product of 4.5%. Russia owns 10 % of all arable land in the world.
According to the data on the sown areas by crops in 2020, most of the agricultural area of Russia is
occupied by wheat. The Russian Federation ranks third in the ranking of leading countries in
the production of this type of grain crops, as well as leading positions in its export. Brown (leaf) and
linear (stem) rust is the most harmful disease of grain crops. It is the reason for the sparseness of
wheat crops and leads to a sharp decrease in yield. Therefore, one of the main tasks of farmers is to
preserve the crop from diseases. The application of such areas of artificial intelligence as computer
vision, machine learning and deep learning is able to cope with this task. These artificial intelligence
technologies allow us to successfully solve applied problems of the agro-industrial complex using
automated analysis of photographic materials. Aim. To consider the application of computer vision
methods for the problem of classification of lesions of cultivated plants on the example of wheat.
Materials and methods. The CGIAR Computer Vision for Crop Disease dataset for the crop disease
recognition task is taken from the open source Kaggle. It is proposed to use an approach to the recognition
of lesions of cultivated plants using the well-known neural network models ResNet50,
DenseNet169, VGG16 and EfficientNet-B0. Neural network models receive images of wheat as input.
The output of neural networks is the class of plant damage. To overcome the effect of overfitting
neural networks, various regularization techniques are investigated. Results. The results of the classification
quality, estimated by the software using the F1-score metric, which is the average harmonic
between the Precision and Recall measures, are presented. Conclusion. As a result of the conducted research,
it was found that the DenseNet model showed the best recognition accuracy using a combination
of transfer learning technology and DropOut and L2 regulation technologies to overcome the effect
of retraining. The use of this approach allowed us to achieve a recognition accuracy of 91%.
Описание:
Янишевская Наталья Александровна, студент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; natalia.yanishevskaya1997@yandex.ru.
Болодурина Ирина Павловна, д-р техн. наук, профессор, заведующий кафедрой прикладной математики, Оренбургский государственный университет, г. Оренбург; prmat@mail.osu.ru. N.A. Yanishevskaya, natalia.yanishevskaya1997@yandex.ru,
I.P. Bolodurina, prmat@mail.osu.ru
Orenburg State University, Orenburg, Russian Federation