НЕЙРОСЕТЕВЫЕ СВЕРТОЧНЫЕ МОДЕЛИ ОБНАРУЖЕНИЯ И РАСПОЗНАВАНИЯ СИГНАЛОВ СВЕТОФОРА
Аннотация и ключевые слова
Аннотация (русский):
Статья посвящена построению и исследованию сверточных нейросетевых моделей для обнаружения и распознавания сигналов светофора. Для решения этих задач используются различные методы и алгоритмы, такие как цветовые фильтры, сопоставление адаптивных шаблонов, контурный анализ, методы машинного обучения, алгоритмы компьютерного зрения. Многие технологические компании создают системы для распознавания сигналов светофора и элементов дорожной инфраструктуры. В данной работе для распознавания сигналов светофора проведен сравнительный анализ двух архитектур сверточных нейронных сетей: YOLOv8n и Faster R-CNN. Выбор этих архитектур обусловлен их высокой эффективностью в решении задач обнаружения и распознавания объектов на изображениях. Решение поставленных задач потребовало реализации следующих этапов: сбора и подготовки исходного набора данных для моделирования, выбора необходимого инструментария для построения моделей, выбора архитектуры и обучения сверточных нейронных сетей, а также проведения экспериментальных исследований на базе построенных моделей. В качестве исходного набора данных выбран набор LISA, содержащий большое количество различных обучающих примеров в виде изображений размера 1280×960. Исходные данные были разделены на обучающую, валидационную (для контроля переобучения) и тестовую (для оценки адекватности моделей) выборки в пропорциях 80%, 10% и 10%. Ночные и дневные снимки были равномерно распределены между всеми выборками. Кроме того, для аугментации исходных данных применялись геометрические преобразования и изменения изображения на уровне пикселей: поворот на небольшой угол, обрезка, масштабирование, изменение яркости и насыщенности изображения. Итоговое количество изображений составило 43107, включая 34485 примеров для обучения моделей, 4311 - для их валидации и 4311 - для тестирования. В качестве языка программирования выбран Python. При обучении значение функции потерь для сети Faster R-CNN составило 0,11, а для YOLOv8n - 0,25. При этом обе модели показали приемлемые результаты при распознавании как ближних, так и дальних объектов. При этом наиболее эффективной оказалась модель YOLOv8n. Она незначительно уступает в точности, однако примерно в 5,5 раз быстрее производит распознавание сигналов светофора по сравнению с Faster R-CNN. Это позволяет использовать ее в режиме реального времени, например, в системах автономного управления транспортными средствами.

Ключевые слова:
СИГНАЛЫ СВЕТОФОРА, СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ, РАСПОЗНАВАНИЕ ОБЪЕКТОВ, МОДЕЛЬ FASTER R-CNN, МОДЕЛЬ YOLOV8N
Войти или Создать
* Забыли пароль?