Статья посвящена решению задачи определения возраста человека по фотографии на основе построения и исследования нейросетевых сверточных моделей. Показано, что возраст человека является одним из значимых факторов, подлежащих определению при анализе изображений в ряде прикладных задач. Сфера применения систем автоматического определения возраста широка и включает такие направления как системы видеонаблюдения и контроля доступа, контентная фильтрация в онлайн-сервисах, маркетинг и персонализация рекламы, цифровые технологии в образовании, медицинская диагностика, дополненная и виртуальная реальность. Возрастные изменения, как правило, затрагивают следующие характеристики: наличие морщин, изменение овала лица, изменение цвета и текстуры кожи, опущение век, изменение формы губ и подбородка. Визуальные признаки могут быть замаскированы косметикой, медицинскими процедурами, стилем жизни, а также отличаться в зависимости от этнической принадлежности. Это делает задачу определения возраста по изображению особенно сложной. Поэтому для решения задачи определения возраста целесообразно использовать современные методы глубокого обучения. В работе для решения этой задачи применен подход на основе сверточных нейронных сетей. Для его реализации выполнены следующие этапы: получение и подготовка данных для анализа, выбор библиотек и архитектур для построения нейросетевых сверточных моделей, обучение нейросетевых сверточных моделей, оценка результатов работы моделей. Для реализации первого этапа выбраны следующие общедоступные наборы данных: Facial Age и UTKFace. Всего было реализовано три сценария подготовки данных: классификация по точному возрасту, классификация по одиннадцати возрастным диапазонам и классификация по пяти укрупненным возрастным категориям. Общее число изображений для классификации составило около 14000, из которых обучающая выборка содержала 9734, а валидационная - 4238 изображений. Для построения нейросетевых моделей использован язык программирования Python, а также библиотеки и фреймворки TensorFlow, NumPy, Matplotlib, Seaborn, Scikit-learn, Pillow и Tkinter. Рассмотрены и сравнены две архитектуры сверточных нейронных сетей: ResNet50V2 и YOLOv8n. Архитектура YOLOv8n продемонстрировала преимущество перед ResNet50V2 по каждой из метрик Accuracy, Macro F1-score и Weighted F1-score. Выявлены проблемы с классификацией средневозрастных групп, что указало на необходимость дополнительной балансировки обучающей выборки и применения методов аугментации.
ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА, ВОЗРАСТ ЧЕЛОВЕКА, НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ, СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ, YOLOV8N, RESNET50V2, КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ



