НЕЙРОСЕТЕВАЯ МОДЕЛЬ РАСПОЗНАВАНИЯ ДИПФЕЙКОВЫХ ИЗОБРАЖЕНИЙ

Черкасов П. А.; Хусаинов Р М; Талипов Н. Г.

doi:doi:10.55421/3034-4689_2026_29_5_102

Главная / Журналы / ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА / Том 29 Номер 5 / НЕЙРОСЕТЕВАЯ МОДЕЛЬ РАСПОЗНАВАНИЯ ДИПФЕЙКОВЫХ ИЗОБРАЖЕНИЙ

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

НЕЙРОСЕТЕВАЯ МОДЕЛЬ РАСПОЗНАВАНИЯ ДИПФЕЙКОВЫХ ИЗОБРАЖЕНИЙ

Журнал: ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА Том 29 № 5 , 2026

Рубрики: 3. ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

Черкасов П. А. ¹

Хусаинов Р М ²

Талипов Н. Г. ³

Информация об авторах и публикации

Авторы:

1. Казанский национальный исследовательский технический университет им. А.Н. Туполева

2. Казанский национальный исследовательский технический университет им. А.Н. Туполева

3. Казанский национальный исследовательский технический университет им. А.Н. Туполева

Тип:

Статья

DOI:

https://doi.org/10.55421/3034-4689_2026_29_5_102

EDN:

https://elibrary.ru/QMZEDX

Страницы:

с 102 по 108

Статус:

Опубликован

Получено:

06.05.2026

Одобрено:

20.05.2026

Опубликовано:

01.06.2026

Язык материала:

русский

Ключевые слова:

ДИПФЕЙК, ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ, НЕЙРОСЕТЕВАЯ МОДЕЛЬ, СГЕНЕРИРОВАННОЕ ИЗОБРАЖЕНИЕ, РАСПОЗНАВАНИЕ ДИПФЕЙКОВ, НЕЙРОННАЯ СЕТЬ

Аннотация и ключевые слова

Аннотация:
В статье рассмотрена задача распознавания дипфейковых изображений с использованием нейросетевой модели. Проводится обзор современных исследований дипфейков на изображениях, выявляются преимущества и недостатки существующих методов распознавания. Проводится анализ существующих наборов данных (датасетов) реальных изображений и дипфейков, обосновывается выбор наиболее пригодного для обучения, валидации и тестирования нейросетевой модели. В результате анализа наборов данных в качестве исходного набора выбран датасет ArtiFact (Real and Fake Image Dataset), содержащий более 2 миллионов изображений, 19 генераторов изображений и 11 источников реальных изображений. Учитывая ограниченные вычислительные ресурсы среды, решено не использовать найденный датасет полностью, а отобрать необходимые изображения для создания собственных датасетов: final (обучающая, валидационная, тестовая выборки), controlA, controlB. Анализируются архитектуры нейронных сетей для использования в рамках задачи распознавания дипфейковых изображений. Для распознавания дипфейковых изображений использована модель Xception. Размер входного изображения для модели установлен по умолчанию - 299×299. В качестве инструментов обучения нейросетевой модели в работе задействованы облачная среда Google Kolab, локальная среда выполнения кода (Jupyter Notebook), использован язык программирования Python. Проводится обучение нейросетевой модели, подбор оптимального процесса обучения и гиперпараметров модели. Выполнено сравнение двух подходов к распознаванию дипфейковых изображений: модифицированной нейросетевой модели Xception с трансформерным заголовком и ансамбля из четырех моделей (Xception, Efficientnet-B4, ConvNeXt, Swin Transformer.). По результатам анализа выявлено, что модель CNN+tr.head демонстрирует высокие результаты метрик на тестовой выборке (F1 = 0,9105), однако чувствительна к новым типам генераторов, что выражается в падении метрики F1 на контрольной выборке до 0,7414. Ансамблевый подход, напротив, обеспечивает более высокую робастность при распознавании изображений, сгенерированных ранее неизвестными моделями (метрика F1 на контрольной выборке - 0,8082).

Ключевые слова:
ДИПФЕЙК, ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ, НЕЙРОСЕТЕВАЯ МОДЕЛЬ, СГЕНЕРИРОВАННОЕ ИЗОБРАЖЕНИЕ, РАСПОЗНАВАНИЕ ДИПФЕЙКОВ, НЕЙРОННАЯ СЕТЬ

Текст

Текст (PDF): Читать Скачать

Список литературы

1. Дипфейк. URL: https://ru.wikipedia.org/wiki/ Дипфейк (дата обращения 02.03.2026).

2. Что такое дипфейки, для чего их используют и чем они опасны. URL: https://practicum.yandex.ru/blog/chto-takoedeepfake-i-kak-zashchititsya/#chto-takoye-dipfeyk (дата обращения 24.04.2026).

3. Неренц Д.В., Филология: научные исследования, 9, 96-111 (2025).

4. Yong Y., Zhihao Q., Ye Z., Russakovsky O., Yu W., Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 23850–23859 (2025). DOI: https://doi.org/10.1109/CVPR52734.2025.02221

5. Junyu S., Minghui L., Junguo Z., Zhifei Yu, Yipeng L., Shengshan H., Ziqi Z., Yechao Z., Wei W., Yinzhe X., Leo Yu Z, 39th Conference on Neural Information Processing Systems (NeurIPS), 1-13 (2025).

6. Пикуль А.С., Безопасность информационных технологий, 31, 4, 116-127 (2024). DOI: https://doi.org/10.26583/bit.2024.4.08

7. Воронов С.А., Информация и безопасность, 28, 1, 103-110 (2025). DOI: https://doi.org/10.1504/IJICS.2025.148456

8. Андриянов А.М., Научно-технический вестник Поволжья, 1, 169-172 (2025).

9. Гришаев Д.А., Вестник Пензенского государственного университета, 1 (49), 28-31 (2025).

10. Гарифуллин Н.Б., Молодежная школа-семинар по проблемам управления в технических системах имени А.А. Вавилова. 1, 13-15 (2024).

11. Мантуленко А.И., Математические методы в технологиях и технике, 5, 97-101 (2025).

12. Петрин Д.А., Известия Института инженерной физики, 1 (59), 56-60 (2021).

13. Набор данных genimage. URL: https://drive.google.com/drive/folders/1jGt10bwTbhEZuGXLyvrCuxOI0cBqQ1FS (дата обращения 09.03.2026).

14. Datasets: InfImagine / FakeImageDataset. URL: https://huggingface.co/datasets/InfImagine/FakeImageDataset (дата обращения 09.03.2026).

15. ArtiFact: Real and Fake Image Dataset. URL: https://elibrary.ru/item.asp?id=49175611 (дата обращения 09.03.2026).

16. Datasets: yanbax / CIFAKE_autotrain_compatible. URL: https://huggingface.co/datasets/yanbax/CIFAKE_autotrain_compatible (дата обращения 09.03.2026).

17. Synthbuster: Towards Detection of Diffusion Model Generated Images. URL: https://zenodo.org/records/10066460 (дата обращения 09.03.2026).

18. GitHub: opendatalab / LEGION. URL: https://github.com/opendatalab/LEGION (дата обращения 09.03.2026).

19. Гагарина А.И., Современная педагогика и научные исследования в образовательной организации высшего образования: материалы Всероссийской научно-методической конференции, 694-704 (2022).

20. Акобия В.З., Современные тенденции развития и перспективы внедрения инновационных технологий в машиностроении, образовании и экономике, 7, 1, 136-138 (2025).

21. Сверточная нейронная сеть, часть 1: структура, топология, функции активации и обучающее множество // habr.com [сайт]. – URL: https://habr.com/ru/articles/348000/ (дата обращения: 24.04.2026).

22. Иванов П.П., Цифровой регион: опыт, компетенции, проекты: сборник статей VII Международной научно-практической конференции, посвященной 95-летнему Юбилею Брянского государственного инженерно-технологического университета, 314-318 (2025).

23. Xception: компактная глубокая нейронная сеть. URL: https://habr.com/ru/articles/347564/ (дата обращения: 24.04.2026).

24. Использование моделей EfficientNet для классификации изображений. URL: https://habr.com/ru/companies/sberbank/articles/828842/ (дата обращения: 24.04.2026).

25. Обзор – ConvNet для 2020. URL: https://habr.com/ru/companies/otus/articles/654279/ (дата обращения: 24.04.2026).

26. Обзор архитектуры Swin Transformer. URL: https://habr.com/ru/articles/599057/ (дата обращения: 24.04.2026).

27. Ансамблевые методы машинного обучения. URL: https://habr.com/ru/articles/571296/ (дата обращения: 24.04.2026).

Отправить рукопись Скачать PDF
Текст JATS XML

Цитировать

Цитирований:

Подтверждение

Регистрация