ГЕНЕРАЦИЯ ВИДЕО ПОДСТИЛАЮЩЕЙ ПОВЕРХНОСТИ НА ОСНОВЕ ОДИНОЧНОГО СНИМКА

Колобова Дарья Алексеевна; Шлеймович Михаил Петрович

doi:doi:10.55421/3034-4689_2025_28_12_124

Главная / Журналы / ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА / Том 28 Номер 12 / ГЕНЕРАЦИЯ ВИДЕО ПОДСТИЛАЮЩЕЙ ПОВЕРХНОСТИ НА ОСНОВЕ ОДИНОЧНОГО СНИМКА

ГЕНЕРАЦИЯ ВИДЕО ПОДСТИЛАЮЩЕЙ ПОВЕРХНОСТИ НА ОСНОВЕ ОДИНОЧНОГО СНИМКА

Отправить рукопись Скачать PDF
Текст

Цитировать

Цитирований:

ГЕНЕРАЦИЯ ВИДЕО ПОДСТИЛАЮЩЕЙ ПОВЕРХНОСТИ НА ОСНОВЕ ОДИНОЧНОГО СНИМКА

Журнал: ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА Том 28 № 12 , 2026

Рубрики: 3. ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

Колобова Дарья Алексеевна ¹

Шлеймович Михаил Петрович ²

Информация об авторах и публикации

Авторы:

1. Казанский национальный исследовательский технический университет им. А.Н. Туполева (АСОИУ, инженер)
сотрудник

Казанский национальный исследовательский технический университет им. А.Н. Туполева
студент с 01.01.2024 по настоящее время

2. Казанский национальный исследовательский технический университет им. А.Н. Туполева (Кафедра автоматизированных систем обработки информации и управления, Заведующий кафедрой)
сотрудник с 01.01.1997 по настоящее время

Россия

Тип:

Статья

DOI:

https://doi.org/10.55421/3034-4689_2025_28_12_124

Страницы:

с 124 по 134

Статус:

Опубликован

Получено:

28.01.2026

Одобрено:

28.01.2026

Опубликовано:

28.01.2026

Язык материала:

русский

Ключевые слова:

НЕЙРОННЫЕ СЕТИ, ГЕНЕРАЦИЯ ВИДЕО, ОБРАБОТКА ИЗОБРАЖЕНИЙ, КАДР, ДИФФУЗИОННЫЕ МОДЕЛИ, ИНТЕРПОЛЯЦИЯ, ЦВЕТОВЫЕ ХАРАКТЕРИСТИКИ

Аннотация и ключевые слова

Аннотация:
Генерация видео является одной из наиболее актуальных и сложных задач в области искусственного интеллекта и компьютерного зрения. Ее решение открывает широкие возможности для креативных индустрий, бизнеса, образования, маркетинга. Однако генерация продолжительного, семантически связного видео с высоким разрешением остается нерешенной проблемой. Этим объясняется необходимость создания новых, а также исследования уже существующих моделей. В данной статье проводится сравнительный анализ основных методов генерации видео: вариационных автоэнкодеров (VAE), генеративно-состязательных сетей (GAN), авторегрессионных, flow-based и диффузионных моделей. Рассматриваются их ключевые архитектурные особенности, достоинства и недостатки. Особое внимание в работе уделено диффузионным моделям, которые на данный момент являются передовым подходом для решения задачи генерации видео. За последние несколько лет появилось огромное количество диффузионных моделей генерации видео, среди которых наиболее известными являются Sora (OpenAI), Gen-3 (Runway), Kandinsky (Sber AI), Stable Video Diffusion (Stability AI). Однако большинство из них являются закрытыми, коммерческими продуктами, исходный код и архитектура которых недоступны для исследования и модификации. Для реализации генерации в работе используется диффузионная модель с открытым исходным кодом Stable Video Diffusion. Практическая часть исследования включает генерацию видео на основе исходного изображения подстилающей поверхности, а также анализ полученного результата. Сгенерированные видеопоследовательности могут быть использованы для симуляции различных полетных сценариев и расширения датасетов для беспилотных летательных аппаратов (БПЛА). В ходе анализа качества сгенерированного видео выявлено, что для предотвращения накопления артефактов и ошибок генерации требуется дополнительная обработка последовательности кадров после 10-13 кадра видео. Анализ проводился с помощью набора метрик, отражающих изменение цветовых характеристик и текстуры сгенерированного видео.

Ключевые слова:
НЕЙРОННЫЕ СЕТИ, ГЕНЕРАЦИЯ ВИДЕО, ОБРАБОТКА ИЗОБРАЖЕНИЙ, КАДР, ДИФФУЗИОННЫЕ МОДЕЛИ, ИНТЕРПОЛЯЦИЯ, ЦВЕТОВЫЕ ХАРАКТЕРИСТИКИ

Текст

Текст (PDF): Читать Скачать

Отправить рукопись Скачать PDF
Текст JATS XML

Цитировать

Цитирований:

Подтверждение

Регистрация