Представленная работа посвящена описанию создания программного приложения для автоматической генерации музыкальных MIDI-композиций с использованием нейросетевой модели LSTM. Проанализированы различные архитектуры нейросетей: LSTM, GAN, трансформеры и диффузионные модели. Выбрана модель LSTM как наиболее устойчивая и адаптивная для генерации последовательностей, обученная на музыкальных фрагментах, с последующей генерацией мелодий и сохранением результатов в формате MIDI. Токенизация музыкальных данных (в формате MIDI) была реализована через представление pianoroll, что позволило преобразовать музыку в последовательности, пригодной для подачи в нейросеть. Реализована архитектура нейросети и пользовательский интерфейс. Разработанный пользовательский интерфейс обеспечивает ввод параметров генерации и скачивание готового файла. Также реализована система серверной логики на фреймворке Flask. Проведено тестирование, подтверждающее работоспособность системы и качество получаемых музыкальных последовательностей. В ходе разработки приложения были также выявлены и устранены проблемы, связанные с производительностью модели и качеством генерации музыки. Результатом является рабочий прототип, обеспечивающий автоматическую генерацию музыки. Основные характеристики продукта: генерация MIDI-композиций с настройкой параметров (темп, длина, творческая вариативность); простой и интуитивно понятный интерфейс; локальная обработка данных, не требующая подключения к интернету; бесплатный прототип на этапе разработки, с перспективой перехода на freemium-модель.
НЕЙРОСЕТЕВАЯ МОДЕЛЬ LSTM, ГЕНЕРАЦИЯ МУЗЫКАЛЬНЫХ КОМПОЗИЦИЙ, MIDI-КОМПОЗИЦИИ, ТОКЕНИЗАЦИЯ МУЗЫКАЛЬНЫХ ДАННЫХ



