НЕЙРОСЕТЕВОЕ РАСПОЗНАВАНИЕ РУКОПИСНЫХ БУКВ АНГЛИЙСКОГО АЛФАВИТА
Аннотация и ключевые слова
Аннотация (русский):
В статье решается задача разработки сверточной нейросетевой модели для распознавания рукописных букв английского алфавита. Рассматриваются основные подходы к распознаванию символов. Отмечается, что традиционные методы оптического распознавания текста, основанные на правилах и статистических моделях, уступают место более гибким и эффективным нейросетевым подходам. Для реализации такого подхода выполнены следующие этапы: получение исходных данных для анализа, построение архитектуры нейросетевой модели, обучение модели и оценка результатов ее работы. Для построения модели выбран общедоступный набор данных EMNIST на платформе Kaggle, содержащий 88800 изображений рукописных букв английского алфавита. Для наглядности приведен пример изображений из набора данных. Описана архитектура нейросетевой модели. В качестве платформы для ее обучения использована среда моделирования MATLAB. Для обучения нейронной сети использован оптимизатор Adam с начальной скоростью обучения 0.00 1 и максимальным количеством эпох, равным 10. Размер пакета был установлен на уровне 64, что обеспечивало баланс между скоростью обучения и качеством обновлений весов. Обучение модели осуществлялось с помощью функции trainNetwork, которая принимала подготовленный набор изображений и меток. Каждая эпоха обучения включала в себя расчет точности, что позволяло следить за ходом построения модели. Точность нейросетевой модели после обучения составила 92%. Для оценки результатов работы нейросетевого классификатора изображений была построена матрица ошибок, анализ которой позволил сделать вывод, что у нейросетевой модели возникают трудности с рас-познаванием букв «i» и «l» поскольку эти буквы очень похожи и, исходя из разных почерков и небольших шумов, становится невозможным определить без дополнительной информации, какая из букв представлена на изображении. Для проверки устойчивости модели к внешним искажениям проведено исследование, включающее добавление случайного гауссовского шума к изображениям из тестовой выборки. После добавления шума точность нейросетевой классификации снизилась с 92% до 88,27%. Это указывает на то, что модель сохраняет относительно высокую точность, несмотря на наличие зашумленных данных. Построенная модель показала высокую точность распознавания изображений английских рукописных букв. Несмотря на снижение точности при добавлении шумов и искажений, модель продемонстрировала хорошую обобщающую способность. Это указывает на ее адекватность и возможность эффективного практического использования.

Ключевые слова:
СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ, КОМПЬЮТЕРНОЕ ЗРЕНИЕ, НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ, РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ, РУКОПИСНЫЕ СИМВОЛЫ, БУКВЫ АНГЛИЙСКОГО АЛФАВИТА
Войти или Создать
* Забыли пароль?