Herald of Technological University

ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА

3034-4689 3033-9219

98703

10.55421/3034-4689_2025_28_4_84

3. Информатика, вычислительная техника и управление

3. Information teory, computer technology and control

3. Информатика, вычислительная техника и управление

RECOGNITION OF ENGLISH CAPITAL LETTERS BASED ON CONVOLUTIONAL NEURAL NETWORK

НЕЙРОСЕТЕВОЕ РАСПОЗНАВАНИЕ РУКОПИСНЫХ БУКВ АНГЛИЙСКОГО АЛФАВИТА

Алексеева

А. А.

Alekseeva

A. A.

Катасёва

Д В

Kataseva

D V

Казанский национальный исследовательский технический университет им. А.Н. Туполева Kazan National Research Technical University named after A.N. Tupolev

Казанский национальный исследовательский технический университет имени А.Н. Туполева Казань Россия Казанский национальный исследовательский технический университет имени А.Н. Туполева Казань Russian Federation

01 08 2025

28 4 84 88

https://elibrary.ru/item.asp?id=81207648

В статье решается задача разработки сверточной нейросетевой модели для распознавания рукописных букв английского алфавита. Рассматриваются основные подходы к распознаванию символов. Отмечается, что традиционные методы оптического распознавания текста, основанные на правилах и статистических моделях, уступают место более гибким и эффективным нейросетевым подходам. Для реализации такого подхода выполнены следующие этапы: получение исходных данных для анализа, построение архитектуры нейросетевой модели, обучение модели и оценка результатов ее работы. Для построения модели выбран общедоступный набор данных EMNIST на платформе Kaggle, содержащий 88800 изображений рукописных букв английского алфавита. Для наглядности приведен пример изображений из набора данных. Описана архитектура нейросетевой модели. В качестве платформы для ее обучения использована среда моделирования MATLAB. Для обучения нейронной сети использован оптимизатор Adam с начальной скоростью обучения 0.00 1 и максимальным количеством эпох, равным 10. Размер пакета был установлен на уровне 64, что обеспечивало баланс между скоростью обучения и качеством обновлений весов. Обучение модели осуществлялось с помощью функции trainNetwork, которая принимала подготовленный набор изображений и меток. Каждая эпоха обучения включала в себя расчет точности, что позволяло следить за ходом построения модели. Точность нейросетевой модели после обучения составила 92%. Для оценки результатов работы нейросетевого классификатора изображений была построена матрица ошибок, анализ которой позволил сделать вывод, что у нейросетевой модели возникают трудности с рас-познаванием букв «i» и «l» поскольку эти буквы очень похожи и, исходя из разных почерков и небольших шумов, становится невозможным определить без дополнительной информации, какая из букв представлена на изображении. Для проверки устойчивости модели к внешним искажениям проведено исследование, включающее добавление случайного гауссовского шума к изображениям из тестовой выборки. После добавления шума точность нейросетевой классификации снизилась с 92% до 88,27%. Это указывает на то, что модель сохраняет относительно высокую точность, несмотря на наличие зашумленных данных. Построенная модель показала высокую точность распознавания изображений английских рукописных букв. Несмотря на снижение точности при добавлении шумов и искажений, модель продемонстрировала хорошую обобщающую способность. Это указывает на ее адекватность и возможность эффективного практического использования.

The article solves the problem of developing a convolutional neural network model for recognizing handwritten letters of the English alphabet. The main approaches to character recognition are considered. It is noted that traditional methods of optical character recognition based on rules and statistical models are giving way to more flexible and efficient neural network approaches. To implement this approach, the following steps were performed: obtaining the initial data for analysis, building the architecture of the neural network model, training the model and evaluating the results of its operation. To build the model, a publicly available EMNIST dataset on the Kaggle platform was selected, containing 88,800 images of handwritten letters of the English alphabet. For clarity, an example of images from the dataset is provided. The architecture of the neural network model is described. The MATLAB modeling environment was used as a platform for its training. The Adam optimizer with an initial learning rate of 0.001 and a maximum number of epochs of 10 was used to train the neural network. The batch size was set at 64, which ensured a balance between the learning rate and the quality of weight updates. The model was trained using the trainNetwork function, which accepted a prepared set of images and labels. Each training epoch included an accuracy calculation, which made it possible to monitor the progress of model construction. The accuracy of the neural network model after training was 92%. To evaluate the performance of the neural network image classifier, an error matrix was constructed, the analysis of which allowed us to conclude that the neural network model has difficulties recognizing the letters "i" and "l" since these letters are very similar and, based on different handwritings and small noises, it becomes impossible to determine without additional information which of the letters is presented in the image. To test the model's robustness to external distortions, a study was conducted that included adding random Gaussian noise to the images from the test set. After adding noise, the accuracy of the neural network classification decreased from 92% to 88.27%. This indicates that the model maintains relatively high accuracy despite the presence of noisy data. The constructed model demonstrated high accuracy of recognition of images of English handwritten letters. Despite the decrease in accuracy when adding noise and distortions, the model demonstrated good generalization ability. This indicates its adequacy and the possibility of effective practical use.

СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ КОМПЬЮТЕРНОЕ ЗРЕНИЕ НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ РУКОПИСНЫЕ СИМВОЛЫ БУКВЫ АНГЛИЙСКОГО АЛФАВИТА

CONVOLUTIONAL NEURAL NETWORK COMPUTER VISION NEURAL NETWORK MODELING IMAGE RECOGNITION HANDWRITTEN CHARACTERS LETTERS OF THE ENGLISH ALPHABET