ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ МОДЕЛИ ОЦЕНКИ ЗДОРОВЬЯ СЕРДЦА ЧЕЛОВЕКА НА ОСНОВЕ МЕТОДА K-БЛИЖАЙШИХ СОСЕДЕЙ
Аннотация и ключевые слова
Аннотация:
Статья посвящена построению и исследованию интеллектуальной модели оценки здоровья сердца человека. Отмечается, что диагностика состояния сердечно-сосудистой системы человека является одной из актуальных тем в области машинного обучения и искусственного интеллекта. Использование алгоритмов машинного обучения для решения этой задачи позволяет выявлять предвестники заболеваний, оценивать риски и предоставлять персонализированные рекомендации по лечению и образу жизни человека. Рассмотрено понятие здорового сердца, приведена классификация сердечно-сосудистых заболеваний, проанализированы методы и этапы их диагностики, актуализирована целесообразность построения интеллектуальной модели для оценки здоровья сердца человека. Для построения модели выбран метод k-ближайших соседей, используемый для решения задач классификации. Для обучения и тестирования модели выбран набор данных «Heart Disease Dataset (Comprehensive)» из общедоступного источника Kaggle. Набор состоит из 1190 записей с информацией о пациентах с сердечно-сосудистыми заболеваниями. Выходных класса два - «0» (здоров) и 1 (риск наличия заболевания). Соотношение классов в наборе данных составляет 47,14 % («0») и 52,86 % («1»). Для оценки взаимозависимости данных произведен корреляционный анализ. Все данные случайным образом разделены на обучающую и тестовую выборки в соотношении 80/20. Объем обучающей выборки составил 952 записи, а тестовой - 238. Для построения модели использовались средства библиотеки sklearn на Python, а также средство для работы с блокнотами Kaggle. В качестве ускорителя применялся ускоритель GPU P100, что позволило значительно сократить время построения и оценки модели. При помощи функции classification_report библиотеки sklearn проведена оценка построенной модели по различным метрикам на тестовой выборке данных. Значения метрик были вычислены для каждого класса. Результаты расчета метрик позволили сделать вывод об адекватности построенной модели. Также проведена оценка построенной модели на тестовой выборке данных при помощи метрики AUC-ROC. Значение метрики составило 0,9747. Кроме того, проведено сравнение точности построенной модели с точностью других методов классификации. Для сравнения были выбраны наиболее популярные решения, представленные на платформе Kaggle. Построенная модель показала более высокие результаты по сравнению с другими известными методами, что указывает на ее эффективность. Таким образом, построенную модель можно эффективно использовать в качестве инструмента для оценки здоровья сердца человека, например, на базе настольного или веб-приложения.

Ключевые слова:
ИНТЕЛЛЕКТУАЛЬНАЯ МОДЕЛЬ, КЛАССИФИКАЦИЯ, ОЦЕНКА ЗДОРОВЬЯ СЕРДЦА, СЕРДЕЧНО-СОСУДИСТЫЕ ЗАБОЛЕВАНИЯ, МЕТОД K-БЛИЖАЙШИХ СОСЕДЕЙ, МАШИННОЕ ОБУЧЕНИЕ
Войти или Создать
* Забыли пароль?