<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Herald of Technological University</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Herald of Technological University</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">3034-4689</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">102974</article-id>
   <article-id pub-id-type="doi">10.55421/3034-4689_2025_28_5_116</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>3. Информатика, вычислительная техника и управление</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>3. Information teory, computer technology and control</subject>
    </subj-group>
    <subj-group>
     <subject>3. Информатика, вычислительная техника и управление</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">CONSTRUCTION OF A MODEL FOR PREDICTING THE ENTHALPY OF SUBLIMATION OF ORGANIC COMPOUNDS USING MACHINE LEARNING METHODS AND FRAGMENTS DESCRIPTORS</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>ПОСТРОЕНИЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ ЭНТАЛЬПИИ СУБЛИМАЦИИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ И ФРАГМЕНТНЫХ ДЕСКРИПТОРОВ</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лифанов</surname>
       <given-names>А Д</given-names>
      </name>
      <name xml:lang="en">
       <surname>Лифанов</surname>
       <given-names>А Д</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лифанова</surname>
       <given-names>Е. Г.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lifanova</surname>
       <given-names>E. G.</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">КНИТУ</institution>
     <country>ru</country>
    </aff>
    <aff>
     <institution xml:lang="en">КНИТУ</institution>
     <country>ru</country>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Казанский (Приволжский) федеральный университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Kazan (Volga) Federal University</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2025-08-07T21:34:53+03:00">
    <day>07</day>
    <month>08</month>
    <year>2025</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2025-08-07T21:34:53+03:00">
    <day>07</day>
    <month>08</month>
    <year>2025</year>
   </pub-date>
   <volume>28</volume>
   <issue>5</issue>
   <fpage>116</fpage>
   <lpage>122</lpage>
   <history>
    <date date-type="received" iso-8601-date="2025-08-04T00:00:00+03:00">
     <day>04</day>
     <month>08</month>
     <year>2025</year>
    </date>
   </history>
   <self-uri xlink:href="https://www.elibrary.ru/item.asp?id=82356349">https://www.elibrary.ru/item.asp?id=82356349</self-uri>
   <abstract xml:lang="ru">
    <p>В настоящее время в химии накоплен большой массив экспериментальных данных. В связи с этим, возникает необходимость совершенствования вычислительных методов хранения, обработки экспериментальных данных. В данном подходе органические соединения представляется в виде набора дескрипторов, характеризующих особенности химической структуры молекул. На практике переход в газовую фазу термодинамически возможен не только для жидкостей, но и для веществ, находящихся в твердом состоянии. Для большого числа органических соединений возможен их переход из твердого состояния в газообразное минуя жидкую фазу. Данный процесс называется сублимацией. Количественной характеристикой такого перехода является энтальпия сублимации, которая обозначается как Hsub. Данный параметр является важной термодинамической характеристикой и несомненно представляет практический интерес. Данные об октановых числах для органических соединений были взяты из литературных источников. В базу данных для нашей работы была включена информация об энтальпии сублимации для 845 органических веществ. Для упрощения анализа представления органических соединений, мы использовали 208 дескрипторов RDKit, поскольку они являются одними из лучших дескрипторов для прогнозирования свойств химических соединений. Данные дескрипторы создаются на основе общих ключей подструктуры. Кроме того, модели были рассчитаны с использованием молекулярных отпечатков Моргана, также известных как циркулярные отпечатки с радиусом 2. В рамках данной работы были реализованы гребневая регрессия, алгоритм случайного леса, метод ближайших соседей kNN, метод опорных векторов (SVM), искусственные нейронные сети. Для обучающей выборки полученная классификационная модель случайного леса показала безошибочную классификацию, ошибка прогноза для нее равна 0. Статистические характеристики построенной модели гребневой регрессии для выборки имеют следующие значения: R2 =0.88 и ошибкой предсказания RMSE=13.05 кДж/моль.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>Currently, a large amount of experimental data has been accumulated in chemistry. In this regard, there is a need to improve computational methods for storing and processing experimental data. In this approach, organic compounds are represented as a set of descriptors that characterize the features of the chemical structure of molecules. In practice, the transition to the gas phase is thermodynamically possible not only for liquids, but also for substances in the solid state. For a large number of organic compounds, their transition from a solid state to a gaseous state is possible, bypassing the liquid phase. This process is called sublimation. The quantitative characteristic of such a transition is the enthalpy of sublimation, which is denoted as Hsub. This parameter is an important thermodynamic characteristic and is undoubtedly of practical interest. Data on octane numbers for organic compounds were taken from literature data. Information on the enthalpy of sublimation for 845 organic substances was included in the database for this work. To simplify the analysis of the representation of organic compounds, we used 208 RDKit descriptors, as they are among the best descriptors for predicting the properties of chemical compounds. These descriptors are created based on the shared keys of the substructure. In addition, the models were calculated using Morgan's molecular fingerprints, also known as circular prints with a radius of 2. Within the framework of this work, ridge regression, the random forest algorithm, the kNN nearest neighbor method, the support vector machine (SVM) method, and artificial neural networks were implemented. For the training sample, the obtained random forest classification model showed an error-free classification, the prediction error for it is 0. The statistical characteristics of the constructed ridge regression model for the sample have the following values: R2 =0.88 and the prediction error RMSE=13.05 kDj/mol.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>БОЛЬШИЕ ДАННЫЕ</kwd>
    <kwd>ИНДУСТРИЯ 4.0</kwd>
    <kwd>ЭНТАЛЬПИЯ СУБЛИМАЦИИ</kwd>
    <kwd>МАШИННОЕ ОБУЧЕНИЕ</kwd>
    <kwd>ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>BIG DATA</kwd>
    <kwd>INDUSTRY 4.0</kwd>
    <kwd>ENTHALPY OF SUBLIMATION</kwd>
    <kwd>MACHINE LEARNING</kwd>
    <kwd>ARTIFICIAL INTELLEGENCE</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list/>
 </back>
</article>
