<?xml version="1.0"?>
<!DOCTYPE article
PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20190208//EN"
       "JATS-journalpublishing1.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.4" xml:lang="en">
 <front>
  <journal-meta>
   <journal-id journal-id-type="publisher-id">Herald of Technological University</journal-id>
   <journal-title-group>
    <journal-title xml:lang="en">Herald of Technological University</journal-title>
    <trans-title-group xml:lang="ru">
     <trans-title>ВЕСТНИК ТЕХНОЛОГИЧЕСКОГО УНИВЕРСИТЕТА</trans-title>
    </trans-title-group>
   </journal-title-group>
   <issn publication-format="print">3034-4689</issn>
  </journal-meta>
  <article-meta>
   <article-id pub-id-type="publisher-id">110870</article-id>
   <article-id pub-id-type="doi">10.55421/3034-4689_2025_28_10_102</article-id>
   <article-categories>
    <subj-group subj-group-type="toc-heading" xml:lang="ru">
     <subject>3. Информатика, вычислительная техника и управление</subject>
    </subj-group>
    <subj-group subj-group-type="toc-heading" xml:lang="en">
     <subject>3. Information teory, computer technology and control</subject>
    </subj-group>
    <subj-group>
     <subject>3. Информатика, вычислительная техника и управление</subject>
    </subj-group>
   </article-categories>
   <title-group>
    <article-title xml:lang="en">USING GRADIENT BOOSTING FOR PREDICTING THE FLASH POINT OF ORGANIC COMPOUNDS</article-title>
    <trans-title-group xml:lang="ru">
     <trans-title>ИСПОЛЬЗОВАНИЕ ГРАДИЕНТНОГО БУСТИНГА ДЛЯ ПРОГНОЗИРОВАНИЯ ТЕМПЕРАТУРЫ ВСПЫШКИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ</trans-title>
    </trans-title-group>
   </title-group>
   <contrib-group content-type="authors">
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лифанов</surname>
       <given-names>А. Д.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lifanov</surname>
       <given-names>A. D.</given-names>
      </name>
     </name-alternatives>
     <email>lifanov84@mail.ru</email>
     <xref ref-type="aff" rid="aff-1"/>
    </contrib>
    <contrib contrib-type="author">
     <name-alternatives>
      <name xml:lang="ru">
       <surname>Лифанова</surname>
       <given-names>Е. Г.</given-names>
      </name>
      <name xml:lang="en">
       <surname>Lifanova</surname>
       <given-names>E. G.</given-names>
      </name>
     </name-alternatives>
     <xref ref-type="aff" rid="aff-2"/>
    </contrib>
   </contrib-group>
   <aff-alternatives id="aff-1">
    <aff>
     <institution xml:lang="ru">Казанский национальный исследовательский технологический университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Kazan National Research Technological University</institution>
    </aff>
   </aff-alternatives>
   <aff-alternatives id="aff-2">
    <aff>
     <institution xml:lang="ru">Казанский (Приволжский) федеральный университет</institution>
    </aff>
    <aff>
     <institution xml:lang="en">Kazan (Volga) Federal University</institution>
    </aff>
   </aff-alternatives>
   <pub-date publication-format="print" date-type="pub" iso-8601-date="2025-12-25T15:14:09+03:00">
    <day>25</day>
    <month>12</month>
    <year>2025</year>
   </pub-date>
   <pub-date publication-format="electronic" date-type="pub" iso-8601-date="2025-12-25T15:14:09+03:00">
    <day>25</day>
    <month>12</month>
    <year>2025</year>
   </pub-date>
   <volume>28</volume>
   <issue>10</issue>
   <fpage>102</fpage>
   <lpage>107</lpage>
   <history>
    <date date-type="received" iso-8601-date="2025-12-24T00:00:00+03:00">
     <day>24</day>
     <month>12</month>
     <year>2025</year>
    </date>
   </history>
   <self-uri xlink:href="https://www.elibrary.ru/item.asp?id=83044300">https://www.elibrary.ru/item.asp?id=83044300</self-uri>
   <abstract xml:lang="ru">
    <p>В настоящее время в химии накоплен большой массив экспериментальных данных. В связи с этим, возникает необходимость совершенствования вычислительных методов хранения, обработки экспериментальных данных. Температура вспышки органических соединений является важным факторов, обеспечивающим безопасность химических производств. Современная химическая промышленность в условиях перехода к Индустрии 4.0 претерпевает глубокие цифровые трансформации из-за повышенных требований к безопасности химических производств. Использование цифровых двойников процессов вызвали значительные изменения в организации химического производства. Так, в настоящее время активно развиваются такие направления Индустрии 4.0 как аддитивные технологии, Интернет вещей и т.д. В таких условиях применение алгоритмов машинного обучения является ключевым инструментом для выявления факторов, влияющих на температуру вспышки органических соединений и повышения эффективности прогнозирования данного параметра. В базу данных для данной работы была включена информация о температурах вспышки для 1741 органических веществ. Данные о температурах вспышки органических соединений были взяты из базы данных PubChem. Для упрощения анализа представления органических соединений, мы использовали 208 дескрипторов RDKit, поскольку они являются одними из лучших дескрипторов для прогнозирования свойств химических соединений. Данные дескрипторы создаются на основе общих ключей подструктуры. Кроме того, модели были рассчитаны с использованием молекулярных отпечатков Моргана, также известных как циркулярные отпечатки с радиусом 2. В рамках данной работы был реализован градиентный бустинг. XGBoost построен на принципах усиления градиента с использованием древовидных алгоритмов обучения для повышения возможностей прогнозного моделирования. Для обучающей выборки полученная классификационная модель градиентного бустинга показала безошибочную классификацию, ошибка прогноза для нее равна 0. Статистические характеристики построенной модели гребневой регрессии для выборки имеют следующие значения: R2 =0.74 и ошибкой предсказания RMSE=36.36 К.</p>
   </abstract>
   <trans-abstract xml:lang="en">
    <p>Currently, a large amount of experimental data has been accumulated in chemistry. In this regard, there is a need to improve computational methods for storing and processing experimental data. The flash point of organic compounds is an important factor ensuring the safety of chemical industries. The modern chemical industry, in the context of the transition to Industry 4.0, is undergoing deep digital transformations due to increased safety requirements for chemical industries. The use of digital process twins has caused significant changes in the organization of chemical production. Thus, such areas of Industry 4.0 as additive technologies, the Internet of Things, etc. are currently actively developing. In such conditions, the use of machine learning algorithms is a key tool for identifying factors affecting the flash point of organic compounds and improving the efficiency of predicting this parameter. Information on the flaskpoint temperature for 1741 organic substances was included in the database for this work. The data on flash points of organic compounds were taken from the PubChem database. To simplify the analysis of the representation of organic compounds, we used 208 RDKit descriptors, as they are among the best descriptors for predicting the properties of chemical compounds. These descriptors are created based on the shared keys of the substructure. In addition, the models were calculated using Morgan's molecular fingerprints, also known as circular prints with a radius of 2. As part of this work, gradient boosting was implemented. XGBoost is built on the principles of gradient enhancement using tree-based learning algorithms to enhance predictive modeling capabilities. For the training sample, the obtained gradient boosting model showed an error-free classification, the prediction error for it is 0. The statistical characteristics of the constructed ridge regression model for the sample have the following values: R2 =0.74 and the prediction error RMSE=36.36 K.</p>
   </trans-abstract>
   <kwd-group xml:lang="ru">
    <kwd>БОЛЬШИЕ ДАННЫЕ</kwd>
    <kwd>ИНДУСТРИЯ 4.0</kwd>
    <kwd>ТЕМПЕРАТУРА ВСПЫШКИ</kwd>
    <kwd>ГРАДИЕНТНЫЙ БУСТИНГ</kwd>
    <kwd>ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ</kwd>
   </kwd-group>
   <kwd-group xml:lang="en">
    <kwd>BIG DATA</kwd>
    <kwd>INDUSTRY 4.0</kwd>
    <kwd>FLASH POINT</kwd>
    <kwd>GRADIENT BOOSTING</kwd>
    <kwd>ARTIFICIAL INTELLIGENCE</kwd>
   </kwd-group>
  </article-meta>
 </front>
 <body>
  <p></p>
 </body>
 <back>
  <ref-list/>
 </back>
</article>
