В настоящее время нефтехимические процессы направлены на получение бензиновых фракций с высоким октановым числом. Октановое число - это показатель, который характеризует устойчивость топлива к детонации (взрыву) в двигателях внутреннего сгорания. Чем выше данный показатель, тем большее количество энергии оно способно производить. В качестве эталона был взят изооктан (2,2,4-триметилпентан). Иногда используют его смесь с нормальным гептаном. Для повышения октановых чисел бензиновых фракций обычно вводят антидетонационные присадки. В качестве антидетонационных присадок используют органические соединения различного строения. Обычно это изоалканы, олефины, циклоалканы, спирты и т.д. с высокими октановыми числами. Особенностям влияния антидетонационных присадок на октановые числа топлив посвящены многочисленные работы. В данных работах показана возможность направленного регулирования октановых чисел бензиновых фракций путем варьирования природы модифицирующих добавок и их количества. Обычно наблюдается аддитивное увеличение октанового числа бензиновых фракций пропорционально содержанию антидетонационной присадки. Однако возможны и исключения, которые устанавливаются эмпирически путем. Наиболее перспективным является установление закономерностей связи химического строения углеводородов с показателями детонации топлив. В данном подходе органические соединения представляется в виде набора дескрипторов, характеризующих особенности химической структуры молекул. Данные об октановых числах для органических соединений были взяты из базы данных PubChem. В базу данных для данной работы была включена информация об октановых числах для 219 органических веществ. Для упрощения анализа представления органических соединений, мы использовали ключи MACC, поскольку они являются одними из лучших дескрипторов для прогнозирования свойств химических соединений. Данные дескрипторы создаются на основе общих ключей подструктуры. Кроме того, модели были рассчитаны с использованием молекулярных отпечатков Моргана, также известных как циркулярные отпечатки с радиусом 2. В рамках данной работы был реализованы гребневая регрессия, алгоритм случайного леса, метод ближайших соседей kNN, метод опорных векторов (SVM), искусственные нейронные сети. Для обучающей выборки полученная классификационная модель случайного леса показала безошибочную классификацию, ошибка прогноза для нее равна 0. Статистические характеристики построенной XGBoost-модели для выборки имеют следующие значения: R2 =0.83 и ошибкой предсказания RMSE=9.96 °С.
БОЛЬШИЕ ДАННЫЕ, ИНДУСТРИЯ 4.0, ОКТАНОВОЕ ЧИСЛО, МАШИННОЕ ОБУЧЕНИЕ, ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ