Оптимізація гіперпараметрів XGBoost для інтелектуальних систем прогнозування B2B-замовлень
Вантажиться...
Дата
ORCID
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
ТОВ «ТЕХНІЧНИЙ УНІВЕРСИТЕТ «МЕТІНВЕСТ ПОЛІТЕХНІКА»
Анотація
Статтю присвячено розробленню методології оптимізації гіперпараметрів моделі машинного навчан-ня XGBoost для інтелектуальних систем прогнозування успішності B2B-замовлень в умовах часових обмежень. Дослідження базується на комплексному порівнянні шести алгоритмів оптимізації, включаючи Random Search, Optuna TPE, Hyperopt TPE, генетичний алгоритм, оптимізацію роєм частинок та послі-довну оптимізацію. Експериментальну валідацію проведено на двох наборах історичних даних обсягом 86 794 записи кожен із використанням метрики AUC-PR як цільової функції оптимізації та п’ятикратною стратифікованою крос-валідацією. Результати демонструють, що алгоритм Optuna TPE досягає найви-щої ефективності з максимальними значеннями AUC-PR 0,9661 та 0,9780 для досліджуваних датасетів відповідно. Установлено оптимальний часовий інтервал роботи алгоритму в межах 240–360 секунд, після якого подальша оптимізація не забезпечує покращення результатів і може призводити до деградації якос-ті моделі. Застосування оптимізованих гіперпараметрів забезпечило зменшення кількості помилок класи-фікації на 5,3–6,2 % порівняно з базовими налаштуваннями XGBoost. Дослідження включає детальний ана-ліз простору пошуку гіперпараметрів та розроблення системи контролю часових обмежень. Розроблена методологія має практичне значення для створення автоматизованих систем підтримки прийняття рішень у B2B-секторі та може бути впроваджена в комп’ютерно-інтегровані технології управління під-приємством.
This paper focuses on developing a methodology for automated XGBoost hyperparameter optimization in intelligent systems for B2B order success prediction under time constraints. The research is based on comprehensive comparison of six optimization algorithms, including Random Search, Optuna TPE, Hyperopt TPE, genetic algorithm, particle swarm optimization, and sequential optimization. Experimental validation was conducted on two historical datasets with 86,794 records each, using AUC-PR metric as the optimization objective function and five-fold stratified cross-validation. Results demonstrate that Optuna TPE algorithm achieves the highest efficiency with maximum AUC-PR values of 0.9661 and 0.9780 for the studied datasets respectively. The optimal time interval for algorithm operation was established within 240–360 seconds, after which further optimization does not provide improvement and may lead to model quality degradation. Application of optimized hyperparameters ensured a reduction in classification errors by 5.3–6.2 % compared to default XGBoost settings. The study includes detailed analysis of hyperparameter search space and development of a time constraint control system. The methodology incorporates robust preprocessing techniques, including median imputation for missing values, interquartile range outlier detection with winsorization, and robust scaling for numerical features. The developed methodology has practical significance for creating automated decision support systems in the B2B sector and can be integrated into computer-integrated enterprise management technologies.
This paper focuses on developing a methodology for automated XGBoost hyperparameter optimization in intelligent systems for B2B order success prediction under time constraints. The research is based on comprehensive comparison of six optimization algorithms, including Random Search, Optuna TPE, Hyperopt TPE, genetic algorithm, particle swarm optimization, and sequential optimization. Experimental validation was conducted on two historical datasets with 86,794 records each, using AUC-PR metric as the optimization objective function and five-fold stratified cross-validation. Results demonstrate that Optuna TPE algorithm achieves the highest efficiency with maximum AUC-PR values of 0.9661 and 0.9780 for the studied datasets respectively. The optimal time interval for algorithm operation was established within 240–360 seconds, after which further optimization does not provide improvement and may lead to model quality degradation. Application of optimized hyperparameters ensured a reduction in classification errors by 5.3–6.2 % compared to default XGBoost settings. The study includes detailed analysis of hyperparameter search space and development of a time constraint control system. The methodology incorporates robust preprocessing techniques, including median imputation for missing values, interquartile range outlier detection with winsorization, and robust scaling for numerical features. The developed methodology has practical significance for creating automated decision support systems in the B2B sector and can be integrated into computer-integrated enterprise management technologies.
Опис
Бібліографічний опис
Мірошниченко С. О. Оптимізація гіперпараметрів XGBoost для інтелектуальних систем прогнозування B2B-замовлень. Науковий Журнал Метінвест Політехніки. Серія: Технічні науки. 2025. No 4. С. 103-112. DOI: https://doi.org/10.32782/3041-2080/2025-4-13
