Автоматизована система відбору ознак для комп’ютерно-інтегрованого прогнозування успішності B2B-замовлень з використанням XGBoost
Вантажиться...
Дата
ORCID
Науковий ступінь
Рівень дисертації
Шифр та назва спеціальності
Рада захисту
Установа захисту
Науковий керівник/консультант
Члени комітету
Назва журналу
Номер ISSN
Назва тому
Видавець
ТОВ «ТЕХНІЧНИЙ УНІВЕРСИТЕТ «МЕТІНВЕСТ ПОЛІТЕХНІКА»
Анотація
Інтенсивний розвиток сектору корпоративної електронної торгівлі створює потребу в автоматизованих системах прогнозування для оптимізації керування ланцюгами постачання та мінімізації фінансових ризиків. Точне прогнозування успішності B2B-замовлень є важливим для ефективного керування ресурсами та оптимізації виробничих процесів підприємства. Сучасні ERP-системи накопичують великі обсяги даних про поведінку клієнтів, що створює можливості для застосування методів машинного навчання у процесах прийняття рішень. Мета дослідження полягає у розробленні оптимальної стратегії автоматизованого відбору ознак для прогнозування успішності B2B-замовлень з використанням алгоритму XGBoost в архітектурі комп’ютерно-інтегрованих систем керування підприємством. Здійснено експериментальне дослідження ефективності шести методів відбору ознак на двох незалежних наборах даних обсягом 86 794 записи з 24 характеристиками замовлень. Порівняно прямий та зворотний відбір за важливістю XGBoost, жадібні прямий та зворотний алгоритми, рекурсивне виключення ознак та алгоритм Boruta. Автоматизована оптимізація гіперпараметрів здійснена засобами фреймворку Optuna з алгоритмом Tree-structured Parzen Estimator. Оцінювання проводилось за метрикою AUC-PR з 5-кратною крос-валідацією для забезпечення статистичної надійності результатів. Жадібні алгоритми забезпечили найвищу ефективність класифікації: прямий відбір досягнув AUC-PR 0,97873, зворотний – 0,97785. Встановлено, що оптимальний набір ознак включає 16 характеристик. Це відповідає зменшенню розмірності на 33 %, що сприяє підвищенню прогностичної якості. Комплексний підхід забезпечив зниження помилкових класифікацій на 2,7–3,7 % порівняно з базовими налаштуваннями та дав змогу ідентифікувати дев’ять критично важливих ознак. Отримані результати створюють методологічну основу для розроблення автоматизованих систем прогнозування в сучасних комп’ютерно-інтегрованих виробничих комплексах.
Contemporary business process automation, involving implementation of information technologies for optimizing enterprise operations, creates demand for intelligent forecasting systems to manage supply chains and minimize financial risks. Accurate prediction of corporate order success is critical for efficient resource management and production process optimization. Modern ERP systems accumulate large volumes of customer behavior data, creating opportunities for machine learning applications in decision-making processes. This research develops an optimal automated feature selection strategy for B2B order success prediction using XGBoost within computer-integrated enterprise management systems. An experimental study evaluated six feature selection methods on two independent datasets containing 86.794 records with 24 order characteristics. Methods compared included forward and backward XGBoost importancebased selection, greedy forward and backward algorithms, recursive feature elimination, and Boruta algorithm. Automated hyperparameter optimization was implemented using Optuna framework with Tree-structured Parzen Estimator. Evaluation employed AUC-PR metric with 5-fold stratified cross-validation for statistical reliability. Greedy algorithms achieved highest classification efficiency: forward selection reached AUC-PR of 0.97873, backward selection achieved 0.97785. Optimal feature set size was established at 16 characteristics, representing 33 % dimensionality reduction while improving predictive quality. The comprehensive approach reduced misclassifications by 2.7–3.7 % compared to baseline configurations and identified nine critically important prediction features. Results establish methodological foundation for developing automated forecasting systems in computerintegrated manufacturing complexes, ensuring improved accuracy while optimizing computational resources and reducing model complexity for practical implementation in enterprise environments.
Contemporary business process automation, involving implementation of information technologies for optimizing enterprise operations, creates demand for intelligent forecasting systems to manage supply chains and minimize financial risks. Accurate prediction of corporate order success is critical for efficient resource management and production process optimization. Modern ERP systems accumulate large volumes of customer behavior data, creating opportunities for machine learning applications in decision-making processes. This research develops an optimal automated feature selection strategy for B2B order success prediction using XGBoost within computer-integrated enterprise management systems. An experimental study evaluated six feature selection methods on two independent datasets containing 86.794 records with 24 order characteristics. Methods compared included forward and backward XGBoost importancebased selection, greedy forward and backward algorithms, recursive feature elimination, and Boruta algorithm. Automated hyperparameter optimization was implemented using Optuna framework with Tree-structured Parzen Estimator. Evaluation employed AUC-PR metric with 5-fold stratified cross-validation for statistical reliability. Greedy algorithms achieved highest classification efficiency: forward selection reached AUC-PR of 0.97873, backward selection achieved 0.97785. Optimal feature set size was established at 16 characteristics, representing 33 % dimensionality reduction while improving predictive quality. The comprehensive approach reduced misclassifications by 2.7–3.7 % compared to baseline configurations and identified nine critically important prediction features. Results establish methodological foundation for developing automated forecasting systems in computerintegrated manufacturing complexes, ensuring improved accuracy while optimizing computational resources and reducing model complexity for practical implementation in enterprise environments.
Опис
Ключові слова
автоматизований відбір ознак, градієнтний бустинг, XGBoost, B2B-прогнозування, машинне навчання, зменшення розмірності, AUC-PR, automated feature selection, B2B order prediction, computer-integrated systems, business process automation, machine learning optimization, hyperparameter tuning, greedy algorithms
Бібліографічний опис
Мірошниченко С. О., Мірошниченко В. І., Койфман О. О., Вовна О. В. Автоматизована система відбору ознак для комп’ютерно-інтегрованого прогнозування успішності B2B-замовлень з використанням XGBoost. Науковий Журнал Метінвест Політехніки. Серія: Технічні науки. 2025. No 5. С. 58-75. DOI: https://doi.org/10.32782/3041-2080/2025-5-7
