Модель ML для аналізу властивостей речовини на основі її фізико-хімічних особливостей

Предмет статті – розширення попередніх результатів бінарної класифікації на багатокласову за допомогою моделі ML для аналізу властивостей речовини на основі її фізико-хімічних особливостей. Мета дослідження – розроблення нової моделі ML і показників для порівняння якості аналізу різних моделей, зок...

Full description

Saved in:
Bibliographic Details
Main Authors: Олександр Кирсанов, Станіслав Кривенко
Format: Article
Language:English
Published: Kharkiv National University of Radio Electronics 2025-03-01
Series:Сучасний стан наукових досліджень та технологій в промисловості
Subjects:
Online Access:https://www.itssi-journal.com/index.php/ittsi/article/view/566
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Предмет статті – розширення попередніх результатів бінарної класифікації на багатокласову за допомогою моделі ML для аналізу властивостей речовини на основі її фізико-хімічних особливостей. Мета дослідження – розроблення нової моделі ML і показників для порівняння якості аналізу різних моделей, зокрема для аналізу якості вина за його складом. Завдання: підготовка даних, вибір типу моделі, її навчання, налаштування, оцінювання, розгортання та моніторинг. У дослідженні використовується метод AWS SageMaker для підготовки даних, розроблення моделі, її навчання, налаштування, оцінювання, розгортання та моніторингу, а дані обробляються за допомогою блокнотів Jupyter і Pandas. Досягнуті результати. Аналіз даних передбачає описову статистику, кореляційні матриці та візуалізації, як-от гістограми та діаграми розсіювання, щоб зрозуміти взаємозв’язки та якість даних. Моделі було навчено за допомогою XGBoost, дані розподілено на набори для навчання, перевірки, тестування та оцінення за допомогою матриць невідповідності та показників AUC-ROC. Матриці невідповідності для двох моделей показали змішані результати, доводячи складність порівняння продуктивності моделі та необхідність подальших досліджень незбалансованих класів. Автоматичне налаштування гіперпараметрів Amazon SageMaker було використано для оптимізації продуктивності моделі за допомогою баєсівської оптимізації та регресії процесу Гаусса. У дослідженні застосовувалися показники ROC-AUC для оцінювання продуктивності моделі з підходами мікро- та макроусереднення, що показують різні значення AUC для двох моделей. Друга модель продемонструвала трохи кращу продуктивність на основі показників AUC, але аналіз матриці невідповідності показав потребу в моделях, адаптованих до незбалансованих класів. Висновки: у дослідженні успішно розроблено нову модель ML з метою багатокласової класифікації, продемонстровано її потенціал для покращення передбачення якості вина та запропоновано майбутні напрями досліджень.
ISSN:2522-9818
2524-2296