Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights

Kanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive...

Full description

Saved in:
Bibliographic Details
Main Authors: Taufik Kurniawan, Laily Hermawanti, Achmad Nuruddin Safriandono
Format: Article
Language:English
Published: Politeknik Negeri Batam 2024-11-01
Series:Journal of Applied Informatics and Computing
Subjects:
Online Access:https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1846135869472243712
author Taufik Kurniawan
Laily Hermawanti
Achmad Nuruddin Safriandono
author_facet Taufik Kurniawan
Laily Hermawanti
Achmad Nuruddin Safriandono
author_sort Taufik Kurniawan
collection DOAJ
description Kanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive exPlanations (SHAP) dan teknik Random Over Sampling (ROS) untuk mengatasi masalah ketidakseimbangan data. Dengan menggunakan optimasi hiperparameter melalui Optuna, model yang dihasilkan menunjukkan kinerja yang unggul, dengan akurasi rata-rata 96,84%, presisi 99,23%, recall 94,51%, skor F1 96,74%, spesifisitas 99,17%, dan AUC 96,84% dalam evaluasi validasi silang 10 kali lipat. Analisis SHAP memberikan interpretabilitas yang signifikan, mengidentifikasi fitur-fitur utama seperti jenis kelamin, kebiasaan merokok, dan tanda-tanda fisik jari kuning sebagai faktor-faktor yang paling memengaruhi prediksi model. Hasil penelitian ini menunjukkan bahwa model yang diusulkan tidak hanya akurat, tetapi juga dapat ditafsirkan, memberikan kontribusi signifikan untuk mendukung pengambilan keputusan klinis yang lebih baik dalam diagnosis kanker paru-paru.
format Article
id doaj-art-1999ac9f287a4d90af417422e19a637f
institution Kabale University
issn 2548-6861
language English
publishDate 2024-11-01
publisher Politeknik Negeri Batam
record_format Article
series Journal of Applied Informatics and Computing
spelling doaj-art-1999ac9f287a4d90af417422e19a637f2024-12-09T10:38:51ZengPoliteknik Negeri BatamJournal of Applied Informatics and Computing2548-68612024-11-018229630310.30871/jaic.v8i2.83958395Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction InsightsTaufik KurniawanLaily HermawantiAchmad Nuruddin SafriandonoKanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive exPlanations (SHAP) dan teknik Random Over Sampling (ROS) untuk mengatasi masalah ketidakseimbangan data. Dengan menggunakan optimasi hiperparameter melalui Optuna, model yang dihasilkan menunjukkan kinerja yang unggul, dengan akurasi rata-rata 96,84%, presisi 99,23%, recall 94,51%, skor F1 96,74%, spesifisitas 99,17%, dan AUC 96,84% dalam evaluasi validasi silang 10 kali lipat. Analisis SHAP memberikan interpretabilitas yang signifikan, mengidentifikasi fitur-fitur utama seperti jenis kelamin, kebiasaan merokok, dan tanda-tanda fisik jari kuning sebagai faktor-faktor yang paling memengaruhi prediksi model. Hasil penelitian ini menunjukkan bahwa model yang diusulkan tidak hanya akurat, tetapi juga dapat ditafsirkan, memberikan kontribusi signifikan untuk mendukung pengambilan keputusan klinis yang lebih baik dalam diagnosis kanker paru-paru.https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395balancing datasetinterpretable machine learninglung cancer classificationshapley additive explanationsxgboost
spellingShingle Taufik Kurniawan
Laily Hermawanti
Achmad Nuruddin Safriandono
Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
Journal of Applied Informatics and Computing
balancing dataset
interpretable machine learning
lung cancer classification
shapley additive explanations
xgboost
title Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
title_full Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
title_fullStr Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
title_full_unstemmed Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
title_short Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
title_sort interpretable machine learning with shap and xgboost for lung cancer prediction insights
topic balancing dataset
interpretable machine learning
lung cancer classification
shapley additive explanations
xgboost
url https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395
work_keys_str_mv AT taufikkurniawan interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights
AT lailyhermawanti interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights
AT achmadnuruddinsafriandono interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights