Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights
Kanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive...
Saved in:
| Main Authors: | , , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Politeknik Negeri Batam
2024-11-01
|
| Series: | Journal of Applied Informatics and Computing |
| Subjects: | |
| Online Access: | https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1846135869472243712 |
|---|---|
| author | Taufik Kurniawan Laily Hermawanti Achmad Nuruddin Safriandono |
| author_facet | Taufik Kurniawan Laily Hermawanti Achmad Nuruddin Safriandono |
| author_sort | Taufik Kurniawan |
| collection | DOAJ |
| description | Kanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive exPlanations (SHAP) dan teknik Random Over Sampling (ROS) untuk mengatasi masalah ketidakseimbangan data. Dengan menggunakan optimasi hiperparameter melalui Optuna, model yang dihasilkan menunjukkan kinerja yang unggul, dengan akurasi rata-rata 96,84%, presisi 99,23%, recall 94,51%, skor F1 96,74%, spesifisitas 99,17%, dan AUC 96,84% dalam evaluasi validasi silang 10 kali lipat. Analisis SHAP memberikan interpretabilitas yang signifikan, mengidentifikasi fitur-fitur utama seperti jenis kelamin, kebiasaan merokok, dan tanda-tanda fisik jari kuning sebagai faktor-faktor yang paling memengaruhi prediksi model. Hasil penelitian ini menunjukkan bahwa model yang diusulkan tidak hanya akurat, tetapi juga dapat ditafsirkan, memberikan kontribusi signifikan untuk mendukung pengambilan keputusan klinis yang lebih baik dalam diagnosis kanker paru-paru. |
| format | Article |
| id | doaj-art-1999ac9f287a4d90af417422e19a637f |
| institution | Kabale University |
| issn | 2548-6861 |
| language | English |
| publishDate | 2024-11-01 |
| publisher | Politeknik Negeri Batam |
| record_format | Article |
| series | Journal of Applied Informatics and Computing |
| spelling | doaj-art-1999ac9f287a4d90af417422e19a637f2024-12-09T10:38:51ZengPoliteknik Negeri BatamJournal of Applied Informatics and Computing2548-68612024-11-018229630310.30871/jaic.v8i2.83958395Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction InsightsTaufik KurniawanLaily HermawantiAchmad Nuruddin SafriandonoKanker paru-paru tetap menjadi salah satu penyebab kematian utama di seluruh dunia, dan deteksi dini melalui metode yang akurat dan andal sangat penting untuk meningkatkan prognosis pasien. Studi ini mengusulkan model klasifikasi kanker paru-paru yang mengintegrasikan XGBoost dengan SHapley Additive exPlanations (SHAP) dan teknik Random Over Sampling (ROS) untuk mengatasi masalah ketidakseimbangan data. Dengan menggunakan optimasi hiperparameter melalui Optuna, model yang dihasilkan menunjukkan kinerja yang unggul, dengan akurasi rata-rata 96,84%, presisi 99,23%, recall 94,51%, skor F1 96,74%, spesifisitas 99,17%, dan AUC 96,84% dalam evaluasi validasi silang 10 kali lipat. Analisis SHAP memberikan interpretabilitas yang signifikan, mengidentifikasi fitur-fitur utama seperti jenis kelamin, kebiasaan merokok, dan tanda-tanda fisik jari kuning sebagai faktor-faktor yang paling memengaruhi prediksi model. Hasil penelitian ini menunjukkan bahwa model yang diusulkan tidak hanya akurat, tetapi juga dapat ditafsirkan, memberikan kontribusi signifikan untuk mendukung pengambilan keputusan klinis yang lebih baik dalam diagnosis kanker paru-paru.https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395balancing datasetinterpretable machine learninglung cancer classificationshapley additive explanationsxgboost |
| spellingShingle | Taufik Kurniawan Laily Hermawanti Achmad Nuruddin Safriandono Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights Journal of Applied Informatics and Computing balancing dataset interpretable machine learning lung cancer classification shapley additive explanations xgboost |
| title | Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights |
| title_full | Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights |
| title_fullStr | Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights |
| title_full_unstemmed | Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights |
| title_short | Interpretable Machine Learning with SHAP and XGBoost for Lung Cancer Prediction Insights |
| title_sort | interpretable machine learning with shap and xgboost for lung cancer prediction insights |
| topic | balancing dataset interpretable machine learning lung cancer classification shapley additive explanations xgboost |
| url | https://jurnal.polibatam.ac.id/index.php/JAIC/article/view/8395 |
| work_keys_str_mv | AT taufikkurniawan interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights AT lailyhermawanti interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights AT achmadnuruddinsafriandono interpretablemachinelearningwithshapandxgboostforlungcancerpredictioninsights |