Metodologi Stratifikasi Risiko
Background Aplikasi
Aplikasi ini merupakan hasil Proyek Akhir (Final Project) mata kuliah Matematika Diskrit semester 1 program studi Rekayasa Kecerdasan Artifisial, Departmen Teknik Informatika, Institut Teknologi Sepuluh Nopember.
Tim Pengembang:
1. Fahmi Alfayadh (5054251015)
2. Evina Fitriyani (5054251013)
3. Aziz Rahmad Arifin (5054251002)
1. Data Source & Model Architecture
Sistem prediksi ini dibangun menggunakan algoritma Logistic Regression, dilatih menggunakan Healthcare Dataset Stroke Data (bersumber dari repositori publik Kaggle). Model menghasilkan skor probabilitas kontinu (P(y=1|X)) dalam rentang [0,1] yang merepresentasikan kemungkinan terjadinya stroke berdasarkan fitur klinis dan demografis input.
2. Thresholding Strategy
Untuk menerjemahkan probabilitas statistik menjadi wawasan klinis yang dapat ditindaklanjuti, diterapkan pendekatan Hybrid Thresholding yang menggabungkan distribusi persentil data (data-driven) dengan metrik evaluasi performa model (performance-driven).
Klasifikasi risiko dibagi menjadi tiga tingkatan sebagai berikut:
Kategori ini mencakup individu dengan probabilitas prediksi di bawah 10%.
Threshold 0.10 (10%) diadopsi langsung dari standar profil risiko stroke klinis (seperti Framingham Risk Score). Nilai ini divalidasi secara statistik oleh data latih kami, di mana persentil ke-40 berada pada angka 0.093, menunjukkan bahwa batas klinis 10% sangat relevan dan aman untuk menyaring populasi sehat.
Analisis densitas menunjukkan bahwa area ini didominasi secara signifikan oleh kelas negatif (True Negatives), mengindikasikan spesifisitas tinggi dalam menyaring populasi sehat.
Rentang probabilitas antara 10% hingga 45.45%.
Interval ini merepresentasikan zona transisi (grey area) antara batas dasar populasi sehat dan batas keputusan optimal model.
Area ini menangkap observasi dengan ketidakpastian model yang lebih tinggi (probabilistic uncertainty), di mana subjek memiliki sejumlah faktor risiko yang tereskalasi namun belum mencapai ambang batas klasifikasi positif yang definitif.
Kategori ini mencakup individu dengan probabilitas prediksi melebihi 45.4%.
Threshold 0.454 (atau 0.4545) diturunkan menggunakan Youden’s J Statistic (J=Sensitivity+Specificity-1) dari kurva ROC model.
Nilai ini merupakan Optimal Cutoff Point yang secara matematis memaksimalkan kemampuan diskriminatif model dalam memisahkan kelas positif (Stroke) dan negatif. Probabilitas di atas titik ini mengindikasikan confidence model yang tinggi terhadap label positif.
⚠️ Disclaimer / Penafian
Aplikasi ini adalah alat bantu simulasi untuk tujuan edukasi dan penelitian akademis. Hasil prediksi dihasilkan oleh model matematis dan bukan merupakan diagnosis medis profesional. Jangan gunakan hasil ini sebagai pengganti konsultasi dengan dokter. Segera hubungi tenaga medis jika Anda mengalami gejala kesehatan.