Stroke Risk Calculator

Metodologi Stratifikasi Risiko

Gambaran teknis model prediksi dan strategi ambang batas.

Background Aplikasi

Aplikasi ini merupakan hasil Proyek Akhir (Final Project) mata kuliah Matematika Diskrit semester 1 program studi Rekayasa Kecerdasan Artifisial, Departmen Teknik Informatika, Institut Teknologi Sepuluh Nopember.

Tim Pengembang:
1. Fahmi Alfayadh (5054251015)
2. Evina Fitriyani (5054251013)
3. Aziz Rahmad Arifin (5054251002)

1. Data Source & Model Architecture

Sistem prediksi ini dibangun menggunakan algoritma Logistic Regression, dilatih menggunakan Healthcare Dataset Stroke Data (bersumber dari repositori publik Kaggle). Model menghasilkan skor probabilitas kontinu (P(y=1|X)) dalam rentang [0,1] yang merepresentasikan kemungkinan terjadinya stroke berdasarkan fitur klinis dan demografis input.

2. Thresholding Strategy

Untuk menerjemahkan probabilitas statistik menjadi wawasan klinis yang dapat ditindaklanjuti, diterapkan pendekatan Hybrid Thresholding yang menggabungkan distribusi persentil data (data-driven) dengan metrik evaluasi performa model (performance-driven).

Klasifikasi risiko dibagi menjadi tiga tingkatan sebagai berikut:

🟢 Low Risk Category (P < 0.10)

Definisi:
Kategori ini mencakup individu dengan probabilitas prediksi di bawah 10%.

Justifikasi Metodologis:
Threshold 0.10 (10%) diadopsi langsung dari standar profil risiko stroke klinis (seperti Framingham Risk Score). Nilai ini divalidasi secara statistik oleh data latih kami, di mana persentil ke-40 berada pada angka 0.093, menunjukkan bahwa batas klinis 10% sangat relevan dan aman untuk menyaring populasi sehat.

Interpretasi Statistik:
Analisis densitas menunjukkan bahwa area ini didominasi secara signifikan oleh kelas negatif (True Negatives), mengindikasikan spesifisitas tinggi dalam menyaring populasi sehat.

🟡 Moderate Risk Category (0.10 ≤ P ≤ 0.4545)

Definisi:
Rentang probabilitas antara 10% hingga 45.45%.

Justifikasi Metodologis:
Interval ini merepresentasikan zona transisi (grey area) antara batas dasar populasi sehat dan batas keputusan optimal model.

Interpretasi Statistik:
Area ini menangkap observasi dengan ketidakpastian model yang lebih tinggi (probabilistic uncertainty), di mana subjek memiliki sejumlah faktor risiko yang tereskalasi namun belum mencapai ambang batas klasifikasi positif yang definitif.

🔴 High Risk Category (P > 0.4545)

Definisi:
Kategori ini mencakup individu dengan probabilitas prediksi melebihi 45.4%.

Justifikasi Metodologis:
Threshold 0.454 (atau 0.4545) diturunkan menggunakan Youden’s J Statistic (J=Sensitivity+Specificity-1) dari kurva ROC model.

Interpretasi Statistik:
Nilai ini merupakan Optimal Cutoff Point yang secara matematis memaksimalkan kemampuan diskriminatif model dalam memisahkan kelas positif (Stroke) dan negatif. Probabilitas di atas titik ini mengindikasikan confidence model yang tinggi terhadap label positif.

⚠️ Disclaimer / Penafian

Aplikasi ini adalah alat bantu simulasi untuk tujuan edukasi dan penelitian akademis. Hasil prediksi dihasilkan oleh model matematis dan bukan merupakan diagnosis medis profesional. Jangan gunakan hasil ini sebagai pengganti konsultasi dengan dokter. Segera hubungi tenaga medis jika Anda mengalami gejala kesehatan.

Start Calculation