Mengumpulkan Data
cleveland.data
Menelaah Data
Memvalidasi Data
Menentukan Objek Data
Membersihkan Data
Mengonstruksi Data
Membangun Model
Raw
Decision Tree
Naive Bayes
Support Vector Machine
Over Sampling
Decision Tree
Naive Bayes
Support Vector Machine
Over Sampling + Normalisasi
Decision Tree
Naive Bayes
Support Vector Machine
Over Sampling + Normalisasi + Tunning
Decision Tree
Naive Bayes
Support Vector Machine
Mengevaluasi Hasil Pemodelan
Dalam penelitian ini yang bertujuan membangun model untuk heart disease, peneliti menilai efek dari berbagai teknik pemrosesan data pada performa tiga model klasifikasi: Decision Tree, Naive Bayes, dan SVM (Support Vector Machine). Empat skenario yang berbeda diuji: penggunaan data mentah (Raw), Over Sampling, Over Sampling bersama dengan Normalisasi, dan kombinasi Over Sampling, Normalisasi, serta Tunning.
Pertama, dengan data mentah, model Decision Tree mencapai akurasi 70.7%, Naive Bayes 61.1%, dan SVM 69.4%. Ini memberikan baseline untuk membandingkan efek dari teknik pemrosesan data selanjutnya.
Ketika Over Sampling diterapkan, akurasi Decision Tree meningkat menjadi 74.5%, menunjukkan peningkatan yang signifikan. Namun, tidak ada perubahan pada akurasi Naive Bayes (61.1%) dan SVM (69.4%), menunjukkan bahwa Over Sampling tidak mempengaruhi model ini dalam konteks heart disease.
Selanjutnya, ketika Normalisasi ditambahkan ke Over Sampling, semua model mengalami penurunan akurasi. Decision Tree turun menjadi 67%, Naive Bayes turun lebih lanjut menjadi 54.8%, dan SVM turun menjadi 66%. Hal ini menunjukkan bahwa kombinasi Over Sampling dan Normalisasi tidak selalu memberikan manfaat terhadap model-model ini dalam konteks heart disease.
Terakhir, ketika Tunning parameter diperkenalkan bersamaan dengan Over Sampling dan Normalisasi, terjadi perubahan yang dramatis pada model SVM, dengan peningkatan akurasi yang sangat signifikan menjadi 89.8%. Sementara itu, Decision Tree menurun ke 66.0%, dan Naive Bayes turun ke 53.3%.
Dari analisis ini, peneliti menyimpulkan bahwa Tunning parameter, ketika dikombinasikan dengan Over Sampling dan Normalisasi, sangat efektif dalam meningkatkan performa SVM untuk heart disease, tetapi tidak untuk Decision Tree dan Naive Bayes. Temuan ini menyoroti pentingnya pemilihan dan adaptasi teknik pemrosesan data yang sesuai dengan kebutuhan spesifik model dan konteks aplikasi, dalam hal ini heart disease.