ABSTRAKSI: Penyakit Jantung merupakan salah satu penyakit yang dapat sangat mematikan di dunia. Untuk menekan persentase kematian akibat penyakit jantung maka dibutuhkan sebuah sistem yang dapat memprediksi penyakit jantung.
Algoritma CART adalah metode klasifikasi untuk menentukan prediksi yang dapat menangani himpunan data yang mempunyai jumlah besar dan variabel yang sangat banyak. Algoritma CART akan menghasilkan suatu pohon klasifikasi jika variabel responnya kategorik, dan menghasilkan pohon regresi jika variabel responnya kontinu. Dan akan menyeleksi beberapa variabel dan interaksi antar variabel yang paling penting dalam menentukan hasil variabel dependennya. Ciri khas algoritma CART adalah akan menghasilkan kelompok data yang akurat dengan hasil yang mudah diinterpretasikan dan lebih cepat dalam hal perhitungannya.
Dalam Tugas Akhir ini akan dikupas mengenai langkah kerja algoritma CART pada prediksi penyakit jantung untuk mengetahui hasil prediksi penyakit jantung, dan mengetahui variabel yang berpengaruh dalam membentuk prediksi penyakit jantung.
Hasil pengujian menunjukkan bahwa total seluruh variabel yang berpengaruh dalam menghasilkan prediksi penyakit jantung berjumlah delapan buah, yaitu umur, total kolesterol, HDL kolesterol, systolic, diastolic, status diabetes, status merokok, dan jenis kelamin dan parameter penentu utamanya adalah parameter umur. Adanya pengaruh antara kombinasi jumlah data training yang bernilai positif dan negatif, jumlah data training menentukan perbedaan tingkat diferensiasi parameter yang terjadi. Prediksi penyakit jantung dengan algoritma CART ini dapat menghasilkan akurasi tertinggi mencapai 77%.Kata Kunci : prediksi, jantung, algoritma, CART, pohon, klasifikasi.ABSTRACT: Heart disease is one of disease that can be deadly in the world. To decrease the percentage of deaths from heart disease it needed a system that can predict heart disease.
CART algorithm is a classification method for determining the set of predictions that can handle large amounts of data and variables. CART algorithm will produce a classification tree if the response was categorical variables, and produce regression tree if the response variable is continuous. CART algorithm will select some variables and its interactions are most important to determine the outcome of the dependent variable. Characteristic CART algorithm is the data will produce accurate results faster and more easily interpreted in terms of the calculation.
In this final project will be discussed about prediction of heart desease by using CART Algorithm to determine the outcome prediction of heart disease, and know the variables that can affect the prediction of heart disease.
The experimental results show that the total of all the variables that can affect the result in the prediction of heart disease were eight variables, there are age, total cholesterol, HDL cholesterol, systolic, diastolic, diabetes status, smoking status, and gender, and the main parameter is age. The other factor that show influence of the result are training’s data combination which is positive and negative, the total amount of training data to determine the differentiation of parameters. Prediction of heart disease by CART algorithm can produce the highest accuracy that can be reached is 77%Keyword: prediction, heart, algorithm, CART, tree, classification.