Penyakit Alzheimer adalah salah satu tantangan utama dalam perawatan medis abad ini, yang mempengaruhi jutaan orang di seluruh dunia. Alzheimer merusak neuron dan jaringan di area otak yang bertanggung jawab atas daya ingat, bahasa, penalaran, dan perilaku sosial. Deteksi dini penyakit ini memungkinkan pengobatan yang lebih efektif dan perencanaan perawatan yang tepat. Salah satu metode yang umum digunakan adalah inspeksi visual dengan menggunakan Magnetic Resonance Imaging (MRI). Keterbatasan inspeksi visual termasuk subjektivitas dan sifatnya yang memakan waktu, terutama dengan kumpulan data MRI yang besar atau kompleks, membuat interpretasi yang akurat menjadi tantangan yang signifikan. Oleh karena itu, alternatif untuk mendeteksi penyakit Alzheimer adalah dengan menggunakan analisis citra MRI berbasis deep learning. Salah satu pendekatan yang menjanjikan adalah dengan mengimplementasikan model External Attention Transformer (EAT). Model ini meningkatkan klasifikasi gambar dengan menggunakan dua memori eksternal yang digunakan bersama dan mekanisme attention yang menyaring informasi yang berlebihan untuk meningkatkan kinerja dan efisiensi. Tujuan dari penelitian ini adalah untuk mengevaluasi dan membandingkan performa dari model dasar Convolutional Neural Network (CNN), model Vision Transformer (ViT), dan model EAT dalam mendeteksi Alzheimer dengan menggunakan dataset 6400 gambar MRI otak. Model EAT mengungguli model dasar CNN dan model ViT dalam mendeteksi Alzheimer, mencapai hasil terbaiknya dengan akurasi 0,965 dan F1-score 0,747 untuk data uji.