Microarray merupakan salah satu teknologi bioinform
atika yang dapat mengetahui profil dari
ekspresi gen secara paralel dalam jumlah dimensi ya
ng besar. Microarray digunakan untuk
membantu peneliti dalam melakukan diagnosis terhada
p penyakit. Proses kerja microarray
adalah mengelompokkan gen berdasarkan rasio yang di
tunjukkan dari keseluruhan gen
tersebut. Dalam Data Mining, proses pengelompokkan
ini disebut dengan klasterisasi.
Secara umum, data microarray dikumpulkan dalam juml
ah sampel dan dimensi yang besar.
Pada analisis penelitian, data yang memiliki jumla
h dimensi besar sangat sulit untuk diteliti.
Oleh karena itu, dibutuhkan klasterisasi untuk memp
eroleh klaster sampel sehingga
menghasilkan informasi baru dari data tersebut.
Metode yang digunakan adalah clique partition yang
didasari oleh prosedur branch and bound
dan DFS untuk menelusuri setiap titik dalam graf. A
lgoritma clique bekerja dengan
melakukan pencarian di setiap titik secara rekursif
dan backtracking hingga semua titik
dilewati. Proses menemukan klaster diawali dengan m
entransformasikan data microarray ke
dalam graf yang dibentuk menjadi matriks adjacency.
Matriks ini merupakan matriks
keterhubungan antar titik yang hanya terdiri dari d
ua nilai biner, 1 jika terdapat korelasi antar
titik dan 0 jika sebaliknya. Dalam penelitian Tugas
Akhir ini, penentuan korelasi ditentukan
berdasarkan nilai threshold. Mencari klaster menggu
nakan clique partition berarti mencari
maximal clique. Hasil yang diperoleh menunjukkan pe
rubahan threshold mempengaruhi
jumlah klaster yang diperoleh. Analisis hasil klast
er untuk data microarray yang digunakan
menunjukkan bahwa pemilihan threshold yang lebih ke
cil memeberikan nilai error SSE yang
lebih sedikit. clique partition, klastering, microarray, PCA,thres hold