ABSTRAKSI: Data mining merupakan suatu teknik yang dapat memecahkan permasalahan gudang data, sehingga tumpukan data yang tidak memiki informasi apaapun dapat digali dan dianalisa. Tumpukan data tidak dapat langsung diproses, data yang berdimensi tinggi harus dipreprocessing sehingga saat mining data benar-benar memberikan hasil yang maksimal.
ICA (Independent Component Analysis) merupakan suatu teknik reduksi pada data numerik yang dapat mengurangi dimensi, dimensi yang baru disebut Independent Component (IC). ICA mereduksi dengan mencari dimensi yang saling independent untuk menjadi dimensi baru. Kondisi ini lebih kuat jika dibandingkan mencari ketidakterhubungan antar dimensi .
Fenomena Curse of Dimensionality dapat diselesaikan dengan pengurangan dimensi dengan ICA.Hasil pengujian dengan ICA dapat mereduksi data colon tumor dengan 2000 dimensi dapat diringkas menjadi 60 IC dan data set DLBCL dengan 4026 dimensi dapat diringkas menjadi 46 IC. Kedua dataset memiliki hasil evaluasi clustering terbaik pada 1 IC yaitu dengan nilai SSE sebesar 0.00 dan nilai SSE 0.97.ICA memberikan hasil evaluasi clustering yang lebih baik jika dibandingkan dengan PCA (Principal Component Analysis) yaitu dengan tingkat SSE (Sum of Squared Error) yang lebih kecil.Kata Kunci : Data mining, ICA, PCA, data numerik, dimensi tinggi, independent,ABSTRACT: Data mining is defined as a techniques of solving data warehouse problem, in order that data collection which doesn t have anything information can be mined and analyzed. Data colection can t be processed directly, data with high dimensionality must be preprocessed so the output is truly maximal when data is mined.
ICA (Independent Component Analysis) which can minimize dimension and then new dimension is named IC (Independent Component) is a reduction of numeric data. Reduction in ICA is finding dimension which is independent each other to be a new dimension. This condition is stronger than finding uncorrelation between dimension.
Curse of dimensionality phenomenon can be solved by minimizing dimension using ICA. Evaluation using ICA can reduce data colon tumor with 2000 dimension extracted to be 60 IC and DLBCL dataset with 4026 dimension extracted to be 46 IC. Both datasets have the best clustering evaluation in one IC. As seen in the value of SSE in data colon tumor is 0 and the value of SSE in DLBCL is 0.97. ICA gives better clustering evaluation than PCA (Principal Component Analysis) because ICA has smaller SSE values than PCA.Keyword: Data mining, ICA, PCA, numeric data, high dimension, independent,