Model Group Investigation (GI) merupakan salah satu strategi pembelajaran kooperatif yang banyak digunakan di pendidikan tinggi. Namun, tantangan seperti jumlah mahasiswa yang besar dan keragaman profil individu menyulitkan proses pembentukan kelompok secara manual. Beberapa penelitian sebelumnya telah menerapkan algoritma klasterisasi seperti K-Means, tetapi penggunaan K-Medoids, yang lebih tangguh terhadap noise pada data, masih jarang dieksplorasi, khususnya dalam konteks GI. Penelitian ini mengusulkan pendekatan berbasis data menggunakan K-Medoids untuk membentuk kelompok mahasiswa berbasis GI. Dengan menerapkan kerangka kerja KDD, proses yang dilakukan mencakup pemilihan data, preprocessing, transformasi, pengelompokan, serta evaluasi. Pada proses pengelompokan terdapat tiga tahapan: (1) mahasiswa dikelompokkan berdasarkan minat, (2) pada setiap subset minat dilakukan klasterisasi menggunakan K-Medoids, dengan memilih jenis distance measurement dan nilai k
berdasarkan Silhoette Score tertinggi, dan (3) penyusunan kelompok heterogen. Pada tahap pengelompokan kedua, proses klasterisasi menggunakan jarak Manhattan dan PCA menghasilkan nilai Silhouette Score tertinggi, yaitu 0.555 untuk subset Pengukuran Kinerja (k=3) dan 0.618 untuk Pengembangan Data Warehouse (k=4). Hasil evaluasi menunjukkan bahwa metode yang diusulkan menghasilkan kelompok dengan heterogenitas lebih tinggi dibandingkan metode baseline Cluster-Based Assembly, yaitu 0.607 vs. 0.555 untuk subset Pengukuran Kinerja, dan 0.622 vs. 0.543 untuk Pengembangan Data Warehouse. Dengan demikian, metode ini berhasil menghasilkan kelompok yang secara internal beragam namun tetap kohesif dalam hal minat, yang sejalan dengan pembelajaran berbasis GI.