Di era digital dan dinamika interaksi sosial yang terus berkembang, media sosial telah menjadi salah satu platform penting bagi masyarakat untuk menyampaikan aspirasi dan pendapat mereka. Instagram khususnya, menjadi wadah yang interaktif untuk mengungkapkan pandangan terhadap suatu isu melalui konten visual maupun berkomentar. Penelitian ini bertujuan untuk menggali wawasan dari berbagai komentar Instagram terkait fenomena sosial yang terjadi di Kota Semarang. Menggunakan algoritma Gaussian Mixture Model (GMM) dan serangkaian tahapan Natural Language Processing (NLP), penelitian ini berupaya untuk mengelompokkan data komentar dan mengidentifikasi topik diskusi yang relevan dengan kehidupan sosial masyarakat Kota Semarang. Data komentar dikumpulkan melaui metode web scrapping dari akun-akun berita lokal Kota Semarang, menghasilkan total 2.332 komentar. Sebelum analisis lebih lanjut, data melalui tahapan preprocessing, termasuk pembersihan data dan tokenisasi. Selanjutnya, data teks diubah menjadi representasi numerik menggunakan metode TF-IDF dan LDA, yang memungkinkan algoritma Machine Learning untuk mengolah dan mengelompokan data secara efektif. Tahapan akhir dari penelitian ini adalah penerapan algoritma GMM clustering yang menghasilkan 8 klaster dengan silhoutte score sebesar 0.81, menunjukkan kualitas pengelompokkan yang baik. Klaster-klaster tersebut kemudian dinterpretasikan untuk diidentifikasi ke dalam topik-topik sosial dominan di masyarakat Kota Semarang, memberikan gambaran yang komprehensif tentang isu-isu yang menjadi perhaian publik. Hasil penelitian ini diharapkan dapat memberikan konstribusi yang signifikan bagi Pemerintah Kota Semarang dalam memahami dan mengolah informasi yang beredar di media sosial Instagram. Dengan pemahaman yang lebih baik tentang opini publik, diharapkan pemerintah mampu mengambil keputusan yang lebih tepat dan responsif terhadap kebutuhan masyarakat.