Software requirement specification adalah sebuah dokumen yang dapat digunakan sebagai panduan bagi developer untuk mengembangkan aplikasi. Penelitian ini menggunakan SRS dari aplikasi Penguin untuk membantu menentukan pembentukkan class diagram yang berdasarkan use case dan sequence diagram dengan menggunakan metode text mining. Hasil dari proses tersebut akan dihitung similaritasnya, setelah itu akan dilakukan validasi dan pengujian dengan menggunakan Gwet's AC1 dan Cohen Kappa. Berdasarkan hasil dan pembahasan, terbentuklah 3 artefak, yaitu actor dari use case diagram (AUC), objek dari sequence diagram (OSD ), dan nama kelas dari class diagram (NCD). Tiga artefak tersebut menghasilkan dua perbandingan dalam pembentukkan class diagram, perbandingan pertama adalah antara AUC dan NCD, dengan nilai cosine similarty tertinggi sebesar 0.666. dari nilai tersebut hasil pembentukkan komponen class diagram yang berhasil terbentuk adalah seller dan customer. Perbandingan pertama juga menghasilkan nilai 0.088 untuk cohen kappa, dan 0.756 untuk Gwet’s AC1. Selanjutnya untuk perbandingan kedua, antara OSD dan NCD, dua buah hasil didapatkan dengan nilai yang sama, yaitu 0.9. nilai tersebut menghasilkan pembentukkan komponen class diagram seperti seller, transaction page, revenue page, expenditure page, and penguin app system. Dan pada perbandingan kedua ini mempunyai nilai cohen kappa sebesar 0.112 dan 0.926 untuk nilai Gwet’s AC1. Hasil dari cohen kappa dan Gwet’s AC1 dapat digunakan sebagai rekomendasi untuk meningkatkan nama kelas yang sesuai dengan nama aktor pada use case diagram, dan objek pada sequence diagram