Penelitian ini berfokus pada ekstraksi artefak Unified Modeling Language (UML) untuk evaluasi terkait konsistensi desain interaksi dan alur kerja fungsionalitas sebuah aplikasi dalam proses pengembangan perangkat lunak. Secara khusus, penelitian ini berfokus pada ekstraksi dua jenis artefak, yaitu Activity Diagram dan Use Case Description, dengan berfokus pada bagian Step Performed. Karena kedua artefak ini memiliki aturan dan format yang berbeda-beda, penelitian ini mengusulkan pendekatan Text Mining untuk mengekstrak artefak tersebut dengan menyeragamkan format ekstraksi untuk memungkinkan evaluasi. Dokumen Spesifikasi Kebutuhan Perangkat Lunak untuk proyek pembangunan perangkat lunak Sipranta digunakan sebagai obyek penelitian yang berfokus pada pengelolaan data tumbuh kembang balita di Posyandu. Hasil ekstraksi untuk setiap artefak terdiri dari sebelas set informasi yang diekstrak, diberi label sebagai dokumen D1 hingga D11 untuk Activity Diagram dan D12 hingga D22 untuk Step Performed pada Use Case Descriptions. Validasi dan reliabilitas hasil ekstraksi dinilai dengan menggunakan dua pendekatan: pemrograman Python dan penilaian kuesioner dan ditemukan dalam kategori "Almost Perfect Agreement" dengan nilai masing-masing 0,8127 dan 0,8930. Pengukuran similaritas menggunakan Cosine Similarity berdasarkan hasil ekstraksi menunjukkan bahwa kedua artefak selaras dan konsisten, dengan skor di atas 0,85.
This study focuses on extracting Unified Modeling Language artifacts for evaluation related to the consistency of interaction design and functionality flow of an application in the software development process. Specifically, the study focuses on extracting two types of artifacts, namely Activity Diagram and Use Case Description, with emphasis on the Step Performed section. As these two artifacts have varying rules and formats, the study proposes a text mining approach to extract that artifacts while standardizing the extraction format to enable the evaluation. The software requirement specification document for the Sipranta software development project is used as the research object, which focuses on managing growth and development data for toddlers in Integrated Health Posts (Posyandu). The extraction results for each artifact comprise eleven sets of extracted information, labeled as documents D1 to D11 for Activity Diagram and D12 to D22 for Step Performed. The reliability of the extraction results is assessed using two approaches: Python programming and expert questionnaires and is found to be in the "Almost Perfect Agreement" category with respective values of 0.8127 and 0.8930. The similarity measurement using cosine similarity based on the extraction results indicates that the two artifacts are aligned and consistent, with similarity scores above 0.85.