Abstract:
|
Khai phá quy trình hay còn được gọi đầy đủ hơn là khai phá dữ liệu quy trình tập trung phân tích toàn bộ quá trình hoạt động dựa trên dữ liệu sự kiện sẵn có. Khai phá quy trình giúp các doanh nghiệp đưa ra các quyết định hay những cải tiến, điều chỉnh để cho mô hình kinh doanh phù hợp với thực tế hơn. Phát hiện mô hình quy trình là bài toán quan trọng trong lĩnh vực khai phá quy trình. Khi đối mặt với một nhật ký sự kiện phức tạp từ một môi trường linh hoạt cao, phát hiện quy trình gặp nhiều thách thức trong việc cung cấp một mô hình quy trình nghiệp vụ chính xác và dễ hiểu. Nguyên nhân là do nhật ký sự kiện này chứa một lượng lớn các hành vi. Trong tình huống này, phân cụm vết được coi là một giải pháp linh hoạt làm giảm độ phức tạp của bài toán phát hiện quy trình bằng cách chia tập các vết hành vi trong nhật ký sự kiện thành các nhóm tương tương tự nhau. Phân cụm vết được nhiều nhà khoa học quan tâm nghiên cứu, điển hình là kết quả của Minseok Song và cộng sự đề xuất năm 2008 hay của R. P. Jagadeesh Chandra Bose và cộng sự giới thiệu năm 2009. Khóa luận sẽ phân tích các hướng tiếp cận để giải quyết bài toán phân cụm vết. Từ đó, khóa luận sẽ trình bày và triển khai bài toán phân cụm vết từ nhật ký sự kiện theo hướng tiếp cận từ trên xuống dựa theo luận án của tiến sỹ Jochen De Weerdt. Khóa luận thực nghiệm dựa trên plugin ActiTraC được tích hợp trong bộ công cụ khai phá quy trình ProM với đầu vào là một nhật ký sự kiện để cho ra các cụm dữ liệu. Khóa luận tiến hành thực nghiệm trên bộ dữ liệu Lfull. Với 10 cụm được tạo, độ phù hợp (fitness) của mô hình quy trình đạt được là 0.99642825 |