THUẬT TOÁN PHÂN CỤM K –MEANS*
Thông tin bài báo
Ngày đăng: 30/08/17Tóm tắt
Thuật toán phân cụm nửa giám sát thu hút được nhiều nghiên cứu trong thời gian gần đây. Dựa trên một số thông tin cung cấp bởi người sử dụng như một số điểm dữ liệu đã được gán nhãn sẵn hoặc một số ràng buộc giữa các cặp dữ liệu (must-link, cannot-link) được tích hợp vào các thuật toán phân cụm nửa giám sát sẽ làm cho chất lượng của quá trình phân cụm được cải tiến. Bài báo này đề xuất một phương pháp phân cụm nửa giám sát trong trường hợp dữ liệu trợ giúp là không đầy đủ cho thuật toán phân cụm K-Means, thuật toán mới được đặt tên là K-Means*. Thuật toán K-Means* được lai giữa hai phương pháp gồm phương pháp phân cụm nửa giám sát và phương pháp ước lượng các trọng tâm của các cụm cho K-Means. Kết quả thực nghiệm từ UCI chỉ ra hiệu quả của phương pháp đề xuất.
Từ khóa
Toàn văn:
PDFCác bài báo tham chiếu
- Hiện tại không có bài báo tham chiếu