MỘT PHƯƠNG PHÁP PHÂN VÙNG DỮ LIỆU THEO ĐỘ TIN CẬY DỰA TRÊN PHÂN CỤM MỜ VIỄN CẢNH | Huân | TNU Journal of Science and Technology

MỘT PHƯƠNG PHÁP PHÂN VÙNG DỮ LIỆU THEO ĐỘ TIN CẬY DỰA TRÊN PHÂN CỤM MỜ VIỄN CẢNH

Thông tin bài báo

Ngày nhận bài: 21/02/22                Ngày hoàn thiện: 20/04/22                Ngày đăng: 21/04/22

Các tác giả

1. Phùng Thế Huân, Trường Đại học Công nghệ Thông tin và Truyền thông - ĐH Thái Nguyên
2. Hoàng Thị Cành Email to author, Trường Đại học Công nghệ Thông tin và Truyền thông - ĐH Thái Nguyên
3. Phạm Huy Thông, Viện Công nghệ Thông tin - ĐH Quốc gia Hà Nội

Tóm tắt


Phân cụm dữ liệu và các lĩnh vực ứng dụng là một trong những hướng nghiên cứu nhận được nhiều sự quan tâm từ các nhà khoa học trong những năm gần đây. Trong quá trình thu thập dữ liệu, có thể một số dữ liệu có độ tin cậy thấp hơn (sai giá trị, thuộc tính không chính xác, v.v.) tồn tại trong toàn bộ tập dữ liệu. Điều này sẽ làm giảm hiệu suất phân cụm với các nhiễu và ngoại lệ có thể xảy ra. Một số hướng nghiên cứu đã được đưa ra để giải quyết vấn đề này. Thứ nhất, đối với các dữ liệu sai giá trị, sai thuộc tính có thể sử dụng các phương pháp phân cụm bán giám sát mờ an toàn. Thứ hai, đối với các điểm dữ liệu nhiễu có thể sử dụng khái niệm tập mờ viễn cảnh, cho dù đã có một số nghiên cứu liên quan nhằm tăng chất lượng phân cụm, tuy nhiên chỉ dừng lại ở tập mờ truyền thống. Trong bài báo này, chúng tôi đề xuất một phương pháp mới trong phân vùng dữ liệu theo độ tin cậy dựa trên phân cụm mờ viễn cảnh có tên gọi PT2FCM. Thuật toán đề xuất được so sánh thực nghiệm với một số phương pháp liên quan như phân cụm bán giám sát mờ trên tập mờ viễn cảnh (FCPFS), phân cụm bán giám sát mờ an toàn (CS3FCM), v.v. Các kết quả thực nghiệm cho thấy, phương pháp đề xuất có chất lượng phân cụm tốt so với các phương pháp liên quan trong cùng tập dữ liệu.

Từ khóa


Phân cụm mờ; Phân cụm bán giám sát mờ; Phân cụm an toàn; Trọng số an toàn; Tập mờ viễn cảnh

Toàn văn:

PDF

Tài liệu tham khảo


[1] Y. Wu, Y. Guo, Y. Xiao, and S. Lao, “AAE-SC: A scRNA-seq clustering framework based on adversarial autoencoder,” IEEE Access, vol. 8, pp. 178962-178975, 2020.

[2] J. T. Santoso, S. Jumini, and Bhawika, Unsupervised Data Mining Technique for Clustering Library in Indonesia, Library Philosophy and Practice, pp. 1-9, 2021.

[3] W. Shi, W. N. Chen, T. Gu, H. Jin, and J. Zhang, “Handling Uncertainty in Financial Decision Making: A Clustering Estimation of Distribution Algorithm With Simplified Simulation,” IEEE Transactions on Emerging Topics in Computational Intelligence, vol. 5, no. 1, pp. 42-56, 2020.

[4] S. Majumdar and Laha, Clustering and classification of time series using topological data analysis with applications to finance, Expert Systems with Applications, vol. 162, 2020.

[5] A. Kumar, H. S. Bhadauria, and A. Singh, “Semi-supervised OTSU based hyperbolic tangent Gaussian kernel fuzzy C-mean clustering for dental radiographs segmentation,” Multimedia Tools and Applications, vol. 79, no. 3, pp. 2745-2768, 2020.

[6] K. Zhao, Y. Jiang, K. Xia, L. Zhou, Y. Chen, K. Xu, and P. Qian, “View-collaborative fuzzy soft subspace clustering for automatic medical image segmentation,” Multimedia Tools and Applications, vol. 79, no. 13, pp. 9523-9542, 2020.

[7] W. Pedrycz and J. Waletzky, “Fuzzy clustering with partial supervision,” IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), vol. 27, no. 5, pp. 787-795, 1997.

[8] H. Gan, Y. Fan, Z. Luo, R. Huang, and Z. Yang, “Confidence-weighted safe semi-supervised clustering,” Engineering Applications of Artificial Intelligence, vol. 81, pp. 107-116, 2019.

[9] H. Gan, Z. Li, W. Wu, Z. Luo, and R. Huang, “Safety-aware graph-based semi-supervised learning,” Expert Systems with Applications, vol. 107, pp. 243-254, 2018.

[10] H. Gan, Y. Fan, Z. Luo, and Q. Zhang, “Local homogeneous consistent safe semi-supervised clustering,” Expert Systems with Applications, vol. 97, pp. 384-393, 2018.

[11 H. Gan, “Safe Semi-Supervised Fuzzy C-Means Clustering,” IEEE Access, vol. 7, pp. 95659-95664, 2019.

[12] B. C. Cuong and V. Kreinovich, “Picture fuzzy sets,” Journal of Computer Science and Cybernetics, vol. 30, no. 4, pp. 409-420, 2014.

[13] L. Lovász and M. D. Plummer, Matching theory, American Mathematical Soc, vol. 378, 2009.

[14] L. A. Zadeh, “Fuzzy sets,” In Fuzzy sets, fuzzy logic, and fuzzy systems: selected papers by Lotfi A Zadeh, pp. 394-432, 1996.

[15] K. Atanassov, “Intuitionistic fuzzy sets,” International Journal Bioautomation, vol. 20, no. 1, pp. 1-6, 2016.

[16] P. H. Thong and L. H. Son, “Picture fuzzy clustering: a new computational intelligence method,” Soft Comput., vol. 20, no. 9, pp. 3549-3562, 2016.

[17] D. Dua and C. Graff, “UCI Machine Learning Repository,” 2019. [Online]. Available http://archive.ics.uci.edu/ml. [Accessed Jan. 10, 2022].

[18] D. L. Davies and D. W. Bouldin, “A cluster separation measure,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 2, pp. 224-227, 1979.




DOI: https://doi.org/10.34238/tnu-jst.5563

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved