MỘT THUẬT TOÁN NHANH CHO KHAI THÁC CÁC TẬP HỮU ÍCH CAO CHỨA K MỤC | Hoa | TNU Journal of Science and Technology

MỘT THUẬT TOÁN NHANH CHO KHAI THÁC CÁC TẬP HỮU ÍCH CAO CHỨA K MỤC

Thông tin bài báo

Ngày nhận bài: 23/06/21                Ngày hoàn thiện: 31/07/21                Ngày đăng: 02/08/21

Các tác giả

1. Nông Thị Hoa, Trường Đại học Duy Tân
2. Nguyễn Văn Tảo Email to author, Trường Đại học Công nghệ thông tin và truyền thông - ĐH Thái Nguyên
3. Nguyễn Thị Tân Tiến, Trường Đại học Y Dược - ĐH Thái Nguyên

Tóm tắt


Khai thác tập hữu ích cao thực hiện tìm kiếm các tập mục được bán ra mang lại mức lãi cao hơn một ngưỡng cho trước. Việc tìm ra các tập hữu ích cao giúp gợi ý các mặt hàng liên quan trên các trang thương mại điện tử và đưa ra các chính sách bán hàng hiệu quả. Các hệ thống gợi ý thường hiện thêm khoảng 5 đến 7 sản phẩm tương tự hoặc có liên quan để giúp người dùng lựa chọn các sản phẩm cần  mua. Trong các nghiên cứu trước đây, việc tìm các tập hữu ích cao thường tốn thời gian do xét nhiều tổ hợp các mục hàng trong một giao dịch. Trong bài báo này, chúng tôi đưa ra một thuật toán nhanh cho khai thác các tập hữu ích cao chứa k mục. Một cấu trúc danh sách nhỏ gọn được dùng để lưu thông tin về các tập mục chứa k mục xuất hiện trong cơ sở dữ liệu giao dịch. Đầu tiên, thực hiện phân mảnh dọc cơ sở dữ liệu giao dịch để sinh ra các phân mảnh con. Tiếp theo, khai thác các tập hữu ích cao trên từng phân mảnh dọc bằng cách thống kê các tập mục và tính số tiền lãi của tập mục đó. Các thực nghiệm được làm trên các cơ sở dữ liệu chuẩn. Kết quả thực nghiệm cho thấy cách tiếp cận đề xuất giảm đáng kể cả bộ nhớ và thời gian tính toán. Hơn nữa, thuật toán đề xuất còn tốt hơn thuật toán được so sánh.

Từ khóa


Tập hữu ích cao; Khai thác tập hữu ích cao; Tập hữu ích cao chứa k mục; Phân đoạn dọc; Khai phá dữ liệu

Toàn văn:

PDF

Tài liệu tham khảo


[1] P. Fournier-Viger, S. Zida, J. C.-W. Lin, C.-W. Wu, V. S. Tseng, "EFIM-Closed: Fast and memory efficient discovery of closed high-utility itemsets," In: Proceedings of MLDM 2016, LNCS, Springer, USA, 2016, vol. 9729, pp. 199-213.

[2] Y. Unil, K. Donggyu, Y. Eunchul, F. Hamido, "Damped window based high average utility pattern mining over data streams," Knowledge-Based Systems, vol. 144, pp. 188-205, 2018.

[3] K. Donggyu and Y. Unil, "Efficient algorithm for mining high average-utility itemsets in in-cremental transaction databases," Applied Intelligence, vol. 47, no. 1, pp. 114-131, 2017.

[4] C. W. Wu, P. Fournier-Viger, J. Y. Gu, V. S. Tseng, "Mining closed high utility itemsets without candidate generation," In: Proceeding of Technologies and Applications of Artificial Intelligence (TAAI), Taiwan, 2015, pp. 187-194.

[5] P. Fournier-Viger, J. Lin, R. Nkambou, B. Vo, V. S. Tseng, "Mining Compact High Utility Itemsets Without Candidate Generation," High-Utility Pattern Mining: Theory, Algorithms and Applications, vol. 51, pp. 282-307, 2019.

[6] L. T. Dam, R. Heri, N. Kjetil, and H. Q. Duong, "Towards efficiently mining closed high utility itemsets from incremental databases," Knowledge-Based Systems, vol. 165, pp. 13-29, 2019.

[7] Y. Until, K. Donggyu, "Mining of high average-utility itemsets using novel list structure and pruning strategy," Future Generation Computer Systems, vol. 68, pp. 346-360, 2017.

[8] Frequent Itemset Mining Dataset Repository, 2012. [Online]. Available: http://fimi.uantwerpen.be/. [Accessed May 25, 2021].

[9] P. Fournier-Viger, A. Gomariz, A. Soltani, H. Lam, and T. Gueniche, "Spmf: Open-source data mining platform," 2014. [Online]. Available: http://www.philippe-fournier-viger.com/spmf/. [Accessed May 15, 2021].




DOI: https://doi.org/10.34238/tnu-jst.4691

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved