Ngày nhận bài: 03/06/21                Ngày hoàn thiện: 02/07/21                Ngày đăng: 14/07/21
Iris (hoa Diên Vĩ) là một loài hoa đẹp, đại diện cho sự may mắn, tình yêu, lòng dũng cảm, trung thành và sự khôn ngoan. Vì vậy việc phân lớp, dự đoán chính xác loài hoa Iris mang lại nhiều ý nghĩa quan trọng trong thực tiễn. Mặc dù đã và đang có rất nhiều công bố khoa học liên quan đến phân lớp, dự đoán loài hoa Iris, tuy nhiên hiệu năng phân lớp, dự đoán của những công bố này vẫn còn tồn tại những hạn chế nhất định cần được nghiên cứu để cải thiện hơn nữa. Trong bài báo này, tác giả đề xuất mô hình phân lớp dữ liệu, dự đoán hoa Iris trên cơ sở ứng dụng bộ công cụ Weka và các thuật toán Naïve Bayes, Random Forest và KNN. Kết quả cho thấy cả 3 thuật toán trên đều cho độ chính xác cao (trên 95%), vì vậy phù hợp để sử dụng cho việc xây dựng mô hình phân lớp dự đoán hoa Iris. Tuy nhiên, 2 thuật toán Random Forest và KNN (k=3) thể hiện sự ổn định và có tính khách quan tốt hơn so với thuật toán Naïve Bayes.
