MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ | Phương | TNU Journal of Science and Technology

MỘT SỐ KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU ẢNH THEO NỘI DUNG DỰA TRÊN ĐỘ ĐO KHOẢNG CÁCH THÍCH NGHI VÀ PHÂN CỤM PHỔ

Thông tin bài báo

Ngày nhận bài: 23/06/25                Ngày hoàn thiện: 18/11/25                Ngày đăng: 18/11/25

Các tác giả

Nguyễn Thị Lan Phương Email to author, Học viện Phụ nữ Việt Nam

Tóm tắt


Tra cứu ảnh dựa vào nội dung cho phép người dùng tra cứu hình ảnh dựa trên các đặc trưng cụ thể của ảnh như màu sắc, kết cấu, hình dạng.Điều này giúp cải thiện hiệu quả của việc tra cứu ảnh, đặc biệt khi người dùng không thể sử dụng từ khoá hoặc chưa biết chính xác mô tả của ảnh. Ngoài ra, tra cứu ảnh dựa trên nội dung khắc phục ngôn ngữ hạn chế và ảnh chưa có gán nhãn đầy đủ có nghĩa là người dùng tra cứu ảnh bằng cách sử dụng ảnh mà người ta có sẵn, thay vì phải biết chính xác từ khoá mô tả. Bài báo này trình bày hai kỹ thuật chính nhằm nâng cao hiệu quả tra cứu ảnh theo nội dung: (1) phương pháp phân hạng kết quả dựa trên độ đo khoảng cách thích nghi sử dụng phân tích phân biệt tuyến tính, và (2) thuật toán phân cụm phổ có trọng số tối thiểu cho ảnh phản hồi liên quan. Các kỹ thuật này giải quyết vấn đề khoảng cách ngữ nghĩa và cải thiện độ chính xác trong truy vấn ảnh thông qua học máy và tương tác người dùng. Thử nghiệm trên các bộ dữ liệu chuẩn như Corel và SIMPLIcity cho thấy các phương pháp đề xuất vượt trội hơn các phương pháp truyền thống.

Từ khóa


Tra cứu ảnh dựa trên nội dung; Phân cụm phổ; Học máy; Phân lớp; Khoảng cách ngữ nghĩa

Toàn văn:

PDF

Tài liệu tham khảo


[1] M. Flickner, “Query by image and video content: The QBIC system,” Computer, vol. 28, no. 9, pp. 23-32, 1995.

[2] W. Niblack et al., “The QBIC Project: Querying Images by Content, Using Color, Texture, and Shape,” Proceedings of SPIE - The International Society for Optical Engineering, vol. 1908, pp. 173-187, January 1993.

[3] D. Liu, K. A. Hua, K. Vu, and N. Yu, “Fast Query Point Movement Techniques for Large CBIR Systems,” IEEE Transactions on Knowledge and Data Engineering, vol. 21, no. 5, pp. 729-743, 2009.

[4] A. Alzu’bi, A. Amira, and N. Ramzan, “Content-based image retrieval with compact deep convolutional features,” Neurocomputing, vol. 249, pp. 95-105, 2017.

[5] S. P. Rana, M. Dey, and P. Siarry, “Boosting contentbased image retrieval performance through integration of parametric & nonparametric approaches,” Journal of Visual Communication and Image Representation, vol. 58, no. 3, pp. 205-219, 2019.

[6] Z. Xiao and X. Qi, “Complementary relevance feedback-based content-based image retrieval,Multimedia Tools Appl., vol. 73, no. 3, pp. 2157–2177, 2014.

[7] L. Zhang, H. P. H. Shum, and L. Shao, Discriminative Semantic Subspace Analysis for Relevance Feedback,” IEEE Trans. Image Processing, vol. 25, no. 3, pp. 1275–1287, Mar. 2016.

[8] M. Yousuf, Z. Mehmood, H. A. Habib, T. Mahmood, T. Saba, A. Rehman, and M. Rashid, “A novel technique based on visual words fusion analysis of sparse features for effective content-based image retrieval,” Mathematical Problems in Engineering, vol. 1, 2018, doi: 10.1155/2018/2134395.

[9] D. Tao, X. Tang, X. Li, and X. Wu, “Asymmetric bagging and random subspace for support vector machines-based relevance feedback in image retrieval,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28, no. 7, pp. 1088 –1099, July 2006.

[10] E. Xing, A. Ng, and M. Jordan, “Distance metric learning with application to clustering with side-information,” in NeurIPS Proceedings: Advances in Neural Information Processing Systems 15 (NIPS 2002), 2002, pp. 521 – 528.

[11] A. Raza, H. Dawood, H. Dawood, S. Shabbir, R. Mehboob, and A. Banjar, “Correlated primary visual texton histogram features for content base image retrieval,” IEEE Access, vol. 6, pp. 46595-46616, 2018.

[12] Y. Ishikawa, R. Subramanya, and C. Faloutsos, “Mind Reader: Querying databases through multiple examples,” in Proceedings of the 24th VLDB Conference, New York, USA, 1998, pp. 218–227.

[13] X. Jin and J. C. French, “Improving Image Retrieval Effectiveness via Multiple Queries,” Multimedia Tools and Applications, vol. 26, pp. 221-245, 2005.

[14] C. Liu and G. Song, “A Method of Measuring the Semantic Gap in Image Retrieval: Using the Information Theory” 2011 International Conference on Image Analysis and Signal Processing, Wuhan, China, 2011, pp. 287-291, doi: 10.1109/IASP.2011.6109048.




DOI: https://doi.org/10.34238/tnu-jst.13110

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved