ỨNG DỤNG PHÂN TÍCH DỮ LIỆU VÀ PHÂN LỚP GIÁM SÁT NAIVE BAYES PHÁT HIỆN GIAN LẬN TRONG THANH TOÁN TRỰC TUYẾN | Trừng | TNU Journal of Science and Technology

ỨNG DỤNG PHÂN TÍCH DỮ LIỆU VÀ PHÂN LỚP GIÁM SÁT NAIVE BAYES PHÁT HIỆN GIAN LẬN TRONG THANH TOÁN TRỰC TUYẾN

Thông tin bài báo

Ngày nhận bài: 11/03/20                Ngày hoàn thiện: 04/05/20                Ngày đăng: 11/05/20

Các tác giả

1. Mai Mạnh Trừng Email to author, Trường Đại học Kinh tế Kỹ thuật Công nghiệp
2. Lê Trung Thực, Trường Đại học Công nghệ Đông Á
3. Đào Thị Phương Anh, Trường Đại học Kinh tế Kỹ thuật Công nghiệp

Tóm tắt


Sự phát triển nhanh chóng của giao dịch thanh toán trực tuyến kéo theo tấn công gian lận trong hình thức giao dịch này tăng theo, gây tổn thất to lớn cho nhiều cá nhân, tập thể trong ngành tài chính. Gian lận giao dịch tín dụng trong thanh toán trực tuyến là một trong những hoạt động phi pháp phổ biến và đáng lo ngại nhất. Việc phát hiện, ngăn chặn các hoạt động gian lận giao dịch thông qua phân tích, khai phá dữ liệu kết hợp sử dụng thuật toán học máy là một trong những phương pháp nổi bật hiện nay. Kỹ thuật khai phá dữ liệu được sử dụng để nghiên cứu các mẫu, đặc điểm, thuộc tính, hành vi của giao dịch bình thường, giao dịch bất thường (giao dịch gian lận) dựa trên dữ liệu chuẩn hóa và dữ liệu bất quy tắc. Thuật toán học máy phân lớp nhằm dự đoán, phát hiện giao dịch bình thường, giao dịch gian lận một cách tự động mỗi khi có giao dịch mới phát sinh. Bài viết này nghiên cứu về một số thuật toán học máy có giám sát: Sử dụng mạng Bayes, cây tăng cường Naïve Bayes (Tree Augmented Naïve Bayes – TAN) và Naïve Bayes trong bài toán phân lớp nhị phân dựa trên dữ liệu là hơn 4 triệu bản ghi giao dịch tín dụng trực tuyến tương ứng với khoảng 80 nghìn mã thẻ nhằm phát hiện giao dịch gian lận. Sau khi tiền xử lý dữ liệu bằng phương pháp chuẩn tắc và phân tích thành phần chính (Principal Component Analysis-PCA), tất cả các thuật toán phân lớp đạt độ chính xác hơn 95% so với bộ dữ liệu chưa qua tiền xử lý.


Từ khóa


Gian lận giao dịch tín dụng; TAN; PCA; Naive bayes, cây tăng cường; mạng Bayes

Toàn văn:

PDF

Tài liệu tham khảo


[1]. N. Sivakumar, and Dr. R. Balasubramanian, “Fraud Detection in Credit Card Transactions: Classification, Risks and Prevention Techniques,” International Journal of Computer Science and Information Technologies, vol. 6, no. 2, pp. 1379-1386, 2015.

[2]. The Nilson Report, “Global Card Fraud Losses Reach $16.31 Billion — Will Exceed $35 Billion in 2020 According to The Nilson Report”, August, 2015. [Online]. Available: https://www.businesswire.com/news/home/20150804007054/en/Global-Card-Fraud-Losses-Reach-16.31-Billion. [Accessed Dec. 2019].

[3]. N. Ogwueleka, “Data mining application in credit card fraud detection system,” Journal of Engineering Science and Technology, vol. 6, no. 3, p. 311, 2011.

[4]. V. Bhusari, and S. Patil, “Application of hidden markov model in credit card fraud detection,” International Journal of Distributed and Parallel Systems (IJDPS), vol. 2, no. 6, pp. 203-211, November, 2011.

[5]. S. J. Stolfo, D. W. Fan, W. Lee, A. L. Prodromidis, and P. K. Chan, “Credit card fraud detection using meta-learning: issues and initial results,” Proc. AAAI Workshop AI Methods in Fraud, 1998, pp. 83-90.

[6]. S. Y. Sait, M. S. Kumar, and H. A. Murthy, “User traffic classification for proxy-server based internet access control,” IEEE 6th International Conference on Signal Processing and Communication Systems (ICSPCS), 2012, pp. 1-9.

[7]. E. M. Carneiro, L. A. V. Dias, A. M. Da Cunha, and L. F. S. Mialaret, “Cluster analysis and artificial neural networks: A case study in credit card fraud detection,” 12th ed. International Conference on Information Technology-New Generations, 2015, 122-126.

[8]. S. Maes, K. Tuyls, B. Vanschoenwinkel and B. Manderick, Credit Card Fraud Detection Using Bayesian and Neural Networks. in Proceedings of the First International NAISO Congress on NEURO FUZZY THECHNOLOGIES,” Proceedings of the First International NAISO Congress on NEURO FUZZY THECHNOLOGIES (Havana, Cuba), 2002, pp. 16-19.

[9]. R. Najafi and A. Mohsen, “Network intrusion detection using tree augmented naive-bayes”, The Third International Conference on Contemporary Issues in Computer and Information Sciences (CICI), 2012, pp. 396-402.

[10]. R. Jain, B. Gour, and S. Dubey, “A hybrid approach for credit card fraud detection using rough set and decision tree technique,” International Journal of Computer Applications, vol. 139, no.10, pp. 1-6, 2016.

[11]. A. C. Bahnsen, A. Stojanovic, D. Aouada, and B. Ottersten, “Cost sensitive credit card fraud detection using bayes minimum risk,” 12th International Conference on Machine Learning and Applications, 2013.


Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved