HỒI QUY LASSO VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU UNG THƯ VÚ | Vân | TNU Journal of Science and Technology

HỒI QUY LASSO VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU UNG THƯ VÚ

Thông tin bài báo

Ngày nhận bài: 25/04/22                Ngày hoàn thiện: 30/05/22                Ngày đăng: 31/05/22

Các tác giả

1. Nông Quỳnh Vân Email to author, Trường Đại học Sư phạm - ĐH Thái Nguyên
2. Trần Đình Hùng, Trường Đại học Sư phạm - ĐH Thái Nguyên

Tóm tắt


Hồi quy LASSO là một trong những phương pháp hồi quy phạt được đề xuất bởi Tibshirani vào năm 1996. Mục tiêu của LASSO là lựa chọn và ước lượng tham số trong mô hình hồi quy tuyến tính bằng cách hiệu chỉnh một số hệ số bằng 0. Đặc biệt, LASSO rất hữu ích trong việc phân tích dữ liệu gen, trong đó số lượng yếu tố dự báo (gen) lớn hơn nhiều so với số lượng quan sát mẫu (số bệnh nhân). Trong bài báo này, chúng tôi sẽ hệ thống lại các kiến thức cơ bản về hồi quy LASSO và áp dụng phương pháp LASSO cho nghiên cứu gen ở bệnh nhân ung thư vú. Mục tiêu của chúng tôi là xác định gen nào ảnh hưởng đến mức độ nghiêm trọng của ung thư vú theo dữ liệu microarray. Kết quả cho thấy, LASSO hoạt động tương đối tốt trong phân tích mức độ biểu hiện gen và chỉ ra được những gen có liên quan tới gen gây ung thư vú BRC1 là các gen NBR2, AASDH, KIAA2013, VPS25, NBR1, SEC22C, RPL27, CBLN3, KHDRBS1, XRCC2. Trên thực tế, gen NBR2 tiếp giáp với BRCA1 trên nhiễm sắc thể 17 và hai gen này có chung một vùng gen khởi động. Như vậy, tiên lượng ung thư vú xác định bằng hồi quy sẽ giúp chúng ta hiểu rõ hơn về cơ chế tiềm ẩn sự xuất hiện của ung thư vú đối với phụ nữ còn trẻ.


Từ khóa


Hồi quy; Bình phương tối thiểu; LASSO; Chính quy hóa L1; Hồi quy phạt; Ung thư vú

Toàn văn:

PDF

Tài liệu tham khảo


[1] B. Efron, T. Hastie, I. Johnstone, and R. Tibshirani, “Least Angle Regression (with discussion),” Annals of Statistics, vol. 32, pp. 407-499, 2004.

[2] J. Fan and R. Li, “Variable selection via non concave penalized likelihood and its oracle properties,” Journal of American Statistical Association, vol. 96, pp. 1348–1360, 2001.

[3] J. Fan and J. Lv, “A selective overview of variable selection in high dimensional feature space,” Statistica Sinica, vol. 20, pp. 101-148, 2010.

[4] W. J. Fu, “Penalized regression: The bridge versus the LASSO,” Journal of Computational and Graphical Statistics, vol. 7, pp. 397-416, 1998.

[5] H. Zou and T. Hastie, “Regularization and Variable Selection via the Elastic Net,” Journal of the Royal Statistical Society Series B, vol. 67, pp. 301-320, 2005.

[6] H. Zou, “The adaptive lasso and its oracle properties,” Journal of American Statistical Association, vol. 101, pp. 1418-1429, 2006.

[7] T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd ed., Springer: New York, NY, USA, 2008.

[8] M. R. Osborne, B. Presnell, A. Brevin, and B. Turlach, “On the LASSO and its dual,” Journal of Computational and Graphical Statistics, vol. 9, no. 2, pp. 319-338, 2000.

[9] R. Tibshirani, “Regression shrinkage and selection via the LASSO,” Journal of the Royal Statistical Society Series B, vol. 58, pp. 267-288, 1996.

[10] A. S. Amusan and I. O. Adeshina, “Multicollinearity Regularization Using Lasso and Ridge Regression on Economic Data,” Kasu Journal of Mathematical Sciences, vol. 2, no. 2, pp. 43-54, 2021.

[11] A. Brown, F. Xu, H. Nicolai, B. Griffiths, A. Chambers, D. Black, and E. Solomon, “The 5' end of the BRCA1 gene lies within a duplicated region of human chromosome 17q21,” Oncogene, vol. 12, pp. 2507-2513, 1996.




DOI: https://doi.org/10.34238/tnu-jst.5901

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved