PHƯƠNG PHÁP I-VECTOR TRONG NHẬN DẠNG NGƯỜI NÓI | Hiền | TNU Journal of Science and Technology

PHƯƠNG PHÁP I-VECTOR TRONG NHẬN DẠNG NGƯỜI NÓI

Thông tin bài báo

Ngày đăng: 16/10/17

Các tác giả

Phùng Thị Thu Hiền Email to author, Trường Đại học Kỹ thuật Công nghiệp – ĐH Thái Nguyên

Tóm tắt


Nhận dạng người nói ngày càng có nhiều ứng dụng mang ý nghĩa thực tế, đặc biệt là các ứng dụng trong nhận diện người nói và xác thực người nói. Tuy nhiên việc nâng cao chất lượng của các ứng dụng này là điều cần quan tâm nghiên cứu. Bài báo này trình bày tổng quan về phương pháp nhận dạng người nói SR (Speaker recognition), các thuật toán nhận dạng người nói dựa trên mô hình GMM (Gaussian mixture model), mô hình GMM-UBM (Gaussian mixture model - Universal Background Model) và Phương pháp phân tích JFA – Joint factor analysis. Đặc biệt bài báo trình bày về phương pháp I-vector, phương pháp này sử dụng một tập các nhân tố có tổng số chiều thấp nên giúp làm tăng hiệu quả của phương pháp nhận dạng người nói, sau đó tiến hành kiểm chứng lại phương pháp i-vector trên bộ dữ liệu NIST 2008 SRE.


Từ khóa


Phương pháp i-vector; mô hình GMM; nhận dạng người nói SR; kỹ thuật phân tích FA; thích nghi UBM; Phương pháp trích chọn đặc trưng MFCC.

Toàn văn:

PDF

Các bài báo tham chiếu

  • Hiện tại không có bài báo tham chiếu
Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
Phòng 408, 409 - Tòa nhà Điều hành - Đại học Thái Nguyên
Phường Tân Thịnh - Thành phố Thái Nguyên
Điện thoại: 0208 3840 288 - E-mail: jst@tnu.edu.vn
Phát triển trên nền tảng Open Journal Systems
©2018 All Rights Reserved