PHƯƠNG PHÁP I-VECTOR TRONG NHẬN DẠNG NGƯỜI NÓI

Phùng Thị Thu Hiền

PHƯƠNG PHÁP I-VECTOR TRONG NHẬN DẠNG NGƯỜI NÓI

Thông tin bài báo

Ngày đăng: 16/10/17

Các tác giả

Phùng Thị Thu Hiền , Trường Đại học Kỹ thuật Công nghiệp – ĐH Thái Nguyên

Tóm tắt

Nhận dạng người nói ngày càng có nhiều ứng dụng mang ý nghĩa thực tế, đặc biệt là các ứng dụng trong nhận diện người nói và xác thực người nói. Tuy nhiên việc nâng cao chất lượng của các ứng dụng này là điều cần quan tâm nghiên cứu. Bài báo này trình bày tổng quan về phương pháp nhận dạng người nói SR (Speaker recognition), các thuật toán nhận dạng người nói dựa trên mô hình GMM (Gaussian mixture model), mô hình GMM-UBM (Gaussian mixture model - Universal Background Model) và Phương pháp phân tích JFA – Joint factor analysis. Đặc biệt bài báo trình bày về phương pháp I-vector, phương pháp này sử dụng một tập các nhân tố có tổng số chiều thấp nên giúp làm tăng hiệu quả của phương pháp nhận dạng người nói, sau đó tiến hành kiểm chứng lại phương pháp i-vector trên bộ dữ liệu NIST 2008 SRE.

Từ khóa

Phương pháp i-vector; mô hình GMM; nhận dạng người nói SR; kỹ thuật phân tích FA; thích nghi UBM; Phương pháp trích chọn đặc trưng MFCC.

Toàn văn:

PDF

Các bài báo tham chiếu

Hiện tại không có bài báo tham chiếu



Ghi nhớ