단순히 스피커/음성 인식 시스템에서 널리 사용되고 있으며 스피커 정보를 나타내는 템플릿의 일종이라는 사실만 알뿐 자세한 정보를 알지 못해 조사해보도록 하자! 두둥
i-vector (Identity) 이란?
아이덴티티 벡터 또는 i-vector는 특정 음반에 대한 스펙트럼 서명으로 전체 음소와 같이 크기는 거의 없음. 기본적으로, 시간 슬라이스의 가우스 혼합과 같은 형태로 표현
- 프레임 레벨 피처의 분포 패턴의 특이한 특성을 나타내는 피쳐
- i-vector 추출은 본질적으로 GMM 슈퍼 벡터의 차원 감소
d-vector이란?
i-벡터의 시퀀스에서 추출되며 사운드 클립을 소스와 안정적으로 일치시키는 데 사용
'Dev > 보이스피싱 방지 프로젝트' 카테고리의 다른 글
화자인식(Speaker Recognition) 기술 및 관련 연구 (0) | 2019.08.15 |
---|---|
[OpenSource] Voice Recognition Github 자료 (0) | 2019.08.15 |
[화자인식] Speaker Recognition 기술 정리 (0) | 2019.08.08 |
[AWS-1] 기본 사용법 (0) | 2019.08.07 |