Автоматическая идентификация диктора по голосу

Авторы

  • Н.С. Маматов Научно-инновационный центр информационно-коммуникационных технологий при Ташкентском университете информационных технологий им. М. Ал-Хоразмий
  • А.Н. Самижонов Московский государственный технический университет имени Н.Э.Баумана
  • П.Б. Нуримов Научно-инновационный центр информационно-коммуникационных технологий при Ташкентском университете информационных технологий им. М. Ал-Хоразмий

Ключевые слова:

речь, сигнал, признак, модель, идентификация, фонема, метод, кеп- страл коэффициент, вероятность, критерия

Аннотация

Системы распознавания человека по голосу решают задачи связанные с определением личности диктора. При этом речевой сигнал диктора передаётся в систему. Для этого используются базы эталонов, которые хранят записи некоторого количества дикторов, между ними осуществляется поиск. Далее система сравнивает тестовую запись с эталонами и выдаёт в качестве решения некоторые результаты, связанные с распознаванием которые, могут варьировать в зависимости типа системы и сферы её применения. В настоящее время системы распознавания дикторов вызывают живой интерес для разных областей человеческой деятельности, так как речь является лёгким и естественным способом для людей для взаимодействия друг с другом и с окружающим миром. В данной работы были рассмотрены системы идентификации дикторов текстозависимого и независимого характера. Выделение признаков выполнялось с использованием мел-частотных кепстральных коэффициентов (MFCC). Исследован метод векторного квантования для автоматической идентификации человека по голосу. Используя извлеченные признаки, кодовая книга от каждого диктора была построена путем кластеризации векторов признаков. Дикторы моделировались с использованием векторного квантования (VQ). Кодовые книги всех дикторов были собраны в базе данных. Из результатов можно сказать, что векторное квантование с использованием кепстральных признаков выдает хорошие результаты для создания системы распознавания личности по голосу.

cover

Загрузки

Опубликован

2019-10-10

Как цитировать

(1)
Маматов , Н.; Самижонов , А.; Нуримов , П. Автоматическая идентификация диктора по голосу. ПВПМ 2019, 100-107.

Выпуск

Раздел

Все статьи