ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ ОЗНАК РОЗПІЗНАВАННЯ МОВЦІВ ПРИ ВИКОРИСТАННІ ЗАГОРТАЛЬНИХ НЕЙРОМЕРЕЖ

М. М. Биков, В. В. Ковтун

Анотація


У статті автори навели результати дослідження ефективності спектральних ознак для прийняття рішень автоматизованою системою розпізнавання мовців критичного застосування із згортальним нейромережевим класифікатором глибокого навчання, використання якого зумовило представлення інформативних ознак у графічному вигляді.


Ключові слова


автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, цифрова обробка сигналів, кепстральний аналіз, згортальна нейромережа

Повний текст:

PDF

Посилання


Critical system — Wikipedia [Електронний ресурс] — Режим доступу : https://en.wikipedia.org/wiki/Critical_system.

Биков М. М. Аналіз ефективності ідентифікації мовця за частотою основного тону /

М. М. Биков, В. В. Ковтун. — Вісник Хмельницького національного університету. — 2004. — № 2. — Ч.1. — Т. 2 (60). — С. 20—23.

Рабинер Л. Цифровая обработка речевых сигналов / Л. Рабинер, Р. Шафер. — М. : Радио и связь, 1981. — 496 с.

Hermansky H. RASTA processing of speech / H. Hermansky, N. Morgan. — IEEE Trans. Speech and Audio Processing. — 1994. — 2, N 6. — P. 578—589.

Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech / H. Hermansky. — J. Acoust. Soc. America. — 1990. — 87. — P. 1738—1753.

rasta-plp speech analysis — ICSI [Електронний ресурс] — Режим доступу : http://www.icsi.berkeley.edu/pubs/techreports/tr-91-069.pdf.

Perceptual Linear Predictive (PLP) Analysis of Speech [Електронний ресурс] — Режим доступу : http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf

CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] —

Режим доступу: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Електронний ресурс] — Режим доступу: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Електронний ресурс] —

Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus - Univ. Texas-Dallas [Електронний ресурс] — Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

=============REFERENCES================

Critical system — Wikipedia [Yelektronniy resurs] — Rezhim dostupu: https://en.wikipedia.org/wiki/Critical_system.

Bikov M. M. Analíz yefektivností ídentifíkatsíí̈ movtsya za chastotoyu osnovnogo tonu /

M. M. Bikov, V. V. Kovtun. — Vísnik Khmel'nits'kogo natsíonal'nogo uníversitetu. — 2004. —

№ 2. — CH.1. — T.2(60). — S. 20—23.

Rabiner L. Tsifrovaya obrabotka rechevykh signalov / L. Rabiner, R. Shafer. — M. : Radio i svyaz', 1981. — 496 s.

Hermansky H. RASTA processing of speech / H. Hermansky, N. Morgan. — IEEE Trans. Speech and Audio Processing. — 1994. — 2, N 6. — P. 578—589.

Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech / H. Hermansky. — J. Acoust. Soc. America. — 1990. — 87. — P. 1738—1753.

rasta-plp speech analysis — ICSI [Yelektronniy resurs] — Rezhim dostupu: http://www.icsi.berkeley.edu/pubs/techreports/tr-91-069.pdf.

Perceptual Linear Predictive (PLP) Analysis of Speech [Yelektronniy resurs] — Rezhim dostupu: http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf

CS231n: Convolutional Neural Networks for Visual Recognition [Yelektronniy resurs] — Rezhim dostupu: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Yelektronniy resurs] — Rezhim dostupu: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Yelektronniy resurs] — Rezhim dostupu: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus — Univ. Texas-Dallas [Yelektronniy resurs] — Rezhim dostupu: http://ecs.utdallas.edu/loizou/speech/noizeus/.


Посилання

  • Поки немає зовнішніх посилань.


ISSN 2311-2662 (Online), ISSN 1681-7893 (Print)