ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ ОЗНАК РОЗПІЗНАВАННЯ МОВЦІВ ПРИ ВИКОРИСТАННІ ЗАГОРТАЛЬНИХ НЕЙРОМЕРЕЖ

M. M. Bykov; V. V. Kovtun

RESEARCH EFFICIENCY FEATURES SPEAKERS RECOGNITION USING NEURAL NETWORKS COAGULATION

Authors

M. M. Bykov Vinnytsia National Technical University
V. V. Kovtun Vinnytsia National Technical University

Keywords:

automated recognition system speakers critical application, pattern recognition, digital signal processing, cepstral analysis, neural network coagulation

Abstract

The study represents the results of the research of efficiency of the spectral features of speech signal for automated decision-making critical system for speaker recognition with convolutional neural network deep learning classifier, the use of which caused the submission of informative features in graphical view.

Author Biographies

M. M. Bykov, Vinnytsia National Technical University

k. t. n., Associate Professor of Computer Control Systems

V. V. Kovtun, Vinnytsia National Technical University

k. t. n., Associate Professor, Associate Professor of Computer Control Systems

References

1. Critical system — Wikipedia [Електронний ресурс] — Режим доступу : https://en.wikipedia.org/wiki/Critical_system.
2. Биков М. М. Аналіз ефективності ідентифікації мовця за частотою основного тону /
М. М. Биков, В. В. Ковтун. — Вісник Хмельницького національного університету. — 2004. — № 2. — Ч.1. — Т. 2 (60). — С. 20—23.
3. Рабинер Л. Цифровая обработка речевых сигналов / Л. Рабинер, Р. Шафер. — М. : Радио и связь, 1981. — 496 с.
4. Hermansky H. RASTA processing of speech / H. Hermansky, N. Morgan. — IEEE Trans. Speech and Audio Processing. — 1994. — 2, N 6. — P. 578—589.
5. Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech / H. Hermansky. — J. Acoust. Soc. America. — 1990. — 87. — P. 1738—1753.
6. rasta-plp speech analysis — ICSI [Електронний ресурс] — Режим доступу : http://www.icsi.berkeley.edu/pubs/techreports/tr-91-069.pdf.
7. Perceptual Linear Predictive (PLP) Analysis of Speech [Електронний ресурс] — Режим доступу : http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf
8. CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] —
Режим доступу: http://cs231n.github.io/convolutional-networks/
9. Caffe | Deep Learning Framework [Електронний ресурс] — Режим доступу: http://caffe.berkeleyvision.org/.
10. An overview of gradient descent optimization algorithms [Електронний ресурс] —
Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.
11. NOIZEUS: Noisy speech corpus - Univ. Texas-Dallas [Електронний ресурс] — Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

=============REFERENCES================
1. Critical system — Wikipedia [Yelektronniy resurs] — Rezhim dostupu: https://en.wikipedia.org/wiki/Critical_system.
2. Bikov M. M. Analíz yefektivností ídentifíkatsíí̈ movtsya za chastotoyu osnovnogo tonu /
M. M. Bikov, V. V. Kovtun. — Vísnik Khmel'nits'kogo natsíonal'nogo uníversitetu. — 2004. —
№ 2. — CH.1. — T.2(60). — S. 20—23.
3. Rabiner L. Tsifrovaya obrabotka rechevykh signalov / L. Rabiner, R. Shafer. — M. : Radio i svyaz', 1981. — 496 s.
4. Hermansky H. RASTA processing of speech / H. Hermansky, N. Morgan. — IEEE Trans. Speech and Audio Processing. — 1994. — 2, N 6. — P. 578—589.
5. Hermansky H. Perceptual Linear Prediction (PLP) analysis of speech / H. Hermansky. — J. Acoust. Soc. America. — 1990. — 87. — P. 1738—1753.
6. rasta-plp speech analysis — ICSI [Yelektronniy resurs] — Rezhim dostupu: http://www.icsi.berkeley.edu/pubs/techreports/tr-91-069.pdf.
7. Perceptual Linear Predictive (PLP) Analysis of Speech [Yelektronniy resurs] — Rezhim dostupu: http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf
8. CS231n: Convolutional Neural Networks for Visual Recognition [Yelektronniy resurs] — Rezhim dostupu: http://cs231n.github.io/convolutional-networks/
9. Caffe | Deep Learning Framework [Yelektronniy resurs] — Rezhim dostupu: http://caffe.berkeleyvision.org/.
10. An overview of gradient descent optimization algorithms [Yelektronniy resurs] — Rezhim dostupu: http://sebastianruder.com/optimizing-gradient-descent/.
11. NOIZEUS: Noisy speech corpus — Univ. Texas-Dallas [Yelektronniy resurs] — Rezhim dostupu: http://ecs.utdallas.edu/loizou/speech/noizeus/.

Downloads

PDF (Українська)
Downloads: 326

Abstract views: 312

Published

2017-04-13

How to Cite

[1]

M. M. Bykov and V. V. Kovtun, “RESEARCH EFFICIENCY FEATURES SPEAKERS RECOGNITION USING NEURAL NETWORKS COAGULATION”, Опт-ел. інф-енерг. техн., vol. 32, no. 2, pp. 22–28, Apr. 2017.

Download Citation

Issue

Vol. 32 No. 2 (2016)

Section

Systems Of Technical Vision And Artificial Intelligence, Image Processing And Pattern Recognition

Metrics

Downloads

Download data is not yet available.

License

Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:

Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).

RESEARCH EFFICIENCY FEATURES SPEAKERS RECOGNITION USING NEURAL NETWORKS COAGULATION

Authors

Keywords:

Abstract

Author Biographies

M. M. Bykov, Vinnytsia National Technical University

V. V. Kovtun, Vinnytsia National Technical University

References

Downloads

Published

How to Cite

Issue

Section

Metrics

Downloads

License

Most read articles by the same author(s)

Language

Make a Submission

Information