ПІДВИЩЕННЯ ІНФОРМАТИВНОСТІ ОСНОВНОГО ТОНУ ДЛЯ РОЗПІЗНАВАННІ МОВЦІВ ЗГОРТАЛЬНИМИ НЕЙРОМЕРЕЖАМИ

Authors

  • Mykola Maksymovych Bykov Вінницький національний технічний університет
  • VASYLIOVYCH VYaCHESLAV KOVTUN Вінницький національний технічний університет

Keywords:

автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, цифрова обробка сигналів, сингулярний аналіз, згортальна нейромережа, вейвлет-перетворення

Abstract

In the article the method and algorithm were presented for speaker’s pitch extraction from the speech signal, using the data of the wavelet transform and singular analysis of the speech signal. That allows arbitrary scale representation of the signal in the frequency domain and increases reliability allocation pitch in the case of noise present in the speech signal and using a convolution neural network for speaker recognition.

Author Biographies

Mykola Maksymovych Bykov, Вінницький національний технічний університет

к.т.н., доцент, професор кафедри комп’ютерних систем управління

VASYLIOVYCH VYaCHESLAV KOVTUN, Вінницький національний технічний університет

к.т.н., доцент, доцент кафедри комп’ютерних систем управління

References

Биков М. М., Ковтун В. В. Аналіз ефективності ідентифікації мовця за частотою основного тону // Вісник Хмельницького національного університету. – 2004. – № 2. – Ч. 1. – Т. 2(60). – С. 20-23.

Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. – М.: Радио и связь, 1981.– 496 с.

Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. – СПб: ООО "МОДУС+", 1999. – 152 с.

Голяндина Н. Э. Метод “Гусеница”-SSA: Аналіз временных рядов: учеб. пособие / Н. Э. Голяндина. – СПб: Изд-во СПбГУ, 2004. – 76 с.

CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

REFERENCES

Bykov M. M., Kovtun V. V. Analiz efektyvnosti identyfikatsiyi movtsya za chastotoyu osnovnoho tonu // Visnyk Khmelnytskoho natsionalʹnoho universytetu. – 2004. – № 2. – CH. 1. – T. 2(60). – S. 20-23.

Rabyner L., Shafer R. Tsyfrovaya obrabotka rechevykh syhnalov.– M.: Radyo y svyaz, 1981.– 496 s.

Novykov L. V. Osnovy veyvlet-analyza syhnalov. Uchebnoe posobye. – SPb: OOO "MODUS+", 1999. – 152 s.

Holyandyna N. É. Metod “Husenytsa”-SSA: Analiz vremennykh ryadov: ucheb. posobye / N. É. Holyandyna. – SPb: Yzd-vo SPbHU, 2004. – 76 s.

CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

Downloads

Abstract views: 239

Published

2018-08-20

How to Cite

[1]
M. M. Bykov and V. V. KOVTUN, “ПІДВИЩЕННЯ ІНФОРМАТИВНОСТІ ОСНОВНОГО ТОНУ ДЛЯ РОЗПІЗНАВАННІ МОВЦІВ ЗГОРТАЛЬНИМИ НЕЙРОМЕРЕЖАМИ”, Опт-ел. інф-енерг. техн., vol. 34, no. 2, Aug. 2018.

Issue

Section

Systems Of Technical Vision And Artificial Intelligence, Image Processing And Pattern Recognition

Metrics

Downloads

Download data is not yet available.